Dalam artikel kali ini kita akan membahas Uji Multikolinearitas. Multikolinearitas adalah suatu kondisi dimana terjadi korelasi yang kuat diantara variabel-variabel bebas (X) yang diikutsertakan dalam pembentukan model regresi linier.
Dapat terlihat bahwa multikolinieritas merupakan suatu kondisi yang menyalahi asumsi regresi linier. Dengan demikian, multikolinieritas tidak mungkin terjadi pada rigresi linier sederhana dimana hanya terdapat satu variabel bebas (X).
Pertanyaan Umum dalam Analisis Regresi Berganda:
- Seberapa besar pengaruh variabel bebas terhadap variabel tak bebas?
- Dapatkah variabel bebas tertentu dihilangkan dari model karena pengaruhnya yg kecil (tidak ada) terhadap variabel tak bebas?
- Perlukah menambahkan variabel bebas yang belum masuk ke dalam model untuk memperoleh tambahan informasi?
Hubungan Antar Variabel Bebas
- Tidak berkorelasi dengan dirinya sendiri
- Tidak berkorelasi dengan variabel bebas lain yang terkait dg variabel tak bebas namum belum/tidak masuk dalam model
- Berkorelasi dengan dirinya sendiri
- Berkorelasi dengan variabel bebas lain yang terkait dg variabel tak bebas namum belum/tidak masuk dalam model
Contoh Kasus
Misalkan regresi pengeluaran untuk konsumsi makanan keluarga pada pendapatan keluarga, tabungan, usia kepala keluarga.
- Variabel bebas akan saling berkorelasi
- Variabel bebas juga berkorelasi dengan variabel sosial-ekonomi lain yang berpengaruh terhadap pengeluaran untuk konsumsi, misalkan ukuran keluarga
- Terjadi Multikolinieritas (kolinieritas)
Sejarah Uji Multikolinearitas
Ditemukan pertama kali oleh Ragnar Frisch (Institute of Economics, Oslo University). Pada awalnya, multikolinieritas berarti adanya hubungan yg linier sempurna atau pasti diantara beberapa atau semua variabel bebas dalam model regresi.
Misalkan pada model regresi dengan k variabel bebas X1, X2, …, Xk (dimana X1 = 1), suatu hubungan linier yg sempurna dikatakan ada jika memenuhi kondisi:
λ1X1+λ2X2+…+λkXk = 0
dimana λ1, λ2, …, λk adalah konstanta sedemikian rupa sehingga tidak semuanya nol (0).
Dalam perkembangannya, multikolinieritas juga berarti adanya hubungan yg linier kuat tetapi tidak sempurna diantara beberapa atau semua variabel bebas dalam model regresi.
Misalkan pada model regresi dengan k variabel bebas X1, X2, …, Xk (dimana X1 = 1), suatu hubungan linier yg kuat tapi tidak sempurna dikatakan ada jika memenuhi kondisi:
λ1X1+λ2X2+…+λkXk + vi = 0
dimana vi adalah unsur kesalahan yg bersifat stokastik.
Pengaruh pada Saat Variabel Bebas Tidak Saling Berkorelasi
Data produktifitas kerja (halaman 296).
Trial (i) | Crew Size (Xi1) | Bonus pay (Xi2) | Crew Produktivity Score (Yi) |
---|---|---|---|
1 | 4 | 2 | 42 |
2 | 4 | 2 | 39 |
3 | 4 | 3 | 48 |
4 | 4 | 3 | 51 |
5 | 6 | 2 | 49 |
6 | 6 | 2 | 53 |
7 | 6 | 3 | 61 |
8 | 6 | 3 | 60 |
Lakukan analisis regresi secara parsial & overall.
Pengaruh pada Saat Variabel Bebas Saling Berkorelasi secara Sempurna
Contoh (halaman 299).
Case (i) | Xi1 | Xi2 | Yi |
---|---|---|---|
1 | 2 | 6 | 23 |
2 | 8 | 9 | 83 |
3 | 6 | 8 | 63 |
4 | 10 | 10 | 103 |
Konsekuensi Multikolinieritas
A. Kesalahan Baku Semakin Besar
Meski penaksir OLS bisa diperoleh, standard error (kesalahan baku) cenderung semakin besar dengan meningkatnya korelasi antar variabel bebas. Misal pada model regresi yi = β1xi1 + β2 xi2+ ei dimana xi = X i −X dan yi = Yi −Y maka:
β1 = (∑ yi xi1)(∑ xi22 ) − (∑ yi xi2 )(∑ xi1xi2 ) / (∑ xi21)(∑ xi22 ) − (∑ xi1xi2 )2
Jika xi2 = λxi1 + vi, dimana λ ≠ 0 dan Σ xi2vi = 0, maka:
β1 = (∑ yi xi1)(∑ xi22 + ∑vi2 ) − (∑ yi xi2 + ∑ yivi )(∑ xi21) / (∑ xi21)(∑ xi21+ ∑vi2 ) − (∑ xi21)2
Penaksir β2 dapat dicari secara analogi dengan pencarian penaksir β1.
B. Convidence Interval lebih Lebar
Besarnya standard error berakibat pada selang keyakinan (confidence interval) untuk suatu parameter menjadi lebih lebar.
Misalkan rx1x2 = 0,9 maka CI 95% untuk β1 dirumuskan sebagai berikut:

C. Standard Error Sensitif terhadap Perubahan Data
Pada multikolinieritas yg tinggi tapi tidak sempurna, estimator koefisien regresi bisa diperoleh, tapi estimator & standard error menjadi sensitif terhadap perubahan data. Contoh:
Y | X1 | X3 |
---|---|---|
1 | 2 | 4 |
2 | 2 | |
3 | 4 | 12 |
4 | 6 | |
5 | 8 | 16 |
Y | X1 | X3 |
---|---|---|
1 | 2 | 4 |
2 | 2 | |
3 | 4 | |
4 | 6 | 12 |
5 | 8 | 16 |
Periksa signifikansi koefisien regresi, s.e., & R2
D. Variabel dapat tidak Signifikan
Pada multikolinieritas yg tinggi tapi tidak sempurna, bisa terjadi R2 (koefisien determinasi) tinggi namun tidak satupun variabel signifikan secara statistik.
Cara Mendeteksi Multikolinieritas
- Matriks korelasi antar variabel bebas. Periksa apakah terdapat nilai korelasi yg tinggi (sempurna) antar variabel bebas.
- Kestabilan koefisien regresi parsial
- Kesesuaian tanda koefisien regresi menurut suatu teori
- Variance Inflation Factor (VIF). Petunjuk terjadinya kolinieritas jika VIF > 5
- R2 tinggi, tapi tidak ada/hanya sedikit variabel bebas yg signifikan secara statistik
Alternatif Solusi Mengatasi Multikolinieritas
1. Informasi apriori
Contoh:
Pada model Yi = β+β1Xi1+β2Xi2+εi
Misal Y = Konsumsi, X1 = Pendapatan, X2 = Tabungan Informasi apriori, misalkan β2 = 0,10β1 sehingga:
Yi = β+β1Xi1+0,10β1Xi2+εi = β+β1Xi+εi dimana Xi = Xi1+0,10Xi2
Informasi apriori bisa berdasarkan suatu teori atau hasil penelitian sebelumnya.
2. Menghubungkan Data
Menghubungkan data cross-sectional dan data time series (panel data).
3. Mengeluarkan Variabel Bebas
Mengeluarkan satu atau beberapa variabel bebas Beberapa metode yg dapat digunakan:
- Principle Component Analysis
- Factor Analysis
- Stepwise Regression
- Ridge Regression dan lain sebagainya.
4. Transformasi Variabel
Transformasi variabel (melalui first differencing) Untuk data time series, jika hubungan
Yt = β+β1Xt1+β2Xt2+εt
berlaku pd saat t, maka berlaku pula untuk t-1, sehingga ada:
Yt-1 = β+β1X(t-1)1+β2X(t-1)2+εt-1
Jika kedua persamaan di atas dikurangkan, maka diperoleh:
Yt – Yt-1 = β1(Xt1 – X(t-1)1) + β2(Xt2 – X(t-1)2) + vt
dimana vt = εt – εt-1
Metode lainnya untuk mengatasi multikolinearitas juga dapat dilakukan dengan Penambahan data baru.
Latihan Soal Uji Multikolinieritas
Berdasarkan data berikut, cocokkan model:
Yi = β+β1Xi1+β2Xi2+εi
No. | Y | X1 | X2 |
---|---|---|---|
1 | -10 | 1 | 1 |
2 | -8 | 2 | 3 |
3 | -6 | 3 | 5 |
4 | -4 | 4 | 7 |
5 | -2 | 5 | 9 |
6 | 6 | 11 |
No. | Y | X1 | X2 |
---|---|---|---|
7 | 2 | 7 | 13 |
8 | 4 | 8 | 15 |
9 | 6 | 9 | 17 |
10 | 8 | 10 | 19 |
11 | 10 | 11 | 21 |
Agung Priyo Utomo – STIS