BAB XI
HETEROSKEDASTISITAS DATA
11.1 PENGANTAR
Pada asumsi klasik ke-5 dinyatakan bahwa varian dari disturbance term atau error
term (e) bersifat konstan. Asumsi ini merupakan konsekuensi dari sulit terpenuhinya asumsi
klasik ke-4 yakni zero conditional mean atau ekspektasi error adalah nol. Oleh karena itu,
perlu asumsi lain bahwa variasi dari komponen pengganggu diasumsikan konstan. Jika
komponen pengganggu memiliki variasi konstan disebut dengan Homoskedastisitas,
sebaliknya jika variasi tidak konstan disebut dengan Heteroskedastisitas.
11.2 KONSEP HETEROSKEDASTISITAS
Jika kondisi autokorelasi sering terjadi karena penggunaan data time series,
sebaliknya, heteroskedastisitas sering terjadi dalam penggunaan data cross-section.
Dibandingkan dengan data time series, miliki karakteristik yang lebih variatif sebagai
konsekuensi dari penggunaan unit individu yang berbeda. Misalnya studi tentang
pengupahan pada berbagai perusahan akan memberikan hasil perbedaan yang relatif tinggi
antara perusahaan besar dengan perusahaan kecil, sehingga memberikan nilai variasi yang
tinggi. Data dengan fluktuasi yang tinggi cenderung memiliki rata-rata dan varian yang tidak
konstan atau memiliki heteroskedastisitas.
Heteroskedastisitas mengakibatkan estimasi OLS tidak menghasilkan estimator yang
Best Linear Unbiassed Estimator (BLUE), tetapi hanya menghasilkan estimator yang Linear
Unbiasse. Heteroskedastisitas mengakibatkan varian menjadi tidak minimum atau varian
variabel sehingga adanya heteroskedastisitas membuat model menjadi tidak efisien (Baltagi,
2008). Secara formal, kondisi heteroskedastisitas ditunjukkan oleh:
Var (E X1,X2,... ..., Xk) = o12 ; i = 1,2,......., k...........
MODUL EKONOMETRIKA DASAR |96
Dimana simbol i menunjukkan bahwa varian mengalami perubahan dari satu
observasi ke observasi lainnya. Jika diilustrasikan dengan gambar ditunjukkan pada gambar
berikut:
Sebaliknya, jika dalam suatu model nilai varian adalah minimum, maka kondisi
tersebut bersifat homoskedastisitas, secara format sebagai berikut:
Var (E X1,X2,... ..., Xk) = o2.......................................................
Jika diilustrasikan seperti gambar berikut:
MODUL EKONOMETRIKA DASAR |97
Menurut Gujati (2004), terdapat beberapa alasan mengenai keberadaan
heteroskedastitas dalam suatu model yakni:
1. Adanya situasi error learning models
Kondisi error learning models maksudnya bahwa tingkat kesalahan akan
semakin menurun seiring dengan waktu. Misalnya, penggunaan teknologi dalam
kegiatan produksi akan mampu mengurangi tingkat kesalahan dalam proses produksi,
serta memberikan hasil yang lebih banyak dengan kualitas yang semakin baik. Di
bidang pendidikan, semakin lama siswa belajar maka semakin sedikit kesalahan
dalam mengerjakan soal dan kualitas menjadi meningkat/lebih baik.
2. Peningkatan Pendapatan
Adanya peningkatan pada data pendapatan individu atau masyarakat
mengakibatkan data-data pendapatan (jenis-jenis pendapatan) juga mengalami
peningkatan dan memiliki variasi yang relatif tinggi.
3. Pengambilan Data
Teknik pengambilan data yang semakin berkembang dan maju serta
penggunaan berbagai teknologi pendukung memberikan hasil positif terhadap
kualitas data yang digunakan.
4. Keberagaman Outlier
MODUL EKONOMETRIKA DASAR |98
Outlier merupakan kondisi data yang menyimpang dari rata-rata hitung. Data
outlier dapat mengakibatkan kualitas data menjadi menurun yang ditunjukkan oleh
nilai rata-rata yang tidak valid serta memiliki standar error yang relatif besar.
5. Kesalahan Spesifikasi
Pembentukan model yang tidak sesuai, seperti pemilih variabel yang tidak
tepat dapat menghasilkan model menjadi tidak valid.
11.3 ASUMSI HETEROSKEDASTISITAS
Permasalahan heteroskedastisitas sebagai akibat dari adanya varian yang tidak
minimum dalam suatu model memberikan konsekuensi hasil kesimpulan menjadi tidak valid.
Secara spesifik, keberadaan varian dalam model yang bersifat tidak minimum dan tidak
konstan, diidentifikasi dapat menghasilkan terjadinya hal-hal berikut (Baltagi, 2008):
1. Standar error menjadi bias. Hal ini terjadi karena data dalam model yang cenderung
fluktuatif memberikan nilai variasi yang besar.
2. Nilai koefisien parameter masih tidak bias (unbiassed) namun bukan merupakan nilai
yang terbaik (tidak efisien).
3. Konsekuensi lanjutan dari poin (1), nilai t-statistik maupun F-statistik tidak dapat
ditentukan.
4. Kesimpulan yang diambil menjadi tidak valid.
11.4 PENYEBAB HETEROSKEDASTISITAS
Terdapat beberapa alasan mengapa residual regresi dapat bersifat heteroskedastisitas,
di antaranya (Gujarati, 2003 dan Pindyck dan Rubenfeld, 1997):
1. Situasi error learning
Misalnya kita ingin mengetahui hubungan tingkat kesalahan mengetik
terhadap berbagai variabel. Jika kita menggunakan sampel yang bersifat panel /time
series akan sangat mungkin model yang dimiliki akan bersifat heterokedastis. Hal ini
disebabkan kesalahan pengetikan akan menurun dari waktu ke waktu dan terjadi
MODUL EKONOMETRIKA DASAR |99
konvergensi di antara elemen sampel (kesalahan anggota sampel yang paling tidak
terampil akan menurun mendekati mereka yang awalnya sudah terampil).
2. Kemampuan direksi.
Hal ini tampak jelas pada penelitian dengan menggunakan variabel
pendapatan. Aktivitas oleh individu yang memiliki pendapatan tinggi akan jauh lebih
variatif dibandingkan mereka yang berpendapatan rendah. Dengan demikian suatu
model regresi dengan menggunakan variabel semacam ini akan mengalami
peningkatan residual kuadrat dengan semakin besarnya pendapatan.
3. Perbaikan teknik pengambilan data.
Peneliti akan belajar untuk menarik informasi dengan benar, dengan demikian
kesalahan akibat proses ekstraksi data akan semakin menurun .
4. Keberadaan Outlier
Outlier adalah data yang memiliki karakteristik sengat berbeda dari kondisi
yang umum. Misalnya kita memiliki suatu set data pendapatan dengan kisaran IDR
2-5 juta per bulan, keberadaan individu dengan pendapatan 100 juta dapat dikatakan
outlier.
5. Masalah spesifikasi.
Jika model pada populasi adalah non-linier (misalnya eksponensial) namun
kita memaksa menggunakan model linier. Di sini, kuadrat residual akan meningkat
cepat dengan meningkatnya nilai variabel bebas.
11.5 CARA MENDETEKSI HETEROSKEDASTISITAS
Model regresi dengan heteroskedastisitas mengandung konsekuensi serius pada estimator
metode OLS karena tidak lagi BLUE. Oleh karena itu, sangat penting bagi kita untuk
mengetahui apakah suatu model regresi mengandung unsur heteroskedastisitas atau tidak.
Beberapa metode untuk mendeteksi ada tidaknya masalah heteroskedastisitas bisa dilakukan
secara informal maupun formal, antara lain sebagai berikut:
1. Metode informal (Grafik)
MODUL EKONOMETRIKA DASAR |100
Metode cara yang paling cepat dan dapat digunakan untuk menguji masalah
heteroskedastisitas adalah dengan mendeteksi pola residual melalui sebuah grafik.
Ketentuannya dari metode grafik yaitu:
“Jika residual mempunyai varian yang sama (homoskedastisitas) maka kita tidak mempunyai
pola yang pasti dari residual. Sebaliknya jika residual mempunyai sifat heteroskedastisitas,
residual ini akan menunjukkan pola yang tertentu.”
2. Metode Park
Setelah membahas deteksi heteroskedastisitas secara informal dengan metode grafis,
maka selanjutnya kita akan membahas uji deteksi heteroskedastisitas dimulai dari metode
yang dikembangkan oleh Park. Menurut Park, varian variabel gangguan yang tidak konstan
atau masalah heteroskedastisitas muncul karena residual ini tergantung dari variabel
independen yang ada di dalam model. Ketentuan pengujian metode Park adalah sebagai
berikut ;
Berdasarkan uji statistic estimator . Jika tidak signifikan melalui uji maka dapat
disimpulkan tidak ada heteroskedastisitas.
Sebaliknya jika signifikan secara statistic maka model mengandung unsur
heteroskedastisitas.
3. Metode Glejser
Uji metode glejser ini mirip dengan uji Park namun perbedaannya hanya pada
variable dependennya. Jika pada uji Park menggunakan ln(residual kuadrat) sebagai variabel
dependen, maka untuk uji glejser variabel ini diganti dengan nilai absolut residual. Ketentuan
pengujian metode glejser antara lain:
Berdasarkan uji statistic estimator . Jika tidak signifikan melalui uji maka dapat
disimpulkan tidak ada heteroskedastisitas.
Sebaliknya jika signifikan melalui uji t secara statistic maka model mengandung
unsure heteroskedastisitas.
MODUL EKONOMETRIKA DASAR |101
4. Metode Korelasi Spearman
Metode berikutnya untuk mendeteksi masalah heteroskedastisitas adalah metode
yang dikembangkan oleh Spearman. Sebelum membahas metode korelasi dari Spearman,
kita definisikan terlebih dahulu korelasi yang dikembangkan oleh Spearman
5. Metode Goldfeld-Quandt
Adanya kelemahan metode Park dan Glejser menginspirasi ahli ekonometrika lain
untuk mengembangkan metode deteksi heteroskedastisitas lebih lanjut. Metode GoldFeld-
Quandt mengasumsikan bahwa heteroskedastisitas merupakan fungsi positif dari variabel
independen.
6. Metode Breusch-Pagan-Godfrey
Breusch-Pagan mengembangkan metode yang tideak memerlukan penghilangan data
dan pengurutan data, sebagai alternatif dari metode GoldFeld-Quandt.
7. Metode White
Tidak seperti metode Breusch-Pagan yang sangat tergantung pada asumsi tentang
normalitas pada variabel gangguan, Hal White mengembangkan sebuah metode yang tidak
memerlukan asumsi tentang adanya normalitas pada variabel gangguan.
11.6 PENYEMBUHAN HETEROSKEDASTISITAS
Saat model kita diketahui mengandung masalah heteroskedastisitas maka harus
disembuhkan. Penyembuhan masalah heterokedastisitas tergantung dari pengetahuan kita
tentang varian dari variabel gangguan.
Jika varian diketahui maka kita bisa mengatasi masalah heterokedastisitas dengan
metode Weighted Least Squares (WLS).
Tetapi dalam banyak kasus kita tidak bisa mengetahui varian variabel gangguan
dengan metode white dan atau metode transformasi.
MODUL EKONOMETRIKA DASAR |102
BAB XII
MODEL REGRESI DATA PANEL
12.1 PENGERTIAN REGRESI DATA PANEL
Regresi Data Panel adalah gabungan antara data cross section dan data time series,
dimana unit cross section yang sama diukur pada waktu yang berbeda. Maka dengan kata
lain, data panel merupakan data dari beberapa individu sama yang diamati dalam kurun
waktu tertentu. Jika kita memiliki T periode waktu (t = 1,2,…,T) dan N jumlah individu (i =
1,2,…,N), maka dengan data panel kita akan memiliki total unit observasi sebanyak NT. Jika
jumlah unit waktu sama untuk setiap individu, maka data disebut balanced panel. Jika
sebaliknya, yakni jumlah unit waktu berbeda untuk setiap individu, maka disebut unbalanced
panel.
Sedangkan jenis data yang lain, yaitu: data time-series dan data cross-section. Pada
data time series, satu atau lebih variabel akan diamati pada satu unit observasi dalam kurun
waktu tertentu. Sedangkan data cross-section merupakan amatan dari beberapa unit observasi
dalam satu titik waktu.
12.2 ASUMSI REGRESI DATA PANEL
Metode Regresi Data Panel akan memberikan hasil pendugaan yang bersifat Best
Linear Unbiased Estimation (BLUE) jika semua asumsi Gauss Markov terpenuhi diantaranya
adalah non-autcorrelation.
Non-autocorrelation inilah yang sulit terpenuhi pada saat kita melakukan analisis
pada data panel. Sehingga pendugaan parameter tidak lagi bersifat BLUE. Jika data panel
dianalisis dengan pendekatan model-model time series seperti fungsi transfer, maka ada
informasi keragaman dari unit cross section yang diabaikan dalam pemodelan. Salah satu
MODUL EKONOMETRIKA DASAR |103
keuntungan dari analisis regresi data panel adalah mempertimbangkan keragamaan yang
terjadi dalam unit cross section.
12.3 PERSAMAAN REGRESI DATA PANEL
Persamaan Regresi data panel ada 2 macam , yaitu One Way Model dan Two Way Model.
One Way Model adalah model satu arah, karena hanya mempertimbangkan efek individu
(αi) dalam model. Berikut Persamaannya:
Dimana:
α = Konstanta
β = Vektor berukuran P x 1 merupakan parameter hasil estimasi
Xit = Observasi ke-it dari P variabel bebas
αi = efek individu yang berbeda-beda untuk setiap individu ke-i
Eit = error regresi seperti halnya pada model regresi klasik.
Two Way Model adalah model yang mempertimbangkan efek dari waktu atau
memasukkan variabel waktu. Berikut Persamaannya:
Persamaan di atas menunjukkan dimana terdapat tambahan efek waktu yang
dilambangkan dengan deltha yang dapat bersifat tetap ataupun bersifat acak antar tahunnya.
MODUL EKONOMETRIKA DASAR |104
12.4 KEUNTUNGAN REGRESI DATA PANEL
Keuntungan melakukan regresi data panel, antara lain:
1. Dapat memberikan peneliti jumlah pengamatan yang besar, meningkatkan degree of
freedom (derajat kebebasan), data memiliki variabilitas yang besar dan mengurangi
kolinieritas antara variabel penjelas, di mana dapat menghasilkan estimasi ekonometri
yang efisien.
2. Panel data dapat memberikan informasi lebih banyak yang tidak dapat diberikan hanya
oleh data cross section atau time series saja.
3. Panel data dapat memberikan penyelesaian yang lebih baik dalam inferensi perubahan
dinamis dibandingkan data cross section.
12.5 TAHAPAN REGRESI DATA PANEL
Tidak seperti regresi biasanya, regresi data panel harus melalui tahapan penentuan model
estimasi yang tepat. Berikut diagram tahapan dari regresi data panel:
MODUL EKONOMETRIKA DASAR |105
12.6 PENENTUAN MODEL ESTIMASI
Dalam metode estimasi model regresi dengan menggunakan data panel dapat
dilakukan melalui tiga pendekatan, antara lain:
1. Common Effect Model atau Pooled Least Square (PLS)
Merupakan pendekatan model data panel yang paling sederhana karena hanya
mengkombinasikan data time series dan cross section. Pada model ini tidak diperhatikan
dimensi waktu maupun individu, sehingga diasumsikan bahwa perilaku data perusahaan
sama dalam berbagai kurun waktu. Metode ini bisa menggunakan pendekatan Ordinary Least
Square (OLS) atau teknik kuadrat terkecil untuk mengestimasi model data panel.
2. Fixed Effect Model (FEM)
Model ini mengasumsikan bahwa perbedaan antar individu dapat diakomodasi dari
perbedaan intersepnya. Untuk mengestimasi data panel model Fixed Effects menggunakan
teknik variable dummy untuk menangkap perbedaan intersep antar perusahaan, perbedaan
intersep bisa terjadi karena perbedaan budaya kerja, manajerial, dan insentif. Namun
demikian slopnya sama antar perusahaan. Model estimasi ini sering juga disebut dengan
teknik Least Squares Dummy Variable (LSDV).
3. Random Effect Model (REM)
Model ini akan mengestimasi data panel dimana variabel gangguan mungkin saling
berhubungan antar waktu dan antar individu. Pada model Random Effect perbedaan intersep
diakomodasi oleh error terms masing-masing perusahaan. Keuntungan menggunkan model
Random Effect yakni menghilangkan heteroskedastisitas. Model ini juga disebut dengan
Error Component Model (ECM) atau teknik Generalized Least Square (GLS) .
MODUL EKONOMETRIKA DASAR |106
DAFTAR PUSTAKA
Wahyudi, Setyo Tri. 2020. Ekonometrika. Depok : Rajawali Pers
Bramana,Erwin.2017.Panduan Eviews Sederhana UntukEkonometrika
Dasar.Jakarta.Grasindo
https://www.muradmaulana.com/2015/09/mengenal-singkat-pengertian-ekonometrika-
kegunaannya.html
https://www.gurupendidikan.co.id/data/
https://www.statistikian.com/download-eviews?amp
https://teorionline.wordpress.com/2011/05/15/pengenalan-eviews/
http://sosiologis.com/pengujian-hipotesis
https://www.rumusstatistik.com/2019/05/pengujian-hipotesis.html
https://penelitianilmiah.com/analisis-korelasi/
https://teknikelektronika.com/pengertian-uji-hipotesis-jenis-jenisnya/
https://maglearning.id/2021/10/29/pengertian-analisis-korelasi-konsep-dasar/
MODUL EKONOMETRIKA DASAR |107