SPSS untuk penyelidik muda
KANDUNGAN
PRAKATA .......................................................................................... iv
DEDIKASI dan PENGHARGAAN ....................................................... vi
BAB 1 .....................................................................................................1
1.1 Mengapa Statistik Penting?...........................................................2
1.2 SPSS untuk Penyelidik Muda ........................................................3
1.3 Senangnya Statistik Diskriptif ........................................................4
1.4 Statistik Inferensi Sedikit Mencabar !.............................................6
1.3 Konsep Mudah Taburan Normal..................................................10
1.4 Statistik Parametrik dan Bukan Parametrik .................................15
1.4.1 Kenapa Dinamakan Statistik Parametrik ? ............................15
1.4.2 Apa Pula Statistik Bukan Parametrik ?..................................17
1.4.3 Penentuan Saiz Sampel .......................................................20
1.5 Memahami Pemboleh ubah.........................................................22
1.5.1 Pemboleh ubah Selanjar dan Diskrit .....................................23
1.5.2 Pemboleh ubah Bersandar dan Tidak Bersandar..................24
1.5.3 Moderator dan Mediator........................................................26
1.5.4 Pemboleh ubah Luaran.........................................................29
1.6 Apa Itu Skala?.............................................................................30
1.6.1 Skala Nominal.......................................................................32
1.6.2 Skala Ordinal ........................................................................33
1.6.3 Skala Sela (Interval)..............................................................34
1.6.4 Skala Nisbah (Ratio) .............................................................35
BAB 2 ...................................................................................................38
2.1 Aplikasi Praktis SPSS..................................................................39
2.1.1 Isu dan Objektif.....................................................................39
2.1.2 Soalan Kajian (SK)................................................................40
2.1.3 Reka bentuk dan Populasi ....................................................43
2.1.4 Kajian Eksperimen ................................................................44
2.1.5 Kaji Selidik ............................................................................45
2.1.6 Hipotesis ...............................................................................46
2.2 Melaksana Kajian ........................................................................48
2.3 Mudahnya SPSS .....................................................................51
2.3.1 Variable View dan Data View................................................52
i
SPSS untuk penyelidik muda
2.3.2 Menamakan Pemboleh ubah ................................................54
2.3.3 Menyediakan Value ..............................................................54
2.3.4 Data Hilang atau Tidak Lengkap ...........................................55
BAB 3 ...................................................................................................64
3.1 Persediaan Data..........................................................................65
3.1.1 Kod Semula ..........................................................................65
3.1.2 Missing Complete at Random (MCAR) .................................72
3.2 Semakan Diskriptif ......................................................................82
3.2.1 Semakan Data Kategori ........................................................82
3.2.2 Semakan Data Selanjar ........................................................85
3.2.3 Semakan Data Ordinal..........................................................87
3.3 Skala Likert - Ordinal ke Sela ! ....................................................88
BAB 4 ...................................................................................................93
4.1 Mengapa Data Perlu Normal? .....................................................94
4.1.1 Ujian Kenormalan KS dan SW ..............................................95
4.1.2 Ujian Skewness dan Kurtosis................................................96
4.2 Normal – Uji Jangan Tak Uji ! ......................................................98
4.2.1 SK 4, 5, 7 (Skor motivasi, Sains dan self-esteem) ................99
4.2.2 SK 8 (Skor self-esteem untuk Kumpulan 1, 2 dan 3)...........101
4.2.3 SK 9 (Skor Sains ikut jantina) .............................................104
4.2.4 SK 11, 15 (Skor ujian pra, pasca dan pengekalan) .............105
4.2.5 SK 14 (Skor sum_harga ikut kumpulan umur).....................108
4.2.6 SK 6 (Sum_harga dan sum_spec) ......................................110
4.2.7 SK 10, 12 (Ujian pra, pasca, pengekalan ikut jantina) .........113
4.2.8 SK 13 (Skor Sum_harga antara jantina)..............................115
BAB 5 .................................................................................................117
5.1 Statistik Diskriptif Sampel Kajian ...............................................118
5.1.1 Transformasi Kumpulan Umur ............................................118
5.1.2 Peratusan Ikut Kumpulan Umur ..........................................122
5.1.3 Peratusan Ikut Jantina ........................................................123
5.1.4 Crosstab Umur dan Jantina ................................................124
5.1.5 Crosstab Kumpulan dan Jantina .........................................126
5.1.6 Crosstab akuan Twitter dan Jantina....................................127
5.1.7 Carta bar Akaun Twitter dan Jantina ...................................127
ii
SPSS untuk penyelidik muda
5.2 Analisis Statistik Kajian..............................................................130
5.3 Analisis Statistik Diskriptif..........................................................132
SK 1 (Frekuensi)..........................................................................132
SK 2 (Frekuensi)..........................................................................136
5.4 Analisis Statistik Inferensi..........................................................139
SK 3 (chi-kuasa dua tidak bersandar) ..........................................139
SK 4 (Korelasi Pearson) ..............................................................145
SK 5 (Partial Pearson Correlation)...............................................152
SK 6 (Korelasi) ............................................................................155
SK 7 (Regresi Berganda).............................................................159
SK 8 (ANOVA satu hala antara kumpulan) ..................................167
SK 9 (ANOVA dua hala antara kumpulan) ...................................172
SK 10 (ANOVA satu hala pengukuran berulang) .........................181
SK 11 (ANOVA satu hala antara kumpulan) ................................185
SK 12 (MANOVA satu hala).........................................................190
SK 13 (ujian-t sampel tidak bersandar) ........................................210
SK 14 (ujian-t sampel bersandar / padanan)................................213
Lampiran 1 ......................................................................................216
Rujukan ........................................................................................... 217
iii
SPSS untuk penyelidik muda
PRAKATA
Statistik adalah satu disiplin ilmu yang banyak menggunakan simbol dan rumus
sehingga menyukarkan pemahaman sebahagian besar pelajar. Namun begitu,
statistik menjadi satu alat untuk mentafsir data dari kajian sehingga mempelajari
statistik sesuatu yang tidak dapat dielakkan, khususnya di peringkat pengajian
siswazah. Kewujudan IBM SPSS Statictics sebagai satu aplikasi perisian
komputer yang mesra pengguna, telah memberi peluang kepada pengguna
yang kurang menguasai statistik secara mendalam tetapi masih boleh
menganalisis data penyelidikan dengan sistematik dan lengkap.
Buku ini ditulis, seperti saya sendiri yang menjalankan kajian. Pendekatan ini
diambil bagi menghasilkan satu buku yang dibaca dan difahami sebagai satu
proses analisis data yang lengkap dengan exploratory data analysis, missing
value analysis, menguji syarat analisis (seperti Mahalanobis distances,
multicollinearity, singularity, sphericity), pengujian kenormalan skewness dan
kurtosis, membuat pelaporan dan transformasi data ordinal ke sela (interval).
Ini kerana saya menyedari wujudnya pelbagai buku SPSS di pasaran, maka
buku ini cuba membawa satu pendekatan yang lebih menyeluruh.
Buku ini terhasil kerana saya ingin membantu pelajar diploma, ijazah pertama,
pelajar pascasiswazah serta penyelidik muda untuk menjalankan analisis data
secara sistematik.
Selamat membaca dan salam hormat.
Othman Talib
[email protected]
www.drotspss.blogspot .com
https://www.facebook.com/othman.talib
iv
SPSS untuk penyelidik muda
IBM SPSS Statistics versi 21 yang digunakan dalam buku ini.
v
SPSS untuk penyelidik muda
DEDIKASI dan PENGHARGAAN
Buat isteriku, TENGKU PUTRI NORISHAH yang takut kepada statistik,
pengikut setia blog dan facebook yang mengikuti coretanku saban hari
dan anak bongsuku NINE yang tidak pernah mengganggu ketika aku
sibuk menulis…
Penulis bersama peserta dalam salah satu bengkel yang
dikendalikannya di Universiti Islam Antarabangsa, Gombak.
vi
SPSS untuk penyelidik muda
BAB 1
PENGENALAN
1
SPSS untuk penyelidik muda
1.1 Mengapa Statistik Penting?
Buku ini disediakan bagi penyelidik muda yang baru berjinak-jinak
menggunakan aplikasi analisis statistik dalam penyelidikan mereka.
Statistik adalah satu disiplin pengetahuan yang merekod, menyusun dan
menganalisis data-data dalam bentuk angka sehingga boleh ditafsirkan
dengan lebih bermakna. Buku ini hanya akan menghuraikan secara
sepintas lalu pengetahuan statistik kerana fokus diberikan kepada
aplikasi dan prosidur menganalisis data menggunakan perisian statistik
SPSS.
Mengapa statistik penting?
Pengetahuan statistik sangat penting dalam bidang penyelidikan sains
dan juga sains sosial. Kaedah dan instrumen mendapatkan nilai purata
berat 100 buah durian tidak sama seperti mendapatkan nilai purata
pendapat 100 siswazah terhadap sesuatu isu. Menimbang berat durian
memerlukan alat penimbang yang boleh diselaraskan dengan mudah
dengan kesahan dan kebolehpercayaan yang tinggi, berbanding dengan
penggunaan instrumen seperti borang kaji selidik bagi mengambil data
dalam bentuk respon pendapat siswazah.
Bukan itu sahaja, adalah sesuatu yang pelik jika terdapat penyelidik yang
ingin pula mengambil purata bagi jantina atau bangsa misalnya. Nilai
purata jantina ini walaupun boleh diperolehi dengan mudah tetapi tidak
membawa apa-apa makna. Bolehkah seseorang yang lahir dari
perkahwinan campur Melayu dan Cina memberikn respoan bangsanya
1.5? Tentu tidak masuk akal !
2
SPSS untuk penyelidik muda
Pentingnya pengetahuan statistik kerana anda boleh menjelaskan
fenomena sampel yang anda kaji dengan yakin dan berupaya membuat
kesimpulan yang jelas dan bermakna dan juga membuat inferensi atau
generalisasi kesimpulan tersebut kepada populasi. Pengetahuan statistik
juga membolehkan anda membuat jangkaan sesuatu fenomena dan
implikasinya dalam bidang yang anda kaji.
1.2 SPSS untuk Penyelidik Muda
Buku ini akan menggunakan hanya satu contoh yang merangkumi
analisis asas data kuantitatif diskriptif dan inferensi. Strategi ini digunakan
bagi memudahkan pemahaman, seolah-olah buku ini sedang
menyelesaikan analisis bagi satu kajian sambil memberi fokus kepada
keperluan utama analisis statistik asas. Buku ini juga tidak mengupas
sebarang formula atau rumus statistik yang boleh dibaca dalam buku-
buku statistik yang lain. Buku ini dipersembahkan persis penyelidik muda
yang berfikir untuk membuat satu kajian dan memilih analisis statistik
yang sesuai sebelum menggunakan SPSS bagi analisis data tersebut.
Buku ini akan mendemonstrasi aplikasi perisian statistik SPSS secara
langkah demi langkah bermula dengan penyediaan dan saringan data
atau analisis eksploratori data (EDA – Exploratory Data Analysis) diikuti
dengan penjelasan tentang syarat (assumption) sebelum sesuatu analisis
boleh dijalankan tanpa melibatkan formulasi matematik atau statistik yang
kompleks. Buku ini cuba memberikan satu gambaran bahawa analisis
statistik bukanlah sesuatu yang patut ditakuti. Terdapat dua bentuk asas
statistik iaitu statistik diskriptif dan statistik inferensi yang akan
dibincangkan dalam buku ini.
3
SPSS untuk penyelidik muda
1.3 Senangnya Statistik Diskriptif
Perbincangan dalam buku ini melibatkan kedua-dua analisis statistik
diskriptif dan inferensi. Statistik diskriptif, sebagaimana namanya,
bertujuan memperihalkan set-set data mentah yang diambil dari sampel
bagi memahami ciri-ciri sampel yang terpilih dari satu-satu populasi. Data
ini diperolehi dan dikumpul dari sampel menerusi melalui pelbagai cara
seperti kaji selidik, ujian pencapaian atau ujian kecerdasan dalam bentuk
frekuensi, indeks kecenderungan memusat (min, median, mod), indeks
kebolehubahan (julat, varians dan sisihan piawai) dan kedudukan relatif
(percentile).
Jadual 1.1 adalah satu contoh set data yang divisualkan dalam bentuk
graf bar. Graf seperti Rajah 1.1 pula digunakan akan memudahkan
perbandingan secara visual berbanding dengan hanya perbandingan
dalam bentuk angka.
Jadual 1.1 Contoh satu jadual mudah
Syarikat Untung (Juta)
A 23
B 21
C 13
D 41
E 33
4
SPSS untuk penyelidik muda
45 Untung (Juta) 33
40
35 41
30
21
25 23 13
20 BCD E
15 Rajah 1.1 Graf bar
10
5
0
A
Secara ringkasnya, statistik diskriptif sering digunakan bagi
• mempersembahkan sekumpulan data dalam bentuk yang lebih
mudah difahami
• memberi gambaran ciri-ciri sampel yang mewakili ciri-ciri dalam
populasi di mana sampel tersebut diperolehi.
Satu contoh lagi bagi satu aplikasi statistik diskriptif adalah skor min
sekumpulan pelajar. Jika 10 pelajar dalam satu kelas mendapat skor
Sains seperti berikut 70, 66, 76, 53, 51, 68, 79, 79, 64, 65 maka min atau
skor purata kumpulan tersebut adalah 67.1. Nilai 67.1 ini adalah satu
analisis diskriptif yang lebih bermakna dan mudah difahami bagi mewakili
prestasi keseluruhan 10 pelajar berbanding dengan skor individu pelajar.
Juga boleh dilaporkan skor tertinggi (76) dan skor terendah (51) bagi set
data tersebut dengan julat sebanyak 25 iaitu beza antara skor maksima
dan skor mimina. Tentu “tidak berfaedah” untuk membincangkan setiap
individu data, berbanding dengan perbincangan tentang min bagi set data
5
SPSS untuk penyelidik muda
tersebut. Nilai min menggambarkan bahawa kumpulan yang mempunyai
min 50 bagi sesuatu skor adalah lebih baik secara keseluruhan
berbanding dengan kumpulan yang mempunyai min 40.
Dalam contoh lain, didapati satu sampel guru Sejarah (n=200) seluruh
Daerah Hulu Langat (N=560) adalah 20% guru lelaki (40 orang) dan 60%
(n=160) guru perempuan. Analisis diskriptif ini hanya menggambarkan
peratusan guru lelaki dan perempuan dalam sampel yang mewakili
populasi seluruh guru Sejarah Daerah Kajang. Ini tidak bermakna peratus
guru lelaki dan perempuan adalah 20:60 bagi populasi guru Sejarah
seluruh Daerah Hulu Langat.
1.4 Statistik Inferensi Sedikit Mencabar !
Lazimnya selepas menghuraikan ciri-ciri sampel menggunakan statistik
diskriptif, penyelidik akan menggunakan pula statistik inferensi untuk
menganalisis data yang diperolehi dari sampel bertujuan membuat
inferensi atau generalisasi atau menganggar ciri-ciri sampel kepada
populasi yang diwakili oleh sampel tersebut. Inferensi ini boleh dilakukan
kerana sampel yang dipilih adalah secara rawak “seboleh-bolehnya” dari
populasi maka sampel yang diambil “sepatutnya” mempunyai ciri-ciri
populasi. Dalam bahasa yang lebih mudah, statistik inferensi adalah
usaha menganalisis sampel yang sedikit bagi mengkaji ciri-ciri populasi
yang lebih besar di mana sampel tersebut diperolehi. Sampel digunakan
bagi menjimatkan masa, tenaga dan kewangan.
Lazimnya inferensi atau generalisasi dilakukan dengan menguji hipotesis
bagi mengetahui sama ada pemerhatian fenomena yang dikaji pada
sampel berada dalam aras keyakinan (confidence level) untuk dibuat
inferensi dari sampel kepada populasi. Hipotesis bertindak
6
SPSS untuk penyelidik muda
memperincikan lagi objektif kajian. Hipotesis permulaan atau dinamakan
hipotesis nol, Ho dibina jika anda ingin menjalankan analisis statistik yang
menggunakan data numerikal untuk tujuan membuat inferensi. Prosidur
pengujian hipotesis (akan dibincangkan lebih lanjut dalam bab
seterusnya) ini dilakukan melalui analisis statistik inferensi seperti ujian-t,
korelasi, regresi, ANOVA, dan MANOVA.
Penolakan atau penerimaan sesuatu hipotesis nol yang diuji seperti “min
skor kumpulan A tidak berbeza dengan min skor kumpulan B” lazimnya
ditentukan pada aras keyakinan, katakan 95% atau .95. Aras keyakinan
ini akan menghasilkan aras signifikan (significance level) 5% atau .05,
diberikan symbol, p=.05.
Aras keyakinan untuk menerima Ho bahawa tiada perubahan yang
signifikan antara skor min kumpulan A dan B, atau nilai p>.05. Menolak
Ho, yang membawa maksud wujud perubahan yang signifikan antara skor
min kumpulan A dan B berlaku p<.05. Bagi kajian yang memerlukan
dapatan yang lebih jitu, selalunya dalam bidang perubatan, aras
keyakinan 99% atau aras signifikan 0.01 ditetapkan untuk menerima atau
menolak hipotesis nol.
95 % kawasan terima Ho, 5 % kawasan tolak Ho,
tiada perbezaan signifikan wujud perbezaan signifikan
Skor
Rajah 1.2 Aras keyakinan 95% dan aras signifikan 5%
7
SPSS untuk penyelidik muda
Pemahaman ini boleh diillustrasikan dalam Rajah 1.2 di atas. Bila aras
signifikan ditetapkan pada .05 (iaitu 95% aras keyakinan) seperti lazimnya
dalam bidang sains sosial, maka jika nilai perbezaan skor min berada
dalam julat .05 (tolak Ho), bermakna perbezaan skor min ini 95% berlaku
kurang dari 5 dalam 100 kerana kebetulan.
Tiga asas pengiraan dalam statistik diskriptif iaitu min, varians dan sisihan
piawai kemudian digunakan selanjutnya bagi pengiraan dalam statistik
inferensi. Katakan anda mengambil secara rawak 100 sampel ketinggian
pelajar sebuah IPTA yang mempunyai populasi 10,000. Pengiraan min
(atau disebut sebagai purata dalam perbualan harian) sampel
menunjukkan min ketinggian adalah 1.11 m. Anda boleh membuat
inferensi dengan membuat anggaran (estimation) bahawa min ketinggian
populasi di IPTA tersebut adalah sekitar 1.11 m juga. Anda lakukan
inferensi bagi menjimatkan kos, masa dan tenaga jika mengambil semua
ketinggian individu pelajar dalam populasi.
Bagi memahami varians dan sisihan piawai pula, katakan anda
mempunyai satu set data dengan skor 1, 2, 3 dan 4, maka min set data
ini adalah 2.5
Min = 1 + 2 + 3 + 4 = 2.5
4
Dari nilai min ini, anda boleh mengira jumlah perbezaan antara individu
skor dengan min (perbezaan ini dikuasa dua bagi mengelakkan jumlah
keseluruhan perbezaan menjadi sifar) dan hasilnya adalah 6. Kemudian
nilai ini dibahagikan dengan 3 (iaitu n-1 atau 4 - 1) untuk mendapatkan
varians, s2 iaitu 2 seperti pengiraan berikut:
8
SPSS untuk penyelidik muda
Maka varians, s2 = (1 - 2)2 + (2 - 2)2 + (3 - 2)2 + (4 - 2)2 = 6 = 2
n-1 (4 - 1)
Persoalan timbul apabila operasi pengiraan melibatkan pembahagian (4
- 1) = 3, bukannya terus dibahagi dengan 4 sebagai lazimnya dalam
pencarian min (purata). Konsep ini digunakan oleh ahli statistik apabila
mengira sesuatu set data dari satu sampel yang diperolehi dari satu
populasi. Nilai pada sampel ini tidak sepenuhnya bebas dan terikat
dengan nilai pada populasi. Konsep ini dinamakan darjah kebebasan
(degree of freedom) atau ringkasnya, df.
Konsep df ini menjelaskan bahawa terdapat ralat persampelan apabila
data dari sampel digunakan untuk membuat anggaran sesuatu nilai
pengukuran bagi populasi secara inferensi. Misalnya jika empat data di
atas diambil dari populasi yang mempunyai min tertentu, katakan min
populasi adalah 2 (secara hipotetikal), maka hanya tiga (4 - 1) sahaja data
dari sampel tersebut yang bebas mempunyai sebarang nilai, manakala
satu lagi mesti mempunyai nilai tertentu (tidak bebas) bagi memastikan
akhirnya min populasi adalah 2. Hal ini tidak berlaku jika anda mengira
min sesuatu sampel untuk tujuan diskriptif, bukan untuk tujuan membuat
inferensi kepada nilai populasi, iaitu anda boleh terus bahagikan nilai yang
dijumlah dengan n, bukannya n-1.
Selain dari itu, pembahagian terhadap (n - 1) untuk mengira min bagi
tujuan inferensi (berbanding dengan pembahagian terhadap n sahaja
bagi tujuan diskriptif) akan menghasilkan nilai varians, s2 bagi sampel
yang lebih besar (sebab dibahagi dengan nilai yang lebih kecil, n - 1
berbanding dibahagi dengan n sahaja). Penjelasan ini mempunyai logik
kerana semakin kecil bilangan sampel, pembahagian terhadap bilangan
9
SPSS untuk penyelidik muda
sampel (n - 1) bagi mendapat nilai varians, s2 akan semakin besar, tetapi
sebaliknya semakin besar bilangan sampel, pembahagian terhadap
bilangan sampel (n - 1) akan menghasilkan nilai varians yang
menghampiri nilai populasi.
Setelah melalui operasi kuasa dua, nilai varians, s2 ini akan di punca
kuasakan pula bagi meneutralkan operasi kuasa dua tersebut, lalu
terhasillah nilai yang dinamakan sisihan piawai, s.
Maka sisihan piawai, √s2 = s = √2 = 1.4
Nilai sishan piaswai, s = 1.4, merujuk kepada perbezaan purata data
individu terhadap min adalah 1.4.
Nilai sisihan piawai ini sekaligus menggambarkan serakan (variability)
data. Jika satu dapatan melaporkan set data A mempunyai sishan
piaswai, sA = 8.8 dan set data B mempunyai sishan piawai, sB = 7.7, maka
boleh disimpulkan bahawa individu data atau skor dalam set data A lebih
jauh tersebar disekitar min data set A tersebut, berbanding set data B.
1.3 Konsep Mudah Taburan Normal
Taburan normal adalah satu konsep penting dalam kajian sains sosial.
Apakah maksud taburan normal (normal distribution) dan mengapa
konsep ini penting? Penyelidikan sosial sains samada dalam bidang
pendidikan, kemasyarakatan atau psikologi melibatkan pengukuran
pemboleh ubah seperti IQ (intellectual quotion), berat badan, ketinggian,
skor persetujuan, pendapatan isi rumah dengan pengambilan sampel
sebelum dibuat inferensi atau generalisasi kepada populasi.
10
SPSS untuk penyelidik muda
Apakah yang dimaksudkan dengan taburan normal? Mengapa taburan
normal menjadi satu konsep yang sangat penting dalam statistik
inferensi?
Secara ‘lumrah’, kebanyakkan nilai pemboleh ubah dalam satu populasi
seperti IQ, ketinggian, berat badan akan tertabur secara ‘normal’.
Tertabur secara normal bermakna, terdapat peratusan kecil nilai ekstrem
yang terlalu rendah ataupun terlalu tinggi manakala sebahagian besar
nilai yang diukur akan berada di sekitar nilai min populasi. Maka, jika
diplotkan frekuensi taburan tersebut dibuat histogram (graf berbentuk
bar), atau poligon (graf berbentuk garisan) , maka anda akan
memperolehi bentuk normal seperti bentuk loceng yang simetri Rajah 1.3
berikut:
Rajah 1.3 Taburan normal
(sumber - http://mvpprograms.com)
Oleh itu, dari segi konsep, semua analisis statistik perlu mengambil
sampel secara rawak dengan nilai skor pemboleh ubah yang diukur
tertabur sekitar min sebagaimana nilai pemboleh ubah tersebut tertabur
secara normal disekitar min dalam populasi. Dengan ciri asas ini, barulah
boleh dibuat inferensi atau generalisasi kerana ciri sampel adalah
mewakili ciri populasi apabila kedua-duanya tertabur secara normal.
11
SPSS untuk penyelidik muda
Rajah 1.4 adalah contoh graf histogram yang menghampiri taburan
normal apabila dibandingkan dengan bentuk lengkung normal.
Rajah 1.4 Contoh graf taburan normal satu kajian
(dipetik dari http://www.bmj.com)
Katakan anda ingin memplot skor ketinggian semua pelajar IPTA di
Malaysia, dengan populasi seramai 50,000 orang maka skor tersebut
dijangka akan tertabur secara normal seperti graf pada Rajah 1.5 berikut
dengan min ketinggian pelajar IPTA katalah 1.0 m.
0.4m 1.0m 1.2m
Rajah 1.5 Min ketinggian pelajar IPTA
Graf pada Rajah 1.5 di atas menunjukkan satu taburan normal, iaitu graf
berbentuk loceng simetri, dengan 50% skor berada lebih rendah dari nilai
12
SPSS untuk penyelidik muda
min dan 50% skor lagi berada di atas nilai min. Ingat, simetri adalah ciri
utama sebuah graf taburan normal.
Graf tersebut juga menunjukkan skor min ketinggian siswazah seluruh
populasi adalah 1.0 m dengan skor ketinggian terendah 0.4 m dan
tertinggi 1.2 m. Jika anda mengambil secara rawak 500 sampel pelajar
IPTA seluruh negara (dari jumlah 50,000), maka skor sampel dijangka
juga tertabur menghampiri taburan normal ketinggian sebagai mana
dalam populasi pelajar.
Ambil pula contoh lain bagi graf taburan skor IQ seluruh pelajar IPTA di
Malaysia dengan purata skor IQ atau min = 100 dan sisihan piawai = 10.
Anda boleh melukis graf seperti Rajah 1.6 berikut dan bahagikan (dalam
peratus keluasan) kepada 6 bahagian, 3 masing-masing disebelah kiri
dan kanan min.
Rajah 1.6 Pembahagian pada graf normal
Perhatikan peratusan pembahagian berikut:
• 50 % skor berada antara 70 – 100 (sebelah kiri min)
• 50 % skor berada antara 100 – 130 (sebelah kanan min)
• 34 % skor berada antara 90 -100 dan 100 - 110
• (13.5 + 2.5) % berada antara skor 70 – 90 dan 110 - 130
13
SPSS untuk penyelidik muda
Oleh kerana bentuk graf normal ini boleh diaplikasi kepada pelbagai
pemboleh ubah selanjar (akan dibincangkan lebih lanjut dalam bab akan
datang) seperti skor pencapaian Sains, skor Matematik, skor IQ, skor
motivasi atau berat badan dalam populasi, maka semua skor sampel ini
boleh dipiawaikan dengan menukar skor tersebut kepada skor piawai,
dinamakan skor z dengan rumus berikut asalkan anda tahu min dan
sisihan piawai set data tersebut:
Z = Data individu – min
Sisihan piawai
Pengiraan bagi satu set data dengan min 100 dan
s.p 10:
• Skor 100, skor z = (100 -100) / 10 = 0
• Skor 110, skor z = (110 -100) / 10 = +1
• Skor 120, skor z = (120 -100) / 10 = +2
• Skor 110, skor z = (110 -100) / 10 = +1
• Skor 90, skor z = (90 -100) / 10 = -1
Anda akhirnya akan memperolehi graf taburan seperti Rajah 1.7 berikut
dengan skor individu ditukar kepada skor piawai iaitu skor z.
Rajah 1.7 Graf normal dengan skor z (skor piawai)
14
SPSS untuk penyelidik muda
Sebarang set skor, jika anda tahu min dan sisihan piawai, maka anda
boleh tukar dari graf normal data mentah (guna set data sedia ada)
kepada graf normal piawai dengan skor z.
Skor z dinamakan skor piawai kerana sebarang skor pemboleh ubah dari
sampel (juga disebut skor mentah) bagi sebarang populasi yang diketahui
min dan apabila ditukar kepada skor z, graf piawai akan diperolehi sama
seperti graf Rajah 1.7.
1.4 Statistik Parametrik dan Bukan Parametrik
1.4.1 Kenapa Dinamakan Statistik Parametrik ?
Parameter adalah pengukuran yang dapat menjelaskan ciri-ciri populasi.
Jika min skor IQ seluruh populasi pelajar sebuah Kolej X (N=2500) adalah
115, maka pengukuran ini dinamakan “mengukur parameter populasi
Kolej X”. Jadi parameter adalah kuantiti numerikal yang mencirikan
populasi. Kuantiti numerikal (parameter) tersebut adalah skor IQ.
Jika anda hanya mengambil sampel secara rawak (n=350) dari populasi
Kolej X, dan membuat pengiraan lalu memperolehi min bagi sampel
adalah 112, maka pengukuran ini dikatakan statistik. Jadi statistik adalah
satu kuantiti numerikal yang mencirikan sampel. Kuantiti numerikal
tersebut adalah adalah skor IQ. Dalam kata lain, statistik adalah proses
mengira skor min IQ sampel di Kolej X.
Jadi, istilah PARAMETER digunakan bagi proses menganalisis set data
POPULASI bagi menjelaskan ciri populasi tersebut, sedang proses yang
sama bagi set data SAMPEL dinamakan STATISTIK.
15
SPSS untuk penyelidik muda
Namun, terlalu sukar dan memakan masa dan belanja yang besar jika kita
ingin mengukur parameter kerana melibatkan bilangan individu yang
terlalu besar bagi kebanyakkan populasi. Oleh kerana pengukuran
parameter seperti min, sisihan piawai, varians sesuatu pemboleh ubah
(ketinggian atau berat badan) dalam POPULASI yang mempunyai
taburan NORMAL dinamakan PARAMETER, maka sebarang pengukuran
sampel (dari populasi yang sama) yang juga tertabur secara normal,
dinamakan statistik parametrik. Dalam kata lain, statistik (sampel) yang
menganggar nilai parameter (populasi) dinamakan statistik parametrik.
Jadi, statistik parametrik adalah statistik dari sampel yang boleh
diinferensikan kepada populasi kerana kedua-dua populasi dan sampel
mempunyai ciri yang sama iaitu tertabur secara normal. Oleh sebab
itulah, syarat utama yang perlu dipenuhi sebelum menjalankan analisis
statistik parametrik adalah memastikan data sampel tertabur secara
normal. Maka taburan normal juga dikenali sebagai taburan parametrik
apabila data selanjar (data sela) dipersembahkan dalam bentuk
histogram atau poligon simetri berbentuk loceng.
Taburan normal bagi sampel ini bukan sahaja boleh dilihat melalui lakaran
histogram, tetapi juga boleh dikira melalui ujian statistik seperti ujian
kenormalan Kromogorov-Smirnov (KS) dan ujian kenormalan Shapiro-
Wilk SW). Ujian SW sering digunakan untuk bilangan atau saiz sampel
yang lebih kecil (n < 100) walaupun tiada bilangan nilai saiz sampel yang
jelas yang dipersetujui oleh penyelidik.
Oleh kerana sampel mesti mempunyai set data yang tertabur secara
normal, maka perlu dibincangkan sedikit saiz sampel yang boleh
disandarkan untuk mendapat skor yang berkemungkinan tertabur secara
normal. Oleh itu, saiz sampel mendapat perhatian dalam statistik
16
SPSS untuk penyelidik muda
parameter supaya taburan data sampel tidak terlalu jauh berbeza dengan
taburan populasi yang normal.
Sebagai rumusan, statistik parametrik adalah analisis statistik yang
memerlukan set data tertabur sekurang-kurangnya menghampiri taburan
normal. Jika taburan set data didapati tidak normal hasil dari sampel tidak
rawak atau wujud skor ekstrem, maka set data sampel ini tidak dapat
menganggar parameter dalam populasi tersebut. Oleh itu, analisis
statistik bukan parametrik yang menjadi pasangan kepada statistik
parametrik lebih sesuai digunakan. Selain menguji kenormalan, pastikan
juga, skala yang digunakan pada pemboleh ubah untuk analisis statistik
parametrik mestilah berskala sela atau nisbah.
1.4.2 Apa Pula Statistik Bukan Parametrik ?
Jika sampel yang diperolehi tidak berciri normal sebagaimana populasi
atau data yang digunakan bukan pada skala nisbah atau sela maka
statistik bukan parametrik lebih sesuai digunakan. Statistik bukan
parametrik adalah bebas taburan normal dan menggunakan pangkatan
skor sebagai asas pengiraan, bukannya min dan varians yang sebenar
dari data pada skala sela atau nisbah. Ini bermakna, sebarang sampel
yang tidak tertabur secara normal atau skala pengukuran yang digunakan
adalah pada skala kategori seperti ordinal dan nominal, maka statistik
bukan parametrik lebih sesuai digunakan.
Kenapa perlu statistik bukan parametrik?
Andaikan terdapat data yang tidak tertabur secara normal, dengan skor
rendah menjadi majoriti dalam set skor tersebut seperti berikut:
17
SPSS untuk penyelidik muda
• Set data: 1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,16,18,20
• Min = 92 / 20 = 4.6
Nilai min 4.6 ini tidak menggambarkan dengan tepat min skor bagi set
skor tersebut yang majoriti individu kurang dari 4. Nilai min 4.6 terhasil
kerana adanya skor ekstrem yang tinggi 16, 18, 20. Jika anda
menggunakan min ini sebagai asas pengiraan dalam statistik parametrik,
anda mungkin mendapat kesimpulan yang salah atau tersasar.
Hal yang sama jika wujud data ekstrem seperti berikut:
• 1,1,1,1,1,2,2,2,2,3,3,3,4,4,4,4,5,5,5,100
• Min = 153 / 20 = 7.6
Min 7.6 juga tidak menggambarkan dengan tepat corak individu skor
dalam set data yang majoriti adalah skor 1- 5.
Set data yang ada nilai ekstrem dan tidak tertabur secara normal, lebih
sesuai diambil nilai median. Dalam kes di atas, median = 3, dan nilai 3 ini
lebih tepat mewakili set data tersebut berbanding nilai min = 7.6.
Dalam statistik bukan parametrik, skor disusun mengikut urutan. Skor
atau data yang paling rendah diberikan pangkatan 1, diikuti dengan
pangkatan 2 bagi skor yang lebih tinggi dan seterusnya. Jika terdapat dua
skor yang sama, maka jumlah pangkatan skor yang sama tersebut akan
dibahagi mengikut bilangan skor yang sama bagi mendapatkan
pangkatan yang sama bagi setiap skor. Begitulah seterusnya.
Perhatikan contoh enam set data berikut, A – F dengan jumlah skor (21)
dan min pangkatan (3.5) yang digunakan sebagai asas pengiraan dan
bukannya nilai jumlah skor (305) dan skor min (58.8) sebenar.
18
SPSS untuk penyelidik muda
Penentuan pangkatan bagi skor tidak tertabur secara normal boleh
diringkas seperti berikut:
• Skor A 45 (Pangkatan 1 - terendah) =1
• Skor B 55 (Pangkatan 5) = 4.5
• Skor C 55 (Pangkatan 4) = 4.5
• Skor D 52 (Pangkatan 3) =3
• Skor E 50 (Pangkatan 2) =2
• Skor F 100 (Pangkatan 6 - tertinggi) =6
✓ Jumlah skor = 357 Jumlah pangkatan = 21
✓ Min skor = 59.5 Min pangkatan = 3.5
Statistik bukan parametrik tidak mengambil kira bentuk taburan skor
asalkan skor tersebut boleh diatur mengikut pangkatan. Ini kerana statistik
bukan parametrik berdasarkan pangkatan (seperti menggunakan min
pangkatan 3.5) bukan nilai kuantiti skor min sebenar (59.5) kerana ada
skor yang ekstrem (dalam kes ini 100) untuk aplikasi analisis statistik.
Sampel yang kecil bilangannya selalu tidak menunjukkan taburan normal
maka statistik bukan parametrik sering digunakan bagi menggantikan
statistik parametrik.
Oleh kerana analisis data statistik bukan parametrik tidak menggunakan
nilai skor sebenar dan menggantikannya dengan skor pangkatan, maka
statistik bukan parametrik kurang “berkuasa”. Ujian statistik bukan
parametrik adalah seperti McNemar, Fisher Exact, Wilcoxon, Chi-kuasa
dua, Mann-Whitney, Cochran, Friedman dan Kruskal-Wallis yang juga
boleh diaplikasikan melalui perisian statistik SPSS. Walau
bagaimanapun, buku ini tidak akan membincangkan statistik bukan
parametrik.
19
SPSS untuk penyelidik muda
Sebagai kesimpulan, set data pada skala kategori (skala ordinal dan
nominal) tidak boleh membentuk graf normal, maka ujian bukan
parametrik sahaja yang sesuai
1.4.3 Penentuan Saiz Sampel
Mengikut Central Limit Theorem, saiz sampel bagi setiap kumpulan atau
kategori perlu mencapai sekurang-kurangnya bilangan n=30. Angka ini
selalunya dikaitkan dengan bilangan saiz sampel bagi satu-satu kategori
untuk dikaji, seperti saiz sampel dalam kumpulan eksperimen dan
kawalan dalam kajian eksperimen atau quasi eksperimen. Ini bermakna
jika n < 30, set data dalam satu-satu kumpulan dibimbangi tidak tertabur
secara normal.
Bagi memudahkan pemahaman, semakin kecil sampel, semakin sukar
untuk mendapat taburan normal maka dicadangkan bilangan 30 ini
sebagai saiz sampel sandaran. Namun, apapun bilangan sampel dalam
satu-satu kategori samada 20, 25, 30 mahupun 40, kesemuanya perlu
diuji dengan ujian kenormalan. Terdapat kes bilangan sampel 25 adalah
normal berbanding dengan bilangan sampel 35. Jadi, ujian kenormalan
mestilah dilakukan terlebih dahulu untuk memastikan saiz sampel
tersebut tertabur menghampiri ciri normal. Sampel untuk kajian berciri
eksperimen tidak boleh terlalu besar, sebab itu angka n=30 selalu menjadi
sandaran, supaya sampel anda tidak terlalu besar sehingga sukar dikawal
dari terdedah kepada pemboleh ubah luaran yang boleh mencemarkan
dapatan kajian.
Jika anda melakukan kajian tinjauan (survey) dengan mengedarkan kaji
selidik, anda tidak mengawal sampel anda, malah anda mungkin tidak
bersemuka dengan sampel anda. Dalam kajian tinjauan, anda boleh
20
SPSS untuk penyelidik muda
menggunakan jadual saiz sampel minima seperti jadual Krejcie dan
Morgan (1970) atau Cohen (1988).
Jadual Krejic dan Morgan (1970) menggunakan aras keyakinan dalam
pengiraan saiz sampel. Jika populasi anda N=30 maka anda memerlukan
n = 28. Jika populasi anda N = 500, maka sampel anda n = 217. Sila lihat
Lampiran 1 untuk jadual Krejcie dan Morgan.
Sementara itu, jadual Cohen (1988) berasaskan statistical power dan
effect size (ES) seperti dalam Lampiran 1 (muka surat 216). Katakan anda
membuat kajian eksperimen dengan tetapkan kesan saiz yang katakan
bernilai d = .7 berdasarkan kajian lepas, dengan “power” adalah 80%,
maka sampel anda adalah sebanyak 33 orang bagi setiap kumpulan. Ini
bermakna, kajian eksperimen memerlukan anda menganggar nilai ES
sebelum kajian bermula. Jika anda yakin dapat mengumpulkan lebih
ramai sampel, anggarkan sahaja ES yang lebih sederhana, katakan 0.6,
maka sampel anda bagi satu kumpulan adalah 45.
Anda juga boleh menggunakan perisian komputer percuma seperti
G*Power yang boleh dimuat turun secara percuma di
http://www.gpower.hhu.de/en.html. Ini adalah perisian yang juga
berasaskan statistical power dan ES. Tidak ramai yang kisah kewujudan
perisian percuma ini. G*Power sangat menarik kerana boleh menentikan
saiz sampel berasaskan jenis analisis statistik yang berbeza. Dengan
membuat anggaran statistical power 80% dan ES yang anda jangkakan
terlebih dahulu, anda akan mengetahui saiz sampel yang diperlukan
mengikut jenis analisis statistik.
Jadi, mana satu anda ingin gunakan? Jika anda tahu bilangan populasi,
anda boleh menggunakan jadual Krejcie dan Morgan (1970). Jika anda
boleh menganggar ES dari kajian lepas, gunakan sahaja jadual Cohen
21
SPSS untuk penyelidik muda
(1988) atau G*Power. Selalunya bilangan sampel yang diperolehi tidak
banyak berbeza, namun anda perlu dapatkan sampel yang melebihi
sampel minima yang dicadangkan oleh jadual-jadual tersebut bagi
memastikan anda tidak menghadapi masalah kelak.
Ada penyelidik yang berpendapat, tidak sesuai guna misalnya jadual
Krejcie dan Morgan (1970) kerana kononnya sudah lama. Ini bukan soal
lama atau baru sebab konsep statistik tidak tertakluk kepada lama atau
baru, asalkan konsep yang digunakan bersesuaian dengan keperluan.
Ketahuilah bahawa konsep analisis statisik jauh lebih lama, misalnya
ujian-t diperkenalkan oleh Gosset pada tahun 1908. Jadi, fahami ciri
kajian anda dan pilihlah mana-mana cara penentuan sampel yang sesuai,
bukan kerana lama atau barunya !
1.5 Memahami Pemboleh ubah
Anda telah menemui istilah parameter, statistik dan pemboleh ubah.
Terdapat istilah lain yang juga banyak digunakan seperti faktor. Berikut
adalah sedikit penjelasan perbezaan antara istilah-istilah tersebut.
Parameter juga banyak digunakan dalam kajian sains, yang tidak merujuk
kepada populasi secara lansung sepertimana yang difahami dalam
kajiaan sains sosial. Parameter dalam kajian sains boleh difahami
sebagai satu set faktor seperti tekanan dan suhu yang mewakili
perubahan satu sistem yang apabila diubah-ubah akan mempengaruhi
ciri sistem tersebut.
Contohnya sistem gas dalam pam basikal yang melibatkan dua faktor iaitu
isipadu gas dan tekanan gas. Bila Isipadu gas dikecilkan, maka tekanan
gas akan bertambah dan menolak gas ke dalam tiup basikal. Jadi
22
SPSS untuk penyelidik muda
parameter dalam kes ini adalah isipadu gas dan tekanan gas. Sistem ini
dianggap sebagai “populasi” kerana sistem tersebut menunjukkan sifat
yang standard dan konsisten (isipadu menurun, tekanan menaik) yang
boleh digunapakai dalam apa sahaja sistem lain. Dalam erti kata lain,
hubungan antara tekanan dan isipadu telah menjadi satu teori untuk
populasi kajian sains.
Secara umum sebarang faktor yang boleh berubah-ubah seperti suhu,
tekanan juga dinamakan pemboleh ubah. Dalam sosial sains, pemboleh
ubah pula merujuk kepada sebarang entiti yang mempunyai nilai yang
berubah-ubah dari satu individu ke individu lain seperti IQ, EQ atau
motivasi. Terdapat dua pemboleh ubah utama iaitu pemboleh ubah
bersandar dan pemboleh ubah tidak bersandar.
1.5.1 Pemboleh ubah Selanjar dan Diskrit
Pemboleh ubah selanjar (continuous variable) adalah pemboleh ubah
yang datanya berterusan dan boleh mempunyai sebarang nilai antara dua
jarak. Berat, masa, pH, skor Sejarah adalah contoh pemboleh ubah
selajar kerana anda boleh mendapatkan ukuran pada sebarang nilai
seperti:
• masa berlari 100 m = 12 minit 33 saat
• berat badan = 75.44 kg
• nilai pH air paip = 6.01
Pemboleh ubah diskrit (descrete variable) pula adalah pemboleh ubah
yang datanya mempunyai nilai tertentu berurutan tanpa boleh dibahagi
lagi antara keduanya. Bilangan anak, agama, bangsa adalah contoh
pemboleh ubah diskrit. Ini bermakna seseorang hanya mungkin
memberikan bilangan anaknya secara diskrit seperti 1,2,3 atau 4 dan
23
SPSS untuk penyelidik muda
seterusnya bukan nilai antara angka tersebut seperti 1.5 anak atau 3.3
anak.
1.5.2 Pemboleh ubah Bersandar dan Tidak Bersandar
Pemboleh ubah bersandar (independent variable) adalah pemboleh ubah
yang memberi kesan kepada perubahan pemboleh ubah bersandar
(dependent variable). Dalam penanaman pokok, baja dianggap sebagai
pemboleh ubah tidak bersandar (bebas dari perubahan) manakala
ketinggian pokok sebagai pemboleh ubah bersandar jika ketinggian
pokok didapati dipengaruhi oleh baja. Dalam erti kata lain, baja adalah
pemboleh ubah tidak bersandar kerana baja bebas dari perubahan tetapi
mempengaruhi ketinggian pokok sebagai pemboleh ubah bersandar.
Jika anda ingin membuat kajian bagi mengetahui kesan beberapa jenis
medium pengajaran seperti video dan animasi terhadap pencapaian
pelajar, anda sebenarnya membuat satu kajian eksperimen. Katakan
anda menggunakan video dan animasi bagi mengetahui kesannya
terhadap skor mata pelajaran Sains, maka teknik pengajaran dalam kajian
ini adalah pemboleh ubah tidak bersandar yang akan memberi kesan
kepada pemboleh ubah bersandar iaitu skor mata pelajaran Sains.
Pemboleh ubah tidak bersandar sering diringkaskan sebagai IV manakala
pemboleh ubah bersandar sebagai DV.
IV DV
Teknik pengajaran Skor Sains
(i. video ii. animasi)
24
SPSS untuk penyelidik muda
Dalam contoh di atas, hanya wujud hanya satu IV (teknik pengajaran) dan
satu DV (skor Sains) sahaja terlibat dalam dalam kajian ini. Walau
bagaimana pun, IV mempunyai dua kategori (atau tahap) iaitu video dan
animasi. Jadi jangan keliru antara pemboleh ubah dengan tahap dalam
pemboleh ubah tersebut.
Teknik pengajaran adalah pemboleh ubah tidak bersandar kerana
memberi kesan lansung kepada skor Sains sebagai pemboleh ubah
bersandar. Ini kerana, penyelidik memanipulasi teknik pengajaran dengan
mengadakan dua kategori (animasi dan video) bagi melihat kesan setiap
satunya pada pemboleh ubah bersandar iaitu skor Sains.
Dalam kes lain, jika anda mengukur berat badan dan ketinggian
sekumpulan pelajar sekolah rendah berumur dari 7 - 12 tahun, anda akan
dapati berat badan dan ketinggian pelajar meningkat dengan umur. Maka
berat badan dan ketinggian ada hubungan dengan peningkatan umur.
Ketinggian dan berat badan adalah pemboleh ubah yang boleh
meramalkan umur pelajar. Maka, berat badan dan ketinggian adalah
pemboleh ubah peramal (predictor) kerana kedua-dua pemboleh ubah ini
boleh digunakan bagi meramal umur pelajar antara 7 - 12 tahun.
Bagi kajian korelasi yang mengkaji hubungan antara pemboleh ubah
seperti jantina dan EQ (emotional quotion) atau antara skor IQ dengan
skor EQ, maka kedua-duanya tidak mempengaruhi antara satu sama lain
secara lansung. Jantina dalam kes ini tidak mempengaruhi skor IQ secara
lansung. Ini kerana, penyelidik tidak boleh memanipulasi jantina bagi
melihat kesannya pada skor EQ ! Jadi dalam kes ini, kita tidak boleh
pastikan mana satu pemboleh ubah bersandar dan pemboleh ubah tidak
bersandar. Apa yang dianalisis adalah hubungan antara dua pemboleh
ubah kajian sahaja. Jadi berhati-hati menggunakan perkataan pemboleh
25
SPSS untuk penyelidik muda
ubah bersandar dan pemboleh ubah tidak bersandar dalam kajian
korelasi.
Selain dari pemboleh ubah tidak bersandar dan pemboleh ubah
bersandar, terdapat beberapa pembahagian pemboleh ubah mengikut
jenis data yang diperolehi iaitu pemboleh ubah selanjar, diskret, numerikal
dan kategori seperti ringkasan dalam Jadual 1.2 berikut. Anda juga perlu
membiasakan diri dengan istilah-istilah ini kerana digunakan juga dalam
kajian. Perhatikan bahawa terdapat pembahagian yang bertindih seperti
berat badan dan bilangan kereta adalah pemboleh ubah selanjar dan juga
numerikal.
Jadual 1.2 Contoh pelbagai pemboleh ubah
Pemboleh ubah Contoh
Pemboleh ubah selanjar Berat badan : 45.6 kg, 63.0 kg, 93.3 kg
Masa: 3.2 minit, 300.3 saat, 5.2 hari
pemboleh ubah diskret Bilangan kereta: 1, 2, 3, 4…
Bilangan sekolah : 10, 110, 500
pemboleh ubah numerikal Berat badan: 45.6 kg, 63.0 kg, 93.3 kg
Bilangan kereta: 1, 2, 3, 4
pemboleh ubah kategori Bangsa: Melayu / India / Cina
Tahap akademik: SPM / Sijil / Diploma / Ijazah
1.5.3 Moderator dan Mediator
Terdapat dua lagi pemboleh ubah yang disebut sebagai pemboleh ubah
moderator dan mediator. Perhatikan Rajah 1.8 dan Rajah 1.9 berikut:
26
Mabuk SPSS untuk penyelidik muda
Kemalangan
Rajah 1.8 Mabuk menyebabkan kemalangan (Model 1)
Laju
Mabuk Kemalangan
Rajah 1.9 Laju sebagai mediator (Model 2)
Secara umum, pemboleh ubah moderator berupaya mengubah kekuatan
hubungan (menguatkan atau melemahkan) antara pemboleh ubah tidak
bersandar dengan pemboleh ubah bersandar malah boleh mengubah
arah hubungan tersebut.
Perhatikan Rajah 1.8. Mabuk sering dianggap punca utama kemalangan
(Model 1). Walau bagaimanapun mabuk mungkin juga menyebabkan
pemandu memandu laju (Model 2), dan kelajuan ini “menambahkan” lagi
kadar kemalangan. Impak mabuk terhadap kemalangan juga boleh
27
SPSS untuk penyelidik muda
berkurang jika pemandu yang mabuk lalu membawa kereta dengan
perlahan atau tidak dibenarkan membawa kereta lansung.
Jadi, laju adalah moderator yang meningkatkan lagi kadar kemalangan
(atau mengurangkannya) sementara mabuk adalah pemboleh ubah tidak
bersandar dan kemalangan adalah pemboleh ubah bersandar.
Membuang mediator tidak akan menghilangkan kesan antara kedua
pemboleh ubah, iaitu mabuk tetap akan menyebabkan kemalangan. Inilah
sebabnya moderator berasal dari perkataan moderate atau sederhana.
Contoh lain dapat difahami dari kekerapan menonton berita (DV) yang
dipengaruhi oleh umur (IV). Lazimnya mereka yang berumur lebih gemar
menonton berita. Walau bagaimanapun, jantina boleh menguatkan
hubungan ini. Lelaki yang berumur lebih kerap menonton berita
berbanding dengan perempuan berumur. Ini bermakna jantina adalah
pemboleh ubah ketiga (selain IV dan DV) yang menjadi moderator dan
berinteraksi dengan umur bagi menguatkan kekerapan menonton berita.
Selain pemboleh ubah moderator, anda juga perlu tahu pemboleh ubah
mediator. Pastikan anda tidak terkeliru kerana kedua-duanya mempunyai
ejaan yang hampir sama. Pemboleh ubah mediator menyatakan
bagaimana dan kenapa sesuatu kesan atau hubungan antara dua
pemboleh ubah boleh berlaku. Jika kesan mediator dibuang, maka tiada
lagi hubungan antara kedua-dua pemboleh ubah.
Sebagai contoh, anda mengkaji hubungan antara kekerapan membaca
novel Bahasa Inggeris (IV) dengan skor Bahasa Inggeris (DV), kerana
anda ingin mengetahui samada pelajar yang kerap membaca novel
Inggeris mendapat skor Bahasa Inggeris yang lebih baik. Namun anda
perlu tahu bahawa penguasaan bahasa Inggeris juga adalah pemboleh
28
SPSS untuk penyelidik muda
ubah yang menyebabkan pelajar itu kerap membaca novel Inggeris dan
akhirnya berlaku peningkatan skor bahasa Inggeris.
Oleh itu, "penguasaan Bahasa Inggeris" adalah mediator yang dapat
menjelaskan hubungan antara IV dan DV. Dengan membuang
penguasaan Bahasa Inggeris, hubungan antara IV dan DV telah tidak
bermakna. Maksudnya tidak guna mengukur hubungan antara IV dan DV
ini jika sampel kajian anda tidak menguasai Bahasa Inggeris, sebab
mereka tidak akan membaca novel Bahasa Inggeris ! Jadi penguasaan
dalam Bahasa Inggeris adalah mediator menjelaskan mengapa
hubungan IV dan DV ini berlaku. Mediator berasal dari perkataan mediate
yang membawa maksud “penengah” kepada IV dan DV. Jika “penengah”
ini dibuang, maka putuslah hubungan antara IV dan DV !
1.5.4 Pemboleh ubah Luaran
Pemboleh ubah luaran (extraneous variable) adalah pemboleh ubah tidak
bersandar yang boleh mempengaruhi pemboleh ubah bersandar yang
dikaji. Berbalik kepada contoh menuntun berita. Kekerapan menonton
berita (pemboleh ubah bersandar) dipengaruhi oleh umur (pemboleh
ubah tidak bersandar). Selain daripada itu, isu semasa (pemboleh ubah
luaran) yang berlaku juga mempengaruhi kekerapan menonton berita.
Oleh itu, isu semasa adalah pemboleh ubah luaran yang perlu dikawal.
Pemboleh ubah luaran ini tidak dikehendaki dalam kajian, kerana
mengganggu pemboleh ubah bersandar. Maksudnya, elakkan kajian
menonton berita ketika berlakunya isu hangat sehingga semua orang
yang kecil dan besar menonton berita, seperti peristiwa MH370. Ada
baiknya anda tangguhkan dulu sehingga tiada berita yang sensasi
29
SPSS untuk penyelidik muda
berlaku. Ada juga penyelidik menamakan pemboleh ubah ini sebagai
confounding variable.
1.6 Apa Itu Skala?
Sebagai pengenalan, katakan anda mengukur panjang dengan pembaris.
Katakan panjang buku statistik anda adalah 25.3 sm. Pembaris adalah
instrumen atau alat ukur, 25.3 adalah nilai diukur dalam unit sentimenter
(sm). Panjang 25.3 sm ini diukur pada skala sela (interval). Jika anda
mengira bilangan pelajar, seperti 200 orang, maka 200 adalah nilai yang
digunakan. Dalam kes ini, anda hanya membilang (counting) pada skala
nisbah (ratio).
Terdapat dua lagi skala iaitu nominal dan ordinal yang perlu difahami
sebelum anda melakukan analisis statistik kerana setiap skala
mempunyai analisis statistik tertentu yang boleh digunakan.
Setiap pemboleh ubah dalam kajian diukur bagi mendapatkan data dalam
skala tertentu. Jadi, dalam statistik, terdapat empat skala iaitu nominal,
sela, ordinal dan nisbah. Banyak buku meringkaskan empat skala ini
dengan akronim NOIR - nominal, ordinal, interval, ratio. NOIR ini boleh
diingati sebagai No Oil In River.
Dalam kehidupan seharian, kita akan mengukur apa yang disebut sebagai
pemboleh ubah, iaitu nilai yang berubah-ubah pada individu seperti berat
badan, kebolehan EQ, tahap akademik, bilangan pelajar dan bangsa.
Setiap satunya mempunyai cara pengukuran yang mungkin
menggunakan instrumen dan skala yang berbeza.
30
SPSS untuk penyelidik muda
• Berat badan pelajar diukur dengan penimbang dalam skala nisbah
seperti 52.1 kg
• Skor IQ pelajar diukur dengan ujian IQ dalam skala sela seperti skor
80 markah
• Tahap akademik diukur dengan soal selidik pada skala ordinal
seperti 1: Sijil 2: Diploma 3: Ijazah
• Agama diukur dengan skala nominal seperti 1: Islam 2: Buddha 3:
Hindu 4:Kristian
Skala sela dan nisbah melibatkan pengukuran secara lansung (samada
menggunakan instrumen atau membilang) terhadap sesuatu pemboleh
ubah yang menghasilkan data yang mempunyai sesuatu angka yang
bermakna. Skala sela dan nisbah menghasilkan data yang disebut data
numerikal. Skala ordinal dan nominal melibatkan pengukuran yang
menghasilkan sesuatu angka yang hanya mewakili sesuatu kategori
maka disebut sebagai data kategori. Jadual 1.3 berikut adalah contoh
pengukuran mengikut skala dengan penjelasan lanjut diberikan selepas
ini.
31
SPSS untuk penyelidik muda
Jadual 1.3 Contoh pengukuran ikut skala
Pemboleh ubah Contoh skor Skala
Masa 5.1 minit Nisbah numerikal
Status diri 1: Berkahwin Ordinal kategori
2: Bujang
3: Bercerai
Bilangan rumah 2 buah Nisbah numerikal
Jawatan 1: Pekerja am Nominal Kategori
2: Pegawai
3: Eksekutif
Jarak 20.4 km Sela numerikal
Persetujuan 1: Tidak Setuju Ordinal kategori
2: Neutral
3: Setuju
Skor Matematik 60 markah Sela numerikal
1.6.1 Skala Nominal
Anda boleh sahaja memikirkan perkataan “no-minal” sebagai “no-
meaning” kerana angka bagi skala ini hanyalah menggambarkan kategori
tetapi tidak membawa nilai atau merit maka angka pada skala ini tidak
memberi apa-apa makna.
Contohnya pemboleh ubah bangsa:
• 1: Melayu
• 2: Cina
Angka 1 bukan bermakna lebih kecil dari 2, sebaliknya hanya sebagai
perwakilan atau label membezakan kategori bangsa. Anda boleh
menukar angka 1 sebagai Cina dan 2 sebagai Melayu. Skala nominal
penting dalam mengumpul maklumat demografi sampel kajian. Skala ini
tiada nilai pemeringkatan kerana angka yang digunakan hanyalah label
atau wakil kepada kategori, dan angka-angka tersebut juga tiada jarak
32
SPSS untuk penyelidik muda
(sela) tertentu yang seragam. Oleh itu, analisis bagi data nominal
lazimnya dilakukan secara diskriptif seperti frekuensi atau peratusan.
Frekuensi ini kemudiannya boleh dianalisis dengan analisis bukan
parametrik seperti chi-kuasa dua.
Jika set dapatan bangsa dari skala “1: Melayu 2: Cina” adalah
1,1,1,1,1,1,1,2,2,2 bermakna bilangan Melayu adalah 7 (70%) dan Cina 3
(30%) yang dilaporkan dalam bentuk frekuensi atau peratusan. Adalah
tidak munasabah untuk mendapatkan min bagi data nominal sebab data
nominal adalah data kategori.
1.6.2 Skala Ordinal
Skala ordinal adalah skala yang menyusun kategori mengikut
pemeringkatan dari kecil kepada besar suatu nilai seperti
1: Tidak puas hati
2: Neutral
3: Sangat Puas Hati
Katakan dalam satu kajian tinjauan, 100 responden pekerja kilang telah
mengisi satu soal selidik tentang tahap kepuasan persekitaran tempat
kerja menggunakan skala ordinal:
1: Tidak Puas Hati
2: Neutral
3: Puas hati
Angka 1, 2 dan 3 mempunyai nilai atau merit, iaitu 1 menggambarkan nilai
paling kecil (Tidak Puas Hati) terhadap persekitaran tempat kerja
manakala angka 3 menggambarkan nilai paling tinggi (Puas Hati) dari
33
SPSS untuk penyelidik muda
segi kepuasan. Dapatan kajian boleh dilaporkan secara diskriptif seperti
“majoriti pekerja iaitu 80% (80 responden menjawab 1) tidak berpuas hati
dengan persekitaran kerja berbanding 15% (15 responden menjawab 2)
pekerja tidak ada masalah terhadap persekitaran kerja (Neutral).
Terdapat hanya sebilangan kecil responden iaitu 5% (5 responden
menjawab 3) berpuas hati dengan persekitaran tempat kerja”
Walau bagaimanapun, jarak antara angka 1-2 dan 2-3 yang mewakili
sesuatu tahap tidak mempunyai sela atau jarak yang sama. Jadi
perbezaan tahap 1 (Tidak Puas Hati) dengan tahap 2 (Neutral) tidak
mempunyai satu jarak yang sama, sebab itu angka tersebut tidak boleh
dinisbahkan.
1.6.3 Skala Sela (Interval)
Sela (interval) bermakna “suatu jarak tertentu yang seragam” dari titik A
ke titik B dan dari titik B ke C dan seterusnya. Jika ada 4 titik, iaitu A, B,
C, D maka setiap jarak antara A ke B ke C ke D adalah sama, seperti
jarak setiap sentimeter dalam pada sebuah pembaris.
Apabila anda menjalankan ujian matematik kepada 20 pelajar dengan
skor antara 0 hingga 100, maka jarak sela antara 10 – 20 markah, atau
40 – 50 markah ataupun 45 - 55 adalah dalam sela 10 markah. Sela
menjadikan setiap markah mempunyai makna. Pelajar yang mempunyai
markah yang lebih tinggi dikatakan mempunyai lebih penguasaan dalam
kandungan yang diuji berbanding dengan pelajar yang mendapat skor
yang lebih rendah.
34
SPSS untuk penyelidik muda
Berikut adalah contoh skor matematik yang diperolehi oleh 3 pelajar:
• Ali = 40 markah
• Baha = 50 markah
• Charles = 80 markah
• Dan = 0 markah
Oleh kerana skor mempunyai sela yang sama (0,1,2,3….100), maka
boleh disimpulkan bahawa Charles mendapat markah tertinggi, diikuti
dengan Baha, manakala Ali mendapat markah terendah. Charles
memperolehi 30 markah lebih tinggi dari Baha dan 40 markah lebih tinggi
dari Ali. Markah Charles dua kali lebih banyak dari markah Ali, tetapi ini
tidak bermakna Charles dua kali lebih pandai dari Ali. Dan pula mendapat
0 markah kerana tidak hadir. Nilai 0 ini bukan mutlak yang membawa
maksud Dan tidak tahu apa-apa lansung tentang ujian matematik
tersebut, tetapi dia mendapat 0 kerana tidak hadir.
Oleh itu skala sela ini bermula dari 0, tetapi ini bukanlah kosong mutlak
(absolute zero) atau kosong yang membawa maksud “tiada apa-apa”
secara mutlak. Jika ada pelajar walaupun hadir dan menjawab soalan
ujian tetapi masih mendapat skor 0 kerana salah konsep dalam
memberikan jawapan, skor 0 ini bukan membawa maksud kosong mutlak
iaitu pelajar tersebut lansung tiada apa-apa pengetahuan tentang soalan
yang ditanya. Sama halnya dengan suhu. Jika suhu 0o C, tidak bermakna
tiada suhu ketika itu.
1.6.4 Skala Nisbah (Ratio)
Skala nisbah mempunyai nilai kosong sebenar bagi membolehkan angka
dinisbahkan. Jika Zahin mempunyai berat badan 80 kg sedang adiknya
35
SPSS untuk penyelidik muda
Zulqarnine hanya 40 kg, maka boleh dinisbahkan berat keduanya 80:40
atau 80/40 untuk dibuat kesimpulan bukan sahaja berat Zahin 40 kg
melebihi berat Zulqarnine, juga Zahin dua kali lebih berat dari berat
Zulqarnine.
Dalam satu acara mengukur ketinggian tiga pemain pasukan sepak
takraw sekolah anda, data berikut diperoleh:
• Ali 1.1 m
• Dollah 1.0 m
• Ramesh 0 m
Ramesh mendapat 0 m bukan kerana dia tiada ketinggian lansung tetapi
sebaliknya dia tidak hadir semasa sesi pengukuran. Sifar disini bermakna
sifar mutlak yang membawa maksud “tiada nilai pengukuran” lansung
(bezakan dengan sifar pada skor matematik yang tidak membawa
maksud tiada lansung pengetahuan matematik).
Kedua-dua skala nisbah dan sela adalah skala numerikal maka analisis
data dilaksanakan bagi keduanya adalah sama. Perisian SPSS
menganggap data dengan skala nisbah dan sela adalah sama. Anda
boleh menggunakan kedua-dua statistik diskriptif dan inferensi tanpa
masalah dengan skala sela dan nisbah. Rajah 1.10 adalah pembahagian
mudah skala pengukuran.
36
SPSS untuk penyelidik muda
Pengukuran
Numerikal Kategorikal
Nisbah Sela Nominal Ordinal
Rajah 1.10 Pembahagian skala
37
SPSS untuk penyelidik muda
BAB 2
APLIKASI SPSS
DALAM KAJIAN
38
SPSS untuk penyelidik muda
2.1 Aplikasi Praktis SPSS
Sebelum anda menerokai aplikasi perisian SPSS, berikut adalah situasi
kajian yang digunakan dalam buku ini. Kajian ini dijalankan bagi
mengetahui beberapa isu dalam kalangan pelajar lelaki dan perempuan
di kolej komuniti di Malaysia. Isu ini “bukan isu sebenar” sekadar
memudahkan anda memahami analisis data dengan SPSS.
2.1.1 Isu dan Objektif
Katakan seorang penyelidik ingin mengetahui empat isu dalam kalangan
pelajar lelaki dan perempuan di kolej komuniti yang juga menjadi objektif
umum kajian ini iaitu mengkaji:
a. pemilikan akuan Twitter antara lelaki dan perempuan
b. tahap motivasi dan self-esteem pelajar kolej komuniti
c. kesan pemahaman pelajar kolej komuniti terhadap Sains apabila
diberikan tiga kaedah pengajaran yang berbeza iaitu Model, Animasi
dan Teks.
d. faktor pembelian telefon bimbit dalam kalangan pelajar kolej komuniti
Oleh itu, satu kajian yang mengabungkan kajian eksperimen dan tinjauan
dilakukan bagi mengetahui empat isu di atas. Kajian ini sengaja dijalankan
bertujuan memperkenalkan asas-asas analisis diskriptif dan inferensi.
Satu set data “dummy” telah disediakan bagi memudahkan anda
menjalankan sendiri analisis statistik. Data ini juga boleh dimuat turun di
www.drotspss.blogspot.com dan sila klik “SPSS UNTUK PENYELIDIK
MUDA” yang terletak di bawah banner blog tersbut bagi muat turun data.
39
SPSS untuk penyelidik muda
2.1.2 Soalan Kajian (SK)
Soalan kajian (SK) adalah pernyataan khusus dalam bentuk soalan
sebagai panduan kepada penyelidik sendiri untuk mencari jawapannya.
Soalan kajian mesti mengandungi pemboleh-pemboleh ubah yang terlibat
dalam kajian contohnya:
• Apakah kekuatan hubungan antara jumlah masa persediaan belajar
dengan skor pencapaian dalam matematik di sekolah ?
• Apakah terdapat perbezaan yang signifikan antara min skor IQ pelajar
aliran teknikal berbanding dengan min skor IQ pelajar aliran Sains ?
Dalam kedua-dua soalan kajian di atas, pemboleh ubah yang terlibat
dinyatakan dengan jelas. Soalan kajian ini juga memberi panduan kepada
penyelidik untuk menentukan jenis data yang perlu dikumpulkan serta
jenis analisis statistik yang bersesuaian.
Bagi SK pertama, pemboleh ubah yang terlibat adalah “jumlah masa
persediaan belajar” dan “skor pencapaian matematik”. Oleh itu, penyelidik
perlu mengumpulkan data jumlah masa persediaan setiap responden
bersekali dengan skor pencapaian matematik mereka. Analisis yang
diperlukan adalah analisis korelasi Pearson yang mengukur kekuatan
antara kedua-dua pemboleh ubah tersebut.
Bagi SK kedua, pemboleh ubah yang terlibat adalah “skor IQ” pelajar
aliran teknikal dan “skor IQ” pelajar aliran Sains. Oleh itu, penyelidik perlu
mengumpulkan data skor IQ kedua-dua kumpulan pelajar bagi
mendapatkan min skor tersebut. Analisis yang diperlukan adalah ujian-t
sampel tidak bersandar yang mengukur perbezaan min skor kedua-dua
kumpulan yang dibandingkan.
40
SPSS untuk penyelidik muda
Daripada objektif umum kajian, sebanyak 15 soalan kajian (SK) telah
dibina seperti berikut:
SK1
Apakah peratus faktor persetujuan paling tinggi bagi pembelian telefon
bimbit kerana harga?
SK2
Apakah faktor persetujuan paling dominan bagi pembelian telefon bimbit
dalam kalangan pelajar kolej komuniti?
SK3
Adakah terdapat perbezaan dari segi jumlah pemilikan akuan twitter
antara pelajar lelaki dan perempuan?
SK 4
Adakah terdapat hubungan antara skor motivasi dengan skor Sains dalam
kalangan pelajar kolej komuniti?
SK 5
Adakah masih terdapat hubungan antara skor motivasi dengan skor Sains
jika skor self-esteem pelajar tersebut dikawal?
SK 6
Adakah terdapat hubungan yang signifikan antara persetujuan pembelian
telefon kerana faktor harga dan spesifikasi?
41
SPSS untuk penyelidik muda
SK 7
Adakah terdapat pengaruh skor ujian pasca dan skor motivasi sebagai
faktor peramal terhadap skor pengekalan ?
SK 8
Adakah terdapat perbezaan skor self-esteem antara ketiga-tiga kumpulan
pelajar yang diajar dengan kaedah pengajaran berbeza?
SK 9
Adakah terdapat perbezaan skor Sains antara jantina dalam kumpulan
umur yang berbeza ?
Adakah terdapat kesan interaksi antara jantina dengan kumpulan umur
tersebut?
SK 10
Adakah terdapat perbezaan skor ujian pra, ujian pasca dan ujian
pengekalan bagi kumpulan yang mengikuti pengajaran kaedah
menggunakan Model?
SK 11
Adakah terdapat perbezaan skor ujian pasca bagi kumpulan yang
mengikuti tiga kaedah pengajaran berbeza?
42
SPSS untuk penyelidik muda
SK 12
Adakah terdapat perbezaan skor min ujian pasca dan skor min ujian
pengekalan disebabkan oleh jantina ?
SK 13
Adakah terdapat perbezaan antara persetujuan pembelian telefon bimbit
kerana faktor harga antara lelaki dan perempuan?
SK14
Adakah terdapat perbezaan yang signifikan antara skor ujian pra dan
ujian pasca dalam kalangan pelajar lelaki?
2.1.3 Reka bentuk dan Populasi
Soalan kajian 1 – 14 di atas boleh dijawab melalui kajian eksperimen dan
tinjauan. Kajian eksperimen melibatkan kajian kesan aplikasi tiga
pendekatan berbeza dalam pengajaran mata pelajaran Sains iaitu
pengajaran menggunakan MODEL, ANIMASI dan BUKU TEKS di
peringkat kolej komuniti.
Sebanyak 94 subjek telah dipilih secara rawak mudah dari 91 kolej
komuniti diikuti dengan pemilihan secara rawak tugasan (random
assignment) bagi membentuk tiga kumpulan berbeza tetapi setara yang
diajar mata pelajaran Sains seperti Rajah 2.1
43