The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Bab 1 STATCAL ................................................................................................................................ [1]
1.1Sekilas STATCAL ......................................................................................................................... [1]
1.2 Beberapa Program Aplikasi Statistika Commercial dan Gratis ............................................. [6]

Bab 2 MENGINPUT DATA DI STATCAL ................................................................................... [10]
2.1 Persiapan Data............................................................................................................................ [10]
2.2 Menginput Data Kategori di STATCAL .................................................................................. [11]
2.3 Menginput Data Numerik di STATCAL ................................................................................. [14]
2.4 Data Kosong (Not Available / NA) ........................................................................................... [16]

Bab 3 DESKRIPTIF......................................................................................................................... [19]
3.1 Distribusi Frekuensi Univariat ................................................................................................. [19]
3.2 Distribusi Frekuensi Bivariat .................................................................................................... [21]
3.3 Berbagai Ukuran Deskriptif (Rata-Rata, Standar Deviasi, dan Sebagainya) ..................... [24]

Bab 4 UJI ASUMSI NORMALITAS POPULASI ........................................................................ [29]

Bab 5 UJI ASUMSI KESAMAAN VARIANS POPULASI ......................................................... [33]

Bab 6 UJI BEDA DUA SAMPEL BERPASANGAN .................................................................... [38]
6.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan ...................................................................... [38]
6.2 Beberapa Kutipan Isi Buku Mengenai Uji Beda 2 Sampel Berpasangan (Uji t 2
Sampel Berpasangan dan Uji Wilcoxon) ....................................................................................... [41]
6.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon ...................................................................... [42]
6.4 Contoh Kasus (Penyelesaian dengan SPSS) ............................................................................ [42]
6.5 Contoh Kasus (Penyelesaian dengan STATCAL) .................................................................. [50]
6.6 Contoh Kasus (Penyelesaian dengan Minitab) ....................................................................... [55]

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by luthfi.jariyah2022, 2023-08-12 22:55:01

PEDOMAN DASAR MENGOLAH DATA DENGAN PROGRAM APLIKASI STATISTIKA STATCAL (Disertai Perbandingan Hasil dengan SPSS & Minitab)

Bab 1 STATCAL ................................................................................................................................ [1]
1.1Sekilas STATCAL ......................................................................................................................... [1]
1.2 Beberapa Program Aplikasi Statistika Commercial dan Gratis ............................................. [6]

Bab 2 MENGINPUT DATA DI STATCAL ................................................................................... [10]
2.1 Persiapan Data............................................................................................................................ [10]
2.2 Menginput Data Kategori di STATCAL .................................................................................. [11]
2.3 Menginput Data Numerik di STATCAL ................................................................................. [14]
2.4 Data Kosong (Not Available / NA) ........................................................................................... [16]

Bab 3 DESKRIPTIF......................................................................................................................... [19]
3.1 Distribusi Frekuensi Univariat ................................................................................................. [19]
3.2 Distribusi Frekuensi Bivariat .................................................................................................... [21]
3.3 Berbagai Ukuran Deskriptif (Rata-Rata, Standar Deviasi, dan Sebagainya) ..................... [24]

Bab 4 UJI ASUMSI NORMALITAS POPULASI ........................................................................ [29]

Bab 5 UJI ASUMSI KESAMAAN VARIANS POPULASI ......................................................... [33]

Bab 6 UJI BEDA DUA SAMPEL BERPASANGAN .................................................................... [38]
6.1 Contoh Kasus Uji Beda 2 Sampel Berpasangan ...................................................................... [38]
6.2 Beberapa Kutipan Isi Buku Mengenai Uji Beda 2 Sampel Berpasangan (Uji t 2
Sampel Berpasangan dan Uji Wilcoxon) ....................................................................................... [41]
6.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon ...................................................................... [42]
6.4 Contoh Kasus (Penyelesaian dengan SPSS) ............................................................................ [42]
6.5 Contoh Kasus (Penyelesaian dengan STATCAL) .................................................................. [50]
6.6 Contoh Kasus (Penyelesaian dengan Minitab) ....................................................................... [55]

Keywords: statistika,pengelolaan data

42 Andy Field (2009:558) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd Edition” menyatakan sebagai berikut. “The Wilcoxon signed-rank test compares two conditions when the same participants take part in each condition and the resulting data violate an assumption of the dependent t-test.” 6.3 Uji t 2 Sampel Berpasangan dan Uji Wilcoxon Berdasarkan uraian pada Bagian 6.2, maka dapat ditarik informasi sebagai berikut. Uji t 2 sampel berpasangan (paired-samples t test / dependent t-test) dan uji Wilcoxon digunakan untuk menguji apakah terdapat perbedaan yang signifikan (secara statistika) berdasarkan 2 sampel berpasangan. Asumsi normalitas dikenakan pada uji t 2 sampel berpasangan, yakni populasi dari data selisih pasangan pengamatan diasumsikan berdistribusi normal (Andy Field, 2009:326). Pada penggunaan uji t 2 sampel berpasangan, asumsi normalitas dapat diabaikan, apabila jumlah sampel cukup besar (Andy Field, 2009:329). Hal ini karena berdasarkan sifat teorema limit sentral (central limit theorem), ketika jumlah sampel besar (N > 30), maka distribusi sampling dari statistik t akan mendekati normal (Murray R. Spiegel dan Larry J. Stephens, 2008:275-276). Jumlah sampel dipandang cukup besar apabila > 30 (Murray R. Spiegel dan Larry J. Stephens, 2008:275-276). Pada penggunaan uji t 2 sampel berpasangan, apabila jumlah sampel < 30 dan asumsi normalitas tidak dipenuhi, uji Wilcoxon dapat digunakan sebagai pendekatan nonparametrik (Andy Field, 2009:558). 6.4 Contoh Kasus (Penyelesaian dengan SPSS) Input data Tabel 6.1 dalam SPSS seperti pada Gambar 6.1. Pertama akan dilakukan uji asumsi normalitas untuk data selisih antara berat badan sebelum dan berat badan sesudah. Maka


43 terlebih dahulu akan dihitung data selisih antara berat badan sebelum dan berat badan sesudah. Pilih Transform => Compute Variable (Gambar 6.3). Gambar 6.3 Perhatikan Gambar 6.4 (kotak Compute Variable). Pada kotak Target Variable, isi dengan selisih. Pada kotak Numeric Expression, data berat badan sebelum dikurang dengan data berat badan sesudah. Kemudian pilih OK. Gambar 6.4 Data selisih dapat dilihat pada Gambar 6.5.


44 Gambar 6.5 Data selisih pada Gambar 6.5, selanjutnya akan diuji asumsi normalitasnya. Perhatikan Gambar 6.6. Pilih Analyze => Nonparametric Tests => 1-Sample K-S. Gambar 6.6 Perhatikan Gambar 6.7 (kotak One-Sample Kolmogorov-Smirnov Test). Pindahkan variabel selisih ke kotak sebelah kanan Test Variable List. Pada Test Distribution, pilih Normal. Kemudian pilih OK.


45 Gambar 6.7 Tabel 6.3 disajikan hasil uji asumsi normalitas dengan uji Kolmogorov-Smirnov untuk data selisih. Diketahui nilai probabilitas / p-value / Asymp. Sig. (2-tailed) adalah 0,787 > tingkat signifikansi 0,05, maka asumsi normalitas untuk data selisih dipenuhi. Tabel 6.3 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov untuk Data Selisih One-Sample Kolmogorov-Smirnov Test selisih N 6 Normal Parametersa,,b Mean 2.1667 Std. Deviation 1.60208 Most Extreme Differences Absolute .267 Positive .267 Negative -.233 Kolmogorov-Smirnov Z .653 Asymp. Sig. (2-tailed) .787 a. Test distribution is Normal. b. Calculated from data. Diketahui jumlah sampel < 30 dan asumsi normalitas untuk data selisih dipenuhi, maka akan digunakan uji t 2 sampel berpasangan untuk menguji apakah terdapat perbedaan berat badan yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Perhatikan Gambar 6.8. Pilih Analyze => Compare Means => Paired-Samples T Test.


46 Gambar 6.8 Perhatikan Gambar 6.9 (kotak Paired-Samples T Test). Pindahkan variabel berat badan sebelum ke kotak Variable1 dan pindahkan variabel berat badan sesudah ke kotak Variable2. Kemudian pilih OK. Gambar 6.9 Tabel 6.4 disajikan nilai rata-rata dan standar deviasi untuk masing-masing variabel. Diketahui rata-rata berat badan sebelum mengkonsumsi obat diet ABCD adalah 81,1667, dengan standar deviasi 3,60093. Sementara rata-rata berat badan sesudah mengkonsumsi obat diet ABCD selama 1 bulan adalah 79, dengan standar deviasi 4. Tabel 6.4 Statistik Deskriptif Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 Berat_Badan_Sebelum 81.1667 6 3.60093 1.47007 Berat_Badan_Sesudah 79.0000 6 4.00000 1.63299


47 Secara rata-rata, terjadi penurunan berat badan setelah mengkonsumsi obat diet ABCD selama 1 bulan. Dengan kata lain, terdapat perbedaan rata-rata berat badan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Apakah perbedaan rata-rata tersebut signifikan secara statistika? Untuk menjawab pertanyaan ini, maka perhatikan hasil dari uji t 2 sampel berpasangan pada Tabel 6.5. Tabel 6.5 Uji t 2 Sampel Berpasangan Paired Samples Test Paired Differences t df Sig. (2- Mean tailed) Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper Pair 1 Berat_Badan_Sebelum - Berat_Badan_Sesudah 2.16667 1.60208 .65405 .48538 3.84795 3.313 5 .021 Berdasarkan hasil dari uji t 2 sampel berpasangan pada Tabel 6.5, diperoleh hasil sebagai berikut. Nilai statistik t (t hitung) adalah 3,313. Nilai derajat bebas (df / degree of freedom) adalah 5. Nilai kritis t (t tabel) dengan derajat bebas 5 dan tingkat signifikansi 5% adalah 2,57 (Gambar 6.10). Gambar 6.10 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel


48 1 1 = −2,57 = +2,57 Gambar 6.11 Daerah Keputusan berdasarkan Uji t Diketahui nilai statistik t adalah 3,313, berada pada daerah 1, yakni daerah penolakan 0 dan penerimaan 1, maka terdapat perbedaan berat badan yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas / p-value / Sig. (2-tailed) adalah 0,021 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Wilcoxon dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan digunakan uji Wilcoxon untuk menguji apakah terdapat perbedaan berat badan yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Perhatikan Gambar 6.12. Pilih Analyze => Nonparametric Tests => 2 Related Samples. 0


49 Gambar 6.12 Perhatikan Gambar 6.13 (kotak Two-Related-Samples Tests). Pindahkan variabel berat badan sebelum ke kotak Variable1 dan pindahkan variabel berat badan sesudah ke kotak Variable2. Pada Test Type pilih Wilcoxon. Kemudian pilih OK. Gambar 6.13 Hasil dari uji Wilcoxon diperlihatkan pada Tabel 6.6.


50 Tabel 6.6 Hasil Uji Wilcoxon Test Statisticsb Berat_Badan_Se sudah - Berat_Badan_Se belum Z -2.226a Asymp. Sig. (2-tailed) .026 a. Based on positive ranks. b. Wilcoxon Signed Ranks Test Berdasarkan hasil uji Wilcoxon pada Tabel 6.6, diketahui nilai probabilitas / p-value / Asymp. Sig. (2-tailed) adalah 0,026 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. 6.5 Contoh Kasus (Penyelesaian dengan STATCAL) Input data Tabel 6.1 dalam STATCAL seperti pada Gambar 6.14. Gambar 6.14 Input Data Numerik dalam STATCAL Perhatikan Gambar 6.15. Pilih Statistics => Test of Two Populations.


51 Gambar 6.15 Perhatikan Gambar 6.16. Pilih T-Test (Paired Populations). Pada kotak Choose Numeric Variable (Single Choice) bagian atas, pindahkan variabel Berat Sebelum ke kotak sebelah kanan. Pada kotak Choose Numeric Variable (Single Choice) bagian bawah, pindahkan variabel Berat Sesudah ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result. Gambar 6.16 Gambar 6.17 merupakan hasil STATCAL untuk uji asumsi normalitas dengan uji Kolmogorov-Smirnov berdasarkan data selisih. Diketahui nilai probabilitas / P-Value of KS adalah 0,7867 > tingkat signifikansi 0,05, maka asumsi normalitas untuk data selisih dipenuhi.


52 Gambar 6.17 Hasil Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov untuk Data Selisih Diketahui jumlah sampel < 30 dan asumsi normalitas untuk data selisih dipenuhi, maka akan digunakan uji t 2 sampel berpasangan untuk menguji apakah terdapat perbedaan berat badan yang signifikan (secara statistika / berdasarkan pengujian statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Gambar 6.18 disajikan hasil uji t 2 sampel berpasangan dengan STATCAL. Gambar 6.18 Hasil Uji t 2 Sampel Berpasangan Berdasarkan hasil uji t 2 sampel berpasangan pada Gambar 6.18, diperoleh hasil sebagai berikut. Nilai statistik t (t hitung / t statistic) adalah 3,3127. Nilai derajat bebas (degree of freedom) adalah 5. Nilai kritis t (t tabel) / t Critical Value (5%) dengan derajat bebas 5 dan tingkat signifikansi 5% adalah 2,5706.


53 1 1 = −2,5706 = +2,5706 Gambar 6.19 Daerah Keputusan berdasarkan Uji t Diketahui nilai statistik t adalah 3,3127, berada pada daerah 1, yakni daerah penolakan 0 dan penerimaan 1, maka terdapat perbedaan berat badan yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas / P-Value adalah 0,0212 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Wilcoxon dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan digunakan uji Wilcoxon untuk menguji apakah terdapat perbedaan berat badan yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan. Perhatikan Gambar 6.20. 0


54 Gambar 6.20 Pada kotak Choose Numeric Variable (Single Choice) bagian atas, pindahkan variabel Berat Sebelum ke kotak sebelah kanan. Pada kotak Choose Numeric Variable (Single Choice) bagian bawah, pindahkan variabel Berat Sesudah ke kotak sebelah kanan. Hasilnya dapat dilihat pada bagian Result. Perhatikan hasil uji Wilcoxon pada Gambar 6.21. Gambar 6.21 Berdasarkan hasil uji Wilcoxon pada Gambar 6.21, diketahui nilai probabilitas / p-value adalah 0,026 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.


55 6.6 Contoh Kasus (Penyelesaian dengan Minitab) Input data Tabel 6.1 dalam Minitab seperti pada Gambar 6.22. Gambar 6.22 Input Data dalam Minitab Perhatikan Gambar 6.23. Pilih Stat => Basic Statistics => Paired t, sehingga muncul kotak Paired t (Test and Confidence Interval) (Gambar 6.24). Gambar 6.23 Gambar 6.24


56 Pada Gambar 6.24, pada kotak First sample, isi dengan variabel Sebelum, sementara pada kotak Second sample, isi dengan variabel Sesudah. Kemudian pilih OK. Gambar 6.25 disajikan hasil uji t 2 sampel berpasangan. Gambar 6.25 Hasil Uji t 2 Sampel Berpasangan Berdasarkan hasil uji t 2 sampel berpasangan pada Gambar 6.25, diperoleh hasil sebagai berikut. Diketahui nilai statistik t / T-Value adalah 3,31, berada pada daerah 1, yakni daerah penolakan 0 dan penerimaan 1, maka terdapat perbedaan berat badan yang signifikan (secara statistika), sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan (lihat Gambar 5.6). Cara lain dalam pengambilan keputusan terhadap hipotesis, diketahui nilai probabilitas / P-Value adalah 0,021 < tingkat signifikansi 0,05, maka terdapat perbedaan berat badan yang signifikan, sebelum dan sesudah mengkonsumsi obat diet ABCD selama 1 bulan.


57 BAB 7 UJI BEDA DUA SAMPEL INDEPENDEN 7.1 Contoh Kasus Uji Beda 2 Sampel Independen Misalkan diberikan data tinggi badan dari 7 responden laki-laki dan 5 responden perempuan (Tabel 7.1). Tabel 7.1 Data Tinggi Badan Nama Jenis Kelamin Tinggi Rata-Rata Ugi 1 175.43 176.58 Egi 1 178.54 Andi 1 169.85 Budi 1 179.65 Doni 1 176.54 Roy 1 178.43 Roki 1 177.65 Intan 2 170.31 168.67 Rini 2 171.31 Suci 2 167.31 Sari 2 169.32 Riri 2 165.12 Berdasarkan data Pada Tabel 7.1: Terdapat 2 variabel, yakni jenis kelamin dan tinggi. Terdapat 2 sampel independen, yakni sampel tinggi badan untuk laki-laki dan sampel tinggi badan untuk perempuan. Variabel jenis kelamin merupakan variabel kategori, sementara variabel tinggi merupakan variabel numerik atau rasio. Untuk variabel jenis kelamin, misalkan angka 1 menyatakan laki-laki, sementara angka 2 menyatakan perempuan.


58 Secara rata-rata, tinggi laki-laki lebih tinggi (176,58) dibandingkan tinggi perempuan (168,67). Uji t independen (independent t test) atau uji Mann-Whitney dapat digunakan untuk menguji hipotesis apakah terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. Data pada Tabel 7.1 jika diinput dalam SPSS seperti pada Gambar 7.1. Gambar 7.1 Data Tabel 7.1 Diinput dalam SPSS Misalkan diberikan data hasil produksi jagung antara bibit jenis A dan bibit jenis B (Tabel 7.2). Tabel 7.2 Data Hasil Produksi Jagung Jenis Bibit Sampel (Bibit Jagung) Jenis Bibit Hasil (Dalam Kg) Rata-Rata Jenis A Bibit Jagung Ke-1 (Jenis A) 1 21.23 21.11 Bibit Jagung Ke-2 (Jenis A) 1 20.23 Bibit Jagung Ke-3 (Jenis A) 1 20.12 Bibit Jagung Ke-4 (Jenis A) 1 21.25 Bibit Jagung Ke-5 (Jenis A) 1 22.31 Bibit Jagung Ke-6 (Jenis A) 1 20.21 Bibit Jagung Ke-7 (Jenis A) 1 22.42 Jenis B Bibit Jagung Ke-1 (Jenis B) 2 16.31 18.34 Bibit Jagung Ke-2 (Jenis B) 2 19.34


59 Bibit Jagung Ke-3 (Jenis B) 2 20.21 Bibit Jagung Ke-4 (Jenis B) 2 16.23 Bibit Jagung Ke-5 (Jenis B) 2 20.23 Bibit Jagung Ke-6 (Jenis B) 2 17.54 Bibit Jagung Ke-7 (Jenis B) 2 18.53 Berdasarkan data Pada Tabel 7.2: Terdapat 2 variabel, yakni jenis bibit dan hasil produksi. Terdapat 2 sampel independen, yakni sampel hasil produksi jagung untuk jenis bibit A dan sampel hasil produksi jagung untuk jenis bibit B. Variabel jenis bibit merupakan variabel kategori, sementara variabel hasil produksi merupakan variabel numerik atau rasio. Untuk variabel jenis bibit, misalkan angka 1 menyatakan jenis bibit A, sementara angka 2 menyatakan jenis bibit B. Secara rata-rata, hasil produksi jagung untuk jenis bibit A lebih tinggi (21,11) dibandingkan hasil produksi jagung untuk jenis bibit B (18,34). Uji t independen (independent t test) atau uji Mann-Whitney untuk menguji hipotesis apakah terdapat perbedaan yang signifikan dari hasil produksi jagung antara jenis bibit A dan jenis bibit B. Data pada Tabel 7.2 jika diinput dalam SPSS seperti pada Gambar 7.2. Gambar 7.2 Data Tabel 7.2 Diinput dalam SPSS


60 7.2 Beberapa Kutipan Isi Buku Mengenai Uji t 2 Sampel Independen dan Uji MannWhitney Prem S. Mann (2013:470-471) dalam bukunya yang berjudul “Introductory Statistics, 8th Edition” menyatakan sebagai berikut. “Inferences About the Difference Between Two Population Means for Independent Samples: and Unknown but Equal This section discusses making a confidence interval and testing a hypothesis about the difference between the means of two populations, 1 − 2 , assuming that the standard deviations, 1 and 2 , of these populations are not known but are assumed to be equal. There are some other conditions, explained below, that must be fulfilled to use the procedures discussed in this section. If the following conditions are satisfied, 1. The two samples are independent 2. The standard deviations 1 and 2 of the two populations are unknown, but they can be assumed to be equal, that is, 1 = 2 3. At least one of the following two conditions is fulfilled: i. Both samples are large (i.e., 1 ≥ 30 and 2 ≥ 30) ii. If either one or both sample sizes are small, then both populations from which the samples are drawn are normally distributed then we use the t distribution to make a confidence interval and test a hypothesis about the difference between the means of two populations, 1 − 2 . When the standard deviations of the two populations are equal, we can use for both 1 and 2 . Because is unknown, we replace it by its point estimator , which is called the pooled sample standard deviation (hence, the subscri .” Prem S. Mann (2013:480-481) dalam bukunya yang berjudul “Introductory Statistics, 8th Edition” menyatakan sebagai berikut. “Inferences About the Difference Between Two Population Means for Independent Samples: and Unknown and Unequal Section 10.2 explained how to make inferences about the difference between two population means using the t distribution when the standard deviations of the two populations are unknown but equal and certain other assumptions hold true. Now, what if all other assumptions of Section 10.2 hold true, but the population standard deviations are not only unknown but also unequal? In this case, the procedures used to make confidence intervals and to test hypotheses about 1 − 2 remain similar to the ones we learned in Sections 10.2.1 and 10.2.2, except for two differences. When the population standard deviations are unknown and not equal, the degrees of freedom are no longer given by 1 +2 − 2, and the standard deviation of ̅1 −̅2 is not calculated using the pooled standard deviation . Degrees of Freedom If 1. The two samples are independent 2. The standard deviations 1 and 2 of the two populations are unknown and unequal, that is 1 ≠ 2 , 3. At least one of the following two conditions is fulfilled: i. Both samples are large (i.e., 1 ≥ 30 and 2 ≥ 30) ii. If either one or both sample sizes are small, then both populations from which the samples are drawn are normally distributed


61 then the t distribution is used to make inferences about 1 − 2 , and the degrees of freedom for the t distribution are given by = ( 1 2 1 + 2 2 2 ) 2 ( 1 2 1 ) 2 (1 −1) + ( 2 2 2 ) 2 (2 −1) The number given by this formula is always rounded down for df.” Murray R. Spiegel dan Larry J. Stephens (2008:447-448) dalam bukunya yang berjudul "Statistics, Fourth Edition" menyatakan sebagai berikut. “Consider Table 17.2, which shows the strengths of cables made from two different alloys, I and II. In this table we have two samples: 8 cables of alloy I and 10 cables of alloy II. We would like to decide whether or not there is a difference between the samples or, equivalently, whether or not they come from the same population. Although this problem can be worked by using the t test of Chapter 11, a nonparametric test called the Mann–Whitney U test, or briefly the U test, is useful. If 1 and 2 are both at least equal to 8, it turns out that the distribution of U is nearly normal, so that = − is normally distributed with mean 0 and variance 1”. Paul H. Kvam dan Brani Vidakociv (2007:131) dalam bukunya yang berjudul “Nonparametric Statistics with Applications to Science and Engineering” menyatakan sebagai berikut. “Like the Wilcoxon test above. The Mann-Whitney test is applied to find differences in two populations, and does not assume tlhat the populations are normally distributed.” Andy Field (2009:540) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3rd Edition” menyatakan sebagai berikut. “When you want to test differences between two conditions and different participants have been used in each condition then you have two choices: the Mann–Whitney test (Mann & Whitney, 1947) and the Wilcoxon rank-sum test (Wilcoxon, 1945; Figure 15.2). These tests are the non-parametric equivalent of the independent t-test. In fact both tests are equivalent, and there’s another, more famous, Wilcoxon test, so it gets extremely confusing for most of us.”. 7.3 Uji t 2 Sampel Independen dan Uji Mann-Whitney Berdasarkan uraian pada Bagian 7.2, maka dapat ditarik informasi sebagai berikut.


62 Uji t 2 sampel independen dan uji Mann-Whitney digunakan untuk menguji apakah terdapat perbedaan yang signifikan (secara statistika) berdasarkan 2 sampel independen. Asumsi normalitas dikenakan pada uji t 2 sampel independen, yakni sampel pertama dan sampel kedua diasumsikan ditarik dari populasi-populasi berdistribusi normal (Prem S. Mann, 2013:470-471). Asumsi normalitas pada uji t 2 sampel independen dapat diabaikan, ketika ukuran sampel pertama dan kedua ≥ 30 (Prem S. Mann, 2013:470-471). Hal ini karena berdasarkan sifat teorema limit sentral (central limit theorem), ketika jumlah sampel besar, maka distribusi sampling dari statistik t akan mendekati normal (Murray R. Spiegel dan Larry J. Stephens, 2008:275-276). Apabila jumlah sampel pada salah satu / kedua sampel < 30 dan asumsi normalitas tidak dipenuhi, maka uji Mann-Whitney dapat digunakan sebagai pendekatan nonparametrik. Uji t 2 sampel independen juga dikenai asumsi kesamaan varians populasi. Untuk menguji asumsi kesamaan varians dari dua populasi dapat digunakan uji Levene. 7.4 Contoh Kasus (Penyelesaian dengan SPSS) Input data Tabel 7.1 dalam SPSS seperti pada Gambar 7.1. Pertama, akan dilakukan pengujian asumsi normalitas untuk data tinggi badan laki-laki dan perempuan. Dalam SPSS, uji Shapiro-Wilk dapat digunakan untuk melakukan uji asumsi normalitas. Perhatikan Gambar 7.3. Pilih Analyze => Descriptive Statistics => Explore. Gambar 7.3


63 Perhatikan Gambar 7.4 (kotak Explore). Masukkan variabel Tinggi ke kotak Dependent List. Sementara masukkan variabel Jenis Kelamin ke kotak Factor List. Pilih Plots, sehingga muncul kotak Explore: Plots. Pilih Normality plots with tests. Kemudian pilih Continue dan OK. Hasil uji asumsi normalitas dengan uji Shapiro-Wilk diperlihatkan pada Tabel 7.3. Gambar 7.4 Tabel 7.3 Hasil Uji Asumsi Normalitas dengan Uji Shapiro-Wilk Tests of Normality Jenis Kelamin Kolmogorov-Smirnova Shapiro-Wilk Statistic df Sig. Statistic df Sig. Tinggi Laki-Laki .219 7 .200* .830 7 .081 Perempuan .203 5 .200* .954 5 .767 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Berdasarkan hasil uji asumsi normalitas dengan uji Shapiro-Wilk pada Tabel 7.3, diketahui: Asumsi normalitas populasi dipenuhi untuk data tinggi badan laki-laki (probabilitas / p-value / Sig. 0,081 > tingkat signifikansi 0,05). Asumsi normalitas populasi dipenuhi untuk data tinggi badan perempuan (probabilitas / p-value / Sig. 0,767 > tingkat signifikansi 0,05).


64 Diketahui asumsi normalitas untuk kedua populasi dipenuhi, maka pengujian dilanjutkan dengan menggunakan uji t 2 sampel independen. Perhatikan Gambar 7.5. Pilih Analyze => Compare Means => Independent-Samples T Test. Gambar 7.5 Gambar 7.6 Perhatikan Gambar 7.6 (kotak Independent-Samples T Test). Masukkan variabel Tinggi ke kotak Test Variable(s), sementara masukkan variabel Jenis_Kelamin ke kotak Grouping Variable. Pilih Define Groups, sehingga muncul kotak Define Groups. Pada Group 1, isi dengan angka 1 (angka 1 menyatakan laki-laki), sementara pada Group 2, isi dengan angka 2 (angka 2 menyatakan perempuan). Kemudian pilih Continue dan OK. Tabel 7.4 disajikan nilai rata-rata dan standar deviasi dari variabel tinggi badan antara lakilaki dan perempuan. Diketahui rata-rata tinggi badan laki-laki adalah 176,5843, dengan standar deviasi 3,27747. Sementara rata-rata tinggi badan perempuan adalah 168,6740,


65 dengan standar deviasi 2,47658. Secara rata-rata, tinggi badan laki-laki lebih tinggi dibandingkan perempuan. Tabel 7.4 Statistik Deskriptif Group Statistics Jenis Kelamin N Mean Std. Deviation Std. Error Mean Tinggi Laki-Laki 7 176.5843 3.27747 1.23877 Perempuan 5 168.6740 2.47658 1.10756 Tabel 7.5 disajikan hasil uji t 2 sampel independen untuk menguji apakah terdapat perbedaan yang signifikan antara tinggi badan laki-laki dan perempuan. Tabel 7.5 Hasil Uji t 2 Sampel Independen Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference F Sig. t df Sig. (2- tailed) Mean Difference Std. Error Difference Lower Upper Tinggi Equal variances assumed .078 .786 4.529 10 .001 7.91029 1.74668 4.01844 11.80214 Equal variances not assumed 4.760 9.919 .001 7.91029 1.66169 4.20370 11.61687 Berdasarkan Tabel 7.5, diperoleh hasil sebagai berikut. Pertama, periksa terlebih dahulu, apakah asumsi kesamaan varians dua populasi dipenuhi atau tidak. Pengujian asumsi kesamaan varians dua populasi dalam SPSS menggunakan uji Levene. Perhatikan bahwa nilai p-value / Sig. pada kolom Levene’s Test for Equality of Variances adalah 0,786 > tingkat signifikansi 0,05, maka asumsi kesamaan varians dua populasi dipenuhi.


66 1 1 Karena asumsi kesamaan varians dua populasi dipenuhi, perhatikan hasil-hasil pada baris Equal variances assumed. Jika asumsi kesamaan varians dua populasi tidak dipenuhi, perhatikan hasil-hasil pada baris Equal variances not assumed. Diketahui nilai p-value / Sig. pada kolom Sig. (2-tailed) adalah 0,001 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara lakilaki dan perempuan. Gambar 7.7 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel = −2,228 = +2,228 Gambar 7.8 Daerah Keputusan berdasarkan Uji t Cara lain, diketahui nilai statistik t (t hitung) adalah 4,529 dan derajat bebas (df) 10. Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228 (Gambar 7.7). Berdasarkan Gambar 7.8, diketahui nilai statistik t adalah 4,529, berada pada daerah 1 , yakni daerah penolakan 0 dan penerimaan 1 , maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. 0


67 Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Mann-Whitney dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan digunakan uji Mann-Whitney untuk menguji apakah terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. Perhatikan Gambar 7.9. Pilih Analyze => Nonparametric Tests => 2 Independent Samples. Gambar 7.9 Perhatikan Gambar 7.10 (kotak Two-Independent-Samples Tests). Masukkan variabel Tinggi ke kotak Test Variable Lists dan masukkan variabel Jenis_Kelamin ke kotak Grouping Variable. Kemudian pilih Define Groups, sehingga muncul kotak Two Independent Samples: Define Groups. Pada kotak Group 1, isi angka 1 (angka 1 menyatakan laki-laki), sementara pada kotak Group 2, isi angka 2 (angka 2 menyatakan perempuan). Pilih Continue dan OK.


68 Gambar 7.10 Tabel 7.6 Hasil Uji Mann-Whitney Test Statisticsb Tinggi Mann-Whitney U 2.000 Wilcoxon W 17.000 Z -2.517 Asymp. Sig. (2-tailed) .012 Exact Sig. [2*(1-tailed Sig.)] .010a a. Not corrected for ties. b. Grouping Variable: Jenis Kelamin Berdasarkan hasil uji Mann-Whitney pada Tabel 7.6, diketahui nilai p-value / Asymp. Sig. (2- tailed) adalah 0,012 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. 7.5 Contoh Kasus (Penyelesaian dengan STATCAL) Input data Tabel 7.1 dalam STATCAL seperti pada Gambar 7.11 dan Gambar 7.12.


69 Gambar 7.11 Input Data Numerik di STATCAL Gambar 7.12 Input Data Kategori di STATCAL Perhatikan Gambar 7.13. Pilih Statistics => Test of Two Populations. Gambar 7.13


70 Perhatikan Gambar 7.14. Pilih T-Test (Independent Populations). Pada kotak Choose Numeric Variable (Single Choice), pindahkan variabel Tinggi Badan ke kotak sebelah kanan. Sementara pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel Jenis Kelamin ke kotak sebelah kanan. Gambar 7.14 Perhatikan lagi Gambar 7.14. Pada bagian Choose Group:, isi angka 1 pada kotak First Group dan isi angka 2 pada kotak Second Group. Perhatikan bahwa angka 1 untuk jenis kelamin laki-laki, sementara angka 2 untuk jenis kelamin perempuan. Hasil dari uji t 2 sampel independen dapat dilihat pada bagian Result. Gambar 7.15 merupakan hasil STATCAL untuk boxplot. Boxplot pada Gambar 7.15 memperlihatkan sebaran data tinggi badan berdasarkan jenis kelamin laki-laki dan perempuan. Titik-titik hitam pada boxplot menyatakan tinggi badan dari setiap responden. Titik-titik yang berwarna merah menyatakan data tersebut Perhatikan Gambar 7.14. Pilih TTest (Independent Populations) Pada kotak Choose Numeric Variable (Single Choice), pindahkan variabel Tinggi Badan ke kotak sebelah kanan. Pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel Jenis Kelamin ke kotak sebelah kanan. Pada bagian Choose Group:, isi angka 1 pada kotak First Group dan isi angka 2 pada kotak Second Group. Perhatikan bahwa angka 1 untuk jenis kelamin laki-laki, sementara angka 2 untuk jenis kelamin perempuan.


71 termasuk ke dalam data ekstrim / outlier (sebaran data cukup jauh dari rata-ratanya). Berdasarkan boxplot pada Gambar 7.15, terlihat secara umum tinggi badan laki-laki lebih tinggi dibandingkan perempuan. Gambar 7.15 Boxplot Gambar 7.16 Uji Asumsi Normalitas dengan Uji Kolmogorov-Smirnov Berdasarkan hasil uji asumsi normalitas dengan uji Kolmogorov-Smirnov pada Gambar 7.16, diketahui: Asumsi normalitas populasi dipenuhi untuk data tinggi badan laki-laki (probabilitas / P-Value of KS 0,889 > tingkat signifikansi 0,05). Asumsi normalitas populasi dipenuhi untuk data tinggi badan perempuan (probabilitas / P-Value of KS 0,986 > tingkat signifikansi 0,05).


72 Gambar 7.17 Uji Asumsi Kesamaan Varians Dua Populasi dengan Uji Levene Gambar 7.17 disajikan hasil uji asumsi kesamaan varians dua populasi dengan uji Levene. Diketahui P-Value bernilai 0,7862 > tingkat signifikansi 0,05, maka asumsi kesamaan varians dua populasi dipenuhi. Gambar 7.18 Uji t 2 Sampel Berpasangan Gambar 7.18 merupakan hasil dari uji t 2 sampel berpasangan. Diketahui asumsi kesamaan varians dipenuhi, maka perhatikan hasil pada “When Assumption of Equal Variances is Satisfied”. Diketahui: Nilai statistik t (t hitung / t statistic) adalah 4,5288. Derajat bebas (degree of freedom) 10.


73 1 1 Gambar 7.19 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel = −2,228 = +2,228 Gambar 7.20 Daerah Keputusan berdasarkan Uji t Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228 (Gambar 7.19). Berdasarkan Gambar 7.20, diketahui nilai statistik t adalah 4,5288, berada pada daerah 1, yakni daerah penolakan 0 dan penerimaan 1, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. Cara lain, diketahui nilai P-Value 0,0011 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. Apabila asumsi normalitas tidak dipenuhi dan ukuran sampel < 30, maka uji Mann-Whitney dapat digunakan sebagai pendekatan nonparametrik. Sebagai contoh saja, berikut akan digunakan uji Mann-Whitney untuk menguji apakah terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. 0


74 Gambar 7.21 Perhatikan Gambar 7.21. Pilih Mann-Whitney Test. Pada kotak Choose Numeric Variable (Single Choice), pindahkan variabel Tinggi Badan ke kotak sebelah kanan. Sementara pada kotak Choose Categorical Variable (Single Choice), pindahkan variabel Jenis Kelamin ke kotak sebelah kanan. Perhatikan lagi Gambar 57.21. Pada bagian Choose Group:, isi angka 1 pada kotak First Group dan isi angka 2 pada kotak Second Group. Perhatikan bahwa angka 1 untuk jenis kelamin laki-laki, sementara angka 2 untuk jenis kelamin perempuan. Hasil dari uji MannWhitney dapat dilihat pada bagian Result (Gambar 7.22).


75 Gambar 7.22 Berdasarkan hasil uji Mann-Whitney pada Gambar 7.22, diketahui nilai P-Value with Continuity Correction adalah 0,0101 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. 7.6 Contoh Kasus (Penyelesaian dengan Minitab) Input data Tabel 7.1 dalam Minitab seperti pada Gambar 7.23. Gambar 7.23 Perhatikan Gambar 7.24. Pilih Stat => basic Statistics => 2-Sample t.


76 Gambar 7.24 Perhatikan Gambar 7.25. Pada kotak Samples:, isi dengan variabel Tinggi Badan, sementara pada kotak Subscripts:, isi dengan Jenis Kelamin. Diketahui pada hasil sebelumnya (Bagian 7.4 dan Bagian 7.5), asumsi kesamaan varians dari dua populasi dipenuhi. Sehingga pilih Assume equal variances. Kemudian pilih OK. Gambar 7.25 Gambar 7.26 disajikan hasil Minitab untuk uji t 2 sampel independen. Diketahui: Rata-rata tinggi badan laki-laki adalah 176,58, dengan standar deviasi 3,28. Rata-rata tinggi badan perempuan adalah 168,67, dengan standar deviasi 2,48. Nilai statistik t (t hitung / T-Value) adalah 4,53. Nilai derajat bebas (degree of freedom / DF) adalah 10.


77 1 1 Gambar 7.26 Gambar 7.27 Menghitung Nilai Kritis t (t Tabel) dengan Microsoft Excel = −2,228 = +2,228 Gambar 7.28 Daerah Keputusan berdasarkan Uji t Nilai kritis t (t tabel) dengan derajat bebas 10 dan tingkat signifikansi 5% adalah 2,228 (Gambar 7.27). Berdasarkan Gambar 7.28, diketahui nilai statistik t adalah 4,53, berada pada daerah 1, yakni daerah penolakan 0 dan penerimaan 1, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. Cara lain, diketahui nilai P-Value 0,001 < tingkat signifikansi 0,05, maka terdapat perbedaan tinggi badan yang signifikan antara laki-laki dan perempuan. 0


78 BAB 8 KORELASI LINEAR PEARSON 8.1 Sekilas Pengertian Korelasi Linear Pearson Berdasarkan Beberapa Buku Berikut diberikan beberapa kutipan penjelasan mengenai korelasi linear Pearson dari beberapa buku. John Maindonald dan W. John Braun (2010:67) dalam bukunya yang berjudul “Data Analysis and Graphics Using R, An Example-Based Approach 3rd Edition” menyatakan sebagai berikut. “The usual Pearson or product–moment correlation is a summary measure of linear relationship. Calculation of a correlation should always be accompanied by a check that the relevant scatterplot shows a linear relationship. Often the addition of a smooth trend line helps the assessment. Check also that the marginal distributions of the two variables are roughly normal, or at least not highly skew. If the relationship is monotonic, but is not linear and/or has asymmetric marginal distributions, it may be appropriate to use a Spearman rank correlation.” Gareth James, Daniela Witten, Trevor Hastie dan Robert Tibshirani (2014:70) dalam bukunya yang berjudul “An Introduction to Statistical Learning with Applications in R” menyatakan sebagai berikut. “Recall that correlation, defined as (, ) = ∑ ( −̅)( − ̅) =1 √∑ ( − ̅) =1 √∑ ( − ̅) =1 [1.1] is also a measure of the linear relationship between and . This suggests that we might be able to use = (, ) instead of 2 in order to assess the fit of the linear model.” Peter Dalgaard (2008:120-122) dalam bukunya yang berjudul “Introductory Statistics with R, 2 nd Edition” menyatakan sebagai berikut. “A correlation coefficient is a symmetric, scale-invariant measure of association between two random variables. It ranges from −1 to +1, where the extremes indicate perfect correlation and 0 means no correlation. The Pearson correlation is rooted in the two-dimensional normal distribution where the theoretical correlation describes the contour ellipses for the density. The empirical correlation coefficient is


79 (, ) = ∑ ( − ̅)( − ̅) √∑( − ̅) 2 ∑( − ̅) 2 [1.2] It can be shown that || will be less than 1 unless there is a perfect linear relation between and , and for that reason the Pearson correlation is sometimes called the “linear correlation”.” Michael J. Crawley (2015:108) dalam bukunya yang berjudul “Statistics, An Introduction Using R, 2nd Edition” menyatakan sebagai berikut. “With two continuous variables, x and y, the question naturally arises as to whether their values are correlated with each other (remembering, of course, that correlation does not imply causation). Correlation is defined in terms of the variance of x, the variance of y, and the covariance of x and y (the way the two vary together; the way they co-vary) on the assumption that both variables are normally distributed. We have symbols already for the two variances, 2 and 2 . We denote the covariance of and by cov(x, y), after which the correlation coefficient r is defined as = (,) √ 2 2 [1.3] Sanders & Smidth (2000:522-524) dalam bukunya yang berjudul “Statistics, A First Course, 6th Edition” menyatakan sebagai berikut. “In correlation analysis, the purpose is to measure the strength or closeness of the relationship between the variables. In other words, regression analysis asks, “What is the pattern of the existing relationship?” and correlation analysis asks, “How strong is the relationship described in the regression equation?” Although it is possible to be concerned only with regression analysis or only with an analysis of correlation, the two are typically considered together. …As you’ll notice in Figure 12.1, the eight points form a path that can be approximated by a straight line. Thus, there appears to be a linear relationship between variables. And a high degree of relationship is indicated by the fact that the points are all close to this straight-line path. You’ll also notice there’s a positive (or direct) relationship between variables, that is, as aptitude test results increase, output also increases. Of course, it’s quite possible for variables to have a negative (or inverse) relationship (as the value increases, the value decreases).” 8.2 Korelasi Linear Pearson Berdasarkan uraian pada Bagian 1, diperoleh informasi sebagai berikut: Korelasi linear Pearson dapat diartikan suatu nilai yang mengukur seberapa erat hubungan linear antara dua variabel (linear relationship) dan dapat diketahui arah hubungannya (direction) (John Maindonald dan W. John Braun, 2010:67; Sanders dan Smidth, 2000:524).


80 Korelasi linear Pearson sering juga disebut dengan Pearson product-moment correlation (John Maindonald dan W. John Braun, 2010:67). Notasi korelasi linear Pearson untuk sampel adalah “”, sementara untuk populasi adalah “” (dibaca: rho) (Douglas C. Montgomery dan George C. Runger, 2014:459; Damodar N Gujarati, 2003:85; Prem S. Mann, 2013:611). Nilai korelasi linear Pearson berkisar dari −1 sampai dengan +1 (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173). Nilai korelasi linear Pearson yang semakin dekat dengan −1 atau +1 menandakan sebaran data dari dua variabel tersebut semakin linear. Dengan kata lain hubungan linear antara dua variabel tersebut semakin kuat (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173). Nilai korelasi linear Pearson yang bernilai −1 atau +1 menandakan sebaran data dari dua variabel tersebut linear sempurna. Dengan kata lain hubungan linear antara dua variabel tersebut sempurna (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173). Nilai korelasi linear Pearson yang bernilai mendekati 0 menandakan sebaran data dari dua variabel tersebut semakin tidak linear. Dengan kata lain hubungan linear antara dua variabel tersebut semakin lemah, mungkin saja terdapat hubungan lain yang bersifat nonlinear (Peter Dalgaard, 2008:120-122; Andy Field, 2009:173). Skala data yang dipersyaratkan dalam penggunaan korelasi linear Pearson adalah continuous atau kontinu atau numerik (Michael J. Crawley, 2015:108). Nilai koefisien korelasi linear Pearson bersifat simetri, maksudnya nilai korelasi linear Pearson antara dan () akan sama dengan nilai korelasi linear Pearson antara dan () (Peter Dalgaard, 2008:120-122; Gujarati N Damodar, 2003:85). Pembahasan selanjutnya akan dijelaskan lebih detail mengenai pernyataan-pernyataan di atas.


81 8.3 Contoh Kurva Linear dan Nonlinear Misalkan diberikan data seperti pada Tabel 8.1. Tabel 8.1 Contoh Data No 1 2 3 4 5 1 -5 25 -125 2 0.038462 8 2 -4 16 -64 3 0.058824 7 3 -3 9 -27 4 0.1 6 4 -2 4 -8 5 0.2 5 5 -1 1 -1 6 0.5 4 6 0 0 0 7 1 3 7 1 1 1 8 0.5 2 8 2 4 8 9 0.2 1 9 3 9 27 10 0.1 0 10 4 16 64 11 0.058824 -1 Berdasarkan data pada Tabel 8.1: Akan disajikan grafik sebaran data antara dan 1, dengan menempati sumbu-x dan 1 menempati sumbu-y (Gambar 8.1). Akan disajikan grafik sebaran data antara dan 2, dengan menempati sumbu-x dan 2 menempati sumbu-y (Gambar 8.2). Akan disajikan grafik sebaran data antara dan 3, dengan menempati sumbu-x dan 3 menempati sumbu-y (Gambar 8.3). Akan disajikan grafik sebaran data antara dan 4, dengan menempati sumbu-x dan 4 menempati sumbu-y (Gambar 8.4). Akan disajikan grafik sebaran data antara dan 5, dengan menempati sumbu-x dan 4 menempati sumbu-y (Gambar 8.5).


82 Gambar 8.1 Grafik Sebaran Data antara dan Gambar 8.2 Grafik Sebaran Data antara dan Gambar 8.3 Grafik Sebaran Data antara dan Gambar 8.4 Grafik Sebaran Data antara dan


83 Gambar 8.5 Grafik Sebaran Data antara dan Berdasarkan grafik sebaran data di atas, diketahui: Kurva pada Gambar 8.1, Gambar 8.2, dan Gambar 8.4 merupakan kurva nonlinear (titik-titik tepat pada kurva nonlinear). Sementara kurva pada Gambar 8.3 dan Gambar 8.5 merupakan kurva linear (titiktitik tepat pada kurva linear) (Sanders dan Smidth, 2000:524). 8.4 Contoh Sebaran Data Linear Sempurna dan Cenderung Linear Misalkan diberikan data seperti pada Tabel 8.2. Tabel 8.2 Contoh Data 1 2 3 1 7.8 9 1 2 6.5 8 7 3 8.2 7 9 4 7.5 6 2 5 6.2 5 3 6 8.4 4 5 7 3.5 3 12 8 3.3 2 2 9 4.2 1 4 10 2 0 4 Berdasarkan data pada Tabel 8.2, disajikan grafik sebaran data antara 1 dan , 2 dan , 3 dan (Gambar 8.6).


84 Gambar 8.6 Sebaran Data antara , , terhadap Berdasarkan grafik sebaran data pada Gambar 8.6, diketahui: Sebaran data antara 1 dan cenderung linear. Titik-titik cenderung dekat dengan garis linear (nilai korelasi linear Pearson -0,81, mendekati -1). Dengan kata lain hubungan antara variabel 1 dan cenderung linear (Sanders dan Smidth, 2000:524). Sebaran data antara 2 dan linear sempurna. Titik-titik tepat pada garis linear (nilai korelasi linear Pearson -1). Hubungan antara 2 dan bersifat linear sempurna. Sebaran data antara 3 dan cenderung tidak linear. Titik-titik cukup jauh dari garis linear (nilai korelasi Pearson 0,016, cenderung dekat dengan 0, yang berarti sebaran data cenderung tidak linear). Hubungan antara variabel 3 dan cenderung tidak bersifat linear. 8.5 Sebaran Data dari Dua Variabel (Sebaran Data Cenderung Naik/Positif; Turun/Negatif; Linear Positif Sempurna; Linear Negatif Sempurna) Misalkan diberikan contoh data seperti pada Tabel 8.3.


85 Tabel 8.3 Contoh Data 1 2 3 4 5 1 5.4 9 7.8 5 1 2 4.2 8 6.5 4 2 3 3.3 7 8.2 3 3 4 3.5 6 7.5 2 4 5 8.4 5 6.2 12 5 6 6.2 4 8.4 2 6 7 7.5 3 3.5 3 7 8 8.2 2 3.3 4 8 9 6.5 1 4.2 5 9 10 7.8 0 2 6 10 Gambar 8.7 Sebaran Data antara , , , , terhadap Berdasarkan sebaran data pada Gambar 8.7, diperoleh informasi sebagai berikut. Sebaran data antara 1 dan linear sempurna (titik-titik tepat pada garis). 1 meningkat, juga pasti meningkat. 1 dan berkorelasi positif sempurna (nilai korelasi linear Pearson 1) (Sanders dan Smidth, 2000:524). Sebaran data antara 2 dan cenderung naik atau positif. Terdapat kecenderungan 2 yang semakin meningkat, juga meningkat. 2 dan berkorelasi positif namun tidak


86 sempurna (titik-titik tidak tepat di garis) (nilai korelasi linear Pearson 0,686) (Sanders dan Smidth, 2000:524). Sebaran data antara 3 dan linear sempurna (titik-titik tepat di garis). 3 meningkat, pasti turun. 3 dan berkorelasi negatif sempurna (nilai korelasi linear Pearson -1) (Sanders dan Smidth, 2000:524). Sebaran data antara 4 dan cenderung turun atau negatif. Terdapat kecenderungan 4 yang semakin meningkat, menurun. 4 dan berkorelasi negatif namun tidak sempurna (titik-titik tidak tepat di garis) (nilai korelasi linear Pearson -0,81) (Sanders dan Smidth, 2000:524). Sebaran data antara 5 dan cenderung tidak linear. Titik-titik cukup jauh dari garis linear (nilai korelasi Pearson 0,088, cenderung dekat dengan 0, yang berarti sebaran data cenderung tidak linear). Hubungan antara variabel 5 dan cenderung tidak bersifat linear. 8.6 Mengukur Keeratan Hubungan Linear antara Dua Variabel dengan Korelasi Linear Pearson Misalkan diberikan contoh data seperti pada Tabel 8.4. Tabel 8.4 Contoh Data No Kinerja Motivasi Stres Gaji Berat Badan 1 75 71 45 74 55.34 2 65 60 65 67 65.34 3 72 78 55 70 45.45 4 84 79 55 80 71.21 5 74 69 54 74 54.45 6 59 55 76 59 48.53 7 83 80 37 80 76.45 8 55 45 75 52 76.45 9 65 78 68 67 56.43 10 73 77 54 70 63.34


87 Berdasarkan data pada Tabel 8.4, ingin diketahui: Faktor manakah yang memiliki korelasi/hubungan linear paling erat terhadap kinerja? Apakah motivasi, stres, gaji atau berat badan? Gambar 8.8 disajikan sebaran data antara motivasi, stres, gaji dan berat badan terhadap kinerja. Sementara Gambar 8.9 merupakan nilai-nilai korelasinya (korelasi linear Pearson). Gambar 8.8 Sebaran Data antara Motivasi, Stres, Gaji dan Berat Badan terhadap Kinerja Gambar 8.9 Korelasi Linear Pearson antar Variabel


88 Berdasarkan grafik sebaran data Gambar 8.8 dan nilai korelasi linear Pearson Gambar 8.9, diperoleh hasil sebagai berikut. Korelasi atau hubungan linear paling kuat pertama adalah antara gaji dan kinerja, dengan nilai korelasi linear Pearson 0,976. Nilai korelasi bernilai positif, yakni 0,976, dapat diartikan terdapat kecenderungan, gaji yang semakin meningkat, kinerjanya juga meningkat. Hubungan yang dimaksud di sini adalah hubungan linear. Sementara korelasi atau hubungan terkuat kuat kedua adalah antara stres dan kinerja, dengan nilai korelasi linear Pearson -0,888. Nilai korelasi bernilai negatif, yakni - 0,888, dapat diartikan terdapat kecenderungan, stres yang semakin meningkat, kinerjanya menurun. Korelasi atau hubungan terkuat ketiga adalah antara motivasi dan kinerja, dengan nilai korelasi linear Pearson 0,824. Nilai korelasi bernilai positif, yakni 0,824, dapat diartikan terdapat kecenderungan, motivasi yang semakin meningkat, kinerjanya meningkat. Dan yang terakhir adalah antara berat badan dan kinerja, dengan nilai korelasi linear Pearson 0,18. Nilai korelasi linear Pearson bernilai positif, yakni 0,18, dapat diartikan terdapat kecenderungan, berat badan yang semakin meningkat, kinerjanya meningkat. 8.7 Ukuran Pengaruh (Size of an Effect) Andy Field (2009:170) dalam bukunya yang berjudul “Discovering Statistics Using SPSS, 3 rd Edition” menyatakan sebagai berikut. “We also saw in section 2.6.4 that because the correlation coefficient is a standardized measure of an observed effect, it is a commonly used measure of the size of an effect and that values of ±.1 represent a small effect, ±.3 is a medium effect and ±.5 is a large effect (although I re-emphasize my caveat that these canned effect sizes are no substitute for interpreting the effect size within the context of the research literature).” Berdasarkan uraian di atas: Nilai korelasi linear Pearson ±0,1 menyatakan small effect (pengaruh lemah).


89 Nilai korelasi linear Pearson ±0,3 menyatakan medium effect (pengaruh sedang). Nilai korelasi linear Pearson ±0,5 menyatakan large effect (pengaruh besar). Pada Bagian 8.6, diketahui nilai korelasi linear Pearson antara gaji dan kinerja adalah 0,976 > 0,5, yang berarti gaji dan kinerja berkorelasi kuat. Namun nilai korelasi Pearson antara berat badan dan kinerja adalah 0,18 (di antara -0,3 dan +0,3), yang berarti berat badan dan kinerja berkorelasi lemah. Perhatikan bahwa aturan pengelompokkan korelasi lemah, sedang atau kuat di atas, bukan aturan yang mutlak, dalam beberapa literatur lain, aturan pengelompokkan korelasi bisa berbeda. Seperti pada: http://www.dummies.com/education/math/statistics/how-to- interpreta-correlation-coefficient-r/ dan https://www.slideshare.net/phannithrupp/ guideline-forinterpreting-correlation-coefficient. 8.8 Kapan Uji Asumsi Normalitas Perlu Diuji? Apa Akibatnya Jika Asumsi Normalitas Tidak Dipenuhi? Pada Kondisi Bagaimana Uji Asumsi Normalitas Dapat Diabaikan? Menggunakan Pendekatan Apakah Untuk Menguji Keakuratannya? Uji asumsi normalitas tidak perlu dilakukan apabila hanya sampai pada perhitungan nilai korelasi linear Pearson. Mengapa demikian? Hal ini karena terpenuhinya atau tidak terpenuhi asumsi normalitas tidak akan mempengaruhi hasil dari nilai korelasi linear Pearson. Alan Agresti dan Barbara Finlay (2009:284) dalam bukunya yang berjudul “Statistical Methods for the Social Sciences, 4th Edition” menyatakan sebagai berikut. “The least squares line and and 2 are valid descriptive statisics no matter what the shape of the conditional distribution of y-values for each x-value.” Asumi normalitas yang dimaksud adalah kedua sampel diasumsikan ditarik dari populasi yang berdistribusi normal. Andy Field (2009:178) dalam bukunya “Discovering Statistics Using SPSS, 3rd Edition” menyatakan sebagai berikut.


90 “However, if you want to establish whether the correlation coefficient is significant, then more assumptions are required: for the test statistic to be valid the sampling distribution has to be normally distributed and as we saw in Chapter 5 we assume that it is if our sample data are normally distributed (or if we have a large sample). Although typically, to assume that the sampling distribution is normal, we would want both variables to be normally distributed.” Jadi pada saat kapan uji asumsi normalitas perlu diuji? Jawabannya adalah pada saat ketika kita akan melakukan uji signifikansi korelasi linear Pearson. Mengapa demikian? Hal ini karena, terpenuhinya atau tidak terpenuhinya asumsi normalitas akan mempengaruhi distribusi sampling dari statistik korelasi linear Pearson. Jika asumsi normalitas dipenuhi, maka distribusi sampling dari statistik korelasi linear Pearson ini akan berdistribusi , sehingga aturan distribusi dapat digunakan. Jika asumsi normalitas tidak dipenuhi, maka distribusi sampling dari statistik korelasi linear Pearson akan semakin jauh dari distribusi , sehingga kesimpulan yang diperoleh menjadi tidak akurat. Pada kondisi bagaimana uji asumsi normalitas dapat diabaikan? Uji asumsi normalitas dapat diabaikan ketika jumlah sampel cukup besar. Mengapa demikian? Hal ini karena ketika ukuran sampel besar, berdasarkan perluasan dari Teorema Limit Sentral (extended Central Limit Theorem) menyatakan distribusi sampling dari statistik korelasi linear Pearson akan mendekati normal. Dan juga distribusi akan mendekati distribusi normal ketika derajat bebas dari distribusi semakin besar. Alan Agresti dan Barbara Finlay (2009:284) dalam bukunya yang berjudul “Statistical Methods for the Social Sciences, 4th Edition” menyatakan sebagai berikut. “However, the statistical inferences in Section 9.5 also assume that the conditional distributions of y are (1) normal, with (2) identical standard deviation tau for each x-value. These assumptions are also not exactly satisfied in practice. For large samples, the normality assumption is relatively unimportant, because an extended Central Limit Theorem implies that sample slopes and correlations have approximately normal sampling distributions.” Dalam konteks ini, kapan ukuran sampel dikatakan besar? Ukuran sampel dikatakan cukup besar ketika di atas 30. Murray R. Spiegel dan Larry J. Stephens (275-276) dalam bukunya yang berjudul “Statistics 4th Edition” menyatakan sebagai berikut.


91 “In previous chapters we often made use of the fact that for samples of size N > 30, called large samples, the sampling distributions of many statistics are approximately normal, the approximation becoming better with increasing N. For samples of size N < 30, called small samples, this approximation is not good and becomes worse with decreasing N, so that appropriate modifications must be made. A study of sampling distributions of statistics for small samples is called small sampling theory. However, a more suitable name would be exact sampling theory, since the results obtained hold for large as well as for small samples. In this chapter we study three important distributions: Student’s t distribution, the chi-square distribution, and the F distribution. For large values of or (certainly ≥ 30) the curves (2) closely approximately the standardized normal curve = 1 √2 −( 1 2 ) 2 Menggunakan pendekatan apakah untuk menguji keakuratannya terhadap perubahan asumsi normalitas? Salah satu pendekatan untuk menguji keakuratannya adalah dengan menggunakan pendekatan simulasi Monte Carlo. 8.9 Korelasi Linear Pearson Digunakan untuk Pengujian Validitas Dalam beberapa literatur, sering ditemui korelasi linear Pearson digunakan untuk pengujian validitas. Berikut kutipan isi dari beberapa buku mengenai korelasi linear Pearson digunakan untuk pengujian validitas. Sugiyono (2015:207-209) dalam bukunya yang berjudul “Metode Penelitian Manajemen” menyatakan sebagai berikut. “Setelah data ditabulasikan, maka pengujian validitas konstruksi dilakukan dengan analisis faktor, yaitu mengkorelasikan antar skor item instrumen dalam suatu faktor dan mengkorelasikan skor faktor dengan skor total. Seperti telah dikemukakan bahwa, analisis faktor dilakukan dengan cara mengkorelasikan jumlah skor faktor dengan skor total. Bila korelasi tiap faktor tersebut positif dan besarnya 0,3 ke atas maka faktor tersebut merupakan konstrak yang kuat. Jadi berdasarkan analisis faktor itu dapat disimpulkan bahwa instrumen tersebut memiliki validitas konstruksi yang baik. Dari hasil perhitungan diketahui nilai korelasi ke tujuh butir instrumen dengan skor total ditunjukkan pada tabel 5.9 berikut: Berdasarkan tabel 5.9 berikut dapat diketahui, bahwa butir no 3 (faktor 1) tidak valid, karena korelasi butir tersebut dengan skor total hanya 0,22 (di bawah r kritis 0,3). Butir tersebut tidak selaras dengan butir yang lain.” Yvonne Augustine dan Robert Kristaung (2013:70) dalam bukunya yang berjudul “Metode Penelitian Bisnis dan Akuntansi” menyatakan sebagai berikut.


Click to View FlipBook Version