Kamis, 19 September 2013

MENGETAHUI DATA BERDISTRIBUSI NORMAL ATAU TIDAK - smester 2

MENGETAHUI DATA BERDISTRIBUSI NORMAL ATAU TIDAK


12.1.  Tujuan Pengajaran
            Materi modul ini membahas distribusi normal dengan tujuan agar mahasiswa dapat:
1.      Mengenal metode yang digunakan untuk mengetahui data berdistribusi normal atau tidak
2.      Melakukan olah data untuk mengetahui data berdistribusi normal atau tidak
kata kunci: kurtosis, histogram, boxplot dan ditribusi normal
11.2.  Pengantar
Metode
Parameter
Distribusi Normal
Keterangan
Deskriptif
Koefisien varian
Nilai koefisien varians <30%
   SD
          x 100%
 Mean
Rasio Skewness
Nilai rasio pada kisaran -2 s.d 2
   Skewness
SE Skewness
Rasio Kurtosis
 Nilai rasio kurtosis -2 s.d. 2
   Kurtosis
SE Kurtosis
Histogram
Simetris tidak miring ke kiri dan ke kanan, tidak terlalu tinggi dan tidak atau terlalu rendah

Box Plot
Simetris median tepat di tengah, tidak ada outliner atau nilai ekstrim

Normal Q-Q plots
Data menyebar sekitar garis

Deterended Q-Q plots

Data menyebar sekitar garis pada nilai 0

Analitis
Kolmogorov-Smirnov
Nilai kemaknaan (p) > 0,05
Untuk sampel besar (> 50)
Shapiro-Wilk
Nilai kemaknaan (p) > 0,05
Untuk sampel besar (> 50)
Keterangan: SD = standar deviasi,   SE = standar error 
Tabel x.1. Metode untuk mengetahui suatu data berdistribusi normal atau tidak.
Setelah data diketahui berdistribusi normal atau tidak selanjutnya Saudara dapat berpedoman pada hal berikut ini:
§  Jika data berdistribusi normal untuk penyajian data menggunakan mean dan standar. Untuk uji hipotesis, menggunakan uji parametrik.
§  Jika data tidak normal, penyajian data menggunakan median dan minimum maksimum sebagai pasangan ukuran pemusatan dan penyebaran. Untuk uji hipotesis, gunakan uji non parametrik.
11.3.  Studi Kasus
Contoh: seorang peneliti telah mengumpulkan data yang akan diolah dengan program SPSS. Salah satu variabel yang akan diukur adalah umur responden. Berikut nomor urut dan umur responden (dalam satuan tahun):
No
Umur
No
Umur
No
Umur
No
Umur
1
32
21
31
41
57
61
32
2
28
22
42
42
51
62
52
3
25
23
40
43
26
63
45
4
43
24
39
44
37
64
47
5
45
25
41
45
45
65
60
6
55
26
52
46
57
66
28
7
60
27
60
47
50
67
30
8
52
28
27
48
48
68
29
9
25
29
28
49
48
69
33
10
58
30
32
50
38
70
38
11
31
31
29
51
28
71
54
12
44
32
40
52
39
72
35
13
56
33
28
53
54
72
27
14
60
34
51
54
28
74
54
15
55
35
32
55
32
75
52
16
42
36
45
56
57
76
49
17
35
37
29
57
36
77
46
18
25
38
31
58
35
78
44
19
27
39
45
59
44
79
45
20
50
40
54
60
28
80
54
Tabel x.2. Umur responden.
x.2.1    Olah Data dengan SPSS
Berdasarkan data tersebut selanjutnya akan kita gunakan program SPSS untuk mengetahui data berdistribusi normal atau tidak. Data tersebut telah penulis siapkan dalam file MODUL11.sav. Saudara dapat mengikuti pembahasan secara aktif dengan asumsi program SPSS dan file tersebut telah siap untuk dioperasikan. Prosedur penyelesaian studi kasus dengan asumsi program SPSS dan file tersebut telah aktif adalah sebagai berikut:
1.      Pilih dan klik menu Analyze > Descriptive Statistic > Explore. Jendela Explore ditampilkan.
2.      Masukkan variabel umur ke dalam kotak isian Dependent List, pada bagian Display biarkan tombol pilihan pada Both (yang berarti pilihan Statistic dan Plots). Perhatikan gambar berikut ini.
Gambar X.1. Jendela Explore
3.      Klik tombol perintah Plots yang terdapat di posisi bawah, selanjutnya jendela Explore: Plots ditampilkan. Lakukan pemilihan seperti ditunjukkan gambar berikut ini.
Gambar x.2. Jendela Explore: Plots.
Pilihan tersebut adalah sebagai berikut:
§  Factor levels together pada bagian Boxplots digunakan untuk menampilkan boxplot.
§  Histogram pada bagian Descriptive untuk menampilkan grafik histogram.
§  Normality plot with test untuk menampilkan plot dan uji normalitas.
4.      Klik tombol perintah Continue, jendela Explore ditampilkan kembali, akhiri dengan klik tombol perintah OK.
x.2.2    Interpretasi Hasil Olah Data
Setelah Saudara melakukan prosedur tersebut, SPSS akan menampilkan satu file keluaran atau output yang dijelaskan berikut ini.
Gambar x.3. Hasil keluaran Case Processing Summary
Hasil di atas menunjukkan jumlah responden atau sampel (N) sebanyak 80 orang dan kolom Percent menunjukkan data dalam satuan persentase - lihat kolom Valid. Dalam kasus ini tidak ada data yang missing – hilang atau kosong – lihat kolom Missing. Sesuai dengan penjelasan di awal, selanjutnya kita dapat menentukan data berdistribusi normal atau tidak dengan membaca hasil keluaran (output) berikut ini:
1.      Metode Deskriptif. Dilakukan dengan menghitung dan melihat beberapa parameter untuk menentukan normalitas distribusi data berdasarkan koefisien varians, rasio skewness dan rasio kurtosis.
Gambar x.4. Hasil keluaran Descriptive
Interpretasi hasil tersebut adalah sebagai berikut:
a.       Koefisien varians dihitung dengan rumus:
=(standar deviasi / mean) x 100%
(10,913/42,00) x 100% = 25,9837%
b.      Koefisien rasio skewness dihitung dengan rumus:
=(skewness / standar error of skewness)
0,87/0,269 = 0,3234
c.       Rasio kurtosis dihitung dengan rumus:
=kurtosis / standar error of kurtosis
-1,326/0,532 = -2,4924
d.      Histogram, berdasarkan gambar berikut menunjukkan distribusi data cenderung miring ke kiri.
Gambar 12.5. Hasil keluaran Histogram.
e.       Normal Q-Q plot. Data dikatakan berdistribusi normal jika tersebar disekitar garis. Berdasarkan hasil keluaran SPSS terlihat data menyebar di sekitar baris dan di luar garis atau letaknya jauh dari garis. Melihat gambar semacam ini kemungkinan besar data tidak berdistribusi normal.
Gambar 12.6. Hasil keluaran Normal Q-Q plot.
f.       Detrended Nornal Q-Q. Secara teoritis data dikatakan berdistribusi normal jika tersebar disekitar garis – angka nol. Berdasar keluaran di atas terlihat sebagian besar data letaknya jauh dari angka nol. Dengan demikian, kemungkinan besar data tidak berdistribusi normal.


Gambar 12.7. Hasil keluaran Detrended Normal Q-Q plot.
g.       Boxplot.
Gambar 12.8. Hasil keluaran Boxplot
Keterangan:
§  Kotak besar di tengah mengandung 50% yaitu persentil 25 sampai dengan 75. Garis tengah di kotak merupakan median (persentil 50). Area kotak atau wilayah ini disebut hspread.
§  Data 1,5 hspread disebut sebagai whisker.
§  Nilai lebih dari 1,5 hspread dinamakan data outliner yang diberi tanda o.
§  Nilai lebih dari 3 hspread dinamakan data ekstrim yang diberi tanda *.
§  Berdasarkan gambar di atas terlihat median berada di posisi tengah, whisker relatif simetris dan tidak terdapat data outliner. Dengan demikian, kemungkinan besar data berdistribusi normal.
2.      Metode Analitis. Baca hasil uji Kolmogorov- Smirnov atau Shapiro-Wilk. Hasil uji tersebut dapat dilihat melalui gambar berikut ini.
Gambar 12.9. Hasil keluaran Test of Normality.
Dalam hal ini sampel sebanyak 80 orang sehingga menggunakan Kolmogorov-Smirnov (>50). Nilai p = 0,002 (kolom Sig.), karena p < 0,05 sehingga dapat disimpulkan data berdistribusi tidak normal.
x.2.3    Membandingkan Interpretasi Hasil Olah Data
Perhatikan perbandingan hasil kesimpulan berdasarkan parameter penilaian dalam tabel berikut ini.
Parameter
Hasil
Kriteria Normal
Kesimpulan Distribusi Data
Koefisien varians
25,9837
< 30%
Normal
Rasio Skewness
0,3234
-2 s.d. 2
Normal
Rasio Kurtosis
-2,4924
-2 s.d. 2
Tidak Normal
Histogram*
Cenderung miring ke kiri
Simetris, tidak miring ke kiri atau kanan dan tidak terlalu tinggi atau terlalu rendah
Tidak Normal
Box Plot*
Simetris dan tidak terdapat outliner
Simetris, median tepat di tengah, tidak ada outliner atau nilai ekstrim
Normal
Normal Q-Q Plot*
Terdapat data yang tidak berada di sekitar garis
Data menyebar di sekitar garis
Tidak Normal
Detrended Q-Q Plot*
Sebagian data berada jauh di sekitar garis pada nilai nol
Data menyebar di sekitar garis pada nilai nol.
Tidak Normal
Kolmogorov-Smirnov
Shapiro-Wilk
p = 0,002
P > 0,05

Keterangan:
*)    interpretasi berbeda sehingga kesimpulan juga berbeda.
Tabel 12.3. Kesimpulan berdasarkan beberapa parameter penilaian.

Coba Saudara perhatikan secara cermat kesimpulan dalam Tabel 11.3, dalam beberapa kasus hasil dari metode tersebut seringkali tidak sama. Metode analitis baik Kolmogorov-Smirnov maupun Shapiro-Wilk lebih sensitif dibandingkan dengan menghitung nilai koefisien varians, rasio skewness maupun rasio kurtosis. Dengan demikian, jika metode analitis dibandingkan dengan melihat histogram maupun plot dinilai lebih objektif. Untuk menghindari perbedaan interpretasi hasil kesimpulan, dalam buku ini penulis menggunakan metode analitis sebagai metode untuk menguji normalitas data■

5 komentar:

  1. saya sari mau bertanya, seberapa pentingkah uji normalitas pada model linier?

    BalasHapus
  2. Terimakasih tulisan nya sangat membantu, ada sedikit pertanyaan, apakah uji normalitas deskriptif harus semua terpenuhi atau hanya memilih salah satu saja, misalnya koefisien varians saja??? Jika berkenan mohon jawabannya

    BalasHapus
  3. Komentar ini telah dihapus oleh pengarang.

    BalasHapus
  4. Trimakasih tulisannya cukup membantu saya dalam memahami dan melakukan uji kenormalan data ...

    BalasHapus