MENGETAHUI DATA
BERDISTRIBUSI NORMAL ATAU TIDAK
12.1. Tujuan
Pengajaran
Materi modul ini
membahas distribusi normal dengan tujuan agar mahasiswa dapat:
1.
Mengenal metode yang digunakan untuk
mengetahui data berdistribusi normal atau tidak
2.
Melakukan olah data untuk mengetahui
data berdistribusi normal atau tidak
kata kunci: kurtosis, histogram,
boxplot dan ditribusi normal
11.2. Pengantar
Metode
|
Parameter
|
Distribusi Normal
|
Keterangan
|
Deskriptif
|
Koefisien varian
|
Nilai koefisien varians <30%
|
SD
x 100%
Mean
|
Rasio Skewness
|
Nilai rasio pada kisaran -2 s.d 2
|
Skewness
SE
Skewness
|
|
Rasio Kurtosis
|
Nilai rasio
kurtosis -2 s.d. 2
|
Kurtosis
SE
Kurtosis
|
|
Histogram
|
Simetris tidak miring ke kiri dan ke kanan, tidak
terlalu tinggi dan tidak atau terlalu rendah
|
||
Box Plot
|
Simetris median tepat di tengah, tidak ada outliner
atau nilai ekstrim
|
||
Normal Q-Q plots
|
Data menyebar sekitar garis
|
||
Deterended Q-Q plots
|
Data menyebar sekitar garis pada nilai 0
|
||
Analitis
|
Kolmogorov-Smirnov
|
Nilai kemaknaan (p) > 0,05
|
Untuk
sampel besar (> 50)
|
Shapiro-Wilk
|
Nilai kemaknaan (p) > 0,05
|
Untuk
sampel besar (> 50)
|
Keterangan: SD = standar deviasi, SE = standar error
Tabel x.1. Metode untuk mengetahui suatu data
berdistribusi normal atau tidak.
Setelah data
diketahui berdistribusi normal atau tidak selanjutnya Saudara dapat berpedoman
pada hal berikut ini:
§ Jika data berdistribusi normal untuk penyajian data
menggunakan mean dan standar. Untuk uji hipotesis, menggunakan uji parametrik.
§ Jika data tidak normal, penyajian data menggunakan
median dan minimum maksimum sebagai pasangan ukuran pemusatan dan penyebaran.
Untuk uji hipotesis, gunakan uji non parametrik.
11.3. Studi
Kasus
Contoh:
seorang peneliti telah mengumpulkan data yang akan diolah dengan program SPSS.
Salah satu variabel yang akan diukur adalah umur responden. Berikut nomor urut
dan umur responden (dalam satuan tahun):
No
|
Umur
|
No
|
Umur
|
No
|
Umur
|
No
|
Umur
|
1
|
32
|
21
|
31
|
41
|
57
|
61
|
32
|
2
|
28
|
22
|
42
|
42
|
51
|
62
|
52
|
3
|
25
|
23
|
40
|
43
|
26
|
63
|
45
|
4
|
43
|
24
|
39
|
44
|
37
|
64
|
47
|
5
|
45
|
25
|
41
|
45
|
45
|
65
|
60
|
6
|
55
|
26
|
52
|
46
|
57
|
66
|
28
|
7
|
60
|
27
|
60
|
47
|
50
|
67
|
30
|
8
|
52
|
28
|
27
|
48
|
48
|
68
|
29
|
9
|
25
|
29
|
28
|
49
|
48
|
69
|
33
|
10
|
58
|
30
|
32
|
50
|
38
|
70
|
38
|
11
|
31
|
31
|
29
|
51
|
28
|
71
|
54
|
12
|
44
|
32
|
40
|
52
|
39
|
72
|
35
|
13
|
56
|
33
|
28
|
53
|
54
|
72
|
27
|
14
|
60
|
34
|
51
|
54
|
28
|
74
|
54
|
15
|
55
|
35
|
32
|
55
|
32
|
75
|
52
|
16
|
42
|
36
|
45
|
56
|
57
|
76
|
49
|
17
|
35
|
37
|
29
|
57
|
36
|
77
|
46
|
18
|
25
|
38
|
31
|
58
|
35
|
78
|
44
|
19
|
27
|
39
|
45
|
59
|
44
|
79
|
45
|
20
|
50
|
40
|
54
|
60
|
28
|
80
|
54
|
Tabel x.2.
Umur responden.
x.2.1 Olah Data dengan SPSS
Berdasarkan
data tersebut selanjutnya akan kita gunakan program SPSS untuk mengetahui data
berdistribusi normal atau tidak. Data tersebut telah penulis siapkan dalam file
MODUL11.sav. Saudara dapat mengikuti pembahasan
secara aktif dengan asumsi program SPSS dan file tersebut telah siap untuk
dioperasikan. Prosedur penyelesaian studi kasus dengan asumsi program SPSS dan
file tersebut telah aktif adalah sebagai berikut:
1. Pilih dan klik menu Analyze > Descriptive Statistic
> Explore. Jendela Explore ditampilkan.
2. Masukkan variabel umur ke dalam kotak isian Dependent
List, pada bagian Display biarkan tombol pilihan pada Both (yang berarti
pilihan Statistic dan Plots). Perhatikan gambar berikut ini.
Gambar X.1. Jendela Explore
3. Klik tombol perintah Plots yang terdapat di posisi
bawah, selanjutnya jendela Explore: Plots ditampilkan. Lakukan pemilihan
seperti ditunjukkan gambar berikut ini.
Gambar x.2. Jendela Explore: Plots.
Pilihan tersebut adalah sebagai berikut:
§ Factor levels together pada bagian Boxplots digunakan
untuk menampilkan boxplot.
§ Histogram pada bagian Descriptive untuk menampilkan
grafik histogram.
§ Normality plot with test untuk menampilkan plot dan
uji normalitas.
4. Klik tombol perintah Continue, jendela Explore
ditampilkan kembali, akhiri dengan klik tombol perintah OK.
x.2.2 Interpretasi Hasil Olah
Data
Setelah Saudara
melakukan prosedur tersebut, SPSS akan menampilkan satu file keluaran atau
output yang dijelaskan berikut ini.
Gambar x.3. Hasil keluaran Case Processing Summary
Hasil di atas menunjukkan jumlah
responden atau sampel (N) sebanyak 80 orang dan kolom Percent menunjukkan data
dalam satuan persentase - lihat kolom Valid. Dalam kasus ini tidak ada data
yang missing – hilang atau kosong – lihat kolom Missing. Sesuai dengan
penjelasan di awal, selanjutnya kita dapat menentukan data berdistribusi normal
atau tidak dengan membaca hasil keluaran (output) berikut ini:
1. Metode Deskriptif. Dilakukan dengan menghitung dan
melihat beberapa parameter untuk menentukan normalitas distribusi data
berdasarkan koefisien varians, rasio skewness dan rasio kurtosis.
Gambar x.4. Hasil keluaran Descriptive
Interpretasi hasil tersebut adalah sebagai berikut:
a. Koefisien varians dihitung dengan rumus:
=(standar deviasi / mean) x 100%
(10,913/42,00) x 100% = 25,9837%
b. Koefisien rasio skewness dihitung dengan rumus:
=(skewness / standar error of skewness)
0,87/0,269 = 0,3234
c. Rasio kurtosis dihitung dengan rumus:
=kurtosis / standar error of kurtosis
-1,326/0,532 = -2,4924
d. Histogram, berdasarkan gambar berikut menunjukkan
distribusi data cenderung miring ke kiri.
Gambar 12.5. Hasil keluaran Histogram.
e. Normal Q-Q plot. Data dikatakan berdistribusi normal
jika tersebar disekitar garis. Berdasarkan hasil keluaran SPSS terlihat data
menyebar di sekitar baris dan di luar garis atau letaknya jauh dari garis.
Melihat gambar semacam ini kemungkinan besar data tidak berdistribusi normal.
Gambar 12.6. Hasil keluaran Normal Q-Q plot.
f. Detrended Nornal Q-Q. Secara teoritis data dikatakan
berdistribusi normal jika tersebar disekitar garis – angka nol. Berdasar
keluaran di atas terlihat sebagian besar data letaknya jauh dari angka nol.
Dengan demikian, kemungkinan besar data tidak berdistribusi normal.
Gambar 12.7. Hasil keluaran Detrended Normal Q-Q plot.
g. Boxplot.
Gambar 12.8. Hasil keluaran Boxplot
Keterangan:
§ Kotak besar di tengah mengandung 50% yaitu persentil
25 sampai dengan 75. Garis tengah di kotak merupakan median (persentil 50).
Area kotak atau wilayah ini disebut hspread.
§ Data 1,5 hspread disebut sebagai whisker.
§ Nilai lebih dari 1,5 hspread dinamakan data outliner
yang diberi tanda o.
§ Nilai lebih dari 3 hspread dinamakan data ekstrim yang
diberi tanda *.
§ Berdasarkan gambar di atas terlihat median berada di
posisi tengah, whisker relatif simetris dan tidak terdapat data outliner.
Dengan demikian, kemungkinan besar data berdistribusi normal.
2. Metode Analitis. Baca hasil uji Kolmogorov- Smirnov
atau Shapiro-Wilk. Hasil uji tersebut dapat dilihat melalui gambar berikut ini.
Gambar 12.9. Hasil
keluaran Test of Normality.
Dalam hal ini sampel sebanyak 80 orang sehingga
menggunakan Kolmogorov-Smirnov (>50). Nilai p = 0,002 (kolom Sig.), karena p
< 0,05 sehingga dapat disimpulkan data berdistribusi tidak normal.
x.2.3 Membandingkan Interpretasi
Hasil Olah Data
Perhatikan perbandingan
hasil kesimpulan berdasarkan parameter penilaian dalam tabel berikut ini.
Parameter
|
Hasil
|
Kriteria Normal
|
Kesimpulan Distribusi Data
|
Koefisien varians
|
25,9837
|
< 30%
|
Normal
|
Rasio Skewness
|
0,3234
|
-2 s.d. 2
|
Normal
|
Rasio Kurtosis
|
-2,4924
|
-2 s.d. 2
|
Tidak Normal
|
Histogram*
|
Cenderung miring ke kiri
|
Simetris, tidak miring ke kiri atau kanan dan tidak
terlalu tinggi atau terlalu rendah
|
Tidak Normal
|
Box Plot*
|
Simetris dan tidak terdapat outliner
|
Simetris, median tepat di tengah, tidak ada outliner
atau nilai ekstrim
|
Normal
|
Normal Q-Q Plot*
|
Terdapat data yang tidak berada di sekitar garis
|
Data menyebar di sekitar garis
|
Tidak Normal
|
Detrended Q-Q Plot*
|
Sebagian data berada jauh di sekitar garis pada
nilai nol
|
Data menyebar di sekitar garis pada nilai nol.
|
Tidak Normal
|
Kolmogorov-Smirnov
Shapiro-Wilk
|
p = 0,002
|
P > 0,05
|
Keterangan:
*) interpretasi berbeda sehingga kesimpulan
juga berbeda.
Tabel 12.3. Kesimpulan berdasarkan beberapa parameter
penilaian.
Coba Saudara
perhatikan secara cermat kesimpulan dalam Tabel 11.3,
dalam beberapa kasus hasil dari metode tersebut seringkali tidak sama. Metode
analitis baik Kolmogorov-Smirnov maupun Shapiro-Wilk lebih sensitif
dibandingkan dengan menghitung nilai koefisien varians, rasio skewness maupun
rasio kurtosis. Dengan demikian, jika metode analitis dibandingkan dengan
melihat histogram maupun plot dinilai lebih objektif. Untuk menghindari
perbedaan interpretasi hasil kesimpulan, dalam buku ini penulis menggunakan
metode analitis sebagai metode untuk menguji normalitas data■
saya sari mau bertanya, seberapa pentingkah uji normalitas pada model linier?
BalasHapusgambar grafiknya ga keluar
BalasHapusTerimakasih tulisan nya sangat membantu, ada sedikit pertanyaan, apakah uji normalitas deskriptif harus semua terpenuhi atau hanya memilih salah satu saja, misalnya koefisien varians saja??? Jika berkenan mohon jawabannya
BalasHapusKomentar ini telah dihapus oleh pengarang.
BalasHapusTrimakasih tulisannya cukup membantu saya dalam memahami dan melakukan uji kenormalan data ...
BalasHapus