M Tarmizi Taher: MENGETAHUI DATA BERDISTRIBUSI NORMAL ATAU TIDAK

MENGETAHUI DATA BERDISTRIBUSI NORMAL ATAU TIDAK

12.1. Tujuan Pengajaran

Materi modul ini membahas distribusi normal dengan tujuan agar mahasiswa dapat:

1. Mengenal metode yang digunakan untuk mengetahui data berdistribusi normal atau tidak

2. Melakukan olah data untuk mengetahui data berdistribusi normal atau tidak

kata kunci: kurtosis, histogram, boxplot dan ditribusi normal

11.2. Pengantar

Sebelum Saudara melakukan uji hipotesis suatu data lebih dulu harus mengetahui apakah data yang akan diuji berdistribusi normal atau tidak. Untuk mengetahui suatu data berdistribusi normal atau tidak dapat dilakukan dengan metode destriptif dan analitis seperti yang ditunjukkan dalam tabel berikut ini.

Metode	Parameter	Distribusi Normal	Keterangan
Deskriptif	Koefisien varian	Nilai koefisien varians <30%	SD x 100% Mean
	Rasio Skewness	Nilai rasio pada kisaran -2 s.d 2	Skewness SE Skewness
	Rasio Kurtosis	Nilai rasio kurtosis -2 s.d. 2	Kurtosis SE Kurtosis
	Histogram	Simetris tidak miring ke kiri dan ke kanan, tidak terlalu tinggi dan tidak atau terlalu rendah
	Box Plot	Simetris median tepat di tengah, tidak ada outliner atau nilai ekstrim
	Normal Q-Q plots	Data menyebar sekitar garis
	Deterended Q-Q plots	Data menyebar sekitar garis pada nilai 0
Analitis	Kolmogorov-Smirnov	Nilai kemaknaan (p) > 0,05	Untuk sampel besar (> 50)
Analitis	Shapiro-Wilk	Nilai kemaknaan (p) > 0,05	Untuk sampel besar (> 50)

Keterangan: SD = standar deviasi, SE = standar error

Tabel x.1. Metode untuk mengetahui suatu data berdistribusi normal atau tidak.

Setelah data diketahui berdistribusi normal atau tidak selanjutnya Saudara dapat berpedoman pada hal berikut ini:

§ Jika data berdistribusi normal untuk penyajian data menggunakan mean dan standar. Untuk uji hipotesis, menggunakan uji parametrik.

§ Jika data tidak normal, penyajian data menggunakan median dan minimum maksimum sebagai pasangan ukuran pemusatan dan penyebaran. Untuk uji hipotesis, gunakan uji non parametrik.

11.3. Studi Kasus

Contoh: seorang peneliti telah mengumpulkan data yang akan diolah dengan program SPSS. Salah satu variabel yang akan diukur adalah umur responden. Berikut nomor urut dan umur responden (dalam satuan tahun):

No	Umur	No	Umur	No	Umur	No	Umur
1	32	21	31	41	57	61	32
2	28	22	42	42	51	62	52
3	25	23	40	43	26	63	45
4	43	24	39	44	37	64	47
5	45	25	41	45	45	65	60
6	55	26	52	46	57	66	28
7	60	27	60	47	50	67	30
8	52	28	27	48	48	68	29
9	25	29	28	49	48	69	33
10	58	30	32	50	38	70	38
11	31	31	29	51	28	71	54
12	44	32	40	52	39	72	35
13	56	33	28	53	54	72	27
14	60	34	51	54	28	74	54
15	55	35	32	55	32	75	52
16	42	36	45	56	57	76	49
17	35	37	29	57	36	77	46
18	25	38	31	58	35	78	44
19	27	39	45	59	44	79	45
20	50	40	54	60	28	80	54

Tabel x.2. Umur responden.

x.2.1 Olah Data dengan SPSS

Berdasarkan data tersebut selanjutnya akan kita gunakan program SPSS untuk mengetahui data berdistribusi normal atau tidak. Data tersebut telah penulis siapkan dalam file MODUL11.sav. Saudara dapat mengikuti pembahasan secara aktif dengan asumsi program SPSS dan file tersebut telah siap untuk dioperasikan. Prosedur penyelesaian studi kasus dengan asumsi program SPSS dan file tersebut telah aktif adalah sebagai berikut:

1. Pilih dan klik menu Analyze > Descriptive Statistic > Explore. Jendela Explore ditampilkan.

2. Masukkan variabel umur ke dalam kotak isian Dependent List, pada bagian Display biarkan tombol pilihan pada Both (yang berarti pilihan Statistic dan Plots). Perhatikan gambar berikut ini.

Gambar X.1. Jendela Explore

3. Klik tombol perintah Plots yang terdapat di posisi bawah, selanjutnya jendela Explore: Plots ditampilkan. Lakukan pemilihan seperti ditunjukkan gambar berikut ini.

Gambar x.2. Jendela Explore: Plots.

Pilihan tersebut adalah sebagai berikut:

§ Factor levels together pada bagian Boxplots digunakan untuk menampilkan boxplot.

§ Histogram pada bagian Descriptive untuk menampilkan grafik histogram.

§ Normality plot with test untuk menampilkan plot dan uji normalitas.

4. Klik tombol perintah Continue, jendela Explore ditampilkan kembali, akhiri dengan klik tombol perintah OK.

x.2.2 Interpretasi Hasil Olah Data

Setelah Saudara melakukan prosedur tersebut, SPSS akan menampilkan satu file keluaran atau output yang dijelaskan berikut ini.

Gambar x.3. Hasil keluaran Case Processing Summary

Hasil di atas menunjukkan jumlah responden atau sampel (N) sebanyak 80 orang dan kolom Percent menunjukkan data dalam satuan persentase - lihat kolom Valid. Dalam kasus ini tidak ada data yang missing – hilang atau kosong – lihat kolom Missing. Sesuai dengan penjelasan di awal, selanjutnya kita dapat menentukan data berdistribusi normal atau tidak dengan membaca hasil keluaran (output) berikut ini:

1. Metode Deskriptif. Dilakukan dengan menghitung dan melihat beberapa parameter untuk menentukan normalitas distribusi data berdasarkan koefisien varians, rasio skewness dan rasio kurtosis.

Gambar x.4. Hasil keluaran Descriptive

Interpretasi hasil tersebut adalah sebagai berikut:

a. Koefisien varians dihitung dengan rumus:

=(standar deviasi / mean) x 100%

(10,913/42,00) x 100% = 25,9837%

b. Koefisien rasio skewness dihitung dengan rumus:

=(skewness / standar error of skewness)

0,87/0,269 = 0,3234

c. Rasio kurtosis dihitung dengan rumus:

=kurtosis / standar error of kurtosis

-1,326/0,532 = -2,4924

d. Histogram, berdasarkan gambar berikut menunjukkan distribusi data cenderung miring ke kiri.

Gambar 12.5. Hasil keluaran Histogram.

e. Normal Q-Q plot. Data dikatakan berdistribusi normal jika tersebar disekitar garis. Berdasarkan hasil keluaran SPSS terlihat data menyebar di sekitar baris dan di luar garis atau letaknya jauh dari garis. Melihat gambar semacam ini kemungkinan besar data tidak berdistribusi normal.

Gambar 12.6. Hasil keluaran Normal Q-Q plot.

f. Detrended Nornal Q-Q. Secara teoritis data dikatakan berdistribusi normal jika tersebar disekitar garis – angka nol. Berdasar keluaran di atas terlihat sebagian besar data letaknya jauh dari angka nol. Dengan demikian, kemungkinan besar data tidak berdistribusi normal.

Gambar 12.7. Hasil keluaran Detrended Normal Q-Q plot.

g. Boxplot.

Gambar 12.8. Hasil keluaran Boxplot

Keterangan:

§ Kotak besar di tengah mengandung 50% yaitu persentil 25 sampai dengan 75. Garis tengah di kotak merupakan median (persentil 50). Area kotak atau wilayah ini disebut hspread.

§ Data 1,5 hspread disebut sebagai whisker.

§ Nilai lebih dari 1,5 hspread dinamakan data outliner yang diberi tanda o.

§ Nilai lebih dari 3 hspread dinamakan data ekstrim yang diberi tanda *.

§ Berdasarkan gambar di atas terlihat median berada di posisi tengah, whisker relatif simetris dan tidak terdapat data outliner. Dengan demikian, kemungkinan besar data berdistribusi normal.

2. Metode Analitis. Baca hasil uji Kolmogorov- Smirnov atau Shapiro-Wilk. Hasil uji tersebut dapat dilihat melalui gambar berikut ini.

Gambar 12.9. Hasil keluaran Test of Normality.

Dalam hal ini sampel sebanyak 80 orang sehingga menggunakan Kolmogorov-Smirnov (>50). Nilai p = 0,002 (kolom Sig.), karena p < 0,05 sehingga dapat disimpulkan data berdistribusi tidak normal.

x.2.3 Membandingkan Interpretasi Hasil Olah Data

Perhatikan perbandingan hasil kesimpulan berdasarkan parameter penilaian dalam tabel berikut ini.

Parameter	Hasil	Kriteria Normal	Kesimpulan Distribusi Data
Koefisien varians	25,9837	< 30%	Normal
Rasio Skewness	0,3234	-2 s.d. 2	Normal
Rasio Kurtosis	-2,4924	-2 s.d. 2	Tidak Normal
Histogram*	Cenderung miring ke kiri	Simetris, tidak miring ke kiri atau kanan dan tidak terlalu tinggi atau terlalu rendah	Tidak Normal
Box Plot*	Simetris dan tidak terdapat outliner	Simetris, median tepat di tengah, tidak ada outliner atau nilai ekstrim	Normal
Normal Q-Q Plot*	Terdapat data yang tidak berada di sekitar garis	Data menyebar di sekitar garis	Tidak Normal
Detrended Q-Q Plot*	Sebagian data berada jauh di sekitar garis pada nilai nol	Data menyebar di sekitar garis pada nilai nol.	Tidak Normal
Kolmogorov-Smirnov Shapiro-Wilk	p = 0,002	P > 0,05

Keterangan:

*) interpretasi berbeda sehingga kesimpulan juga berbeda.

Tabel 12.3. Kesimpulan berdasarkan beberapa parameter penilaian.

Coba Saudara perhatikan secara cermat kesimpulan dalam Tabel 11.3, dalam beberapa kasus hasil dari metode tersebut seringkali tidak sama. Metode analitis baik Kolmogorov-Smirnov maupun Shapiro-Wilk lebih sensitif dibandingkan dengan menghitung nilai koefisien varians, rasio skewness maupun rasio kurtosis. Dengan demikian, jika metode analitis dibandingkan dengan melihat histogram maupun plot dinilai lebih objektif. Untuk menghindari perbedaan interpretasi hasil kesimpulan, dalam buku ini penulis menggunakan metode analitis sebagai metode untuk menguji normalitas data■

5 komentar:

Unknown19 November 2015 pukul 07.08
saya sari mau bertanya, seberapa pentingkah uji normalitas pada model linier?
BalasHapus
Balasan
Unknown15 November 2016 pukul 14.19
gambar grafiknya ga keluar
BalasHapus
Balasan
AJG27 Januari 2018 pukul 17.35
Terimakasih tulisan nya sangat membantu, ada sedikit pertanyaan, apakah uji normalitas deskriptif harus semua terpenuhi atau hanya memilih salah satu saja, misalnya koefisien varians saja??? Jika berkenan mohon jawabannya
BalasHapus
Balasan
Anita28 Juni 2018 pukul 13.05
Komentar ini telah dihapus oleh pengarang.
BalasHapus
Balasan
Anita28 Juni 2018 pukul 13.20
Trimakasih tulisannya cukup membantu saya dalam memahami dan melakukan uji kenormalan data ...
BalasHapus
Balasan

Tambahkan komentar

M Tarmizi Taher

Kamis, 19 September 2013

MENGETAHUI DATA BERDISTRIBUSI NORMAL ATAU TIDAK - smester 2

5 komentar:

tarmizi

Total Tayangan Halaman

Mengenai Saya