Cetral Limit Theory
Central Limit Theory menyatakan bahwa, walaupun original variable nya diambil acak dari populasi akan tetapi jika jumlah sample yang diambil sangat banyak, maka distribusi dari mean akan mendekati kurva normal.
Untuk lebih jelasnya bisa dibaca artikel ini.
Misalkan kita punya taman. Di taman tsb terdapat 6 jenis bunga. Jumlah populasi bunga sangat banyak. Dan mean dari populasi adalah 3.5 (mean dari 1, 2, 3, 4, 5, 6).
Jika kita lakukan 7 kali percobaan pengambilan sample, dengan tiap kali percobaan kita ambil 10 bunga, maka hasilnya sbb:
Nah Central Limit Theory (CLT) menyatakan bahwa semakin banyak sample yang diambil tiap percobaan maka:
mean_percobaan akan mendekati 3.5
Digambar terlihat:
mean_perc 1 = 3.7
mean_perc 2 = 3.7
mean_perc 3 = 2.5
mean_perc 4 = 4.1
mean_perc 5 = 3.6
mean_perc 6 = 3.9
mean_perc 7 = 3.3
------------------------
mean of mean_perc = 3.54
CLT juga menyatakan bahwa, semakin sering percobaan dilakukan dan mean_perc dicari kembali mean-nya (mean of mean_perc) maka hasilnya akan mendekati 3.5 (digambar terlihat 3.54).
Apa urgensinya dari CLT ini?
CLT meyatakan bahwa semakin banyak sampel yang diambil maka semakin mendekati kurva normal. Itulah mengapa ada pendapat yang megatakan, ramdom sample yang diambil dengan observasi 30, sudah mendekati distribusi normal.
Lebih jauh, jika tiap percobaan dicari mean nya dan diulangi, lalu mean tiap-tiap percobaan ini di gambar dalam kurva histogram, maka dipastikan kurvanya akan jadi kurva normal.
Secara teori, di wikipedia dinyatakan begini:
If are random samples each of size taken from a population with overall mean and finite variance and if is the sample mean, the limiting form of the distribution of as , is the standard normal distribution
Terlihat jika jumlah sample n sangat besar, maka distribusiya menjadi standard normal distribution.
Jika ingin mencoba efek penambahan observasi pada masing masing percobaan bisa download spreadsheet ini.
Dalam spreadsheet, diasumsikan dengan lempar dadu.
Dan, terlihat juga disini dengan 216x percobaan dan jumlah sample 500 sample per percobaan, maka mean yang didapat dari mean dari masing-masing 216x percobaan tsb 3.50 (sama dengan mean populasi 3.50). Kita bisa lanjutkan percobaan lempar dadu ini sampai percobaan ke 500, dengan klik tombol "Run".
Ringkasnya semakin banyak sample, maka mean dari rata-rata sample tsb akan mendekati mean populasi.
Dan juga, semakin sering dilakukan percobaan, maka mean of mean_perc akan mendekati mean_populasi.
Berikut adalah beberapa contoh histogram, dengan random pengambilan dadu sebanyak n lemparan dadu untuk sejumlah p kali percobaan.
n=100, p=100
n=1000, p = 216
n=50000, p=525
Terlihat semakin banyak sample per percobaan, dan semakin banyak percobaan, maka kurva mean of mean_perc akan semakin menjadi kurva normal.
Comments
Post a Comment