Cetral Limit Theory

Central Limit Theory menyatakan bahwa, walaupun original variable nya diambil acak dari populasi akan tetapi jika jumlah sample yang diambil sangat banyak, maka distribusi dari mean akan mendekati kurva normal.

Untuk lebih jelasnya bisa dibaca artikel ini.

Misalkan kita punya taman. Di taman tsb terdapat 6 jenis bunga. Jumlah populasi bunga sangat banyak. Dan mean dari populasi adalah 3.5 (mean dari 1, 2, 3, 4, 5, 6).

Jika kita lakukan 7 kali percobaan pengambilan sample, dengan tiap kali percobaan kita ambil 10 bunga, maka hasilnya sbb:


Nah Central Limit Theory (CLT) menyatakan bahwa semakin banyak sample yang diambil tiap percobaan maka:

mean_percobaan akan mendekati 3.5

Digambar terlihat: 

mean_perc 1 = 3.7

mean_perc 2 = 3.7

mean_perc 3 = 2.5

mean_perc 4 = 4.1

mean_perc 5 = 3.6

mean_perc 6 = 3.9

mean_perc 7 = 3.3

------------------------

mean of mean_perc = 3.54

CLT juga menyatakan bahwa, semakin sering percobaan dilakukan dan mean_perc dicari kembali mean-nya (mean of mean_perc) maka hasilnya akan mendekati 3.5 (digambar terlihat 3.54).

Apa urgensinya dari CLT ini?

CLT meyatakan bahwa semakin banyak sampel yang diambil maka semakin mendekati kurva normal. Itulah mengapa ada pendapat yang megatakan, ramdom sample yang diambil dengan observasi 30, sudah mendekati distribusi normal.

Lebih jauh, jika tiap percobaan dicari mean nya dan diulangi, lalu mean tiap-tiap percobaan ini di gambar dalam kurva histogram, maka dipastikan kurvanya akan jadi kurva normal.

Secara teori, di wikipedia dinyatakan begini:

If  are random samples each of size  taken from a population with overall mean  and finite variance  and if  is the sample mean, the limiting form of the distribution of  as , is the standard normal distribution


Terlihat jika jumlah sample n sangat besar, maka distribusiya menjadi standard normal distribution.

Jika ingin mencoba efek penambahan observasi pada masing masing percobaan bisa download spreadsheet ini


Dalam spreadsheet, diasumsikan dengan lempar dadu.

Kolom C, dilakukan percobaan lempar dadu 10x tiap percobaan. Hasil mean tiap percobaan ditulis di kolom N. Setelah 10x percobaan, mean dari mean-perc 3.59 (sel N4).

Kolom G, dilakukan percobaan lempar dadu 100x lempar tiap percobaan. Dan diulangi sampai 100x percobaan. Tiap percobaan hasil mean nya ditulis di kolom R. Setelah 100x percobaan, mean dari mean-perc 3.52 (sel R4).


Terlihat disini dengan 100x percobaan dan jumlah sample 100 sample per percobaan, maka mean yang didapat dari mean dari masing-masing 100x percobaan tsb 3.52 (mendekati mean populasi 3.50).

Dan, terlihat juga disini dengan 216x percobaan dan jumlah sample 500 sample per percobaan, maka mean yang didapat dari mean dari masing-masing 216x percobaan tsb 3.50 (sama dengan mean populasi 3.50). Kita bisa lanjutkan percobaan lempar dadu ini sampai percobaan ke 500, dengan klik tombol "Run".

Ringkasnya semakin banyak sample, maka mean dari rata-rata sample tsb akan mendekati mean populasi.

Dan juga, semakin sering dilakukan percobaan, maka mean of mean_perc akan mendekati mean_populasi.

Berikut adalah beberapa contoh histogram, dengan random pengambilan dadu sebanyak n lemparan dadu untuk sejumlah p kali percobaan.

n=100, p=100


n=1000, p = 216


n=50000, p=525


Terlihat semakin banyak sample per percobaan, dan semakin banyak percobaan, maka kurva mean of mean_perc akan semakin menjadi kurva normal.




 






Comments