Posts

Showing posts from November, 2020

Confident Interval 1 Tailed t test

Image
Stata menampilkan Confidence Interval untuk t test. Akan tetapi interval yang ditampilkan adalah untuk 2 tailed test. Bagaimana untuk 1 tailed test? Stata sudah cukup berbaik hati menampilkan probalility untuk 1 tailed t test. Namun untuk confident interval 1 tailed t test nya tidak ditampilkan. Berikut diberikan contoh kasus sbb . Terlihat akan diuji apakah terdapat kenaikan komsumsi kopi > 3 cangkir per hari. Ha: mean > 3 (rata-rata konsumsi kopi meningkat) Dengan hitung manual didapat hasil sbb. Dengan hitung manual p-value terletak antara 0.01 < p-value < 0.025. Karena p-value < 0.05 maka Ho reject, Ha accept. Artinya dapat disimpulkan: rata-rata konsumsi kopi meningkat dari sebelumnya 3 cangkir. Output dengan Stata: Terlihat bahwa Ha: mean > 3, Pr nya 0.0232 lebih kecil dari 0.05 sehingga Ha accept. Terlihat juga 95% Conf. Interval di output Stata. Namun ingat ini adalah output dari 2 tailed test. Bagaimana dengan output 1 tailed test nya? Kita harus buat 95% Lef

Cara Membaca Null Hypotesis Stata

Image
Tulisan ini merupakan adaptasi dari artikel  https://www.ssc.wisc.edu/sscc/pubs/sfs/sfs-ttest.htm . Didalam artikel tsb diberikan penjelasan cara membaca Ha, pada output Stata.  Latar Belakang Pada saat melakuka test Hipotesis Null (Ho) apakah kita reject atau accept, perlu dibuatkan lawan dari Ho, yaitu Ha nya. Menariknya Stata akan menampilkan Ha, baik yang two tailed, maupun yang one tailed left, maupun right. Sebagai contoh:  Anggap kita ingin menguji bahwa rata-rata nilai educ (education) pada satu polulasi = 14 (Ho: mean = 14). Terlihat disini Stata mengasumsikan: Ho: mean =14 Dan stata menampilkan nilai Mean, Std. Err., dan Std. Dev dari 254 sample. Mean ditampilkan = 13.38583. Ditampilkan pula 95% Conf. Interval. Apakah Ho: mean = 14 bisa di Accept? Kita lihat bahwa 14, berada diluar range 95% Conf. Interval, sehingga: Ho: mean = 14 reject Konsekuensinya lawannya yaitu Ha: mean != 14, Accept. Perhatikan nilai P(|T| > |t|) nya = 0.0037 < 0.05 sehingga ini significant, juga

Contoh Soal t-test dan z-test

Image
Uji t-test dan z-test pada dasarnya adalah uji Hipotesis. Biasanya uji t-test dilakukan pada sample yang terbatas, kurang dari 30, sedangkan uji z-test dialkukan pada sample lebih dari 30. Apa beda uji t-test dengan z-test? Dari Stata kita jadi tahu bahwa z-test hanya digunakan jika variance atau standard deviasi dari populasi diketahui.  Jika kita menggunakann z-test maka asumsinya Standar Deviasi populasi sudah diketahui. Jadi jika ada sample walau jumlahnya kecil akan tetapi 𝞼 diketahui, maka kita sebaiknya menggunakan z-test. Akan tetapi kita juga tahu dari Central Teorm Limit, bahwa jika n > 30, maka kurva z dan kurva t akan berhimpit (nyaris sama). Sehingga jika n > 30, kita tetap bisa pakai z-test walau 𝞼 tidak diketahui. 𝞼 akan hampir sama nilainya dengan standard deviasi sample s . Contoh Uji z-test Sebuah mesin menghasilkan minuman sebanyak 80 ml per botol (𝛍 populasi ). Seorang karyawan (peneliti) yakin bahwa mesin tersebut tidak menghasilkan sebanyak 80 ml per bo

Confident Interval Tips & Trick

Image
Update 29 Nov 2020: Tips & Trick dibawah ini hanya berlaku untuk 2 tailed test. Sedangkan untuk 1 tailed test, baca artikel ini . Confidence Interval dapat digunakan untuk menentukan apakah H0 ditolak atau diterima. Kita tidak perlu ingat rumus seperti yang dibahas pada artikel t-test . Kita cukup melihat apakah value dari H0 masuk dalam range interval atau tidak. Jika masuk, maka H0 diterima. Sebagai contoh kita gunakan Buku Praktikum Analysis Statistik, karya Bpk. Surya Darma, edisi 2020. 1. Uji Proporsi  Perhatikan halam 29. Asumsi H0 yaitu proporsi latar belakang (variable Latar) menggunakan handphone, sebagai "hadiah" atau dengan cara "membeli", diasumsikan sama, alias 50:50, alias .05. Di gambar terlihat: H0:p = 0.5 ---> check apakah 0.5 masuk dalam rentang interval? Ternyata tidak masuk --> H0 ditolak. 2. Uji Beda Rata-rata (mean)  Perhatikan gambar halaman 31. Terlihat  H0: mean = 3 diluar range --> H0 ditolak. Lalu rata-rata menggunakan HP bera

Sejarah t test

Image
Uji t test adalah sebuah metode untuk menguji hipotesis apakah H0 dapat diterima atau ditolak.  Sejarah T-TEST Pada tahun 1908, William Sealy Gosset menerbitkan penelitian tentang sebuah cara untuk menentukan apakah dua kelompok berbeda rata-rata (mean) nya satu sama lain secara significan atau tidak. Penelitaannya dilakukan di sebuah ladang barley. Dia mengambil sampel dari ladang barley 1 sebanyak n1 sample, dan dari ladang barley 2 sebanyak n2 sample. Dia pun menghitung yield per sample tsb. Barley ini nanti akan digunakan untuk bahan pembuatan bir. Dari sample-sample di kedua ladang tsb dia bisa dapatkan rata rata untuk ladang 1 (X1-bar) dan rata-rata yield ladang 2 (X2-bar). Nah, dari gambar terlihat kurva normal X1 (warna merah) dan kurva normal X2 (warna biru). Sedangkan rata-rata itu vertical putus-putus. Nah, perhatikan. Sudah jelas-jelas mean yield X2 lebih dikanan, artinya lebih besar. Lalu buat apa dibandingkan? Wait... tunggu dulu.... Ingat bahwa X2 itu memang lebih tinggi

Problem Colliniearity dalam Regresi

Image
Dalam kalkulasi estimasi, seperti uji regresi kadang ditemukan satu atau beberapa variable independent di ommit oleh Stata. Variable yang diommit ini tidak dilibatkan dalam perhitungan. Salah satu penyebabya adalah collinearity. Apa itu collinearity? Collinearity terjadi saat satu atau beberapa variable independent berkaitan erat dengan variable indendent lainnya. Collinearity ini menyebabkan model regresi menjadi bermasalah. Contoh: Nilai raport siswa ditentukan oleh uang saku, dan biaya transport. Yang logis adalah semakin tinggi uang saku maka semakin tinggi nilai raport siswa. Dan semakin tinggi biaya transport semakin rendah nilai raport siswa.  Logis kan. Tabel berikut ini saya buat secara imaginer. Nilai (rentang 0 - 100), biayatransport dalam Rupiah x 1000, dan uangsaku dalam Rupiah x 1000. Persamaan regresi: nilai = 23.18457 + 0.7823691.uangsaku - 0.8115702.biayatransport Terlihat bahwa: R-squared 83% cukup tinggi, dan Prob 0.0018 (significant). Disamping itu variable independ

Regresi Categorical dengan Dummy Variable

Image
Artikel ini terjemahan dari: https://stats.idre.ucla.edu/spss/faq/coding-systems-for-categorical-variables-in-regression-analysis-2/ File latihannya download hsb2.xls   Ringkasan dari artikel tsb: 1. Categorical Variable tidak bisa dimasukkan langsung dalam uji regresi. Uji regresi hanya bisa dilakukan pada variable numerical (continues) maupun variable dichotomous (spt Gender) . Variable selain itu (spt variable nominal atau ordinal), tidak bisa dilakukan uji regresi. 2. Agar bisa dilakukan uji regresi maka variable Categorical tsb di recode menjadi variable lain. Ada beberapa teknik recode: 1. Dummy Coding 2. Simple Coding 3. Deviation Coding 4. Difference Coding 5. Helmert Coding 6. Orthogonal Polynomial Coding 7. Repeated Coding 8. Special User-Defined Coding Teknik yang mana yang cocok digunakan tergantung type variable nya, apakah Ordinal atau Nominal. Ini akan dibahas nanti dengan contoh. Perlu diingat bahwa saat membuat variable baru, jumlah variable yang dibuat adala

Teknik Coding Dummy Variables

Sebagaimana telah dibahas pada pembahasan sebelumnya, Dummy Variables digunakan semata karena regresi hanya bisa bekerja dengan data numerical. Apabila ingin melakukan regresi pada data categorical (baik nominal, ataupun ordinal) maka satu variable di pecah ke beberapa variable dummy-nya. Berikut adalah terjemahan ringkas dari artikel "CODING SYSTEMS FOR CATEGORICAL VARIABLES IN REGRESSION ANALYSIS"  https://stats.idre.ucla.edu/spss/faq/coding-systems-for-categorical-variables-in-regression-analysis-2/ Untuk data-latihan bisa download hsb2.xls Problem Regresi Pada Categorical Variable Categorical variable membutuhkan perhatian khusus saat melakukan analisa regresi karena, tidak spt variable dichotomous atau variable continous (yang bisa langsung diterapkan analisa regresi), maka variable catogorical tidak bisa langsung dimasukkan dalam analisa regresi. Variable ini perlu di recode dulu menjadi variable baru yang bisa dimasukkan dalam analisa regresi. Ada banyak metode untuk m

Multiple Regresi Dummy Variable

Image
Adakalanya kita mendapatkan satu variable yang bersifat categorical nominal seperti - Gender: Male, Female; atau ordinal seperti lulusan: SD, SMP, SMA, Univ. Kita tahu bahwa regresi hanya bisa dilakukan pada variable numerical (interval, atau ratio) baik angkanya discreet atau continues. Jika kita tetap ingin menguji variable categorical tsb kedalam persamaan regresi, apa trik nya? Caranya buat Dummy Variable. Sebagai contoh: Level Pendidikan (edulevel) 1=very low (VL) 2=somewhat low (SL) 3=somewhat high (SH) 4=very high (VH) Nah kita bisa bikin 4 Dummy variable baru. Nanum, karena dummy variable hanya berisi 0 dan 1, maka jumlah variable yang akan dimasukkan dalam persamaan regresi hanya 3 saja. Education level    VL  SL  SH 1    1    0   0 2                  0    1   0 3       0    0   1 4    0    0   0 (VH as baseline) Dalam hal diatas, maka yang menjadi refensi adalah VH (tidak dimasukkan dalam persamaan regresi). Kenapa begitu? Anggap persamaan regresi: y = a.VL + b.SL +