Posts

Sejarah t test

Image
Uji t test adalah sebuah metode untuk menguji hipotesis apakah H0 dapat diterima atau ditolak.  Sejarah T-TEST Pada tahun 1908, William Sealy Gosset menerbitkan penelitian tentang sebuah cara untuk menentukan apakah dua kelompok berbeda rata-rata (mean) nya satu sama lain secara significan atau tidak. Penelitaannya dilakukan di sebuah ladang barley. Dia mengambil sampel dari ladang barley 1 sebanyak n1 sample, dan dari ladang barley 2 sebanyak n2 sample. Dia pun menghitung yield per sample tsb. Barley ini nanti akan digunakan untuk bahan pembuatan bir. Dari sample-sample di kedua ladang tsb dia bisa dapatkan rata rata untuk ladang 1 (X1-bar) dan rata-rata yield ladang 2 (X2-bar). Nah, dari gambar terlihat kurva normal X1 (warna merah) dan kurva normal X2 (warna biru). Sedangkan rata-rata itu vertical putus-putus. Nah, perhatikan. Sudah jelas-jelas mean yield X2 lebih dikanan, artinya lebih besar. Lalu buat apa dibandingkan? Wait... tunggu dulu.... Ingat bahwa X2 itu memang lebih ti...

Problem Colliniearity dalam Regresi

Image
Dalam kalkulasi estimasi, seperti uji regresi kadang ditemukan satu atau beberapa variable independent di ommit oleh Stata. Variable yang diommit ini tidak dilibatkan dalam perhitungan. Salah satu penyebabya adalah collinearity. Apa itu collinearity? Collinearity terjadi saat satu atau beberapa variable independent berkaitan erat dengan variable indendent lainnya. Collinearity ini menyebabkan model regresi menjadi bermasalah. Contoh: Nilai raport siswa ditentukan oleh uang saku, dan biaya transport. Yang logis adalah semakin tinggi uang saku maka semakin tinggi nilai raport siswa. Dan semakin tinggi biaya transport semakin rendah nilai raport siswa.  Logis kan. Tabel berikut ini saya buat secara imaginer. Nilai (rentang 0 - 100), biayatransport dalam Rupiah x 1000, dan uangsaku dalam Rupiah x 1000. Persamaan regresi: nilai = 23.18457 + 0.7823691.uangsaku - 0.8115702.biayatransport Terlihat bahwa: R-squared 83% cukup tinggi, dan Prob 0.0018 (significant). Disamping itu variable...

Regresi Categorical dengan Dummy Variable

Image
Artikel ini terjemahan dari: https://stats.idre.ucla.edu/spss/faq/coding-systems-for-categorical-variables-in-regression-analysis-2/ File latihannya download hsb2.xls   Ringkasan dari artikel tsb: 1. Categorical Variable tidak bisa dimasukkan langsung dalam uji regresi. Uji regresi hanya bisa dilakukan pada variable numerical (continues) maupun variable dichotomous (spt Gender) . Variable selain itu (spt variable nominal atau ordinal), tidak bisa dilakukan uji regresi. 2. Agar bisa dilakukan uji regresi maka variable Categorical tsb di recode menjadi variable lain. Ada beberapa teknik recode: 1. Dummy Coding 2. Simple Coding 3. Deviation Coding 4. Difference Coding 5. Helmert Coding 6. Orthogonal Polynomial Coding 7. Repeated Coding 8. Special User-Defined Coding Teknik yang mana yang cocok digunakan tergantung type variable nya, apakah Ordinal atau Nominal. Ini akan dibahas nanti dengan contoh. Perlu diingat bahwa saat membuat variable baru, jumlah variable yang dibuat a...

Teknik Coding Dummy Variables

Sebagaimana telah dibahas pada pembahasan sebelumnya, Dummy Variables digunakan semata karena regresi hanya bisa bekerja dengan data numerical. Apabila ingin melakukan regresi pada data categorical (baik nominal, ataupun ordinal) maka satu variable di pecah ke beberapa variable dummy-nya. Berikut adalah terjemahan ringkas dari artikel "CODING SYSTEMS FOR CATEGORICAL VARIABLES IN REGRESSION ANALYSIS"  https://stats.idre.ucla.edu/spss/faq/coding-systems-for-categorical-variables-in-regression-analysis-2/ Untuk data-latihan bisa download hsb2.xls Problem Regresi Pada Categorical Variable Categorical variable membutuhkan perhatian khusus saat melakukan analisa regresi karena, tidak spt variable dichotomous atau variable continous (yang bisa langsung diterapkan analisa regresi), maka variable catogorical tidak bisa langsung dimasukkan dalam analisa regresi. Variable ini perlu di recode dulu menjadi variable baru yang bisa dimasukkan dalam analisa regresi. Ada banyak metode untuk m...

Multiple Regresi Dummy Variable

Image
Adakalanya kita mendapatkan satu variable yang bersifat categorical nominal seperti - Gender: Male, Female; atau ordinal seperti lulusan: SD, SMP, SMA, Univ. Kita tahu bahwa regresi hanya bisa dilakukan pada variable numerical (interval, atau ratio) baik angkanya discreet atau continues. Jika kita tetap ingin menguji variable categorical tsb kedalam persamaan regresi, apa trik nya? Caranya buat Dummy Variable. Sebagai contoh: Level Pendidikan (edulevel) 1=very low (VL) 2=somewhat low (SL) 3=somewhat high (SH) 4=very high (VH) Nah kita bisa bikin 4 Dummy variable baru. Nanum, karena dummy variable hanya berisi 0 dan 1, maka jumlah variable yang akan dimasukkan dalam persamaan regresi hanya 3 saja. Education level    VL  SL  SH 1    1    0   0 2                  0    1   0 3       0    0   1 4    0    0...

Distribusi Normal Z

Image
Distribusi normal jika distandarkan menjadi distribusi normal Z. Makna secara grafis dapat dilihat sbb: Jika suatu nilai hanya muncul dalam rentang -4 sd +4, maka probabilitas nilai tsb muncul adalah luas area di kirinya. Cara baca tabelnya: Probabilitas muncul nilai < -3.40 adalah 0.0003 (atau 0.03%) Probabilitas muncul nilai < -2.19 adalah 0.0143 (atau 1.43%) Contoh lain:      Probabilitas muncul nilai < 1.30 adalah 0.9032 (atau 90.32%) Probabilitas muncul nilai < 1.39 adalah 0.9177 (atau 91.77%) Membikin pakai excel cukup gunakan rumus NORMSDIST(z). Transformasi Distribusi Normal ke Distribusi Z Untuk setiap nilai x --> z     ( x - mean X )    (x -  𝛍)   z = -------------- =  -------       stdev X             𝛔 Atau jika digambarkan sbb: Misal contoh soal : Pada periode 2017, sebanyak 70% keluarga di California membeli teh dengan anggaran $36.16 per tahun. Menurut inf...

Multiple Regresi - Case Resto Hamburger

Image
Berikut ini case study dari buku  Basic Procedure for Multiple Regression Model Building. Applied Regression Analysis for Business . Diceritakan bahwa, seorang pemilik restoran hamburger melihat terjadi ketidak-stabilan gross-margin dari usahanya. Ketidak stabilan ini akan berdampak meningkatnya resiko bisnis karena ketidak-pastian keuntungan. Dia kemudian menyewa ahli statistik dan keuangan untuk menganalisa laporan keuangan quarterly sejak 2008 sd 2012 (5 tahun) dan meminta ahli tsb memberikan saran-saran perbaikan. Detail do-file dan file excel laporan keuangannya bisa di download disini . Tulisan ini akan dibagi dalam beberapa bagian. Mari kita mulai. Awalnya... Ahli statistik dan keuangan berdiskusi dengan management pusat restoran. Didapatkan indikasi awal bahwa grosmargin dipengaruhi: COGS yang tidak stabil. COGSt, di definisikan COGS pada quarter ke t. Dalam 5 tahun berarti total ada 20 quarter. Setelah dianalisis lebih lanjut COGSt ini dipengaruhi oleh harga Raw material (...