Multiple Regresi - Case Resto Hamburger

Berikut ini case study dari buku Basic Procedure for Multiple Regression Model Building. Applied Regression Analysis for Business.

Diceritakan bahwa, seorang pemilik restoran hamburger melihat terjadi ketidak-stabilan gross-margin dari usahanya. Ketidak stabilan ini akan berdampak meningkatnya resiko bisnis karena ketidak-pastian keuntungan. Dia kemudian menyewa ahli statistik dan keuangan untuk menganalisa laporan keuangan quarterly sejak 2008 sd 2012 (5 tahun) dan meminta ahli tsb memberikan saran-saran perbaikan.

Detail do-file dan file excel laporan keuangannya bisa di download disini.

Tulisan ini akan dibagi dalam beberapa bagian.

Mari kita mulai.

Awalnya...

Ahli statistik dan keuangan berdiskusi dengan management pusat restoran. Didapatkan indikasi awal bahwa grosmargin dipengaruhi: COGS yang tidak stabil. COGSt, di definisikan COGS pada quarter ke t. Dalam 5 tahun berarti total ada 20 quarter.

Setelah dianalisis lebih lanjut COGSt ini dipengaruhi oleh harga Raw material (daging) - PRMt (Price of Raw Material). Selain itu ada direct cost berupa gaji karwayan produksi, yang tergambar dari jumlah karyawan produksi. Karyawan yang tidak terlibat langsung dalam produksi, bukan bagian dari COGS. Akan tetapi dalam model ini dimasukkan. Sehingga akan dikaji juga efek jumlah karyawan NOEt (Number of Employee).

Perusahaan juga tiap tahun ekspansi menambah jumlah outlet (point of Sales), yang diduga ini berkontribusi juga terhadap ketidak-stabilan COGS, NPOSt (NewPoint of Sales), dan juga ingin dilihat relasi total point of sales terhadap COGS, POSt (Point of Sales).

Disamping itu perusahaan selain menjual hamburger, juga menjual makanan kecil dan minuman sebagai pelengkap. Margin yang ditetapkan terhadap makanan atau minuman pelengkap ini lebih kecil dari margin hamburger. Sehingga di tengarai juga, jika terlalu banyak menjual makanan minuman sampingan akan menurunkan laba (karena COGS naik). Dengan demikian ingin dilihat juga relasi antara rasio penjualan hamburger terhadap total penjualan, SOHt (Sales of Hamburger), dilihat pengaruhnya terhadap COGSt.

Data awal yang didapat sbb...


Berdasarkan file diatas, maka dilakukan analisisnya.

Do file bisa di download di link diatas (pasword: ibnu123).

Struktur do file:

Preprocess:

1. Set up direktori

2. Set up log file

Main Process

3. Import data excel

4. Penulisan Label untuk semua variable

5. Regressi 

Output

6. Format output ke file doc, menggunakan command outreg

Closing

7. Save data 

Setelah membuat Do file tersebut, maka tinggal dijalankan dan analisis hasilnya.

Lanjut ya...

Pertama-tama kita ingin melihat benar gak sih terjadi ketidak-stabilan gross margin. Setelah didapat Sales per quarter kita tabulasi.


Agak sukar melihat data jika dalam bentuk tabel. Kita bikinkan grafiknya.



Terlihat benar bahwa % margin terhadap sales bumpy (kadang naik, kadang turun). Ini membahayakan bagi perusahaan. Apalagi 4 quarter terakhir rata-rata Margin/Sales turun (garis warna merah).

Diguga karena faktor utama karena harga raw material yang tidak stabil. Grafik membenarkan hal ini.


Lanjut...

Setelah data didapat diasumsikan model COGS sbb:

COGSt = cons + a1.NSt + a2.PRMt + a3.APOSt + a4.NPOSt + a5.NOEt + a6.SOHt + error

Dari persamaan diatas terlihat independent variablenya ada 6.

Apakah ke 6 variable tsb bisa diserderhakan? Seharusnya bisa. Nanti akan dilakukan penyisiran variable mana yang layak di elimiasi dari model dengan dua teknik:

o General to Specific

o Specific to General

Tapi sebelmnya kita tanya dulu: apakah data-data bersih? Apakah ada outlier?


Cek outlier

Pertama kita cek 2 sigma (2 x Standar Deviasi) dan 3 sigma (3 x Standar Deviasi).


Terlihat bahwa jika menggunakan 2 sigma ada 2 Variable yang diluar "band 2 sigma". Dan jika menggunakan 3 sigma, maka tidak ada variable yang value observasinya diluar "band 3 sigma".

Secara umum 3 sigma mencover 99% sample observasi, dan tidak ada yang melanggar band 3 sigma tsb, maka menggunakan metode 3 sigma ini, kesimpulan sementara tidak ada outlier.

Analisa outlier berdasarkan Fitted Values dan Residual

Jika dilakukan regresi, maka didapat slope dan intercept sbb:



Jika digambarkan dalam Actual Values vs Calculated Value (Fitted Value) juga tidak terlalu jauh sebarannya.



Akan tetapi jika dianalisis dari Residualnya (COGSt - Actual), terlihat dua data yang jauh dari rata-rata.





Terlihat ada dua data yang akan melonjak yaitu 4q2010 dan 2q2011, ini berpotensi variable jadi outlier.

Untuk "menetralisir" kita coba masukkan 2 dummy variable:

IVq2010 : 1 jika pada baris data 4q2011 dan 0 pada baris lainnya

IIq2011: 1 jika pada baris data 2q2011 dan 0 pada baris lainnya.

Pada Stata commandnya sbb:

gen IVq2010 = 1 if Quarter == "4q2010"

replace IVq2010 = 0 if Quarter != "4q2010" 

gen IIq2011 = 1 if Quarter == "2q2011"

replace IIq2011 = 0 if Quarter != "2q2011"

Jika dilakukan proses regresi dan dilakukan pemeriksaan residual (dengan menghitung ulang hasil rumus COGSt, dengan koefisien regressi untuk semua Independent Variable (8 variable), maka akan terlihat perbaikan. 

Secara summary regressinya pun terlihat ada perhaikan dari indikator R-square total.


Terlihat nilai Adjusted R-square meningkat, F meningkat, dan Root MSE menurun. Ini menunjukkan dummy variable memberikan efek perbaikan pada model.

Sekarang lanjut ke Selection Exploratory Variables...

Dari 8 variable tersebut mana variabel yang benar-benar berkontribusi pada COGSt?

Ada dua cara, yaitu menggunakan General to Specific dan Specific to General.

General to Specific

Proses di Statanya dimulai dari regresi semua variable, lalu dikurangi satu-satu. Comandnya sbb:


hasilnya file case-resto1.doc, sbb:


Terlihat kombinasi yang menghasilkan t statistic significant (p < 0.01) adalah yang di bintang 3. Didapat kombinasi ke 6, yang berisi semua variable yang significant.

Sehingga disimpulkan variable yang berpengaru NSt, PRMt, dan NPOSt.


Sehingga persamaan regressinya sbb:


Finally, interpretasi...

1. Intercerpt -5.350 ribu dollar. Artinya jika tidak ada penjualan NSt = 0, biaya raw material gratis PRMt = 0 (karena tidak jualan), dan tidak ada penambahan outlet baru (NPOSt = 0), maka COGS akan -5 juta dollar. Jika Sales 0, maka margin positif 5 juta dollar. Ini aneh, tidak ada penjualan tapi ada gross margin. Jadi interpretasi perlu menggunakan logic juga.

Yang paling mungkin bahwa kita bisa memandang 5 juta dollar ini adalah Fix Cost. Dimana ada atau tidak ada penjualan, maka tetap keluar uang senilai 5 juta dollar. Management restoran harus bisa menekan biaya fix cost ini.

2. NSt (penjualan) meningkat, maka COGS meningkat. Setiap penambahan penjualan 1 dollar, maka COGS meningkat 0.56 dollar.

3. PRMt (harga raw material / daging) meningkatkan COGS. Setiap penambahan harga daging 1 dollar/pack, maka COGS akan meningkat 82 dollar. Ini perlu di nego ulang ke pabrikan daging.

4. NPOS berkontribusi negatif, cukup besar terhadap COGS. Artinya management perlu stop dulu pengembangan outlet baru. 


Comments