Exploratory Factor Analysis

Exploratory Factor Analysis (EFA), adalah teknik yang dilakukan untuk eksplorasi data, dalam rangka mencari kesamaan antara variable, dan membentuk variable baru (yang disebut variable laten, atau construct), dengan sesedikit mungkin menghindari terhadinya information loss. Ini "agak" mirip dengan kasus file JPEG, dimana file Bitmap di reduksi jadi file JPEG dengan minimum information loss.

EFA akan membuang variable yang tidak berkontribusi terhadap model.

Ambil contoh kasus berikut.

Dan gunakan steps spt di Buku Praktikum, atau dari youtube.

Berikut adalah variable yang mempengaruhi prestasi belajar.




Kita cari corelasi antar variable:


Korelasi dikatakan kuat kalau absolut nya > 0.5.
    Coefficient ValueStrength of Association
    0.1 < | r | < .3small correlation
    0.3 < | r | < .5medium/moderate correlation
    r | > .5large/strong correlation

Finansial - Lingkungan : -0.63

Jika diturukan korelasi absolut > 0.3 (medium correlation):

3.Fasilitas - 5.Finansial - 1.Lingkungan - 4.Organisasi
                             |
                  6.Karakter - 3.Fasilitas - 2.Motivasi

Terlihat bahwa:
- ada korelasi kuat antara Finansial dan Linkungan
- dan korelasi medium antara 6 variable tsb

Artinya: layak untuk dicoba factor analysis.

Step pertama: Ditentukan apakah sudah memenuhi sampling adequacy (kecukupan jumlah sampling). Gunakan KMO nya, dan buang variable yang dibawah nilai KMO.


Terlihat bahwa dengan eigen value > 1, maka Factor yang di-ambil hanya Factor1 dan Factor2, artinya 4 faktor layak dibuang. Dan jika Factor1 dan Factor2 diambil sudah mencakup 60.81% sample terwakili.

Tetapi sebelum dibuang, kita cek dulu apakah sample sudah adequate? 
Jika KMO > 0.5 sample is adequate.


Terlihat bahwa nilai KMO overall 0.5515 > 0.5, artinya jumlah sample sudah mencukupi secara overall. Akan tetapi secara individual, variable lingkungan KMO nya 0.4839 < 0.5. Ini berarti sample nya kurang. Solusinya: sample di tambah, atau variable lingkungan tidak di-ikutkan dalam analisis faktor.




Terlihat sekarang setiap variable KMO > 0.5, sehingga bisa lanjut ke step berikut.

Uji Bartlet

Optional: Uji Bartlet untuk memeriksa homogenitas variance antara satu variable dengan variable lain. Jika variance homogen maka bisa lanjut proses.

  • Null hypothesis: Variance ( σ2 ) is equal across all groups.

    H0: σ2i = σ2j for all groups

  • Alternative hypothesis: Variance is not equal across all groups.

    H1: σ2i ≠ σ2j for at least one pair of groups

When the P-Value is bigger than the significance level (0.05) maka Accept Ho.
 

Terlihat bahwa p-value Bartlett test = 0.722 > 0.05, maka Ho diterima, artinya terdapat kesamaan variance diantara variable-variable tsb. Sehingga, factor test bisa lanjut.

Step kedua: Pemeriksaan Korelasi Parsial


Anti image corelation pada sisi diagonal harus 1. Sedangkan Anti image covariance pada sisi diagonal harus > 0.5, dan pada covariance lain harus rendah.

Terlihat pemeriksaan korelasi parsial, memenuhi syarat diatas. Sehingga bisa dilanjutkan ke analisa loading path.

Step ketiga: Pemeriksaan Factor Loading Plot & Rotate Kaiser


Screeplot

. factor motivasi fasilitas organisasi finansial karakter, pcf mineigen(1)
. screeplot


Terlihat bahwa Eigenvalue diatas 1, ada 2 factor.

Loading Factor Plot

. factor motivasi fasilitas organisasi finansial karakter, pcf mineigen(1)

Jika matrix ini diplot:

. loadingplot

Terlihat bahwa
 
Factor 2 kuat dipengaruhi: Finansial dan Organisasi  
Factor 1 kuat dipengaruhi: Motivasi, Karakter (faktor internal)

. factor motivasi fasilitas organisasi finansial karakter, ml
.loadingplot



. rotate, kaiser


Jika diambil nilai yang terbesar, maka terlihat Factor1 berhubungan dengan motivasi, finansial, dan karakter. Artinya bisa diidentikkan dengan faktor internal. Sedangkan Factor2 behubungan dengan Fasilitas dan Organisasi. Artinya bisa diinentikkan dengan faktor eksternal.

Sehingga bisa dibentuk dua variable laten baru:
Faktor Internal
Faktor Ekstenal

. loadingplot



Case-2

Contoh berikut di adaptasi dari artikel ini. Datanya ini film.dta.

Jalankan factor test.

. factor forbiddenplanet thehangover meettheparents benhur gladiator galaxyquest darkcity, ml


Terlihat ada 3 factor yang eigenvalue > 1. Eigenvalue ini sama dengan Variance, spt pada kolom berikut ini.

.loadingplot



. rotate, kaiser

Variance untuk Factor1 2.15 > 1 berarti significant. Demikian juga untuk Factor2 1.95 dan Factor3 1.78 yang > 1 berarti significant. Jika Variance suatu factor < 1, maka Factor tsb kurang significant dan bisa dibuang.

. loadingplot




Dari setiap variable, kita cari nilai tertinggi. Terlihat bahwa Factor1 terdiri dari The Hangover, Meet The Parents, dan Galaxy Quest. Ini film type Comedy (latent variable).

Sedangkan Factor2 terdiri dari Forbiddent City dan Dark City ini type Science Fiction (latent varbable). Dan Factor3 terdiri dari Benhur dan Gladiator, ini type History.

Sehingga bisa disimpulkan terdapat 3 latent variable baru:
Comedy
Science Fiction
History

Case 3
to be continued

Comments