Register Now

Login

Lost Password

Lost your password? Please enter your email address. You will receive a link and will create a new password via email.

Send Message

Add post

Add question

Belajar PCA Principal Component Analysis

Jika kita mempunyai matriks yang besar, apakah kita bisa melihatnya sehingga nampak seperti berukuran kecil?

Bisa, caranya kita lihat mariks tersebut dengan sudut pandang yang lain.

Melihat dengan sudut pandang lain artinya kita tranformasi matriks tersebut sehingga setelah ditransformasi nampak seperti berukuran kecil.

Persamaannya,

T=X.W

dari persamaan di atas, matriks X (m baris dan n kolom) kita tranformasi oleh W sehingga akan terlihat menjadi matriks T .

Catatan: pemilihan ukuran kolom W tergantung pengambilan nilai eigen terbesar. Jika pengambilan nilai eigen terbesarnya 2, maka kolom W akan mempunyai 2 kolom.

Ingat, transformasi tidak merubah data matriks A, hanya melihatnya dengan sudut pandang lain.

Bagaimana mencari W?

Menurut metode PCA, W  merupakan matriks yang kolom-kolomnya merupakan vektor eigen yang telah disusun ulang sedemikian sehingga terurut oleh nilai eigennya, dari mulai yang terbesar hingga terkecil.

Kemudian diambil beberapa nilai eigen terbesar sehingga ukuran W menjadi beberapa kolom saja.

Apabila W hanya mempunyai 2 kolom, maka T hasil transformasinya akan mempunyai 2 dimensi (kolom yang pertama sebagai x dan kolom kedua sebagai y) yang bisa kita:

1. Visualisasi

2. Analisis

3. Interpretasi

Kenapa PCA pada literatur lain adalah eigen dekomposisi pada matriks kovariansnya?

Karena saat kita mempunyai matriks X dengan ukuran mxn, dan setiap kolom mempunyai range(max-min) yang berbeda, kita melakukan standarisasi dengan melakukan

z = \frac{\text{data tiap kolom-mean tiap kolom}}{\text{standar deviasi tiap kolom}}

dengan melakukan langkah di atas data tiap kolom akan mempunya mean=0 sehingga

X^{T}X= matriks kovarian X.

Setelah itu kita melakukan eigen dekomposisi untuk memperoleh nilai eigen dan vektor eigen dari X^{T}X atau matriks kovarian X.

Kenapa dinamai principal component analysis?

Karena kita mencari koordinat baru yang kita sebut principal component untuk merepresentasikan data.

Kenapa ditransformasi oleh matriks W yang berisi vektor eigen yang nilai eigennya besar saja?

Vektor eigen akan menjadi sumbu pada koordinat baru. Nilai eigen akan menjadi magnitude atau besaran arah dari vektor eigennya. Semakin besar nilai eigen semakin besar/panjang arah dari sumbunya maka diharapkan akan mencakup keseluruhan data (variasi data yang besar).

Bisa dijelaskan lagi apa yang dimaksud dengan PCA dengan visualisasi?

Misal kita mempunyai data seperti berikut

Sumber:georgemdallas.wordpress.com

Kita akan coba memvisualisasikan di atas di koordinat lain daripada menggunakan sb-x dan sb-y.

Yang mana koordinat baru ini diharapkan mempunyai variasi data yang besar sehingga mencakup/merepresentasikan datanya.

Misal kita membuat koordinat baru berupa garis hitam horizontal sembarang seperti berikut:

Sumber:georgemdallas.wordpress.com

Setelah data diproyeksikan ke koordinat garis hitam datanya terlihat lebih sedikit, karena ada dua segitiga setelah diproyeksikan hasilnya sama.

Maka, garis hitam vertikal ini tidak bagus untuk koordinat baru karena menghasilkan variasi data yang kecil.

Misal kita membuat garis hitam lagi

Sumber:georgemdallas.wordpress.com

Kali ini kita berhasil membuat koordinat yang variasinya besar setelah diproyeksi ke garis hitam.

Alih-alih mencari garis koordinat secara trial dan error, maka muncullah ide principal component analysis yang mana koordinatnya disebut principal component dan isinya berupa vektor eigen.

Kenapa koordinatnya vektor eigen?

Karena mencari vektor eigen cukup mudah. Ingat kembali persamaan nilai eigen.

Ax=\lambda x

Dari persamaan di atas, A  jika  ditransformasi oleh x akan sama dengan x dengan magnitude \lambda yang mana x adalah vektor eigen dan koordinat baru untuk merepresentasikan A.

Kenapa PCA digunakan untuk mereduksi dimensi?

Jika kita memilih 2 nilai eigen terbesar dan bisa membentuk W yang mempunya 2 kolom berupa vektor eigen, maka data X bisa kita tranformasi oleh W

T=X.W

sehingga diperoleh T yang ukurannya mempunyai 2 kolom.

X yang awalnya mempunyai ukuran m baris dan n kolom bisa kita lihat sebagai T yang mempunyai 2 kolom di koordinat W (di ruang W).

(under revision)

0

Baca Lagi Biar Pinter

  • 63
    [latexpage] Dapatkah suatu matriks sama dengan  suatu nilai? Tentu mustahil sama. Matriks mempunyai dimensi m x n ( m baris…
    Tags: matriks, nilai, eigen, dengan, kita, di, adalah, yang, vektor, $latex
  • 61
    Manfaat : Pengelompokan variabel Mencari variabel yang unggul atau dominan dari variabel lainnya Jadi, ketika kita mempunyai banyak variabel, bisa…
    Tags: akan, yang, eigen, dengan, kita, bisa, data, nilai, dan, adalah
  • 56
    Bagaimana jika kamu menyebarkan kuesioner tetapi yang mengisi kuesioner mengisi dengan acak? Untuk menghindari hal tersebut kita bisa mengeceknya dengan…
    Tags: yang, data, kita, dengan, di, matriks, adalah, dari, science, dan
  • 54
    Orang zaman dahulu mengamati langit, awan, angin dan rasi bintang. Hasil dari pengamatan dipakai untuk kehidupan sehari-hari. Kini, orang mengamati…
    Tags: data, dari, yang, adalah, dan, dengan, di, statistics, thinking, science
  • 54
    Sampel adalah bagian dari populasi.   Dalam menentukan besaran sampel yang harus diambil harus dipertimbangkan Ukuran populasi Keragaman populasi
    Tags: yang, dari, adalah, statistics, thinking, data, science

About Riad Taufik Lazwardiexcellent

Lecturer of Mathematics at 1. Bina Tunas Bangsa (now) 2. Fitrah Islamic World Academic School (2019-2020) 3. Kalbis Institute | Managed by Binus (2018-2019) 4. Telkom University (2017-2018) 5. UIN Bandung (2015-2018)

Follow Me

Leave a reply