Masih tentang pengklasifikasian yang bermanfaat untuk memprediksi. Artikel ini membahas algoritma K -Mean yang juga memanfaatkan Euclidean Distance untuk mengklasifikasi->memprediksi. Sederhananya, apabila ada input objek baru algoritma k mean akan mengklasifikasikan objek baru tersebut (memakai euclidean distance) kemudian melakukan tindakan (yang sama dengan objek lain pada kluster yang sama) kepada objek baru tersebut. Contoh, misal kita terbiasa memakan pisang dulu sebelum makan, ketika di meja makan terdapat apel dan sepiring nasi otak kita akan menyuruh untuk memakan apel dulu sebelum makan nasi karena apel ‘dekat’ atau ‘se-kluster’ dengan pisang. K artinya membuat kluster sebanyak k. Mean artinya pengklasifikasian dihitung berdasarkan “rata-rata” jarak terdekat antara objek dengan centroid.
Centroid adalah objek yang dijadikan pusat bagi objek-objek sekelilingnya pada kluster yang sama.
Algoritma K-mean.
- Input : jumlah kluster (k) dan n objek
- Memilih sejumlah objek sebagai centroid awal.
- For setiap objek
cari terdekat. Bahasa matematikanya,
arg
D, distance.
~jarak paling minimal.
Kemudian masukan objek ke kulster j.
- For setiap kluster
cari centroid baru dengan rumus rata-rata aritmatika.
Lakukan proses di atas terus menerus hingga centroid tak lagi bergerak.
Contoh.
*bintang adalah centroid.
Berapa banyak komputasi yang dilakukan?
*d jarak (distance), c jumlah centroid, n jumlah objek.
Kenapa pada rumus di atas operatornya kali? silahkan baca dulu materi tentang “cara menghitung banyak kemungkinan”.
—————————-
Di kalkulus kita belajar tentang vektor. Vektor adalah sesuatu yang mempunyai besaran dan arah. Saat kita belajar ngoding, kita akan mengenal array satu dimensi. Nah, representasi geometri dari array satu dimensi adalah vektor.
Hubungannnya dengan algoritma k-mean adalah objek yang diklasifikasikan terkadang berupa vektor. Semisal, gambar. Gambar biasanya berupa array/matrix/vektor.
Belajar bukanlah perlombaan mencari ilmu pengetahuan, tapi perjalanan mencari kebenaran,~natisa
0
Baca Lagi Biar Pinter
- 80Masalah clustering, selanjutnya saya sebut pengklasifikasian, sebenarnya adalah masalah optimisasi. "Dan tahukah bahwa pengklasifikasian bisa untuk memprediksi? ". Sebelum kita bahas…
- 36Algoritma K-NN merupakan algoritma yang bisa melakukan prediksi. Cara yang digunakan sangat sederhana. Cukup menghitung jarak terdekat. Artinya, apabila ada…
- 35Tulisan ini disadur dari artikel : Applications of Calculus in Real life oleh : Waldo Otis via media : Medium Kita…
- 33
Leave a reply