Algoritma k-Means sangat sensitif terhadap pencilan (outliers) karena object-object seperti ini sangat jauh letaknya/karakteristiknya dari mayoritas data lainnya, dan dengan demikian bila dimasukkan ke suatu cluster, data semacam ini bisa mendistorsi nilai rerata cluster secara dramatis. Hal ini secara tak sengaja akan mengubah penetapan object-object lainnya ke cluster-cluster. Efek ini diperburuk lagi karena penggunaan fungsi error kuadrat, seperti bisa dilihat di contoh berikut. Contoh kelemahan k-Means. Misalkan ada enam titik dalam ruang 1-D (satu dimensi) yang nilai-nilainya adalah sebagai berikut: 1,2,3,8,9,10, dan 25. Secara intuitif, dengan melihat secara visual kita bisa membayangkan bahwa titik-titik tersebut dipartisi menjadi cluster {1,2,3} dan {8,9,10}. dimana titik 25 dikeluarkan karena terlihat sebagai suatu pencilan (outlier). Tetapi, bagaimanakah k-means akan mempartisi nilai-nilai tersebut? Jika kita menerapkan k-means dengan menggunakan k = 2 dan menggunakan p...
Belajar Gratis Seputar Sistem Informasi, Informatika, Bisnis, Akuntansi, & Manajemen