k-Means vs k-Medoids, Kelemahan k-Medoids dan Solusinya: CLARA

Metode mana yang lebih handal antara k-means vs k-medoids

Metode k-medoids lebih handal dibanding dengan k-means ketika ada data noise dan pencilan karena k-medoids tidak terlalu dipengaruhi oleh data pencilan atau data ekstrem lainnya dibandingkan dengan k-means. Namun demikian, kompleksitas tiap-tiap iterasi dalam algoritma k-medoids secara komputasi adalah O(k(n-k)2). [Baca artikel sebelumnya tentang: Penjelasan k-Medoids, Algoritma, dan Contohnya]. Bila nilai n dan k sangat besar, komputasi ini mejadi sangat mahal (lama dan rumit), dan jauh lebih mahal dibanding dengan metode k-means. Kesamaan dari kedua metode tersebut adalah bahwa pengguna perlu menetapkan k atau jumlah clusternya. Berikut di bawah ini adalah tabel yang lebih menjelaskan tentang kajian perbandingan antara k-means vs k-medoids dalam beberapa aspek:
Perbandingan k-means vs k-medoids dalam beberapa aspek

Penjelasan k-Medoids, Algoritma, dan Contohnya

Pada artikel sebelumnya tentang kelemahan k-means dan contohnya (lihat pada artikel sebelumnya disini), algoritma k-means sangat sensitif terhadap pencilan (outliers) karena object-object pencilan sangat jauh berbeda dari object lain pada umumnya sehingga ketika dimasukkan ke dalam suatu cluster, object-object seperti itu mendistorsi nilai rerata (mean) dari cluster tersebut. Hal ini secara tak sengaja berpengaruh pada object-object lainnya. Contoh tentang kelemahan ini bisa dibaca lagi di artikel sebelumnya [Kelemahan k-means dan Contohnya].