Data Mining dan Big Data Dalam Dunia Industri
Abstract
salah satu metode klastering yang paling populer dan banyak digunakan dalam analisis data tak berlabel. Metode ini bertujuan untuk membagi sekumpulan data ke dalam sejumlah klaster yang telah ditentukan sebelumnya, berdasarkan kedekatan data terhadap pusat klaster (centroid). Proses K-Means dimulai dengan menentukan jumlah klaster (k), kemudian memilih centroid awal secara acak. Setiap data kemudian diklasifikasikan ke klaster terdekat berdasarkan jarak Euclidean. Selanjutnya, centroid diperbarui berdasarkan rata-rata data dalam masing-masing klaster, dan proses ini diulang hingga pusat klaster tidak lagi berubah secara signifikan. Kelebihan metode ini adalah kesederhanaannya dan efisiensi komputasinya, namun K-Means juga memiliki keterbatasan seperti kepekaan terhadap pemilihan centroid awal dan ketidaksesuaian dalam menangani data non-linier atau berbentuk kompleks. Metode ini banyak diaplikasikan dalam segmentasi pasar, pengenalan pola, analisis citra, dan pengelompokan dokumen.
Full Text:
PDFDOI: https://doi.org/10.35308/invasi.v3i1.12756
DOI (PDF): https://doi.org/10.35308/invasi.v3i1.12756.g6057
Refbacks
- There are currently no refbacks.
Jurnal Industri dan Inovasi (INVASI)




