Data Mining dan Big Data Dalam Dunia Industri

Muzakkir putera, Newton Newton, Helen Parkhurst, Muhammad Rezaldi, Sri Indah Lestari

Abstract


salah satu metode klastering yang paling populer dan banyak digunakan dalam analisis data tak berlabel. Metode ini bertujuan untuk membagi sekumpulan data ke dalam sejumlah klaster yang telah ditentukan sebelumnya, berdasarkan kedekatan data terhadap pusat klaster (centroid). Proses K-Means dimulai dengan menentukan jumlah klaster (k), kemudian memilih centroid awal secara acak. Setiap data kemudian diklasifikasikan ke klaster terdekat berdasarkan jarak Euclidean. Selanjutnya, centroid diperbarui berdasarkan rata-rata data dalam masing-masing klaster, dan proses ini diulang hingga pusat klaster tidak lagi berubah secara signifikan. Kelebihan metode ini adalah kesederhanaannya dan efisiensi komputasinya, namun K-Means juga memiliki keterbatasan seperti kepekaan terhadap pemilihan centroid awal dan ketidaksesuaian dalam menangani data non-linier atau berbentuk kompleks. Metode ini banyak diaplikasikan dalam segmentasi pasar, pengenalan pola, analisis citra, dan pengelompokan dokumen.

Full Text:

PDF


DOI: https://doi.org/10.35308/invasi.v3i1.12756

DOI (PDF): https://doi.org/10.35308/invasi.v3i1.12756.g6057

Refbacks

  • There are currently no refbacks.


Jurnal Industri dan Inovasi (INVASI)

Universitas Teuku Umar, Jalan Alue Peunyareng, Ujong Tanoh Darat, Meureubo, Aceh Barat, Aceh. Kode Pos 23615