research

Analisis Topic Modeling Journal ArXiv Menggunakan Metode K-Means dengan Algoritma Dimensionality Reduction dan t-SNE Model

Abstract

Sinergi antara Cluster K-means dan Principal Component Analysis (PCA) dalam pemodelan topik menghadirkan pendekatan yang ampuh untuk menyaring pola dari data tekstual. Cluster K-means, sebuah teknik pembelajaran tanpa pengawasan, unggul dalam mengelompokkan titik data yang serupa, menjadikannya penting dalam mengelompokkan konten tekstual ke dalam topik yang koheren. Proses ini memungkinkan ekstraksi tema atau subjek mendasar dalam kumpulan data yang luas. PCA berfungsi sebagai metode reduksi dimensi, mengungkap pola-pola penting dengan mengurangi kompleksitas data berdimensi tinggi. Ketika diterapkan pada pemodelan topik, PCA membantu mengidentifikasi fitur atau dimensi yang paling berpengaruh dalam kumpulan data tekstual, meningkatkan kemampuan interpretasi dan memfasilitasi analisis yang mendalam. Integrasi Cluster K-means dan PCA menawarkan kerangka kerja yang kuat untuk pemodelan topik yang efisien. Dengan menggunakan K-means untuk mengkategorikan data teks ke dalam kelompok yang mewakili topik berbeda dan selanjutnya memanfaatkan PCA untuk reduksi dimensi, metodologi gabungan ini memberdayakan peneliti untuk mengungkap dan memahami tema laten secara efektif. Kesimpulannya, penggabungan Cluster K-means dengan PCA mewakili jalan yang menjanjikan bagi para peneliti untuk mencari wawasan berbeda dari kumpulan data tekstual. Pendekatan terpadu ini memfasilitasi ekstraksi topik yang komprehensif, membantu penemuan pengetahuan dan proses pengambilan keputusan di berbagai domain. Penelitian kali ini menunjukan antara metode Kmeans dengan menggunakan algoritma pereduksi dimensi PCA memberikan hasil yang sangat memuaskan dengan mengkombinasi visualisasi antara algortma t-SNE dan UMAP

    Similar works