10 research outputs found

    Application of Numerical Measure Variations in K-Means Clustering for Grouping Data

    Get PDF
    The K-Means Clustering algorithm is commonly used by researchers in grouping data. The main problem in this study was that it has yet to be discovered how optimal the grouping with variations in distance calculations is in K-Means Clustering. The purpose of this research was to compare distance calculation methods with K-Means such as Euclidean Distance, Canberra Distance, Chebychev Distance, Cosine Similarity, Dynamic TimeWarping Distance, Jaccard Similarity, and Manhattan Distance to find out how optimal the distance calculation is in the K-Means method. The best distancecalculation was determined from the smallest Davies Bouldin Index value. This research aimed to find optimal clusters using the K-Means Clustering algorithm with seven distance calculations based on types of numerical measures. This research method compared distance calculation methods in the K-Means algorithm, such as Euclidean Distance,  Canberra Distance, Chebychev Distance, Cosine Smilirity, Dynamic Time Warping Distance, Jaccard Smilirity and Manhattan Distance to find out how optimal the distance calculation is in the K-Means method. Determining the best distance calculation can be seen from the smallest Davies Bouldin Index value. The data used in this study was on cosmetic sales at Devi Cosmetics, consisting of cosmetics sales from January to April 2022 with 56 product items. The result of this study was a comparison of numerical measures in the K-Means Clustering algorithm. The optimal cluster was calculating the Euclidean distance with a total of 9 clusters with a DBI value of 0.224. In comparison, the best average DBI value was the calculation of the Euclidean Distance with an average DBI value of 0.265

    Identifikasi Motif Time Series Data Mining dengan Euclid

    Get PDF
    The development of information technology that is supported by storage media technology has brought about major changes to the availability of data warehouses. The availability of data warehouses is often overlooked because of the inability to process the data so that data stacks are often regarded as garbage, which should be used as decision support, one form of data warehouse that is often encountered today is time series. Therefore it is necessary to develop a method to improve the motive discovery of time series data mining. The method used is discretion so that it produces time series sub sequences, which are then clustered. The distance used is the euclid distance. The results obtained are the finding of motives in time series based on time that can be used as decision support and predictions in the future

    Korelasi Faktor Penyebab Tindak Kekerasan dalam Rumah Tangga Menggunakan Data Mining Algoritma A Priori

    Get PDF
    Badan Keluarga Berencana dan Pemberdayaan Perempuan Kabupaten Langkat Sumatera Utara merupakan suatu instansi pemerintahan yang bertanggung jawab melayani masyarakat kabupaten Langkat dalam kasus kekerasan dalam rumah tangga(KDRT). Kekerasan dalam rumah tangga sudah termasuk masalah yang umum terjadi dalam kehidupan rumah tangga. Hal ini dikarenakan kurang harmonisnya hubungan dalam rumah tangga tersebut. Semakin banyaknya masyarakat yang melakukan tindakan kekerasan, maka perlu mencari solusi dan sebuah pengetahuan baru untuk mengatasi permasalahan ini dengan korelasi faktor penyebab tindak kekerasan dalam rumah tangga menggunakan algoritma a priori untuk menghasilkan kombinasi terdekat antar variabel. Teknik yang digunakan dalam aplikasi data mining ini adalah aturan asosiasi dengan algoritma a priori. Algoritma apriori ini melakukan proses iterasi untuk menghasilkan kombinasi item yang memiliki pola frekuensi tinggi, berdasarkan nilai ambang batas support dan confidence yang diberikan oleh user. Teknik ini menganalisis kombinasi faktor penyebab terjadinya tindak kekerasan dalam rumah tangga yang sering dialami korban berdasarkan pada data korban berjumlah 307 data kekerasan dalam rumah tangga. Melalui data tindak kekerasan dalam rumah tangga yang berjumlah 307 data, telah diperoleh hasil sebanyak 74 rule. Dan dari 74 rule yang terbentuk, telah ditemukannya rule terbaik dengan keterangan yaitu, seorang ibu rumah tangga cenderung mengalami jenis kekerasan berupa kekerasan fisik yang disebabkan oleh faktor ekonomi, support 20% dan confidence 76%.  Kata Kunci: Korelasi Faktor Penyebab Kekerasan Dalam Rumah Tangga, Algoritma A Priori


    Get PDF
    One of the problems in higher education is the mistake of prospective students in majors selection. This is caused by not paying attention to the suitability of the major in the original school with the chosen major in higher education so that it impacts not only non optimal processing and learning outcomes, such as the low GPA, but also on social life, such as increasing unemployment. The selection of the right major is very important and to help prospective students in choosing it requires an online system that can be accessed by everyone and select original school majors to see conformity with majors in higher education. This system uses association rules and parameters of support and confidence in data mining. The purpose of this research is to determine the correlation between majors in the original school, majors in higher education and the achievement of the GPA through the use of support and confidence parameters that process the knowledge base in the form of an alumni database on the online system created. Training or testing was conducted on 10,254 data in the database and produced new information and knowledge that between the majors of the original school, the choice of majors in higher education and GPA had a strong correlation with the value of confidence reaching 100%

    Clustering Tindak Kekerasan Pada Anak Menggunakan Algoritma K-Means Dengan Perbandingan Jarak Kedekatan Manhattan City Dan Euclidean

    No full text
    ABSTRAK Kekerasan terhadap anak dari tahun ketahun semakin meningkat dan menjadi perhatian di kalangan masyarakat. Hasil pemantauan Komisi Perlindungan Anak Indonesia (KPAI) terhadap kekerasan pada anak dari tahun 2011 sampai 2014, terjadi peningkatan yang signifikan. Tahun 2011 terjadi 2178 kasus kekerasan, tahun 2012 ada 3512 kasus, tahun 2013 ada 4311 kasus dan tahun 2014 ada 5066 kasus kekerasan pada anak. Metode yang digunakan untuk mengclusterkan tindak kekerasan pada anak adalah algoritma k-means menggunakan 2 jarak kedekatan yakni Manhattan City dan Euclidean dengan jumlah data 280 kejadian yang diperoleh dari POLRES BINJAI bekerja sama dengan Badan KBPP Kab.Langkat dengan variable usia korban, jenis kekerasan dan faktor penyebab. Hasil cluster menunjukkan dengan jarak kedekatan Manhattan City bahwa korban kekerasan anak cenderung terjadi pada remaja dengan jenis kekerasan psikis dan pelecehan seksual karena faktor ekonomi dan kesempatan, sedangkan dengan jarak kedekatan Euclidean bahwa korban kekerasan anak cenderung terjadi pada anak-anak dengan usia 5 sampai 12 tahun mengalami kekerasan seksual karena faktor ekonomi

    Konsep data mining dalam implementasi

    No full text
    Buku ini ditulis bagi pembaca pemula yang tertarik dengan Data Mining dalam bentuk konsep dan teori tentang data mining beserta teknik dan algoritma yang mendukung penerapannya dalam berbagai kasus.x, 172 hlm.: 21 c

    Perbandingan Hasil Penggunaan Metode Wp Dan Topsis Pada Sistem Pendukung Keputusan Pemilihan Lokasi Lahan Tambak Paling Terbaik Untuk Dijadikan Usaha Tambak Air Payau

    Full text link
    The number of methods available to the decision support system, so sometimes confused to choose which one matches the use of the method according to the case of a decision support system. For that made a comparison of the case of a decision support system of pond site selection to be the best business brackish water ponds for the comparison of the decision. The method used is weighted product (WP) and TOPSIS by determining the number of criteria, the type of criteria (Cost and Benefits), with three alternatives. Results of the study is the result of manual calculation equal to the calculations in thesystem. Each of the calculation of the WP and TOPSIS methods show that the results in the selection of the best locations embankment land to be used as business brackish water ponds each method has different outcomes depending

    Clustering Tindak Kekerasan pada Anak Menggunakan Algoritma K-Means dengan Perbandingan Jarak Kedekatan Manhattan City dan Euclidean

    Full text link
    Kekerasan terhadap anak dari tahun ketahun semakin meningkat dan menjadi perhatian di kalangan masyarakat. Hasil pemantauan Komisi Perlindungan Anak Indonesia (KPAI) terhadap kekerasan pada anak dari tahun 2011 sampai 2014, terjadi peningkatan yang signifikan. Tahun 2011 terjadi 2178 kasus kekerasan, tahun 2012 ada 3512 kasus, tahun 2013 ada 4311 kasus dan tahun 2014 ada 5066 kasus kekerasan pada anak. Metode yang digunakan untuk mengclusterkan tindak kekerasan pada anak adalah algoritma k-means menggunakan 2 jarak kedekatan yakni Manhattan City dan Euclidean dengan jumlah data 280 kejadian yang diperoleh dari POLRES BINJAI bekerja sama dengan Badan KBPP Kab.Langkat dengan variable usia korban, jenis kekerasan dan faktor penyebab. Hasil cluster menunjukkan dengan jarak kedekatan Manhattan City bahwa korban kekerasan anak cenderung terjadi pada remaja dengan jenis kekerasan psikis dan pelecehan seksual karena faktor ekonomi dan kesempatan, sedangkan dengan jarak kedekatan Euclidean bahwa korban kekerasan anak cenderung terjadi pada anak-anak dengan usia 5 sampai 12 tahun mengalami kekerasan seksual karena faktor ekonomi