63 research outputs found

    Analisis Ensemble Support Vector Machine dan Survival Support Vector Machine pada Data Nasabah Gadai di Perusahaan Financial Technology-X

    Get PDF
    Terdapat dua kategori nasabah gadai pada perusahaan Fintech X yakni nasabah early payment dan late payment. Setiap kategori nasabah terdapat durasi pelunasan barang tanggungan. Oleh sebab itu penting bagi perusahaan untuk mendapat informasi awal terkait kondisi nasabah apakah baik atau buruk. Nasabah yang baik adalah nasabah yang semakin cepat dalam melunasi tanggungan sedangkan nasabah yang buruk merupakan nasabah yang semakin lama melunasi tanggungan. Untuk mengatasi problem tersebut terdapat dua tahap permodelan yang dilakukan. Tahap pertama adalah klasifikasi nasabah yang early payment atau late payment. Tahap kedua menganalisis survival untuk masing-masing kategori nasabah. Adapun metode yang digunakan pada tahap pertama yakni Regresi Logistik Biner, SVM dan Ensemble SVM. Sedangkan pada tahap kedua adalah Cox Proportional Hazard dan survival SVM. Untuk mendukung kesimpulan pada tahap klasifikasi, dilakukan studi simulasi dengan membangkitan beberapa skenario variabel prediktor. Hasil studi simulasi diperoleh bahwa Ensemble SVM mampu mengimbangi kinerja SVM dan regresi logistik. Akan tetapi ketika diaplikasikan pada data nasabah Fintech X, peforma metode klasifikasi yang diajukan tidak memberikan hasil yang baik. Hal tersebut disebabkan tidak adanya variabel yang benar-benar dapat mendiskriminasi kategori nasabah early payment maupun late payment. Pada tahap berikutnya, survival SVM memiliki peforma yang baik dibandingkan Cox Proportional Hazard. Survival SVM unggul pada setiap kategori nasabah. Salah satu kemungkinan survival SVM unggul karena asumsi dari Cox Proportional Hazard tidak terpenuhi. ====================================================================================================== There are two categories of pawning customers in Fintech X companies, namely early payment and late payment customers. Each category of customer there is the duration of repayment of dependent goods. Therefore it is important for the company to get initial information related to the condition of the customer whether good or bad. A good customer is a customer who is getting faster in paying off the dependents while a bad customer is a customer who is paying off the dependent longer. To overcome the problem there are two stages of modeling. The first stage is the classification of customers who are early payment or late payment. The second phase analyzes survival for each customer category. The method used in the first stage of Binary Logistic Regression, SVM and Ensemble SVM. While in the second stage is Cox Proportional Hazard and SVM survival. To support the conclusions at the classification stage, a simulation study was conducted by generating some predictor variable scenarios. The results of the simulation study found that Ensemble SVM is able to compensate for SVM performance and logistic regression. However, when applied to customer data Fintech X, the performance of the proposed classification method does not give good results. This is due to the absence of variables that can really discriminate the category of early payment customers and late payment. In the next stage, SVM survival has a better performance than Cox Proportional Hazard. SVM Survival excels in every customer category. One possible survival of SVM better because the assumption of Cox Proportional Hazard is not met

    Prediksi awal waktu shalat berdasarkan titik belok kecerahan langit menggunakan metode Support Vector Regression dan Restricted Cubic Spline

    Get PDF
    Penelitian mengenai kecerahan langit merupakan salah satu faktor yang penting untuk observasi astronomi, karena setiap perubahan waktu ditandai dengan perubahan kondisi langit. Data kecerahan langit yang digunakan diperoleh dari alat SQM di LAPAN BPAA Pasuruan yang akan digunakan untuk mengetahui ketepatan awal waktu Shalat Shubuh dan Shalat Isya. Pada penelitian ini dilakukan 3 tahap untuk memprediksi awal waktu Shalat, yaitu tahap prediksi menggunakan Support Vector Regression, tahap pembentukan model persamaan garis regresi menggunakan Restricted Cubic Spline, dan yang terakhir tahap penentuan titik belok kecerahan langit. Prediksi data kecerahan langit untuk penentuan titik belok awal waktu Shalat Isya menggunakan metode Support Vector Regression mendapatkan nilai akurasi RMSE sebesar 0,05146 dan MAPE sebesar 0,23%, sedangkan pada data kecerahan langit untuk menentuan titik belok awal waktu Shalat Shubuh mendapatkan nilai akurasi RMSE sebesar 0,26974 dan MAPE sebesar 2,28%. Pembentukan model persamaan garis regresi menggunakan Restricted Cubic Spline pada data kecerahan langit untuk penentuan titik belok awal waktu Shalat Isya mendapatkan nilai akurasi RMSE sebesar 0,0349 dan R2 sebesar 0,9482, sedangkan pada data kecerahan langit untuk penentuan titik belok awal waktu Shalat Shubuh mendapatkan nilai akurasi RMSE sebesar 0,0747 dan R2 sebesar 0,9120. Kemudian didapatkan nilai titik belok awal waktu Shalat Isya pada 4-8 Oktober sebesar 72,81 atau awal waktu Shalat Isya dimulai pukul 18.33 WIB. Sedangkan nilai titik belok awal waktu Shalat Shubuh pada 4-8 Oktober sebesar 7,05 atau awal waktu Shalat Isya dimulai pukul 03.57 WIB

    AUTOMATIC GRIDDING CITRA MICROARRAY DENGAN MENGGUNAKAN IMAGE THRESHOLDING

    Get PDF
    .Citra microarray adalah citra hasil pemindaian laser scanner terhadap microarray yang umumnya digunakan untuk mendeteksi perbedaan efek hibridisasi dari dua kelompok sampel DNA. Citra tersebut kemudian dianalisis untuk mendapatkan intensitas fluorescence setiap titik mikroskopis DNA pada microarray. Salah satu tahapan analisis citra microarray adalah menentukan daerah pada citra microarray yang memuat satu titik mikroskopis DNA. Penentuan daerah ini dapat dilakukan secara manual maupun secara otomatis atau yang dikenal dengan automatic gridding. Beberapa penelitian menggunakan k-mean clustering untuk melakukan automatic gridding, tetapi metode ini membutuhkan waktu komputasi yang cukup lama. Dalam makalah ini akan dipaparkan metode untuk automatic gridding dengan menggunakan image thresholding. Selain itu juga dilakukan simulasi dengan menggunakan MATLAB untuk membandingkan waktu yang diperlukan untuk komputasi automatic gridding dengan image thresholding dan automatic gridding dengan k-mean clustering. Hasil simulasi menunjukkan bahwa waktu komputasi automatic gridding dengan image thresholding jauh lebih sedikit di bandingkan dengan automatic gridding dengan k-mean clustering

    Additive Survival Least Square SVm untuk Analsisis Data SUrvival (Studi Simulasi dan Studi Kasus pada Data Pasien Kanker Serviks di RSUD dr. Soetomo Surabaya)

    Get PDF
    Analisis survival adalah metode yang digunakan untuk menganalisis waktu suatu subjek mulai dari awal pengamatan sampai terjadinya kejadian. Awalnya, model survival menggunakan pendekatan parametrik. Selanjutnya Cox mengusulkan modelnya yaitu proporsional hazard yang bersifat semiparametrik. Kelebihan dari Cox PHM adalah penggunaan fungsi Likelihood parsial yang terbukti sesuai dengan fungsi Likelihood. Kelemahan dari Cox PHM adalah adanya asumsi proporsional dan asumsi linearitas dalam kovariat. Pada penelitian ini akan digunakan analisis survival dengan pendekatan nonparametrik yaitu Additive Survival Least Square SVM (A-SURLSSVM) yang dibandingkan dengan Cox PHM. Data yang digunakan merupakan data simulasi dan data riil. Data simulasi dibangkitkan dengan berbagai skenario meliputi jumlah data, persentase sensoring, serta banyaknya variabel prediktor yang berbeda-beda baik untuk data dengan pola linier maupun nonlinier. Data riil yang digunakan merupakan data pasien kanker serviks di rumah sakit dr. Soetomo Surabaya. Kriteria kebaikan model yang digunakan dalam penelitian ini adalah Concordance indeks (C-index), Logrank dan hazard ratio. Semakin bagus suatu model jika nilai kriteria kebaikan model semakin tinggi. Pada penelitian ini didapatkan hasil bahwa performansi A-SURLSSVM lebih baik dari pada Cox PHM berdasarkan C-index dan Hazard Ratio baik pada data riil maupun simulasi. Selanjutnya, dilakukan features selection untuk mengetahui prediktor yang relevan mempengaruhi survival time. Dengan features selection pada data riil, dua dari dua belas variabel yang digunakan dikeluarkan dari dari model yaitu Komplikasi dan Riwayat KB sehingga dapat meningkatkan nilai C-index. Pada berbagai setting pada data simulasi performansi dari A-SURLSSVM selalu lebih baik dari Cox PHM. Pada data dengan pola nonlinier selisih performansi C-index antara A-SURLSSVM dan Cox PHM lebih besar dibandingkan pada data linier. Sehingga metode A-SURLSSVM cocok digunakan pada data nonlinier. Selain itu, C-index merupakan ukuran performansi yang paling bagus dibandingkan hazard ratio dan Logrank. Hasil features selection pada data simulasi sebanyak 100 replikasi menunjukkan bahwa interaksi antar variabel menghasilkan variabel main counfounder dan sub-main counfounder. ==================================================================================================================== Survival analysis is a method used to analyze the time of a subject from the beginning of observation until the occurrence of events. Initially, the survival model used a parametric approach. Furthermore, Cox proposed a model so Called Cox Proportional Hazard model (Cox-PHM) as a semiparametric approach. The parameter estimation in Cox PHM used partial Likelihood function proven in accordance with the Likelihood function. The weakness of the Cox PHM is the presence of proportional assumptions and linearity assumptions within the covariates. This research use survival analysis with nonparametric approach, that is Additive Survival Least Square SVM (A-SURLSSVM) and Cox PHM as a benchmark. The data used in this study are simulation and real datasets. The simulation datasets are generated with various scenarios including the sample sizes, the percentage of sensoring, and the number of features for both linear and nonlinear data. The real dataset used is the cervical cancer patients in dr. Soetomo Surabaya. Performance measures use in this research are Concordance index (C-index), Logrank and hazard ratio. The better model if it produces higher performance measures. It is found that the performance of A-SURLSSVM is better than Cox PHM based on C-index and Hazard Ratio both on real and simulated datasets. Furthermore, feature selection is performed to determine which relevant predictors influence survival time. Using for the features selection of real datasets, two out of twelve variables are removed from the model, i.e Complications and Family History. At various settings in simulation data, the A-SURLSSVM is always better than Cox PHM. In the data with nonlinear pattern, the difference of C-index between A-SURLSSVM and Cox PHM is greater than in linear data. So the A-SURLSSVM method performs much better for nonlinear data. In addition, the C-index is the best performance measure compared to hazard ratio and logrank. The results of the features selection in the simulation data of with 100 replication show that the interaction between variables yields the main counfounder and the sub-main counfounder variables

    Bayesian Spasial Survival Model pada Proses Kejadian Hiv/Aids Di Jawa Timur

    Get PDF
    Analisis survival adalah suatu himpunan dari prosedur statistika untuk menganalisis data di mana variabel respon diakibatkan waktu sampai suatu peristiwa terjadi. Salah satu penerapan dari analisis survival adalah untuk mengetahui laju bertahan hidup penderita HIV/AIDS, Karena penyebaran peyakit virus HIV/AIDS yang menyerang kekebalan tubuh manusia disebabkan oleh faktor yaitu tingkat Pendidikan seksual di suatu Kabupaten/Kota yang diamati, impor HIV/AIDS yang artinya penyakit ini menyebar melewati batas Kabupaten/Kota yang dinamakan batas teritorial, jumlah populasi beresiko di suatu Kabupaten/Kota (pekerja seks komersial dan pelanggan prostitusi) maka terdapat kemungkinan bahwa kejadian di suatu lokasi pasti mempengaruhi kejadian lokasi lain. Oleh karena itu lebih tepat dimodelkan dengan Survival spasial. Model menyertakan efek random spasial CAR (Conditionally Autoregresive) untuk mengatasi kebergantungan spasial yang tidak terjelaskan dalam model. Penelitian ini menggunakan matriks pembobot Queen Contiguity. Dalam menentukan ada/tidaknya pengaruh antar Kabupaten/Kota terhadap Angka Kejadian HIV/AIDS maka digunakan Statistik Uji Moran’s I yang menunjukkan nilai statistik Moran’s I sebesar 0,5184 dan nilai Z-value sebesar 45,074 sehingga disimpulkan bahwa terdapat pengaruh lokasi yang signifikan pada kejadian HIV/AIDS ditiap Kabupaten/Kota di Jawa Timur. Distribusi dagum 3 parameter dan Lognormal 3 parameter adalah distribusi yang paling sesuai untuk memodelkan laju bertahan hidup penderita HIV/AIDS. Model terbaik adalah survival dengan efek random yang berdistribusi Normal adalah dis-tribusi lognormal 3 parameter sedangkan model spasial survival yang paling baik adalah efek random dengan CAR pada distribusi Dagum 3 parameter. Fungsi Survival penderita HIV/AIDS menurun seiring lamanya waktu perawatan, sedangkan fungsi Hazard semakin meningkat serta ditiap Kabupaten/Kota memiliki laju kesembuhan yang berbeda. =================================================================================================== Survival analysis is a result of calculated statistics to analysis data over which response variable induced time until the phenomenon happened. Implemen-tation of this survival analysis is to understand a survival rate of HIV-AIDS pa-tients. The spread of HIV-ADIS infection which affects human immune system caused by some factors, i.e. the level of reproductive health education in the area, Imported cases, the number of people at risk in the area. Finally, there is a possibil-ity that an incidence of HIV infection from one area will affect the others. There-fore, modelling of spatial survival will suit for this case it. A model that includes spatial random effect of CAR (Conditionally Autoregressive) was used to adjust unexplainable spatial dependent in the model. This research used weighted matrix Queen’s contiguity. The process of determining is if an effect of between-districts/cities toward incidence rate of HIV-AIDS cases are exist, Moran’s I sta-tistical test was used. It exhibited Moran’s I value of 0.5184 and Z-value of 45.0740 which indicate that there is a significant effect of space (spatial) to HIV-ADIS incidence in every districts/city in East Java province. Distribution of da-gum 3 parameter and Lognormal 3 parameter is the most suitable distribution for a survival rate modelling of HIV-AIDS patients. The best model is survival with the random effect of Normal distributed is the lognormal distribution of 3 parameters while the best spatial survival model is the random effect with the CAR on the Dagum 3 parameter distribution. Survival function of HIV-AIDS patients reduced as the more extended treatment time, while Hazard function increased, and addi-tionally all districts/cities had different survival rate

    Studi Simulasi Dan Analisis Survival Delisting Time Di Bursa Efek Indonesia Untuk Perusahaan Manufaktur Dengan Metode Multiperiod Generalized Extreme Value Regression

    Get PDF
    Sektor manufaktur di Indonesia merupakan salah satu sektor yang menjanjikan bagi para investor. Bagi para investor, kinerja dari setiap perusahaan manufaktur salah satunya dapat dilihat dari laporan keuangan perusahaan yang tercatat di BEI. Selain itu, dapat diketahui pula dari rekam jejak kebangkrutan setiap perusahaan. Salah satu indikator perusahaan bangkrut di BEI adalah perusahaan tersebut mengalami delisting. Peluang delisting perusahaan manufaktur tersebut dapat diketahui dengan menggunakan analisis survival. Data yang digunakan merupakan data panel dengan 17 rasio keuangan dan indikator makro ekonomi sebagai prediktor. Analisis ini menggunakan model multiperiod Generalized Extreme Value Regression (GEVR). Model ini ekuivalen dengan model hazard. Secara deskriptif, perusahaan survive dan delisting memiliki karakteristik yang berbeda di beberapa rasio keuangan. Perbedaan antara sektor tidak menunjukan perbedaan kurva survival yang berarti. Dari hasil pengujian parsial diketahui terdapat lima variabel yang signifikan yaitu CR, DER, ROE, RETA, dan BI rate. Model optimal menghasilkan nilai c-index sebesar 77,78%. ============================================================ The manufacturing sector in Indonesia is one of the promising sectors for investors. For investors, performance of each manufacture company can be evaluated from the financial statements of companies listed on the IDX. In addition, it can also be known from the record of default or bankruptcy of each company. One of the indicator of a bankrupt company in IDX is that the company is delisted from IDX. The delisting probality of the manufacturing company can be determined by using survival analysis. The data used are panel data with 17 financial ratios and macroeconomic indicators as predictors. This analysis uses the multiperiod Generalized Extreme Value Regression (GEVR) model. This model is equivalent to hazard model. Descriptively, the survival and delisting companies have different characteristics in several financial ratios. Differences across sector do not show significant differences in survival curves. From the result of partial test, there are five significant variables, namely CR, DER, ROE, RETA, and BI rate. Optimal model produce c-index is 77,78%

    Pemodelan Kansei Engineering Type I & Kansei Quality Management Untuk Peningkatan Kinerja Layanan Logistik

    Get PDF
    Tuntutan pemberian layanan logistik yang prima khususnya logistik pihak ketiga (third party logistics atau 3PL) meningkat tajam seiring dengan tumbuhnya persaingan perusahaan logistik di Indonesia. 3PL merupakan perusahaan eksternal yang melayani kegiatan logistik untuk perusahaan lain. Kualitas prima sesuai dengan standar yang ditetapkan, harga yang kompetitif serta pengiriman tepat waktu merupakan kriteria dasar dalam pemilihan layanan. Mengacu pada ketatnya persaingan saat ini yang menyediakan performansi yang seimbang untuk ketiga kriteria tersebut, tentu saja dibutuhkan kriteria pembeda yang menjadi penentu keputusan akhir. Kepuasan emosional (atau disebut sebagai Kansei dalam bahasa Jepang) dianggap sebagai kriteria penentu dalam pengambilan keputusan akhir. Namun, bagaimana keterlibatan Kansei dalam proses pengembangan dan peningkatan layanan logistik masih belum banyak diteliti. Dengan demikian, studi tentang pemodelan Kansei Engineering untuk peningkatan kinerja layanan logistik dilakukan, dengan mengeksplorasi dan mengintegrasikan Kansei Engineering Type I (KE Type I) dan Kansei Quality Management (KQM). KE Type I terkait dengan identifikasi Kansei words dan atribut layanan logistik, sedangkan KQM lebih menitikberatkan pada validasi model matematika Kansei yang dibangun berdasarkan atribut layanan logistik yang kritis. Untuk memahami aplikasi riil dari model ini, sebuah studi di perusahaan 3PL dilakukan. Beberapa atribut layanan yang kritis terhadap Kansei dan menjadi penentu transaksi akan diidentifikasi sebagai langkah perbaikan maupun penguat diferensiasi dan kompetisi bisnis di perusahaan tersebut

    Diagnostic Checking Residual Model Regresi Cox Proportional Hazard Pada Data Pasien Kanker Tiroid Di Rumah Sakit Xyz Menggunakan Cox-Snell Residual Dan Martingale Residual

    Get PDF
    Kanker tiroid merupakan penyakit keganasan yang sering ditemukan pada kelenjar tiroid. Jumlah penderita kanker tiroid termasuk dalam 10 besar penyakit kanker dengan jumlah penderita terbanyak di Indonesia tahun 2018 berdasarkan data Globocan dengan kematian sebesar 19%, persentase yang lebih tinggi dibandingkan dunia yaitu sebesar 7,5%. Salah satu penyebab utama terjadinya kematian pada penderita kanker tiroid ialah metastasis. Metastasis adalah penyebaran sel kanker dari suatu organ ke organ yang lainnya. Regresi Cox proportional hazard merupakan metode survival yang paling umum digunakan. Cox-Snell residual dan Martingale residual merupakan alat yang digunakan dalam penelitian ini sebagai diagnostic checking untuk mengetahui linieritas variabel-variabel yang diduga berpengaruh terhadap hazard ratio pada model regresi Cox proportional hazard data pasien kanker tiroid di Rumah Sakit XYZ dari Januari 2008 hingga Februari 2019. Analisis regresi Cox Proportional Hazard menghasilkan model terbaik, yaitu survival time pasien kanker tiroid hingga mengalami metastasi di Rumah Sakit XYZ dipengaruhi secara signifikan oleh variabel jenis kelamin. ================================================================================================================================= Thyroid cancer is a malignant disease that is often found in the thyroid gland. The number of patients with thyroid cancer is included in the top 10 cancers with the highest number of sufferers in Indonesia in 2018 based on Globocan data with deaths of 19%, that is higher percentage than the world that is 7.5%. One of the main causes of death in patients with thyroid cancer is metastasis. Metastasis is the spread of cancer cells from one organ to another. Cox proportional hazard regression is the most commonly used survival method. Cox-Snell residual and Martingale residual is a tool used in this study as a diagnostic checking to determine the linearity of variables thought to affect hazard ratios in the Cox proportional hazard regression model in thyroid cancer patient datas at XYZ Hospital from January 2008 to February 2019. Cox proportional hazard regression analysis produces the best model, namely the survival time of thyroid cancer patients to experience metastasis in XYZ Hospital is significantly affected by sex
    • …
    corecore