Search CORE

4 research outputs found

A deep learning approach for kidney disease recognition and prediction through image processing

Author: Kumar Kailash
Mahdal Miroslav
Pradeepa M.
RajaRao M. V. L. N.
Ramesh Janjhyam Venkata Naga
Verma Shikha
Publication venue: MDPI
Publication date: 01/01/2023
Field of study

Chronic kidney disease (CKD) is a gradual decline in renal function that can lead to kidney damage or failure. As the disease progresses, it becomes harder to diagnose. Using routine doctor consultation data to evaluate various stages of CKD could aid in early detection and prompt intervention. To this end, researchers propose a strategy for categorizing CKD using an optimization technique inspired by the learning process. Artificial intelligence has the potential to make many things in the world seem possible, even causing surprise with its capabilities. Some doctors are looking forward to advancements in technology that can scan a patient’s body and analyse their diseases. In this regard, advanced machine learning algorithms have been developed to detect the presence of kidney disease. This research presents a novel deep learning model, which combines a fuzzy deep neural network, for the recognition and prediction of kidney disease. The results show that the proposed model has an accuracy of 99.23%, which is better than existing methods. Furthermore, the accuracy of detecting chronic disease can be confirmed without doctor involvement as future work. Compared to existing information mining classifications, the proposed approach shows improved accuracy in classification, precision, F-measure, and sensitivity metrics.Web of Science136art. no. 362

DSpace at VSB Technical University of Ostrava

Breast cancer disease classification using fuzzy-ID3 algorithm based on association function

Author: Mohd Arfian Ismail
Mohd Saberi Mohamad
Nur Farahaina Idris
Shahreen Kasim
Sutikno Tole
Zalmiyah Zakaria
Publication venue: 'Institute of Advanced Engineering and Science'
Publication date: 01/06/2022
Field of study

Breast cancer is the second leading cause of mortality among female cancer patients worldwide. Early detection of breast cancer is considerd as one of the most effective ways to prevent the disease from spreading and enable human can make correct decision on the next process. Automatic diagnostic methods were frequently used to conduct breast cancer diagnoses in order to increase the accuracy and speed of detection. The fuzzy-ID3 algorithm with association function implementation (FID3-AF) is proposed as a classification technique for breast cancer detection. The FID3-AF algorithm is a hybridisation of the fuzzy system, the iterative dichotomizer 3 (ID3) algorithm, and the association function. The fuzzy-neural dynamic-bottleneck-detection (FUZZYDBD) is considered as an automatic fuzzy database definition method, would aid in the development of the fuzzy database for the data fuzzification process in FID3-AF. The FID3-AF overcame ID3’s issue of being unable to handle continuous data. The association function is implemented to minimise overfitting and enhance generalisation ability. The results indicated that FID3-AF is robust in breast cancer classification. A thorough comparison of FID3-AF to numerous existing methods was conducted to validate the proposed method’s competency. This study established that the FID3-AF performed well and outperform other methods in breast cancer classification

UMP Institutional Repository

Klasifikasi faktor penyebab siswa putus sekolah menggunakan metode decision tree ID3

Author: Putri Larazani Arum Baruna
Publication venue
Publication date: 27/12/2022
Field of study

INDONESIA: Pendidikan menjadi faktor paling penting dalam mencetak generasi bangsa yang berkualitas. Oleh sebab itu pemerintah mengeluarkan kebijakan wajib belajar 12 tahun. Namun, kesadaran masyarakat Indonesia mengenai hal ini masih sangat kurang, terlebih bagi mereka yang tinggal di daerah pedalaman. Pada salah satu sekolah menengah pertama di Desa Panangan Kecamatan Gapura Kabupaten Sumenep masih ditemukan siswa-siswi yang memilih untuk putus sekolah setiap tahunnya. Keputusan ini diambil berdasarkan beberapa faktor yang menjadi penyebab siswa memilih jalan tersebut. Faktor yang menjadi penyebab siswa putus sekolah menarik untuk diteliti lebih dalam, agar dimasa yang akan datang hal ini tidak terjadi lagi. Terdapat 329 data yang diteliti dalam penelitian ini dimana 6 diantaranya memutuskan untuk putus sekolah. Data tersebut merupakan data siswa-siswi dari sekolah yang bersangkutan selama 3 tahun terakhir. Pada prosesnya peneliti akan mengklasifikasikan faktor penyebab siswa putus sekolah yang nantinya faktor-faktor tersebut akan disusun menjadi decision tree yang dibangun dengan algoritma ID3. Nilai akurasi dari model klasifikasi adalah 98,48%. Berdasarkan hasil tersebut Algoritma ID3 dapat mengoptimalkan decision tree dalam mengklasifikasikan faktor penyebab siswa putus sekolah. ENGLISH: Education is the most important factor in producing a quality generation of the nation. Therefore the government issued a 12 year compulsory education policy. However, the awareness of the Indonesian people regarding this matter is still very lacking, especially for those who live in rural areas. In one of the junior high schools in Panangan Village, Gapura District, Sumenep Regency, there are still students who choose to drop out of school every year. This decision was taken based on several factors that caused students to choose that path. The factors that cause students to drop out of school are interesting to study more deeply, so that in the future this will not happen again. There are 329 data that be examined in this study where 6 of them decided to drop out of school. The data is data on students from the school concerned for the last three years. In the process, researchers will classify the factors that cause students to drop out of school, which later these factors will be arranged into a decision tree built with the ID3 algorithm. The accuracy value of the classification model is 98.48%. Based on these results, the ID3 Algorithm can optimize the decision tree in classifying the factors that cause students to drop out of school. ARABIC: التربية هو أهم عامل في إنتاج لوجودة الأمة. أصدرت الحكومة سياسة التعليم الإلزامي لمدة 12 عامًا. فإن ذلك لا يزال وعي الشعب الإندونيسي فيما يتعلق بهذه المسألة مفقودا للغاية، خاصة بالنسبة لأولئك الذين يعيشون في المناطق الريفية. في إحدى المدارس المتوسطة في قرية بانانجان، منطقة غابورا، منطقة فرعية سومينيب، لا يزال الطلاب الين يختارون ترك المدرسة كل عام. تم اتخاذ هذا السباب بناءً على عدة عوامل تسبب في اختيار الطالب للمتنفّس. العوامل التي تتسبب على توقف الطلاب من المدرسة مثيرة للاهتمام للدراسة بشكل أعمق، بحيث لا يحدث هذا مرة أخرى في المستقبل. تمت 329 بيانات في هذه الدراسة، قرر 6 منها توقف للدراسة. البيانات هي بيانات عن طلاب من المدرسة المعنية لآخر 3 سنوات. في هذه العملية، سيقوم الباحثة بتصنيف العوامل السببية على توقف الطلاب الدراسة، والتي سيتم تجمع هذه العوامل لاحقًا في Decision Tree باستخدام خوارزمية ID3. قيمة دقة نموذج التصنيف هي 98.48٪. بناءً على هذه النتائج، الخوارزمية ID3 تستطيع لترقية Decision Tree في تصنيف العوامل السببية على توقف الطلاب الدراسة

Etheses of Maulana Malik Ibrahim State Islamic University

Contribuciones al problema de clasificación en machine learning

Author: Orenes Casanova Yolanda
Publication venue: 'Universidad Miguel Hernandez de Elche'
Publication date: 01/10/2022
Field of study

El problema de clasificación es un tema muy estudiado en la ciencia de datos, en concreto en el campo del aprendizaje automático o “machine learning”. En la actualidad cada vez hay más información y los agentes económicos y sociales quieren extraer conclusiones relevantes de los datos que les ayuden a tomar mejores decisiones. El problema de clasificación es muy importante en la toma de decisiones en una gran variedad de campos, de hecho, en la literatura se puede encontrar un gran número de métodos que son capaces de realizar las tareas propias de la clasificación. La clasificación es una metodología de aprendizaje supervisado en la ciencia de datos, cuyo propósito es predecir la clase correcta, entre un conjunto de clases conocidas, de una nueva observación dada en base al conocimiento proporcionado por un conjunto de datos previo, también llamado datos de entrenamiento. En esta tesis doctoral se trabaja el problema de la clasificación en los aspectos siguientes: Se hace una revisión bibliográfica exhaustiva del problema de clasificación. Se compara el análisis discriminante y el método de selección de características, RBS. Se estudia el desempeño de dos conceptos de la teoría de juegos, como técnicas para la selección de características, comparándolos con distintos métodos de selección de características implementados en Weka. Y se definen tres medidas de desempeño para evaluar el rendimiento de un clasificador. A continuación, se desarrolla cada uno de los aspectos anteriores. En esta tesis se realiza una revisión bibliográfica muy amplia, que queda reflejada a lo largo de toda la memoria por estar estrechamente vinculada con la revisión de la literatura relacionada con el problema de clasificación y en particular, con la selección de características. Todo ello ha servido para elaborar un estado del arte del tema que ha sido muy útil como punto de partida para establecer diferentes problemas abiertos pendientes de estudiar. Se sabe que una de las dificultades en el análisis de un conjunto de datos es su alta dimensionalidad, lo que puede implicar un peor rendimiento de los clasificadores utilizados. La respuesta más eficaz es reducir la dimensión transformando los datos o la otra alternativa puede ser la selección de características. En esta tesis se lleva a cabo un estudio computacional en el que se comparan los resultados obtenidos mediante un método de reducción de la dimensión como es el análisis discriminante y un método de selección de características, incorporado en RBS. En dicho estudio se obtiene que en tiempo computacional el análisis discriminante es ligeramente mejor que el método RBS. Sin embargo, en términos de precisión para conjuntos de 1,000,000 de registros, el método de selección de características RBS ofrece mejores resultados. Además, en esta memoria se lleva a cabo un estudio computacional comparando la selección de características mediante los valores de Shapley y Banzhaf con varios algoritmos de selección de características implementados en Weka. Lo que se hace es definir un juego cooperativo asociado a un problema de clasificación y se calculan los valores de Shapley y Banzhaf asociados a ese juego, seleccionando aquellas características con un mayor valor por considerarse que tienen una mayor influencia en la precisión de la predicción. Finalmente, se compara, para diversos conjuntos de datos, la selección de características obtenidas con los métodos basados en teoría de juegos y los métodos implementados en Weka. Resaltar que, dado el mismo conjunto de datos, no todos los clasificadores son igualmente precisos en sus predicciones. La precisión conseguida por un modelo de clasificación depende de varios factores. Por lo tanto, el análisis del desempeño de los clasificadores es relevante para determinar cuál funciona mejor. Asimismo, en esta tesis se definen tres medidas de desempeño para evaluar el rendimiento de un clasificador. Se consideran tres clasificadores de referencia, en concreto, dos intuitivos y uno aleatorio. Para evaluar un clasificador se determina la reducción proporcional del error de clasificación cuando se utiliza el clasificador a evaluar con respecto a emplear uno de referencia. Este también es un enfoque interesante de la evaluación del desempeño de los clasificadores porque se puede medir lo ventajoso que es un nuevo clasificador con respecto a los tres de referencia simples, que pueden verse como las mejores opciones basadas en el sentido común. Además, también se analiza la relación entre los tres clasificadores de referencia y diferentes aspectos de la entropía del conjunto de datos. Se lleva a cabo un experimento intensivo para exponer cómo funcionan las medidas de rendimiento propuestas y cómo la entropía puede afectar el rendimiento de un clasificador. Para validar lo observado en el experimento anterior, se realiza un experimento extensivo utilizando 11 conjuntos de datos y cuatro clasificadores implementados en Weka

RediUMH (Universidad Miguel Hernández)