4 research outputs found

    Influence of augmentation on the performance of the double ResNet-based model for chest X-ray classification

    Get PDF
    Purpose: A pandemic disease elicited by the SARS-CoV-2 virus has become a serious health issue due to infecting millions of people all over the world. Recent publications prove that artificial intelligence (AI) can be used for medical diagnosis purposes, including interpretation of X-ray images. X-ray scanning is relatively cheap, and scan processing is not computationally demanding. Material and methods: In our experiment a baseline transfer learning schema of processing of lung X-ray images, including augmentation, in order to detect COVID-19 symptoms was implemented. Seven different scenarios of augmentation were proposed. The model was trained on a dataset consisting of more than 30,000 X-ray images. Results: The obtained model was evaluated using real images from a Polish hospital, with the use of standard metrics, and it achieved accuracy = 0.9839, precision = 0.9697, recall = 1.0000, and F1-score = 0.9846. Conclusions: Our experiment proved that augmentations and masking could be important steps of data pre-processing and could contribute to improvement of the evaluation metrics. Because medical professionals often tend to lack confidence in AI-based tools, we have designed the proposed model so that its results would be explainable and could play a supporting role for radiology specialists in their work

    Przewidywanie immunogenności u myszy przy użyciu klasyfikatora Random Forest

    No full text
    Biomedical data are difficult to interpret due to their large amount. One of the solutions to cope with this problem is to use machine learning. Machine learning can be used to capture previously unnoticed dependencies. The authors performed random forest classifier with entropy and Gini index criteria on immunogenicity data. Input data consisted of 3 columns: epitope (8-11 amino acids long peptide), major histocompatibility complex (MHC) and immune response. Presented model can predict the immune response based on epitope-MHC complex. Achieved results had accuracy of 84% for entropy and 83% for Gini index. The results are not fully satisfying but are a fair start for more complexed experiments and could be used as an indicator for further research.Dane biomedyczne są trudne do interpretacji ze względu na ich dużą ilość. Jednym z rozwiązań radzenia sobie z tym problemem jest wykorzystanie uczenia maszynowego. Techniki te umożliwiają wychwycenie wcześniej niezauważonych zależności. W artykule przedstawiono wykorzystanie klasyfikatora Random Forest z kryterium entropii i indeksem Gini na danych dotyczących immunogenności. Dane wejściowe składają się z 3 kolumn: epitop (peptyd o długości 8-11 aminokwasów), główny kompleks zgodności tkankowej (MHC) i odpowiedź immunologiczna. Zaprezentowany model przewiduje odpowiedź immunologiczną na podstawie kompleksu epitop-MHC. Uzyskane wyniki osiągnęły dokładność na poziomie 84% (entropia) i 83% (indeks Gini). Wyniki nie są w pełni satysfakcjonujące, ale stanowią dobry początek dla bardziej złożonych eksperymentów i wyznacznik do dalszych badań

    Algorytm do analizy danych genetycznych – porównanie częstotliwości występowania określonych mutacji wśród różnych populacji

    No full text
    This paper presents a novel algorithm which can be used to analyze genomic data obtained during Next Generation Sequencing (NGS). Due to the interest in the subject among geneticists, it is necessary to develop algorithms and programs which analyze genetic data that will be user-friendly and accessible to people not related to typical bioinformatics. A way of performing comparative analyze, including proper data preprocessing and final data processing is described. Input data for the algorithm are annotated .vcf files. The outcome of presented algorithm is a file with counted percentage of single nucleotide polymorphisms (SNP) in data for every loaded population.W artykule przedstawiono nowatorski algorytm służący do analizy danych genomowych uzyskanych podczas sekwencjonowania nowej generacji (NGS). Ze względu na zainteresowanie tą tematyką wśród genetyków konieczne jest opracowanie przyjaznych dla użytkownika i dostępnych dla osób niezwiązanych z bioinformatyką algorytmów i programów analizujących dane genetyczne. Opisano sposób przeprowadzania analizy porównawczej, w tym wstępne i końcowe przetwarzanie danych. Dane wejściowe algorytmu to pliki formatu .vcf z adnotacjami. Wynikiem przedstawionego algorytmu jest plik zawierający informacje dotyczące częstości występowania polimorfizmów pojedynczego nukleotydu (ang. single nucleotide polymorphism, SNP) w badanych populacjach

    A Novel Lightweight Approach to COVID-19 Diagnostics Based on Chest X-ray Images

    No full text
    Background: This paper presents a novel lightweight approach based on machine learning methods supporting COVID-19 diagnostics based on X-ray images. The presented schema offers effective and quick diagnosis of COVID-19. Methods: Real data (X-ray images) from hospital patients were used in this study. All labels, namely those that were COVID-19 positive and negative, were confirmed by a PCR test. Feature extraction was performed using a convolutional neural network, and the subsequent classification of samples used Random Forest, XGBoost, LightGBM and CatBoost. Results: The LightGBM model was the most effective in classifying patients on the basis of features extracted from X-ray images, with an accuracy of 1.00, a precision of 1.00, a recall of 1.00 and an F1-score of 1.00. Conclusion: The proposed schema can potentially be used as a support for radiologists to improve the diagnostic process. The presented approach is efficient and fast. Moreover, it is not excessively complex computationally
    corecore