8 research outputs found

    Semantic Biclustering

    Get PDF
    Tato disertační práce se zaměřuje na problém hledání interpretovatelných a prediktivních vzorů, které jsou vyjádřeny formou dvojshluků, se specializací na biologická data. Prezentované metody jsou souhrnně označovány jako sémantické dvojshlukování, jedná se o podobor dolování dat. Termín sémantické dvojshlukování je použit z toho důvodu, že zohledňuje proces hledání koherentních podmnožin řádků a sloupců, tedy dvojshluků, v 2-dimensionální binární matici a zárove ň bere také v potaz sémantický význam prvků v těchto dvojshlucích. Ačkoliv byla práce motivována biologicky orientovanými daty, vyvinuté algoritmy jsou obecně aplikovatelné v jakémkoli jiném výzkumném oboru. Je nutné pouze dodržet požadavek na formát vstupních dat. Disertační práce představuje dva originální a v tomto ohledu i základní přístupy pro hledání sémantických dvojshluků, jako je Bicluster enrichment analysis a Rule a tree learning. Jelikož tyto metody nevyužívají vlastní hierarchické uspořádání termů v daných ontologiích, obecně je běh těchto algoritmů dlouhý čin může docházet k indukci hypotéz s redundantními termy. Z toho důvodu byl vytvořen nový operátor zjemnění. Tento operátor byl včleněn do dobře známého algoritmu CN2, kde zavádí dvě redukční procedury: Redundant Generalization a Redundant Non-potential. Obě procedury pomáhají dramaticky prořezat prohledávaný prostor pravidel a tím umožňují urychlit proces indukce pravidel v porovnání s tradičním operátorem zjemnění tak, jak je původně prezentován v CN2. Celý algoritmus spolu s redukčními metodami je publikován ve formě R balííčku, který jsme nazvali sem1R. Abychom ukázali i možnost praktického užití metody sémantického dvojshlukování na reálných biologických problémech, v disertační práci dále popisujeme a specificky upravujeme algoritmus sem1R pro dv+ úlohy. Zaprvé, studujeme praktickou aplikaci algoritmu sem1R v analýze E-3 ubikvitin ligázy v trávicí soustavě s ohledem na potenciál regenerace tkáně. Zadruhé, kromě objevování dvojshluků v dat ech genové exprese, adaptujeme algoritmus sem1R pro hledání potenciálne patogenních genetických variant v kohortě pacientů.This thesis focuses on the problem of finding interpretable and predic tive patterns, which are expressed in the form of biclusters, with an orientation to biological data. The presented methods are collectively called semantic biclustering, as a subfield of data mining. The term semantic biclustering is used here because it reflects both a process of finding coherent subsets of rows and columns in a 2-dimensional binary matrix and simultaneously takes into account a mutual semantic meaning of elements in such biclusters. In spite of focusing on applications of algorithms in biological data, the developed algorithms are generally applicable to any other research field, there are only limitations on the format of the input data. The thesis introduces two novel, and in that context basic, approaches for finding semantic biclusters, as Bicluster enrichment analysis and Rule and tree learning. Since these methods do not exploit the native hierarchical order of terms of input ontologies, the run-time of algorithms is relatively long in general or an induced hypothesis might have terms that are redundant. For this reason, a new refinement operator has been invented. The refinement operator was incorporated into the well-known CN2 algorithm and uses two reduction procedures: Redundant Generalization and Redundant Non-potential, both of which help to dramatically prune the rule space and consequently, speed-up the entire process of rule induction in comparison with the traditional refinement operator as is presented in CN2. The reduction procedures were published as an R package that we called sem1R. To show a possible practical usage of semantic biclustering in real biological problems, the thesis also describes and specifically adapts the algorithm for two real biological problems. Firstly, we studied a practical application of sem1R algorithm in an analysis of E-3 ubiquitin ligase in the gastrointestinal tract with respect to tissue regeneration potential. Secondly, besides discovering biclusters in gene expression data, we adapted the sem1R algorithm for a different task, concretely for finding potentially pathogenic genetic variants in a cohort of patients

    Collected Papers (on various scientific topics), Volume XII

    Get PDF
    This twelfth volume of Collected Papers includes 86 papers comprising 976 pages on Neutrosophics Theory and Applications, published between 2013-2021 in the international journal and book series “Neutrosophic Sets and Systems” by the author alone or in collaboration with the following 112 co-authors (alphabetically ordered) from 21 countries: Abdel Nasser H. Zaied, Muhammad Akram, Bobin Albert, S. A. Alblowi, S. Anitha, Guennoun Asmae, Assia Bakali, Ayman M. Manie, Abdul Sami Awan, Azeddine Elhassouny, Erick González-Caballero, D. Dafik, Mithun Datta, Arindam Dey, Mamouni Dhar, Christopher Dyer, Nur Ain Ebas, Mohamed Eisa, Ahmed K. Essa, Faruk Karaaslan, João Alcione Sganderla Figueiredo, Jorge Fernando Goyes García, N. Ramila Gandhi, Sudipta Gayen, Gustavo Alvarez Gómez, Sharon Dinarza Álvarez Gómez, Haitham A. El-Ghareeb, Hamiden Abd El-Wahed Khalifa, Masooma Raza Hashmi, Ibrahim M. Hezam, German Acurio Hidalgo, Le Hoang Son, R. Jahir Hussain, S. Satham Hussain, Ali Hussein Mahmood Al-Obaidi, Hays Hatem Imran, Nabeela Ishfaq, Saeid Jafari, R. Jansi, V. Jeyanthi, M. Jeyaraman, Sripati Jha, Jun Ye, W.B. Vasantha Kandasamy, Abdullah Kargın, J. Kavikumar, Kawther Fawzi Hamza Alhasan, Huda E. Khalid, Neha Andalleb Khalid, Mohsin Khalid, Madad Khan, D. Koley, Valeri Kroumov, Manoranjan Kumar Singh, Pavan Kumar, Prem Kumar Singh, Ranjan Kumar, Malayalan Lathamaheswari, A.N. Mangayarkkarasi, Carlos Rosero Martínez, Marvelio Alfaro Matos, Mai Mohamed, Nivetha Martin, Mohamed Abdel-Basset, Mohamed Talea, K. Mohana, Muhammad Irfan Ahamad, Rana Muhammad Zulqarnain, Muhammad Riaz, Muhammad Saeed, Muhammad Saqlain, Muhammad Shabir, Muhammad Zeeshan, Anjan Mukherjee, Mumtaz Ali, Deivanayagampillai Nagarajan, Iqra Nawaz, Munazza Naz, Roan Thi Ngan, Necati Olgun, Rodolfo González Ortega, P. Pandiammal, I. Pradeepa, R. Princy, Marcos David Oviedo Rodríguez, Jesús Estupiñán Ricardo, A. Rohini, Sabu Sebastian, Abhijit Saha, Mehmet Șahin, Said Broumi, Saima Anis, A.A. Salama, Ganeshsree Selvachandran, Seyed Ahmad Edalatpanah, Sajana Shaik, Soufiane Idbrahim, S. Sowndrarajan, Mohamed Talea, Ruipu Tan, Chalapathi Tekuri, Selçuk Topal, S. P. Tiwari, Vakkas Uluçay, Maikel Leyva Vázquez, Chinnadurai Veerappan, M. Venkatachalam, Luige Vlădăreanu, Ştefan Vlăduţescu, Young Bae Jun, Wadei F. Al-Omeri, Xiao Long Xin.‬‬‬‬‬

    Resilience-Building Technologies: State of Knowledge -- ReSIST NoE Deliverable D12

    Get PDF
    This document is the first product of work package WP2, "Resilience-building and -scaling technologies", in the programme of jointly executed research (JER) of the ReSIST Network of Excellenc

    XV Міжнародна конференція з математичної, природничо-наукової та технологічної освіти (ICon-MaSTEd 2022) 18-20 травня 2022 року, м. Кривий Ріг, Україна

    Get PDF
    Матеріали XV Міжнародної конференції з математичної, природничо-наукової та технологічної освіти (ICon-MaSTEd 2022) 18-20 травня 2022 року, м. Кривий Ріг, Україна.Proceedings of the XV International Conference on Mathematics, Science and Technology Education (ICon-MaSTEd 2022) 18-20 May 2022, Kryvyi Rih, Ukraine

    Memorias del Congreso Argentino en Ciencias de la Computación - CACIC 2021

    Get PDF
    Trabajos presentados en el XXVII Congreso Argentino de Ciencias de la Computación (CACIC), celebrado en la ciudad de Salta los días 4 al 8 de octubre de 2021, organizado por la Red de Universidades con Carreras en Informática (RedUNCI) y la Universidad Nacional de Salta (UNSA).Red de Universidades con Carreras en Informátic
    corecore