2 research outputs found

    A clustering analysis of the chemical metric space

    Get PDF
    Tese de mestrado Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2018O tempo médio de vida da espécie humana tem vindo a aumentar significativamente, sendo a indústria farmacêutica responsável por parte desse sucesso. O tempo médio de produção de um fármaco situa-se entre os 10 e os 15 anos e o seu custo tem vindo a crescer anualmente. A quiminformática permite a redução destas adversidades, recorrendo a ferramentas informáticas com a capacidade de prever propriedades químicas e biológicas. Uma abordagem utilizada para esta previsão é a dos modelos Relação Estrutura-Atividade Quantitativa, que se baseia na relação entre a semelhança de estrutura de fármacos e o conhecimento das suas atividades. Na verdade, alguns modelos utilizados atualmente utilizam algoritmos de elevada complexidade, incapazes de fazer previsões para grandes quantidades de dados. Neste contexto, na elaboração do presente trabalho, foi desenvolvido um algoritmo de agrupamento que permitisse definir farmacologicamente o espaço molecular. A performance deste algoritmo foi avaliada para um conjunto de dados considerável, provenientes da base de dados ZINC, de modo a verificar diversos aspetos importantes, como por exemplo, se este seria capaz de produzir resultados que permitissem definir o espaço molecular. Com base nos resultados produzidos pelo algoritmo, foram definidos farmacologicamente os agrupamentos gerados, de acordo com regras lógicas, recorrendo a uma base de dados de atividades, nomeadamente o ChEMBL 23. Este processo permitiu a criação de uma base de dados, posteriormente utilizada na construção de uma interface gráfica de busca. Desta forma, para um composto desconhecido, será possível verificar a que agrupamento este se encontra mais próximo, extrapolando a informação de alvos a ele ligado para o novo fármaco.The average life expectancy of the human species has been growing significantly and the pharmaceutical industry is a part of this success. The average time of production of a drug is between 10 and 15 years and the cost of it has been growing annually. Cheminformatics allows the reduction of these adversities, using computer tools capable of predicting chemical and biological properties. An approach used is the Quantitative Structure Activity Relationship models. These, make use of the relationship between the similarity of drug’s structure and the knowledge of their activities. In fact, some models currently used, make use of highly complex algorithms, unable to make predictions for large amounts of data. Thus, this work had the purpose to develop a clustering algorithm that allowed to define pharmacologically the molecular space. The algorithm performance was evaluated for a considerable data set, from the ZINC database, in order to verify several important aspects, such as, the ability to produce results that allowed to define the molecular space. Based on the results produced by the algorithm, the clusters generated, according to logical rules, were pharmacologically defined using a database of activities, namely ChEMBL 23. This process allowed the creation of a database, later used in the construction of a search graphical user interface. So, for an unknown compound, it will be possible to verify which is the closest cluster, extrapolating the target information attached to it, to the new drug
    corecore