4 research outputs found
Applied Computational Techniques on Schizophrenia Using Genetic Mutations
[Abstract] Schizophrenia is a complex disease, with both genetic and environmental influence. Machine learning techniques can be used to associate different genetic variations at different genes with a (schizophrenic or non-schizophrenic) phenotype. Several machine learning techniques were applied to schizophrenia data to obtain the results presented in this study. Considering these data, Quantitative Genotype – Disease Relationships (QDGRs) can be used for disease prediction. One of the best machine learning-based models obtained after this exhaustive comparative study was implemented online; this model is an artificial neural network (ANN). Thus, the tool offers the possibility to introduce Single Nucleotide Polymorphism (SNP) sequences in order to classify a patient with schizophrenia. Besides this comparative study, a method for variable selection, based on ANNs and evolutionary computation (EC), is also presented. This method uses half the number of variables as the original ANN and the variables obtained are among those found in other publications. In the future, QDGR models based on nucleic acid information could be expanded to other diseases.Programa Iberoamericano de Ciencia y TecnologÃa para el Desarrollo; 209RT-0366Xunta de Galicia; 10SIN105004PRInstituto de Salud Carlos III; RD07/0067/0005Xunta de Galicia; Ref. 2009/5
MIANN models in medicinal, physical and organic chemistry
[Abstract] Reducing costs in terms of time, animal sacrifice, and material resources with computational methods has become a promising goal in Medicinal, Biological, Physical and Organic Chemistry. There are many computational techniques that can be used in this sense. In any case, almost all these methods focus on few fundamental aspects including: type (1) methods to quantify the molecular structure, type (2) methods to link the structure with the biological activity, and others. In particular, MARCH-INSIDE (MI), acronym for Markov Chain Invariants for Networks Simulation and Design, is a well-known method for QSAR analysis useful in step (1). In addition, the bio-inspired Artificial-Intelligence (AI) algorithms called Artificial Neural Networks (ANNs) are among the most powerful type (2) methods. We can combine MI with ANNs in order to seek QSAR models, a strategy which is called herein MIANN (MI & ANN models). One of the first applications of the MIANN strategy was in the development of new QSAR models for drug discovery. MIANN strategy has been expanded to the QSAR study of proteins, protein-drug interactions, and protein-protein interaction networks. In this paper, we review for the first time many interesting aspects of the MIANN strategy including theoretical basis, implementation in web servers, and examples of applications in Medicinal and Biological chemistry. We also report new applications of the MIANN strategy in Medicinal chemistry and the first examples in Physical and Organic Chemistry, as well. In so doing, we developed new MIANN models for several self-assembly physicochemical properties of surfactants and large reaction networks in organic synthesis. In some of the new examples we also present experimental results which were not published up to date.Ministerio de Ciencia e Innovación; CTQ2009-07733Universidad del Pais Vasco; UFI11/22Universidad del Pais Vasco; GIU 094
Computación evolutiva para el proceso de selección de variables en espacios de búsqueda multimodales
[Resumen] Esta tesis se enmarca dentro de la problemática de la selección de variables en espacios de búsqueda multimodal, Esta tarea puede ser abordada mediante diferentes técnicas, analizadas en profundidad e indicando los puntos débiles de cada una de ellas.
Entre ellas, las técnicas basadas en Computación Evolutiva apartan buena soluciones cuando se trata de explorar espacios de búsqueda complejos (como los resultantes en un proceso de selección de variables). No obstante, presentan limitaciones cuando dicho espacio de búsqueda presenta múltiples soluciones globales o una única solución global pero múltiples soluciones subóptimas (mÃnimos locales).
En estos casos, la búsqueda puede verse atrapada en un mÃnimo local, o bien focalizarse en el entorno de una única solución cuando lo verdaderamente interesante serÃa obtener el mayor número posible de soluciones válidas. Con el objetivo de paliar estas deficiencias se proponen dos técnicas basadas en Algoritmos Genéticos que permiten explorar de manera homogénea el espacio de búsqueda y localizar un mayor número de soluciones.
Los resultados obtenidos tras las pruebas realizadas muestran el buen comportamiento de ambas, asà como una serie de ventajas tales como la generalización del proceso de evaluación de las soluciones, puesto que se aporta una técnica de evaluación basada en el empleo de Redes de Neuronas Artificiales
Resolución de problemas de optimización combinatoria utilizando técnicas de computación evolutiva: una aplicación a la biomedicina
[Resumen] Cada dÃa se genera una mayor cantidad de datos, tanto con respecto a su volumen como
por el número de variables que involucran, lo cual representa un problema para las técnicas
tradicionales. En muchos problemas el conjunto de soluciones posibles es tan elevado que
la localización de una solución óptima es imposible en un tiempo razonable, por lo que es
necesario emplear técnicas basadas en heurÃsticas. Se ha observado que las técnicas de
computación evolutiva (CE) proporcionan resultados satisfactorios en situaciones en que
técnicas tradicionales no los obtuvieron, en especial en su aplicación a datos biomédicos y
relacionados con el diagnóstico de enfermedades.
AsÃ, en este trabajo se ha desarrollado un modelo basado en CE capaz de, a partir de unos
datos de entrada etiquetados como sujetos sanos o enfermos, extraer expresiones con las
que construir un modelo de clasificación. Este modelo ha sido validado tanto contra datos
sintéticos como aplicado a un conjunto de datos clÃnicos reales, además de comparar sus
resultados con métodos similares. Es de destacar que el modelo propuesto obtiene
expresiones sencillas y que logra clasificar ambos tipos de conjuntos mejor que el resto de
técnicas, resultando de gran utilidad como apoyo al diagnóstico clÃnico.[Resumo] Cada dÃa xérase unha maior cantidade de datos, tanto con respecto ao seu volume como
polo número de variables que involucran, o cal representa un problema para as técnicas
tradicionais. En moitos problemas o conxunto de solucións posibles é tan elevado que a
localización dunha solución óptima é imposible nun tempo razoable, polo que é necesario
empregar técnicas baseadas en heurÃsticas. Observouse que as técnicas de computación
evolutiva (CE) proporcionan resultados satisfactorios en situacións en que técnicas
tradicionais non os obtiveron, en especial na súa aplicación a datos biomédicos e
relacionados co diagnóstico de enfermidades.
AsÃ, neste traballo desenvolveuse un modelo baseado en CE capaz de, a partir duns datos
de entrada etiquetados como suxeitos sans ou enfermos, extraer expresións coas que
construÃr un modelo de clasificación. Este modelo foi validado tanto contra datos sintéticos
como aplicado a un conxunto de datos clÃnicos reais, ademais de comparar os seus
resultados con métodos similares. Compre destacar que o modelo proposto obtén
expresións sinxelas e que logra clasificar ambos tipos de conxuntos mellor co resto de
técnicas, resultando de gran utilidade como apoio ó diagnóstico clÃnico.[Abstract] Every day more data are being generated. Not only the volume of data increases, but also
the number of variables does. This represents an issue for traditional techniques.
Furthermore, many problems involve such a large set of possible solutions that finding the
optimal solution in a reasonable amount of time is not feasible. Thus, using techniques
based on heuristics becomes necessary. Evolutionary Computation (EC) has provided
good results in situations in which traditional techniques did not, especially when applied to
biomedical data and disease diagnosis.
Therefore, in this work, a model based on EC has been developed. This model, based on
an input set with data that belong to healthy or diseased subjects, is capable of extracting
expressions in order to build a classification model. The model proposed in this thesis has
been validated on generated data, as well as applied to real clinical data, comparing the
results obtained with those of other similar techniques. It is worth pointing out that the
model presented extracts simple expressions and performs better when classifying both
types of data sets than other existing techniques. As a result, the model presented is
expected to be very useful for clinical diagnostic support