2 research outputs found

    Análisis de autoreactividad de anticuerpos leucémicos soportado por estrategias de Inteligencia Artificial

    Get PDF
    184 p.Los antígenos son moléculas externas reconocidas por el organismo de variada estructura y naturaleza. El sistema inmune ha desarrollado técnicas de reconocimiento para estos agentes patógenos, representando diferentes mecanismos de defensa contra una posible infección, siendo los anticuerpos los responsables de esta detección. Predecir qué anticuerpo reconocerá a un antígeno, o estimar a nivel cualitativo la intensidad de la interacción que se producirá, es una tarea ardua y compleja, representando un gran desafío en el área inmunológica. Debido a que los antígenos pueden ser distintos tipos de moléculas, y tener procedencia en diferentes patógenos, la forma en la cual un anticuerpo reconoce un conjunto de antígenos con diversas intensidades de interacción, es una pregunta que se ha abordado desde diferentes perspectivas. Por otra parte, el organismo ha desarrollado estrategias para reconocer moléculas externas de aquellas propias. Esto evita que se genere una respuesta inmune sobre tejidos en el organismo. Las moléculas propias del organismo que desencadenan esta respuesta son denominadas auto antígenos, y al proceso de presentar defensas contra estas moléculas se le denomina auto reactividad. El análisis de auto antígenos es de gran relevancia, tanto para el estudio de enfermedades auto inmunes, como para enfermedades relacionadas a células propias del organismo. En el caso de la leucemia, un tipo de cáncer que afecta a células del tejido sanguíneo, el estudio de la auto reactividad y la interacción entre auto antígenos y anticuerpos es de gran relevancia para el diseño y propuestas que permitan diagnosticar y tratar esta enfermedad. Gran parte de los estudios de interacción entre auto antígenos y anticuerpos se han realizado utilizando técnicas experimentales. No obstante, diversos enfoques in-silico han sido desarrollados empleando diferentes herramientas computacionales como docking o simulación molecular para cálculos de energía libre y visualización de interacciones. Pese a su gran utilidad, estas técnicas poseen un alto costo asociados a la necesidad de material experimental, necesidad de poseer estructuras definidas o modelos confiables, elevados tiempos de simulación, entre otros. De esta forma la aplicación de técnicas de machine learning y diversos métodos de codificación representan una alternativa potente al problema de reconocimiento de interacción entre proteína-proteína, particularmente, a secuencias de auto antígenos y anticuerpos de leucemia. A partir de la información de interacciones entre 45 secuencias de cadena pesada de anticuerpos y cerca de 8000 secuencias de auto antígenos, Se diseñó e implemento un sistema predictivo ensamblado cualitativo del nivel de intensidad de la interacción entre auto antígenos y cadenas pesadas de anticuerpos. Como estrategias de entrenamiento de modelos predictivos, se combinaron variados métodos de representación de proteínas, principalmente Natural Language Processing y propiedades fisicoquímicas, con diferentes algoritmos de aprendizaje supervisado logrando un predictor ensamblado con un rendimiento del 81% de accuracy. Se aplicaron diferentes estrategias de validación que permiten demostrar la robustez del sistema predictivo propuesto, incluyendo sistemas de validación cruzada y métodos propios basados en estrategias Leave One Antibody Out. Adicionalmente, se diseñó e implemento un conjunto de colecciones de moléculas inmunológicas integradas en un único sistema de base de datos, al cual acoplado a una estrategia de clasificación filogenética, se diseña e implementa una estrategia de clasificación de secuencias de autoantígenos basado en propiedades descriptivas, funcionales y componentes filogenéticos. La combinación del conjunto de colecciones con el sistema de clasificación, en conjunto con el sistema ensamblado predictivo, facilita el diseño de estrategias de identificación de secuencias autoantígenos y su evaluación contra anticuerpos leucémicos, brindando los soportes iniciales para herramientas de diseño y descubrimiento de antígenos/anticuerpos que cumplan con características relevantes para el problema de la leucemia, denotando la usabilidad de métodos computacionales en problemas complejos de la ingeniería médica. // ABSTRACT: Antigens are external molecules of varied structures and nature recognized by the body. The immune system has developed recognition techniques for these pathogens, representing different defense mechanisms against possible infection, the antibodies responsible for this detection. Predicting which antibody will recognize an antigen or estimating the intensity of the interaction that will occur at a qualitative level is an arduous and complex task, representing a significant challenge in the immunological area. Because antigens can be different types of molecules and have origins in various pathogens, how an antibody recognizes a set of antigens with varying intensities of interaction is a question that has been approached from different perspectives. On the other hand, the organism has developed strategies to recognize external molecules on its own. This prevents an immune response from being generated on tissues in the body. The body’s own molecules that trigger this response are called self-antigens, and the process of presenting defenses against these molecules is called self-reactivity. The analysis of self-antigens is of great relevance, both for studying autoimmune diseases and for diseases related to the body’s own cells. In leukemia, a type of cancer that affects cells of the blood tissue, the study of self-reactivity and the interaction between self-antigens and antibodies is of great relevance for the design of proposals that allow the diagnosis and treatment of this disease. Much of the interaction studies between self-antigens and antibodies have been carried out using experimental techniques. However, various in-silico approaches have been developed using different computational tools such as docking or molecular simulation for free energy calculations and interactive visualization. Despite their great utility, these techniques have a high cost associated with the need for experimental material, the need to have defined structures or reliable models, high simulation times, among others. In this way, the application of machine learning techniques and various coding methods represent a powerful alternative to the problem of protein-protein interaction recognition, particularly to leukemia self-antigen and antibody sequences. From the information of interactions between 45 sequences of antibodies heavy chain and about 8000 sequences of self-antigens, a qualitative assembled predictive system for the level of intensity of the interaction between self-antigens and heavy chains of antibodies was designed and implemented. As predictive model training strategies, various protein representation methods were combined, mainly Natural Language Processing and physicochemical properties, with different supervised learning algorithms, achieving an assembled predictor with a performance of 81% accuracy. Different validation strategies were applied to demonstrate the robustness of the proposed predictive system, including cross-validation systems and proprietary methods based on Leave One Antibody Out strategies. Additionally, a set of collections of immunological molecules integrated into a single database system was designed and implemented. Coupled with a phylogenetic classification strategy, a method for classifying self-antigen sequences based on descriptive properties was designed and implemented. This method uses different functional properties and phylogenetic components to estimate the relation of new sequences with the set of self-antigen sequences. The combination of the group of collections with the classification system, in association with the assembled predictive system, facilitates the design of strategies for the identification of selfantigen sequences and their evaluation against leukemic antibodies, providing the initial supports for tools of creation and discovery of antigens/antibodies that meet relevant characteristics for the leukemia problem, denoting the usability of computational methods in complex issues of medical engineering

    Aplicaciones de estructuras de grafos y aprendizaje profundo a sistemas de clasificación de interacción antígeno-anticuerpo

    Get PDF
    72 p.Las interacciones proteína-proteína son de real importancia para la ingeniería de proteínas debido a que forman parte esencial en la mayoría de los procesos moleculares. Un caso particular es la interacción antígeno-anticuerpo, la cual cumple con el rol de inhibir o neutralizar agentes patógenos que afectan negativamente la homeostasis normal del cuerpo. Conocer el funcionamiento específico de un anticuerpo es de gran interés en áreas como la medicina y la farmacología, ya que facilita el diseño de vacunas y medicamentos. Variados métodos experimentales se han desarrollado con el fin de estudiar las interacciones proteína-proteína. Algunos de los ejemplos clásicos corresponden a los microarrays de ADN y proteína, la espectroscopia de masas (MS) y la letalidad sintética. Sin embargo, estos métodos se caracterizan por tener un alto costo de producción y tiempo de desarrollo, ser susceptibles al error humano, y muchas veces, requieren de un elevado conocimiento. Para solventar este problema, cada vez se aplican más técnicas basadas en Machine Learning y Deep Learning, como es el caso de AlphaFold y su capacidad de predecir la estructura secundaria. Sin embargo, la rama de la inteligencia artificial aún debe ser más estudiada y aplicada en la investigación científica. Con base en esto, se realizó una investigación con el fin de predecir la interacción antígeno-anticuerpo por medio de Graph Neural Network. Para lograr esto, las proteínas se representaron por medios de estructuras de grafos, en donde los nodos correspondían a los residuos de las proteínas, mientras que las aristas a las distancias euclidianas entre aminoácidos. Además, se contó con un clasificador de interacción para cada complejo. En general, se obtuvo un rendimiento alrededor del 0,51 y se planteó una serie de puntos a tratar en futuros trabajos para el perfeccionamiento de los modelos, los cuales tienen que ver con arquitecturas de redes neuronales, representación de grafos, métodos de codificación y predicción de complejos proteicos. Demostrando que, a pesar de que los resultados no fueron los esperados, el camino por delante es extenso y queda un largo desarrollo por realizar, con el fin de llegar a elaborar sistemas predictivos en base a esta arquitectura de deep learning. // ABSTRACT: Protein-protein interactions are significant for protein engineering because they are essential to most molecular processes. A particular case is an antigen-antibody interaction, which fulfills the role of inhibiting or neutralizing pathogenic agents that negatively affect the normal homeostasis of the body. Knowing the specific functioning of an antibody is of great interest in areas such as medicine and pharmacology since it facilitates the design of vaccines and drugs. Various experimental methods have been developed to study protein-protein interactions. Some classic examples are DNA and protein microarrays, mass spectroscopy (MS), and synthetic lethality. However, these methods are characterized by high production cost and development time, being susceptible to human error, and often requiring a high level of knowledge. To solve this problem, more and more techniques based on Machine Learning and Deep Learning are being applied, such as AlphaFold and its ability to predict secondary structure. However, the branch of artificial intelligence still needs to be more studied and used in scientific research. Based on this, an investigation was carried out to predict the antigenantibody interaction using the Graph Neural Network. Proteins were represented by employing graph structures, where nodes corresponded to protein residues while edges to Euclidean distances between amino acids. In addition, there was an interaction classifier for each complex. In general, a performance of around 0.51 was obtained, and a series of points were raised to be dealt with in future Works to improve the models, which have to do with neural network architectures, graph representation, coding methods, and prediction of protein complexes. Even though the results were not as expected, the road ahead is long, and there is a long development to be done to develop predictive systems based on this deep learning architecture
    corecore