69 research outputs found

    Treatment of Massive Metagenomic Data with Graphs

    Get PDF
    Among the de novo strategies to assemble metagenomic DNA fragments the application of de Bruijn graphs stands out. These graphs greatly reduce the computational complexity and overload that arises as a consequence of the huge data volume. An Eulerian cycle can be established on a de Bruijn graph that allows the assembly of sequence reads into longer fragments for genome reconstruction. This paper shows the theoretical principles of the computational schema applied. Also, the difficulties that appear in the practical application of the method and the algorithmic features of some of the available open source programs. Finally, the work of the authors research group is summarized.Facultad de Informátic

    Treatment of Massive Metagenomic Data with Graphs

    Get PDF
    Among the de novo strategies to assemble metagenomic DNA fragments the application of de Bruijn graphs stands out. These graphs greatly reduce the computational complexity and overload that arises as a consequence of the huge data volume. An Eulerian cycle can be established on a de Bruijn graph that allows the assembly of sequence reads into longer fragments for genome reconstruction. This paper shows the theoretical principles of the computational schema applied. Also, the difficulties that appear in the practical application of the method and the algorithmic features of some of the available open source programs. Finally, the work of the authors research group is summarized.Facultad de Informátic

    Análisis del desempeño de clustering y árboles de decisión en la evaluación clínica de microbiomas de pacientes con cáncer colorrectal

    Get PDF
    La metagenómica orientada hacia el uso de genes marcadores como el 16S rRNA permite establecer el perfil taxonómico del microbioma de pacientes con cáncer colorrectal. Cabe entonces explorar el papel del análisis taxonómico del microbioma como herramienta de diagnóstico y evaluación de la enfermedad. En tal sentido debe ajustarse la interrelación bioinformático-médica. Cada algoritmo a utilizar, cada parámetro a ajustar, requieren de una evaluación acerca del grado en que colaboran a mejorar el análisis en términos médicos. El objetivo general del trabajo es entonces caracterizar el microbioma de pacientes del AMBA en cuanto a riqueza, diversidad y distribución estadística, a través de muestras del gen marcador 16S rRNA obtenidas de materia fecal. En particular, se procuró reproducir la pipeline desarrollada anteriormente con muestras extraídas de repositorios internacionales mejorando los aspectos de automatización y ajustando la elección de parámetros. También se validó la metodología de trabajo por medio de comparación con los procesos llevados a cabo en el marco de la Large Bowel Microbiome Disease Network. A su vez, se realizó el análisis estadístico correspondiente para establecer la riqueza, diversidad de los microbiomas autóctonos. Finalmente se evaluó el desempeño de métodos supervisados y no supervisados de clasificación y predicción respecto del diagnósticoWorkshop: WBDMD – Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informátic

    Reconocimiento de patrones genéticos por medio de grafos

    Get PDF
    Se expone la línea de investigación que se lleva adelante en el Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan resultados del proyecto de investigación “Aplicación de Técnicas de Data Mining para Análisis del Microbioma Humano según Funcionalidades Metabólicas”, C200 del Programa de Incentivos. Con él se intenta aportar procedimientos para analizar la relación clínica entre el microbioma intestinal y la presencia de patologías. Esto comprende la obtención de muestras de microbiomas de pacientes, la identificación funcional de las secuencias genéticas y la determinación de la distribución de frecuencias por especies en cada paciente. En el proyecto de investigación anterior C169 se habían obtenido datos de secuencias del gen marcador 16S rRNA. La necesidad de establecer ahora una clasificación por funcionalidades metabólicas para todos los genes presentes en cada microbioma, llevó a la búsqueda de nuevos datos crudos (no ensamblados) y al análisis de los procedimientos de extracción, control de calidad, limpieza y ensamble.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Reconocimiento de patrones genéticos por medio de grafos

    Get PDF
    Se expone la línea de investigación que se lleva adelante en el Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan resultados del proyecto de investigación “Aplicación de Técnicas de Data Mining para Análisis del Microbioma Humano según Funcionalidades Metabólicas”, C200 del Programa de Incentivos. Con él se intenta aportar procedimientos para analizar la relación clínica entre el microbioma intestinal y la presencia de patologías. Esto comprende la obtención de muestras de microbiomas de pacientes, la identificación funcional de las secuencias genéticas y la determinación de la distribución de frecuencias por especies en cada paciente. En el proyecto de investigación anterior C169 se habían obtenido datos de secuencias del gen marcador 16S rRNA. La necesidad de establecer ahora una clasificación por funcionalidades metabólicas para todos los genes presentes en cada microbioma, llevó a la búsqueda de nuevos datos crudos (no ensamblados) y al análisis de los procedimientos de extracción, control de calidad, limpieza y ensamble.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Reconocimiento de patrones genéticos por medio de grafos

    Get PDF
    Se expone la línea de investigación que se lleva adelante en el Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan resultados del proyecto de investigación “Aplicación de Técnicas de Data Mining para Análisis del Microbioma Humano según Funcionalidades Metabólicas”, C200 del Programa de Incentivos. Con él se intenta aportar procedimientos para analizar la relación clínica entre el microbioma intestinal y la presencia de patologías. Esto comprende la obtención de muestras de microbiomas de pacientes, la identificación funcional de las secuencias genéticas y la determinación de la distribución de frecuencias por especies en cada paciente. En el proyecto de investigación anterior C169 se habían obtenido datos de secuencias del gen marcador 16S rRNA. La necesidad de establecer ahora una clasificación por funcionalidades metabólicas para todos los genes presentes en cada microbioma, llevó a la búsqueda de nuevos datos crudos (no ensamblados) y al análisis de los procedimientos de extracción, control de calidad, limpieza y ensamble.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Clasificación por enterotipos y grupos ortólogos del microbioma humano con métodos no supervisados

    Get PDF
    Se relatan las tareas llevadas a cabo por el Grupo de Investigación y Desarrollo en Data Mining del Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLAM durante el año 2015 en el marco del Proyecto de Incentivos C169 “Aplicaciones de Data Mining al Estudio del Microbioma Humano”. Se detallan las pruebas realizadas con el software SUPERFOCUS y la base de datos genéticos SEED, para desarrollar los análisis taxonómicos y funcionales que prepararan la información de las secuencias microbiómicas para procesarla con algoritmos de data mining. Se explicitan los aspectos teóricos y prácticos de la aplicación de estos algoritmos sobre conjuntos de prueba. Se analiza la interpretación clínica dada a los resultados y finalmente se describen los cursos de acción para continuar con la investigación durante 2016.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Clasificación por enterotipos y grupos ortólogos del microbioma humano con métodos no supervisados

    Get PDF
    Se relatan las tareas llevadas a cabo por el Grupo de Investigación y Desarrollo en Data Mining del Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLAM durante el año 2015 en el marco del Proyecto de Incentivos C169 “Aplicaciones de Data Mining al Estudio del Microbioma Humano”. Se detallan las pruebas realizadas con el software SUPERFOCUS y la base de datos genéticos SEED, para desarrollar los análisis taxonómicos y funcionales que prepararan la información de las secuencias microbiómicas para procesarla con algoritmos de data mining. Se explicitan los aspectos teóricos y prácticos de la aplicación de estos algoritmos sobre conjuntos de prueba. Se analiza la interpretación clínica dada a los resultados y finalmente se describen los cursos de acción para continuar con la investigación durante 2016.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Minería de datos para análisis del microbioma humano

    Get PDF
    Se expone la línea de investigación que lleva adelante el Grupo de Investigación y Desarrollo en Data Mining del Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan los resultados del proyecto de investigación “Aplicaciones de Data Mining al Estudio del Microbioma Humano”, C169 del Programa de Incentivos. La línea de trabajo intenta aportar procedimientos computacionales adecuados para analizar la relación clínica entre el microbioma intestinal y la presencia de patologías tales como el cáncer de colon y la enfermedad de Crohn. El trabajo hasta aquí realizado comprende la obtención de una muestra de microbiomas de pacientes desde el repositorio de NCBI, la identificación bacteriana a partir del gen marcador y la determinación de la distribución de frecuencias por especies en cada paciente. Se continuó luego con el agrupamiento de pacientes por enterotipos y la evaluación clínica de las categorías obtenidas.Eje: Bases de datos y Minería de datos.Red de Universidades con Carreras en Informática (RedUNCI

    Técnicas de minería de datos aplicadas al procesamiento de ADN de comunidades microbiológicas

    Get PDF
    Se expone la línea de investigación que lleva adelante el Grupo de Investigación y Desarrollo en Data Mining del Departamento de Ingeniería e Investigaciones Tecnológicas de la UNLaM. Se detallan los resultados del proyecto de investigación “Data Mining y Simulación en Evaluaciones de Biodiversidad”, C141 del Programa de Incentivos, y las perspectivas de un nuevo proyecto, “Aplicaciones de Data Mining al estudio del Microbioma Humano”, que se inicia dentro del mismo programa institucional. Las modernas técnicas de secuenciación de ADN transforman su estructura química en secuencias informáticas de símbolos cada una de las cuales puede ser vista como una instancia de una base de datos. Es posible entonces aplicar métodos para clasificar casos y predecir patrones de comportamiento de forma similar a como se lo hace sobre otros dominios. Dentro de esta línea de trabajo se desarrolló un algoritmo que permite evaluar la cantidad de especies distintas en una comunidad microbiana, mejorando la eficiencia de otras estimaciones estadísticas a partir de muestras. Actualmente se trabaja en las formas de agrupamientos (clustering) que resulten compatibles con la evaluación clínica del metagenoma humano (microbioma), el cual sufre importantes variaciones en presencia de patologías. Se pretende desarrollar un clasificador de enterotipos, conjuntos de genes asociados a diferentes vías metabólicas, que permita determinar y predecir variaciones debidas al curso de una enfermedad.Eje: Base de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI
    corecore