16 research outputs found

    Caracterización de factores de transcripción del tipo “WRKY” en portainjertos de frutales de carozo (Prunus spp.) con respuesta contrastante a la hipoxia radical

    Get PDF
    80 p.La hipoxia o asfixia radical, es un estado fisiológico en el cual la raíz de una planta es privada del suministro adecuado de oxígeno y constituye un estrés abiótico que restringe el desarrollo de los huertos de frutales de carozo en Chile. Los árboles de frutales de carozo se injertan en portainjertos (especies del género Prunus L.) quienes determinan su tolerancia a la hipoxia radical. La variabilidad en las respuestas fisiológicas de la especies del género Prunus a la hipoxia, sugiere que diferentes estrategias habrían evolucionado para enfrentar el estrés. Sin embargo, las bases moleculares de tales respuestas son desconocidas. Análisis moleculares de las respuestas de angiospermas a la asfixia radical, sugieren un rol importante de los factores de transcripción (FT) del tipo WRKY, estudios que no han sido realizados en porta injertos del género Prunus. La presente tesis identificó genes que codifican para proteínas del tipo WRKY y analizó su ubicación en el genoma Prunus persica (Pp). Comparó además las proteínas WRKY identificadas con sus ortólogas en Arabidopsis thaliana (At) y estableció sus relaciones filogenéticas. Por otro lado, se seleccionaron 9 genes candidatos de la familia WRKY para estudiar sus patrones de expresión en dos genotipos con respuesta contrastante a la hipoxia (tolerante vs sensible) y otros estreses abióticos (salinidad, sequía, altas y bajas temperaturas). Los resultados de esta tesis dan luces acerca de la evolución de esta familia de FT en P. persica y se provee información valiosa para el análisis funcional de FT del tipo WRKY en especies leñosas perennes y para el mejoramiento genético de portainjertos de frutales de carozo./ABSTRACT:Root hypoxia limits stone fruit tree (SFTs) development. To overcome this problem, SFTs are grafted on clonal rootstocks (different Prunus species). Therefore, the stone fruit tree tolerance to hypoxia and other environmental stresses is mainly mediated by the performance of the rootstock. The high variability in the physiological responses to hypoxia in Prunus species suggests that different molecular mechanisms could evolve within the genus for dealing with this stress. Increasing plant tolerance to root asphyxia or hypoxia is a main goal of Prunus rootstock breeding programs. Greater understanding of the molecular basis of hypoxia tolerance/sensitivity in Prunus rootstocks and the identification of genes participating in the response to this stress will be critical steps toward improving hypoxia tolerance in stone-fruit plants by molecular assisted selection (MAS) methods. Alternatively, other approaches are possible, based on direct modification of key genes associated with hypoxia tolerance by genetic engineering of Prunus species. However, the molecular bases of hypoxia responses are still largely unknown. Molecular analysis from angiosperm responses to the root asphyxia, suggests an important role of WRKY transcriptions factors, but such studies have not been done in Prunus species used as rootstocks. This thesis identified genes encoding proteins of the WRKY family in Prunus persica and analyzed how they are distributed in their genome. Also, a comparison of the identified proteins and their phylogenetic relationships with their homologs from Arabidopsis thaliana (At) were determined. Furthermore, 9 candidate genes were selected from the WRKY family and their expression patterns were studied in two genotypes with contrast response at hypoxia (tolerant vs sensitive) was analyzed by qRT-PCR. Also, the expression patterns of candidates genes were studied under other abiotic stresses (such as salinity, drought, high and low temperatures). The thesis results, give lights about the evolution of the WRKY family in P. persica and provides information for the functional analysis of WRKY transcription factor and for the genetic improvement of stone fruits rootstocks. Palabras clave: Prunus persica, WRKY, WRKY22, WRKY14, factores de transcripción, hipoxia, M2624, F12

    Análisis transcriptómico del proceso de la maduración de la papaya cultivada en chile (vasconcellea pubescens)

    Get PDF
    104 p.Contexto: La papaya de montaña (Vasconcellea pubescens), perteneciente a la familia Caricacea, es un cultivo artesanal en Chile. Su fruto presenta excelentes características organolépticas y nutricionales, además de un alto contenido de vitaminas y antioxidantes. En estado inmaduro presenta elevadas concentraciones de papaína, siendo muy utilizado en la industria farmacéutica. Por lo que se debe consumir de forma procesada como mermelada, conservas, jugos, etc. Este fruto se ha posicionado en el mercado internacional debido a que es considerado un producto gourmet con resultados prometedores. Aumentando las exigencias de calidad del producto, debiendo producir frutos uniformes, de gran color, sabor y aroma, las cuales son obtenidas durante la etapa de maduración frutal. Debido a que la papaya es un fruto climatérico, su maduración continúa durante su poscosecha, aumentando la producción de etileno, principal fitohormona involucrada en el proceso de ablandamiento del fruto. Esto genera pérdidas significativas en la etapa de elaboración del producto final. Con el objetivo de lograr un mejor entendimiento de estos cambios a nivel genético y molecular, se han seleccionado tres estadios tempranos del proceso de maduración de papaya, los cuales fueron secuenciados mediante la tecnología Roche/454,. Resultados: Se realizaron dos medias placas de Roche/454 GS-FLX para los estadios 0, 1 y 3 días poscosecha, obteniendo 1.453.964 reads, ensamblados en 32.161 contigs consensus con un tamaño promedio de 659 pb. Se realizó el mapeo comparativo utilizando como referencia el genoma de Carica papaya, obteniendo un 40,6% de regiones con identidad significativa. Del proceso de anotación comparativa se determinó, por estrategias de identificación de genes ortólogos, la proporción de genes compartidos con V. pubescens. Obteniendo una anotación de un 56% de contigs mediante genoma de referencia C. papaya, 28% de contigs a través de bases de datos NR, UNIPROT y genomas A. thaliana, S. lycopersicum. A su vez, aquellos contigs no anotados, fueron clasificados mediante KOG obteniendo un 2% de contigs y mediante CDD obteniendo un 1% de contigs. Restando finalmente un 13% de contigs sin anotar. Según la descripción obtenida por la anotación funcional, se realizó una clasificación según procesos relevantes en la etapa de maduración, enfocando siete categorías putativamente relacionadas con el proceso de ablandamiento. Conclusión: Se generó una colección de ESTs, que permitieron identificar funciones características para el desarrollo frutal. En base al estudio genómico-computacional, se identificaron procesos asociados a maduración frutal como, por ejemplo, modificaciones post-raduccionales, recambio de proteínas, transducción de señales, metabolismo de fitohormonas, producción de azucares, pigmentación y metabolismo de ésteres volátiles. Confirmando la presencia de genes asociados a la biosíntesis de etileno (ACO, ACS, ETR), constantemente producido durante la etapa de maduración. La información funcional obtenida mediante este estudio será corroborada experimentalmente para proporcionar el rol de cada uno de los genes identificados en el proceso de ablandamiento, con el fin de establecer potenciales marcadores moleculares que permitan la selección de genotipos que presenten bajos niveles de ablandamiento que permitan implementar estrategias de mejoramiento genético de esta especiey así mejorar su calidad comercial de poscosecha. Palabras claves: Papaya de montaña, Vasconcellea pubescens, 454, EST, maduración, ablandamiento. /ABSTRACT: Background: The mountain papaya (Vasconcellea pubescens), member of the Caricacea family, is an artisanal crop in Chile. It’s fruit has excellent organoleptic and nutritional characteristics, and a high content of vitamins and antioxidants. In immature state has high concentration of papain, widely used in the pharmaceutical industry. Should be consumed in processed form as jam, preserves, juices, etc. This fruit has been positioned in the international market because it’s considered a gourmet product with promising results. Increasing the needs for quality product, must produce uniform fruit, great color, flavor and fragrance, which are obtained during the maturation fruit stage. Because papaya is a climacteric fruit, ripening continues during post-harvest, increasing the ethylene production, the main plant hormone involved in the fruit softening process. This results in significant losses in the elaboration of the final product. In order to better understand the genetic and molecular basis of these changes, have selected three primary stages of the ripening process of papaya, which were sequenced by Roche/454 technology. Results: Two half plates of Roche/454 GS-FLX for stages 0, 1 and 3 days postharvest, obtaining 1,453,964 reads, assembled into 32,161 contigs consensus with an average size of 659 bp. Comparative mapping was performed using as reference the genome of Carica papaya, obtaining 40.6% of regions with significant identity. Comparative annotation process was determined by identifying strategies of orthologous genes, the proportion of genes shares with V. pubescens. Getting a score of 56% of contigs in the reference genome C. papaya, 28% of contigs through NR, UNIPROT databases and genomes of A. thaliana, S. lycopersicum. In turn, those contigs not annotated were classified by KOG getting 2% of contigs and by CDD getting 1% of contigs. Finally subtracting 13% of contigs without scoring. According to the description obtained by the functional annotation, classification was made according to relevant processes in the maturation stage, focusing on seven categories putatively related to the softening process. Conclusion: This generated a collection of ESTs, which identified characteristic functions for fruit development. Based on the genomic-computational study, we identified fruit ripening processes associated with, ex, post-translational modification, protein turnover, signal transduction, plant hormones metabolism, sugars production, pigmentation and volatile esters metabolism. Confirming the presence of genes associated with ethylene biosynthesis (ACO, ACS, ETR), consistently produced during the maturation stage. The functional information obtained by this study will be verified experimentally to provide the role of each of the genes identified in the softening process, in order to establish potential markers that allow for selection of genotypes with low levels of softening that allow to implement breeding strategies of this species and improve their quality commercial postharvest. Keywords: Papaya mountain Vasconcellea pubescens, 454, EST, maturation, softening

    Análisis comparativo de técnicas de Machine Learning para predecir la deserción de estudiantes en varios niveles de estudios

    Get PDF
    50 p.Más del 50% de los matriculados en Chile en educación superior, no termina sus estudios en la primera carrera que se matricula. Esto genera importantes pérdidas de eficiencia para el Estado, las familias de los alumnos y las Universidades. Por este motivo se presenta un análisis comparativo de diversos algoritmos de Machine Learning para predecir la deserción en varios niveles y establece cuales son las variables significativas para los modelos. El estudio se dividió en dos etapas, la primera determina la deserción de los estudiantes, sin importar el tiempo en que suceda. La segunda considera la deserción en tres diferentes niveles por separado: Primer, Segundo y Tercer año. Los análisis muestran que el método Random Forest es el que mejor desempeño presenta. Los atributos más significativos de acuerdo a Information Gain resultaron ser las Notas de Educación Media e Índice de Pobreza Comunal, factores que de acuerdo al estado del arte no han sido aplicados en otros estudios de Minería de Datos aplicada a la Educación. Otro aporte de esta investigación, es la respuesta a una interrogante planteada por Arrau and Loiseau (2003) respecto de la deserción por quintiles de Ingreso económico. Palabras claves— Retención estudiantil, Random Forest, Minería de datos, Dashboar

    Metodología dinámica de análisis de supervivencia aplicada a credit scoring

    Get PDF
    136 p.Esta investigación busca confeccionar una metodología que permita detectar y modelar cambios sufridos a lo largo del tiempo en los patrones que definen una clasificación en modelos de Análisis de Supervivencia. La Metodología Dinámica de Análisis de Supervivencia (MDAS) propuesta utiliza tres diferentes algoritmos de detección de cambios en los datos, con los cuales se entrenan modelos de Riesgos Proporcionales de Cox de manera independiente para luego seleccionar como modelo final aquel que minimice el error sobre un conjunto de prueba. La MDAS fue aplicada a un caso real de Credit Scoring con tres instancias de tiempo, y los resultados obtenidos fueron contrastados con los alcanzados por la metodología estática correspondiente con el fin de ilustrar la verdadera utilidad del método desarrollado. La metodología propuesta alcanzó una efectividad en promedio superior al modelo estático, lo cual fue estadísticamente comprobado. Por lo tanto, se logró desarrollar una metodología capaz de utilizar los datos más relevantes para el modelamiento del concepto objetivo de estudio. Adicionalmente, el Modelo de Riesgos Proporcionales de Cox ofrece una favorable interpretación de resultados que permitió analizar variables y aspectos relevantes en el riesgo de no pago. Palabras claves: Análisis de Supervivencia, Modelo de Riesgos Proporcionales de Cox, Metodología Dinámica, Credit Scoring. Abstract This research aims to make a methodology able to detect and model changes occurred along the time to the patterns which define a classification in Survival Analysis models. The called Dynamic Survival Analysis Methodology (MDAS) uses three different data change detection algorithms, which train Cox’s proportional hazards models independently and then selects as final model that one minimizes the global risk on a test set. The MDAS was applied over a real data of Credit Scoring with three time instances, and the outcomes achieved were contrasted versus the static methodology one, in order to show the real usefulness of the developed method. The proposed methodology achieved a higher average effectiveness than the static model, which was statistically proven. Therefore, it was possible to develop a methodology able to use the most relevant data to model the target. Moreover, the Cox’s proportional hazards model gives a useful interpretation of outcomes what allowed analyze characteristic variables and relevant issues in the default risk. Key words: Survival Analysis, Cox’s proportional hazards model, Dynamic Methodology, Credit Scoring

    Mecanismo evolutivo del origen de genes superpuestos convergentes

    Get PDF
    87 p.La secuenciación de diversos genomas muestra que los genes se encuentran sometidos a una selección y pueden evolucionar a través del tiempo. Un ejemplo de ello es la superposición de genes, característica usualmente asociada a los virus, y que se presenta cuando una misma secuencia de ADN codifica para dos proteínas en marcos de lectura distintos. La finalidad de esta Memoria es estudiar genes superpuestos de orientación convergente mediante el análisis de su origen, de modo de explicar por qué determinados genes se encuentran separados en ciertos genomas y en otros están superpuestos. Con este conocimiento se podrá entender el modo en que surge una región codificante a partir de una que no lo es y generar un modelo de cómo nuevas secuencias de aminoácidos emergen de regiones no codificantes para determinadas duplas de genes superpuestos. Las principales herramientas de trabajo fueron los árboles filogenéticos, creados con el programa MrBayes 3.1.1, los scripts en lenguaje de programación Perl y BioPerl, la Base de Datos “Clusters of Orthologous Groups” (COGs) y ClustalW2 para alineamientos múltiples. Los resultados indican que cuando uno de los genes sufre una mutación, inserción, deleción o alteración del marco de lectura que altera el codón de término del gen, se produce una extensión de la secuencia hasta el siguiente codón de término, originando la superposición con el gen adyacente y la expresión de una nueva secuencia genómica. Este cambio en el gen puede permanecer por una selección positiva en el genoma, otorgando cierta estabilidad al cambio, si representa una característica positiva para el genoma. Es incluso posible que la secuencia extendida pueda adquirir nuevas propiedades con el paso del tiempo./ ABSTRACT: The sequencing of several genomes shows that genes are subject of selection and can evolve over time. An example of this are overlapping genes, a feature usually associated with viruses, which occurs when the same sequence of DNA encodes two proteins in different open reading frames. The purpose of this report is to study convergent overlapping genes through its origin analysis, which could explain why certain genes are separated in some genomes and are overlapped in others. With this knowledge it will be possible to understand how a coding region arise from a non-coding one, and generate a model of how new aminoacid sequences emerge from non-coding regions for certain pairs of overlapping genes. The main tools used were phylogenetic trees, created with MrBayes 3.1.1 program, scripts in Perl programming language and BioPerl, the “Cluster of Orthologous Groups” (COGs) database, and ClustalW2 for multiple sequences alignment. The results show that when a gene suffers a mutation, insertion, deletion or frame shift that modify the gene stop codon, it produces an extension of the sequence to the next stop codon, causing the overlap with the adjacent gene and the expression of a new genomic sequence. This change in the gene may remain by a positive selection in the genome, giving some stability to the modification, if its represent a positive feature for the genome. It is even possible that the extended sequence could acquire new properties with the passing of time

    Análisis genómico comparativo de borradores genómicos para el estudio de diversidad genética en cepas de Piscirickettsia salmonis

    Get PDF
    75 p.Piscirickettsia salmonis, es el agente etiológico de la Septicemia Rickettsial del Salmón (SRS) o Piscirickettsiosis, enfermedad que afecta la producción del salmón a diferentes latitudes con un particular impacto al sur de Chile, donde ha sido responsable de las mayores pérdidas económicas. A pesar de la importancia de este patógeno, existe escasa información sobre las bases moleculares de su fisiología y otros aspectos relevantes de su ciclo de vida y patogénesis.Utilizando tecnología Illumina, bases de datos públicas y herramientas bioinformáticas, en el laboratorio de la división de bio-cómputo se ensambló y anotó el “draft” genómico de la cepa tipo Piscirickettsia salmonis LF-89, además de Piscirickettsia salmonis EM-90, y 2 aislados ambientales desde peces infectados en operaciones de acuicultura al sur de Chile. Con estas cepas se llevó a cabo la construcción del “core” y pan-genoma de Piscirickettsia salmonis, y además se aplicaron estrategias filogenéticas y filogenómicas. Un análisis genómico comparativo reveló que esta bacteria podría compartir un origen evolutivo común con miembros del género Coxiella y Legionella, el cual sumado a conservados grupos de genes ortólogos, entrega pistas sobre una potencial perdida/ganancia de genes, que han conformado el genoma de la cepa Piscirickettsia salmonis LF-89. Este trabajo presenta el primer análisis comparativo entre cepas de Piscirickettsia salmonis, lo que potenciará la interpretación de información experimental disponible y además entrega las bases moleculares para futuras investigaciones experimentales. Este trabajo también proporciona una plataforma de información para investigar la evolución de este género con el fin de explicar mejor la interacción de este patógeno con su huésped y además proporciona información valiosa sobre los factores de virulencia y patogenicidad, lo que abre nuevas perspectivas para el desarrollo de herramientas de detección y control más eficaces. Palabras clave: Genómica comparativa Piscirickettsia salmonis./ABSTRACT: Piscirickettsia salmonis, the etiological agent of the Salmonid Rickettsial Septicaemia (SRS), or Piscirickettsiosis, disease that has affected salmon production at different latitudes with particular impact in southern Chile, wherein has been responsible for major economic losses. Despite the importance of this pathogen, only scarce information about molecular basis of his physiology and other relevant aspects of its life cycle and pathogenesis. Using the Illumina techonolgy, public databases and bioinformatics tools, in bio-computing division laboratory, it was sequenced, assembled and annotated the draft genome sequences of the type strain Piscirickettsia salmonis LF-89, Piscirickettsia salmonis EM-90, and two environmental strain isolated from infected fish from aquaculture operations in the south of Chile. With this strains it was carried the construction the Piscirickettsia salmonis’ “core” and pan-genome. Also the strategic application of phylogenetic and phylogenomic. A comparative genomic analysis revealed this bacterium could share a common evolutionary origin with members of the Coxiella and Legionella genus, which in addition with conserved clusters of orthologous genes analysis, provided clues about the potential gene loss/gain events that have shaped the genome of Piscirickettsia salmonis LF-89 strains. This work presents the first comparative genomic analysis between Piscirickettsia salmonis strains, information that will aid in the interpretation of available experimental information and provide the molecular basis for future experimental research. This work also provides an informational platform to investigate the evolution of this genus in order to better explain the interactions of this pathogen with the salmonid host, providing valuable information about virulence and pathogenicity factors, which could open new perspectives for the development of more effective disease detection and control strategies. Keywords: Comparative genomics Piscirickettsia salmonis

    Estudio de interacciones entre fármacos y proteínas del sistema monoaminérgico y/o receptores nicotínicos utilizando técnicas de minería de datos

    Get PDF
    184 p.El estudio de interacciones entre fármacos y proteínas es de gran importancia para el diseño racional de fármacos, en donde la predicción computacional de las mismas es uno de los mayores desafíos. En particular proyectos actuales están buscados nuevos fármacos candidatos para el tratamiento de enfermedades relacionadas con el sistema nervioso central, estudiando las interacciones existentes entre proteínas del sistema monoaminérgico y/o receptores nicotínicos de acetilcolina con diversos fármacos candidatos. Durante este proceso se comprueba la factibilidad de estos posibles candidatos en una fase modelada a través de computador antes de hacer pruebas experimentales con los fármacos putativos. La etapa de modelado por computador conlleva dos estudios enlazados: el primero es virtual screening en donde distintos fármacos son probados con una misma proteína de forma de encontrar aquellos posibles complejos que presenten una buena estabilidad energética en un cierto instante, es decir con una conformación fija tanto para la proteína como para el fármaco. Posterior a esto se debe verificar la estabilidad del posible complejo fármaco-proteína encontrado a través de un estudio de dinámica molecular, en donde se comprobará la interacción del complejo a lo largo del tiempo. En la práctica estos estudios han mostrado que los complejos seleccionados en la etapa de virtual screening muestran una baja aprobación en posteriores estudios de dinámica molecular. Sólo un 30% de los complejos encontrados en la primera etapa cumplen con el criterio de estabilidad obtenido en el posterior estudio de dinámica molecular. Considerando que un estudio de dinámica molecular puede durar hasta 1 semana, existe una gran cantidad de tiempo perdido durante esta parte del proceso de diseño de fármacos. La presente memoria de título se hace cargo de esta problemática. Para esto se ha desarrollado un modelo de inferencia, basado en técnicas de minería de datos, capaz de predecir si un complejo fármaco-proteína, de la familia monoaminérgica y/o receptores nicotínicos, seleccionado en una etapa de virtual screening, se comportará de forma estable durante un estudio posterior de dinámica molecular. El modelo utiliza para su entrenamiento diversas características estructurales y propiedades fisicoquímicas de los complejos fármaco-proteína estudiados. Alcanzando una eficiencia medida como tasa de verdaderos positivos de sobre el 80% (esto es identificar complejos estables) y una tasa de falsos positivos cercana al 10% (esto es aceptar erróneamente complejos no-estables)./ABSTRACT:The study of interactions between pharmaceutical drugs and proteins is quite significant for the rational pharmaceutical drug design, where the computational prediction of these is one of the largest challenges. In particular, current projects are seeking new pharmaceutical drug candidates for the treatment of diseases related to the central nervous system, studying the interactions between monoaminergic system proteins and/or nicotinic acetylcholine receptors with various pharmaceutical drug candidates. During this process the feasibility of these potential candidates is tested in a computerized modeled phase before making experimental tests with the putative pharmaceutical drugs. The stage of computerized modeling involves two studies linked: the first one is a virtual screening where different pharmaceutical drugs are tested using the same protein in order to find those potential complexes which have good energy stability at a certain moment, ie with a stable conformation for both the protein and the pharmaceutical drug. After this, it must be verified the stability of possible pharmaceutical drug-protein complex found through a study of molecular dynamics, where complex interaction will be checked over time. In practice, these studies have shown that chosen complex in the virtual screening stage show low approval in subsequent molecular dynamics studies. Only 30% of the complexes in the first stage meet the stability criterion obtained in subsequent molecular dynamics study. Considering that a study of molecular dynamics can last up to 1 week, there is a lot of wasted time during the pharmaceutical drug design part of the process. The dissertation herein deals with this problem. For this, it has been developed an inference model, based on data mining techniques, capable of predicting whether a pharmaceutical drug-protein, from monoaminergic family and/or nicotinic receptors, selected at a virtual screening stage, will behave in a stable way during a subsequent study of molecular dynamics. The model uses, for training, various structural and physicochemical properties of the complex pharmaceutical drugprotein studied. Achieving efficiency as a measure of true positive rate of over 80% (ie this is to identify stable complexes) and a false positive rate close to 10% (ie this is to accept non-stable complexes erroneously)

    Análisis longitudinal de loci de características cuantitativas

    Get PDF
    57 p.La selección asistida por marcadores moleculares (MAS; Marker Assisted Selection) es considerada una alternativa viable en los programas de mejoramiento genético vegetal, a partir de su eficiencia en la selección de rasgos con un alto índice de dificultad y costos en su medición. Diversas características de interés económico en programas de mejoramiento se denominan como cuantitativas debido a su origen poligénico, por lo tanto, su expresión está determinada por el efecto aditivo de cada uno de los genes participantes. La expresión de estas características puede cambiar durante el periodo de cultivo, principalmente en plantas leñosas o perennes. Es por ello que el presente estudio analizó los loci de características cuantitativas (QTL; Quantitative Trait Loci) que controlan el crecimiento de Eucalyptus cladocalyx, y también se midió su estabilidad a través del tiempo, para una posterior selección temprana de árboles asistida por marcadores moleculares. Cuarenta y siete familias de medios hermanos de Eucalyptus cladocalyx, establecidas en un ensayo localizado en Tunga Norte (Illapel, Chile), fueron utilizadas para detectar las regiones genéticas asociadas a las características fenotípicas de interés (crecimiento en altura y diámetro a la altura del pecho). La base genética de las características de interés, se pudo comprender mejor mediante el uso de medidas repetidas en el tiempo. El análisis longitudinal mediante un modelo lineal de efectos mixtos, determino que los loci EMBRA32, EMBRA61, EMBRA191 y EMBRA208 se encuentran asociados a las características de interés, explicando entre el 3.7 y 20.7 % de la variación fenotípica observada. Tres de los cuatro loci presentan una estabilidad en el tiempo, y podrían ser considerados en futuros programas de mejoramiento genético. La estructura genética de E. cladocalyx se estimó en base a Redes Neuronales Artificiales con el programa SOTA, el que determinó la existencia de tres grupos genéticamente diferenciados. Comparativamente, un análisis con el modelo Bayesiano empleado en el software STRUCTURE, ratifico lo expuesto por SOTA, demostrando de esta forma la viabilidad del uso de Redes Neuronales en la predicción de estructura genética./ABSTRACT: The molecular Marker Assisted Selection (MAS) is considered a viable alternative in plant breeding programs, based on their efficiency in selecting traits with a high degree of difficulty and cost of measurement. Diverse characteristics of economic interest in breeding programs are referred to as quantitative due to its polygenic origin, therefore, its expression is determined by the additive effect of each of the genes participants. The expression of these characteristics can change during the cultivation period, mainly in woody or perennial plants. That is why this study analyzed the Quantitative Trait Loci (QTL) that control the growth in Eucalyptus cladocalyx, and also was measured its stability through time for a subsequent early selection of trees assisted molecular marker. Half-sib families of Eucalyptus cladocalyx established in an trial located in Tunga Norte (Illapel, Chile), they were used to detect genetic regions associated the phenotypic characteristics of interest (growth in height and diameter at breast height). The genetic basis of the characteristics of interest, it may best be understood through use repeated measures in time. The longitudinal analysis using a linear mixed-effects model determined that the loci EMBRA32, EMBRA61, EMBRA191 and EMBRA208 are associated to the characteristics of interest, explaining between 3.7 and 20.7% of the phenotypic variation observed. Three of the four loci present a stability over time, and could be considered in future breeding programs. The genetic structure of E. cladocalyx was estimated based on Artificial Neural Networks with the SOTA program, that determined the existence of three genetically distinct groups. Comparatively, a Bayesian analysis model used in the STRUCTURE software, ratified the exposed by SOTA, thus demonstrating the feasibility of using neural networks in predicting genetic structur

    Herramientas de minería de datos para el modelamiento de la Pérdida dado el Default

    Get PDF
    162 p.Esta tesis aborda el problema de la Pérdida dado el Default (LGD, por sus siglas en inglés), utilizando diferentes herramientas de minería de datos para su medición. El problema nace de las dificultades que se encuentran en la estimación de las provisiones para las entidades financieras, ya que dependen de parámetros como la EAD o Exposición al Default que corresponde al monto total que el cliente le debe a la compañía financiera, por lo cual es un valor conocido, otro parámetro importante es la PD o Probabilidad de Default que corresponde a la posibilidad de que un cliente devuelva lo solicitado, medición realizado principalmente por modelos de scoring, y por último se tiene a la LGD o Pérdida dado el Default que corresponde a la pérdida esperada para la entidad financiera en caso de que ocurra el default, la cual posee poca incursión en el modelamiento. Es necesario utilizar minería de datos para abordar este problema, ya que se pueden establecer predicciones en base al análisis de grandes bases de datos, considerando variables sobre características crediticias históricas del cliente y de indicadores macroeconómicos del país, al momento de que un cliente caiga en default. Para lo anterior se utilizó la metodología de descubrimiento de conocimiento en base de datos (KDD) para la construcción tanto de los modelos propuestos como de los modelos a comparar. Los métodos implementados corresponden a modelos no lineales, como lo son Support Vector Regression (SVR), Ensembles y SVR con programación de Kernels, estos modelos son comparados con la literatura actual, en donde destacan modelos de Redes Neuronales, Árboles de Regresión y Regresión con respuesta fraccional. Se realiza una comparación mediante una aplicación a un caso real, en donde las propuestas entorno a la metodología ensemble son consideradas como las más competentes, ya que a lo menos igualan los mejores resultados actuales obtenidos por las Redes Neuronales, siendo el Random Forest una atractiva idea de modelar la Pérdida dado el Default. Palabras claves: Riesgo Crediticio, Pérdida dado el Default, SVR,ensemble./ABSTRACT:This thesis addresses the problem of Loss given Default (LGD, for its acronym in English), using different data mining tools for measurement.The problem stems from the difficulties encountered in estimating provisions for financial institutions, as they depend on parameters like EAD or Exposure to the Default corresponding to the total amount that the customer owes the finance company, so is a known value, another important parameter is the PD or default probability corresponding to the likelihood that a customer returns the requested measurement performed mainly by scoring models, and finally has LGD or Loss Given Default that corresponds to the expected loss for the lender in the event of default, which has little foray into modeling. You need to use data mining to address this problem, since they can make predictions based on the analysis of large databases, considering variables on historical customer credit characteristics and macroeconomic indicators of the country, when a customer falls in default. For the above, the methodology of knowledge discovery in databases (KDD) for construction of the models proposed so as to compare models. The methods are implemented to nonlinear models, such as Support Vector Regression (SVR), and SVR Ensembles Kernels with programming, these models are compared with the current literature, where models stand Neural Networks, Regression and Regression Trees with fractional response. A comparison is made by an application to a real case, where the methodology proposed ensemble environment are considered the most relevant, since at least match the best current results obtained by neural networks, with the Random Forest an attractive idea of modeling the Loss given Default.Keywords: Credit Risk, Loss given Default, SVR ensembles

    Identificacion y analisis de modulos conservados en el genero Acidithiobacillus mediante un abordaje filogenomico

    Get PDF
    86 p.Las bacterias del género Acidithiobacillus son gamma-proteobacterias involucradas en procesos de la biolixiviación. A la fecha, se dispone de cuatro miembros de este género cuyo genoma se encuentra total o parcialmente secuenciado. La mayoría de las investigaciones en este género han sido realizadas en el organismo modelo Acidithiobacillus ferrooxidans, por lo que es interesante obtener información acerca del metabolismo y fisiología de un mayor número de miembros. Con el fin de determinar las principales diferencias genómicas y su origen, se llevó a cabo un abordaje filogenómico-comparativo del contenido génico de cada una de las especies en estudio, con énfasis especial en el estudio de las familias de proteínas conservadas y exclusivas de cada especie. El presente estudio identificó las principales diferencias y/o similitudes a nivel genómico entre los organismos secuenciados de este género. Las diferencias derivadas de la comparación genómica reflejan características funcionales adquiridas y/o perdidas, a través de la evolución de este género. En base a la reconstrucción del modelo del pangenoma se construyó un posible modelo evolutivo del género Acidithiobacillus sostenido en sus genes conservados, adquiridos y pérdidos. Utilizando este modelo, se identificó un total de 5902 genes correspondientes al núcleo genómico del género (conservados), además de los genes exclusivos de cada organismo en donde Acidithiobacillus thiooxidans es que el presenta un mayor número de genes ganados y menor número de genes perdidos en el tiempo con respecto a su ancestro (917 genes ganados y 376 genes perdidos), del total de los organismos analizados. Finalmente, utilizando esta información, se definieron las principales características conservadas en el género, que son principalmente proteínas asociadas a metabolismo de membrana debido al entorno de vida en el que se desenvuelven estos organismos. Además, se lograron identificar características exclusivas adquiridas por eventos evolutivos para algunos de los organismo en estudio, por ejemplo se identificaron proteínas asociadas a flagelo y movilidad celular, en los organimos Acidithiobacillus thiooxidans y Acidithiobacillus caldus. En conclusión, la aplicación de un abordaje filogenómico-comparativo ha proporcionado una visión preliminar de las principales características funcionales propias de cada miembro y ha permitido identificar lo posibles procesos evolutivos responsables de esta variación, lo que en su conjunto proveen una visión general del potencial rol ecofisiológico de cada representante de este género./ ABSTRACT: Bacteria of the genus Acidithiobacillus are gamma-proteobacteria are involved in bioleaching processes. To date, there are four members of this genus whose genome is totally or partially sequenced. Most research has been focused in the model organism Acidithiobacillus ferrooxidans, so it is interesting to obtain information about the metabolism and physiology of a greater number of members. In order to identify key genomic differences and their origin, we carried out a Phylogenomics-comparative approach of gene content for the species studied, with special emphasis on the study of conserved and particular protein familias related to each species. This study identified the main differences / similarities at the genomic level hmong sequenced organisms of this genus. Differences arising from genomic comparison reflect functional characteristics acquired / lost through the evolution of this genus. Based on the reconstruction of the pan-genomic model, we built a possible model for evolution of the genus Acidithiobacillus in conserved, acquired and lost genes. Using this model, we identified a total of 5902 genes for the core genome of the genus (conserved), and genes unique to each organism. Acidithiobacillus thiooxidans has the greatest number of genes gained and lost fewer genes along evolutionary time with respect to its ancestor (917 genes gained and 376 genes lost), of all the organisms analyzed. Finally, using this information, we defined key conserved features in the genus, which are mainly proteins associated with membrane metabolism due to the living environment in which these organism live. In addition, we identified unique characteristics acquired by evolutionary events for some of the organism under study, for example we identified proteins associated with the flagella and cell motility in organisms Acidithiobacillus thiooxidans and Acidithiobacillus caldus. In conclusion, the application of a Phylogenomics-comparative approach has provided a preliminary overview of the main functional characteristics of each member and has identified the possible evolutionary processes responsible for this variation, which together provide an overview of the potential ecophysiological role each representative of this genus may play
    corecore