6 research outputs found

    Pattern-driven neighborhood search for biclustering of microarray data

    Get PDF
    Biclustering aims at finding subgroups of genes that show highly correlated behaviors across a subgroup of conditions. Biclustering is a very useful tool for mining microarray data and has various practical applications. From a computational point of view, biclustering is a highly combinatorial search problem and can be solved with optimization methods

    Biclustering Algorithm for Embryonic Tumor Gene Expression Dataset: LAS Algorithm

    Get PDF
    An important step in considering of gene expression data is obtained groups of genes that have similarity patterns. Biclustering methods was recently introduced for discovering subsets of genes that have coherent values across a subset of conditions. The LAS algorithm relies on a heuristic randomized search to find biclusters. In this paper, we introduce biclustering LAS algorithm and then apply this procedure for real value gene expression data. In this study after normalized data, LAS performed. 31 biclusters were聽 discovered that 26 of them were for positive gene expression values and others were for negative. Biological validity for LAS procedure in biological process, in molecular function and in cellular component were 77.96% , 62.28% and 74.39% respictively. The result of biological validation of LAS algorithm in this study had shown LAS algorithm effectively convenient in discovering good biclusters

    Unsupervised Algorithms for Microarray Sample Stratification

    Get PDF
    The amount of data made available by microarrays gives researchers the opportunity to delve into the complexity of biological systems. However, the noisy and extremely high-dimensional nature of this kind of data poses significant challenges. Microarrays allow for the parallel measurement of thousands of molecular objects spanning different layers of interactions. In order to be able to discover hidden patterns, the most disparate analytical techniques have been proposed. Here, we describe the basic methodologies to approach the analysis of microarray datasets that focus on the task of (sub)group discovery.Peer reviewe

    Desarrollo y aplicaci贸n de m茅todos estad铆sticos basados en recortes imparciales a datos de expresi贸n g茅nica de alta dimensionalidad

    Get PDF
    En esta Tesis proponemos la utilizaci贸n de m茅todos estad铆sticos basados en recortes imparciales que, aplicados a matrices de datos de expresi贸n g茅nica de alta dimensionalidad, permiten obtener estimadores con funcionamiento robusto mediante la eliminaci贸n de un porcentaje de individuos. La aplicaci贸n de este tipo de estrategias nos va a permitir caracterizar el nivel de expresi贸n t铆pico de cada gen en medidas de escala gen贸mica (genome-wide) como el que aparece asociado al comportamiento de una mayor铆a de condiciones, utilizando una adaptaci贸n del estimador smart a una situaci贸n unidimensional. Nuestra aproximaci贸n plantea utilizar como procedimiento de recorte de partida el estimador MCD , lo que permite obtener una representaci贸n simplificada para el estimador smart y la obtenci贸n de un algoritmo m谩s eficiente que el disponible actualmente. La estimaci贸n de los par谩metros que describen el comportamiento t铆pico de un gen, va a permitir identificar mejor condiciones que manifiestan expresi贸n diferencial y nuevas definiciones para caracterizar genes que muestran comportamientos de expresi贸n generalizada (tipo gen housekeeping). El estimador propuesto ser谩 la base de estad铆sticos para identificar comportamientos at铆picos en muestras clasificadas inicialmente como homog茅neas, y tambi茅n para contrastar expresi贸n diferencial entre condiciones diferentes. Basado en los mismos principios, proponemos la utilizaci贸n de metodolog铆a para encontrar grupos de genes (cl煤sters) que co-expresan y para encontrar agrupaciones conjuntas de genes y de condiciones que comparten patrones de co-expresi贸n. Los procedimientos de agrupaci贸n propuestos incorporan el recorte de un porcentaje de genes y de condiciones para aumentar la robustez de la clasificaci贸n propuesta. Para todos los procedimientos propuestos se han desarrollado funciones, algoritmos y programas de R que los implementan. El funcionamiento de los m茅todos se ha ilustrado utilizando datos simulados y sobre todo utilizando varios conjuntos de datos reales correspondientes a experimentos y estudios biol贸gicos con microarrays de oligonucle贸tidos de alta densidad, que es una de las tecnolog铆as gen贸micas de gran escala m谩s utilizadas para el estudio de la expresi贸n g茅nica.Departamento de Estad铆stica e Investigaci贸n Operativa2012-11-0
    corecore