11 research outputs found

    FPF-SB: a Scalable Algorithm for Microarray Gene Expression Data Clustering

    Get PDF
    Efficient and effective analysis of large datasets from microarray gene expression data is one of the keys to time-critical personalized medicine. The issue we address here is the scalability of the data processing software for clustering gene expression data into groups with homogeneous expression profile. In this paper we propose /FPF-SB/, a novel clustering algorithm based on a combination of the Furthest-Point-First (FPF) heuristic for solving the /k/-center problem and a stability-based method for determining the number of clusters /k/. Our algorithm improves the state of the art: it is scalable to large datasets without sacrificing output quality

    Fuzzy Logic in Medicine and Bioinformatics

    Get PDF
    The purpose of this paper is to present a general view of the current applications of fuzzy logic in medicine and bioinformatics. We particularly review the medical literature using fuzzy logic. We then recall the geometrical interpretation of fuzzy sets as points in a fuzzy hypercube and present two concrete illustrations in medicine (drug addictions) and in bioinformatics (comparison of genomes)

    Aplicación de algoritmos aproximados al diagnóstico/clasificación de enfermedades

    Get PDF
    El diagnóstico de enfermedades puede formularse como un problema de clasificación, en consecuencia se trata de un problema NP-duro, como es el caso de las dos problemáticas que se pretenden resolver en este trabajo: clasificación, en benigno o maligno, de muestras de tumores de pacientes sospechados de sufrir de cáncer de mama; y clasificación, en negativo o positivo, de muestras de pacientes sospechados de padecer diabetes de tipo II. Por tal motivo, nuestra propuesta consiste en desarrollar algoritmos aproximados basados en perceptrones multicapa, en algoritmos genéticos y en algoritmos que hibridan estas opciones, para realizar diagnósticos confiables (clasificación) con respecto a estas enfermedades. Los experimentos numéricos permiten evaluar y comparar el rendimiento de las distintas propuestas utilizando conjuntos de datos reales. Los resultados muestran que nuestras propuestas logran resultados con errores de clasificación próximos a cero, además de, superar el desempeño de algoritmos propuestos en la literatura.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Aplicación de algoritmos aproximados al diagnóstico/clasificación de enfermedades

    Get PDF
    El diagnóstico de enfermedades puede formularse como un problema de clasificación, en consecuencia se trata de un problema NP-duro, como es el caso de las dos problemáticas que se pretenden resolver en este trabajo: clasificación, en benigno o maligno, de muestras de tumores de pacientes sospechados de sufrir de cáncer de mama; y clasificación, en negativo o positivo, de muestras de pacientes sospechados de padecer diabetes de tipo II. Por tal motivo, nuestra propuesta consiste en desarrollar algoritmos aproximados basados en perceptrones multicapa, en algoritmos genéticos y en algoritmos que hibridan estas opciones, para realizar diagnósticos confiables (clasificación) con respecto a estas enfermedades. Los experimentos numéricos permiten evaluar y comparar el rendimiento de las distintas propuestas utilizando conjuntos de datos reales. Los resultados muestran que nuestras propuestas logran resultados con errores de clasificación próximos a cero, además de, superar el desempeño de algoritmos propuestos en la literatura.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Aplicación de algoritmos aproximados al diagnóstico/clasificación de enfermedades

    Get PDF
    El diagnóstico de enfermedades puede formularse como un problema de clasificación, en consecuencia se trata de un problema NP-duro, como es el caso de las dos problemáticas que se pretenden resolver en este trabajo: clasificación, en benigno o maligno, de muestras de tumores de pacientes sospechados de sufrir de cáncer de mama; y clasificación, en negativo o positivo, de muestras de pacientes sospechados de padecer diabetes de tipo II. Por tal motivo, nuestra propuesta consiste en desarrollar algoritmos aproximados basados en perceptrones multicapa, en algoritmos genéticos y en algoritmos que hibridan estas opciones, para realizar diagnósticos confiables (clasificación) con respecto a estas enfermedades. Los experimentos numéricos permiten evaluar y comparar el rendimiento de las distintas propuestas utilizando conjuntos de datos reales. Los resultados muestran que nuestras propuestas logran resultados con errores de clasificación próximos a cero, además de, superar el desempeño de algoritmos propuestos en la literatura.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    K-Boost: a Scalable Algorithm for High-Quality Clustering of Microarray Gene Expression Data

    Get PDF
    Motivation: Microarray technology for profiling gene expression levels is a popular tool in modern biological research. Applications range from tissue classification to the detection of metabolic networks, from drug discovery to time-critical personalized medicine. Given the increase in size and complexity of the data sets produced, their analysis is becoming problematic in terms of time/quality tradeoffs. Clustering genes with similar expression profiles is a key initial step for subsequent manipulations and the increasing volumes of data to be analyzed requires methods that are at the same time efficient (completing an analysis in minutes rather than hours) and effective (identifying significant clusters with high biological correlations). Results: In this paper we propose K-Boost, a novel clustering algorithm based on a combination of the Furthest-Point-First (FPF) heuristic for solving the metric k-centers problem, a stability-based method for determining the number of clusters (i.e. the value of k), and a k-means-like cluster refinement. K-Boost is able to detect the optimal number of clusters to produce. It is scalable to large data-sets without sacrificing output quality as measured by several internal and external criteria

    Fuzzy J-Means and VNS Methods for Clustering Genes from Microarray Data

    No full text
    Motivation: In the interpretation of gene expression data from a group of microarray experiments that include samples from either different patients or conditions, special consideration must be given to the pleiotropic and epistatic roles of genes, as observed in the variation of gene co-expression patterns. Crisp clustering methods assign each gene to one cluster, thereby omitting information about the multiple roles of genes.Results: Here we present the application of a local search heuristic, Fuzzy J-Means, embedded into the Variable Neighborhood Search metaheuristic for the clustering of microarray gene expression data. We show that for all data sets studied this algorithm outperforms the standard Fuzzy C-Means heuristic. Different methods for the utilization of cluster membership information in determining gene co-regulation are presented. The clustering and data analyses were performed on simulated data sets as well as experimental cDNA microarray data for breast cancer and human blood from the Stanford Microarray Database.Motivation : Dans l'interpr\ue9tation des donn\ue9es d'expression g\ue9nique tir\ue9es d'un groupe d'exp\ue9riences sur des micror\ue9seaux comportant des \ue9chantillons correspondant \ue0 des conditions ou des patients diff\ue9rents, on doit porter une attention toute sp\ue9ciale aux r\uf4les pl\ue9iotropique et \ue9pistatique des g\ue8nes, observ\ue9s dans la variation des motifs de co expression de ces derniers. Les m\ue9thodes de groupage exact assignent un g\ue8ne \ue0 chaque famille ou groupe, ce qui ne permet pas de tenir compte des renseignements sur les r\uf4les multiples des g\ue8nes.R\ue9sultats : Nous pr\ue9sentons ici une application d'un algorithme de recherche heuristique locale, la moyenne J floue, int\ue9gr\ue9 \ue0 la m\ue9thode m\ue9taheuristique de recherche dans un voisinage variable, pour le groupage des donn\ue9es d'expression g\ue9n\ue9tique d'un micror\ue9seau. Nous d\ue9montrons que, pour tous les ensembles de donn\ue9es \ue9tudi\ue9s, cet algorithme est sup\ue9rieur \ue0 l'algorithme heuristique de la moyenne C floue. Nous pr\ue9sentons \ue9galement diff\ue9rentes m\ue9thodes d'utilisation des informations sur l'appartenance \ue0 une famille pour d\ue9terminer la co r\ue9gulation g\ue9n\ue9tique. Les analyses de donn\ue9es et le groupage ont \ue9t\ue9 effectu\ue9s sur des ensembles de donn\ue9es de simulation, ainsi que sur des donn\ue9es exp\ue9rimentales sur des micror\ue9seaux ADNc concernant le cancer du sein et le sang humain, tir\ue9es de la base de donn\ue9es de Stanford sur les micror\ue9seaux.NRC publication: Ye
    corecore