166 research outputs found

    El problema de Behrens-Fisher en la investigación biomédica. Análisis crítico de un estudio clínico mediante simulación

    Get PDF
    En el artículo se hace una revisión del problema de Behrens-Fisher, discutiendo los fundamentos inferenciales asociados a la dificultad de su resolución y exponiendo las soluciones prácticas más comunes, juntamente con una nueva solución basada en conceptos de geometría diferencial. A continuación, se realiza un estudio crítico de una investigación biomédica en donde las verdaderas probabilidades de error son distintas de las supuestas debido a que se ignoran probables diferencias entre las varianzas. En dicha investigación se rechazó la hipótesis nula de igualdad de medias (p < 0.01 ), si bien, la verdadera probabilidad de error de tipo I para valores próximos a los muestrales parece ser otra. Con este fin, se realiza un estudio de Monte Cario para obtener estas estimaciones según se utilice el test t de Student de comparación de medias o diferentes soluciones más apropiadas para el problema de Behrens-Fisher. En este estudio de simulación se usa una técnica de reducción de la varianza específica para variables de respuesta dicotómica tales como contrastes de hipótesis (aceptar, no aceptar la hipótesis nula). Se presenta brevemente esta técnica y se ilustra como se diseña la simulación de acuerdo con la mismaPeer Reviewe

    Discovery and classification of complex multimorbidity patterns: unravelling chronicity networks and their social profiles

    Get PDF
    Multimorbidity can be defined as the presence of two or more chronic diseases in an individual. This condition is associated with reduced quality of life, increased disability, greater functional impairment, increased health care utilisation, greater fragmentation of care and complexity of treatment, and increased mortality. Thus, understanding its epidemiology and inherent complexity is essential to improve the quality of life of patients and to reduce the costs associated with multi-pathology. In this paper, using data from the European Health Survey, we explore the application of Mixed Graphical Models and its combination with social network analysis techniques for the discovery and classification of complex multimorbidity patterns. The results obtained show the usefulness and versatility of this approach for the study of multimorbidity based on the use of graphs, which offer the researcher a holistic view of the relational structure of data with variables of different types and high dimensionality

    Kernel Methods for Dimensionality Reduction Applied to the «Omics» Data

    Get PDF
    Microarray technology has been advanced to the point at which the simultaneous monitoring of gene expression on a genome scale is now possible. Microarray experiments often aim to identify individual genes that are differentially expressed under distinct conditions, such as between two or more phenotypes, cell lines, under different treatment types or diseased and healthy subjects. Such experiments may be the first step towards inferring gene function and constructing gene networks in systems biology. The term ”gene expression profile” refers to the gene expression values on all arrays for a given gene in different groups of arrays. Frequently, a summary statistic of the gene expression values, such as the mean or the median, is also reported. Dot plots of the gene expression measurements in subsets of arrays, and line plots of the summaries of gene expression measurements are the most common plots used to display gene expression data (See for example Chambers (1983) and references therein)..

    Chemical characterization of igneous sphene and application of the Zr-in-sphene thermometer to tardimagmatic processes

    Get PDF
    This preliminary work illustrates the chemical composition of sphene from Variscan tonalites with sphene-centered ocellar texture (Ribadelago pluton, NW Iberian Massif). The ocellar texture is linked with the percolation of a tardimagmatic melt, with trondhjemitic affinities, through an hyperdense crystal mush. Chemical zoning in sphene, revealed by BSE imaging, shows a heterogeneous distribution of heavy trace elements (Nb, Y, Ce and Zr) that depicts concentric, oscillatory, sector and patchy patterns. Application of the Zr-in-sphene thermometer yields a temperature range of 746 to 778 ºC for the crystallization of sphene in the tardimagmatic melt. It also constitutes a minimum temperature estimation for biotite partial destabilization in this litholog

    Generación de cuestionarios Moodle con R + exams + Sweave

    Get PDF
    El paquete exams de R tiene como objetivo la generación automática de cuestionarios. Cada cuestionario se caracteriza por tener variantes –tantas como elija el equipo docente- que comparten un enunciado común pero disponen de diferentes datos. El código fuente se redacta en formato Sweave, es decir, una combinación de instrucciones LaTeX y código R mientras que el formato de salida incluye, entre otros, PDF, HTML y XML. El taller se centra en este último formato que permite de forma relativamente sencilla generar actividades para la plataforma de aprendizaje Moodle. En la sesión se practican los tres pasos necesarios para generar un quiz: 1) elaboración del código fuente, 2) obtención del fichero XML, 3) importación a Moodle y configuración del cuestionario. A partir de ejemplos de complejidad creciente se muestra la potencialidad de esta herramienta para implementar actividades on-line en un rango de asignaturas de estadística que abarca desde primer ciclo hasta máster

    Kernel-PCA data integration with enhanced interpretability

    Get PDF
    Background Nowadays, combining the different sources of information to improve the biological knowledge available is a challenge in bioinformatics. One of the most powerful methods for integrating heterogeneous data types are kernel-based methods. Kernel-based data integration approaches consist of two basic steps: firstly the right kernel is chosen for each data set; secondly the kernels from the different data sources are combined to give a complete representation of the available data for a given statistical task. Results We analyze the integration of data from several sources of information using kernel PCA, from the point of view of reducing dimensionality. Moreover, we improve the interpretability of kernel PCA by adding to the plot the representation of the input variables that belong to any dataset. In particular, for each input variable or linear combination of input variables, we can represent the direction of maximum growth locally, which allows us to identify those samples with higher/lower values of the variables analyzed. Conclusions The integration of different datasets and the simultaneous representation of samples and variables together give us a better understanding of biological knowledge

    Kernel conditional Embeddings for associating omic data types

    Get PDF
    Computational methods are needed to combine diverse type of genome-wide data in a meaningful manner. Based on the kernel embedding of conditional probability distributions, a new measure for inferring the degree of association between two multivariate data sources is introduced. We analyze the performance of the proposed measure to integrate mRNA expression, DNA methylation and miRNA expression data

    Machine Learning representation of loss of eye regularity in a drosophila neurodegenerative model

    Get PDF
    The fruit fly compound eye is a premier experimental system for modeling human neurodegenerative diseases. The disruption of the retinal geometry has been historically assessed using time-consuming and poorly reliable techniques such as histology or pseudopupil manual counting. Recent semiautomated quantification approaches rely either on manual region-of-interest delimitation or engineered features to estimate the extent of degeneration. This work presents a fully automated classification pipeline of bright-field images based on orientated gradient descriptors and machine learning techniques. An initial region-of-interest extraction is performed, applying morphological kernels and Euclidean distance-to-centroid thresholding. Image classification algorithms are trained on these regions (support vector machine, decision trees, random forest, and convolutional neural network), and their performance is evaluated on independent, unseen datasets. The combinations of oriented gradient C gaussian kernel Support Vector Machine [0.97 accuracy and 0.98 area under the curve (AUC)] and fine-tuned pre-trained convolutional neural network (0.98 accuracy and 0.99 AUC) yielded the best results overall. The proposed method provides a robust quantification framework that can be generalized to address the loss of regularity in biological patterns similar to the Drosophila eye surface and speeds up the processing of large sample batche

    Avaluació continuada a Disseny Experimental i Anàlisi de Dades mitjançant qüestionaris generats amb R i importats a Moodle

    Get PDF
    Projecte 2015PID‐UB/032En aquest projecte hem incidit en la potencialitat del paquet exams de R per tal de dissenyar la gran majoria de les activitats on-line obligatòries i implementar-les mitjançant la plataforma Moodle de l’assignatura de Disseny Experimental i Anàlisi de Dades (DEAD, per abreujar) que és una assignatura troncal de quart curs a tots els graus de la Facultat de Biologia. Per una part, amb l’ús d’exams, es pot crear un informe reproduïble amb R i Latex que produeix moltes variants de qüestionaris, cadascuna amb diferents dades associades. Per altre, el grau de complexitat és elevat degut a les tècniques estadístiques avançades com diferents dissenys d’experiments, models de regressió, etc. Per tant, aquestes activitats tenen dues components essencials: individualització i acreditació automàtica. Això comporta que l’aprenentatge continuat de l’alumne sigui fluid i personalitzat sense produir un col·lapse al professor. Segons els resultats dels indicadors avaluats, els objectius proposats de creació de material s’ha assolit satisfactòriament però l’ús per part dels estudiants d’aquestes activitats durant el curs ha sigut dispers

    Projecte 2014PID‐UB/021

    Full text link
    En aquest projecte hem explorat les funcionalitats del paquet exams de R per tal d’implementar activitats individualitzades en Moodle. El mòdul exams permet incorporar en el banc de Moodle diferents tipus de preguntes, les més senzilles i habituals són les numèriques i les multichoice, si bé pels propòsits d’aquest projecte destaquen especialment les cloze. L’avantatge principal d’utilitzar exams en lloc de redactar directament les preguntes des del propi Moodle és que una mateixa pregunta amb exams pot tenir moltes variants, cadascuna amb diferents dades associades. Un cop s’integra la pregunta en un qüestionari del campus, aquest subministra aleatòriament a cada estudiant una d’aquestes variants corregint automàticament les respostes. El projecte tenia un perfil principalment exploratori de les capacitats d’exams però hem avançat força en el seu maneig de forma que hem pogut proposar als alumnes cinc activitats. No hem apreciat problemes tècnics rellevants, la participació dels estudiants ha resultat majoritària i molt satisfactòria tenint en compte el seu caràcter voluntari. La nostre conclusió és que aquesta tecnologia resulta molt eficient per dotar a qualsevol curs d’Estadística d’activitats individualitzades sota el paraigües Moodle. Estem disposats en un proper projecte PMID a dissenyar amb exams totes les activitats on-line obligatòries de l’assignatura
    corecore