166 research outputs found
El problema de Behrens-Fisher en la investigación biomédica. Análisis crítico de un estudio clínico mediante simulación
En el artículo se hace una revisión del problema de Behrens-Fisher, discutiendo los fundamentos inferenciales asociados a la dificultad de su resolución y exponiendo las soluciones prácticas más comunes, juntamente con una nueva solución basada en conceptos de geometría diferencial. A continuación, se realiza un estudio crítico de una investigación biomédica en donde las verdaderas probabilidades de error son distintas de las supuestas debido a que se ignoran probables diferencias entre las varianzas. En dicha investigación se rechazó la hipótesis nula de igualdad de medias (p < 0.01 ), si bien, la verdadera probabilidad de error de tipo I para valores próximos a los muestrales parece ser otra. Con este fin, se realiza un estudio de Monte Cario para obtener estas estimaciones según se utilice el test t de Student de comparación de medias o diferentes soluciones más apropiadas para el problema de Behrens-Fisher. En este estudio de simulación se usa una técnica de reducción de la varianza específica para variables de respuesta dicotómica tales como contrastes de hipótesis (aceptar, no aceptar la hipótesis nula). Se presenta brevemente esta técnica y se ilustra como se diseña la simulación de acuerdo con la mismaPeer Reviewe
Discovery and classification of complex multimorbidity patterns: unravelling chronicity networks and their social profiles
Multimorbidity can be defined as the presence of two or more chronic diseases in an individual. This condition is associated with reduced quality of life, increased disability, greater functional impairment, increased health care utilisation, greater fragmentation of care and complexity of treatment, and increased mortality. Thus, understanding its epidemiology and inherent complexity is essential to improve the quality of life of patients and to reduce the costs associated with multi-pathology. In this paper, using data from the European Health Survey, we explore the application of Mixed Graphical Models and its combination with social network analysis techniques for the discovery and classification of complex multimorbidity patterns. The results obtained show the usefulness and versatility of this approach for the study of multimorbidity based on the use of graphs, which offer the researcher a holistic view of the relational structure of data with variables of different types and high dimensionality
Kernel Methods for Dimensionality Reduction Applied to the «Omics» Data
Microarray technology has been advanced to the point at which the simultaneous monitoring
of gene expression on a genome scale is now possible. Microarray experiments often aim to
identify individual genes that are differentially expressed under distinct conditions, such as
between two or more phenotypes, cell lines, under different treatment types or diseased and
healthy subjects. Such experiments may be the first step towards inferring gene function and
constructing gene networks in systems biology.
The term ”gene expression profile” refers to the gene expression values on all arrays for
a given gene in different groups of arrays. Frequently, a summary statistic of the gene
expression values, such as the mean or the median, is also reported. Dot plots of the gene
expression measurements in subsets of arrays, and line plots of the summaries of gene
expression measurements are the most common plots used to display gene expression data
(See for example Chambers (1983) and references therein)..
Chemical characterization of igneous sphene and application of the Zr-in-sphene thermometer to tardimagmatic processes
This preliminary work illustrates the chemical composition of sphene from Variscan tonalites with
sphene-centered ocellar texture (Ribadelago pluton, NW Iberian Massif). The ocellar texture is linked with
the percolation of a tardimagmatic melt, with trondhjemitic affinities, through an hyperdense crystal mush.
Chemical zoning in sphene, revealed by BSE imaging, shows a heterogeneous distribution of heavy trace
elements (Nb, Y, Ce and Zr) that depicts concentric, oscillatory, sector and patchy patterns. Application of
the Zr-in-sphene thermometer yields a temperature range of 746 to 778 ºC for the crystallization of
sphene in the tardimagmatic melt. It also constitutes a minimum temperature estimation for biotite partial
destabilization in this litholog
Generación de cuestionarios Moodle con R + exams + Sweave
El paquete exams de R tiene como objetivo la generación automática de cuestionarios. Cada cuestionario se caracteriza por tener variantes –tantas como elija el equipo docente- que comparten un enunciado común pero disponen de diferentes datos. El código fuente se redacta en formato Sweave, es decir, una combinación de instrucciones LaTeX y código R mientras que el formato de salida incluye, entre otros, PDF, HTML y XML. El taller se centra en este último formato que permite de forma relativamente sencilla generar actividades para la plataforma de aprendizaje Moodle. En la sesión se practican los tres pasos necesarios para generar un quiz: 1) elaboración del código fuente, 2) obtención del fichero XML, 3) importación a Moodle y configuración del cuestionario. A partir de ejemplos de complejidad creciente se muestra la potencialidad de esta herramienta para implementar actividades on-line en un rango de asignaturas de estadística que abarca desde primer ciclo hasta máster
Kernel-PCA data integration with enhanced interpretability
Background Nowadays, combining the different sources of information to improve the biological knowledge available is a challenge in bioinformatics. One of the most powerful methods for integrating heterogeneous data types are kernel-based methods. Kernel-based data integration approaches consist of two basic steps: firstly the right kernel is chosen for each data set; secondly the kernels from the different data sources are combined to give a complete representation of the available data for a given statistical task. Results We analyze the integration of data from several sources of information using kernel PCA, from the point of view of reducing dimensionality. Moreover, we improve the interpretability of kernel PCA by adding to the plot the representation of the input variables that belong to any dataset. In particular, for each input variable or linear combination of input variables, we can represent the direction of maximum growth locally, which allows us to identify those samples with higher/lower values of the variables analyzed. Conclusions The integration of different datasets and the simultaneous representation of samples and variables together give us a better understanding of biological knowledge
Kernel conditional Embeddings for associating omic data types
Computational methods are needed to combine diverse type of genome-wide data in a meaningful manner. Based on the kernel embedding of conditional probability distributions, a new measure for inferring the degree of association between two multivariate data sources is introduced. We analyze the performance of the proposed measure to integrate mRNA expression, DNA methylation and miRNA expression data
Machine Learning representation of loss of eye regularity in a drosophila neurodegenerative model
The fruit fly compound eye is a premier experimental system for modeling human neurodegenerative diseases. The disruption of the retinal geometry has been historically assessed using time-consuming and poorly reliable techniques such as histology or pseudopupil manual counting. Recent semiautomated quantification approaches rely either on manual region-of-interest delimitation or engineered features to estimate the extent of degeneration. This work presents a fully automated classification pipeline of bright-field images based on orientated gradient descriptors and machine learning techniques. An initial region-of-interest extraction is performed, applying morphological kernels and Euclidean distance-to-centroid thresholding. Image classification algorithms are trained on these regions (support vector machine, decision trees, random forest, and convolutional neural network), and their performance is evaluated on independent, unseen datasets. The combinations of oriented gradient C gaussian kernel Support Vector Machine [0.97 accuracy and 0.98 area under the curve (AUC)] and fine-tuned pre-trained convolutional neural network (0.98 accuracy and 0.99 AUC) yielded the best results overall. The proposed method provides a robust quantification framework that can be generalized to address the loss of regularity in biological patterns similar to the Drosophila eye surface and speeds up the processing of large sample batche
Avaluació continuada a Disseny Experimental i Anàlisi de Dades mitjançant qüestionaris generats amb R i importats a Moodle
Projecte 2015PID‐UB/032En aquest projecte hem incidit en la potencialitat del paquet exams de R per tal de dissenyar la gran majoria de les activitats on-line obligatòries i implementar-les mitjançant la plataforma Moodle de l’assignatura de Disseny Experimental i Anàlisi de Dades (DEAD, per abreujar) que és una assignatura troncal de quart curs a tots els graus de la Facultat de Biologia. Per una part, amb l’ús d’exams, es pot crear un informe reproduïble amb R i Latex que produeix moltes variants de qüestionaris, cadascuna amb diferents dades associades. Per altre, el grau de complexitat és elevat degut a les tècniques estadístiques avançades com diferents dissenys d’experiments, models de regressió, etc. Per tant, aquestes activitats tenen dues components essencials: individualització i acreditació automàtica. Això comporta que l’aprenentatge continuat de l’alumne sigui fluid i personalitzat sense produir un col·lapse al professor.
Segons els resultats dels indicadors avaluats, els objectius proposats de creació de material s’ha assolit satisfactòriament però l’ús per part dels estudiants d’aquestes activitats durant el curs ha sigut dispers
Projecte 2014PID‐UB/021
En aquest projecte hem explorat les funcionalitats del paquet exams de R per
tal d’implementar activitats individualitzades en Moodle. El mòdul exams permet
incorporar en el banc de Moodle diferents tipus de preguntes, les més senzilles
i habituals són les numèriques i les multichoice, si bé pels propòsits d’aquest
projecte destaquen especialment les cloze. L’avantatge principal d’utilitzar
exams en lloc de redactar directament les preguntes des del propi Moodle és
que una mateixa pregunta amb exams pot tenir moltes variants, cadascuna
amb diferents dades associades. Un cop s’integra la pregunta en un qüestionari
del campus, aquest subministra aleatòriament a cada estudiant una d’aquestes
variants corregint automàticament les respostes.
El projecte tenia un perfil principalment exploratori de les capacitats d’exams
però hem avançat força en el seu maneig de forma que hem pogut proposar als
alumnes cinc activitats. No hem apreciat problemes tècnics rellevants, la
participació dels estudiants ha resultat majoritària i molt satisfactòria tenint en
compte el seu caràcter voluntari.
La nostre conclusió és que aquesta tecnologia resulta molt eficient per dotar a
qualsevol curs d’Estadística d’activitats individualitzades sota el paraigües
Moodle. Estem disposats en un proper projecte PMID a dissenyar amb exams
totes les activitats on-line obligatòries de l’assignatura
- …