11 research outputs found
Proposal, evaluation and application of two new methodologies for genetic profiling in association studies
L'objectiu de l'epidemiologia genètica és comprendre els efectes dels gens i els factors ambientals en la salut humana. Un aspecte important és l’estudi del paper de la variabilitat genètica en el risc de malalties comunes com la diabetis, malalties cardiovasculars, cà ncer, Alzheimer, etc. Aquesta tesi es centra en la identificació de múltiples variants genètiques per predir el risc a la malaltia i presenta dues aproximacions metodològiques per a la identificació de perfils genètics en presència d'epistasi. Un efecte epistà tic o una interacció genètica apareix quan l'efecte conjunt de diversos marcadors genètics sobre el fenotip observat no queda explicat pels seus efectes marginals. La principal dificultat en l'estudi de les interaccions genètiques és que generalment s'analitzen centenars o milers de marcadors genètics, i això fa inviable l'anà lisi de totes les possibles interaccions, des del punt de vista computacional. Les metodologies presentades permeten explorar interaccions d'ordre alt amb un cost computacional raonable. També s’aborda la simulació de dades amb propietats similars a les d’estudis d’associació genètica.The aim of genetic epidemiology is to understand the effects of genes and environmental factors on human health. An important issue is the role of the genetic variability in the risk for common diseases such as diabetes, cardiovascular disease, cancer, Alzheimer's, etc. This thesis is focused on the identification of genetic variants at multiple loci for prediction of disease risk and presents two new methodological approaches to address genomic profiling in presence of epistasis. An epistatic effect or a genetic interaction is present when the combined effect of several genetic markers on the observed phenotype is not explained by their marginal effects. The main difficulty in the study of genetic interactions is that usually hundreds or thousands of genetic markers are analysed, which makes the analysis of all possible interactions unfeasible, from a computational point of view. The proposed methodologies allow higher order interactions to be explored with a reasonable computational cost. Another prominent issue addressed in this thesis is the simulation of data with similar properties to real genetic association studies
Detección de interacciones genéticas asociadas a enfermedades complejas. Aplicación al cáncer de vejiga
El proyecto en el que he participado se engloba dentro del Estudio Español de
Cáncer de Vejiga/EPICURO, que comenzó en 1997 con el propósito de avanzar en el conocimiento de este cáncer respecto a las causas genéticas y ambientales, prevención, prognosis y tratamiento, y que aglutina esfuerzos de distintos grupos de nvestigación. El proyecto está coordinado por Núria Malats, jefa del Grupo de
EpidemiologÃa Genética y Molecular del CNIO (Centro Nacional de Investigaciones
Oncológicas) y es uno de los mayores estudios sobre cáncer de vejiga que se han
realizado. Sus objetivos principales son: (a) analizar el riesgo al cáncer de vejiga en
relación a factores de susceptibilidad genética, tabaco, ocupación, exposiciones ambientales, dieta, drogas e historial médico; y (b) identi car marcadores moleculares que permitan pronosticar el cáncer de vejiga
MB-MDR: Model-Based Multifactor Dimensionality Reduction for detecting interactions in high-dimensional genomic data
L’anà lisi de l’efecte dels gens i els factors ambientals en el desenvolupament de malalties complexes és un gran repte estadÃstic i computacional. Entre les diverses metodologies de mineria de dades que s’han proposat per a l’anà lisi d’interaccions una de les més populars és el mètode Multifactor Dimensionality Reduction, MDR, (Ritchie i al. 2001). L’estratègia d’aquest mètode és reduir la dimensió multifactorial a u mitjançant l’agrupació dels diferents genotips en dos grups de risc: alt i baix. Tot i la seva utilitat demostrada, el mètode MDR té alguns inconvenients entre els quals l’agrupació excessiva de genotips pot fer que algunes interaccions importants no siguin detectades i que no permet ajustar per efectes principals ni per variables confusores. En aquest article il•lustrem les limitacions de l’estratègia MDR i d’altres aproximacions no paramètriques i demostrem la conveniència d’utilitzar metodologies parametriques per analitzar interaccions en estudis cas-control on es requereix l’ajust per variables confusores i per efectes principals. Proposem una nova metodologia, una versió paramètrica del mètode MDR, que anomenem Model-Based Multifactor Dimensionality Reduction (MB-MDR). La metodologia proposada té com a objectiu la identificació de genotips especÃfics que estiguin associats a la malaltia i permet ajustar per efectes marginals i variables confusores. La nova metodologia s’il•lustra amb dades de l’Estudi Espanyol de Cancer de Bufeta
Detección de interacciones genéticas asociadas a enfermedades complejas. Aplicación al cáncer de vejiga
El proyecto en el que he participado se engloba dentro del Estudio Español de
Cáncer de Vejiga/EPICURO, que comenzó en 1997 con el propósito de avanzar en el conocimiento de este cáncer respecto a las causas genéticas y ambientales, prevención, prognosis y tratamiento, y que aglutina esfuerzos de distintos grupos de nvestigación. El proyecto está coordinado por Núria Malats, jefa del Grupo de
EpidemiologÃa Genética y Molecular del CNIO (Centro Nacional de Investigaciones
Oncológicas) y es uno de los mayores estudios sobre cáncer de vejiga que se han
realizado. Sus objetivos principales son: (a) analizar el riesgo al cáncer de vejiga en
relación a factores de susceptibilidad genética, tabaco, ocupación, exposiciones ambientales, dieta, drogas e historial médico; y (b) identi car marcadores moleculares que permitan pronosticar el cáncer de vejiga
Detección de interacciones genéticas asociadas a enfermedades complejas. Aplicación al cáncer de vejiga
El proyecto en el que he participado se engloba dentro del Estudio Español de
Cáncer de Vejiga/EPICURO, que comenzó en 1997 con el propósito de avanzar en el conocimiento de este cáncer respecto a las causas genéticas y ambientales, prevención, prognosis y tratamiento, y que aglutina esfuerzos de distintos grupos de nvestigación. El proyecto está coordinado por Núria Malats, jefa del Grupo de
EpidemiologÃa Genética y Molecular del CNIO (Centro Nacional de Investigaciones
Oncológicas) y es uno de los mayores estudios sobre cáncer de vejiga que se han
realizado. Sus objetivos principales son: (a) analizar el riesgo al cáncer de vejiga en
relación a factores de susceptibilidad genética, tabaco, ocupación, exposiciones ambientales, dieta, drogas e historial médico; y (b) identi car marcadores moleculares que permitan pronosticar el cáncer de vejiga
Vorname - Rufname - Ãœbername
Objective: Genomic profiling, the use of genetic variants at
multiple loci simultaneously for the prediction of disease
risk, requires the selection of a set of genetic variants that
best predicts disease status. The goal of this work was to provide
a new selection algorithm for genomic profiling. Methods:
We propose a new algorithm for genomic profiling
based on optimizing the area under the receiver operating
characteristic curve (AUC) of the random forest (RF). The proposed
strategy implements a backward elimination process
based on the initial ranking of variables. Results and Conclusions:
We demonstrate the advantage of using the AUC instead
of the classification error as a measure of predictive
accuracy of RF. In particular, we show that the use of the classification
error is especially inappropriate when dealing with
unbalanced data sets. The new procedure for variable selection
and prediction, namely AUC-RF, is illustrated with data
from a bladder cancer study and also with simulated data.
The algorithm is publicly available as an R package, named
AUCRF, at http://cran.r-project.org/.This work was partially supported by grant MTM2008-06747-C02-02 from the Ministerio de Educacion y Ciencia (Spain), grant 050831 from the Marato de TV3 Foundation, grant 2009SGR-581 from the AGAUR-Generalitat de Catalunya and the LMU-innovativ Project BioMed-
mbmdr: an R package for exploring gene-gene interactions associated with binary or quantitative traits
Summary: We describe mbmdr, an R package for implementing
the model-based multifactor dimensionality reduction (MB-MDR)
method. MB-MDR has been proposed by Calle et al. as a dimension
reduction method for exploring gene–gene interactions in casecontrol
association studies. It is an extension of the popular
multifactor dimensionality reduction (MDR) method of Ritchie et al.
allowing a more flexible definition of risk cells. In MB-MDR, risk
categories are defined using a regression model which allows
adjustment for covariates and main effects and, in addition to the
classical low risk and high risk categories, MB-MDR considers a
third category of indeterminate or not informative cells. An important
improvement added to the current mbmdr algorithm with respect
to the original MB-MDR formulation in Calle et al. and also to
the classical MDR approach, is the extension of the methodology
to different outcome types. While MB-MDR was initially proposed
for binary traits in the context of case-control studies, the mbmdr
package provides options to analyze both binary or quantitative traits
for unrelated individuals.The Ministerio de Educacion y Ciencia (Spain) (MTM2008-06747-C02-02); La Marato de TV3 Foundation (Grant 050831); Generalitat de Catalunya (2009SGR-581)
Improving strategies for detecting genetic patterns of disease susceptibility in association studies
The analysis of gene interactions and epistatic patterns of susceptibility is especially important for investigating
complex diseases such as cancer characterized by the joint action of several genes. This work
is motivated by a case-control study of bladder cancer, aimed at evaluating the role of both genetic and
environmental factors in bladder carcinogenesis. In particular, the analysis of the inflammation pathway
is of interest, for which information on a total of 282 SNPs in 108 genes involved in the inflammatory
response is available. Detecting and interpreting interactions with such a large number of polymorphisms
is a great challenge from both the statistical and the computational perspectives. In this paper we propose a
two-stage strategy for identifying relevant interactions: (1) the use of a synergy measure among interacting
genes and (2) the use of the model-based multifactor dimensionality reduction method (MB-MDR), a
model-based version of the MDR method, which allows adjustment for confounders