12 research outputs found

    ABC likelihood-freee methods for model choice in Gibbs random fields

    Full text link
    Gibbs random fields (GRF) are polymorphous statistical models that can be used to analyse different types of dependence, in particular for spatially correlated data. However, when those models are faced with the challenge of selecting a dependence structure from many, the use of standard model choice methods is hampered by the unavailability of the normalising constant in the Gibbs likelihood. In particular, from a Bayesian perspective, the computation of the posterior probabilities of the models under competition requires special likelihood-free simulation techniques like the Approximate Bayesian Computation (ABC) algorithm that is intensively used in population genetics. We show in this paper how to implement an ABC algorithm geared towards model choice in the general setting of Gibbs random fields, demonstrating in particular that there exists a sufficient statistic across models. The accuracy of the approximation to the posterior probabilities can be further improved by importance sampling on the distribution of the models. The practical aspects of the method are detailed through two applications, the test of an iid Bernoulli model versus a first-order Markov chain, and the choice of a folding structure for two proteins.Comment: 19 pages, 5 figures, to appear in Bayesian Analysi

    Choix de modèle pour les champs de Gibbs par un algorithme ABC.

    Get PDF
    International audienceLes champs de Gibbs sont des modèles souvent utilisés pour l'analyse de données présentant des corrélations spatiales. La définition du modèle est alors liée à un système de voisinage ; dans certains cas, plusieurs peuvent être proposés. Pour chaque système de voisinage, un modèle de champ de Gibbs peut être construit et sélectionner le système de voisinage est finalement un problème de choix de modèle. Nous travaillons dans un cadre Bayésien. Nous définissons un nouveau paramètre incluant les paramètres de chacun des modèles et l'indice du modèle. Le choix de modèle repose alors sur l'évaluation des probabilités a posteriori des modèles ou des facteurs de Bayes. Les méthodes utilisées habituellement ne peuvent être appliquées ici car la vraisemblance des champs de Gibbs est disponible à un facteur de normalisation près. Nous proposons donc une approche “ sans vraisemblance”, basée sur un algorithme ABC (Approximate Bayesian Computation). L'algorithme ABC-MC (MC signifiant Model Choice) génère un échantillon dont la distribution est approximativement la distribution a posteriori de l'ensemble des paramètres, échantillon que nous utilisons pour évaluer les probabilités a posteriori des modèles. Nous étudions les performances de cette méthode sur deux modèles qui sont des cas particuliers de champs de Gibbs pour lesquels la vraisemblance est entièrement disponible. Nous utilisons ensuite l'algorithme ABC-MC pour choisir la structure 3D d'une protéine parmi un ensemble de candidats proposés par une méthode de threading. Nous montrons les résultats obtenus pour une protéine de la bactérie Thermotaga maritima

    Détection de sélection darwinienne sur un gène par une approche sans vraisemblance

    No full text
    International audienceEn génétique des populations, les modèles sont souvent complexes ce qui rend l'évaluation de la vraisemblance difficile, si ce n'est impossible. En revanche, des mécanismes de génération de données sont parfois disponibles ce qui explique pourquoi les méthodes d'inférence bayésienne sans vraisemblance sont si utilisées dans ce domaine. Nous nous intéressons ici à la détection des effets de la sélection darwinienne sur un gène. Les données sont alors constituées d'un ensemble de séquences homologues. Notre objectif est d'estimer la distribution a posteriori de certains paramètres, les autres étant considérés comme des paramètres de nuisance. Ces derniers incluent un arbre phylogénétique qui est ici représenté par un arbre de coalescence, ce qui correspond au modèle de Moran. Sous cette hypothèse, nous pouvons construire un mécanisme de génération de données. Notre procédure d'estimation repose sur l'algorithme ABC-SMC (Del Moral et al., 2009). Nous montrerons ici les résultats obtenus sur le gène \textitenv du virus HIV

    ABC methods for model choice in Gibbs random fields

    Get PDF
    National audienceOn s'intéresse au problème du choix bayésien de modèles de champs de Gibbs. Ce choix repose sur l'évaluation des probabilités a posteriori des modèles. Nous montrons l'existence d'une statistique exhaustive pour l'ensemble des paramètres, incluant l'indice du modèle, constituée de la concaténation de statistiques exhaustives de chacun des modèles. Nous utilisons cette statistique pour construire un algorithme ABC

    Choix de modèle pour les champs de Gibbs par un algorithme ABC.

    Get PDF
    International audienceLes champs de Gibbs sont des modèles souvent utilisés pour l'analyse de données présentant des corrélations spatiales. La définition du modèle est alors liée à un système de voisinage ; dans certains cas, plusieurs peuvent être proposés. Pour chaque système de voisinage, un modèle de champ de Gibbs peut être construit et sélectionner le système de voisinage est finalement un problème de choix de modèle. Nous travaillons dans un cadre Bayésien. Nous définissons un nouveau paramètre incluant les paramètres de chacun des modèles et l'indice du modèle. Le choix de modèle repose alors sur l'évaluation des probabilités a posteriori des modèles ou des facteurs de Bayes. Les méthodes utilisées habituellement ne peuvent être appliquées ici car la vraisemblance des champs de Gibbs est disponible à un facteur de normalisation près. Nous proposons donc une approche “ sans vraisemblance”, basée sur un algorithme ABC (Approximate Bayesian Computation). L'algorithme ABC-MC (MC signifiant Model Choice) génère un échantillon dont la distribution est approximativement la distribution a posteriori de l'ensemble des paramètres, échantillon que nous utilisons pour évaluer les probabilités a posteriori des modèles. Nous étudions les performances de cette méthode sur deux modèles qui sont des cas particuliers de champs de Gibbs pour lesquels la vraisemblance est entièrement disponible. Nous utilisons ensuite l'algorithme ABC-MC pour choisir la structure 3D d'une protéine parmi un ensemble de candidats proposés par une méthode de threading. Nous montrons les résultats obtenus pour une protéine de la bactérie Thermotaga maritima

    Choix de modèle pour les champs de Gibbs par un algorithme ABC.

    No full text
    International audienceLes champs de Gibbs sont des modèles souvent utilisés pour l'analyse de données présentant des corrélations spatiales. La définition du modèle est alors liée à un système de voisinage ; dans certains cas, plusieurs peuvent être proposés. Pour chaque système de voisinage, un modèle de champ de Gibbs peut être construit et sélectionner le système de voisinage est finalement un problème de choix de modèle. Nous travaillons dans un cadre Bayésien. Nous définissons un nouveau paramètre incluant les paramètres de chacun des modèles et l'indice du modèle. Le choix de modèle repose alors sur l'évaluation des probabilités a posteriori des modèles ou des facteurs de Bayes. Les méthodes utilisées habituellement ne peuvent être appliquées ici car la vraisemblance des champs de Gibbs est disponible à un facteur de normalisation près. Nous proposons donc une approche “ sans vraisemblance”, basée sur un algorithme ABC (Approximate Bayesian Computation). L'algorithme ABC-MC (MC signifiant Model Choice) génère un échantillon dont la distribution est approximativement la distribution a posteriori de l'ensemble des paramètres, échantillon que nous utilisons pour évaluer les probabilités a posteriori des modèles. Nous étudions les performances de cette méthode sur deux modèles qui sont des cas particuliers de champs de Gibbs pour lesquels la vraisemblance est entièrement disponible. Nous utilisons ensuite l'algorithme ABC-MC pour choisir la structure 3D d'une protéine parmi un ensemble de candidats proposés par une méthode de threading. Nous montrons les résultats obtenus pour une protéine de la bactérie Thermotaga maritima
    corecore