77 research outputs found

    Advances in Learning Bayesian Networks of Bounded Treewidth

    Full text link
    This work presents novel algorithms for learning Bayesian network structures with bounded treewidth. Both exact and approximate methods are developed. The exact method combines mixed-integer linear programming formulations for structure learning and treewidth computation. The approximate method consists in uniformly sampling kk-trees (maximal graphs of treewidth kk), and subsequently selecting, exactly or approximately, the best structure whose moral graph is a subgraph of that kk-tree. Some properties of these methods are discussed and proven. The approaches are empirically compared to each other and to a state-of-the-art method for learning bounded treewidth structures on a collection of public data sets with up to 100 variables. The experiments show that our exact algorithm outperforms the state of the art, and that the approximate approach is fairly accurate.Comment: 23 pages, 2 figures, 3 table

    Total Variation Distance Estimation Is as Easy as Probabilistic Inference

    Full text link
    In this paper, we establish a novel connection between total variation (TV) distance estimation and probabilistic inference. In particular, we present an efficient, structure-preserving reduction from relative approximation of TV distance to probabilistic inference over directed graphical models. This reduction leads to a fully polynomial randomized approximation scheme (FPRAS) for estimating TV distances between distributions over any class of Bayes nets for which there is an efficient probabilistic inference algorithm. In particular, it leads to an FPRAS for estimating TV distances between distributions that are defined by Bayes nets of bounded treewidth. Prior to this work, such approximation schemes only existed for estimating TV distances between product distributions. Our approach employs a new notion of partialpartial couplings of high-dimensional distributions, which might be of independent interest.Comment: 24 page

    Uncertainty Reasoning for Probabilistic Petri Nets via Bayesian Networks

    Get PDF

    Parameterized Completeness Results for Bayesian Inference

    Get PDF
    We present completeness results for inference in Bayesian networks with respect to two different parameterizations, namely the number of variables and the topological vertex separation number. For this we introduce the parameterized complexity classes W[1]PP and XLPP, which relate to W[1] and XNLP respectively as PP does to NP. The second parameter is intended as a natural translation of the notion of pathwidth to the case of directed acyclic graphs, and as such it is a stronger parameter than the more commonly considered treewidth. Based on a recent conjecture, the completeness results for this parameter suggest that deterministic algorithms for inference require exponential space in terms of pathwidth and by extension treewidth. These results are intended to contribute towards a more precise understanding of the parameterized complexity of Bayesian inference and thus of its required computational resources in terms of both time and space

    Solving Optimization Problems via Maximum Satisfiability : Encodings and Re-Encodings

    Get PDF
    NP-hard combinatorial optimization problems are commonly encountered in numerous different domains. As such efficient methods for solving instances of such problems can save time, money, and other resources in several different applications. This thesis investigates exact declarative approaches to combinatorial optimization within the maximum satisfiability (MaxSAT) paradigm, using propositional logic as the constraint language of choice. Specifically we contribute to both MaxSAT solving and encoding techniques. In the first part of the thesis we contribute to MaxSAT solving technology by developing solver independent MaxSAT preprocessing techniques that re-encode MaxSAT instances into other instances. In order for preprocessing to be effective, the total time spent re-encoding the original instance and solving the new instance should be lower than the time required to directly solve the original instance. We show how the recently proposed label-based framework for MaxSAT preprocessing can be efficiently integrated with state-of-art MaxSAT solvers in a way that improves the empirical performance of those solvers. We also investigate the theoretical effect that label-based preprocessing has on the number of iterations needed by MaxSAT solvers in order to solve instances. We show that preprocessing does not improve best-case performance (in the number of iterations) of MaxSAT solvers, but can improve the worst-case performance. Going beyond previously proposed preprocessing rules we also propose and evaluate a MaxSAT-specific preprocessing technique called subsumed label elimination (SLE). We show that SLE is theoretically different from previously proposed MaxSAT preprocessing rules and that using SLE in conjunction with other preprocessing rules improves empirical performance of several MaxSAT solvers. In the second part of the thesis we propose and evaluate new MaxSAT encodings to two important data analysis tasks: correlation clustering and bounded treewidth Bayesian network learning. For both problems we empirically evaluate the resulting MaxSAT-based solution approach with other exact algorithms for the problems. We show that, on many benchmarks, the MaxSAT-based approach is faster and more memory efficient than other exact approaches. For correlation clustering, we also show that the quality of solutions obtained using MaxSAT is often significantly higher than the quality of solutions obtained by approximative (inexact) algorithms. We end the thesis with a discussion highlighting possible further research directions.Kombinatorinen optimointi on laajasti tutkittu matematiikan ja tietojenkäsittelytieteen osa-alue. Kombinatorisissa optimointiongelmissa diskreetin ratkaisujen joukon yli määritelty kustannusfunktio määrittää kunkin ratkaisun hyvyyden. Tehtävänä on löytää sallittujen ratkaisujen joukosta kustannusfunktion mukaan paras mahdollinen. Esimerkiksi niin sanotussa kauppamatkustajan ongelmassa annettuna joukko kaupunkeja tavoitteena on löytää lyhin mahdollinen reitti, jota kulkemalla voidaan käydä kaikissa kaupungeissa. Kauppamatkustajan ongelma sekä monet muut kombinatoriset optimointiongelmat ovat laskennallisesti haastavia, tarkemmin ilmaistuna NP-vaikeita. Haastavia kombinatorisia optimointiongelmia esiintyy monilla eri tieteen ja teollisuuden aloilla; esimerkiksi useat koneoppimiseen liittyvät ongelmat voidaan esittää kombinatorisina optimointiongelmina. Kombinatoristen optimointiongelmien moninaisuus motivoi tehokkaiden ratkaisualgoritmien kehitystä. Väitöskirjassa kehitetään deklaratiivisia ratkaisumenetelmiä NP-vaikeille optimointiongelmille. Deklaratiivinen ratkaisumenetelmä olettaa, että ratkaistavalle ongelmalle on olemassa jonkin matemaattisen rajoitekielen rajoitemalli, joka kuvaa kunkin ongelman instanssin joukkona matemaattisia rajoitteita siten, että kunkin rajoiteinstanssin optimaalinen ratkaisu voidaan tulkita alkuperäisen ongelman optimaalisena ratkaisuna. Deklaratiivisessa ratkaisumenetelmässä ratkaistavan optimointiongelman instanssi ratkaistaan kuvaamalla ensin instanssi rajoitemallilla joukoksi rajoitteita ja ratkaisemalla sitten rajoiteinstanssi rajoitekielen ratkaisualgoritmilla. Työssä käytetään lauselogiikkaa rajoitekielenä ja keskitytään lauselogiikan toteutuvuusongelman (SAT) laajennukseen optimointiongelmille. Tätä ongelmaa kutsutaan nimellä MaxSAT. Työssä kehitetään sekä sekä yleisiä MaxSAT-ratkaisumenetelmiä että MaxSAT-malleja tietyille koneoppimiseen liittyville optimointiongelmille. Väitöskirjan keskeiset kontribuutiot esitellään kahdessa osassa. Ensimmäisessä osassa kehitetään MaxSAT-ratkaisumenetelmiä, tarkemmin sanottuna MaxSAT-esikäsittelymenetelmiä. Esikäsittelymenetelmät ovat tehokkaasti laskettavissa olevia päättelysääntöjä (esikäsittelysääntöjä), joita käyttämällä annettuja MaxSAT-instansseja voidaan yksinkertaistaa. Esikäsittelyn tavoitteena on tehdä MaxSAT-instansseista helpommin ratkaistavia käytännössä. Väitöstyössä: i) esitellään tapa integroida keskeiset lauselogiikan toteutuvuusongelman esikäsittelysäännöt nykyaikaisiin MaxSAT-ratkaisualgoritmeihin ii) analysoidaan esikäsittelyn vaikutusta ratkaisualgoritmien käyttäytymiseen ja iii) esitellään uusi MaxSAT-esikäsittelysääntö. Kaikkia kontribuutioita MaxSAT-esikäsittelyyn analysoidaan sekä teoreettisella että kokeellisella tasolla. Kirjan toisessa osassa kehitetään MaxSAT-malleja kahdelle koneoppimiseen liittyvälle optimointiongelmalle: korrelaatioklusteroinnille ja Bayes-verkkojen rakenteenoppimisongelmalle. Kehitettäviä malleja analysoidaan sekä teoreettisesti, että kokeellisesti. Teoreettisella tasolla mallit todistetaan oikeellisiksi. Kokeellisella tasolla osoitetaan, että mallit mahdollistavat alkuperäisten ongelmien instanssien tehokkaan ratkaisemisen aiemmin näille ongelmille esiteltyihin eksakteihin ratkaisualgoritmeihin verrattuna
    corecore