Analiza kompleksnosti skrivenih Markovljevih modela

Valčić, Irma

thesis

Analiza kompleksnosti skrivenih Markovljevih modela

Authors: Irma Valčić
Publication date: 13 July 2015
Publisher: University of Zagreb. Faculty of Science. Department of Mathematics.

Abstract

U ovom radu analizirali smo skrivene Markovljeve modele, statistički alat koji danas nalazi sve veću primjenu u različitim područjima. Dali smo njihovu formalnu definiciju, opisali neke algoritme za rad sa skrivenim Markovljevim modelima i implementirali ih u programskom jeziku Python. Konstruirali smo i primjer povremeno nepoštene kockarnice kao osnovu za kompliciranije primjene u bioinformatici (npr. modeliranje genoma), proveli simulaciju te pokušali pronaći najbolji model koji bi opisao tako dobivene podatke. Koristili smo nekoliko statističkih metoda za odabir najboljeg modela — maksimizaciju vjerodostojnosti, omjer vjerodostojnosti, AIC i BIC — no niti jedna od tih metoda nije dala dobar rezultat. To ukazuje na kompleksnost skrivenih Markovljevih modela unatoč tome što intuitivno ne djeluju kao nešto iznimno složeno.This thesis explores hidden Markov models, a powerful statistical tool applied in various scientific fields. We give the formal definition of a hidden Markov model, describe several algorithms traditionally used in their analysis and present their implementation in Python. We also construct an example of an occasionally dishonest casino as the basis for more complicated applications in bioinformatics (e.g. genome analysis), simulate data and attempt to find the best model for it. Several statistical methods are used — likelihood maximization, log-likelihood ratio, AIC and BIC — but none of them yield satisfactory results. This indicates the complexity of hidden Markov models even though initially they may not appear particularly difficult