2 research outputs found

    Information Geometry of Reversible Markov Chains

    Full text link
    We analyze the information geometric structure of time reversibility for parametric families of irreducible transition kernels of Markov chains. We define and characterize reversible exponential families of Markov kernels, and show that irreducible and reversible Markov kernels form both a mixture family and, perhaps surprisingly, an exponential family in the set of all stochastic kernels. We propose a parametrization of the entire manifold of reversible kernels, and inspect reversible geodesics. We define information projections onto the reversible manifold, and derive closed-form expressions for the e-projection and m-projection, along with Pythagorean identities with respect to information divergence, leading to some new notion of reversiblization of Markov kernels. We show the family of edge measures pertaining to irreducible and reversible kernels also forms an exponential family among distributions over pairs. We further explore geometric properties of the reversible family, by comparing them with other remarkable families of stochastic matrices. Finally, we show that reversible kernels are, in a sense we define, the minimal exponential family generated by the m-family of symmetric kernels, and the smallest mixture family that comprises the e-family of memoryless kernels

    Tree models :algorithms and information theoretic properties

    Get PDF
    La tesis estudia propiedades fundamentales y algoritmos relacionados con modelos 谩rbol. Estos modelos requieren una cantidad relativamente peque帽a de par谩metros para representar fuentes de memoria finita (Markov) sobre alfabetos finitos, cuando el largo de la cantidad de s铆mbolos pasados necesaria para determinar la distribuci贸n de probabilidad condicional del siguiente s铆mbolo no es fija, sino que depende del contexto en el cual ocurre el s铆mbolo. La tesis define estructuras combinatorias como 谩rboles de contexto generalizados y sus clausuras FSM (del ingl茅s finite state machine), y aplica estas estructuras para describir la primera implementaci贸n en tiempo lineal de codificaci贸n y decodificaci贸n de la versi贸n semi-predictiva del algoritmo Context, un esquema doblemente universal que alcanza una tasa de convergencia 贸ptima a la entrop铆a en la clases de modelos 谩rbol. La tesis analiza luego clases de tipo para modelos 谩rbol, extendiendo el m茅todo de tipos previamente estudiado para modelos FSM. Se deriva una f贸rmula exacta para la cardinalidad de una clase de tipo para una secuencia de largo n dada, as铆 como una estimaci贸n asint贸tica del valor esperado del logaritmo del tama帽o de una clase de tipo, y una estimaci贸n asint贸tica del n煤mero de clases de tipo diferentes para secuencias de un largo dado. Estos resultados asint贸ticos se derivan con la ayuda del nuevo concepto de extensi贸n can贸nica m铆nima de un 谩rbol de contexto, un objeto combinatorio fundamental que se encuentra entre el 谩rbol original y su clausura FSM. Como aplicaciones de las nuevas propiedades descubiertas para modelos 谩rbol, se presentan algoritmos de codificaci贸n enumerativa doblemente universales y esquemas de simulaci贸n universal para secuencias individuales. Finalmente, la tesis presenta algunos problemas abiertos y direcciones para investigaciones futuras en esta 谩rea
    corecore