2,426 research outputs found

    Finger Search in Grammar-Compressed Strings

    Get PDF
    Grammar-based compression, where one replaces a long string by a small context-free grammar that generates the string, is a simple and powerful paradigm that captures many popular compression schemes. Given a grammar, the random access problem is to compactly represent the grammar while supporting random access, that is, given a position in the original uncompressed string report the character at that position. In this paper we study the random access problem with the finger search property, that is, the time for a random access query should depend on the distance between a specified index ff, called the \emph{finger}, and the query index ii. We consider both a static variant, where we first place a finger and subsequently access indices near the finger efficiently, and a dynamic variant where also moving the finger such that the time depends on the distance moved is supported. Let nn be the size the grammar, and let NN be the size of the string. For the static variant we give a linear space representation that supports placing the finger in O(logN)O(\log N) time and subsequently accessing in O(logD)O(\log D) time, where DD is the distance between the finger and the accessed index. For the dynamic variant we give a linear space representation that supports placing the finger in O(logN)O(\log N) time and accessing and moving the finger in O(logD+loglogN)O(\log D + \log \log N) time. Compared to the best linear space solution to random access, we improve a O(logN)O(\log N) query bound to O(logD)O(\log D) for the static variant and to O(logD+loglogN)O(\log D + \log \log N) for the dynamic variant, while maintaining linear space. As an application of our results we obtain an improved solution to the longest common extension problem in grammar compressed strings. To obtain our results, we introduce several new techniques of independent interest, including a novel van Emde Boas style decomposition of grammars

    Fast Dynamic Arrays

    Get PDF
    We present a highly optimized implementation of tiered vectors, a data structure for maintaining a sequence of nn elements supporting access in time O(1)O(1) and insertion and deletion in time O(nϵ)O(n^\epsilon) for ϵ>0\epsilon > 0 while using o(n)o(n) extra space. We consider several different implementation optimizations in C++ and compare their performance to that of vector and multiset from the standard library on sequences with up to 10810^8 elements. Our fastest implementation uses much less space than multiset while providing speedups of 40×40\times for access operations compared to multiset and speedups of 10.000×10.000\times compared to vector for insertion and deletion operations while being competitive with both data structures for all other operations

    Development and characterization of a potent free fatty acid receptor 1 (FFA1) fluorescent tracer

    Get PDF
    The free fatty acid receptor 1 (FFA1/GPR40) is a potential target for treatment of type 2 diabetes. Although several potent agonists have been described, there remains a strong need for suitable tracers to interrogate ligand binding to this receptor. We address this by exploring fluorophore-tethering to known potent FFA1 agonists. This led to the development of 4, a high affinity FFA1 tracer with favorable and polarity-dependent fluorescent properties. A close to ideal overlap between the emission spectrum of the NanoLuciferase receptor tag and the excitation spectrum of 4 enabled the establishment of a homogenous BRET-based binding assay suitable for both detailed kinetic studies and high throughput competition binding studies. Using 4 as a tracer demonstrated that the compound acts fully competitively with selected synthetic agonists but not with lauric acid and allowed for the characterization of binding affinities of a diverse selection of known FFA1 agonists, indicating that 4 will be a valuable tool for future studies at FFA1

    Investigation of Starch Binding Domains for Improvement of Starch degradation

    Get PDF
    Dansk resume Stivelse er planternes primære energilager og et vigtigt næringsmiddel for pattedyr,svampe og bakterier. Stivelse deponeres i højt organiserede semi-krystallinske stivelseskorn i plastider: kloroplaster i blade (transitorisk stivelse) og amyloplaster i lagerorganer som knolde. Stivelse består udelukkende af α-1,4-bundne glukose enheder, som er organiseret enten som det stort set lineære amylose molekyle eller det forgrenede amylopektin molekyle, der indeholder α-1,6-bindinger. Rod og knold stivelse er karakteriseret ved et højt niveau af kovalent bundet fosfat. Denne stivelsesbundne fosfat har en stor effekt på både stivelsens fysiske egenskaber samt på stivelsesnedbrydning i planterne. Inkludering af fosfatestre påvirker de industrielle egenskaber, og medfører forskellige meget ønskværdige egenskaber. Enzymet der kan inkorporere fosfat grupper i stivelse er en glucan, water dikinase (GWD). GWD kan fosforylere i C-3 og C-6 positionen i glukose enhederne i stivelse, ved en dikinase reaktion der anvender β-fosfat fra ATP. Mutanter i Arabidopsis thaliana GWD1 udviser en stivelses overskud fænotype med en lavere stivelses nedbrydnings rate, hvilket påviser en forbindelse mellem stivelses fosforylering og stivelses nedbrydning. To homologe proteiner er blevet identificeret i Arabidopsis genomet, navngivet AtGWD2 og AtGWD3. Mutationer i AtGWD3 resulterede også i en stivelses overskud fænotype, som set hos AtGWD1, hvilket tyder på AtGWD3 også er involveret i stivelses nedbrydning. AtGWD3 er lokaliseret i kloroplasterne og substrat analyser viste at oprenset AtGWD3 udviser præference for fosforyleret α-glucaner og katalysere udelukkende fosforylering i C-3 positionen i glukose enhederne. Disse resultater tyder på at AtGWD1 og AtGWD3 arbejder sammen i en efterfølgende fosforyleringskaskade, som er nødvendig for nedbrydning af stivelse. Glycosyl hydrolasers nedbrydning af rå stivelse er relativ ineffektiv, da polysacharrid kæderne ofte ikke er blotlagte og tilgængelige for enzymernes aktive site. Mange stivelses nedbrydende enzymer har ekstra bindings sites i det katalytiske domæne eller på separate stivelsesbindings domæner (SBD) som muliggør denne interaktion. SBDer er klassificeret i CAZy databasen i forskellige kulhydrat bindings module (CBM)familier. AtGWD1 og AtGWD2 har et tandem repeat af SBDer som tilhører familie CBM45 og AtGWD3 har et enkelt SBD fra familie CBM20. Alle er N-terminalt lokaliseret. Formålet med dette PhD projekt har været at undersøge og karakterisere GWD3-SBDs biokemiske funktion. GWD3-SBD er blevet udtrykt succesfuldt som et isoleret domæne i E. coli og oprenset. Øget stabilitet af domænet blev opnået efter yderligere aminosyrer blev inddraget i den kodende sekvens. Binding til 5 stivelseskorn var svært at måle, og det skyldes højst sandsynligt konsekvensen af den højt specialiserede rolle som GWD3 spiller i stivelses fosforyleringen. Enzymet er reguleret i kloroplasten og kun meget specialiserede områder på stivelses kornene er egnede for fosforylering i C-3 positionen og det er svært at finde forhold, hvor alle parametre er optimale. Binding til små ligosaccharider, som β-cyclodextrins (β-CD) er blevet bestemt med Surface plasmon resonance og domænet tilhører en gruppe af lav affinitets bindere, denne kategori inkluderer ikke-hydrolyserende enzymer. Den overordnede struktur fundet hos CBM20 er ifølge en homologimodellering bevaret i GWD3-SBD og bindings site 1, som er involveret i initial binding er vel bevaret både i strukturen og på sekvens niveau. Sammenlignet med andre karakteriserede CBM20, så har GWD3-SBD et mindre loop i området omkring bindings site 2. Dette loop er under substrat binding i andre CBM20 meget fleksibelt og dette kan forklare den lavere bindings kapacitet fundet hos GWD3- SBD. Fluorescens mærkning og confocal laser scanning microskopi er blevet anvendt som en metode til at visualisere SBD og hydrolyserende enzymers, f.eks. glucoamylase og α-amylases binding til stivelseskorn. Denne metode blev anvendt sammen med transient ekspression af en yellow-fluorescent protein YFP-GWD3-SBD fusion i tobaksplanter for at verificeres stivelsesbinding
    corecore