    String Indexing with Compressed Patterns

    Given a string S of length n, the classic string indexing problem is to preprocess S into a compact data structure that supports efficient subsequent pattern queries. In this paper we consider the basic variant where the pattern is given in compressed form and the goal is to achieve query time that is fast in terms of the compressed size of the pattern. This captures the common client-server scenario, where a client submits a query and communicates it in compressed form to a server. Instead of the server decompressing the query before processing it, we consider how to efficiently process the compressed query directly. Our main result is a novel linear space data structure that achieves near-optimal query time for patterns compressed with the classic Lempel-Ziv 1977 (LZ77) compression scheme. Along the way we develop several data structural techniques of independent interest, including a novel data structure that compactly encodes all LZ77 compressed suffixes of a string in linear space and a general decomposition of tries that reduces the search time from logarithmic in the size of the trie to logarithmic in the length of the pattern

    Constraints on Neutron Star Crusts From Oscillations in Giant Flares

    We show that the fundamental seismic shear mode, observed as a quasi-periodic oscillation in giant flares emitted by highly-magnetized neutron stars, is particularly sensitive to the nuclear physics of the crust. The identification of an oscillation at ~ 30 Hz as the fundamental crustal shear mode requires a nuclear symmetry energy that depends very weakly on density near saturation. If the nuclear symmetry energy varies more strongly with density, then lower frequency oscillations, previously identified as torsional Alfven modes of the fluid core, could instead be associated with the crust. If this is the case, then future observations of giant flares should detect oscillations at around 18 Hz. An accurate measurement of the neutron skin thickness of lead will also constrain the frequencies predicted by the model.Comment: 5 pages, 3 figures; Version to appear in Phys. Rev. Let

    Differentially Private Approximate Pattern Matching

    In this paper, we consider the kk-approximate pattern matching problem under differential privacy, where the goal is to report or count all substrings of a given string SS which have a Hamming distance at most kk to a pattern PP, or decide whether such a substring exists. In our definition of privacy, individual positions of the string SS are protected. To be able to answer queries under differential privacy, we allow some slack on kk, i.e. we allow reporting or counting substrings of SS with a distance at most (1+γ)k+α(1+\gamma)k+\alpha to PP, for a multiplicative error γ\gamma and an additive error α\alpha. We analyze which values of α\alpha and γ\gamma are necessary or sufficient to solve the kk-approximate pattern matching problem while satisfying ϵ\epsilon-differential privacy. Let nn denote the length of SS. We give 1) an ϵ\epsilon-differentially private algorithm with an additive error of O(ϵ1logn)O(\epsilon^{-1}\log n) and no multiplicative error for the existence variant; 2) an ϵ\epsilon-differentially private algorithm with an additive error O(ϵ1max(k,logn)logn)O(\epsilon^{-1}\max(k,\log n)\cdot\log n) for the counting variant; 3) an ϵ\epsilon-differentially private algorithm with an additive error of O(ϵ1logn)O(\epsilon^{-1}\log n) and multiplicative error O(1)O(1) for the reporting variant for a special class of patterns. The error bounds hold with high probability. All of these algorithms return a witness, that is, if there exists a substring of SS with distance at most kk to PP, then the algorithm returns a substring of SS with distance at most (1+γ)k+α(1+\gamma)k+\alpha to PP. Further, we complement these results by a lower bound, showing that any algorithm for the existence variant which also returns a witness must have an additive error of Ω(ϵ1logn)\Omega(\epsilon^{-1}\log n) with constant probability.Comment: This is a full version of a paper accepted to ITCS 202

    Gapped Indexing for Consecutive Occurrences

    The classic string indexing problem is to preprocess a string S into a compact data structure that supports efficient pattern matching queries. Typical queries include existential queries (decide if the pattern occurs in S), reporting queries (return all positions where the pattern occurs), and counting queries (return the number of occurrences of the pattern). In this paper we consider a variant of string indexing, where the goal is to compactly represent the string such that given two patterns P? and P? and a gap range [?, ?] we can quickly find the consecutive occurrences of P? and P? with distance in [?, ?], i.e., pairs of subsequent occurrences with distance within the range. We present data structures that use O?(n) space and query time O?(|P?|+|P?|+n^{2/3}) for existence and counting and O?(|P?|+|P?|+n^{2/3}occ^{1/3}) for reporting. We complement this with a conditional lower bound based on the set intersection problem showing that any solution using O?(n) space must use ??(|P?| + |P?| + ?n) query time. To obtain our results we develop new techniques and ideas of independent interest including a new suffix tree decomposition and hardness of a variant of the set intersection problem

    String Indexing for Top-k Close Consecutive Occurrences

    The classic string indexing problem is to preprocess a string S into a compact data structure that supports efficient subsequent pattern matching queries, that is, given a pattern string P, report all occurrences of P within S. In this paper, we study a basic and natural extension of string indexing called the string indexing for top-k close consecutive occurrences problem (Sitcco). Here, a consecutive occurrence is a pair (i,j), i < j, such that P occurs at positions i and j in S and there is no occurrence of P between i and j, and their distance is defined as j-i. Given a pattern P and a parameter k, the goal is to report the top-k consecutive occurrences of P in S of minimal distance. The challenge is to compactly represent S while supporting queries in time close to the length of P and k. We give two time-space trade-offs for the problem. Let n be the length of S, m the length of P, and ? ? (0,1]. Our first result achieves O(nlog n) space and optimal query time of O(m+k), and our second result achieves linear space and query time O(m+k^{1+?}). Along the way, we develop several techniques of independent interest, including a new translation of the problem into a line segment intersection problem and a new recursive clustering technique for trees

    Ist ein Onlinejournalist noch ein "echter" Journalist?

    Untersuchungsgegenstand: Die Entwicklung des Mediums Internet brachte viele Veränderungen mit sich. Sowohl die Nachrichtengenerierung, als auch die Nachrichtenrezeption haben sich signifikant verändert. Der Fokus der Arbeit liegt auf der Beleuchtung der Unterschiede der Rolle des Onlinejournalisten zum Printjournalisten. Allgemein wird angenommen, dass sich Arbeitsabläufe, von der Recherche, bis hin zur Verbreitung von Nachrichten, stark von den einzelnen Arbeitsschritten des Printjournalismus unterscheiden. Damit einhergehend wurde untersucht, inwieweit sich das Fremd- und Selbstbild des Onlinejournalisten im Vergleich zum Printjournalisten verändert hat. Um alle relevanten Bereiche abzudecken, wurden auch Finanzierungsmodelle, verschiedene Darstellungsformen in der Berichterstattung sowie Organisationsstrukturen in Print- beziehungsweise Onlineredaktionen erläutert. Theorie: Die theoretische Basis der Arbeit bildet das Gesetz der Komplementarität von Wolfgang Riepl. Davon ausgehend, wurden verschiedene Theorien zur Veränderung der Rolle von Medien beleuchtet, wenn neue Medien entwickelt werden. Dazu zählen: die funktionale Konvergenz sowie die Supplementierung von Medien. Um die institutionelle Struktur des Systems Journalismus darzustellen, wurden die Theorien von Schimank zur gesellschaftlichen Differenzierung sowie die Überlegungen von Altmeppen zu Journalismus und Medien als Organisationen näher beleuchtet. Ziel, Fragestellung, Hypothese: Ziel der Arbeit war es herauszufinden, inwieweit Onlinejournalismus mit traditionellem Printjournalismus vergleichbar ist. Der Fokus lag dabei auf der Rolle des Journalisten selbst: Welche neuen Aufgaben haben Journalisten, die in Onlinemedien tätig sind? Wie werden sie von den Rezipienten beurteilt beziehungsweise wie gestaltet sich ihr Selbstbild? Die Forschungsleitende Frage lautet: Ist ein Onlinejournalist noch ein „echter“ Journalist? Darauf basierend wurden weitere Forschungsfragen und Hypothesen abgeleitet: Forschungsfrage 1: Inwiefern lässt sich das Rollenbild des Onlinejournalisten, mit dem von Journalisten, die Texte in gedruckten Zeitungen veröffentlichen vergleichen? Hypothese 1a: Wenn ein Journalist ausschließlich für ein Onlinemedium zuständig ist, dann legt er mehr Wert auf Aktualität und Schnelligkeit in der Verbreitung der Nachricht, als auf intensive oder investigative Recherche. Hypothese 1b: Je größer das Angebot an kommerziellen Weblogs ist, desto weniger bedeutsam ist die Rolle des Journalisten als Gatekeeper. Hypothese 1c: Wenn ein Journalist ausschließlich für ein Onlinemedium tätig ist, dann wird er vom Publikum nicht als Journalist im Sinne eines „public watchdog“, als „Vierte Gewalt“ im Staat, wahrgenommen. Hypothese 1d: Je mehr Aufmerksamkeit eine Information von Seiten der Rezipienten erhält, desto weniger wird im Zuge der Recherche auf journalistische ethische Standards Wert gelegt. Hypothese 1e: Je geringer die rechtliche und finanzielle Absicherung von Onlinejournalisten ist, desto negativer schätzen Journalisten ihre berufliche Zukunft bezüglich Karriere und Verdienst ein. Forschungsfrage 2: Welche Arbeitsschritte im Arbeitsalltag von Journalisten werden durch die Verlagerung der Veröffentlichung von Printmedien auf Onlinemedien obsolet beziehungsweise verändert? Hypothese 2a: Der Aufgabenbereich von Onlinejournalisten erstreckt sich von technischen Belangen, über Aufgaben des Marketings bis hin zur Wartung und Überprüfung von Foren. Für redaktionelle Tätigkeiten kann lediglich ein geringer Teil der Arbeitszeit investiert werden. Hypothese 2b: Onlinejournalisten messen dem Internet als Recherchequelle einen höheren Stellenwert zu, als Redakteure von Printmedien. Hypothese 2c: Aufgrund der geforderten Aktualität bei Onlinemedien, wird meist auf die Überprüfung von Fakten, sowie auf Lektorate verzichtet. Hypothese 2d: Je kommerzieller die veröffentlichten Themen sind, desto eher wird auf Interaktivität gesetzt und dem Rezipienten die Möglichkeit zur Kommentierung der Berichte gegeben. Hypothese 2e: Je etablierter die Redaktion eines Onlinemediums ist, desto mehr Wert wird auf den Austausch mit Journalisten aus Printredaktionen gesetzt. Hypothese 2f: Aufgrund der geringeren Ressourcen bezüglich Zeit und Geld, veröffentlichen Internetjournalisten eher fremde Texte von Presseagenturen und Pressestellen als Journalisten, die für gedruckte Zeitungen tätig sind. Hypothese 2g: Je geringer der Wert einer Nachricht eingeschätzt wird, desto eher wird auf die Mehrfachverwertung von Nachrichten gesetzt. Forschungsfrage 3: Welche Qualitätsstandards gibt es im Onlinejournalismus und inwiefern sind diese mit den Standards die im Printjournalismus üblich sind vergleichbar? Hypothese 3a: Da sich Journalisten in einer Internet- Nachrichten- Redaktion an einer 24/7-Aktualität orientieren müssen, werden für journalistische Texte typische Wesensmerkmale wie Universalität, Periodizität, Publizität und Aktualität eher vernachlässigt. Hypothese 3b: Aufgrund der vielen Möglichkeiten der Rezipienten an den Inhalten von Onlineberichten mitzuwirken, reduziert sich die Verantwortung der Redaktionen an der Gestaltung der Inhalte. Forschungsfrage 4: Inwiefern haben sich Themen, Formate und Stil der Texte im Vergleich zu Berichten die online veröffentlicht werden verändert? Hypothese 4a: Aufgrund der hohen Reichweite von Onlinemedien, ist die Berichterstattung über lokale Ereignisse geringer als bei Printmedien. Hypothese 4b: Je höher der Anspruch der Aktualität gefordert ist, desto eher wird auf stilistische Feinheiten verzichtet. Hypothese 4c: Da das Internet ein verhältnismäßig junges Medium ist, konzentrieren sich Onlinejournalisten verstärkt auf das Aufgreifen und die Vermittlung von Trends und neuer Ideen als Printjournalisten. Forschungsdesign: Als Ergänzung zu einer ausführlichen Literaturstudie, bei welcher sowohl ältere, als auch aktuelle Literatur zum Thema Print- und Onlinejournalismus recherchiert wurden, dienten fünf ExpertInneninterviews mit RedakteurInnen aus dem Print- und dem Onlinebereich. Die Interviews orientierten sich an einem Leitfaden, der auf den im Vorfeld generierten Forschungsfragen und Hypothesen basierte. Im Zuge der anschließenden Analyse der Experteninterviews, wurden die besagten Forschungsfragen und Hypothesen bearbeitet. Ergebnisse: Die Ergebnisse der Literaturstudie und der ExpertInnenbefragung, ließen keine eindeutige Beantwortung der forschungsleitenden Frage: „Ist ein Onlinejournalist noch ein „echter“ Journalist?“ zu. Mit der neuen Generation der Journalisten, die vom Print-, in den Onlinebereich abwandern beziehungsweise von Beginn ihrer beruflichen Tätigkeit an, ausschließlich für Internetplattformen tätig waren, veränderten sich jedoch eindeutig der Arbeitsalltag und die Berufsrolle der „schreibenden Zunft“. Diese Veränderung betrifft auch journalistische Darstellungsformen und Aufgabenbereiche. Kommentar und Glosse, wie man sie aus der Printzeitung kennt, wurden zu Blogs oder kurzen Postings. Der Rezipient bekommt nicht mehr schlicht reserviert, was er wissen muss. Leser oder User werden dazu angehalten sich selbst jene Informationen zusammenzusuchen, die für sie von Interesse sind. Der Journalist wandelt sich vom Gatekeeper zum Gatewatcher und teilt seine Rolle als „public watchdog“ mit tausenden von Laien, die durch die neuen Technologien, aktiv an der Generierung und Verbreitung von Nachrichten teilnehmen. Durch diese Verschiebung der Aufgabenbereiche, verliert der Journalist nach Ansicht der befragten Experten, ein wenig seiner Kompetenz und berufsbedingten Reputation

    Compressed Indexing for Consecutive Occurrences

    Get PDF
    The fundamental question considered in algorithms on strings is that of indexing, that is, preprocessing a given string for specific queries. By now we have a number of efficient solutions for this problem when the queries ask for an exact occurrence of a given pattern P. However, practical applications motivate the necessity of considering more complex queries, for example concerning near occurrences of two patterns. Recently, Bille et al. [CPM 2021] introduced a variant of such queries, called gapped consecutive occurrences, in which a query consists of two patterns P? and P? and a range [a,b], and one must find all consecutive occurrences (q?,q?) of P? and P? such that q?-q? ? [a,b]. By their results, we cannot hope for a very efficient indexing structure for such queries, even if a = 0 is fixed (although at the same time they provided a non-trivial upper bound). Motivated by this, we focus on a text given as a straight-line program (SLP) and design an index taking space polynomial in the size of the grammar that answers such queries in time optimal up to polylog factors

    Bathrooms, bubbles and systems : archigram and the landscapes of transience

    Thesis (Ph. D.)--Massachusetts Institute of Technology, Dept. of Architecture, 2001.Includes bibliographical references (leaves 168-175).The dissertation studies the Archigram, the primary avant-garde architectural publication in Britain from 1961 to 1970, and the related avant-garde practices that engendered the high-tech movement. Drawing on the histories of technology, architecture and popular culture, the study explores the roots of architecture's foray into the realm of electronic information. By challenging the machine-based model of technology that had defined modernist architectural theory and production, my thesis unfolds, the publishers of the Archigram struggled to reconcile architectural form with emerging technologies and to represent visually the dissolution of the artifact into a landscape of complex and indeterminate systems. This attempt to conceive an essentially material object, such as a house, in a world viewed as a series of impulses was among the earliest architectural explorations of the dilemmas introduced by electronic culture. Using the concept of mobility and flux as a unifying thread, the dissertation examines the strategy for developing an architecture based in the practice of representation and of dissemination. The desire to set structures in motion by liberating them from the anchor of urban infrastructures required a reconsideration of the architectural object. For architecture to fully abandon its traditional role as environmental hardware, the conflict between the processes of indeterminacy and the dependence of those processes on a closed system would have to be overcome.(cont.) This tension between the physical and the dematerialized led from megastructural networks to self-contained skins, and finally to the disintegration of architectural objects into a technologically driven version of the Picturesque. In the ultimate merging of the environmental domain with that of information, architecture would become its absence, marked in the landscape only as the residue of a nomadic culture of information.by Hadas A. Steiner.Ph.D

    Medizinisch unterstützt ein bisschen gleicher werden

    Umgang mit älteren alkoholabhängigen, pflegebedürftigen Bewohnerinnen und Bewohnern in Pflegeinstitutionen

    Die Zahl älterer alkoholabhängiger Menschen wird künftig ansteigen und sich zu einem zunehmenden Gesundheitsproblem entwickeln. Das Verhalten älterer alkoholabhängiger Bewohner im Pflegeinstitutionen fordert das Pflegepersonal heraus, weil es ihnen an effektiven Interventionen fehlt, die diese vulnerablen Menschen zu einer besseren Lebensqualität am Ende ihres Lebens verhelfen. Durch eine Literaturrecherche in elektronischen medizinischen Datenbanken wird nach Interventionen gesucht, die den Umgang mit alkoholabhängigen Bewohnern fördert. Diese Studien kommen zum Schluss, dass bei allen in eine Pflegeinstitution eintretenden Bewohner ein Screening bezüglich Vorliegen einer möglichen Alkoholabhängigkeit durchgeführt wird, auf welches bei Bedarf ein Assessment (Beurteilung der Alkoholabhängigkeit) folgen sollte. Die Erstellung eines individuellen Interventionsprogramms, das im Dialog mit dem alkoholabhängigen Bewohner auf einer dazu spezialisierten Abteilung erstellt wird, hat sich als effektiv gezeigt. Dies erfordert eine gute Schulung des Personals und der Patienten, den Einsatz von qualifiziertem Personal und eine interprofessionelle Zusammenarbeit. Das heisst, es ist notwendig Strukturen zu erarbeiten und zu schaffen, in denen die alkoholabhängigen Menschen würdig leben können