    On-line construction of position heaps

    We propose a simple linear-time on-line algorithm for constructing a position heap for a string [Ehrenfeucht et al, 2011]. Our definition of position heap differs slightly from the one proposed in [Ehrenfeucht et al, 2011] in that it considers the suffixes ordered from left to right. Our construction is based on classic suffix pointers and resembles the Ukkonen's algorithm for suffix trees [Ukkonen, 1995]. Using suffix pointers, the position heap can be extended into the augmented position heap that allows for a linear-time string matching algorithm [Ehrenfeucht et al, 2011].Comment: to appear in Journal of Discrete Algorithm

    Average-Case Optimal Approximate Circular String Matching

    Approximate string matching is the problem of finding all factors of a text t of length n that are at a distance at most k from a pattern x of length m. Approximate circular string matching is the problem of finding all factors of t that are at a distance at most k from x or from any of its rotations. In this article, we present a new algorithm for approximate circular string matching under the edit distance model with optimal average-case search time O(n(k + log m)/m). Optimal average-case search time can also be achieved by the algorithms for multiple approximate string matching (Fredriksson and Navarro, 2004) using x and its rotations as the set of multiple patterns. Here we reduce the preprocessing time and space requirements compared to that approach

    Sprachduschen und ihr Nutzen:welche Wirkungen haben Sprachduschen auf die Schüler nach der Meinung der Lehrpersonen?

    Abstract . In dieser Arbeit geht es um Sprachduschen und ihren Nutzen und in dieser Arbeit werden die Meinungen zweier Lehrpersonen über die Wirkungen von Sprachduschen auf die Schüler behandelt. Dieses Thema ist gerade in Finnland sehr aktuell, weil nach dem neuen Curriculum (POPS 2019) die erste Fremdsprache, die sogenannte A1-Sprache, ab Januar 2020 in der ersten Klasse beginnt. Sprachduschen sind eine sehr gute Möglichkeit, die Schüler mit verschiedenen Sprachen bekannt zu machen. Das Ziel dieser Kandidatenarbeit ist also die Wirkung von Sprachduschen auf die Schüler nach der Meinung von Lehrern herauszufinden. Sprachdusche ist ein Begriff, der in Finnland entstanden ist. In der Sprachdusche werden neue Sprachen durch verschiedene Aktivitäten kennengelernt. Man lernt dabei die Grundkenntnisse einer Sprache. Das Hauptziel von Sprachduschen ist, sich für das Fremdsprachenlernen zu begeistern. Sprachduschen können entweder in der Schule oder auch schon im Kindergarten organisiert werden. In der Analyse werden zwei Lehrpersonen über die Wirkungen der Sprachduschen befragt und die Herausforderungen, die sich im Zusammenhang mit Sprachduschen ergeben, analysiert. Als Untersuchungsmethode wird Interview verwendet. Interview ist eine Methode, um Daten zu sammeln und durch Interviews versucht man die Meinung von Experten zu einem Thema herauszufinden. Das Material in dieser Arbeit baut sich auf die Interviews mit den zwei Lehrerinnen, bei denen eine Sprachdusche geführt wurde, auf. Durch die Ergebnisse kann gesagt werden, dass die Wirkungen der Sprachduschen auf die Schüler sehr positiv sind. Die Interviewten sind sich darüber einig, dass Sprachduschen wichtig und nützlich sind. Beide Interviewten sind der Meinung, dass Sprachduschen Motivation und Begeisterung für das Sprachenlernen geben

    ”Kielien opiskelu on kivaa koska oppii uutta”:Eine Fallstudie über Sprachduschen in der dritten Klasse

    Abstract . Sprachduschen sind eine Methode zum Lernen einer neuen Sprache. Dabei wird durch Spiele und Aktivitäten ein Einblick in die neue Sprache gegeben und versucht, einen positiven Eindruck von verschiedenen Sprachen und Kulturen zu vermitteln. Sprachduschen sind besonders nützlich für die Entscheidungsfindung vor der Wahl einer Fremdsprache in der Schule, wie es im Zusammenhang mit dieser Untersuchung der Fall ist. In dieser Pro-Gradu-Arbeit geht um zwei Sprachduschen in zwei verschiedenen dritten Klassen, die die Sprachenwahl vor sich haben. Es wird gezeigt, wie Sprachduschen geplant werden, welche Aktivitäten man durchführen kann und was man beim Organisieren von Sprachduschen berücksichtigen soll. Außerdem ist es das Ziel dieser Arbeit herauszufinden, wie aktiv die Schüler an den Sprachduschen teilnehmen und was sie von solchen Aktivitäten halten. In diesem Zusammenhang wird auch untersucht, welche Faktoren die Meinungen der Schüler beeinflussen, beispielsweise ob die Begeisterung für die englische Sprache oder Sprachen allgemein einen Einfluss auf die Begeisterung für die deutsche Sprache und Sprachduschen hat. Diese Pro-Gradu Arbeit ist eine ethnographische Forschung, die Sprachduschen von ihrer Organisation über die Durchführung bis zur Evaluierung durch die Schüler beobachtet und analysiert. Aufgrund der Ergebnisse der Analyse der Videoaufzeichnungen und der Fragebögen kann behauptet werden, dass Sprachduschen ein effektiver Weg sind, um eine neue Sprache kennenzulernen und die Schüler zu motivieren, Sprachen zu lernen. Die Schüler nehmen mit Begeisterung und ohne Vorurteile an der Sprachdusche teil. Die allgemeine Sprachbegeisterung wirkt sich auch positiv auf die Begeisterung für Sprachduschen und auf die Motivation für das Lernen neuer Sprachen aus. Gleichzeitig haben die Schüler, die Sprachenlernen im Allgemeinen nicht mögen, auch eine negative Einstellung gegenüber den Sprachduschen. Die Mehrheit der Schüler jedoch lernt gerne Sprachen.Tiivistelmä. Kielisuihkut ovat menetelmä uuden kielen oppimiseen. Ne tarjoavat pelien ja aktiviteettien avulla tietoa uudesta kielestä ja pyrkivät antamaan myönteisen vaikutelman eri kielistä ja kulttuureista. Kielisuihkut ovat erityisen hyödyllisiä tehdessä päätöksiä ennen vieraan kielen valintaa, kuten tämän tutkimuksen yhteydessä. Tämä pro gradu -työ käsittelee kahta kielisuihkusta kahdella eri kolmosluokalla, joilla on edessään kielivalinta. Tässä tutkimuksessa esitellään, miten kielisuihkut suunnitellaan, mitä aktiviteetteja niissä voidaan toteuttaa ja mitä on otettava huomioon kielisuihkuja järjestäessä. Lisäksi tämän työn tavoitteena on selvittää, kuinka aktiivisesti oppilaat osallistuvat kielisuihkuihin ja mitä mieltä he ovat tällaisesta toiminnasta. Tässä yhteydessä tutkitaan myös, mitkä tekijät vaikuttavat oppilaiden mielipiteisiin, esimerkiksi vaikuttaako innostus englannin kieleen tai kieliin yleisesti innostukseen saksan kieltä ja kielisuihkuja kohtaan. Tämä pro gradu -työ on etnografinen tutkimus, jossa havainnoidaan ja analysoidaan kielisuihkuja niiden järjestämisestä niiden toteuttamiseen ja oppilaiden suorittamaan arviointiin. Videotallenteiden ja kyselylomakkeiden analyysin tulosten perusteella voidaan väittää, että kielisuihkut ovat tehokas tapa oppia uutta kieltä ja motivoida oppilaita kielten opiskeluun. Oppilaat osallistuvat kielisuihkuun innokkaasti ja ennakkoluulottomasti. Yleinen innostus kieliä kohtaan vaikuttaa myönteisesti myös innostukseen kielisuihkuja kohtaan ja motivaatioon oppia uusia kieliä. Samaan aikaan oppilaat, jotka eivät pidä kielten opiskelusta yleensä, suhtautuvat kielteisemmin kielisuihkuihin. Suurin osa tutkimukseen osallistuneista oppilaista kuitenkin pitää kielten opiskelusta

    Fast Algorithm for Partial Covers in Words

    A factor uu of a word ww is a cover of ww if every position in ww lies within some occurrence of uu in ww. A word ww covered by uu thus generalizes the idea of a repetition, that is, a word composed of exact concatenations of uu. In this article we introduce a new notion of α\alpha-partial cover, which can be viewed as a relaxed variant of cover, that is, a factor covering at least α\alpha positions in ww. We develop a data structure of O(n)O(n) size (where n=wn=|w|) that can be constructed in O(nlogn)O(n\log n) time which we apply to compute all shortest α\alpha-partial covers for a given α\alpha. We also employ it for an O(nlogn)O(n\log n)-time algorithm computing a shortest α\alpha-partial cover for each α=1,2,,n\alpha=1,2,\ldots,n

    Improved Algorithms for Approximate String Matching (Extended Abstract)

    The problem of approximate string matching is important in many different areas such as computational biology, text processing and pattern recognition. A great effort has been made to design efficient algorithms addressing several variants of the problem, including comparison of two strings, approximate pattern identification in a string or calculation of the longest common subsequence that two strings share. We designed an output sensitive algorithm solving the edit distance problem between two strings of lengths n and m respectively in time O((s-|n-m|)min(m,n,s)+m+n) and linear space, where s is the edit distance between the two strings. This worst-case time bound sets the quadratic factor of the algorithm independent of the longest string length and improves existing theoretical bounds for this problem. The implementation of our algorithm excels also in practice, especially in cases where the two strings compared differ significantly in length. Source code of our algorithm is available at http://www.cs.miami.edu/\~dimitris/edit_distanceComment: 10 page

    Probabilistic retrieval of OCR degraded text using N-grams

    Faster Approximate String Matching for Short Patterns

    We study the classical approximate string matching problem, that is, given strings PP and QQ and an error threshold kk, find all ending positions of substrings of QQ whose edit distance to PP is at most kk. Let PP and QQ have lengths mm and nn, respectively. On a standard unit-cost word RAM with word size wlognw \geq \log n we present an algorithm using time O(nkmin(log2mlogn,log2mlogww)+n) O(nk \cdot \min(\frac{\log^2 m}{\log n},\frac{\log^2 m\log w}{w}) + n) When PP is short, namely, m=2o(logn)m = 2^{o(\sqrt{\log n})} or m=2o(w/logw)m = 2^{o(\sqrt{w/\log w})} this improves the previously best known time bounds for the problem. The result is achieved using a novel implementation of the Landau-Vishkin algorithm based on tabulation and word-level parallelism.Comment: To appear in Theory of Computing System

    Scheduling Jobs in Flowshops with the Introduction of Additional Machines in the Future

    This is the author's peer-reviewed final manuscript, as accepted by the publisher. The published article is copyrighted by Elsevier and can be found at: http://www.journals.elsevier.com/expert-systems-with-applications/.The problem of scheduling jobs to minimize total weighted tardiness in flowshops,\ud with the possibility of evolving into hybrid flowshops in the future, is investigated in\ud this paper. As this research is guided by a real problem in industry, the flowshop\ud considered has considerable flexibility, which stimulated the development of an\ud innovative methodology for this research. Each stage of the flowshop currently has\ud one or several identical machines. However, the manufacturing company is planning\ud to introduce additional machines with different capabilities in different stages in the\ud near future. Thus, the algorithm proposed and developed for the problem is not only\ud capable of solving the current flow line configuration but also the potential new\ud configurations that may result in the future. A meta-heuristic search algorithm based\ud on Tabu search is developed to solve this NP-hard, industry-guided problem. Six\ud different initial solution finding mechanisms are proposed. A carefully planned\ud nested split-plot design is performed to test the significance of different factors and\ud their impact on the performance of the different algorithms. To the best of our\ud knowledge, this research is the first of its kind that attempts to solve an industry-guided\ud problem with the concern for future developments