29 research outputs found

    Untersuchungen zu demographischen Gleichgewichtsverteilungen nach dem Zipfschen Gesetz

    Full text link
    Die Analyse umfasst die wissenschaftliche Anwendung des mathematischen Zipfschen Gesetzes auf die demographischen Gleichgewichtsverteilungen und damit auf die Städte- und Gemeindegrößen in der Bundesrepublik Deutschland. Zipfs Gesetz erklärt die Häufigkeit des Gebrauchs der Wörter einer Sprache. Demnach verhält sich der Logarithmus des Rangplatzes eines Wortes (nach seiner Häufigkeit) umgekehrt proportional zum Logarithmus der Häufigkeit seines Gebrauchs. Die Ausgangsdaten der untersuchten Ranggrößenverteilungen sind die Einwohnerzahlen aller einzelnen politischen Gemeinden eines bestimmten Gebietes zu einem bestimmten Zeitpunkt. Die Gemeinde mit der größten Einwohnerzahl wird auf den Rangplatz 1, die Gemeinde mit den wenigsten Einwohnern auf den Rangplatz N gesetzt. Die Anwendung des Zipfschen Gesetzes auf demographische Daten für Deutschland gliedert sich in folgende Punkte: (1) Entwicklung des Kräfteverhältnisses im Zeitablauf von 1975 bis 2003, (2) die Beziehung der Teilmengen zueinander und zur Gesamtmenge, (3) die Auswirkung exogener Datenkatastrophen sowie (4) die Zusammenfassung politischer Gemeinden zu kommunalen Einzugsbereichen. Bei den Untersuchungen zu den deutschen demographischen Daten wird die Brauchbarkeit des Zipfschen Instrumentariums zur Darstellung und Analyse der räumlichen Bevölkerungsverteilung getestet. Es wird also untersucht, ob in den gesamten jeweils vorhandenen Daten überhaupt Korrelation oder Gleichgewicht erkennbar sind. Nach der Analyse leisten die deutschen Bevölkerungsdaten keinen Beitrag zum Zipfschen Gesetz im engeren Sinn, d.h. zur Erwartung, der Ausgleich zwischen den Kräften der Differenzierung und der Vereinheitlichung sei der Normalfall. Das Gleichgewicht stellt sich weder bei Verwendung des gesamten Datenbestands noch nach objektiv begründbarer Datenreduktion mit ausreichend großer Wahrscheinlichkeit ein. (ICG2

    eingesetzt wird. A. nutzt dazu die Boolesche Logik (Algebra) mit den Operatoren AND, OR und NOT. Die logischen Operatoren ergeben folgende Mengen: A AND B

    Get PDF
    N2- Drucker, die ein Verfahren zum schnellen und kostengünstigen Erstellen von dreidimensionalen physikalischen Modellen (Prototypen) nutzen. Sie verwenden Pulvermaterialien, die sich durch Einspritzen eines Bindemittels verfestigen. 3D-D. verarbeiten CAD-Daten und sind für das „rapid prototyping “ inzwischen für unter $ 5.000 zu erwerben

    Vererbungsalgorithmen von semantischen Eigenschaften auf Assoziationsgraphen und deren Nutzung zur Klassifikation von natürlichsprachlichen Daten

    Get PDF
    Ziel dieser Arbeit ist es, Kollokationen auf Satzbasis aus dem Wortschatz-Lexikon Leipzig als Datenbasis nehmend, ein Verfahren zu entwickeln, welches die den Satzkollokationen immanenten Beziehungen zwischen den Wörtern erkennen und handhaben kann. Weiterhin ist es Ziel, diese Beziehungen für wortbedeutungsorientierte Klassifikationsverfahren zu erschliessen und deren unmittelbare Anwendung zu demonstrieren, indem Sachgebietszuweisungen über diese Beziehungen weitervererbt werden können. Es wird gezeigt, dass Cluster in den Satzkollokationen mit einer Approximation für die maximale Clustersuche mit rechnerisch geringem Aufwand gefunden werden können, wenn diese als ein Graph mit der seit kurzem untersuchten small-world Eigenschaft betrachtet werden. Es wird daraufhin ein Disambiguierungsverfahren konstruiert, welches Beziehungen zwischen einem Wort und seinen unmittelbar angrenzenden Clustern berechnet, wobei die verschiedenen Cluster den diversen Gebrauchskontexten und damit auch unter anderem den Bedeutungen des Wortes entsprechen. Dieses Disambiguierungsverfahren dient dann als Grundlage für den Entwurf eines Sachgebietsklassifizierungsverfahrens, welches zu einer inhaltlich homogenen Wortgruppe, zum Beispiel einem Sachgebiet, weitere passende Wörter finden kann. Die vorgeschlagenen Verfahren wurden prototypisch implementiert und Beispiele werden auch im Hinblick auf eine Praxisanwendung diskutiert

    Separierung mit FindLinks gecrawlter Texte nach Sprachen

    Get PDF
    In dieser Arbeit wird ein Programm zur Sprachidentifikation von Web-Dokumenten vorgestellt. Das Verfahren nutzt Worthäufigkeitslisten als Trainingsdaten, um anhand dieser Dokumentenklassifikation in Sprachen vorzunehmen. Somit gehört dieses Werkzeug zu den supervised-learning-Systemen. Die zu klassifizierenden Web-Dokumente wurden mittels des von der Abteilung fur Automatische Sprachverarbeitung entwickelten Tools 'FindLinks' heruntergeladen. Das Programm ist somit in die Nachverarbeitung bestehender Rohdaten einzuordnen.This BSc Thesis presents a program for automatic language identification of web-documents called LangSepa. The procedure uses training-data which is based on word-frequency-tables of over 350 natural languages. Thus this tool can be subsumed under supervised learning systems. The documents for the classification-task were crawled by an information-retrieval system called FindLinks, which is developed at the Natural Language Processing group at the University of Leipzig. Therefore the presented program will be employed for the postprocessing of existent raw data

    Suchmaschinenoptimierung für öffentliche Bibliotheken am Beispiel von Google : warum Platz eins nicht alles ist

    Get PDF
    Diese Arbeit befasst sich mit der Bedeutung von Suchmaschinenoptimierung für öffentliche Bibliotheken. Für ein besseres Verständnis der Optimierungen wird die grundlegende Funktionsweise von Suchmaschinen erläutert und ein Einblick in den Aufbau der zwei häufigsten Websitemodellen bei Bibliotheken gegeben. Es wird gezeigt werden, dass die Ziele eine Suchmaschinenoptimierung weitreichender sind, als nur in der Google Trefferliste auf Platz eins zu stehen und dass die Verwirklichung dieser Ziele einer umfassenden Planung bedarf. Die verschiedenen Punkte, die bei der Planung beachtet werden sollten, werden aufgeführt und erläutert. Abschließend werden die praktischen Maßnahmen für die Optimierung der Website ausführlich dargestellt und es werden beispielhafte Einsatzmöglichkeiten für Bibliotheken genannt.This Bachelor Thesis considers the meaning of Search Engine Optimization for public libraries. The basic functionality of search engines is explained for a better understanding of the optimization and an insight in the two most popular website designs for libraries is provided. It will be proven, that being ranked first place at Google is only an intermediate objective and that the real purpose of Search Engine Optimization can have a far greater influence on the library. The important aspects for a good optimization plan, which is necessary to be successful, will be specified and explained. In the last chapter the actual optimization measures for the website are explained in detail and exemplary uses for libraries are shown

    Effiziente Differenzanalyse und Terminologie-Extraktion an Wikipedia Texten

    Get PDF
    Im Zeitalter der Informationsgesellschaft stellt das Internet eine zentrale Bedeutung für die Wissens- und Informationsbeschaung dar. Immer mehr Menschen informieren sich mit Hilfe des Internets über das Thema Gesundheit. Gerade im Gesundheitssektor ist es wichtig, aus der großen Masse an Informationen diejenigen Quellen herauszufinden, die inhaltlich korrekt, d.h. keine Fehlinformationen enthalten, und möglichst vollständig sind, da falsche Informationen für den Nutzer sogar gesundheitsschädliche Konsequenzen haben könnten. Als Laie medizinische Begriffe oder Zusammenhänge zwischen zwei oder mehreren Begriffen zu verstehen ist schwierig. Bei der Fülle an Informationen, die im Web angeboten werden ertrinkt der Nutzer sprichwörtlich an der Informationsflut. Die freie Online-Enzyklopädie Wikipedia scheint in diesem Kontext eine vielversprechende Quelle zur Informationsbeschaung zu sein. Der Gesundheitssektor der Wikipedia umfasst in der deutschen Sprache ca. 92.000 Artikel. In der englischen Sprache sind es ungefähr 350.000 Artikel. Im Rahmen einer Diplomarbeit an der Hochschule Heilbronn, wurde von B. Trinzcek ein Framework zur Darstellung der Wikipedia als Graph entwickelt. Durch die Verlinkungen in den Artikeln ist es möglich, Zusammenhänge zwischen verschiedenen Artikeln und somit Begriffen zu visualisieren. Der durch das Framework erstellte Graph der Domäne Gesundheit wird als Gesundheitsgraph bezeichnet [27]

    Quantitative Methoden in der Sprachtypologie: Nutzung korpusbasierter Statistiken

    Get PDF
    Die Arbeit setzt sich mit verschiedenen Aspekten der Nutzung korpusbasierter Statistiken in quantitativen typologischen Untersuchungen auseinander. Die einzelnen Abschnitte der Arbeit können als Teile einer sprachunabhängigen Prozesskette angesehen werden, die somit umfassende Untersuchungen zu den verschiedenen Sprachen der Welt erlaubt. Es werden dabei die Schritte von der automatisierten Erstellung der grundlegenden Ressourcen über die mathematisch fundierten Methoden bis hin zum fertigen Resultat der verschiedenen typologischen Analysen betrachtet. Hauptaugenmerk der Untersuchungen liegt zunächst auf den Textkorpora, die der Analyse zugrundeliegen, insbesondere auf ihrer Beschaffung und Verarbeitung unter technischen Gesichtspunkten. Es schließen sich Abhandlungen zur Nutzung der Korpora im Gebiet des lexikalischen Sprachvergleich an, wobei eine Quantifizierung sprachlicher Beziehungen mit empirischen Mitteln erreicht wird. Darüber hinaus werden die Korpora als Basis für automatisierte Messungen sprachlicher Parameter verwendet. Zum einen werden derartige messbare Eigenschaften vorgestellt, zum anderen werden sie hinsichtlich ihrer Nutzbarkeit für sprachtypologische Untersuchungen systematisch betrachtet. Abschließend werden Beziehungen dieser Messungen untereinander und zu sprachtypologischen Parametern untersucht. Dabei werden quantitative Verfahren eingesetzt

    Analyse von webbasierten eGovernment-Anwendungen hinsichtlich der Optimierung von Suchmechanismen mit Methoden der Automatischen Sprachverarbeitung

    Get PDF
    Als Vertreter einer webbasierten eGovernment-Anwendung wird die Website der Stadt Leipzig in Hinblick einer möglichen Optimierung der Suchmechanismen analysiert. Dazu wird zu Beginn die Ausgangssituation auf vorhandene Daten und existierende Probleme untersucht. Es wird eine These bzgl. des unterschiedlichen Sprachgebrauchs auf Redaktions- und auf Nutzerseite formuliert. Der Analyse liegen die Dokumente der Website, sowie Suchanfragen der Nutzer zu Grunde. Aus den Dokumenten werden Fachbegriffe mit Hilfe des ConceptComposers extrahiert und diese zusätzlich mit den Suchanfragen verglichen. Andersherum werden auch die Suchanfragen mit den Dokumenten der Website verglichen und spezifische Begriffe des Sprachgebrauchs der Nutzer ermittelt. Während der Analyse wird eingehend auf das Thema Mehrwortbegriffe eingegangen, sowie verschiedene Methoden der Automatischen Sprachverarbeitung beleuchtet. Im direkten Zusammenhang mit der Analyse sind Werkzeuge entstanden, die es ermöglichen die Analyse in andere Umgebungen zu portieren. Es ist ein einfaches Framework für die Integration von Verfahren zur Berechnung von Synonymen entstanden, das auf die gewonnen Daten aufsetzt und es werden Wege für die Generierung eines Wörterbuches 'Amt-Bürgersprache' aufgewiesen

    City systems in the Baltic states: the Soviet legacy and current paths of change

    Full text link
    This paper analyses the development of city systems in the Baltic States (Estonia, Latvia and Lithuania). These countries have experienced a shift from the relatively isolated realm of the Soviet Union to the European Union, one of the most liberal economies in the world. The aim of this paper is to analyse how the transition from a centrally planned economy to a market-led economy influenced how the city systems changed. The study uses annual data on the population dynamics of the cities from 1989–2015. Zipf’s law serves as a reference point to explore and compare the city-size distribution as well as the regularity and stability of this distribution in the Baltic States. A linear regression is employed to determine the impact of relevant factors that lead to city system change under market economy conditions. The results show that although the current paths of development are different in the Baltic States, the countries illustrate similar trends towards metropolisation and spatial polarisation. The results of this research suggest that spatially uneven development will continue in the Baltic States, and regional development policies should be aligned with the ongoing trends. The findings of the research encourage the development of greater cooperation between the Baltic States in creating regional policies, in particular those related to their shrinking cities and regions.Dieser Beitrag untersucht die Entwicklung von Städtesystemen in den baltischen Staaten (Estland, Lettland und Litauen). Die betroffenen Länder haben einen Wandel von einem Raum der relativen Isolation hin zur Europäischen Union erfahren, eine der liberalsten Wirtschaften der Welt. Ziel dieses Beitrags ist es zu untersuchen, wie der Übergang von einer zentralen Planwirtschaft zu einer Marktwirtschaft den Wandel der Städtesysteme beeinflusst hat. In der Studie werden jährliche Zahlen zur Bevölkerungsdynamik in den Städten zwischen 1989 und 2015 verwendet. Bei der Untersuchung und dem Vergleich der Verbreitung von Städten sowie der Regelmäßigkeit und Stabilität dieser Verbreitung in den baltischen Staaten diente das Zipfsche Gesetz als Bezugsrahmen. Zur Ermittlung der Auswirkung relevanter Faktoren, die unter marktwirtschaftlichen Bedingungen zum Wandel der Städtesysteme geführt haben, wird eine lineare Regression angewandt. Die Ergebnisse zeigen, dass sich die gegenwärtigen Wege des Wandels in den baltischen Staaten zwar unterscheiden, in den Ländern jedoch ähnliche Tendenzen der Metropolenbildung und räumlichen Polarisierung erkennbar sind. Die Ergebnisse dieser Untersuchung legen nahe, dass sich die räumlich uneinheitliche Entwicklung in den baltischen Staaten fortsetzen wird und die regionale Entwicklungspolitik an diesen nachhaltigen Trend angepasst werden sollte. Die Erkenntnisse der Untersuchung bestärken die Entwicklung einer engeren Zusammenarbeit der baltischen Staaten bei der Ausarbeitung regionaler Strategien, besonders solcher, die auf ihre schrumpfenden Städte und Regionen ausgerichtet sind
    corecore