12 research outputs found

    Implementing a New Data Model for Simulating Process

    Full text link
    The paper describes the development of a new methodological approach for simulating geographic processes through the development of a data model that represents a process. This methodology complements existing approaches to dynamic modelling, which focus on the states of the system at each time step, by storing and representing the processes that are implicit in the model. The data model, called nen, focuses existing modelling approaches on representing and storing process information, which provides advantages for querying and analysing processes. The flux simulation framework was created utilizing the nen data model to represent processes. This simulator includes basic classes for developing a domain specific simulation and a set of query tools for inquiring after the results of a simulation. The methodology is prototyped with a watershed runoff simulation

    Implementing a New Data Model for Simulating Processes

    Get PDF
    The paper describes the development of a new methodological approach for simulating geographic processes through the development of a data model that represents a process. This methodology complements existing approaches to dynamic modelling, which focus on the states of the system at each time step, by storing and representing the processes that are implicit in the model. The data model, called nen, focuses existing modelling approaches on representing and storing process information, which provides advantages for querying and analyzing processes. The flux simulation framework was created utilizing the nen data model to represent processes. This simulator includes basic classes for developing a domain specific simulation and a set of query tools for inquiring after the results of a simulation. The methodology is prototyped with a watershed runoff simulation

    A New Geographic Process Data Model

    Get PDF
    Processes, although the subject matter of geography, have not been represented in a manner that aids their querying and analysis. This dissertation develops an appropriate data model that allows for such a process oriented representation, which is built upon a theory of process. The data model, called nen, focuses existing modeling approaches on representing and storing process information. The flux simulation framework was created utilizing the nen data model to represent processes; it extends the RePast agent based modeling environment. This simulator includes basic classes for developing a domain specific simulation and a set of query tools for inquiring after the results of a simulation. The methodology was then prototyped with a watershed runoff simulation

    Geomorphometrische Analysen zur Rekonstruktion holozäner Nutzungspotentiale ausgewählter Standorte in der Western Desert (Ägypten)

    Get PDF
    Die hyperaride und weitgehend vom Menschen unveränderte Western Desert Ägyptens ist ein Hauptuntersuchungsgebiet des interdisziplinär angelegten Sonderforschungsbereichs 389 (ACACIA) und bietet somit ein ideales Feld zur Entwicklung und Prüfung neuer Methoden. In dieser Arbeit wurden erstmalig flächenhafte digitale Höheninformationen in hoher Auflösung für das Untersuchungsgebiet abgeleitet, aufbereitet und hinsichtlich ihrer Qualität und Einsatzmöglichkeiten untersucht. Dabei konnten über die Fragestellung der Arbeit hinaus weitere Einsatzmöglichkeiten zur Beantwortung geomorphologischer und geoarchäologischer Fragestellung herausgearbeitet werden. Beide Höhenmodelle (ASTER / SRTM-3) zeigen für die jeweilige Auflösung geringe Höhenfehler, sie unterscheiden sich jedoch hinsichtlich ihres nutzbaren Maßstabsbereiches. Hier konnte eine Trennung im Bereich von ca. 1:100.000 festgelegt werden. Während die SRTM-3-Daten durch ihre flächenhafte Verfügbarkeit für großräumige Fragestellungen geeignet sind, fallen die ASTER-Höhendaten in die chorische Maßstabsebene und eignen sich besonders zur Beantwortung regionaler Fragestellungen. Die abgeleiteten methodischen Ergebnisse zum Einsatz und der Überprüfung der Höhendaten können problemlos auf andere aride Räume übertragen werden. Zur Ableitung holozäner Nutzungspotentiale wurde ein offenes Modell entwickelt, das die spezielle Fragestellung aufgreift, jedoch ebenfalls mit anderen Datensets und in anderen Regionen nutzbar ist. Es beinhaltet die Verknüpfung geomorphometrischer mit anderen raumbezogenen Daten in einem statistischen Verfahren. Die kanonische Korrespondenzanalyse wurde dabei als geeignete statistische Methode vorgestellt, um ein solches Datenset zu analysieren und einen Mehrwert an Information aus den Daten abzuleiten. Für das holozäne Nutzungspotential der Western Desert konnten durch die Untersuchung zweier archäologischer Fundregionen verschiedene Erkenntnisse gewonnen werden. So ist zeitlich synchron mit einer hygrischen Klimaveränderung zwischen dem Früh- und Mittelholozän von einer veränderten Nutzung der Landschaft durch den Menschen auszugehen. Die Fundposition und das Fundinventar ändern sich hinsichtlich der Lage zur Topographie und zum potentiellen Wasservorkommen. Somit gibt die vorliegende Arbeit für zukünftige interdisziplinäre Forschungsprojekte wichtige Hinweise für ein mögliches methodisches Vorgehen, gerade im Sinne der interdisziplinär zu bearbeitenden Forschungsfelder, die es im Rahmen der Geomorphologie, Geomorphometrie und Geoarchäologie in Zukunft zu untersuchen gilt

    Zur Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen

    Get PDF
    In the last ten years there has been a significant progress of the World Wide Web, which evolved to become the so-called “Web 2.0”. The most important feature of this new quality of the WWW is the participation of the users in generating contents. This trend facilitates the formation of user communities which collaborate on diverse projects, where they collect and publish information. Prominent examples of such projects are the online-encyclopedia “Wikipedia”, the microblogging-platform “Twitter”, the photo-platform “Flickr” and the database of topographic information “OpenStreetMap”. User-generated content, which is directly or indirectly geospatially referenced, is of-ten termed more specifically as “volunteered geographic information”. The geospatial reference of this information is constituted either directly by coordinates that are given as meta-information or indirectly through georeferencing of toponyms or addresses that are contained in this information. Volunteered geographic information is particularly suited for research, as it can be accessed with low or even at no costs at all. Furthermore it reflects a variety of human decisions which are linked to geographic space. In this thesis, the relationship of space and content of volunteered geographic information is investigated from two different perspectives. The first part of this thesis addresses the question for which share of information there exists a relationship between space and content of the information, such that the information is locatable in geospace. In this context, the assumption that about 80% of all information has a reference to space has been well known within the community of geographic information system users. Since the 1980s it has served as a marketing tool within the whole geoinformation sector, although there has not been any empirical evidence. This thesis contributes to fill this research gap. For the validation of the ‘80%-hypothesis’ two approaches are presented. The first approach is based on a corpus of information that is as representative as possible for world knowledge. For this purpose the German language edition of Wikipedia has been selected. This corpus is modeled as a network of information where the articles are considered the nodes and the cross references are considered the edges of a directed graph. With the help of this network a graduated definition of geospatial references is possible. It is implemented by computing the distance of each article to its closest article within the network that is assigned with spatial coordinates. Parallel to this, a survey-based approach is developed where participants have the task to assign pieces of information to one of the categories “direct geospatial reference”, “indirect geospatial reference” and “no geospatial reference”. A synthesis of both approaches leads to an empirically justified figure for the “80%-assertion”. The result of the investigation is that for the corpus of Wikipedia 27% of the information may be categorized as directly geospatially referenced and 30% of the information may be categorized as indirectly geospatially referenced. In the second part of the thesis the question is investigated in how far volunteered geographic information that is produced on mobile devices is related to the locations where it is published. For this purpose, a collection of microblogging-texts produced on mobile devices serve as research corpus. Microblogging-texts are short texts that are published via the World Wide Web. For this type of information the relationship be-tween the content of the information and their position is less obvious than e.g. for topographic information or photo descriptions. The analysis of microblogging-texts offers new possibilities for market and opinion research, the monitoring of natural events and human activities as well as for decision support in disaster management. The spatial analysis of the texts may add extra value. In fact for some of the applications the spatial analysis is a necessary condition. For this reason, the investigation of the relationship of the published contents with the locations where they are generated is of interest. Within this thesis, methods are described that support the investigation of this relationship. In the presented approach, classified Points of Interest serve as a model for the environment. For the purpose of the investigation of the correlation between these points and the microblogging-texts, manual classification and natural language processing are used in order to classify these texts according to their relevance in regard to the respective feature classes. Subsequently, it is tested whether the share of relevant texts in the proximity of objects of the tested classes is above average. The results of the investigation show that the strength of the location-content-correlation depends on the tested feature class. While for the feature classes ‘train station’, ‘airport’ and ‘restaurant’ a significant dependency of the share of relevant texts on the distance to the respective objects may be observed, this is not confirmed for objects of other feature classes, such as ‘cinema’ and ‘supermarket’. However, as prior research that describes investigations on small cartographic scale has detected correlations between space and content of microblogging-texts, it can be concluded that the strength of the correlation between space and content of microblogging-texts depends on scale and topic.:1 Einleitung 1 1.1 Motivation 1 1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1 1.1.2 Die Raumbezugshypothese 3 1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4 1.2 Forschungsziele und Forschungsfragen 5 1.2.1 Prüfung der Raumbezugshypothese 5 1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6 1.3 Aufbau der Arbeit 7 1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7 1.3.2 Gliederung der Arbeit 7 1.3.3 Verwendete Publikationen 8 2 Forschungsstand 11 2.1 Relevante Begriffe 11 2.1.1 Web 2.0 11 2.1.2 User Generated Content / Nutzergenerierte Inhalte 12 2.1.2.1 Bedeutung und Begriffsherkunft 12 2.1.2.2 Begriffsklärung 12 2.1.2.3 Arten von UGC 13 2.1.2.4 Kritik 14 2.1.2.5 Forschungspotential 14 2.1.3 Raumbezug 14 2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14 2.1.3.2 Kategorien des Georaumbezuges 16 2.1.4 Georäumlich 16 2.1.5 Geographische Information und Geodaten 17 2.1.5.1 Begriffsklärung 17 2.1.5.2 Points of Interest als Spezialfall 19 2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19 2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19 2.1.6.2 Das Konzept der menschlichen Sensoren 20 2.1.6.3 Kommunikation geographischer Informationen bei VGI 21 2.1.6.4 Der Mehrwert von VGI 21 2.1.6.5 Motive der Beitragenden 22 2.1.6.6 VGI im globalen Kontext 22 2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23 2.1.6.8 Formale Definition 23 2.1.6.9 Deutsche Entsprechung des Begriffs 24 2.1.7 Semantik nutzergenerierter geographischer Informationen 25 2.1.7.1 Strukturierte Form 25 2.1.7.2 Unstrukturierte Form 26 2.2 Arten nutzergenerierter geographischer Informationen 26 2.2.1 Topographische Informationen – OpenStreetMap 28 2.2.1.1 Korpusbeschreibung 28 2.2.1.2 Forschungsüberblick 30 2.2.1.3 Raumbezug 32 2.2.2 Enzyklopädische Informationen – Wikipedia 34 2.2.2.1 Korpusbeschreibung 34 2.2.2.2 Forschungsüberblick 35 2.2.2.3 Raumbezug 36 2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37 2.2.3 Microblogging-Texte – Twitter 39 2.2.3.1 Korpusbeschreibung 39 2.2.3.2 Forschungsüberblick 41 2.2.3.3 Raumbezug 42 2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43 2.2.4.1 Korpusbeschreibung 43 2.2.4.2 Forschungsüberblick 45 2.3 Informationen und Netzwerke 46 2.3.1 Beispiele für Netzwerkstrukturen 46 2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47 2.3.3 Netzwerkeigenschaften der Wikipedia 47 2.4 Geographische Informationen und Kognition 49 2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50 2.5.1 Naive Bayes 51 2.5.2 Maximum Entropy 51 2.5.3 Support Vector Machines 52 3 Methoden und Ergebnisse 53 3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53 3.1.1 Netzwerkgrad des Georaumbezuges 53 3.1.2 Datenprozessierung 56 3.1.3 Ergebnisse der NGGR-Berechnung 57 3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60 3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65 3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65 3.2.1.1 Material 66 3.2.1.2 Prozedur 66 3.2.1.3 Teilnehmer 67 3.2.2 Hypothesen 68 3.2.3 Daten zur Beteiligung an der Befragung 68 3.2.4 Ergebnisse 70 3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71 3.3.1 Methodik 71 3.3.2 Ergebnisse 72 3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73 3.3.4 Einfluss des fachlichen Hintergrundes auf die Ergebnisse der Befragung 74 3.3.5 Prädiktion des Anteils raumbezogener Informationen für das gesamte Korpus der deutschen Wikipedia 76 3.4 Klassifikation nutzergenerierter geographischer Informationen hinsichtlich der Korrelation Ort-Inhalt am Beispiel von mobil verfassten Microblogging-Texten 77 3.4.1 Manuelle Textklassifikation 78 3.4.2 Überwachte maschinelle Textklassifikation mit manuell klassifizierten Trainingsdaten 80 3.4.2.1 Vorverarbeitung der Microblogging-Texte 81 3.4.2.2 Evaluation der Ergebnisse der maschinellen Textklassifikation 82 3.4.2.3 Tuning der maschinellen Klassifikation 83 3.4.3 Überwachte maschinelle Textklassifikation mit lexikalischen Trainingsdaten 83 3.4.4 Verwendete Daten 86 3.4.4.1 Aufzeichnung von mobilen Microblogging-Texten mit der Twitter-Streaming-API 86 3.4.4.2 Filterung verwendbarer Microblogging-Texte 87 3.4.4.3 Zeitliche und räumliche Muster der Microblogging-Texte 89 3.4.4.4 Verwendete Points of Interest 91 3.4.5 Ergebnisse 92 3.4.5.1 Manuelle Annotation von Texten 92 3.4.5.2 Überwachte maschinelle Klassifikation von Texten mit manuell klassifizierten Trainingsdaten 95 3.4.5.3 Überwachte maschinelle Klassifikation von Texten mit lexikalischen Trainingsdaten 99 3.5 Bestimmung der Entfernungsabhängigkeit des Anteils von für spezifische Orte relevanten Informationen am Beispiel von mobil verfassten Microblogging-Texten 103 3.5.1 Methodik 103 3.5.2 Ergebnisse 104 4 Diskussion 111 4.1 Methoden zur Prüfung der Raumbezugshypothese am Beispiel des Korpus Wikipedia 111 4.1.1 Wahl des Korpus 111 4.1.2 Abstraktes Konzept und Instanz 112 4.1.3 Korpusanalytischer Ansatz 112 4.1.4 Befragungsansatz 114 4.2 Methoden zur Bestimmung der Korrelation Ort-Inhalt von nutzergenerierten Informationen am Beispiel von mobil erzeugten Microblogging-Texten 115 4.2.1 Manuelle Klassifikation 116 4.2.2 Überwachte maschinelle Klassifikation mit manuell klassifizierten Trainingsdaten 117 4.2.3 Unüberwachte maschinelle Klassifikation mit lexikalischen Trainingsdaten 118 4.2.4 Berechnung der Entfernungsabhängigkeit des Anteils ortsbezogener Texte 119 4.2.5 Points of Interest als Modell für den räumlichen Kontext 120 4.3 Der Begriff ‚Raumbezug‘ im Kontext von nutzergenerierten geographischen Informationen 120 5 Schlussfolgerungen und Forschungsausblick 123 5.1 Beantwortung der Forschungsfragen 123 5.1.1 Zur Überprüfung der Raumbezugshypothese 123 5.1.2 Zur Korrelation von Ort und Inhalt von nutzergenerierten geographischen Informationen 125 5.2 Implikationen der Forschungsergebnisse 128 5.3 Forschungsausblick nutzergenerierte geographische Informationen 130 5.3.1 Qualität von VGI 130 5.3.2 Synthese von VGI mit amtlichen Daten 132 5.3.3 Weitere aktuelle Entwicklungen im Bereich VGI-Forschung 132 6 Literaturverzeichnis 135 7 Anhang 151 Anhang A Dokumentation des „Experiments Geoaumbezug“ 152 Anhang B Ergebnisse der Kategorisierungsaufgabe des „Experiments Georaumbezug“ 157 Anhang C Rückmeldungen der Teilnehmer des „Experiments Georaumbezug“ 163 Anhang D Einfluss der Faktoren fachlicher Hintergrund und Wissen auf die Kategorisierung von Begriffen hinsichtlich ihrer Georäumlichkeit 166 Anhang E Ergebnisse der manuellen Klassifikation der Microblogging-Texte 168 Anhang F Klassifikationsmodelle resultierend aus manuellen und lexikalischen Trainingsdaten 177 Anhang G Forschungsdaten-Anhang 181Während der vergangenen zehn Jahre vollzog sich eine signifikante Veränderung des World Wide Webs, das sich zum sogenannten „Web 2.0“ entwickelte. Das wesentlichste Merkmal dieser neuen Qualität des WWW ist die Beteiligung der Nutzer bei der Erstellung der Inhalte. Diese Entwicklung fördert das Entstehen von Nutzergemeinschaften, die kollaborativ in unterschiedlichsten Projekten Informationen sammeln und veröffentlichen. Prominente Beispiele für solche Projekte sind die Online-Enzyklopädie „Wikipedia“, die Microblogging-Plattform „Twitter“, die Foto-Plattform „Flickr“ und die Sammlung topographischer Informationen „OpenStreetMap“. Nutzergenerierte Inhalte, die direkt oder indirekt raumbezogen sind, können spezifischer als „nutzergenerierte geographische Informationen“ bezeichnet werden. Der Raumbezug dieser Informationen entsteht entweder direkt durch die Angabe räumlicher Koordinaten als Metainformationen oder er kann indirekt durch die Georeferenzierung von in den Informationen enthaltenen Toponymen oder Adressen hergestellt werden. Nutzergenerierte geographische Informationen haben für die Forschung den besonderen Vorteil, dass sie einerseits häufig gänzlich ohne oder nur mit geringen Kosten verfügbar gemacht werden können und andererseits eine Vielzahl von menschlichen Entscheidungen widerspiegeln, die mit dem Raum verknüpft sind. In der vorliegenden Dissertation wird die Beziehung von Raum und Inhalt nutzergenerierter geographischer Informationen aus zwei Perspektiven untersucht. Im ersten Teil der Arbeit steht die Frage im Vordergrund, für welchen Anteil an Informationen eine Beziehung zwischen Raum und Informationsinhalt in der Art besteht, dass die Informationen im Georaum lokalisierbar sind. In diesem Zusammenhang existiert seit den 1980er Jahren die unter Nutzern von geographischen Informationssystemen weit verbreitete These, dass 80% aller Informationen einen Raumbezug haben. Diese These dient im gesamten Spektrum der Branche als Marketinginstrument, ist jedoch nicht empirisch belegt. Diese Arbeit trägt dazu bei, die bestehende Forschungslücke zu schließen. Für die Prüfung dieser These, die in der Arbeit als „Raumbezugshypothese“ bezeichnet wird, werden zwei Ansätze vorgestellt. Der erste Ansatz basiert auf der Analyse eines möglichst repräsentativen Informationskorpus, wofür die deutsche Sprachversion der Wikipedia ausgewählt wird. Diese wird als Informationsnetzwerk modelliert, indem deren Artikel als Knoten und deren interne Querverweise als Kanten eines gerichteten Graphen betrachtet werden. Mit Hilfe dieses Netzwerkes ist es möglich eine abgestufte Definition des Raumbezuges von Informationen einzuführen, indem die Entfernung jedes Artikels innerhalb des Netzwerkes zum jeweils nächstgelegenen Artikel, der mit räumlichen Koordinaten gekennzeichnet ist, berechnet wird. Parallel dazu wird ein Befragungsansatz entwickelt, bei dem Probanden die Aufgabe haben, Informationen in die Kategorien „Direkter Raumbezug“, „Indirekter Raumbezug“ und „Kein Raumbezug“ einzuordnen. Die Synthese beider Ansätze führt zu einer empirisch begründeten Zahl für die „Raumbezugsthese“. Das Ergebnis ist, dass für das Untersuchungskorpus Wikipedia 27% der Informationen als direkt raumbezogenen und 30% der Informationen als indirekt raumbezogen kategorisiert werden können. Im zweiten Teil der Arbeit wird die Forschungsfrage untersucht, inwiefern nutzergenerierte Informationen, die über mobile Geräte erzeugt werden, in Beziehung zu den Orten stehen, an denen sie veröffentlicht werden. Als Forschungskorpus dienen mobil verfasste Microblogging-Texte. Dies sind kurze Texte, die über das WWW veröffentlicht werden. Bei dieser Informationsart liegt im Gegensatz zu beispielsweise topographischen Information oder Fotobeschreibungen die Vermutung eines starken Zusammenhanges zwischen dem Inhalt der Informationen und deren Positionen nicht nahe. Die Analyse von Microblogging-Texten bietet unter anderem Potential für die Markt- und Meinungsforschung, die Beobachtung von Naturereignissen und menschlichen Aktivitäten sowie die Entscheidungsunterstützung in Katastrophenfällen. Aus der räumlichen Auswertung kann sich dabei ein Mehrwert ergeben, für einen Teil der Anwendungen ist die räumliche Auswertung sogar die notwendige Voraussetzung. Aus diesem Grund ist die Erforschung des Zusammenhanges der veröffentlichten Inhalte mit den Orten, an denen diese entstehen, von Interesse. In der Arbeit werden eine Methoden vorgestellt, mit deren Hilfe die Untersuchung dieser Korrelation am Beispiel von klassifizierten Points of Interest durchgeführt wird. Zu diesem Zweck werden die Texte mit Hilfe von manueller Klassifikation und maschineller Sprachverarbeitung entsprechend ihrer Relevanz für die getesteten Objektklassen klassifiziert. Anschließend wird geprüft, ob der Anteil der relevanten Texte in der Nähe von Objekten der getesteten Klassen überdurchschnittlich hoch ist. Die Ergebnisse der Untersuchungen zeigen, dass die Stärke der Raum-Inhalt-Korrelation von den getesteten Objektklassen abhängig ist. Während sich beispielsweise bei Bahnhöfen, Flughäfen und Restaurants eine deutliche Abhängigkeit des Anteils der relevanten Texte von der Entfernung zu den betreffenden Objekten zeigt, kann dies für andere Objektklassen, wie z.B. Kino oder Supermarkt nicht bestätigt werden. Da frühere Forschungsarbeiten bei der Analyse im kleinmaßstäbigen Bereich eine Korrelation der Informationsinhalte mit deren Entstehungsorten feststellten, kann geschlussfolgert werden, dass der Zusammenhang zwischen Raum und Inhalt bei Microblogging-Texten sowohl vom Maßstab als auch vom Thema abhängig ist.:1 Einleitung 1 1.1 Motivation 1 1.1.1 Bedeutung raumbezogener nutzergenerierter Inhalte für die geographische Informationswissenschaft und die Kartographie 1 1.1.2 Die Raumbezugshypothese 3 1.1.3 Die Korrelation von Ort und Inhalt bei nutzergenerierten Inhalten 4 1.2 Forschungsziele und Forschungsfragen 5 1.2.1 Prüfung der Raumbezugshypothese 5 1.2.2 Untersuchung der Korrelation von Ort und Inhalt von nutzergenerierten Inhalten 6 1.3 Aufbau der Arbeit 7 1.3.1 Die Beziehung zwischen Raum und Inhalt von nutzergenerierten geographischen Informationen 7 1.3.2 Gliederung der Arbeit 7 1.3.3 Verwendete Publikationen 8 2 Forschungsstand 11 2.1 Relevante Begriffe 11 2.1.1 Web 2.0 11 2.1.2 User Generated Content / Nutzergenerierte Inhalte 12 2.1.2.1 Bedeutung und Begriffsherkunft 12 2.1.2.2 Begriffsklärung 12 2.1.2.3 Arten von UGC 13 2.1.2.4 Kritik 14 2.1.2.5 Forschungspotential 14 2.1.3 Raumbezug 14 2.1.3.1 Der Begriff ‚Raumbezug‘ in der Fachliteratur 14 2.1.3.2 Kategorien des Georaumbezuges 16 2.1.4 Georäumlich 16 2.1.5 Geographische Information und Geodaten 17 2.1.5.1 Begriffsklärung 17 2.1.5.2 Points of Interest als Spezialfall 19 2.1.6 Volunteered Geographic Information / Nutzergenerierte geographische Informationen 19 2.1.6.1 Begriffsherkunft und Charakteristika von VGI 19 2.1.6.2 Das Konzept der menschlichen Sensoren 20 2.1.6.3 Kommunikation geographischer Informationen bei VGI 21 2.1.6.4 Der Mehrwert von VGI 21 2.1.6.5 Motive der Beitragenden 22 2.1.6.6 VGI im globalen Kontext 22 2.1.6.7 Erfassung der Informationen: partizipativ vs. opportunistisch 23 2.1.6.8 Formale Definition 23 2.1.6.9 Deutsche Entsprechung des Begriffs 24 2.1.7 Semantik nutzergenerierter geographischer Informationen 25 2.1.7.1 Strukturierte Form 25 2.1.7.2 Unstrukturierte Form 26 2.2 Arten nutzergenerierter geographischer Informationen 26 2.2.1 Topographische Informationen – OpenStreetMap 28 2.2.1.1 Korpusbeschreibung 28 2.2.1.2 Forschungsüberblick 30 2.2.1.3 Raumbezug 32 2.2.2 Enzyklopädische Informationen – Wikipedia 34 2.2.2.1 Korpusbeschreibung 34 2.2.2.2 Forschungsüberblick 35 2.2.2.3 Raumbezug 36 2.2.2.4 Metaeigenschaften von Artikeln der deutschen Wikipedia 37 2.2.3 Microblogging-Texte – Twitter 39 2.2.3.1 Korpusbeschreibung 39 2.2.3.2 Forschungsüberblick 41 2.2.3.3 Raumbezug 42 2.2.4 Bilder und Bildmetainformationen – Flickr, Instagram, Picasa, Panoramio, Geograph 43 2.2.4.1 Korpusbeschreibung 43 2.2.4.2 Forschungsüberblick 45 2.3 Informationen und Netzwerke 46 2.3.1 Beispiele für Netzwerkstrukturen 46 2.3.2 Implikationen vernetzter Informationen für die Raumbezugshypothese 47 2.3.3 Netzwerkeigenschaften der Wikipedia 47 2.4 Geographische Informationen und Kognition 49 2.5 Informationen klassifizieren durch maschinelle Sprachverarbeitung 50 2.5.1 Naive Bayes 51 2.5.2 Maximum Entropy 51 2.5.3 Support Vector Machines 52 3 Methoden und Ergebnisse 53 3.1 Korpusanalytischer Ansatz für die Prüfung der Raumbezugshypothese 53 3.1.1 Netzwerkgrad des Georaumbezuges 53 3.1.2 Datenprozessierung 56 3.1.3 Ergebnisse der NGGR-Berechnung 57 3.1.4 Korrelation zwischen NGGR und den Eigenschaften von Wikipedia-Artikeln 60 3.2 Befragungsansatz für die Prüfung der Raumbezugshypothese 65 3.2.1 Kategorisierungsaufgabe zur Untersuchung des Georaumbezuges 65 3.2.1.1 Material 66 3.2.1.2 Prozedur 66 3.2.1.3 Teilnehmer 67 3.2.2 Hypothesen 68 3.2.3 Daten zur Beteiligung an der Befragung 68 3.2.4 Ergebnisse 70 3.3 Synthese von korpusanalytischem Ansatz und Befragungsansatz für die Prüfung der Raumbezugshypothese 71 3.3.1 Methodik 71 3.3.2 Ergebnisse 72 3.3.3 Einfluss des Faktors Wissen auf die Ergebnisse der Befragung 73 3.3.4 Einfluss

    National spatial data infrastructure collaboration for the Kingdom of Saudi Arabia

    Get PDF
    Spatial data is a vital national resource necessary for a country’s efficient and sustainable economic, social and environmental development, and so must be properly developed and managed. In the Kingdom of Saudi Arabia (KSA), there is lack of knowledge and no clear framework describing the optimal way for stakeholders, users, providers or administrators, to collaborate effectively in establishing a National Spatial Data Infrastructure (NSDI). Moreover, the complex, multi-layer and multi-jurisdiction system of government leads to competing interests and mandates in coordinating spatial activity. Previous studies on NSDI in KSA focused on technical infrastructure strategy. However, there is a need to study institutional/organisational issues affecting collaboration in NSDI for KSA. This research presented in this thesis leads to recommendations for a best practice, collaboration initiative for Saudi NSDI, and contributes to advancing the goals and implementation of NSDI in KSA. A mixed (triangulated) quantitative and qualitative case study research design was adopted to assist in achieving the research aims, utilising a questionnaire and semi-structured interviews. The data was analysed and elicited concepts to recommend the Saudi NSDI collaboration initiative. A literature review was conducted in areas relevant to Spatial Data Infrastructure (SDI) and collaboration. The diverse definitions for SDI, its main components, and hierarchical nature were explored. Definitions for collaboration, motivational factors, and potential risks and costs were also reviewed. While a conventional NSDI is characterised by a top down approach, new technologies connected to social developments have led to a rapid, parallel development of commercial-, and consumer-led SDI, or dynamic ‘GeoWeb’, representing the potential next generation, Web 2.0 form, of NSDI. Institutional and technical factors are key elements in the success of NSDI collaboration initiatives, which include organisational commitment, policies, and technological resources. The national initiatives for the UK, USA, Australia, and Canada are reviewed and compared, along five key themes: objectives and vision, coordination, datasets, standards, and access. This highlighted the evolving nature of NSDI, given the rapid pace of developments in technology-driven applications and tools, and that coordination and agreement among all stakeholders requires accurate and reliable datasets, widely accepted metadata and standards, and interoperable technology, and must include all government levels and jurisdictions, with greater private sector integration. The current situation in KSA regarding the main SDI stakeholders, and their historical development, including legislation and policies and the barriers to sharing spatial data existing, facilitates background to understanding the issues involved in developing a Saudi NSDI. This is reinforced by primary data collected through a quantitative questionnaire survey of all 26 spatial data bodies in KSA, and qualitative semi-structured interviews of 72 key persons. The data includes themes, like types of spatial organisation and sphere of operations, data types and themes, standards and technical issues, and inter-organisational relationships and collaboration. The results revealed a lack of collaboration due to negative organisational cultures, and technical obstacles relating to a need for unified spatial data and metadata standards and specifications. In particular, there was an absence of appropriate legislation to deal with the two previous points, as well as providing protection for intellectual property; such legislation would outline a system within which collaboration would take place. The historical development and current status of key, independent SDI initiatives in KSA, i.e. MOMRA, Riyadh, and Saudi National SDI, are presented using data from secondary and primary sources. Each initiative represents city, ministry, and national level SDI initiative for collaboration. Finally, this research concludes by providing recommendations for best practice in collaboration among the various stakeholders forming a potential Saudi NSDI. It also outlines suggestions for future work

    Aplicación de los fundamentos de las infraestructuras de datos espaciales en la construcción de sistemas de información geográfica corporativos

    Get PDF
    [ES]La producción y gestión de la información geográfica es una tarea compleja. Los gobiernos siempre han contado con información geográfica, pero no siempre se ha sabido gestionar de la manera más adecuada. La aparición de los sistemas de información geográfica (SIG) facilitó estos trabajos y permitió incorporar los datos geográficos a los procesos para gestionar recursos, planificar intervenciones y tomar decisiones en los diferentes departamentos de la administración. Más tarde surgieron iniciativas para gestionar la información almacenada en estos sistemas de una manera coordinada mediante la creación de los SIG corporativos. Con la incorporación de los avances tecnológicos en este campo, se empezaron a implantar las denominadas infraestructuras de datos espaciales (IDE) en los diferentes niveles de gobierno. Estas herramientas proporcionan mecanismos para compartir la información geográfica de forma fácil y dinámica, permitiendo su utilización en la mayor parte de los procesos que realizan los ciudadanos y las empresas en su día a día. En muchas organizaciones, se ha optado por usar estas infraestructuras como el instrumento principal para la gestión corporativa de los datos geográficos. La utilización de los componentes que conforman estas infraestructuras ofrece considerables ventajas en el intercambio de información entre sistemas, pero al mismo tiempo surgen dudas en su comportamiento corporativo para asegurar el control y la integridad de los datos relativos al territorio. Este trabajo parte de una revisión de un conjunto de sistemas que se utilizan para gestionar la información geográfica. Intentaremos incidir en los aspectos organizativos, en la relación entre las diferentes unidades que los componen y en las funcionalidades que ofrecen a sus usuarios. También nos vamos a parar a observar la evolución y la arquitectura de las infraestructuras de datos espaciales con el objetivo de comprender su operatividad y valorar el funcionamiento de sus componentes. Para cerrar el círculo y tocar todos los aspectos relacionados con la gestión de la información geográfica, haremos una revisión de los métodos utilizados para desarrollar especificaciones de datos, su influencia en la interoperabilidad y en el intercambio de datos entre sistemas. Con los conocimientos extraídos de este examen, pasaremos a proponer lo que consideramos un modelo de SIG corporativo con las mejores funcionalidades, adaptado a la tecnología utilizada en el desarrollo de IDEs, siguiendo los estándares internacionales y cumpliendo los criterios de interoperabilidad en todos los niveles recomendados. Como finalidad última se propone un modelo de SIG corporativo diseñado para su implementación en una administración pública concreta, cuyas características ayudarán a complementar y favorecer la operatividad de la IDE, reduciendo los costes de gestión y facilitando la puesta en marcha de nuevos servicios.[EN]The production and management of geographic information can be considered a complex andchallenging task. Governments have always manipulated geographical information, but it hasnot always been managed in the most appropriate way. The appearance of geographicinformation systems (GIS) made this work easier and made it possible the inclusion ofgeographic data into the management resources processes, planning interventions and decisionmakingprocesses in the different departments of the administration. Later on, there emergeddifferent initiatives to manage the information stored in these systems, in a coordinated way,thanks to the development of a corporate GIS. With the incorporation of technologicaladvances in this field, the so-called spatial data infrastructures (SDIs) began to be implementedat different levels of the government. These tools provide mechanisms for sharing geographic information in an easy and dynamicway, allowing this information to be used in most of the processes carried out by citizens andcompanies in their daily lives. Many organizations have chosen to use these infrastructures asthe main instrument for implementing a corporate management of geographic data. The use ofthe components of these infrastructures offer considerable advantages when we talk aboutinterchanging information between systems, but, at the same time, there are many doubts abouttheir corporate behaviour to ensure control and integrity of these territorial data. This work is based on a general overview of a set of systems used to manage geographicinformation. We will try to emphasise in their organisational aspects, in the relation between thedifferent units which compose them and in the functionalities, they offer to their users. We willalso analyse the evolution and architecture of spatial data infrastructures with the aim ofunderstanding their operability and evaluating how their components work. To close the circleand have a complete vision of all aspects of geographic information management, we will reviewthe methods used to develop data specifications, their influence on interoperability, and theinterchange of data between systems. With the know-how extracted from this paper, we willpropose what we consider as a corporate GIS model with the best functionalities, adapted tothe technology used in the development of IDEs, following the international standards andmeeting the criteria of interoperability at all recommended levels. The ultimate purpose of this work is to propose a corporate GIS model designed to beimplemented in a public administration which must show certain features useful to complementand favour the IDE operability. In this way, management costs are reduced and the launchingof new services gets less complicated
    corecore