245 research outputs found

    Prise en compte des dépendances entre données thématiques utilisateur et données topographiques lors d’un changement de niveau de détail

    Get PDF
    With the large availability of reference topographic data, creating geographic data is not exclusive to experts of geographic information any more. More and more users rely on reference data to create their own data, hereafter called thematic data. Reference data then play the role of support for thematic data. Thematic data make sense by themselves, but even more by their relations with topographic data. Not taking into account the relations between thematic and topographic data during processes that modify the former or the latter may cause inconsistencies, especially for processes that are related to changing the level of detail. The objective of this thesis is to define a methodology to preserve the consistency between thematic and topographic when the level of detail is modified. This thesis focuses on the adaptation of thematic data after a modification of topographic data: we call this process thematic data migration. We first propose a model for the migration of punctual thematic data hosted by a network. This model is composed of: (1) a model to describe the referencing of thematic data on topographic data using spatial relations (2) a method to re-locate thematic data based on these relations. The approach consists in identifying the expected final relations according to the initial relations and the modifications of topographic data between the initial and the final state. The thematic data are then re-located using a multi-criteria method in order to satisfy, as much as possible, the expected relations. An implementation is presented on toy problems and on a real use case provided by a French public authority in charge of road network management. The extension of the proposed model to take into account the relations for other applications than thematic data migration is also discussedAvec l'importante disponibilité de données topographiques de référence, la création des données géographiques n'est plus réservée aux professionnels de l'information géographique. De plus en plus d'utilisateurs saisissent leurs propres données, que nous appelons données thématiques, en s'appuyant sur ces données de référence qui jouent alors le rôle de données support. Les données thématiques ainsi saisies font sens en tant que telles, mais surtout de par leurs relations avec les données topographiques. La non prise en compte des relations entre données thématiques et topographiques lors de traitements modifiant les unes ou les autres peut engendrer des incohérences, notamment pour les traitements liés au changement de niveau de détail. L'objectif de la thèse est de définir une méthodologie pour préserver la cohérence entre les données thématiques et topographiques lors d'un changement de niveau de détail. Nous nous concentrons sur l'adaptation des données thématiques suite à une modification des données topographiques, processus que nous appelons migration des données thématiques. Nous proposons d'abord un modèle pour la migration de données thématiques ponctuelles sur réseau composé de : (1) un modèle pour décrire le référencement des données thématiques sur les données topographiques par des relations spatiales (2) une méthode de relocalisation basée sur ces relations. L'approche consiste à identifier les relations finales attendues en fonction des relations initiales et des changements sur les données topographiques entre les états initial et final. La relocalisation est alors effectuée grâce à une méthode multicritère de manière à respecter au mieux les relations attendues. Une mise en œuvre est présentée sur des cas d'étude jouets et sur un cas réel fourni par un service de l'Etat gestionnaire de réseau routier. Nous discutons enfin l'extension du modèle proposé pour traiter la prise en compte des relations pour d'autres applications que la migration de données thématique

    Enrichissement d'un curriculum par recherche sur Internet

    Full text link
    Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal

    Un système de recherche d'information personnalisée basé sur la modélisation multidimensionnelle de l'utilisateur

    Get PDF
    Depuis l'explosion du Web, la Recherche d'Information (RI) s'est vue étendue et les moteurs de recherche sur le Web ont vu le jour. Les méthodes classiques de la RI, surtout destinées à des recherches textuelles simples, se sont retrouvées face à des documents de différents formats et des contenus riches. L'utilisateur, en réponse à cette avancée, est devenu plus exigeant quant aux résultats retournés par les systèmes de RI. La personnalisation tente de répondre à ces exigences en ayant pour objectif principal l'amélioration des résultats retournés à l'utilisateur en fonction de sa perception et de ses intérêts ainsi que de ses préférences. Le présent travail de thèse se situe à la croisée des différents aspects présentés et couvre cette problématique. Elle a pour objectif principal de proposer des solutions nouvelles et efficaces à cette problématique. Pour atteindre cet objectif, un système de personnalisation de la recherche spatiale et sémantique sur le Web et intégrant la modélisation de l'utilisateur, a été proposé. Ce système comprend deux volets : 1/ la modélisation de l'utilisateur ; 2/ la collaboration implicite des utilisateurs à travers la construction d'un réseau de modèles utilisateurs, construit itérativement lors des différentes recherches effectuées en ligne. Un prototype supportant le système proposé a été développé afin d'expérimenter et d'évaluer l'ensemble de la proposition. Ainsi, nous avons effectué un ensemble d'évaluation, dont les principales sont : a) l'évaluation de la qualité du modèle de l'utilisateur ; b) l'évaluation de l'efficacité de la recherche d'information ; c) l évaluation de l'efficacité de la recherche d'information intégrant les informations spatiales ; d) l'évaluation de la recherche exploitant le réseau d'utilisateurs. Les expérimentations menées montrent une amélioration de la personnalisation des résultats présentés par rapport à ceux obtenus par d'autres moteurs de recherche.The web explosion has led Information Retrieval (IR) to be extended and web search engines emergence. The conventional IR methods, usually intended for simple textual searches, faced new documents types and rich and scalable contents. The users, facing these evolutions, ask more for IR systems search results quality. In this context, the personalization main objective is improving results returned to the end user based sing on its perception and its interests and preferences. This thesis context is concerned with these different aspects. Its main objective is to propose new and effective solutions to the personalization problem. To achieve this goal, a spatial and semantic web personalization system integrating implicit user modeling is proposed. This system has two components: 1/ user modeling; /2 implicit users' collaboration through the construction of a users' models network. A system prototype was developed for the evaluation purpose that contains: a) user model quality evaluation; b) information retrieval quality evaluation; c) information retrieval quality evaluation with the spatial user model data; d) information retrieval quality evaluation with the whole user model data and the users' models network. Experiments showed amelioration in the personalized search results compared to a baseline web search.PARIS11-SCD-Bib. électronique (914719901) / SudocSudocFranceF

    Système de recherche d’information étendue basé sur une projection multi-espaces

    Get PDF
    Depuis son apparition au début des années 90, le World Wide Web (WWW ou Web) a offert un accès universel aux connaissances et le monde de l’information a été principalement témoin d’une grande révolution (la révolution numérique). Il est devenu rapidement très populaire, ce qui a fait de lui la plus grande et vaste base de données et de connaissances existantes grâce à la quantité et la diversité des données qu'il contient. Cependant, l'augmentation et l’évolution considérables de ces données soulèvent d'importants problèmes pour les utilisateurs notamment pour l’accès aux documents les plus pertinents à leurs requêtes de recherche. Afin de faire face à cette explosion exponentielle du volume de données et faciliter leur accès par les utilisateurs, différents modèles sont proposés par les systèmes de recherche d’information (SRIs) pour la représentation et la recherche des documents web. Les SRIs traditionnels utilisent, pour indexer et récupérer ces documents, des mots-clés simples qui ne sont pas sémantiquement liés. Cela engendre des limites en termes de la pertinence et de la facilité d'exploration des résultats. Pour surmonter ces limites, les techniques existantes enrichissent les documents en intégrant des mots-clés externes provenant de différentes sources. Cependant, ces systèmes souffrent encore de limitations qui sont liées aux techniques d’exploitation de ces sources d’enrichissement. Lorsque les différentes sources sont utilisées de telle sorte qu’elles ne peuvent être distinguées par le système, cela limite la flexibilité des modèles d'exploration qui peuvent être appliqués aux résultats de recherche retournés par ce système. Les utilisateurs se sentent alors perdus devant ces résultats, et se retrouvent dans l'obligation de les filtrer manuellement pour sélectionner l'information pertinente. S’ils veulent aller plus loin, ils doivent reformuler et cibler encore plus leurs requêtes de recherche jusqu'à parvenir aux documents qui répondent le mieux à leurs attentes. De cette façon, même si les systèmes parviennent à retrouver davantage des résultats pertinents, leur présentation reste problématique. Afin de cibler la recherche à des besoins d'information plus spécifiques de l'utilisateur et améliorer la pertinence et l’exploration de ses résultats de recherche, les SRIs avancés adoptent différentes techniques de personnalisation de données qui supposent que la recherche actuelle d'un utilisateur est directement liée à son profil et/ou à ses expériences de navigation/recherche antérieures. Cependant, cette hypothèse ne tient pas dans tous les cas, les besoins de l’utilisateur évoluent au fil du temps et peuvent s’éloigner de ses intérêts antérieurs stockés dans son profil. Dans d’autres cas, le profil de l’utilisateur peut être mal exploité pour extraire ou inférer ses nouveaux besoins en information. Ce problème est beaucoup plus accentué avec les requêtes ambigües. Lorsque plusieurs centres d’intérêt auxquels est liée une requête ambiguë sont identifiés dans le profil de l’utilisateur, le système se voit incapable de sélectionner les données pertinentes depuis ce profil pour répondre à la requête. Ceci a un impact direct sur la qualité des résultats fournis à cet utilisateur. Afin de remédier à quelques-unes de ces limitations, nous nous sommes intéressés dans ce cadre de cette thèse de recherche au développement de techniques destinées principalement à l'amélioration de la pertinence des résultats des SRIs actuels et à faciliter l'exploration de grandes collections de documents. Pour ce faire, nous proposons une solution basée sur un nouveau concept d'indexation et de recherche d'information appelé la projection multi-espaces. Cette proposition repose sur l'exploitation de différentes catégories d'information sémantiques et sociales qui permettent d'enrichir l'univers de représentation des documents et des requêtes de recherche en plusieurs dimensions d'interprétations. L’originalité de cette représentation est de pouvoir distinguer entre les différentes interprétations utilisées pour la description et la recherche des documents. Ceci donne une meilleure visibilité sur les résultats retournés et aide à apporter une meilleure flexibilité de recherche et d'exploration, en donnant à l’utilisateur la possibilité de naviguer une ou plusieurs vues de données qui l’intéressent le plus. En outre, les univers multidimensionnels de représentation proposés pour la description des documents et l’interprétation des requêtes de recherche aident à améliorer la pertinence des résultats de l’utilisateur en offrant une diversité de recherche/exploration qui aide à répondre à ses différents besoins et à ceux des autres différents utilisateurs. Cette étude exploite différents aspects liés à la recherche personnalisée et vise à résoudre les problèmes engendrés par l’évolution des besoins en information de l’utilisateur. Ainsi, lorsque le profil de cet utilisateur est utilisé par notre système, une technique est proposée et employée pour identifier les intérêts les plus représentatifs de ses besoins actuels dans son profil. Cette technique se base sur la combinaison de trois facteurs influents, notamment le facteur contextuel, fréquentiel et temporel des données. La capacité des utilisateurs à interagir, à échanger des idées et d’opinions, et à former des réseaux sociaux sur le Web, a amené les systèmes à s’intéresser aux types d’interactions de ces utilisateurs, au niveau d’interaction entre eux ainsi qu’à leurs rôles sociaux dans le système. Ces informations sociales sont abordées et intégrées dans ce travail de recherche. L’impact et la manière de leur intégration dans le processus de RI sont étudiés pour améliorer la pertinence des résultats. Since its appearance in the early 90's, the World Wide Web (WWW or Web) has provided universal access to knowledge and the world of information has been primarily witness to a great revolution (the digital revolution). It quickly became very popular, making it the largest and most comprehensive database and knowledge base thanks to the amount and diversity of data it contains. However, the considerable increase and evolution of these data raises important problems for users, in particular for accessing the documents most relevant to their search queries. In order to cope with this exponential explosion of data volume and facilitate their access by users, various models are offered by information retrieval systems (IRS) for the representation and retrieval of web documents. Traditional SRIs use simple keywords that are not semantically linked to index and retrieve these documents. This creates limitations in terms of the relevance and ease of exploration of results. To overcome these limitations, existing techniques enrich documents by integrating external keywords from different sources. However, these systems still suffer from limitations that are related to the exploitation techniques of these sources of enrichment. When the different sources are used so that they cannot be distinguished by the system, this limits the flexibility of the exploration models that can be applied to the results returned by this system. Users then feel lost to these results, and find themselves forced to filter them manually to select the relevant information. If they want to go further, they must reformulate and target their search queries even more until they reach the documents that best meet their expectations. In this way, even if the systems manage to find more relevant results, their presentation remains problematic. In order to target research to more user-specific information needs and improve the relevance and exploration of its research findings, advanced SRIs adopt different data personalization techniques that assume that current research of user is directly related to his profile and / or previous browsing / search experiences. However, this assumption does not hold in all cases, the needs of the user evolve over time and can move away from his previous interests stored in his profile. In other cases, the user's profile may be misused to extract or infer new information needs. This problem is much more accentuated with ambiguous queries. When multiple POIs linked to a search query are identified in the user's profile, the system is unable to select the relevant data from that profile to respond to that request. This has a direct impact on the quality of the results provided to this user. In order to overcome some of these limitations, in this research thesis, we have been interested in the development of techniques aimed mainly at improving the relevance of the results of current SRIs and facilitating the exploration of major collections of documents. To do this, we propose a solution based on a new concept and model of indexing and information retrieval called multi-spaces projection. This proposal is based on the exploitation of different categories of semantic and social information that enrich the universe of document representation and search queries in several dimensions of interpretations. The originality of this representation is to be able to distinguish between the different interpretations used for the description and the search for documents. This gives a better visibility on the results returned and helps to provide a greater flexibility of search and exploration, giving the user the ability to navigate one or more views of data that interest him the most. In addition, the proposed multidimensional representation universes for document description and search query interpretation help to improve the relevance of the user's results by providing a diversity of research / exploration that helps meet his diverse needs and those of other different users. This study exploits different aspects that are related to the personalized search and aims to solve the problems caused by the evolution of the information needs of the user. Thus, when the profile of this user is used by our system, a technique is proposed and used to identify the interests most representative of his current needs in his profile. This technique is based on the combination of three influential factors, including the contextual, frequency and temporal factor of the data. The ability of users to interact, exchange ideas and opinions, and form social networks on the Web, has led systems to focus on the types of interactions these users have at the level of interaction between them as well as their social roles in the system. This social information is discussed and integrated into this research work. The impact and how they are integrated into the IR process are studied to improve the relevance of the results

    Identification du bâti à partir d'images satellitaires à très hautes résolutions spatiales

    Get PDF
    Résumé: L'urbanisation est un phénomène croissant qui touche l'ensemble du globe et qui a comme conséquence l'étalement des surfaces urbanisées. L'ampleur et la rapidité de cet étalement posent partout des problèmes socio-économiques et environnementaux. Pour réduire au maximum ces problèmes, les aménageurs ont besoin de données spatiales à intégrer aux outils de gestion et de planification. Dans ce contexte général, l'apparition des images satellitaires à Très Haute Résolution Spatiale (THRS) suscitent de fortes attentes. Ces images conjuguent en effet des résolutions spatiales fines, à des coûts raisonnables d'acquisition et à des courtes périodes de revisites. Les méthodes d'interprétation actuelles apparaissent cependant inadaptées à ces nouvelles images. À partir de cette problématique, l'objectif de notre recherche est identifié comme l'élaboration d'une méthode d'extraction semi-automatique des bâtiments à partir d'images THRS. Pour atteindre cet objectif, nous avons déterminé plusieurs étapes. Chacune d'elles est associée à un chapitre de cette thèse. Le premier chapitre expose le contexte général de notre recherche et conduit à l'identification de notre objectif. Nous présentons tout d'abord un bref historique de l'urbanisation avant de nous concentrer sur le phénomène d'étalement et sur les problèmes qu'il engendre. Nous nous intéressons ensuite à ce que la géographie peut apporter pour diminuer ces problèmes. Les positionnements conceptuels, théoriques et méthodologiques de l'analyse géographique des villes sont suivis d'une présentation des principaux outils de gestion et de planification urbaine. Il ressort un besoin croissant en données spatiales à intégrer à ces outils, besoin à partir duquel nous identifions notre objectif. Dans le second chapitre, nous vérifions la faisabilité de notre objectif à travers l'analyse des caractéristiques techniques des images puis des perturbations subies par le signal. La capacité des images à représenter fidèlement les objets urbains est ensuite abordée à travers les notions de qualité et d'interprétabilité des images. Les résultats confirment l'intérêt de l'utilisation des images satellitaires THRS pour l'analyse des objets urbains. Le troisième chapitre présente les phases préliminaires à l'élaboration de notre méthode d'extraction des bâtiments. Nous évaluons tout d'abord la qualité (géométrique et radiométrique) de l'image Ikonos support d'étude. Une revue des méthodes existantes fait ensuite ressortir une limite commune : la délimitation précise des bâtiments. Ce constat nous conduit à évaluer la qualité des méthodes de segmentation puis à réorienter nos choix méthodologiques. Le quatrième chapitre présente ce qui constitue le coeur de notre travail, à savoir le développement d'une méthode d'extraction du bâti. Après une formalisation rigoureuse des objectifs, nous présentons les principes théoriques de notre approche qui s'appuie sur une définition texturale des bâtiments. Le processus d'identification est basé sur la prise en compte conjointe, à l'aide d'un paramètre unique, de la variance du bâtiment et de celle de son entourage proche. Des informations additionnelles (présence d'ombre et de végétation) sont ensuite intégrées dans le but de diminuer les erreurs de commission. Le cinquième chapitre présente les résultats. Il montre la capacité de la méthode à identifier les bâtiments malgré certaines limites d'applicabilité, en particulier dans le cas des grands bâtiments et/ou dans les milieux hétérogènes. Des pistes d'améliorations sont proposées ainsi que des perspectives d'applications. Il ressort de ce travail que le principal apport tient dans l'originalité de l'approche théorique qui ouvre de nouvelles pistes de réflexion pour les travaux futurs.||Abstract: Urbanisation still remains one of the main problems worldwide. The extent and rapidity of the urban growth induce a number of socio-economic and environmental conflicts everywhere. In order to reduce these problems, urban planners need to integrate spatial information in planning tools. Actually high expectations are made on Very High Spatial Resolution imagery (VHSR). These high-spatial resolution images are available at a reasonable price and due to short revisit periods, they offer a high degree of actuality. However, interpretation methods seem not to be adapted to this new type of images. The aim of our study is to develop a new method for semi-automatic building extraction with VHSR. The different steps performed to achieve our objective are each presented in a chapter. In the first chapter, the general context of our research is described with the definition of our objective. After a short historical review of urbanisation, we focus on urban growth and associated problems. In the following we discuss the possible contributions of geography to reduce these problems. After discussing concepts, theories and methodologies of geographical analysis in urban areas, we present existing general urban planning tools. Finally, we show the special interest of our study that is due to a growing need to integrate spatial information in these decision support tools. In the second chapter we verify the possibility of reaching our objective by analysing the technical characteristics of the images, the noise and the distortions which affect the images. Quality and interpretability of the studied image is analysed in order to show the capacity of these image to represent urban objects as close to reality as possible. The results confirm the potential of VHSR Imagery for urban objects analysis. The third chapter deal with the preliminary steps necessary for the elaboration of our method of building extraction. First, we evaluate the quality of the Sherbrooke Ikonos image (geometric and radiometric quality), the basic image of our analysis. A review of existing methods clearly show a common limit: the detection of building boundaries. Consequently, we evaluate the efficiency of several segmentation methods that finally induces a change in our methodological approach. The fourth chapter contains the central part of our work, which consists in the development of a building extraction method. After strict formalisation of our, objectives, we present the theoretical principles of our approach based on textural buildings definition. In the identification process we use only one parameter that accounts at the same time for the variance of the building and the variance of its immediate surroundings. In the following, additional information (shadow and vegetation) is integrated to reduce commission errors. The last chapter exposes the results. They clearly show the capacity of our method for building identification. However, they show some limitations of application, especially on large size buildings and/or in heterogeneous areas. We also propose possible applications such as analysis of suburban buildings or detection of natural disaster damages. The main outcome of this work is the originality of our theoretical approach that encourages new reflections for future research

    GEoTweet: exploration des tweets géolocalisés à Genève

    Get PDF
    Que découvre-t-on sur la société genevoise quand on modélise des frontières au sein d’un réseau social tel que Twitter ? Comment la visualisation des tweets géolocalisés nous permet-elle de saisir la variété des communautés linguistiques à Genève ? Le projet GEoTweet propose des réponses à ces questions de recherche, à travers la mise en place d’une infrastructure permettant de récolter les tweets, de les explorer et de les interroger. Il implémente des modalités techniques d’accès, de stockage et d’exploitation des tweets géolocalisés à partir du streaming public mis à disposition par Twitter via son API, explore les tweets géolocalisés dans un contexte spatio-temporel défini (Genève et ses alentours), et teste des formes de visualisation des données géolocalisées en considérant leur potentiel analytique. Le premier axe de recherche concerne les frontières linguistiques virtuelles. Les tweets géolocalisés donnent des informations sur la population résidente et, en même temps, sur les flux volatiles d’autres catégories d’utilisateurs de l’espace urbain genevois. Le deuxième axe de recherche concerne les convergences et les divergences entre les frontières géopolitiques et les frontières virtuelles, et met en évidence leur perméabilité et leur influence réciproque. Le troisième axe de recherche concerne la qualité de données récoltées et leur fiabilité, à travers l’analyse de l’intégration entre différents media sociaux géolocalisés, les procédures d’élimination des robots et l’importance des sauvegardes pour le stockage. Le projet GEoTweet ouvre des perspectives additionnelles d’exploration et d’analyse des données, et est le point de départ d’une série d’événements grand public visant à la vulgarisation du big data

    L'AIS : une donnée pour l'analyse des activités en mer

    Get PDF
    4 pages, session "Mer et littoral"International audienceCette contribution présente des éléments méthodologiques pour la description des activités humaines en mer dans une perspective d'aide à la gestion. Différentes procédures, combinant l'exploitation de bases de données spatio-temporelles issue de données AIS archivées à des analyses spatiales au sein d'un SIG, sont testées afin de caractériser le transport maritime en Mer d'Iroise (Bretagne, France) sur les plans spatiaux, temporels et quantitatifs au cours d'une année

    Traduction des opérations de l'analyse historique dans le langage conceptuel des systèmes d'information géographique pour une exploration des processus morphologiques de la ville et du territoire

    Get PDF
    Present work intends to conceive an interface between Urban Morphology and Geographic Information Science (GISc). This interface is considered as a space of exchange for knowledge exploration between several disciplines. The links pointed out from this theoretical work help us define the framework of formalization of morphological processes. We have focused our efforts over the methodology of translation of the notion of morphological process. The main steps of translation of the historical analysis operations into the conceptual language of the GISc mainly include numerical handling of cartographic sources, i.e. maps, plans, cadastre, etc. The main problems encountered are linked to the heterogeneity of historical information such as: partial data sets, non-representative statistical ensembles and semantic relativity of concepts through time (polysemy, synonymy, etc.). We discuss these problems from the knowledge production process point of view. We focus on questions of knowledge emergence from quantitative analysis and, symmetrically, of concept formalization leading to data structures compatible with the idea of characterization. Our work is essentially based on the possibilities of the exploratory paradigm applied to geo-historical data. By doing so, we have been particularly interested in the contributions of the systematic approach to the enhancement of the interpretive potential of classical descriptive morphological analyses. Outcome of work are of different natures. We can mention among others: 1° the construction of a formal classification (ontology) of concepts subsuming transformation and evolution of the city and the territory and 2° the development of an exploratory approach of geo-historical data. We have also discussed the contribution of some social sciences' paradigms (Callon and Latour's sociology of translation, Koselleck's conceptual history (Begriffsgeschichte), Peirce's abduction, Ginzburg's indiciary paradigm, etc.) to GISc. In particular, we are interested in the enhancement of the process of modeling by rethinking the tasks of conceptualization and formalization by taking into account the historical context of production of information during the process of knowledge reduction. We have pointed out the importance of periods of conceptual stability to allow comparative measurements and of events to explain ruptures not only at the data level, but also at the level of the entire conceptualization. These outputs should be considered as a new step towards recognition of the exploratory approach as a relevant tool to face interdisciplinary and complex problems related to urban processes in general. In particular, this work helps us stabilizing the theoretical framework contributing to the definition of the next generation numerical archives and interoperability of systems. Indeed, these technical questions need modelers to take into account different kinds of evolution when dealing with either concepts or instances and to produce a common platform to manage both. Finally, we show some clues to continue this work by introducing collaborative approaches and exploratory multidimensional interfaces. The figure below illustrates the initial framework of this research and the extension resulting from our work
    • …
    corecore