Search CORE

267 research outputs found

La définition des annotations linguistiques selon les corpus : de l'écrit journalistique à l'oral

Author: Eshkol-Taravella Iris
Publication venue: HAL CCSD
Publication date: 16/10/2015
Field of study

Confronté à Internet, le Traitement Automatique des Langues (TAL) a dû relever le défi que posait l’analyse de textes dialogiques écrits (blog, forum, chat, réseaux sociaux etc.) et oraux. Les recherches présentées ont, dans un premier temps, porté sur le développement de systèmes à même de repérer et d’analyser l’information à partir d’une annotation des ressources. L’approche retenue privilégie l’intégration d’indices inhérents à la nature de corpus « hors normes » afin d’améliorer les techniques de traitement automatique. La chaîne d’opérations comprend quatre étapes :(i) L’observation et l’analyse manuelle des données afin de recenser les variations dans les occurrences et d’évaluer l’ampleur des phénomènes à annoter, leur classification et l’identification de leurs marqueurs formels.(ii) La modélisation de l’information à partir d’une typologie sous la forme d’un jeu d’étiquettes ajusté à la nature du corpus.(iii) La définition de la technologie congrue (généralement, l’arbitrage entre le développement d’un nouvel outil et l’adaptation d’un outil existant).(iv) L’implémentation du schéma d’annotation défini afin de procéder à une analyse quantitative et qualitative des résultats.L’annotation effectuée concerne les domaines de la syntaxe (étiquetage morpho-syntaxique et chunking), sémantique et/ou pragmatique (entités nommées, indices d’identification de la personne, reformulations etc.). L’application concerne aussi bien des entretiens transcrits que des titres de cartes géographiques, des recettes d’omelette que des articles du Monde. Les méthodes utilisées varient en fonction du corpus et de la tâche traitée. L’annotation syntaxique et le repérage des segments reformulés sont fondés sur la technique d’apprentissage automatique avec les CRFs ; le repérage des entités nommées et des indices d’identification de la personne dans les transcriptions de l’oral utilise les méthodes symboliques ; la détection automatique des tours de parole contenant la reformulation emploie les méthodes heuristiques. Le travail sur le français parlé et son annotation a conduit à la modélisation des caractéristiques propres à l’oral : disfluences, marqueurs discursifs, présentateurs, segmentation, commentaires personnels etc. Un autre phénomène caractéristique de l’oral, la reformulation, a fait l’objet d’une étude particulière. Le travail sur l’annotation du corpus oral, du corpus Web ou du corpus médiatique a permis de reconsidérer la notion de subjectivité qui constitue l’une des difficultés récurrentes du traitement automatique. L’étude de la subjectivité et son expression dans le discours a été poursuivie dans plusieurs des recherches menées : la subjectivité à partir des informations personnelles livrées par le locuteur, la subjectivité dans la perception et l’appropriation des lieux, la subjectivité dans les recettes de cuisine et enfin la subjectivité exprimée à travers les noms généraux

Thèses en Ligne

HAL Université de Tours

Néologismes dans la langue journalistique. Cas de la chronique Point Zéro du quotidien francophone El Watan

Author: BENABID Faïza
Publication venue
Publication date: 01/01/2022
Field of study

University of Biskra Theses Repository

Les tribulations d'un nom propre en traduction (étude contrastive du nom propre et de sa traduction à partir d'un corpus aligné de dix langues européennes)

Author: LECUIT Émeline
MAUREL Denis
VITAS Dusko
Publication venue: SCD de l'université de Tours, Tours
Publication date: 01/01/2012
Field of study

Les noms propres sont omniprésents et intéressent, depuis des siècles, philosophes et linguistes. Le travail réalisé ici est une étude contrastive des noms propres en traduction, divisée en quatre parties. Les deux premières parties sont théoriques. La première partie traite de la notion de nom propre en linguistique anglaise et en linguistique française. La deuxième partie présente les différents procédés de traduction, illustrés par des exemples sur les noms propres. Les deux parties suivantes sont expérimentales. La troisième partie détaille les différentes étapes de la constitution de notre corpus multilingue parallèle aligné et annoté, composé de onze versions du roman de Jules Verne, Le Tour du Monde en quatre-vingts jours, en dix langues européennes. La quatrième partie expose les résultats obtenus suite à l observation du comportement des noms propres en traduction.Cette étude contredit souvent l hypothèse largement répandue de leur intraduisibilité.Proper names are omnipresent and have long held the interest of both philosophers and linguists.Our work, divided into four parts, presents, from a contrastive perspective, the behaviour of proper names in translation.The first two parts are theoretical. Firstly, we give a general presentation of what is a proper name from the point of view of both English and French linguistics. Secondly, we introduce the different translation processes proper nouns can undergo.The last two parts are experimental. We begin by explaining the different phases in the process of constitution of our aligned and annotated multilingual parallel corpus, composed of eleven versions of Jules Verne s novel, Le Tour du monde en quatre-vingts jours, in ten European languages. We then present the results obtained from the observation of proper names behaviour in translation.These results often contradict the widespread idea regarding proper names untranslatability.TOURS-Bibl.électronique (372610011) / SudocSudocFranceF

OpenGrey Repository

Exploration textuelle du discours d'un quotidien régional au carrefour du XIXe et du XXe siècles : Le Petit Comtois (1883-1903)

Author: LETHIER Virginie
Publication venue: HAL CCSD
Publication date: 03/12/2009
Field of study

In contrast to topical trends of mediatic discourse analysis (predominantly focused on newspapers from the 21st century), this thesis aims at analyzing the discourse of a French newspaper called Le Petit Comtois (1883-1944). Rooted in various fields of research, namely corpus linguistics, “discourse analysis from a historical viewpoint” (Robin, Maldidier, Guilhaumou), “textual analysis of discourse“ (Adam, Heidmann) and lexical statistics (Lebart, Salem), this thesis questions the contributions of a new numerical philology (Rastier; Viprey).This work is based on two complementary axes of research: on the one hand, we worked on the constitution of a textual database with the aim of accurately editing, controlling and normalizing it in order to allow for a revival of interdisciplinary studies led on regional 19th century newspapers. Therefore, our point is to propose some methodological approaches in order to overcome technical obstacles which occur during the acquisition and the sharing of large volume of textual data. The construction and the normalization of the database condition the heuristic confrontation of points of views and the choice of textual sciences methods for the analysis.On the other hand, our objectives are to highlight the specificities of Le Petit Comtois discourse during the period 1883-1903. Exploring a 5.5 million-word corpus, we mainly use the textual statistical methods to produce the emergence of the linguistic, textual and discursive reliefs of the text itself in order to use them as clues for the continuation of the analysis, with the aim to overtake the traditional entrance of the vocabulary used in lexicometry and its ways to approach textuality.À la différence des tendances actuelles de l’analyse du discours médiatique, majoritairement tournée vers la presse nationale contemporaine, notre thèse vise un titre régional du XIXe siècle : Le Petit Comtois (1883-1944). Plongeant ses racines dans différents terreaux de recherche, à savoir la linguistique de corpus, l’analyse du discours du côté de l’histoire (Guilhaumou, Robin), la statistique textuelle (Lebart, Salem) et l’analyse textuelle du discours (Adam, Heidmann), cette thèse interroge les apports d’une nouvelle philologie numérique (Rastier; Viprey, Mayaffre) se fixant pour programme de renforcer l’accès aux matérialités discursives.Cette thèse articule ainsi deux axes de recherche complémentaires : d’une part, les conditions de la constitution d’une base de données textuelles finement établies, contrôlées et normalisées selon les recommandations XML-TEI, visant à favoriser le renouveau des lectures interdisciplinaires de la presse régionale de la Troisième République (chapitre II).Il s’agit, ce faisant, de proposer des pistes méthodologiques en vue de la levée des obstacles techniques pesant sur l’acquisition et le partage de grands volumes de données textuelles, dont dépendent les avancées des sciences du texte. Partant, on replacera ces pistes dans la perspective des débats théoriques contemporains en linguistique textuelle et linguistique de corpus.D’autre part, notre objectif est d’apporter un éclairage sur le discours du Petit Comtois sur la période 1883-1903 à partir d’un corpus de 5,5 millions de mots en articulant diverses méthodologies et niveaux d’analyse, de sorte à appréhender dans toute son hétérogénéité et sa complexité l’objet texte. Si notre recherche s’appuie principalement sur les outils de la statistique textuelle qui permettent de faire monter du corpus lui-même ses reliefs linguistiques, textuels, discursifs, envisagés comme des vecteurs d’exploration, elle vise à dépasser la traditionnelle entrée du vocabulaire sur laquelle se fonde la lexicométrie, et ses modes d’approche traditionnels sur cette entrée même.Parce qu’un texte est tout d’abord inscrit sur un support matériel signifiant, notre premier temps d’analyse textuelle du discours du Petit Comtois (chapitre III) est ainsi consacré à l’analyse de la mise en forme de l’information, telle qu’elle se donne à lire à travers l’organisation matérielle de l’aire scripturale (Peytard) et les niveaux d’organisation que sont le rubriquage et le système de titres du quotidien.Plus qu’un simple « chemin de fer » ayant pour fonction de catégoriser l’information, le rubriquage constitue un des ressorts principaux de la rédaction pour hiérarchiser l’information. Parce qu’il rend compte des catégories par lesquelles le quotidien découpe le monde, ce niveau constitue un lieu d’accès privilégié à l’identité du quotidien. Une analyse quantitative du rubriquage, mesurant la surface, l’emplacement topographique de chaque rubrique, sa fréquence moyenne, nous a permis d’observer, outre les thématiques principales du quotidien, les stratégies par lesquelles celui-ci hiérarchisait l’information. Ce volet d’analyse nous a permis d’observer que Le Petit Comtois, à l’instar de la presse quotidienne régionale de la Troisième République, fait la part belle aux événements de portée nationale et internationale, ainsi qu’à la vie politique de la Troisième République. Un examen linguistique des intitulés de rubrique du journal a pour sa part démontré la forte mise en valeur de la coïncidence de la temporalité de l’imprimé quotidien avec celle du monde, ainsi qu’une forte persistance des liens avec la matrice littéraire (Thérenty), perceptible notamment à travers la prédominance des intitulés de rubrique référant à l’écriture épistolaire.Notre intérêt s’est ensuite porté sur les titres du Petit Comtois, dont nous avons interrogé les caractéristiques linguistiques et fonctionnelles, les variations et les régularités en diachronie. Celles-ci ont été analysées à partir de l’étude d’un sous-corpus substantiel de 6910 titres, extrait d’une des rares rubriques comportant des titres de façon permanente de 1883 à 1903 : les « dépêches de nuit ». En premier lieu, au terme de l’analyse, a été dégagée la fonction de classification de l’information dans un horizon thématique, géographique ou historique assurée par les titres, au détriment d’une fonction d’annonce et de condensation de l’information principale de la dépêche. En second lieu, dans cette rubrique emblématique du journalisme d’information inscrite dans un quotidien revendiquant sa fonction d’organe porte-parole d’une sensibilité politique, les titres sont le lieu d’une coloration de l’information livrée par la voix du correspondant ou de l’agence Havas et donc des indices précieux de l’ethos discursif (Amossy) du quotidien : tout en exprimant sa lecture de l’actualité, Le Petit Comtois recourt à une parole railleuse et ludique, un certain franc-parler, visant à entretenir la connivence et la proximité avec son lecteur.Dans un second mouvement (chapitre IV), nous avons entrepris une série d’explorations dans le vocabulaire du Petit Comtois, entendues comme le socle d’un parcours objectivé du discours du journal. Une série de prise de vue sur le vocabulaire du Petit Comtois ont ainsi été constituées.L’index hiérarchique du corpus, analyse fort classique en lexicométrie, a livré une première indication sur la consistance lexico-thématique du corpus, en confirmant notamment l’ouverture du quotidien sur un horizon politique dont Paris est le cœur géographique et l’importance de la temporalité dans Le Petit Comtois.Une seconde analyse, tout aussi classique en lexicométrie, a consisté à examiner la ventilation du vocabulaire en diachronie (ou niveau macro-distributionnel) grâce aux méthodologies de l’AFC : celle-ci a pointé pour sa part une très nette division du corpus en deux séquences chronologiques distinctes : 1884-1896 d’une part, et 1897-1903 d’autre part. L’analyse des profils macro-distributionnels des items, associée à un mouvement de retour au texte, nous ont permis d’interpréter ce clivage comme l’opposition entre une première séquence marquée par un contexte colonialiste et revanchard ainsi que par les fameuses « affaires » politico-financières, et une séquence chronologique témoignant pour sa part d’un tournant radical et de l’intensification des débats autour de la question sociale.Nous nous sommes ensuite tournée vers l’analyse de la configuration fine du vocabulaire (niveau micro-distributionnel - Harris), mode d’accès privilégié à la textualité-texture, à ses dimensions non linéaires (tabulaires, réticulaires), encore insuffisamment exploitées et conceptualisées. L’analyse micro-distributionnelle du vocabulaire du Petit Comtois a ainsi suggéré que la configuration fine du vocabulaire s’organisait autour de quatre pôles isotropiques (Viprey), à consistance lexico-thématique voire rhétorico-stylistique, évoquant respectivement (1) les faits divers et leur passage en justice, (2) la vie législative, (3) les réseaux locaux de sociabilités, et enfin, (4) le vocabulaire du politique, voire de l’idée républicaine.Nous avons voulu observer l’évolution diachronique de cette configuration fine en diachronie. De façon très stimulante, si l’on tient compte des résultats livrés par l’examen du niveau macro-distributionnel et de la nature du discours étudié, la structure fine du vocabulaire se révèle extrêmement stable en diachronie. De rares items témoignent d’une évolution significative de leur co(n)texte d’une diachronie à une autre. Il est intéressant de remarquer que ceux-ci sont particulièrement emblématiques des évolutions socio-politiques dont prend acte la fin d’un très long XIXe siècle. C’est notamment le cas de la forme ouvriers, dont l’évolution très nette du profil collocatif marque celle de son sens. Dans un dernier temps, nous avons examiné les facteurs responsables de la stabilité du rubriquage observée : l’analyse des spécificités des rubriques a ainsi révélé une forte corrélation entre le niveau du rubriquage et celle de la structure fine du vocabulaire. L’invariance des « motifs » lexicaux et stylistiques du quotidien nous suggère donc que l’actualité et son essence présupposée « fluctuante », restent contrôlées et organisées par les pratiques routinières journalistiques, renvoyant tant à la sélection de l’information qu’à sa mise en scène comme événement. Enfin, un dernier temps de cette recherche (chapitre V) est dédié à la consolidation d’une méthode de typologie en corpus, appliquée au classement des rubriques, basée sur le niveau morphosyntaxique. À la recherche d’une typologie discursive des rubriques du Petit Comtois, ce volet d’analyse examine les vertus et les insuffisances d’un étiquetage automatique et explore les perspectives offertes par l’AFC en vue d’un dialogue continué avec les données. Devant être envisagé comme le préalable à une analyse linguistique des genres journalistiques qui croiserait le niveau du vocabulaire et le niveau de la morphosyntaxe tout en tenant compte du plan compositionnel du texte (Bakhtine) grâce à un encodage xml-tei, cet empan de nos recherches constitue une investigation méthodologique visant à se doter d’un protocole robuste et transparent d’analyse.À la suite des travaux pionniers de Douglas Biber, de nombreuses études de typologie textuelle convoquent aujourd’hui le niveau morphosyntaxique. La logométrie, telle que définie par D. Mayaffre, perçoit d’ailleurs dans les progrès de l’étiquetage automatique un renouvellement décisif de l’analyse des données textuelles. Cette position implique de s’accommoder du taux d’erreur intrinsèque aux données issues d’un étiquetage automatique, dont l’influence est supposée modérée par la méthodologie statistique utilisée. Une analyse du discours soucieuse de la matérialité du texte ne peut néanmoins se satisfaire de ce taux d’erreur : entendant l’annotation morphosyntaxique comme un véritable état du texte, elle implique au contraire un étiquetage fin du niveau morphosyntaxique. Or, l’expérience menée dans le cadre d’une entreprise typologique des rubriques du Petit Comtois montre que l’étiquetage automatique réalisé par Cordial est loin d’être suffisant pour répondre à cette prétention : l’étiquetage opéré reste un étiquetage « en langue », aux insuffisances duquel s’ajoutent les limites du lexique interne de Cordial. On regrettera par ailleurs la pertinence discutable des catégories statiques de la grammaire traditionnelle convoquée par ce logiciel.En raison de ces insuffisances et en attendant de mener une contre-expérimentation basée sur un étiquetage fin et contrôlé de nos données, il nous semble ainsi devoir prendre quelques précautions avec les résultats obtenus de notre analyse, fort stimulants au demeurant. En effet, notre analyse des variables morphosyntaxiques dans les rubriques du Petit Comtois met au jour des facteurs très discriminants, parmi lesquels, d’une part, des variables assez inattendues (à l’instar des déterminants définis) et d’autre part, des facteurs faisant écho aux critères génériques journalistiques. On peut interpréter la configuration typologique des rubriques obtenue comme étant notamment fortement structurée par l’opposition entre les productions discursives à énonciation impliquée et les productions caractérisées par un effacement énonciatif, configuration affinée par le degré de complexité des phrases et leur longueur. Le genre semble donc un « facteur » structurant de cette typologie, ce qui nous semble devoir être mis en lien avec la taille colossale du corpus étudié et la méthodologie statistique utilisé, puisque l’AFC donne une représentation synthétique des tendances lourdes voire structurelles d’un ensemble de données. En l’occurrence, le genre est cette tendance, qui, dans la lignée des postulats de l’analyse du discours, s’avère déterminant dans la typologisation des productions discursives journalistique du Petit Comtois

Thèses en Ligne

HAL - Université de Franche-Comté

La "lexicologie explicative et combinatoire" dans le traitement des unités lexicales spécialisées

Author: Valente Renata Stela
Publication venue
Publication date: 01/01/2002
Field of study

Thèse diffusée initialement dans le cadre d'un projet pilote des Presses de l'Université de Montréal/Centre d'édition numérique UdeM (1997-2008) avec l'autorisation de l'auteur

Dépôt Institutionnel Numérique

Contribution à une étude des dysfonctionnements morphosyntaxiques en français chez un groupe d'enseignants et d'étudiants yéménites

Author: Alagra Aziz
Publication venue: HAL CCSD
Publication date: 06/11/2014
Field of study

French is the third language taught in Yemen after Arabic and English. This vitality of French requires the creation of didactic supports, in order to help in its learning. The purpose of the thesis is to highlight the areas of French, which are sources of difficulty for students, in terms of morphology and syntax, to classify and to describe them. The study of errors is based on two corpus of written work, one which has been done by thirty students in the fourth year of the license of the French Department of Thamar University, the other one by fifteen high school teachers, graduated in the same department. This study aims to introduce a reflection, in the French departments of the Yemenite universities, about strategies and objectives of the teaching of French as a language, in a non-French-speaking multilingual environment. It also aims to provide didactic resources for the study of the language to the teachers, trying to highlighting the priorities.Le français est la troisième langue enseignée au Yémen après l'arabe et l'anglais. Cette vitalité du français nécessite la création de supports didactiques, afin d'aider à son apprentissage. L'objet de la thèse est de mettre en évidence les zones du français, qui sont sources de difficultés pour les étudiants tant sur le plan de la morphologie que sur celui de la syntaxe, de les classer et de les décrire. L'étude des erreurs s'appuiera sur deux corpus de travaux écrits effectués, l'un par trente étudiants de quatrième année de licence du département de français de l'université de Dhamar, l'autre par quinze enseignants de lycée diplômés du même département. Cette étude a pour finalité d'initier une réflexion, au sein des départements de français des universités yéménites, sur les stratégies et les objectifs de l'enseignement du français en tant que langue, dans un milieu plurilingue non francophone. Elle vise également à offrir des ressources didactiques en matière d'étude de la langue aux enseignants, en tentant de mettant en évidence des priorités

Thèses en Ligne

Hal-Diderot

Analyse et représentation de la variation terminologique et de la multidimentionalité dans un thésaurus : le cas du métalangage de la terminologie

Author: Vico Ramírez Alicia
Publication venue
Publication date: 01/07/2016
Field of study

Le présent travail consiste à proposer un modèle de représentation des notions théoriques et pratiques de la terminologie et de leurs relations sous forme de thésaurus. Selon la norme ISO 25964-1, 2011, « un thésaurus est un vocabulaire contrôlé et structuré dans lequel les concepts sont représentés par des termes, ayant été organisés afin de rendre explicites les relations entre les concepts (…) ». Notre objectif est de créer un outil pédagogique à la suite d’une réflexion théorique englobant différentes perspectives notionnelles au sein de cette discipline. Les enjeux soulevés par la classification des concepts de certains champs de savoir (notamment ceux donnant lieu à différentes perspectives) n’ont pas été approfondis suffisamment dans la littérature de la terminologie, ni dans celle portant sur les thésaurus. Comment décrire des concepts qui sont sujets à des dissensions théoriques entre les différentes écoles de pensée? Comment classer les différentes relations entretenues par les concepts théoriques et les applications pratiques d’une discipline? À ces questions s’ajoute celle de la prise en compte de ces difficultés dans un thésaurus. Nous commençons par délimiter et organiser les concepts saillants du domaine. Ensuite, à l’aide d’un corpus comprenant des publications associées à différentes approches de la terminologie, nous étudions les réalisations linguistiques de ces concepts et leurs relations en contexte, dans le but de les décrire, de les classer et de les définir. Puis, nous faisons l’encodage de ces données à l’aide d’un logiciel de gestion de thésaurus, en respectant les normes ISO applicables. La dernière étape consiste à définir la visualisation de ces données afin de la rendre conviviale et compréhensible. Enfin, nous présentons les caractéristiques fondamentales du Thésaurus de la terminologie. Nous avons analysé et représenté un échantillon de 45 concepts et leurs termes reliés. Les différents phénomènes associés à ces descripteurs comme la multidimensionalité, la variation conceptuelle et la variation dénominative sont aussi représentés dans notre thésaurus.This thesis proposes a model to represent theoretical and practical concepts of terminology as well as their terminological relationships in the form of a thesaurus. According to the ISO 25964-1:2011 standard, “a thesaurus is a controlled and structured vocabulary in which concepts are represented by terms that have been previously arranged in order to show explicitly the relations among concepts (…)”. Our objective is to create a pedagogical tool that is grounded in a theoretical reflection about different theoretical perspectives within this discipline. The issues associated with the classification of concepts in certain fields of knowledge (especially those with different perspectives) require further study in the field of terminology and information science, and in the literature relating to thesauri. Indeed, how does one describe concepts that are subject to theoretical dissent and different schools of thought? How can the different relationships between theoretical concepts and practical applications of a discipline be classified? To these questions is added the additional challenge of reflecting these difficulties in a thesaurus. Our first step consists in delimiting and organizing the main concepts of the field. Then, by means of a corpus containing different publications associated with different approaches in terminology, we study the linguistic realizations of those concepts and their relationships in context, with the objective of describing, classifying and defining them. We then encode this data using thesaurus management software that respects the relevant ISO standards. Finally, we produce visualizations of this data to make it more user friendly and understandable. To conclude, we present the fundamental characteristics of the Thésaurus de la terminologie. We have analyzed and presented a sample of 45 concepts and their related terms. Different phenomena related to these descriptors, such as multidimensionality, conceptual variation and denominative variation, are also represented in our thesaurus

Dépôt Institutionnel Numérique

Traduction des opérations de l'analyse historique dans le langage conceptuel des systèmes d'information géographique pour une exploration des processus morphologiques de la ville et du territoire

Author: Camacho-Hübner Eduardo
Publication venue: Lausanne, EPFL
Publication date: 08/01/2009
Field of study

Present work intends to conceive an interface between Urban Morphology and Geographic Information Science (GISc). This interface is considered as a space of exchange for knowledge exploration between several disciplines. The links pointed out from this theoretical work help us define the framework of formalization of morphological processes. We have focused our efforts over the methodology of translation of the notion of morphological process. The main steps of translation of the historical analysis operations into the conceptual language of the GISc mainly include numerical handling of cartographic sources, i.e. maps, plans, cadastre, etc. The main problems encountered are linked to the heterogeneity of historical information such as: partial data sets, non-representative statistical ensembles and semantic relativity of concepts through time (polysemy, synonymy, etc.). We discuss these problems from the knowledge production process point of view. We focus on questions of knowledge emergence from quantitative analysis and, symmetrically, of concept formalization leading to data structures compatible with the idea of characterization. Our work is essentially based on the possibilities of the exploratory paradigm applied to geo-historical data. By doing so, we have been particularly interested in the contributions of the systematic approach to the enhancement of the interpretive potential of classical descriptive morphological analyses. Outcome of work are of different natures. We can mention among others: 1° the construction of a formal classification (ontology) of concepts subsuming transformation and evolution of the city and the territory and 2° the development of an exploratory approach of geo-historical data. We have also discussed the contribution of some social sciences' paradigms (Callon and Latour's sociology of translation, Koselleck's conceptual history (Begriffsgeschichte), Peirce's abduction, Ginzburg's indiciary paradigm, etc.) to GISc. In particular, we are interested in the enhancement of the process of modeling by rethinking the tasks of conceptualization and formalization by taking into account the historical context of production of information during the process of knowledge reduction. We have pointed out the importance of periods of conceptual stability to allow comparative measurements and of events to explain ruptures not only at the data level, but also at the level of the entire conceptualization. These outputs should be considered as a new step towards recognition of the exploratory approach as a relevant tool to face interdisciplinary and complex problems related to urban processes in general. In particular, this work helps us stabilizing the theoretical framework contributing to the definition of the next generation numerical archives and interoperability of systems. Indeed, these technical questions need modelers to take into account different kinds of evolution when dealing with either concepts or instances and to produce a common platform to manage both. Finally, we show some clues to continue this work by introducing collaborative approaches and exploratory multidimensional interfaces. The figure below illustrates the initial framework of this research and the extension resulting from our work

Infoscience - École polytechnique fédérale de Lausanne

Moyens informatiques de restitution en archéologie monumentale : cas du temple de Karnak

Author: Semlali Anis
Publication venue
Publication date: 01/08/2009
Field of study

L’objectif de notre recherche est l’exploration et l’étude de la question de l’instrumentation informatique des projets de reconstitution archéologiques en architecture monumentale dans le but de proposer de nouveaux moyens. La recherche a pour point de départ une question, à savoir : « Comment, et avec quels moyens informatiques, les projets de reconstitution architecturale pourraient-ils être menés en archéologie? ». Cette question a nécessité, en premier lieu, une étude des différentes approches de restitution qui ont été mises à contribution pour des projets de reconstitution archéologiques, et ceci, à ses différentes phases. Il s’agit de comprendre l’évolution des différentes méthodologies d’approche (épistémologiquement) que les acteurs de ce domaine ont adoptées afin de mettre à contribution les technologies d’information et de communication (TIC) dans le domaine du patrimoine bâti. Cette étude nous a permis de dégager deux principales avenues: une première qui vise exclusivement la « représentation » des résultats des projets et une seconde qui vise la modélisation de ce processus dans le but d’assister l’archéologue dans les différentes phases du projet. Nous démontrons que c’est la deuxième approche qui permet la combinaison et met à la disposition des archéologues une meilleure exploitation des possibilités que l’outil informatique peut et pourra présenter. Cette partie permet de démontrer la nature systémique et complexe de la mise à contribution des TICs dans le domaine de la restitution archéologique. La multitude des acteurs, des conditions techniques, culturelles et autres, des moyens utilisés ainsi que la variété des objectifs envisagés dans les projets de reconstitution archéologiques poussent à explorer une nouvelle approche qui tient compte de cette complexité. Pour atteindre notre objectif de recherche, la poursuite de l’étude de la nature de la démarche archéologique s’impose. Il s’agit de comprendre les liens et les interrelations qui s’établissent entre les différentes unités techniques et intellectuelles en jeu ainsi que les différents modes de réflexions présents dans les projets de reconstitution archéologique du patrimoine bâti. Cette étude met en évidence le rapport direct entre le caractère subjectif de la démarche avec la grande variabilité des approches et des raisonnements mis en œuvre. La recherche est alors exploratoire et propositionnelle pour confronter notamment le caractère systémique et complexe de l’expérience concrète et à travers les publications savantes, les éléments de la réalité connaissable. L’étude des raisonnements archéologiques à travers les publications savantes nous permet de proposer une première typologie de raisonnements étudiés. Chacune de ces typologies reflète une méthodologie d’approche basée sur une organisation d’actions qui peut être consignée dans un ensemble de modules de raisonnements. Cette recherche fait ressortir, des phénomènes et des processus observés, un modèle qui représente les interrelations et les interactions ainsi que les produits spécifiques de ces liaisons complexes. Ce modèle témoigne d’un processus récursif, par essais et erreurs, au cours duquel l’acteur « expérimente » successivement, en fonction des objectifs de l’entreprise et à travers des modules de raisonnements choisis, plusieurs réponses aux questions qui se posent à lui, au titre de la définition du corpus, de la description, de la structuration, de l’interprétation et de la validation des résultats, jusqu’à ce que cette dernière lui paraisse satisfaire aux objectifs de départ. Le modèle établi est validé à travers l’étude de cas du VIIème pylône du temple de Karnak en Égypte. Les résultats obtenus montrent que les modules de raisonnements représentent une solution intéressante pour assister les archéologues dans les projets de reconstitution archéologiques. Ces modules offrent une multiplicité de combinaisons des actions et avantagent ainsi une diversité d’approches et de raisonnements pouvant être mis à contribution pour ces projets tout en maintenant la nature évolutive du système global.The goal of our research is to explore and study the use of computerized tools in archaeological reconstruction projects of monumental architecture in order to propose new ways in which such technology can be used. The first question we ask is: "How and with which computerized tools can architectural reconstruction projects be conducted in archaeology? In our quest to answer this question, we begin with a study of the different restitution approaches used in various phases of archaeological reconstruction projects. This involves understanding how the different methods of approach have evolved (epistemologically), how those involved in such projects have put information and communication technologies to use in the field of built heritage. This study has identified two main avenues: one whose sole aim is the "representation" of project results and another whose aim is to model this process in order to assist the archaeologist through various phases of a project. We have demonstrated that it is the second approach which combines and offers archaeologists a better utilization of the possibilities offered by computer assisted tools. This allowed us to demonstrate the complex and systemic nature of ICT’s in the field of archaeological reconstruction. The multiple actors, conditions, means and goals considered in archaeological reconstruction projects have led us to explore a new approach that reflects this complexity. In order to achieve the goal of our research, it was necessary to further study the nature of the archaeological process. This involved understanding the links and interrelations between the various components that define the archaeological approach and the various thought processes involved in heritage building archaeological reconstruction projects. This study showed a direct relationship between the subjective nature of the process and the diversity of approaches and thought processes which can be implemented. This exploratory and propositional research reinforces the systemic and complex nature of our approach and prompts us to explore, in practice and through published literature, the elements of known reality. The study of archaeological reasoning through academic publications has allowed us to propose an initial typology of arguments studied. Each of these typologies reflects a methodological approach based on organized actions that can be recorded in a set of reasoning modules. This research has allowed us to highlight phenomena and observed processes, leading to a model representing interrelationships and interactions as well as the specific results of these complex interconnections. This pattern reflects a cyclical process of trial and error, in which the actors consecutively 'experience' (according to the project’s goals and through reasoning modules), several answers to the questions exposed to him under the corpus definition, description, structure, interpretation and validation of the results until the latter would appear to meet the original targets. The model developed was validated through a case study of the seventh pylon of the Karnak temple in Egypt. The results show that the reasoning modules offer an interesting solution assisting archaeologists in archaeological reconstruction projects. The multiple action combinations offered by these modules are an advantage to many approaches and thought processes which could be useful to such projects while maintaining the progressive nature of the overall system

Dépôt Institutionnel Numérique