52 research outputs found
L'acquisition du passif en français
La présente thèse porte sur l’acquisition du passif en français chez des enfants de 3 à 6 ans. Notre premier objectif était de tester l’effet du potentiel adjectival des passifs sur la compréhension des passives actionnelles et non actionnelles. Selon Borer et Wexler (1987), Babyonyshev et al. (2001), Hirsch et Wexler (2006) et Oliva et Wexler (2018), les enfants ne parviendraient pas à comprendre facilement les passifs verbaux, car certains principes de leur grammaire n’auraient pas atteint une certaine maturation syntaxique qui leur autoriserait la computation de ces passifs. Ils pourraient néanmoins utiliser une stratégie adjectivale pour les comprendre en analysant ces passifs comme des passifs adjectivaux, dont la représentation syntaxique serait accessible à leur grammaire.
Pour tester cette hypothèse, nous avons mené une première expérimentation auprès de 98 enfants, âgés de 3 à 6 ans, et de 16 adultes, qui ont réalisé une tâche d’appariement phrase-image. Les résultats révèlent que les passives actionnelles ayant un faible potentiel adjectival sont les mieux comprises par les enfants, ce qui va à l’encontre d’une hypothèse adjectivale. Pour expliquer ces résultats, nous avons avancé que l’affectivité avait un effet facilitant sur la compréhension du passif (Nguyen et Snyder, 2018). Les passives actionnelles présentant un degré plus élevé d’affectivité seraient mieux comprises par les enfants. Les résultats de cette expérimentation appuient également l’hypothèse de Paolazzi et al. (2015, 2016) et Grillo, Alexiadou, Gehrke et al. (2019). Comme ces passives ne revêtent pas d’ambiguïté adjectivale/verbale, leur traitement serait moins complexe que les passives actionnelles présentant un potentiel adjectival élevé et qui peuvent être analysées comme des passives adjectivales ou verbales en l’absence du complément en par.
Notre deuxième objectif de recherche était de mesurer l’effet du complément en par sur la compréhension des passives actionnelles et non actionnelles. Dans une deuxième expérimentation, 96 enfants, âgés de 3 à 6 ans, et 16 adultes ont effectué une tâche d’appariement phrase-image. Les résultats indiquent que la présence du complément en par n’a aucun effet sur la compréhension des passives actionnelles. Nos deux expérimentations reproduisent aussi l’effet Maratsos (Maratsos et al., 1985) : un délai acquisitionnel est observé pour la compréhension des passives non actionnelles. Les résultats de la deuxième expérimentation montrent que les passives courtes non actionnelles sont mieux comprises que les passives longues non actionnelles. Ainsi, notre recherche en conclut que l’acquisition des passives ne se fait pas d’un seul coup, mais qu’elle est largement déterminée par la présence du complément en par. Ce résultat appuie l’hypothèse de Paolazzi et al. (2015, 2016) et Grillo, Alexiadou, Gehrke et al. (2019). Les passives courtes, qui, sans le complément en par, seraient interprétées comme des passives adjectivales, seraient réanalysées en passives verbales lorsque ce complément est ajouté. Cette réanalyse serait couteuse cognitivement, ce qui expliquerait la moins bonne compréhension des passives longues non actionnelles.
Notre thèse propose un ordre d’acquisition des constructions passives. Les passives courtes actionnelles seraient acquises à 3 ans, et les longues, à 4 ans. Les passives courtes non actionnelles seraient maitrisées à 5 ans alors que les longues le seraient après l’âge de 6 ans. Somme toute, nos résultats mettent en évidence l’importance du type de verbe (actionnel/non actionnel), qui est plus déterminant dans la compréhension du passif que l’effet du potentiel adjectival et du complément en par. Nos résultats remettent également en cause l’hypothèse d’une stratégie adjectivale et révèlent l’importance du type de prédicat (évènementiel/statif) et de l’ambiguïté adjectivale/verbale dans la compréhension des phrases passives.The present dissertation focuses on the acquisition of the French passive construction by young children aged 3 to 6 years old. Our first objective was to test the effect of passive's adjectival potential on the comprehension of actional and non actional passives. Following Borer & Wexler (1987), Babyonyshev et al. (2001), Hirsch & Wexler (2006), and Oliva & Wexler (2018), children are not able to comprehend verbal passives because some principles of their grammar have not reached a certain syntactic maturity, which would allow them to compute these passives. They could however use an adjectival strategy to understand these passives by analyzing them as adjectival passives.
To test this hypothesis, we conducted a first experiment with 98 children, aged 3 to 6 years old, and 16 adults, who carried out a sentence-picture matching task. Results show that actional passives with a lower adjectival potential are the ones which are the best understood by children, which do not support an adjectival hypothesis. To explain these results, we have suggested that affectivity have a facility effect on the comprehension of passives (Nguyen & Snyder, 2018). Actional passives which have a higher degree of affectivity would be the ones which are the best understood by children. The results of this experiment also support the hypothesis of Paolazzi et al. (2015, 2016) and Grillo, Alexiadou, Gehrke et al. (2019). Because these passives do not take an adjectival/verbal ambiguity, their treatment would be less complex than actional passives which have a high adjectival potential, and can be analyzed as adjectival or verbal passives without the by-phrase.
Our second research objective was to measure the effect of the by-phrase on the comprehension of actional and non actional passives. In a second experiment, 96 children aged 3 to 6 years old and 16 adults did a sentence-picture matching task. Results show that the presence of the by-phrase has no effect on the comprehension of actional passives. Our two experiments reproduce the Maratsos effect (Maratsos et al., 1985): an acquisitional delay is observed for the comprehension of non actional passives. The results of the second experiment showed that short non actional passives are better understood than long non actional passives. Therefore, our research concludes that the acquisition of the passive construction does not occur at once, but is largely determined by the presence of the by-phrase. This result supports the hypothesis put forward by Paolazzi et al. (2015, 2016) and Grillo, Alexiadou, Gehrke et al. (2019): Short passives which, without the by-phrase, would be interpreted like adjectival passives, should be reanalyzed as verbal passives when this complement is added. The reanalysis would be cognitively costly, which would explain the poor comprehension of long non actional passives.
This dissertation suggests an order of acquisition of passive constructions. Short actional passives would be acquired at 3 years old and long actional passives, at 4 years old. Short non actional passives would be mastered at 5 years old while long non actional passives would be acquired after 6 years old. On the whole, our results highlight the importance of verb type (actional/non actional), which is more decisive in the comprehension of passives than the effect of adjectival potential and the by-phrase. In this way, our results challenge an adjectival strategy and reveal the importance of the predicate type (eventive/stative) and of the adjectival/verbal ambiguity on the comprehension of passive constructions
Analyse des clitiques du serbo-croate dans le cadre du programme minimaliste
Les clitiques du serbo-croate doivent toujours être placés en respectant des règles spécifiques.
Dans le cas contraire, les phrases ne sont pas convenables et la dérivation échoue. Lors de la
formulation des phrases et de l’insertion des clitiques dans celles-ci, il faut respecter les règles
requises. Malgré les restrictions placées par ces règles, selon mes recherches, je propose que les
clitiques en serbo-croate sont beaucoup plus simples comparativement à ce qui a été suggéré par
d’autres chercheurs. La simplicité étant une des clés de la langue serbo-croate.
Mon objectif était d’étudier, dans le cadre du programme minimaliste, la position que
les clitiques du serbo-croate occupent au sein de la phrase. Plus particulièrement, j’ai mis l’accent
sera mis sur la position que ces éléments occupent par rapport à un syntagme nominal (SN)
placé en tête de phrase.
En effet, quoique l’analyse en termes de deuxième position des clitiques du Serbo-croate soit
en général acceptée par les chercheurs, les propositions concernant la définition de leur hôte
diffèrent grandement. D’où mon intérêt envers la recherche empirique décrite dans cette thèse.
Cette recherche, qui à ma connaissance sera la première en son genre, pourrait lever le voile
sur les clitiques du croate (un dialecte du serbo-croate) et la position que ces éléments occupent
par rapport aux autres éléments syntaxiques d’un énoncé.
Dans ma thèse, j’ai proposé que le comportement des clitiques auxiliaires, phrastiques et
pronominaux en serbo-croate peut être expliqué avec facilité dans le cadre du
programme minimaliste. Si l’on prend en considération que cette langue fait partie de celles dont
le trait EPP des clitiques auxiliaires, phrastiques et pronominaux doit être vérifié et éliminé de
la dérivation pour la convergence phrastique, on peut alors comprendre pourquoi la réalisation
desdits clitiques dans la position initiale de la phrase n’est jamais observable dans la
production langagière des locuteurs natif de cette langue
Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition. Volume 2 : Traitement Automatique des Langues Naturelles
@ 6ème conférence conjointe: JEP-TALN-RECITAL 2020no abstrac
Génération automatique d'alignements complexes d'ontologies
Le web de données liées (LOD) est composé de nombreux entrepôts de données. Ces données sont décrites par différents vocabulaires (ou ontologies). Chaque ontologie a une terminologie et une modélisation propre ce qui les rend hétérogènes. Pour lier et rendre les données du web de données liées interopérables, les alignements d'ontologies établissent des correspondances entre les entités desdites ontologies. Il existe de nombreux systèmes d'alignement qui génèrent des correspondances simples, i.e., ils lient une entité à une autre entité. Toutefois, pour surmonter l'hétérogénéité des ontologies, des correspondances plus expressives sont parfois nécessaires. Trouver ce genre de correspondances est un travail fastidieux qu'il convient d'automatiser. Dans le cadre de cette thèse, une approche d'alignement complexe basée sur des besoins utilisateurs et des instances communes est proposée. Le domaine des alignements complexes est relativement récent et peu de travaux adressent la problématique de leur évaluation. Pour pallier ce manque, un système d'évaluation automatique basé sur de la comparaison d'instances est proposé. Ce système est complété par un jeu de données artificiel sur le domaine des conférences.The Linked Open Data (LOD) cloud is composed of data repositories. The data in the repositories are described by vocabularies also called ontologies. Each ontology has its own terminology and model. This leads to heterogeneity between them. To make the ontologies and the data they describe interoperable, ontology alignments establish correspondences, or links between their entities. There are many ontology matching systems which generate simple alignments, i.e., they link an entity to another. However, to overcome the ontology heterogeneity, more expressive correspondences are sometimes needed. Finding this kind of correspondence is a fastidious task that can be automated. In this thesis, an automatic complex matching approach based on a user's knowledge needs and common instances is proposed. The complex alignment field is still growing and little work address the evaluation of such alignments. To palliate this lack, we propose an automatic complex alignment evaluation system. This system is based on instances. A famous alignment evaluation dataset has been extended for this evaluation
Découverte de définitions dans le web des données
In this thesis, we are interested in the web of data and knowledge units that can be possibly discovered inside. The web of data can be considered as a very large graph consisting of connected RDF triple databases. An RDF triple, denoted as (subject, predicate, object), represents a relation (i.e. the predicate) existing between two resources (i.e. the subject and the object). Resources can belong to one or more classes, where a class aggregates resources sharing common characteristics. Thus, these RDF triple databases can be seen as interconnected knowledge bases. Most of the time, these knowledge bases are collaboratively built thanks to human users. This is particularly the case of DBpedia, a central knowledge base within the web of data, which encodes Wikipedia content in RDF format. DBpedia is built from two types of Wikipedia data: on the one hand, (semi-)structured data such as infoboxes, and, on the other hand, categories, which are thematic clusters of manually generated pages. However, the semantics of categories in DBpedia, that is, the reason a human agent has bundled resources, is rarely made explicit. In fact, considering a class, a software agent has access to the resources that are regrouped together, i.e. the class extension, but it generally does not have access to the ``reasons'' underlying such a cluster, i.e. it does not have the class intension. Considering a category as a class of resources, we aim at discovering an intensional description of the category. More precisely, given a class extension, we are searching for the related intension. The pair (extension, intension) which is produced provides the final definition and the implementation of classification-based reasoning for software agents. This can be expressed in terms of necessary and sufficient conditions: if x belongs to the class C, then x has the property P (necessary condition), and if x has the property P, then it belongs to the class C (sufficient condition). Two complementary data mining methods allow us to materialize the discovery of definitions, the search for association rules and the search for redescriptions. In this thesis, we first present a state of the art about association rules and redescriptions. Next, we propose an adaptation of each data mining method for the task of definition discovery. Then we detail a set of experiments applied to DBpedia, and we qualitatively and quantitatively compare the two approaches. Finally, we discuss how discovered definitions can be added to DBpedia to improve its quality in terms of consistency and completeness.Dans cette thèse, nous nous intéressons au web des données et aux ``connaissances'' que potentiellement il renferme. Le web des données se présente comme un très grand graphe constitué de bases de triplets RDF connectées entre elles. Un triplet RDF, dénoté (sujet, prédicat, objet), représente une relation (le prédicat) qui existe entre deux ressources (le sujet et l'objet). Les ressources peuvent appartenir à une ou plusieurs classes, où une classe regroupe des ressources partageant des caractéristiques communes. Ainsi, ces bases de triplets RDF peuvent être vues comme des bases de connaissances interconnectées. La plupart du temps ces bases de connaissances sont construites de manière collaborative par des utilisateurs. C'est notamment le cas de DBpedia, une base de connaissances centrale dans le web des données, qui encode le contenu de Wikipédia au format RDF. DBpedia est construite à partir de deux types de données de Wikipédia : d'une part, des données (semi-)structurées telles que les infoboxes et d'autre part les catégories, qui sont des regroupements thématiques de pages générés manuellement. Cependant, la sémantique des catégories dans DBpedia, c'est-à -dire la raison pour laquelle un agent humain a regroupé des ressources, n'est pas explicite. De fait, en considérant une classe, un agent logiciel a accès aux ressources qui y sont regroupées --- il dispose de la définition dite en extension --- mais il n'a généralement pas accès aux ``motifs'' de ce regroupement --- il ne dispose pas de la définition dite en intension. Dans cette thèse, nous cherchons à associer une définition à une catégorie en l'assimilant à une classe de ressources. Plus précisément, nous cherchons à associer une intension à une classe donnée en extension. La paire (extension, intension) produite va fournir la définition recherchée et va autoriser la mise en œuvre d'un raisonnement par classification pour un agent logiciel. Cela peut s'exprimer en termes de conditions nécessaires et suffisantes : si x appartient à la classe C, alors x a la propriété P (condition nécessaire), et si x a la propriété P, alors il appartient à la classe C (condition suffisante). Deux méthodes de fouille de données complémentaires nous permettent de matérialiser la découverte de définitions, la fouille de règles d'association et la fouille de redescriptions. Dans le mémoire, nous présentons d'abord un état de l'art sur les règles d'association et les redescriptions. Ensuite, nous proposons une adaptation de chacune des méthodes pour finaliser la tâche de découverte de définitions. Puis nous détaillons un ensemble d'expérimentations menées sur DBpedia, où nous comparons qualitativement et quantitativement les deux approches. Enfin les définitions découvertes peuvent potentiellement être ajoutées à DBpedia pour améliorer sa qualité en termes de cohérence et de complétud
La description lexicographique de la terminologie du droit pour les besoins de la traduction juridique du français vers le polonais
Przedmiotem niniejszej monografii jest leksykograficzny opis terminologii prawa, z uwzględ-nieniem jego zastosowania w środowisku pracy tłumacza, a ściślej w kontekście tłumaczenia automatycznego i wspomaganego komputerowo. Opis ten bazuje na modelu opracowanym przez W. Banysia w ramach zorientowanego obiektowo opisu jednostek leksykalnych. Niniejsza praca stanowi zastosowanie tego modelu do leksykograficznego opisu jednostek języka prawa, należą-cych do wyodrębnionej klasy obiektowej .
Monografia składa się z dwóch części. Pierwsza z nich ma charakter opisowy, a jej celem jest przedstawienie ram dyscyplinarnych i teoretycznych pracy. W rozdziale pierwszym omówiono pokrótce pojęcia języka prawa, tekstu prawniczego i przekładu prawniczego. Wyjaśniono różnice między różnymi typami tłumaczenia automatycznego (regułowym, statystycznym, hybrydowym, neuronalnym). Przedstawiono dwa podstawowe podejścia do opisu terminologii: preskryptywne oraz deskryptywne, a także podkreślono znaczenie wykorzystania korpusów językowych w ba-daniach terminologicznych. Rozdział drugi poświęcono podejściu zorientowanemu obiektowo. Szczegółowemu omówieniu zorientowanego obiektowo opisu jednostki leksykalnej W. Banysia towarzyszy zarys następujących koncepcji teoretycznych: klas obiektowych G. Grossa, teorii Sens-Texte, teorii słownika generatywnego oraz ontologii WordNet, z uwzględnieniem tam, gdzie to możliwe, ich przydatności do opisu leksyki specjalistycznej z dziedziny prawa. W roz-dziale trzecim omówiono problemy związane z opisem leksyki specjalistycznej w ramach opisu zorientowanego obiektowo, w szczególności zagadnienia związane z doborem i wyborem do ana-lizy jednostek leksykalnych, a także z wyborem i eksploracją korpusów. Model zorientowanego obiektowo opisu jednostek leksykalnych ma charakter deskryptywny, a jego celem jest zaprezen-towanie języka prawa w jego autentycznej formie.
Druga część pracy ma charakter praktyczny, przedstawiono w niej leksykograficzny opis wybranych do analizy jednostek leksykalnych, sporządzony zgodnie z przedstawioną w części pierwszej metodologią. Składa się ona z tabel, zawierających opis pięćdziesięciu dwóch jednostek leksykalnych, należących do klasy obiektowej oraz jednej jednostki leksykalnej, należącej do superklas : oraz . Tabele te stanowią ilustrację zastosowania modelu leksykograficznego W. Banysia do opisu jednostek języka prawa
Linkky: Extraction de clés de liage par une adaptation de l'analyse relationnelle de concepts
National audienceLes clés de liage permettent de spécifier la manière d’engendrer des liens entre deux sources de données RDF. L’objet de cette démonstration est de présenter Linkky, un prototype implémentant l’extraction de familles de clés de liage dépendantes à l’aide de techniques d’analyse formelle de concept
Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018
International audienc
Description du principe de latéralisation cérébrale et de cohérence cérébrale, et discussion autour des mécanismes de la prise de décision
La prise de décision en clinique est une tache cognitive complexe. Il existe une certaine division latéralisée du travail entre les deux hémisphères cérébraux. La cohérence cérébrale est l’activité en phase d’ondes cérébrales de même fréquence émises par différentes parties du cerveau. Cet état permet le liage des activités séparées du cortex, influence la perception, et est à l’origine d’améliorations cognitives et émotionnelles. A.R.Damasio affirme que les décisions naissent de calculs mentaux indissociables de la perception d’informations venant du corps, comme les émotions. Les ondes cérébrales ont été peu documentées chez les animaux. Dans les études comportementales, l’écologie d’une espèce modifie la perception de son environnement et donc ses décisions. Ces conditionnements sont à considérer dans la définition de l’intelligence animale. Des facteurs épigénétiques comme l’enrichissement environnemental ou la méditation chez l’Homme peuvent en tout cas moduler la flexibilité cognitive
Analyse de flux de matière du cuivre au Québec pour le développement de stratégies de circularité
Parce que le cuivre est très recherché pour ses propriétés, ce qui le rend éminemment adapté aux applications de nouvelles technologies, une compréhension claire des acteurs, une analyse descrip-tive des flux de matière et des stocks peut contribuer à projeter l'avenir du cuivre dans l’économie du Québec. Ce métal est de plus en plus sollicité nécessitant l’accroissement de la production par la construction de nouvelle mine (risque sur l’environnement) ; il est aussi inégalement réparti dans le monde avec des teneurs de plus en plus faible dans le minerai entrainant un risque sur l’appro-visionnement. Ce travail consiste à réaliser l’analyse de flux de matières du cuivre au Québec sur l’année 2014 tout en évaluant la robustesse des résultats par une analyse d’incertitude. Cette ana-lyse inclut les étapes d’extraction et de traitement (minerais et concentré de cuivre), de production de métal primaire (anodes de cuivre, cathodes de cuivre), de transformation métallique (fil ma-chine, tube ou tuyau en cuivre affiné et alliage…), de fabrication et d’assemblage (moteur, groupe électrogène, véhicule …), d’utilisation et de gestion des déchets au cours de l’année 2014. Les échanges de cuivre à l’intérieur du Québec, avec le monde, avec d’autres provinces canadiennes ainsi que les émissions et les rejets de cuivre dans l’environnement sont quantifiés sous forme de flux (kt/a) dans le présent document. La méthode ascendante a privilégié les données primaires disponibles, qui ont été collectées auprès des entreprises et organismes concernés alors que la mé-thode descendante a utilisé principalement des sources de données compilant des statistiques agré-gées par secteur ou par type de produit, telles que celles rassemblées par Ressources Naturelles Canada, Statistique Canada et l’Institut de la statistique du Québec. Les données manquantes ont été complétées par des données secondaires issues de bases de données publiques disponibles (Eu-rocom par exemple), d’une revue de littérature ou de jugements d’experts ou calculées par le logi-ciel STAN (conservation de la masse). Les résultats montrent d’une part que le Québec exporte une grande quantité de cuivre contenu dans les produits semi-finis au niveau des premières étapes du cycle (83% de fil de cuivre fabriqué par Nexans, 62% des cathodes produite par l’affinerie CCR et 55% du concentré de cuivre provenant des mines sont exportés) et d’autre part les importations de cuivre dans les produits finis à l’étape d’utilisation sont aussi importantes (78 kt/a de cuivre importé sur une demande total de 139 kt/a). On dira aussi que la province du Québec transforme en moyenne 7 fois plus de cuivre qu’il en extrait (soit 311 kt/a de cathodes de cuivre produites sur 42 kt/a de cuivre extrait).----------Abstract Copper is highly sought after due to its properties which makes it significantly suitable for tenders of various technologies. A clear understanding of the actors, the materials flow and stocks can help to plan the future impact of copper in the Quebec economy. This metal is more and more solicited requiring the increase of the production by the construction of new mine (risk on the environment); it is also unevenly distributed throughout the world with lower and lower grades in the ore leading to a risk on the supply. This work analyzes the flow of materials and stocks of copper in Quebec in 2014 and evaluates the robustness of the results by an uncertainty analysis. This analysis consists of the extraction and processing steps (copper ores and concentrates), production of primary metal (copper anodes, copper cathodes), processed metal products (wire rod, tube or pipe made of copper and alloys), manufacture and assembly (engine, generator, vehicle), along with the use and man-agement of waste during the year 2014. Copper trade within Quebec, the world, and other Canadian provinces as well as emissions and releases of copper into the environment are quantified as flows (kt/y) in this document. The bottom up approach uses the available primary data collected from the companies and organizations concerned. Whereas top down method primarily uses data sources gathering aggregated statistics by sector or product type, such as those collected by Natural Re-sources Canada, Statistics Canada and the Institut de la statistique du Québec. The missing data were supplemented by secondary data from publicly available databases (e.g. Eurocom), literature assessment, expert judgment, or calculated by the STAN (mass conservation) software. The results show that Quebec exports a large quantity of copper in semi-finished products at the first stages of the cycle (83% of copper wire produced by Nexan, 62% of the cathodes produced by the refinery CCR and 55% of copper concentrate from mines are exported). On the other hand imports of copper into finished products at the stage of use are also important (78 kt/y of copper imported on a total demand of 139 kt/y). Moreover, the Province of Quebec transforms on average 7 times more copper than it extracts (311 kt/y of copper cathodes produced on 42 kt/y of copper extracted). The stock of copper at the stage of use represents a large deposit, i.e. 2000 kt in annual growth of 2%. The uncertainties show that the data and assumptions used to calculate flows should be improved, mainly those related to imports of copper to Québec (>20% the average value). Given the stock of copper available that is in use, the urban mine would be one of the most intriguing approaches to improve the copper’s circularity in the future
- …