La contribution des cooccurrences de deuxième ordre à l’analyse sémantique

Abstract

Cet article montre ce que la cooccurrence peut nous apprendre sur la monosémie et comment on peut exploiter l’analyse des cooccurrences de deuxième ordre pour quantifier l’analyse sémantique. Les analyses sont conduites sur un corpus technique (1,7 million d’occurrences) relevant du domaine spécialisé des machines-outils pour l’usinage des métaux. Dans cet article, nous expliquons la méthodologie adoptée pour déterminer le degré de monosémie d’un mot technique à partir de l’analyse du recoupement de ses cooccurrences de deuxième ordre. Dans le but d’affiner les résultats de la mesure de recoupement, nous procédons également à quelques expérimentations qui vont au-delà du simple repérage statistique des cooccurrences et qui font varier différents paramètres, tels que la fenêtre d’observation, le seuil de significativité et la forme graphique ou le lemme des cooccurrences de premier et deuxième ordre. Finalement, nous abordons l’importance de l’intégration des étiquettes morphosyntaxiques dans l’analyse des cooccurrences.The Contribution of Second Order Co-occurrences to Semantic AnalysisThis article shows what co-occurrence can learn us about monosemy and explores the contribution of second order co-occurrences to quantitative semantic analysis. The analysis is carried out on a technical corpus (1.7 million occurrences) from the specialised domain of machining and metalworking terminology in French. In this article, we explain the methodology for calculating the degree of monosemy of a technical word based on the overlap of its second order co-occurrences. Next, in order to refine the results of the overlap measure, several experiments are discussed, going beyond statistical detection of co-occurrence patterns and showing the impact of several varying parameters, such as co-occurrence span, significance level and word form or lemma of first and second order co-occurrences. Finally, the article addresses the importance of the integration of POS-tags in co-occurrence analysis

    Similar works