research

Segmentation automatique des corpus. Voyages de l'autre côté de J.-M. Le Clézio

Abstract

We present an original segmentation method applied to textual data series. The vocabulary growth and variations of its diversity are calculated. Then a segmentation algorithm, associated with a validity test, gives the optimal successive stages. This method is applied to a novel by Jean-Marie Le Clezio : Voyages de l'autre côté.Méthode originale pour segmenter un corpus en sous-parties homogènes. On calcule l'accroissement du vocabulaire et les variations de sa diversité. Un algorithme de segmentation associé à un test de validité donne le découpage optimal des deux séries. Application à un roman de Jean-Marie Le Clezio : Voyages de l'autre côté

    Similar works