57 research outputs found
Computerization of African languages-French dictionaries
This paper relates work done during the DiLAF project. It consists in
converting 5 bilingual African language-French dictionaries originally in Word
format into XML following the LMF model. The languages processed are Bambara,
Hausa, Kanuri, Tamajaq and Songhai-zarma, still considered as under-resourced
languages concerning Natural Language Processing tools. Once converted, the
dictionaries are available online on the Jibiki platform for lookup and
modification. The DiLAF project is first presented. A description of each
dictionary follows. Then, the conversion methodology from .doc format to XML
files is presented. A specific point on the usage of Unicode follows. Then,
each step of the conversion into XML and LMF is detailed. The last part
presents the Jibiki lexical resources management platform used for the project.Comment: 8 page
Vulnerability analysis of three remote voting methods
This article analyses three methods of remote voting in an uncontrolled
environment: postal voting, internet voting and hybrid voting. It breaks down
the voting process into different stages and compares their vulnerabilities
considering criteria that must be respected in any democratic vote:
confidentiality, anonymity, transparency, vote unicity and authenticity.
Whether for safety or reliability, each vulnerability is quantified by three
parameters: size, visibility and difficulty to achieve. The study concludes
that the automatisation of treatments combined with the dematerialisation of
the objects used during an election tends to substitute visible vulnerabilities
of a lesser magnitude by invisible and widespread vulnerabilities.Comment: 15 page
Des correcteurs orthographiques pour collecter et diffuser les connaissances linguistiques en Afrique subsaharienne
International audienceLes pays du Sahel figurent parmi les plus pauvres de la terre, ils connaissent aussi des taux d’analphabétisation particulièrement élevés (83% au Niger, 60% au Mali, 57% au Sénégal). Or, l’alphabétisation de la population est un facteur essentiel pour développer un pays, il apparaît donc essentiel de mettre en place des stratégies pour améliorer l’alphabétisation des populations.Nous passons rapidement en revue l’histoire récente de la transcription des langues africaines et les problèmes rencontrés dans la production et la diffusion de connaissances linguistiques et de textes. Ensuite nous proposons le développement d’outils informatiques spécifiques pour capitaliser des connaissances et les diffuser
Electronic Voting: the Devil is in the Details
Observing electronic voting from an international point of view gives some
perspective about its genesis and evolution. An analysis of the voting process
through its cultural, ontological, legal and political dimensions explains the
difficulty to normalize this process. It appears that international
organizations are not capable to properly defend the fundamental rights of the
citizens. The approach that was taken when DRE voting computers appeared seems
to have reoccured with VVAT voting computers and the european e-poll project.Comment: 9 page
Analyse des vulnérabilités de trois modes de vote à distance
15 pagesThis article analyses three methods of remote voting in an uncontrolled environment: postal voting, internet voting and hybrid voting. It breaks down the voting process into different stages and compares their vulnerabilities considering criteria that must be respected in any democratic vote: confidentiality, anonymity, transparency, vote unicity and authenticity. Whether for safety or reliability, each vulnerability is quantified by three parameters: size, visibility and difficulty to achieve. The study concludes that the automatisation of treatments combined with the dematerialisation of the objects used during an election tends to substitute visible vulnerabilities of a lesser magnitude by invisible and widespread vulnerabilities.Cet article analyse trois modes de vote à distance dans un environnement non contrôlé : vote par correspondance postale, vote par correspondance hybride et vote par internet. Il décompose les procédures de vote en différentes étapes dont il compare les vulnérabilités en ce qui concerne le respect des critères d'un vote démocratique (confidentialité, anonymat, transparence, unicité, sincérité). Qu'il s'agisse de sûreté ou de fiabilité, chaque vulnérabilité est quantifiée par trois paramètres : ampleur, difficulté et visibilité. L'étude constate que l'automatisation des traitements combinée à la dématérialisation des objets du vote tend à substituer des vulnérabilités visibles et d'ampleur réduite par des vulnérabilités invisibles et de grande ampleur
Langues africaines et communication électronique développement de correcteurs orthographiques
International audienceRésumé Les langues d'Afrique de l'Ouest sont peu utilisées pour la communication électronique. Nous examinons différentes causes de cette situation, comme les problèmes liés à la représentation électronique des caractères spéciaux utilisés dans ces langues, l'histoire de la transcription de ces langues, et leur enseignement. Nous préconisons le développement d'outils informatiques adaptés (éditeurs de textes, claviers) afin de favoriser l'écriture de textes. Enfin, nous détaillons les spécifications d'un correcteur orthographique adapté à la problématique exposée. Nous focalisons plus particulièrement sur le cas de la langue bambara (surtout parlée au Mali)
Favorisons la diversité linguistique en TAL
International audienceNous montrons dans cet article la faible diversité linguistique en TAL et évoquons quelques raisons pour cet état de fait. Nous pensons enfin que, sur la base de ce constat, la communauté pourrait contribuer à remédier à ce problème en adoptant quelques règles simples.Dans la première partie, nous abordons la rareté et la faible qualité des ressources en ligne puis nous présentons la faible diversité linguistique des travaux en TAL à travers une étude sur les publications du domaine, ainsi que celle des dictionnaires et des systèmes de traduction automatique. Dans la deuxième partie, nous évoquons les besoins des locuteurs et des chercheurs en TAL. Dans la troisième partie, nous abordons certaines difficultés rencontrées lors de travaux sur les langues peu dotées. En conclusion, nous formulons des préconisations visant à augmenter la diversité linguistique du TAL
Flore : un site coopératif pour recueillir et diffuser les noms des plantes dans les langues africaines
International audienceLes travaux que nous présentons s'inscrivent dans une problématique de sauvegarde des langues pour lesquelles il existe peu de ressources linguistiques comme les dictionnaires ou les lexiques. La rareté de ces ouvrages de référence fragilise ces langues car elle favorise la multiplication d'écrits incorrects, c'est-à -dire non conformes aux décrets de transcription officiels en vigueur. Nous considérons que la constitution de ressources lexicales électroniques via le réseau internet représente une solution viable. D'une part elle permet de fédérer les travaux de chercheurs géographiquement éloignés. D'autre part elle facilite la diffusion des connaissances puisque celles-ci sont visibles par n'importe quel internaute. Le site Flore s'inscrit dans ce cadre. Il est spécialisé dans les noms des plantes. La définition précise des informations stockées sur ce site par les partenaires du projet (informaticiens, linguistes et ethnobotanistes) nous a amené à dépasser l'objectif initial et à ajouter la description botanique des plantes ainsi que leurs utilisations. Cette extension a abouti à la définition de stratégies de coopération entre les personnes de différentes compétences susceptibles de fournir de nouvelles informations au site (linguistes, botanistes, nutritionistes, etc.). Nous présentons les problèmes techniques rencontrés lors du développement qui font obstacle à l'informatisation des langues africaines : il s'agit des caractères spéciaux spécifiques à ces langues et inexistants sur les claviers courants et dans les polices de caractères courantes. Enfin nous explorons les multiples extensions envisageables, telles la mise en service d'un forum de discussion réservé aux contributeurs du site ou l'édition de son contenu dans un format facilitant le partage des données : XML
Favorisons la diversité linguistique en TAL
International audienceNous montrons dans cet article la faible diversité linguistique en TAL et évoquons quelques raisons pour cet état de fait. Nous pensons enfin que, sur la base de ce constat, la communauté pourrait contribuer à remédier à ce problème en adoptant quelques règles simples.Dans la première partie, nous abordons la rareté et la faible qualité des ressources en ligne puis nous présentons la faible diversité linguistique des travaux en TAL à travers une étude sur les publications du domaine, ainsi que celle des dictionnaires et des systèmes de traduction automatique. Dans la deuxième partie, nous évoquons les besoins des locuteurs et des chercheurs en TAL. Dans la troisième partie, nous abordons certaines difficultés rencontrées lors de travaux sur les langues peu dotées. En conclusion, nous formulons des préconisations visant à augmenter la diversité linguistique du TAL
Computerization of African languages-French dictionaries
8 pagesInternational audienceThis paper relates work done during the DiLAF project. It consists in converting 5 bilingual African language-French dictionaries originally in Word format into XML following the LMF model. The languages processed are Bambara, Hausa, Kanuri, Tamajaq and Songhai-zarma, still considered as under-resourced languages concerning Natural Language Processing tools. Once converted, the dictionaries are available online on the Jibiki platform for lookup and modification. The DiLAF project is first presented. A description of each dictionary follows. Then, the conversion methodology from .doc format to XML files is presented. A specific point on the usage of Unicode follows. Then, each step of the conversion into XML and LMF is detailed. The last part presents the Jibiki lexical resources management platform used for the project
- …