57 research outputs found

    Computerization of African languages-French dictionaries

    Get PDF
    This paper relates work done during the DiLAF project. It consists in converting 5 bilingual African language-French dictionaries originally in Word format into XML following the LMF model. The languages processed are Bambara, Hausa, Kanuri, Tamajaq and Songhai-zarma, still considered as under-resourced languages concerning Natural Language Processing tools. Once converted, the dictionaries are available online on the Jibiki platform for lookup and modification. The DiLAF project is first presented. A description of each dictionary follows. Then, the conversion methodology from .doc format to XML files is presented. A specific point on the usage of Unicode follows. Then, each step of the conversion into XML and LMF is detailed. The last part presents the Jibiki lexical resources management platform used for the project.Comment: 8 page

    Vulnerability analysis of three remote voting methods

    Get PDF
    This article analyses three methods of remote voting in an uncontrolled environment: postal voting, internet voting and hybrid voting. It breaks down the voting process into different stages and compares their vulnerabilities considering criteria that must be respected in any democratic vote: confidentiality, anonymity, transparency, vote unicity and authenticity. Whether for safety or reliability, each vulnerability is quantified by three parameters: size, visibility and difficulty to achieve. The study concludes that the automatisation of treatments combined with the dematerialisation of the objects used during an election tends to substitute visible vulnerabilities of a lesser magnitude by invisible and widespread vulnerabilities.Comment: 15 page

    Des correcteurs orthographiques pour collecter et diffuser les connaissances linguistiques en Afrique subsaharienne

    Get PDF
    International audienceLes pays du Sahel figurent parmi les plus pauvres de la terre, ils connaissent aussi des taux d’analphabétisation particulièrement élevés (83% au Niger, 60% au Mali, 57% au Sénégal). Or, l’alphabétisation de la population est un facteur essentiel pour développer un pays, il apparaît donc essentiel de mettre en place des stratégies pour améliorer l’alphabétisation des populations.Nous passons rapidement en revue l’histoire récente de la transcription des langues africaines et les problèmes rencontrés dans la production et la diffusion de connaissances linguistiques et de textes. Ensuite nous proposons le développement d’outils informatiques spécifiques pour capitaliser des connaissances et les diffuser

    Electronic Voting: the Devil is in the Details

    Get PDF
    Observing electronic voting from an international point of view gives some perspective about its genesis and evolution. An analysis of the voting process through its cultural, ontological, legal and political dimensions explains the difficulty to normalize this process. It appears that international organizations are not capable to properly defend the fundamental rights of the citizens. The approach that was taken when DRE voting computers appeared seems to have reoccured with VVAT voting computers and the european e-poll project.Comment: 9 page

    Analyse des vulnérabilités de trois modes de vote à distance

    Get PDF
    15 pagesThis article analyses three methods of remote voting in an uncontrolled environment: postal voting, internet voting and hybrid voting. It breaks down the voting process into different stages and compares their vulnerabilities considering criteria that must be respected in any democratic vote: confidentiality, anonymity, transparency, vote unicity and authenticity. Whether for safety or reliability, each vulnerability is quantified by three parameters: size, visibility and difficulty to achieve. The study concludes that the automatisation of treatments combined with the dematerialisation of the objects used during an election tends to substitute visible vulnerabilities of a lesser magnitude by invisible and widespread vulnerabilities.Cet article analyse trois modes de vote à distance dans un environnement non contrôlé : vote par correspondance postale, vote par correspondance hybride et vote par internet. Il décompose les procédures de vote en différentes étapes dont il compare les vulnérabilités en ce qui concerne le respect des critères d'un vote démocratique (confidentialité, anonymat, transparence, unicité, sincérité). Qu'il s'agisse de sûreté ou de fiabilité, chaque vulnérabilité est quantifiée par trois paramètres : ampleur, difficulté et visibilité. L'étude constate que l'automatisation des traitements combinée à la dématérialisation des objets du vote tend à substituer des vulnérabilités visibles et d'ampleur réduite par des vulnérabilités invisibles et de grande ampleur

    Langues africaines et communication électronique développement de correcteurs orthographiques

    Get PDF
    International audienceRésumé Les langues d'Afrique de l'Ouest sont peu utilisées pour la communication électronique. Nous examinons différentes causes de cette situation, comme les problèmes liés à la représentation électronique des caractères spéciaux utilisés dans ces langues, l'histoire de la transcription de ces langues, et leur enseignement. Nous préconisons le développement d'outils informatiques adaptés (éditeurs de textes, claviers) afin de favoriser l'écriture de textes. Enfin, nous détaillons les spécifications d'un correcteur orthographique adapté à la problématique exposée. Nous focalisons plus particulièrement sur le cas de la langue bambara (surtout parlée au Mali)

    Favorisons la diversité linguistique en TAL

    Get PDF
    International audienceNous montrons dans cet article la faible diversité linguistique en TAL et évoquons quelques raisons pour cet état de fait. Nous pensons enfin que, sur la base de ce constat, la communauté pourrait contribuer à remédier à ce problème en adoptant quelques règles simples.Dans la première partie, nous abordons la rareté et la faible qualité des ressources en ligne puis nous présentons la faible diversité linguistique des travaux en TAL à travers une étude sur les publications du domaine, ainsi que celle des dictionnaires et des systèmes de traduction automatique. Dans la deuxième partie, nous évoquons les besoins des locuteurs et des chercheurs en TAL. Dans la troisième partie, nous abordons certaines difficultés rencontrées lors de travaux sur les langues peu dotées. En conclusion, nous formulons des préconisations visant à augmenter la diversité linguistique du TAL

    Flore : un site coopératif pour recueillir et diffuser les noms des plantes dans les langues africaines

    Get PDF
    International audienceLes travaux que nous présentons s'inscrivent dans une problématique de sauvegarde des langues pour lesquelles il existe peu de ressources linguistiques comme les dictionnaires ou les lexiques. La rareté de ces ouvrages de référence fragilise ces langues car elle favorise la multiplication d'écrits incorrects, c'est-à-dire non conformes aux décrets de transcription officiels en vigueur. Nous considérons que la constitution de ressources lexicales électroniques via le réseau internet représente une solution viable. D'une part elle permet de fédérer les travaux de chercheurs géographiquement éloignés. D'autre part elle facilite la diffusion des connaissances puisque celles-ci sont visibles par n'importe quel internaute. Le site Flore s'inscrit dans ce cadre. Il est spécialisé dans les noms des plantes. La définition précise des informations stockées sur ce site par les partenaires du projet (informaticiens, linguistes et ethnobotanistes) nous a amené à dépasser l'objectif initial et à ajouter la description botanique des plantes ainsi que leurs utilisations. Cette extension a abouti à la définition de stratégies de coopération entre les personnes de différentes compétences susceptibles de fournir de nouvelles informations au site (linguistes, botanistes, nutritionistes, etc.). Nous présentons les problèmes techniques rencontrés lors du développement qui font obstacle à l'informatisation des langues africaines : il s'agit des caractères spéciaux spécifiques à ces langues et inexistants sur les claviers courants et dans les polices de caractères courantes. Enfin nous explorons les multiples extensions envisageables, telles la mise en service d'un forum de discussion réservé aux contributeurs du site ou l'édition de son contenu dans un format facilitant le partage des données : XML

    Favorisons la diversité linguistique en TAL

    No full text
    International audienceNous montrons dans cet article la faible diversité linguistique en TAL et évoquons quelques raisons pour cet état de fait. Nous pensons enfin que, sur la base de ce constat, la communauté pourrait contribuer à remédier à ce problème en adoptant quelques règles simples.Dans la première partie, nous abordons la rareté et la faible qualité des ressources en ligne puis nous présentons la faible diversité linguistique des travaux en TAL à travers une étude sur les publications du domaine, ainsi que celle des dictionnaires et des systèmes de traduction automatique. Dans la deuxième partie, nous évoquons les besoins des locuteurs et des chercheurs en TAL. Dans la troisième partie, nous abordons certaines difficultés rencontrées lors de travaux sur les langues peu dotées. En conclusion, nous formulons des préconisations visant à augmenter la diversité linguistique du TAL

    Computerization of African languages-French dictionaries

    Get PDF
    8 pagesInternational audienceThis paper relates work done during the DiLAF project. It consists in converting 5 bilingual African language-French dictionaries originally in Word format into XML following the LMF model. The languages processed are Bambara, Hausa, Kanuri, Tamajaq and Songhai-zarma, still considered as under-resourced languages concerning Natural Language Processing tools. Once converted, the dictionaries are available online on the Jibiki platform for lookup and modification. The DiLAF project is first presented. A description of each dictionary follows. Then, the conversion methodology from .doc format to XML files is presented. A specific point on the usage of Unicode follows. Then, each step of the conversion into XML and LMF is detailed. The last part presents the Jibiki lexical resources management platform used for the project
    • …
    corecore