6 research outputs found

    Text revision in Scientific Writing Assistance: An Overview

    Full text link
    Writing a scientific article is a challenging task as it is a highly codified genre. Good writing skills are essential to properly convey ideas and results of research work. Since the majority of scientific articles are currently written in English, this exercise is all the more difficult for non-native English speakers as they additionally have to face language issues. This article aims to provide an overview of text revision in writing assistance in the scientific domain. We will examine the specificities of scientific writing, including the format and conventions commonly used in research articles. Additionally, this overview will explore the various types of writing assistance tools available for text revision. Despite the evolution of the technology behind these tools through the years, from rule-based approaches to deep neural-based ones, challenges still exist (tools' accessibility, limited consideration of the context, inexplicit use of discursive information, etc.)Comment: Published at 13th International Workshop on Bibliometric-enhanced Information Retrieval 12 page

    CASIMIR : un Corpus d'Articles Scientifiques Intégrant les ModIfications et Révisions des auteurs

    No full text
    International audienceÉcrire un article scientifique est une tâche difficile. L'écriture scientifique étant un genre très codifié, de bonnes compétences d'écriture sont essentielles pour transmettre ses idées et les résultats de ses recherches. Cet article décrit les motivations et les travaux préliminaires de la création du corpus CASIMIR dont l'objectif est d'offrir une ressource sur l'étape de révision du processus d'écriture d'un article scientifique. CASIMIR est un corpus des multiples versions de 26 355 articles scientifiques provenant d'OpenReview accompagné des relectures par les pairs

    CASIMIR: Un corpus d'Articles Scientifiques Incluant les MultIples Revisions des auteurs

    No full text
    International audienceWriting a scientific article is a challenging task as it is a highly codified and specific genre, consequently proficiency in written communication is essential for effectively conveying research findings and ideas. In this article, we propose an original textual resource on the revision step of the writing process of scientific articles. This new dataset, called CASIMIR, contains the multiple revised versions of 15,646 scientific articles from OpenReview, along with their peer reviews. Pairs of consecutive versions of an article are aligned at sentence-level while keeping paragraph location information as metadata for supporting future revision studies at the discourse level. Each pair of revised sentences is enriched with automatically extracted edits and associated revision intention. To assess the initial quality on the dataset, we conducted a qualitative study of several state-of-the-art text revision approaches and compared various evaluation metrics. Our experiments led us to question the relevance of the current evaluation methods for the text revision task.La rédaction d'un article scientifique est une tâche difficile car il s'agit d'un genre hautement codifié. Par conséquent, la maîtrise de la communication écrite est essentielle pour transmettre efficacement les résultats et le contenu de ses recherche. Dans cet article, nous proposons une ressource textuelle originale sur l'étape de révision du processus de rédaction des articles scientifiques. Ce nouveau jeu de données, appelé CASIMIR, contient les multiples versions révisées de 15 646 articles scientifiques d'OpenReview, ainsi que leurs évaluations par les pairs. Les paires de versions consécutives d'un article sont alignées au niveau de la phrase tout en conservant les informations sur l'emplacement du paragraphe comme métadonnées pour soutenir les futures études sur la révision au niveau du discours. Chaque paire de phrases révisées est enrichie des modifications extraites automatiquement et de l'intention de révision associée. Pour évaluer la qualité initiale de l'ensemble de données, nous avons mené une étude qualitative de plusieurs approches de révision de texte état de l'art et comparé diverses mesures d'évaluation. Nos expériences nous ont amenés à nous interroger sur la pertinence des méthodes d'évaluation actuelles pour la tâche de révision de texte

    La révision de texte dans l'assistance à l'écriture scientifique : Un résumé

    No full text
    Published at 13th International Workshop on Bibliometric-enhanced Information Retrieval 12 pagesInternational audienceWriting a scientific article is a challenging task as it is a highly codified genre. Good writing skills are essential to properly convey ideas and results of research work. Since the majority of scientific articles are currently written in English, this exercise is all the more difficult for non-native English speakers as they additionally have to face language issues. This article aims to provide an overview of text revision in writing assistance in the scientific domain. We will examine the specificities of scientific writing, including the format and conventions commonly used in research articles. Additionally, this overview will explore the various types of writing assistance tools available for text revision. Despite the evolution of the technology behind these tools through the years, from rule-based approaches to deep neural-based ones, challenges still exist (tools' accessibility, limited consideration of the context, inexplicit use of discursive information, etc.
    corecore