68 research outputs found

    Detecció de la relació malaltia-símptoma entre termes de l'àmbit mèdic: una aproximació basada en corpus

    Get PDF
    Els especialistes en terminologia afirmen que els textos especialitzats són, quant al contingut, estructures formades per termes relacionats conceptualment (Cabré, 1999). L'objectiu principal d'aquest article és mostrar que existeixen patrons lingüístics que evidencien la relació malaltia-símptoma i que poden servir per detectar semiautomàticament o automàtica aquesta relació, mitjançant una metodologia concreta. Aquesta metodologia es basa en el fet que, un cop obtinguts i analitzats uns determinats contextos, s'extreuen marques lingüístiques que evidenciïn la relació i serveixin per realitzar una generalització de patrons lingüístics. En l'estudi observem que molts dels símptomes no apareixen en les definicions dels recursos terminològics mèdics, però sí en els textos especialitzats del corpus. També detectem que molts dels símptomes apareixen mitjançant col·locacions especialitzades.Experts in terminology state that specialised texts are, with respect to their content, structures formed by terms, and these terms are conceptually connected (Cabré, 1999). The main goal of this article is to prove the existence of linguistic patterns that show the disease–symptom relation. These patterns can be useful to detect the relation semiautomatically or automatically by means of a specific methodology. This methodology is based on the fact that, once we extract and analyse certain contexts, we can obtain linguistic marks that show this relation, allowing a generalisation of patterns. Our results show that most symptoms are not included in the definitions given in medical terminological resources, but they are indeed included in the medical corpus that has been analysed in this project. Moreover, most symptoms are described with specialised collocations

    A writing assistant to adapt administrative texts into plain language

    Get PDF
    El lenguaje claro aboga por que los textos dirigidos a los ciudadanos estén redactados en un lenguaje más sencillo y transparente, para que estos puedan entender fácilmente el mensaje que se les quiere transmitir. En este contexto, nuestro objetivo es desarrollar un redactor asistido para el español que ayude al personal de la Administración pública a escribir en lenguaje claro los textos que dirige a la ciudadanía. El sistema, gratuito y en línea, integra diferentes herramientas de Procesamiento de Lenguaje Natural (PLN) para detectar en los textos escritos por los usuarios los rasgos lingüísticos que interfieren con las recomendaciones sobre lenguaje claro. Asimismo, ofrece al usuario información para hacer más sencillo su texto. Para evaluar los algoritmos se empleó un corpus anotado manualmente, y las medidas de precisión y cobertura. Los resultados son muy positivos, aunque también reflejan algunos aspectos que se pueden mejorar en el futuro.Plain language advocates that texts addressed to citizens should be written in simpler and more transparent language, so that they can easily understand the message to be conveyed. In this context, our aim is to develop an assisted writing tool for Spanish to help Public Administration staff to write texts addressed to citizens in plain language. The system is free and online. It integrates different Natural Language Processing (NLP) tools to detect the linguistic features that interfere with plain language recommendations in the texts written by users. It also provides users with information to make their text clearer. A manually annotated corpus, and precision and recall measures were used to evaluate the algorithms. The results are very positive, although they also highlight some aspects that could be improved in the future.Este trabajo se deriva del proyecto de investigación titulado “Tecnologías de la Información y la Comunicación para la e-Administración: hacia la mejora de la comunicación entre Administración y ciudadanía a través del lenguaje claro (TIC-eADMIN)”, financiado por el Ministerio de Ciencia, Innovación e Universidades en la convocatoria 2018 de Proyectos I+D del Subprograma Estatal de Generación de Conocimiento (referencia PGC2018-099694-A-I00), y desarrollado en el Departamento de Filologías Extranjeras y sus Lingüísticas de la Facultad de Filología de la Universidad Nacional de Educación a Distancia (UNED), en el marco del grupo de investigación ACTUALing y en colaboración con el grupo IULATERM (IULA-UPF)

    An ICT tool for the writing of the Final Degree Project (TFG)

    Get PDF
    Desde la implantación del Espacio Europeo de Educación Superior a través del Plan Bolonia, en la universidad española es obligatorio que los estudiantes elaboren un Trabajo de Fin de Grado (TFG). El objetivo del presente trabajo es desarrollar una herramienta TIC (Tecnologías de la Información y la Comunicación) para ayudar a los estudiantes en la redacción del TFG en español. La herramienta tiene forma de editor de textos en línea e integra recursos de Procesamiento del Lenguaje Natural (PLN), como un analizador morfológico y un segmentador discursivo. Está dividida en tres módulos, que ayudan al estudiante a: 1) estructurar el TFG, 2) darle formato y corregirlo ortográficamente, y 3) revisar la adecuación del texto, mediante recomendaciones lingüísticas específicas para este género textual, relacionadas, por ejemplo, con oraciones largas, siglas, definiciones o unidades léxicas subjetivas. La evaluación user-driven realizada con estudiantes universitarios ofrece resultados positivos del uso de la herramienta.Since the implementation of the European Higher Education Area through the Bologna Plan, in the Spanish university it is mandatory for students to prepare a Final Degree Project (TFG). The aim of this work is to develop an ICT (Information and Communication Technologies) tool to help students in the writing of the TFG in Spanish. The tool is an online text editor and integrates Natural Language Processing (NLP) resources, such as a Part of Speech tagger and a discourse segmenter. It is divided into three modules, which help the student to: 1) structure the TFG, 2) format the text and correct its spelling, and 3) review the adequacy of the text, through specific linguistic recommendations for this textual genre, related, for example, with long sentences, initialisms, definitions or subjective lexical units. The user-driven evaluation carried out with university students shows positive results.Este trabajo se ha llevado a cabo en el marco de un contrato Ramón y Cajal (RYC-2014-16935) financiado por el Ministerio de Economía, Industria y Competitividad, vinculado al Departamento de Filologías Extranjeras y sus Lingüísticas de la Facultad de Filología de la Universidad Nacional de Educación a Distancia (UNED). Los resultados se derivan de dos proyectos de investigación. Por un lado, del proyecto “Un sistema automático de ayuda a la redacción de textos especializados de ámbitos relevantes en la sociedad española actual”, financiado en la Convocatoria 2015 de Ayudas Fundación BBVA a Investigadores y Creadores Culturales (IN[15]_HMS_LIN_0371). Por otro lado, del proyecto “Tecnologías de la Información y la Comunicación para la e-Administración: hacia la mejora de la comunicación entre Administración y ciudadanía a través del lenguaje claro (TIC-eADMIN)”, financiado por el Ministerio de Ciencia, Innovación e Universidades en la convocatoria 2018 de Proyectos I+D del Subprograma Estatal de Generación de Conocimiento (PGC2018-099694-A-I00)

    El potencial de las relaciones retóricas para la discriminación de textos especializados de diferentes dominios en euskera y español

    Get PDF
    This study presents our research on the potential of using rhetorical relations and superfi cial marks evidencing them to discriminate among specialized texts of different domains but with a high specialization level, in two very different languages as Basque and Spanish. For our analysis, we employ of the Rhetorical Structure Theory (RST). We compiled a parallel corpus of Spanish-Basque specialized texts that contains two subcorpora of medical and terminological texts. We marked these texts with RST rhetorical relations and we detectedthe discourse markers that evidence them. Finally, we noted that certain types of rhetorical relations and the amount of used discourse markers allow us to differentiate among specialized texts of different domains in both Spanish and Basque.Key words: Rhetorical Structure Theory, rhetorical relations, discourse markers, annotation, specialized text, contrastive study, Spanish, Basque.En este trabajo presentamos un estudio realizado con el fin de averiguar si las relaciones retóricas y las marcas superficiales que las evidencian tienen potencial para distinguir entre textos especializados de diferentes ámbitos que comparten un nivel de especialización alto, en dos lenguas tan diferentes como el euskera y el español. Para el análisis, hemos partido de la Rhetorical Structure Theory (RST). Hemos conformado un corpus paralelo de textos especializados español-euskera que contienedos subcorpus, que incluyen textos del ámbito médico y del ámbito terminológico. Hemos anotado los textos con las relaciones retóricas de la RST y hemos detectado los marcadores del discurso que las evidencian. Finalmente, hemos observado que ciertas relaciones retóricas y la cantidad de marcadores del discurso empleados permiten discriminar un subcorpus de otro, tanto en euskera como en español.Palavras-chave: Rhetorical Structure Theory, relaciones retóricas, marcadores del discurso, anotación, texto especializado, estudio contrastivo, español, eusker

    Writing Administrative Textual Genres in Scholarly and Professional Contexts in Spain

    Get PDF
    Textual genres in the field of Administration can be difficult to write for both university students and public administration employees, since they call for specific linguistic characteristics, which vary according to the genre and the recipient. This article gathers the results of an empirical study examining the perception of writing administrative textual genres for the general public among two groups in the academic and professional fields. The participating groups were made up of students enrolled at a Spanish state university and the staff of a local administration of reference. Data were based on a quantitative analysis of two surveys carried out among over 2000 people. The analysis allowed researchers to identify that the genres most frequently requested and those with which writers struggled the most, in both academic and professional contexts, were: report (informe), requisition (requerimiento), resolution (resolución), agreement (contrato) and minute (acta). It also revealed that the biggest challenges faced by both sets of people when having to write those genres were: unawareness of the proper structure and lexical choice. These findings confirm that both students and administrative professionals face issues when writing the textual genres specific to their field. Likewise, they suggest that there is some correspondence between university curricula and professional practice in terms of writing administrative genres

    Potential of rhetorical relations for differentiation among specialized texts from different domains in Basque and Spanish

    Get PDF
    This study presents our research on the potential of using rhetorical relations and superfi cial marks evidencing them to discriminate among specialized texts of different domains but with a high specialization level, in two very different languages as Basque and Spanish. For our analysis, we employ of the Rhetorical Structure Theory (RST). We compiled a parallel corpus of Spanish-Basque specialized texts that contains two subcorpora of medical and terminological texts. We marked these texts with RST rhetorical relations and we detectedthe discourse markers that evidence them. Finally, we noted that certain types of rhetorical relations and the amount of used discourse markers allow us to differentiate among specialized texts of different domains in both Spanish and Basque.Key words: Rhetorical Structure Theory, rhetorical relations, discourse markers, annotation, specialized text, contrastive study, Spanish, Basque

    The administrative resolution published on institutional web portals: A corpus-based analysis

    Get PDF
    La Administración pública española se comunica con la ciudadanía a través de una serie de textos especializados. Hasta hace unos años, estas comunicaciones se producían en formato papel. Sin embargo, con la aparición de la denominada Administración electrónica, internet se ha convertido en el canal de comunicación principal entre la Administración y la ciudadanía. Esto hace que los textos administrativos preexistentes se hayan tenido que adaptar a las posibilidades técnicas que ofrece la red, lo que los convierte en géneros digitales. Este trabajo se centra en el análisis de un género textual del ámbito de la Administración que en la actualidad se difunde casi exclusivamente a través de medios digitales, la resolución publicada en portales institucionales. Para ello, se toman como objeto de estudio las resoluciones publicadas en la página web del Boletín Oficial del Ayuntamiento de Madrid (BOAM), y se lleva a cabo un análisis lingüístico a nivel textual y léxico de un corpus formado por 20 textos. Asimismo, se realiza un análisis cualitativo de los rasgos digitales de este género textual. Como principal resultado de este estudio se obtiene una estructura modelo que contiene los apartados, los títulos y los contenidos prototípicos del género textual objeto de estudio. Además, se incluye una selección de unidades fraseológicas que se pueden utilizar para redactar esos contenidos. Estas unidades se adaptan a las recomendaciones de lenguaje claro más frecuentes para el español, con las que se pretende promover el uso de un lenguaje más sencillo por parte de las instituciones públicas. En cuanto al análisis de los rasgos digitales, se observan algunas diferencias en cuanto a la publicación de este tipo de textos en formato papel y a través de internet, como la posibilidad de ampliar la información a través de enlaces, o el uso de Códigos Seguros de Verificación (CSV).The Spanish public administration communicates with its citizens through a series of specialized texts. Until a few years ago, these communications were produced in paper format. However, with the emergence of the so-called e-administration, the internet has become the main channel of communication between the administration and its citizens. This means that pre-existing administrative texts have had to be adapted using the available technical possibilities, becoming digital genres. This paper focuses on the analysis of a textual genre of the administration that is currently disseminated almost exclusively through digital media: the resolution published on institutional web portals. For this purpose, the resolutions published on the website of the Boletín Oficial del Ayuntamiento de Madrid (BOAM) are taken as the subject of study for this research. We carry out a linguistic analysis (on a textual and lexical level) of a corpus consisting of 20 texts. Likewise, a qualitative analysis of the digital features of this textual genre is performed. The main result of this study is a model structure containing the prototypical sections, titles and contents of the textual genre under analysis. In addition, a selection of phraseological units that can be used to write these contents is included. These units are adapted to plain language recommendations, which advocate for the use of simpler language by public institutions. Regarding the analysis of the digital features, some differences are observed between the publication of this type of text in paper format and on the internet. For example, with online texts it is possible to expand the information through web links or to use Secure Verification Codes (CSV).Este trabajo se deriva de un contrato de formación predoctoral FPI, financiado por el Ministerio de Ciencia e Innovación en la convocatoria 2019 del Subprograma Estatal de Formación del Programa Estatal de Promoción del Talento y su Empleabilidad en I+D+i, en el marco del Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020 (referencia predoctoral PRE2019-088419). El contrato fue concedido a Sara Pistola Grille, que lleva a cabo su tesis doctoral como investigadora en formación en la Escuela Internacional de Doctorado de la Universidad Nacional de Educación a Distancia (UNED), “Programa de Doctorado en Filología. Estudios Lingüísticos y Literarios: teoría y aplicaciones”, Departamento de Filologías Extranjeras y sus Lingüísticas, Facultad de Filología, UNED. El contrato está asociado al proyecto de investigación titulado “Tecnologías de la Información y la Comunicación para la e-Administración: hacia la mejora de la comunicación entre Administración y ciudadanía a través del lenguaje claro (TIC- eADMIN)”, financiado por el Ministerio de Ciencia, Innovación y Universidades en la convocatoria 2018 de Proyectos I+D del Subprograma Estatal de Generación de Conocimiento (referencia PGC2018-099694-A-I00), y desarrollado en el Departamento de Filologías Extranjeras y sus Lingüísticas de la Facultad de Filología de la UNED, en el marco del grupo de investigación ACTUALing, con la colaboración del grupo IULATERM (IULA-UPF). La investigadora principal del proyecto es Iria da Cunha
    corecore