4,584 research outputs found

    Lexicografía especializada y lenguajes de especialidad: fundamentos teóricos y metodológicos para la elaboración de diccionarios especializados

    Get PDF
    En el presente artículo se pretende mostrar de forma progresiva y secuencial pero integrada una aproximación teórico-práctica al desarrollo de diccionarios especializados desde un enfoque activo, centrado en el usuario y sus necesidades y acorde con las corrientes terminográficas actuales de tipo lingüístico-comunicativo, lo cual nos llevará a adoptar finalmente la etiqueta de “lexicografía especializada” para referirnos a los fundamentos teórico-metodológicos que guían o deberían guiar el desarrollo de estos diccionarios de especialidad. Con este fin y desde una perspectiva teórica se han analizado, entre otros aspectos, los tres pilares básicos en que se sustenta la lexicografía especializada: (1) los lenguajes de especialidad, (2) la terminología, entendida aquí desde la Teoría Comunicativa de la Terminología (Cabré 1999) y (3) la lingüística de corpus como medio necesario para el análisis de los términos en uso. Esta perspectiva teórica de la lexicografía especializada se presenta a su vez complementada por unos fundamentos prácticos y una propuesta metodológica concreta para la elaboración de diccionarios activos de especialidad, mostrándose aquí como resultado el tipo de entrada lexicográfica a obtener, desarrollada siempre y necesariamente en base a unos usuarios y a unas necesidades comunicativas específicas.The present article aims to put forward in a progressive and sequential but also integrated manner a theoretical-practical approach for the development of specialised dictionaries from an active perspective focused on the user, on his/her needs and in accordance with current terminographical research, linguistic-communicative in nature. This will lead to the final adoption of the label “specialised lexicography” to make reference to the theoreticalmethodological foundations that rule or should rule the development of such speciality dictionaries. With this aim in mind and from a theoretical perspective, the three main pillars on which specialised lexicography is sustained have been analysed, namely, (1) specialised languages, (2) terminology, understood here from the Communicative Theory of Terminology (Cabré 1999) and (3) corpus linguistics as the necessary means for the analysis of terms in use. At the same time, the theoretical perspective is presented in conjunction with a series of practical foundations and a specific methodological proposal for the elaboration of specialised active dictionaries. The kind of results to be obtained have been illustrated in the present study with a sample, real lexicographical entry, always developed on the basis of prospective users and specific communicative needs

    Primeras aproximaciones a la anotación lingüístico-ontológica de documentos de Web Semántica: OntoTag

    Full text link
    A instancias de lo que se ha dado en llamar la Web Semántica, la Inteligencia Artificial ha investigado exhaustivamente la anotación semántica de páginas web. La anotación (semántica) de textos se desarrolló primeramente en la Lingüística de Corpus; sin embargo, la Inteligencia Artificial, al centrarse en una anotación basada en ontologías, parece haber pasado por alto sus resultados. Este artículo muestra nuestras primeras experiencias en la integración de ambos campos, según las cuales una anotación híbrida (lingüística y ontológica) no sólo sería posible, sino también de gran utilidad, para hacer más comprensibles a un ordenador los documentos de la Web Semántica. Nuestro equipo de investigación está desarrollando OntoTag, un modelo de anotación multi-nivel (en principio, también multilingüe y de propósito general) basado en los estándares EAGLES y en la Semántica Ontológica, e implementado en lenguajes de marcado de última generación (RDF(S)/XML)

    Propuesta de un glosario terminológico español-inglés para el campo de laboratorio de mecánica de suelos, concretos y pavimentos, Chiclayo, 2022

    Get PDF
    La presente investigación, tuvo como objetivo general: proponer un glosario terminológico en el área de laboratorio de mecánica de suelos, concretos y pavimentos, Chiclayo, 2022. La metodología empleada en esta investigación presentó un enfoque cualitativo, de tipo aplicada y diseño no experimental. El escenario de estudio estuvo delimitado por las normas del manual de ensayos de materiales del MTC (Ministerio de Transportes y Comunicaciones). El corpus estuvo constituido por 87 normas correspondientes a la sección de suelos, concretos y agregados. Se utilizó como instrumento una lista de cotejo y una ficha de análisis terminológica, siendo la observación y el análisis de contenido las técnicas empleadas. El resultado de esta investigación fue un glosario terminológico bilingüe conformado por 50 términos para el área de laboratorio de mecánica de suelos, concretos y pavimentos en función a 6 categorías. Finalmente, se concluyó que, la teoría de Cabré (1999) y los aportes de Cabré, Montané y Nazar (2012) con respecto a los pasos a seguir para la elaboración de un glosario bilingüe, ayudaron a que la elaboración del mismo sea una herramienta confiable y comprensible para los traductores, estudiantes y conocedores de este campo

    Trabajar el léxico en el aula de ELE mediante el uso directo de un corpus lingüístico

    Get PDF
    Treball Final de Màster Universitari en Professor/a d'Educació Secundària Obligatòria i Batxillerat, Formació Professional i Ensenyaments d'Idiomes. Codi: SAP429. Curs acadèmic: 2016/2017El presente trabajo analiza y explora la aplicación de la lingüística de corpus en la enseñanza-aprendizaje de lenguas extranjeras. Se repasa la tipología de corpus y sus usos dentro de la docencia. El análisis también incluye una revisión del constructivismo y el aprendizaje inductivo, en los que situamos el enfoque léxico, y más concretamente la aplicación directa de los corpus en la enseñanza-aprendizaje con el Data-Driven Learning. Finalmente, bajo estos parámetros se realiza una propuesta de actividades prácticas basadas en corpus para trabajar el léxico, principalmente las locuciones idiomáticas, adaptadas para un curso de español como lengua extranjera de la Escuela de Idiomas de nivel C1. Uno de los objetivos principales de este trabajo es la introducción de los corpus lingüísticos en el aula como una herramienta más, en este caso considerada herramienta de tecnologías de la información y comunicación (TIC). Este uso de corpus en el aula puede ser como herramienta de consulta o como herramienta de trabajo de las actividades. Con esta propuesta se resaltan los beneficios de enseñar el léxico como eje central de aprendizaje lengua extranjera y mediante la utilización de corpus, que muestra el patrón de comportamiento de la lengua real en su contexto

    Vocabulario transversal básico para la formación en competencias informáticas e informacionales Español - Catalán - Inglés

    Full text link
    [EN] Cross-linguistic basic vocabulary for students entering university. Obtained by automatic and manual extraction from a textual corpus representative of the field and of the communicative situations of potential users. Systematic, with entries in Spanish, and with Catalan and English equivalences. Software used: AntConc3.2.4w and GesTerm. ([ES] Vocabulario transversal básico para estudiantes que ingresan en la universidad. Obtenido por extracción automática y manual a partir de un corpus textual representativo del ámbito y situaciones de comunicación de los potenciales usuarios. Sistemático, con entradas en español y equivalencias en catalán e inglés. Software: AntConc3.2.4w y GesTermCuenca Piera, MV. (2014). Vocabulario transversal básico para la formación en competencias informáticas e informacionales Español - Catalán - Inglés. http://hdl.handle.net/10251/48343Archivo delegad

    Elaboración de un glosario terminológico bilingüe de publicaciones de una página web canadiense de la industria minera, Lima, 2022

    Get PDF
    El presente trabajo de investigación titulado Elaboración de un glosario terminológico bilingüe de publicaciones de una página web canadiense de la industria minera, Lima, 2022 tuvo como objetivo elaborar un glosario terminológico bilingüe en inglés canadiense y español latinoamericano. La investigación tuvo un enfoque cualitativo, de tipo aplicada, de nivel descriptivo y con un diseño de estudio de caso siendo la técnica de análisis documental. El corpus fue una página web canadiense llamada Miningwatch, del cual se extrajeron 80 términos especializados de 7 publicaciones del ámbito minero, estos siendo seleccionados como muestreo intencional. Este glosario estuvo en función de la unidad léxica y el equivalente en las siguientes subcategorías: definiciones, categoría gramatical, lengua y modalidad geográfica, ejemplo en contexto con sus respectivas fuentes para cada subcategoría, además se agregó el título y la fecha de publicación. Se concluyó que la ficha terminológica tiene la finalidad de almacenar información de la unidad léxica y equivalente, asimismo cada subcategoría proporciona el dato preciso para la traducción de textos especializados, ya que cumple con emplear el uso del equivalente adecuado y presentar una traducción de comunicación efectiva

    Knowledge engineering in the legal domain: The construction of a FunGramKB Satellite Ontolog y

    Full text link
    [ES] Una de las tareas más tediosas en la labor diaria de los profesionales del derecho es la búsqueda de información en el ámbito jurídico. Con el fin de implementar aplicaciones avanzadas del procesamiento del lenguaje natural en este dominio, hemos desarrollado un modelo de representación del conocimiento especializado orientado a la semántica profunda dentro del marco de FunGramKB, una base de conocimiento léxicoconceptual multilingüe de propósito general. Más concretamente, el resultado de esta investigación ha dado como fruto una ontología terminológica sobre derecho penal en el dominio del terrorismo y el crimen organizado transnacional para ser utilizada en sistemas inteligentes que permitan la comprensión automática del discurso legal. El objetivo de este artículo es la descripción de la metodología empleada en el desarrollo de dicha ontología, centrándonos en la descripción de la herramienta que asiste al lingüista en el proceso de adquisición y conceptualización de los términos.[EN] One of the most time-consuming tasks in the daily work of legal professions is the search for information in the field of law. To implement advanced computer-based applications of natural language processing in this regard, we have developed a model of specialized knowledge representation driven by the deep semantics of FunGramKB, a multilingual general-purpose lexico-conceptual knowledge base. In particular, our research results in a terminological ontology on criminal law in the domain of transnational terrorism and organized crime to be implemented in intelligent systems which aim to understand legal discourse automatically. The objective of this paper is to describe the methodology used in the development of that ontology, focusing on the computerised tool to assist linguists in the process of terminological acquisition and conceptualization.Este trabajo forma parte de diversos proyectos de investigación financiados por el Ministerio de Ciencia y Tecnología, códigos FFI2011-29798-C02-01, FFI2010-17610 y FFI2010-15983.Periñán Pascual, JC.; Arcas Túnez, F. (2014). La ingeniería del conocimiento en el dominio legal: La construcción de una Ontología Satélite en FunGramKB. Revista Signos. 47(84):113-139. https://doi.org/10.4067/S0718-09342014000100006S113139478

    Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

    Get PDF
    Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.Tesi

    Glosario militar de la Segunda Guerra Mundial. Trabajo de extracción terminológica y de lingüística de corpus mediante el análisis de textos de época

    Get PDF
    Procedemos seguidamente a detallar, de forma somera, los archivos y el contenido de esta investigación. Dicho trabajo ha quedado dividido y estructurado de la siguiente manera: Un parte teórica (cuyo título es 2. Tesis doctoral. Parte teórica), dividida en once capítulos, en donde reside la fundamentación básica de nuestro trabajo, habiendo sido redactada en lengua española. En ella detallamos los motivos que nos animaron a llevarla a cabo y los objetivos que deseábamos obtener con ella. Se trata de un estudio de análisis de la terminología empleada durante la Segunda Guerra Mundial mediante el empleo de la terminología, de la lingüística de corpus y de las herramientas informáticas creadas para tal fin, con el propósito de implementar dichas metodologías. Nuestra labor ha sido la de cubrir un vacío descriptivo del uso real de las unidades terminológicas en el seno del ámbito militar. No obstante, y al ser ésta una ardua tarea, nuestra investigación ha quedado limitada al estudio del teatro de operaciones europeo, del Mediterráneo y del norte de África y a las operaciones terrestres. Seguidamente exponemos la historia, su definición y la evolución que ha sufrido la lingüística de corpus, y la importancia que las nuevas tecnologías han tenido en dicho desarrollo. Asimismo, detallamos su definición y los motivos por los que ciertos investigadores la consideran disciplina o método, dependiendo de la importancia que se le atribuya a los resultados que han sido extraídos del corpus. En el capítulo dedicado a la terminología, segunda metodología empleada en nuestro trabajo, describimos su historia y su evolución procediendo, a continuación, a su definición. Al igual que ocurriera en la lingüística de corpus, existen voces que han puesto en tela de juicio sus premisas teóricas. Debido a ello, analizaremos las posturas que sostienen los defensores de la tesis tradicional y los motivos por los que otros promueven un cambio para que la terminología sea considerada disciplina. Tras ello, hemos expuesto la idoneidad del uso de los corpus a la hora de individuar, analizar y definir las unidades terminológicas en el seno de cada disciplina. Continuamos detallando los pasos a seguir para compilar un corpus que cumpla con los requisitos y objetivos estipulados, al igual que los diferentes métodos empleados en el trabajo terminológico. Finalmente enumeramos los dos tipos de herramientas a disposición de los terminólogos diseñadas mediante dos enfoques diferentes: el lingüístico y el estadístico. En el siguiente capítulo detallamos los pasos ejecutados en nuestro proceso de extracción terminológica. Describimos las premisas teóricas seleccionadas para delimitar nuestro trabajo, al igual que su aplicación y objetivos. De igual modo, identificamos los textos seleccionados para el estudio terminológico, las herramientas informáticas empleadas para tal efecto y el desarrollo que ha seguido nuestra labor de análisis terminológica. Finalmente, exponemos nuestras consideraciones con respecto al trabajo de extracción terminológica, su evolución, métodos de análisis empleados y los resultados obtenidos. Por último, valoramos nuestra labor y la comparamos con el proceso de ordenación terminológica efectuado en los años cuarenta del pasado siglo; sus deficiencias y sus posibles mejoras con el propósito de continuar dicho estudio de una manera más detallada y con unos objetivos más ambiciosos. El archivo titulado 3. Tesis doctoral. Parte Práctica, alberga los resultados de nuestro estudio, que no son otros que un glosario terminológico militar de la Segunda Guerra Mundial. Dicho glosario consta de 748 páginas y contiene 3.090 términos. Este análisis terminológico se ha centrado en las operaciones terrestres efectuadas en los continentes europeo y africano, quedando excluidas las operaciones navales y aéreas y la guerra en el Pacifico. Dicha parte de la tesis ha sido redactada en lengua inglesa, al estar en dicho idioma los textos que hemos empleado para la creación de nuestro corpus. En ella no solo se incluyen las unidades terminológicas normalizadas durante ese espacio temporal, sino las normalizadas, a posteriori, las que han sido asimiladas al lenguaje general (convirtiéndose en unidades léxicas), aquellas que no habían sido incluidas previamente en ningún glosario y que (después de consultar a un experto o de hallar su definición en contexto) hemos identificado en nuestro trabajo, además de las unidades terminológicas procedentes de otras lenguas que formaron parte del lenguaje de especialidad militar a partir de dicho conflicto. La carpeta denominada 4. Lista de textos enumera los textos que han sido empleados en nuestra investigación. Se trata del Intelligence Bulletin, revista publicada por el War Department norteamericano, en donde se detallan nuevas estrategias, tácticas y armamentos, tanto de las Fuerzas del Eje como Aliadas. Los números de esta publicación fueron editados entre septiembre de 1942 y junio de 1946 aunque, a partir de julio de 1945, su tirada dejó de ser mensual. A pesar de contener un limitado número de palabras (285.214), su carácter de representatividad ha sido fundamental a la hora de identificar el léxico especializado de dicha disciplina. En 5. Textos sin etiquetar, se encuentran los artículos de las publicaciones descritas con anterioridad en texto plano (o formato txt) sin etiquetar, las cuales han sido empleadas durante el proceso de extracción terminológica sobre base estadística y lingüista, en particular, durante el proceso de búsqueda de unidades terminológicas simples. Finalmente, el fichero de nombre 6. Textos con etiquetado gramatical, incluye los mismos escritos detallados arriba, pero que poseen su correspondiente anotación gramatical. Para tal efecto, se seleccionó la anotación CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System, Seventh Version), proporcionada por UCREL (The University Centre for Computer Corpus Research on Language), organismo perteneciente a la Universidad de Lancaster. Con ellos se procedió a ejecutar el análisis de extracción terminológica sobre base estadística, en particular, durante el proceso de búsqueda de unidades terminológicas complejas
    corecore