4,584 research outputs found
Lexicografía especializada y lenguajes de especialidad: fundamentos teóricos y metodológicos para la elaboración de diccionarios especializados
En el presente artículo se pretende mostrar de forma progresiva
y secuencial pero integrada una aproximación teórico-práctica
al desarrollo de diccionarios especializados desde un enfoque
activo, centrado en el usuario y sus necesidades y acorde con
las corrientes terminográficas actuales de tipo lingüístico-comunicativo,
lo cual nos llevará a adoptar finalmente la etiqueta de
“lexicografía especializada” para referirnos a los fundamentos
teórico-metodológicos que guían o deberían guiar el desarrollo
de estos diccionarios de especialidad.
Con este fin y desde una perspectiva teórica se han analizado,
entre otros aspectos, los tres pilares básicos en que se sustenta la
lexicografía especializada: (1) los lenguajes de especialidad, (2)
la terminología, entendida aquí desde la Teoría Comunicativa de
la Terminología (Cabré 1999) y (3) la lingüística de corpus como
medio necesario para el análisis de los términos en uso. Esta
perspectiva teórica de la lexicografía especializada se presenta
a su vez complementada por unos fundamentos prácticos y una
propuesta metodológica concreta para la elaboración de diccionarios
activos de especialidad, mostrándose aquí como resultado
el tipo de entrada lexicográfica a obtener, desarrollada siempre
y necesariamente en base a unos usuarios y a unas necesidades
comunicativas específicas.The present article aims to put forward in a progressive and sequential but
also integrated manner a theoretical-practical approach for the development
of specialised dictionaries from an active perspective focused on the user,
on his/her needs and in accordance with current terminographical research,
linguistic-communicative in nature. This will lead to the final adoption of
the label “specialised lexicography” to make reference to the theoreticalmethodological
foundations that rule or should rule the development of such
speciality dictionaries.
With this aim in mind and from a theoretical perspective, the three main
pillars on which specialised lexicography is sustained have been analysed,
namely, (1) specialised languages, (2) terminology, understood here from
the Communicative Theory of Terminology (Cabré 1999) and (3) corpus
linguistics as the necessary means for the analysis of terms in use. At the
same time, the theoretical perspective is presented in conjunction with a
series of practical foundations and a specific methodological proposal for
the elaboration of specialised active dictionaries. The kind of results to be
obtained have been illustrated in the present study with a sample, real lexicographical
entry, always developed on the basis of prospective users and
specific communicative needs
Primeras aproximaciones a la anotación lingüístico-ontológica de documentos de Web Semántica: OntoTag
A instancias de lo que se ha dado en llamar la Web Semántica, la Inteligencia Artificial ha investigado exhaustivamente la anotación semántica de páginas web. La anotación (semántica) de textos se desarrolló primeramente en la Lingüística de Corpus; sin embargo, la Inteligencia Artificial, al centrarse en una anotación basada en ontologías, parece haber pasado por alto sus resultados. Este artículo muestra nuestras primeras experiencias en la integración de ambos campos, según las cuales una anotación híbrida (lingüística y ontológica) no sólo sería posible, sino también de gran utilidad, para hacer más comprensibles a un ordenador los documentos de la Web Semántica. Nuestro equipo de investigación está desarrollando OntoTag, un modelo de anotación multi-nivel (en principio, también multilingüe y de propósito general) basado en los estándares EAGLES y en la Semántica Ontológica, e implementado en lenguajes de marcado de última generación (RDF(S)/XML)
Propuesta de un glosario terminológico español-inglés para el campo de laboratorio de mecánica de suelos, concretos y pavimentos, Chiclayo, 2022
La presente investigación, tuvo como objetivo general: proponer un glosario
terminológico en el área de laboratorio de mecánica de suelos, concretos y
pavimentos, Chiclayo, 2022. La metodología empleada en esta investigación
presentó un enfoque cualitativo, de tipo aplicada y diseño no experimental. El
escenario de estudio estuvo delimitado por las normas del manual de ensayos de
materiales del MTC (Ministerio de Transportes y Comunicaciones). El corpus estuvo
constituido por 87 normas correspondientes a la sección de suelos, concretos y
agregados. Se utilizó como instrumento una lista de cotejo y una ficha de análisis
terminológica, siendo la observación y el análisis de contenido las técnicas
empleadas. El resultado de esta investigación fue un glosario terminológico bilingüe
conformado por 50 términos para el área de laboratorio de mecánica de suelos,
concretos y pavimentos en función a 6 categorías. Finalmente, se concluyó que, la
teoría de Cabré (1999) y los aportes de Cabré, Montané y Nazar (2012) con
respecto a los pasos a seguir para la elaboración de un glosario bilingüe, ayudaron
a que la elaboración del mismo sea una herramienta confiable y comprensible para
los traductores, estudiantes y conocedores de este campo
Trabajar el léxico en el aula de ELE mediante el uso directo de un corpus lingüístico
Treball Final de Màster Universitari en Professor/a d'Educació Secundària Obligatòria i Batxillerat, Formació Professional i Ensenyaments d'Idiomes. Codi: SAP429. Curs acadèmic: 2016/2017El presente trabajo analiza y explora la aplicación de la lingüística de corpus en la
enseñanza-aprendizaje de lenguas extranjeras. Se repasa la tipología de corpus y sus
usos dentro de la docencia.
El análisis también incluye una revisión del constructivismo y el aprendizaje
inductivo, en los que situamos el enfoque léxico, y más concretamente la aplicación
directa de los corpus en la enseñanza-aprendizaje con el Data-Driven Learning.
Finalmente, bajo estos parámetros se realiza una propuesta de actividades prácticas
basadas en corpus para trabajar el léxico, principalmente las locuciones idiomáticas,
adaptadas para un curso de español como lengua extranjera de la Escuela de Idiomas
de nivel C1.
Uno de los objetivos principales de este trabajo es la introducción de los corpus
lingüísticos en el aula como una herramienta más, en este caso considerada
herramienta de tecnologías de la información y comunicación (TIC). Este uso de
corpus en el aula puede ser como herramienta de consulta o como herramienta de
trabajo de las actividades.
Con esta propuesta se resaltan los beneficios de enseñar el léxico como eje central de
aprendizaje lengua extranjera y mediante la utilización de corpus, que muestra el
patrón de comportamiento de la lengua real en su contexto
Vocabulario transversal básico para la formación en competencias informáticas e informacionales Español - Catalán - Inglés
[EN] Cross-linguistic basic vocabulary for students entering university. Obtained by automatic and manual
extraction from a textual corpus representative of the field and of the communicative situations of
potential users. Systematic, with entries in Spanish, and with Catalan and English equivalences.
Software used: AntConc3.2.4w and GesTerm.
([ES] Vocabulario transversal básico para estudiantes que ingresan en la universidad. Obtenido por
extracción automática y manual a partir de un corpus textual representativo del ámbito y situaciones
de comunicación de los potenciales usuarios. Sistemático, con entradas en español y equivalencias en
catalán e inglés. Software: AntConc3.2.4w y GesTermCuenca Piera, MV. (2014). Vocabulario transversal básico para la formación en competencias informáticas e informacionales Español - Catalán - Inglés. http://hdl.handle.net/10251/48343Archivo delegad
Elaboración de un glosario terminológico bilingüe de publicaciones de una página web canadiense de la industria minera, Lima, 2022
El presente trabajo de investigación titulado Elaboración de un glosario terminológico
bilingüe de publicaciones de una página web canadiense de la industria minera, Lima, 2022
tuvo como objetivo elaborar un glosario terminológico bilingüe en inglés canadiense y
español latinoamericano. La investigación tuvo un enfoque cualitativo, de tipo aplicada, de
nivel descriptivo y con un diseño de estudio de caso siendo la técnica de análisis
documental. El corpus fue una página web canadiense llamada Miningwatch, del cual se
extrajeron 80 términos especializados de 7 publicaciones del ámbito minero, estos siendo
seleccionados como muestreo intencional. Este glosario estuvo en función de la unidad
léxica y el equivalente en las siguientes subcategorías: definiciones, categoría gramatical,
lengua y modalidad geográfica, ejemplo en contexto con sus respectivas fuentes para cada
subcategoría, además se agregó el título y la fecha de publicación. Se concluyó que la ficha
terminológica tiene la finalidad de almacenar información de la unidad léxica y equivalente,
asimismo cada subcategoría proporciona el dato preciso para la traducción de textos
especializados, ya que cumple con emplear el uso del equivalente adecuado y presentar
una traducción de comunicación efectiva
Knowledge engineering in the legal domain: The construction of a FunGramKB Satellite Ontolog y
[ES] Una de las tareas más tediosas en la labor diaria de los profesionales del derecho es la búsqueda de información en el ámbito jurídico. Con el fin de implementar aplicaciones avanzadas del procesamiento del lenguaje natural en este dominio, hemos desarrollado un modelo de representación del conocimiento especializado orientado a la semántica profunda dentro del marco de FunGramKB, una base de conocimiento léxicoconceptual multilingüe de propósito general. Más concretamente, el resultado de esta investigación ha dado como fruto una ontología terminológica sobre derecho penal en el dominio del terrorismo y el crimen organizado transnacional para ser utilizada en sistemas inteligentes que permitan la comprensión automática del discurso legal. El objetivo de este artículo es la descripción de la metodología empleada en el desarrollo de dicha ontología, centrándonos en la descripción de la herramienta que asiste al lingüista en el proceso de adquisición y conceptualización de los términos.[EN] One of the most time-consuming tasks in the daily work of legal professions is the search for information in the field of law. To implement advanced computer-based applications of natural language processing in this regard, we have developed a model of specialized knowledge representation driven by the deep semantics of FunGramKB, a multilingual general-purpose lexico-conceptual knowledge base. In particular, our research results in a terminological ontology on criminal law in the domain of transnational terrorism and organized crime to be implemented in intelligent systems which aim to understand legal discourse automatically. The objective of this paper is to describe the methodology used in the development of that ontology, focusing on the computerised tool to assist linguists in the process of terminological acquisition and conceptualization.Este trabajo forma parte de diversos proyectos de investigación financiados por el Ministerio de Ciencia y Tecnología, códigos FFI2011-29798-C02-01, FFI2010-17610 y FFI2010-15983.Periñán Pascual, JC.; Arcas Túnez, F. (2014). La ingeniería del conocimiento en el dominio legal: La construcción de una Ontología Satélite en FunGramKB. Revista Signos. 47(84):113-139. https://doi.org/10.4067/S0718-09342014000100006S113139478
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar
parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto
con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta
tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y
delitos futuros.
No obstante, debido a la velocidad con la que se generan datos e información en la última
década, las técnicas de análisis tradicional han resultado en baja productividad y en un
uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y
específicamente desde las ciencias de la computación, se vienen realizado múltiples
intentos para ayudar a identificar y obtener la información más importante dentro de estos
grandes volúmenes de datos.
Hasta el momento los estudios previos realizados para este dominio, abarcan desde la
predicción del lugar de un delito utilizando data numérica, hasta la identificación de
nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la
creación de una herramienta de extracción de información para noticias relacionadas al
dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y
locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto
de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de
extracción e información, y (3) Elaboración de una interfaz de programación de
aplicaciones para el consumo del modelo desarrollado.
Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias
sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.Tesi
Glosario militar de la Segunda Guerra Mundial. Trabajo de extracción terminológica y de lingüística de corpus mediante el análisis de textos de época
Procedemos seguidamente a detallar, de forma somera, los archivos y el contenido de esta investigación. Dicho trabajo ha quedado dividido y estructurado de la siguiente manera:
Un parte teórica (cuyo título es 2. Tesis doctoral. Parte teórica), dividida en once capítulos, en donde reside la fundamentación básica de nuestro trabajo, habiendo sido redactada en lengua española. En ella detallamos los motivos que nos animaron a llevarla a cabo y los objetivos que deseábamos obtener con ella. Se trata de un estudio de análisis de la terminología empleada durante la Segunda Guerra Mundial mediante el empleo de la terminología, de la lingüística de corpus y de las herramientas informáticas creadas para tal fin, con el propósito de implementar dichas metodologías. Nuestra labor ha sido la de cubrir un vacío descriptivo del uso real de las unidades terminológicas en el seno del ámbito militar. No obstante, y al ser ésta una ardua tarea, nuestra investigación ha quedado limitada al estudio del teatro de operaciones europeo, del Mediterráneo y del norte de África y a las operaciones terrestres.
Seguidamente exponemos la historia, su definición y la evolución que ha sufrido la lingüística de corpus, y la importancia que las nuevas tecnologías han tenido en dicho desarrollo. Asimismo, detallamos su definición y los motivos por los que ciertos investigadores la consideran disciplina o método, dependiendo de la importancia que se le atribuya a los resultados que han sido extraídos del corpus.
En el capítulo dedicado a la terminología, segunda metodología empleada en nuestro trabajo, describimos su historia y su evolución procediendo, a continuación, a su definición. Al igual que ocurriera en la lingüística de corpus, existen voces que han puesto en tela de juicio sus premisas teóricas. Debido a ello, analizaremos las posturas que sostienen los defensores de la tesis tradicional y los motivos por los que otros promueven un cambio para que la terminología sea considerada disciplina. Tras ello, hemos expuesto la idoneidad del uso de los corpus a la hora de individuar, analizar y definir las unidades terminológicas en el seno de cada disciplina. Continuamos detallando los pasos a seguir para compilar un corpus que cumpla con los requisitos y objetivos estipulados, al igual que los diferentes métodos empleados en el trabajo terminológico. Finalmente enumeramos los dos tipos de herramientas a disposición de los terminólogos diseñadas mediante dos enfoques diferentes: el lingüístico y el estadístico.
En el siguiente capítulo detallamos los pasos ejecutados en nuestro proceso de extracción terminológica. Describimos las premisas teóricas seleccionadas para delimitar nuestro trabajo, al igual que su aplicación y objetivos. De igual modo, identificamos los textos seleccionados para el estudio terminológico, las herramientas informáticas empleadas para tal efecto y el desarrollo que ha seguido nuestra labor de análisis terminológica.
Finalmente, exponemos nuestras consideraciones con respecto al trabajo de extracción terminológica, su evolución, métodos de análisis empleados y los resultados obtenidos. Por último, valoramos nuestra labor y la comparamos con el proceso de ordenación terminológica efectuado en los años cuarenta del pasado siglo; sus deficiencias y sus posibles mejoras con el propósito de continuar dicho estudio de una manera más detallada y con unos objetivos más ambiciosos.
El archivo titulado 3. Tesis doctoral. Parte Práctica, alberga los resultados de nuestro estudio, que no son otros que un glosario terminológico militar de la Segunda Guerra Mundial. Dicho glosario consta de 748 páginas y contiene 3.090 términos. Este análisis terminológico se ha centrado en las operaciones terrestres efectuadas en los continentes europeo y africano, quedando excluidas las operaciones navales y aéreas y la guerra en el Pacifico. Dicha parte de la tesis ha sido redactada en lengua inglesa, al estar en dicho idioma los textos que hemos empleado para la creación de nuestro corpus. En ella no solo se incluyen las unidades terminológicas normalizadas durante ese espacio temporal, sino las normalizadas, a posteriori, las que han sido asimiladas al lenguaje general (convirtiéndose en unidades léxicas), aquellas que no habían sido incluidas previamente en ningún glosario y que (después de consultar a un experto o de hallar su definición en contexto) hemos identificado en nuestro trabajo, además de las unidades terminológicas procedentes de otras lenguas que formaron parte del lenguaje de especialidad militar a partir de dicho conflicto.
La carpeta denominada 4. Lista de textos enumera los textos que han sido empleados en nuestra investigación. Se trata del Intelligence Bulletin, revista publicada por el War Department norteamericano, en donde se detallan nuevas estrategias, tácticas y armamentos, tanto de las Fuerzas del Eje como Aliadas. Los números de esta publicación fueron editados entre septiembre de 1942 y junio de 1946 aunque, a partir de julio de 1945, su tirada dejó de ser mensual. A pesar de contener un limitado número de palabras (285.214), su carácter de representatividad ha sido fundamental a la hora de identificar el léxico especializado de dicha disciplina.
En 5. Textos sin etiquetar, se encuentran los artículos de las publicaciones descritas con anterioridad en texto plano (o formato txt) sin etiquetar, las cuales han sido empleadas durante el proceso de extracción terminológica sobre base estadística y lingüista, en particular, durante el proceso de búsqueda de unidades terminológicas simples.
Finalmente, el fichero de nombre 6. Textos con etiquetado gramatical, incluye los mismos escritos detallados arriba, pero que poseen su correspondiente anotación gramatical. Para tal efecto, se seleccionó la anotación CLAWS 7 (the Constituent Likelihood Automatic Word-tagging System, Seventh Version), proporcionada por UCREL (The University Centre for Computer Corpus Research on Language), organismo perteneciente a la Universidad de Lancaster. Con ellos se procedió a ejecutar el análisis de extracción terminológica sobre base estadística, en particular, durante el proceso de búsqueda de unidades terminológicas complejas
- …