18 research outputs found

    Representación vectorial de relación de hiponimia e hiperonimia en español

    Get PDF
    Actualmente, gracias a Internet y a la Web se dispone de información casi ilimitada, la cual está representada a nivel de textos en su mayoría. Así, dado que acceder a estos textos en su mayoría es de libre acceso, nace el interés por su manipulación de una manera automatizada para poder extraer información que se considere relevante. El presente trabajo de investigación se ubica dentro de la detección automática de relaciones léxicas entre palabras, que son relaciones que se establecen entre los significados de las palabras tal como se consigna en el diccionario. En particular, se centra en la detección de relaciones de hiponimia e hiperonimia, debido a que éstas son relaciones de palabras en las que una de ellas engloba el significado de otra o viceversa, lo cual podría considerarse como categorización de palabras. Básicamente, el método propuesto se basa en la manipulación de una representación vectorial de palabras denominado Word Embeddings, para resaltar especialmente áquellas que tengan relación jerárquica, proceso que se realiza a partir de textos no estructurados. Tradicionalmente, los Word Embeddings son utilizados para tareas de analogía, es decir, para detectar relaciones de sinonimia, por lo que se considera un poco más complejo utilizar estos vectores para la detección de relaciones jerárquicas (hiperonimia e hiponimia), por consecuencia se proponen métodos adicionales para que, en conjunto con los Word Embeddings, se puedan obtener resultados eficientes al momento de detectar las relaciones entre distintos pares de palabras.Currently, thanks to the Internet and Web, almost unlimited information is available, which is mostly represented at text level. Thus, given that access to these texts is mostly freely available, interest in their manipulation is born in an automated way to extract information that is considered relevant. The present research work is located within the automatic detection of lexical relations between words, which are relations that are established between the meanings of words as it is stated in the dictionary. In particular, it focuses on the detection of hyponymy and hyperonymy relationships, because these are word relationships in which one of them encompasses the meaning of another or vice versa, which could be considered as categorization of words. Basically, the proposed method is based on the manipulation of Word Embeddings to highlight especially words that have a hierarchical relationship, a process that is carried out from unstructured texts. Traditionally, Word Embeddings are used for analogy tasks, that is, to detect synonymy relationships, so it is considered a bit more complex to use these vectors for the hierarchical relationships (hyperonimia and hyponymy) detection, therefore, additional methods are proposed, so in conjunction with the Word Embeddings, efficient results can be obtained when detecting the relationships between different pairs of words.Tesi

    Normalización de información de servicios requeridos para Sistemas de Información Geográficos

    Get PDF
    La amplia difusión del proceso de desarrollo basado en componentes, en particular en el dominio de aplicaciones geográficas, ha generado el surgimiento de una gran cantidad y variedad de componentes software orientados a satisfacer las necesidades de los desarrolladores. En este contexto, uno de los principales inconvenientes encontrados al desarrollar aplicaciones mediante reuso de componentes, consiste en la localización de aquellos más adecuados a un requerimiento o conjunto de requerimientos en particular. A esto se denomina proceso de selección de componentes, que incluye dos actividades principales: la oferta de componentes disponibles para reuso y la demanda de servicios a ser satisfechos por la interface de los componentes ofertados. Nuestra propuesta consiste en una mejora al proceso de demanda mediante la estandarización de la especificación de requerimientos o servicios orientándolos a la búsqueda de componentes, en particular para el dominio de aplicaciones geográficas. Para ello se trabaja sobre la normalización de los requerimientos, categorizándolos según información estándar para servicios geográficos. Así, en esta Tesis se define en primer lugar, una Taxonomía de Servicios Geográficos. Luego, se propone una metodología para extraer conocimiento a partir de los casos de uso y categorizar esos requerimientos en clases de servicios geográficos. Por último, se describe la herramienta ReqGIS, la cual automatiza la metodología señalada anteriormente.The wide-spread use of component based development processes, particularly in geographic application domain, has caused the appearance of a great number and variety of software components oriented to satisfying developers’ needs. In this context, one of the main difficulties when developing applications with software reuse is discovering the most suitable components to a particular requirement. This activity is known as selection process, which includes two main activities: offering reusable components and requiring services to be satisfied by the components’ interfaces. Our proposal suggests improving the requiring process by standardizing the software requirement specification, and making requirements more suitable for searching suitable components, particularly for the geographic application domain. To do so, we work on requirement normalization, classifying requirements according to standard information for geographic services. In this Thesis, we firstly define a Geographic Service Taxonomy. Then, we propose a methodology to extracting knowledge from use cases, so requirements could be classified as normalized geographic services. Finally, we describe the ReqGIS tool, which supports the normalization process.Facultad de Informátic

    La terminología de la gastronomía puertorriqueña y su traducción al inglés

    Get PDF
    [ES] La cocina se presenta como un espacio en el que los alimentos se transforman en cultura. La receta, particularmente, aquella que se enmarca en el contexto de un libro vinculado a una cocina nacional, se configura como un acto de comunicación especializada en el que se integran el conocimiento técnico y la definición de la identidad. Estudiamos el entramado que subyace a la terminología utilizada en cinco libros de recetas de Puerto Rico, en su versión original y en su traducción al inglés. Los textos de los que extraemos los términos objeto de análisis se publicaron en momentos clave de la historia puertorriqueña: la década de los cincuenta del siglo XX, marcada por los cambios políticos en la isla con respecto a su relación con Estados Unidos, y la primera década del siglo XXI, momento en que el movimiento “foodie” se encuentra en auge. A fin de representar los términos en una base de datos terminológica que dé cuenta de las categorías y relaciones conceptuales del dominio, combinamos el estudio de corpus paralelos con fuentes de referencia, estudios semánticos y ontologías que describen el dominio culinario desde diferentes perspectivas. El estudio se inserta en los Estudios de Traducción y en la Terminología. [EN] In the kitchen, food transforms into culture. Recipes, particularly those framed in the context of recipe books linked to a national cuisine, stand as an act of specialized communication that combines technical knowledge with the definition of identity. We describe the framework that underlies the terminology used in a sample of recipes from five iconic Puerto Rican cookbooks, both in their original version in Spanish and in their English translation. The texts included in the corpus were published during key periods in Puerto Rican history, the fifties of the 20th century, an era marked by political changes on the island dealing with its relationship to the United States, and the first decade of the 21st century, a decade characterized by a “foodie boom”. In order to create a terminological database that gives an adequate account of the categories and conceptual relations of this domain, we combine the analysis of parallel corpora with lexicographic resources, semantic studies, and ontologies that describe the culinary domain from different points of view. The theoretical framework includes literature from both Translation Studies and Terminology

    IV Congreso de Lingüística General. Cádiz, del 3 al 6 de abril de 2000. Vol. II

    Get PDF
    Durante los días 3 al 6 de abril del año 2000 tuvo lugar en la Universidad de Cádiz el IV Congreso de Lingüística General, organizado por el área de Lingüística General de esta Universidad.893 págs

    Extracción automática de definiciones analíticas y relaciones semánticas de hiponimia-hiperonimia con un sistema basado en patrones lingüísticos

    No full text
    En el presente trabajo se muestra parte de un proyecto en curso centrada en el diseño de un autómata lexicográfico. El objetivo principal de la investigación es la extracción de definiciones analíticas y relaciones semánticas de términos con datos tomados directamente de internet. Presentamos dos de las capacidades del sistema: la extracción de definiciones analíticas y de hiperónimos. La metodología consiste principalmente en la búsqueda automática de esta información con patrones construidos manualmente basados en la estructura léxica de definiciones analíticas en lenguaje natural. Con este desarrollo, ha sido posible mejorar la precisión reportada en el estado del arte. Se ha conseguido una precisión de 92.5% para la tarea de extracción de definiciones analíticas y de las relaciones de hiperonimia

    Procesos de integración textual en la lectura de instrucciones

    Get PDF
    Esta tesis estudia el papel que juega la estructura de un texto en la comprensión del discurso. En una serie de tres experimentos, se pide a sujetos voluntarios que reordenen un conjunto de oraciones, que se presentan aleatoriamente, para hacer que un texto narrativo de cinco oraciones ¿el primer experimento-, un texto expositivo de cinco oraciones ¿el segundo experimento-, o un texto expositivo de nueve oraciones sea coherente. A cada sujeto se le presenta un conjunto desordenado de oraciones específico y único. Los resultados del primer experimento muestran que las relaciones referenciales entre entidades y/o eventos contribuyen a determinar la coherencia del texto. En un texto, las oraciones que se organizan por su coherencia local contienen indicios léxicos y no léxicos que permiten a los sujetos enlazar cada par de oraciones para dar estructura al texto; las oraciones que se organizan por su coherencia global contienen indicios léxicos y no léxicos que permiten relacionar cada oración con un tópico común. En estas condiciones los sujetos aplican una estrategia distinta en el segundo y tercer experimentos. Los resultados del segundo y tercer experimentos revela que los sujetos humanos emplean la información de como se estructuran las oraciones del texto pero de modo distinto en textos de cinco oraciones que en textos de nueve oraciones; en los textos de cinco oraciones emplean la coherencia local y relaciones semánticas concretas; en los textos de nueve oraciones emplean la coherencia global y relaciones semánticas abstractas. Esta diferencia nace de que al contrario que textos de cinco oraciones, los textos de nueve oraciones representan una sobrecarga cognitiva para la memoria operativa. Las relaciones referenciales juegan el mismo papel en todos los experimentos. Los resultados se analizan a la luz de los modelos de Análisis de Semántica Latente, la Teoría de la Estructura Retórica, y la Teoría de la Focalización. Ningún modelo teórico puede explicar todos los hallazgos experimentales, pero, descartando el papel jugado por la referencia, estos hallazgos son más compatibles con un modelo de la Teoría de la Focalización, dado que este modelo es el único que hace predicciones específicas acerca del papel que juega el orden de las oraciones

    Aspectos teóricos y metodológicos para la compilación de un diccionario combinatorio destinado a estudiantes de e/le

    Get PDF
    El presente trabajo pretende contribuir, modestamente, a la investigación colocacional del español desde una perspectiva tanto teórica como práctica, voluntad que se manifiesta ya en el título: Aspectos teóricos y metodológicos para la compilación de un diccionario combinatorio destinado a estudiantes de E/LE. Se trata de un estudio que tiene por objeto ofrecer un panorama de los diccionarios combinatorios existentes para el inglés y las lenguas románicas a fin de establecer las características prototípicas de esta clase de obras. Los resultados obtenidos sirven como base para presentar una propuesta para la compilación de un diccionario combinatorio electrónico destinado a la enseñanza-aprendizaje de E/LE por niveles, al que se ha bautizado como DiCLELE (Diccionario de combinaciones léxicas para la enseñanza-aprendizaje de E/LE). Tras llevar a cabo una aproximación teórica al fenómeno de las colocaciones y definir el concepto de partida (Capítulo 1), la labor se centra en describir las características generales de los diccionarios de colocaciones así como su tipología (Capítulo 2) para, a continuación, dar paso al análisis pormenorizado de los diccionarios de colocaciones monolingües de la lengua general en formato papel (Capítulo 3) y en formato electrónico (Capítulo 4). Seguidamente se reflexiona sobre los diferentes tipos de estructuración semántica adoptados por los diccionarios objeto de análisis (Capítulo 5) y sobre las cuestiones relacionadas con las enseñanza-aprendizaje de las colocaciones (Capítulo 6), con el fin de determinar cuál es la forma más adecuada de reflejar la información colocacional en el futuro DiCLELE, propuesta de diccionario combinatorio electrónico (Capítulo 1) para italohablantes que se describe de forma detallada en el capítulo 7. Para poder materializar dicha propuesta ha sido preciso recabar un gran número de datos léxicos del español, siendo las fuentes elegidas el Plan Curricular del Instituto Cervantes (PCIC) y los principales manuales empleados en los Institutos Cervantes de Italia.The purpose of the work here presented is to be a modest contribution to the studies on Spanish collocations, not only from the point of view of pure theory but also from the point of view of practical application. This purpose is reflected in the title: Aspectos teóricos y metodológicos para la compilación de un diccionario combinatorio destinado a estudiantes de E/LE (Theoretical Aspects and Methods of Compiling a Combinatory Dictionary for Students of Spanish as a Foreign Language). The aim of this study is to provide a panoramic view of the combinatorial dictionaries for English and for the romance languages and to establish their prototypical features. The findings are used to present a proposal for compiling an electronic combinatory dictionary to teach/learn Spanish as a foreign language by levels, called DiCLELE (Diccionario de combinaciones léxicas para la enseñanza-aprendizaje de E/LE). In Chapter 1 I outlined the major approaches to the concept of collocation and showed which concept of collocation will be taken in the present work. In Chapter 2 I described the main characteristics of collocations dictionaries and discussed several general and specialised English bilingual dictionaries. After it I discussed several general monolingual dictionaries on paper (Chapter 3) and electronic ones (Chapter 4). I went on by outlining the different ways to treat the semantic collocational information in existing dictionaries (Chapter 5) and I reflected on how to teach collocations. The last scope was to estabilish how to provide collocational information on the forthcoming DiCLELE, an electronic combinatory dictionary for italian learners of Spanish described in detail in Chapter 7. In order to carry out that purpose, it was necessary to collect a considerable amount of data in Spanish. The sources were the Plan Curricular of Instituto Cervantes (PCIC) and the main handbooks used in the several centres Instituto Cervantes of Italy

    Un enfoque léxico a prueba: efectos de la instrucción en el aprendizaje de las colocaciones léxicas

    Get PDF
    [ES]Las colocaciones léxicas (dar un paseo, contar una historia) han conseguido una gran atención como tema de investigación en campos como la adquisición de segundas lenguas (e.g. Schmitt, 2004; Meunier y Granger, 2008; Wood, 2010) así como en pedagogía de segundas lenguas (e.g. Lewis, 1993; Boers et al., 2006). Se ha demostrado que la adquisición de las colocaciones resulta problemática para aprendientes de L2 adultos (Nesselhauf, 2005) por varias razones, como la incongruencia con la L1, su falta de prominencia en los textos, su frecuente carácter idiomático, su posible carácter discontinuo, su aparente arbitrariedad y el hecho de que en algunos casos estén formadas por palabras ya conocidas. Por todas estas razones pueden pasar desapercibidas en la recepción del input y se requieren muchos encuentros en un período breve de tiempo para poder aprenderlas. En contextos de aprendizaje sin inmersión, las posibilidades de que esto ocurra son mínimas. Como consecuencia, algunos expertos en didáctica del léxico han recomendado la práctica de la captación de las colocaciones o noticing como el centro de la práctica pedagógica referida a las unidades léxicas complejas (Lewis, 1993, 1997, 2000). Otros, sin embargo, han abogado por la efectividad de las actividades explícitas no insertadas en los textos para promover un aprendizaje explícito e intencional de colocaciones previamente seleccionadas (e.g. Laufer y Girsai, 2008; Peters, 2009, 2012). No obstante, hasta donde sabemos, existe escasa evidencia empírica disponible ¿y menos aún para el español como L2 o LE¿ para decidir qué método promueve un mayor aprendizaje de las colocaciones. En esta tesis presentamos los resultados de un estudio de aula que contribuye a llenar este vacío aplicando las dos metodologías en grupos distintos, para después comparar los resultados en ambos grupos. El último objetivo es decidir qué metodología presenta más beneficios y ganancias para los aprendientes. Además, una de las razones a las que en la bibliografía se suele aludir para explicar la dificultad que oponen las colocaciones a los aprendientes de L2 es que no llaman la atención en el input porque no plantean problemas de comprensión. Así, cuando un aprendiente de ELE lee en un texto dé un paseo todos los días, no repararía en que es el verbo dar el que se combina con paseo, pudiendo cometer errores de transferencia en la producción como tomar un paseo ¿si su L1 es el inglés¿ o hacer un paseo ¿si su L1 es el francés-. Sin embargo, no tenemos noticia de ningún estudio que compare el aprendizaje de estas construcciones con verbo de apoyo (Alonso Ramos, 2004) frente a otro tipo de colocaciones en aprendientes de ELE, lo que nos lleva a tratar de responder a esta pregunta en nuestro estudio empírico. Para abordar estos objetivos de investigación diseñamos y llevamos a cabo un estudio experimental en el que se contó con tres grupos, dos experimentales y uno de control. Los tres grupos estuvieron expuestos al mismo input, que se trató de forma diferente. En el grupo de control, el vocabulario se abordó al nivel de la palabra y en su dimensión paradigmática; en el grupo experimental de captación se creó conciencia de las colocaciones y se llamó la atención sobre ellas en el input, animando a que los aprendientes las registraran en sus cuadernos; en el grupo experimental de tratamiento explícito también se creó conciencia de las colocaciones asignando actividades sobre las aparecidas en el input pero con tareas no insertadas en los textos. El tratamiento se implementó dos veces, una en el semestre de otoño y otra en el semestre de primavera durante un período de 8 semanas con 3 sesiones de clase de 75 minutos por semana. Participaron un total de 52 estudiantes de español L2 de la Universidad de Columbia y Barnard. Sus habilidades para el reconocimiento activo de las colocaciones antes y después del tratamiento didáctico se midieron a través de la administración de un pretest y 3 postest, uno al final de cada unidad didáctica. Además, al final del estudio, se administró un cuestionario en los dos grupos experimentales para valorar, de forma cualitativa, las percepciones y actitudes ante los materiales y la metodología seguida. A la luz de los resultados, podemos concluir que (1) la captación de las colocaciones en el input y la realización de actividades explícitas contribuyen al desarrollo de habilidades para su reconocimiento activo, mientras que la exposición a ellas en el input no genera aprendizaje alguno; (2) las ganancias de aprendizaje que se producen a través de la realización de actividades son significativamente mayores a las que se producen a través de la captación; (3) no hay diferencias entre las ganancias de aprendizaje de construcciones con verbo de apoyo y otras colocaciones después de los tratamientos de captación e instrucción explícita; (4) la creación de conciencia de las colocaciones a través de la realización de actividades genera la habilidad de captación de otras colocaciones en el input

    IV Congreso de Lingüística General. Cádiz, del 3 al 6 de abril de 2000. Vol. IV

    Get PDF
    Durante los días 3 al 6 de abril del año 2000 tuvo lugar en la Universidad de Cádiz el IV Congreso de Lingüística General, organizado por el área de Lingüística General de esta Universidad.851 págs
    corecore