2,968 research outputs found

    Predicate Matrix: an interoperable lexical knowledge base for predicates

    Get PDF
    183 p.La Matriz de Predicados (Predicate Matrix en inglés) es un nuevo recurso léxico-semántico resultado de la integración de múltiples fuentes de conocimiento, entre las cuales se encuentran FrameNet, VerbNet, PropBank y WordNet. La Matriz de Predicados proporciona un léxico extenso y robusto que permite mejorar la interoperabilidad entre los recursos semánticos mencionados anteriormente. La creación de la Matriz de Predicados se basa en la integración de Semlink y nuevos mappings obtenidos utilizando métodos automáticos que enlazan el conocimiento semántico a nivel léxico y de roles. Asimismo, hemos ampliado la Predicate Matrix para cubrir los predicados nominales (inglés, español) y predicados en otros idiomas (castellano, catalán y vasco). Como resultado, la Matriz de predicados proporciona un léxico multilingüe que permite el análisis semántico interoperable en múltiples idiomas

    Preposition de in Spanish: From variation to deletion

    Get PDF
    Los procesos de lenición se han estudiado típicamente desde la perspectivasegmental; no obstante, pueden afectar a unidades mayores. Este es el caso de lapreposición de del español, que se reconoce que puede elidirse en un registrofamiliar y en determinadas construcciones sintácticas (habitualmentecomplementos del nombre), atendiendo a la bibliografía (Rigau, 1999; Suñer,1999; Estrada, 2016). No obstante, algunos autores han descrito la elisión comobastante general y fácilmente detectable en el habla de determinadas áreasgeográficas (Arjona, 1978, 1979; Sosa Alonso, 2003; Gómez, 2014). Aquí seefectúa una primera aproximación fonética y experimental a este fenómeno. Losresultados obtenidos apuntan a que se pueden presentar realizaciones fonéticasdiversas que se pueden organizar en un continuo de hiper a hipoarticulación. Laselección de una u otra no es completamente al azar, sino que está condicionadapor el contexto fonético precedente y la distancia al último acento. Tras vocal y siel último acento léxico recae en la penúltima sílaba a de (o incluso antes) sefavorece la producción de soluciones hipoarticuladas (la elisión entre ellas),mientras que tras pausa o consonante y en sílaba postónica suelen darse varianteshiperarticuladas. El valor sintáctico del constituyente introducido por lapreposición, en cambio, no parece influir en su mantenimiento o su pérdida.Although lenition processes have been traditionally analysed from a segmentalperspective, they can also affect whole lexical and functional units. This is the caseof the Spanish preposition de, which can be deleted in casual speech and in certainsyntactic constructions (e.g. noun complements) (see Rigau, 1999; Suñer, 1999;Estrada, 2016). Some authors have shown that de deletion is a very commonphenomenon, especially in certain geographical areas (see Arjona, 1978, 1979;Sosa Alonso, 2003; Gómez, 2014, as a few examples). Our aim in this paper is toanalyse the production of de in spontaneous speech in order to check whetherlenition is really affecting the preposition. We will approach the topic from aphonetic and experimental standpoint. The results demonstrate that the productionof de renders a lot of phonetic variation, which can be organized in a hyper tohypoarticulation continuum. Speakers seem to choose from the pool of variants according to (i) the preceding phonetic context and (ii) the distance from the lastlexical stress: they prefer hypoarticulated realizations (including deletion) after avowel and at least two syllables away from stress, whereas they tend to selecthyperarticulated realizations after a pause or a consonant and in a posttonicsyllable. The syntactic value of the prepositional phrase does not seem to conditionthe reduction of de

    Depuración algorítmica de vistas SQL

    Get PDF
    La falta de herramientas de depuración para lenguajes de acceso a bases de datos supone una limitación importante para el desarrollo de aplicaciones en términos de tiempo, obligando al programador a realizar la depuración mediante prueba‐error. La principal razón de esta falta de herramientas es que los depuradores habituales utilizados en otros paradigmas de programación, no son válidos en el caso de los lenguajes de las bases de datos relacionales, debido al alto nivel de abstracción de los mismos. La herramienta implementada para la consecución de este proyecto, trata de utilizar técnicas de depuración algorítmica para SQL, con el objetivo de detectar vistas erróneas en un sistema de múltiples vistas correlacionadas entre si. El sistema parte de un conjunto de vistas, que tras la ejecución de la vista principal han devuelto un resultado inesperado y construye internamente un árbol representando la dependencia jerárquica entre las diferentes vistas. Cada nodo del árbol representa una vista o una tabla y la relación entre ellos se representa mediante las aristas que las unen. Este árbol se recorre con el fin de localizar la causa del error. El usuario dispone de varias estrategias para llevar a cabo la depuración de las vistas. Él mismo clasifica los nodos como válidos o no válidos, repitiendo el proceso hasta encontrar el nodo crítico responsable del resultado erróneo del que partimos. [ABSTRACT] The lack of debugging tools for database access languages is an important limitation for the development or general systems in terms of time. This implies the programmer must perform the debugging process by trial and error. The main reason for this lack of tools is that the usual trace debuggers used in other paradigms are not available here due to the high abstraction level of the language. The implemented tool proposed in this project, uses algorithmic debugging techniques for SQL, with the goal of detecting erroneous views in a multiply correlated view system. 5 Therefore, the system starts with a set of views, such that the main view has returned an unexpected result. Then the debugger internally builds a tree that represents the hierarchical dependency between the different views. Each tree node represents a view or a table and the relation among the nodes is represented by the edges which join them. The system runs through the tree with the goal of locating the cause of the error. The user has several strategies to carry out the debugging of views. The nodes can be classified as valid or invalid, repeating the process until the critical node that is the main cause of the initial error is found

    Similitud entre documentos multilingües de carácter científico-técnico en un entorno Web

    Get PDF
    En este artículo se presenta un sistema para la agrupación multilingüe de documentos que tratan temas similares. Para la representación de los documentos se ha empleado el modelo de espacio vectorial, utilizando criterios lingüísticos para la selección de las palabras clave, la fórmula tf-idf para el cálculo de sus relevancias, y RSS feedback y wrappers para actualizar el repositorio. Respecto al tratamiento multilingüe se ha seguido una estrategia basada en diccionarios bilingües con desambiguación. Debido al carácter científico-técnico de los textos se han empleado diccionarios técnicos combinados con diccionarios de carácter general. Los resultados obtenidos han sido evaluados manualmente.In this paper we present a system to identify documents of similar content. To represent the documents we’ve used the vector space model using linguistic knowledge to choose keywords and tf-idf to calculate the relevancy. The documents repository is updated by RSS and HTML wrappers. As for the multilingual treatment we have used a strategy based in bilingual dictionaries. Due to the scientific-technical nature of the texts, the translation of the vector has been carried off by technical dictionaries combined with general dictionaries. The obtained results have been evaluated in order to estimate the precision of the system.Este trabajo está subvencionado por el Departamento de Industria del Gobierno Vasco (proyectos Dokusare SA-2005/00272, Dokusare SA-2006/00167)

    Cortesía atenuadora en el español coloquial

    Get PDF
    En el presente trabajo proponemos un modelo descriptivo útil para abordar el análisis pragmático de los rasgos melódicos con función cortés atenuadora en el español coloquial, a partir del análisis acústico de un corpus elaborado ad hoc y su sucesiva validación perceptiva cuyos resultados presentaremos. La investigación se sitúa dentro del proyecto «Fonocortesía: el componente fónico en la expresión de cortesía y descortesía verbales en español coloquial»

    Inhibición semántica acumulativa en la producción de verbos en español

    Get PDF
    This paper reports an experiment designed to assess the occurrence of lexical interference in verb production in Spanish. Using the semantic competitors paradigm (Howard et al., 2006), we show that the higher the number of verbs of the same category produced, the longer it takes to retrieve another verb of the same category in a picture naming task. According to our data, the production of a related verb delays the naming of a new member of the category by 20 ms., which means that, as is the case with nouns, semantically related verbs compete for selection. These results support the statement that, regardless their differences with respect to semantic representation and organization, verb and noun selection are guided by the same principles. Methodologically, our findings confirm that the paradigm is highly sensitive to semantic proximity effects, in terms of either categories or features. In light of these findings, we discuss the reasons why previous studies exploring semantic relatedness effects in verb production, most of them using the picture-word interference paradigm, have led to inconclusive and sometimes contradictory results.Este artículo presenta un experimento diseñado para evaluar la ocurrencia de interferencia léxica en la producción de verbos en español. Usando el paradigma de los competidores semánticos (HOWARD et al., 2006), mostramos que cuanto mayor es el número de verbos de la misma categoría producidos, más tiempo lleva recuperar otro verbo de la misma categoría en una tarea de denominación de imágenes. Según nuestros datos, la producción de un verbo relacionado retrasa la denominación de un nuevo miembro de la categoría en 20 ms, lo que significa que, como es el caso para los sustantivos, los verbos relacionados semánticamente compiten por la selección. Estos resultados respaldan la propuesta de que, independientemente de sus diferencias con respecto a la representación y organización semántica, la selección de verbos y sustantivos se rige por los mismos principios. Metodológicamente, nuestros hallazgos confirman que el paradigma es altamente sensible a los efectos de proximidad semántica, en términos de categorías o rasgos. A la luz de estos hallazgos, discutimos las razones por las cuales los estudios previos que exploraron los efectos de la relación semántica en la producción de verbos, la mayoría de ellos utilizando el paradigma de interferencia entre palabras y dibujos, han llevado a resultados no concluyentes y a veces contradictorios

    En torno a la polisemia y a la homonimia

    Get PDF
    Los llamados sinónimos son simples variantes combinatorias de un único signo. Por otra parte, no es posible hablar de polisemia y homonimia como si de dos fenómenos diferentes se tratara. En ambos casos sucede lo mismo: varios significados se manifiestan con idéntica secuencia fónica (significante), y constituyen signos distintos. Y aunque sólo ocasionalmente, gracias al contexto, esa coincidencia en la expresión puede originar ambigüedad en el habla, en la conversación espontánea.The so-called synonyms are simple combinatorial variants of a single sign. On the other hand, it is not possible to speak of polysemy and homonymy as if it were two different phenomena. In both cases the same thing happens: several meanings are manifested with identical tone sequence (significant), and constitute different signs. And although only occasionally, thanks to the context, that match in the expression can lead to ambiguity in the spoke, in the spontaneous conversation

    Primeras aproximaciones a la anotación lingüístico-ontológica de documentos de Web Semántica: OntoTag

    Full text link
    A instancias de lo que se ha dado en llamar la Web Semántica, la Inteligencia Artificial ha investigado exhaustivamente la anotación semántica de páginas web. La anotación (semántica) de textos se desarrolló primeramente en la Lingüística de Corpus; sin embargo, la Inteligencia Artificial, al centrarse en una anotación basada en ontologías, parece haber pasado por alto sus resultados. Este artículo muestra nuestras primeras experiencias en la integración de ambos campos, según las cuales una anotación híbrida (lingüística y ontológica) no sólo sería posible, sino también de gran utilidad, para hacer más comprensibles a un ordenador los documentos de la Web Semántica. Nuestro equipo de investigación está desarrollando OntoTag, un modelo de anotación multi-nivel (en principio, también multilingüe y de propósito general) basado en los estándares EAGLES y en la Semántica Ontológica, e implementado en lenguajes de marcado de última generación (RDF(S)/XML)

    Una mirada a un grupo de nombres de lugar de reciente creación en un municipio español: algunas semejanzas y diferencias con los topónimos antiguos

    Get PDF
    The present work is focused on toponyms of recent creation. These new place names have generally received less attention among scholars than those with a long history, which have often generated passionate debates and academic papers about their origins. The group analyzed here was discarded from the index list resulting from a toponymy survey made in the village of Gata (Cáceres) in 2014. They are less than one hundred years old, and do not appear to be registered as toponyms in any known written source. However, their analysis reveals that the necessity for a social community to give names to the places it inhabits, and the process for the creation of new toponyms has essentially not changed for centuries.El presente trabajo se centra en los topónimos de reciente creación. Este grupo ha recibido generalmente menos atención por parte de los investigadores que aquellos otros que cuentan con una historia más larga, los cuales han sido con frecuencia objeto de apasionados debates acerca de su origen y generado numerosos trabajos académicos. La nómina de los aquí analizados está formada por el grupo de los no tomados en consideración para formar porte del corpus topónimo de Gata (Cáceres) efectuado en 2014 por tener menos de un siglo de antigüedad y no aparecer en ninguna de las fuentes escritas consultadas. Sim embargo, su análisis revela que para una comunidad rural la necesidad de darle un nombre a los lugares de su entorno y el proceso de creación de nuevos topónimos no ha variado sustancialmente desde la antigüedad
    corecore