870 research outputs found

    Modelo computacional de lectura cognitiva para la representación automática de textos

    Get PDF
    El modelado del lenguaje natural en los ordenadores conlleva ciertas restricciones debido a la estructura lógica y a las limitaciones de tiempo y espacio de las máquinas, además de la complejidad intrínseca del lenguaje. Uno de los mayores problemas de dicho modelado es la representación de la semántica. Los primeros modelos conexionistas del lenguaje se situaban próximos a la cognición humana pero no eran lo suficientemente generales y eficientes para aplicaciones reales. Estos primeros sistemas de procesamiento de lenguaje natural hacían uso de redes de asociación como formalismo de representación. Debido a las limitaciones de almacenamiento y procesamiento de los ordenadores de aquella época, y al crecimiento de la información textual almacenada electrónicamente, los sistemas de procesamiento del lenguaje adoptaron formalismos matemáticos y estadísticos. Hoy en día, a causa de esa cantidad creciente de información textual los sistemas que son capaces de procesar textos son de extrema utilidad. Hasta hace r lativamente poco tiempo, la mayoría de estos sistemas utilizaban la clásica representación de los textos como “bolsa de palabras”, un formalismo de tipo vectorial que sólo tiene en cuenta las apariciones de las palabras de manera independiente. A mediados de los noventa, surgen los hiperespacios de palabras como un formalismo de representación alternativo al de “bolsa de palabras” tradicional. LSA (Análisis de Semántica Latente) fue el precursor de todos ellos, seguido por HAL (Hiperespacio Análogo al Lenguaje), PMI-IR, Indexado Aleatorio, WAS (Espacio de Asociación de Palabras) o ICAN (Construcción Incremental de una Red Asociativa), entre otros. Este tipo de sistemas construyen una representación en forma de matriz del conocimiento semántico lingüístico almacenado en una colección de textos dada. Este hiperespacio tiene en cuenta las relaciones entre las palabras y el contexto sintáctico y semántico en el que aparecen. Sin embargo, estos sistemas también representan los textos como vectores, llevando a cabo peraciones con las filas y las columnas de la matriz correspondientes a las palabras de los documentos. Aunque la representación mediante hiperespacios contiene mucha más información que la representación tradicional, puesto que los valores de los vectores son el resultado de la interacción entre las palabras y el contexto, los textos siguen siendo presentados como un conjunto de números sin estructura. A pesar de ello, los sistemas basados en hiperespacios han aportado una mejora significativa con respecto a los sistemas basados en la representación clásica. De los sistemas anteriormente mencionados, sólo ICAN introduce una representación estructural, almacenando el conocimiento en forma de red contextual asociativa de palabras y no como una matriz. Este modelo, a diferencia del resto de sistemas mencionados, hace posible la actualización del conocimiento sin necesidad de la reconstrucción total del mismo. A pesar del progreso realizado utilizando los hiperespacios de palabras, los seres humanos continúan r alizando tareas de procesamiento de lenguaje natural, como la clasificación de textos o la recuperación de información, de manera mucho más precisa que los ordenadores aunque, por supuesto, más despacio. Es difícil concebir el conocimiento lingüístico representado como una matriz en el cerebro humano, así como que la lectura suponga realizar operaciones matemáticas sobre dicha matriz. La lectura es un proceso secuencial de percepción en el tiempo, durante el cual los mecanismos mentales construyen imágenes e inferencias que se van reforzando, actualizando o descartando hasta la conclusión de la lectura del texto, momento en el que la imagen mental generada permite a los seres humanos resumir o clasificar el texto, recuperar documentos similares o simplemente expresar opiniones sobre el mismo. Esta es la filosofía que subyace en el sistema presentado en esta tesis. Este sistema, denominado SILC (Sistema de Indexación por Lectura Cognitiva), está ligeramente inspirado en el formalismo que sugiere el sistema ICA . Lo que se propone en este trabajo de tesis doctoral es un modelo computacional de lectura que construye una representación de la semántica de un texto como resultado de un proceso en el tiempo. Dicha representación posee una estructura que posibilita la descripción de las relaciones entre los conceptos leídos y su nivel de significación en cada momento del proceso de lectura. Existen otros modelos computacionales de lectura cuyo objetivo es más teórico que aplicado. La mayoría de ellos parten del modelo conexionista de Construcción-Integración y se centran en diferentes fases u objetivos de la lectura. Todos estos sistemas ponen de manifiesto la gran variedad y complejidad de los procesos cognitivos implicados en la lectura. El modelo propuesto en esta tesis, SILC, es un método sencillo que incluye sólo algunos de dichos procesos cognitivos y, aunque trata de ser útil en aplicaciones prácticas, está inspirado en los seres humanos tratando de asemejarse más a su proceder que el resto de sistemas del mismo ca po de aplicación. El modelo que implementa SILC intenta simular, en parte, procesos cognitivos de alto nivel que operan en el tiempo. Primero, el sistema construye una red de asociación conceptual como una memoria lingüística base a partir de una colección de textos que representan el espacio de conocimiento semántico. A continuación, el modelo genera representaciones de los textos de entrada como redes de conceptos con niveles de activación, que recogen el nivel de significación semántica de los mismos. Para ello, el modelo utiliza el conocimiento semántico lingüístico previamente construido realizando inferencias sobre el mismo mediante la propagación por la red de la activación de los conceptos leídos en orden secuencial. La representación generada se usa posteriormente para indexar documentos con el fin de clasificarlos automáticamente. Los métodos de indexación tradicionales representan los textos como resultado de procesos matemáticos. Puesto que los seres humanos superan ampliamente a los ordenadores e tareas de procesamiento de lenguaje natural, el modelo de SILC se inspira en la cognición humana para mejorar su eficacia en dichas tareas. Se han realizado experimentos para comparar el modelo con sujetos humanos, tanto durante la lectura, mediante la predicción o inferencia de conceptos, como al final de la misma, mediante la comparación con resúmenes generados por los sujetos. Los resultados muestran que el sistema es adecuado para modelar de manera aproximada el proceder humano en la lectura y sustentan la hipótesis de partida de SILC: cuanto más se asemeje el sistema a los seres humanos, mejor realizará las tareas prácticas del lenguaje. Los resultados también demuestran que el sistema es adecuado como marco experimental de validación de hipótesis relacionadas con aspectos cognitivos de la lectura. Otros experimentos de aplicación práctica han mostrado que, una vez que los parámetros del modelo han sido optimizados, la representación generada obtiene mejores resultados en clasificación de textos que otr representaciones generadas por los sistemas existentes. Se han definido tres medidas de similitud semántica entre textos a partir de las representaciones generadas por SILC. Los resultados experimentales muestran que la mejor de ellas es más eficaz y eficiente que otras medidas de similitud existentes. Además, la sinergia de dicha medida con el modelo de lectura implementado hace a SILC apropiado para su aplicación a tareas reales de procesamiento de lenguaje natural

    Bibliografía seleccionada y comentada sobre la metáfora

    Get PDF
    A lo largo de las últimas décadas el interés por el estudio de la metáfora ha experimentado un impulso tanto cuantitativo como cualitativo. En la actualidad contamos no solamente con estudios sobre la metáfora de índole retórica o filosófica, sino igualmente con investigaciones procedentes de la psicología, la antropología, la medicina, la ciencia cognitiva, la economía, la biología, etc. Y no ha sido menor la proliferación de análisis lingüísticos realizados desde diferentes enfoques, corrientes o disciplinas, debiendo mencionarse por derecho propio en este sentido la lingüística cognitiva. En esta bibliografía se seleccionan y comentan 125 referencias que reflejan el dinamismo y la amplitud de miras del estudio reciente de la metáfora

    Comparativa entre herramientas MDD enfocada en la versatilidad del lenguaje con respecto a la implementación de requerimientos. Caso práctico Integranova WebRatio

    Full text link
    Within the analysis and development of software, it has been considered a fundamental aspect the implementation of standards that allow us to implement, design and integrate different elements for an application to meet or be framed within different characteristics. The requirements of users have become over time in real challenges to be met by software developers and has sought the need to lower costs with the goal of mass production of content. For this reason, that has been penetrated in new technologies that handle this type of paradigms with the objective of optimizing the necessary resources for the implementation of technological projects, we have found tools such as Integranova, WebRatio, Genexus, that have adopted the paradigm or part of it, offering an agile development alternative in an increasingly competitive market. The objective of the present research is to analyze and to make a comparative between two tools based on a Model-Driven paradigm and to determine which of the two is more convenient for the use by the characteristics that it possesses, as well as by that well it complies the parameters to be considered a Model-Based tool. In the present study the comparison between two tools will be carried out in a given scenario, through the same one it is proposed to analyze the advantages and disadvantages that each tool has in the development of the different requirements of the initial problem. It will evaluate the versatility of the tool and the facilities that they present to the users for their correct implementation and likewise will evaluate the capacity of assimilation of the tool as the basis of a factor of productivity applied to a real field. There will be different regulations to satisfy based on the definition of the model Entity-Relationship, services, transactions, roles and user permissions, etc. We will evaluate how these requirements are handled in both tools, as well as the final product obtained with each of them.Dentro del análisis y desarrollo de software, se ha considerado un aspecto fundamental la implementación de estándares que nos permitan implementar, diseñar e integrar diferentes elementos para que una aplicación cumpla o se encuentre enmarcada dentro de diferentes características. Los requerimientos de los usuarios se han convertido con el pasar del tiempo en verdaderos retos a cumplir por parte de los desarrolladores de software y se ha buscado la necesidad de abaratar costos con el objetivo de masificar la producción de contenidos. Es por esta razón, que se ha incursionado en nuevas tecnologías que manejan este tipo de paradigmas con el objetivo de optimizar los recursos necesarios para implementación de proyectos tecnológicos, se han encontrado herramientas como Integranova, WebRatio, Genexus¿, que han adoptado el paradigma o parte de él, ofreciendo una alternativa de desarrollo ágil en un mercado cada vez más competitivo. El objetivo de la presente trabajo es analizar y realizar una comparativa entre dos herramientas basadas en un paradigma model-driven y determinar cuál de las dos es más conveniente para su uso por las características que posea, así como también por que tan bien cumpla los parámetros para ser considerada una herramienta basada en modelos. En el presente estudio se realizará la comparativa entre dos herramientas en un escenario determinado, mediante el mismo se plantea analizar las ventajas y desventajas que posee cada herramienta en el desarrollo de los diferentes requisitos del problema inicial. Se evaluará la versatilidad de la herramienta y las facilidades que presentan a los usuarios para su correcta implementación y de igual manera se evaluará la capacidad de asimilación de la herramienta como la base de un factor de productividad aplicada a un campo real. Habrá diferentes normativas que satisfacer partiendo de la definición del modelo entidad ¿ relación, servicios, transacciones, roles y permisos de usuario, etc. Se evaluarán como se manejan estos requisitos en ambas herramientas, así como el producto final obtenido con cada una de ellas.Pineda Álvarez, DF. (2017). Comparativa entre herramientas MDD enfocada en la versatilidad del lenguaje con respecto a la implementación de requerimientos. Caso práctico Integranova WebRatio. http://hdl.handle.net/10251/90237TFG

    Hipervinculación de documentos con Máquinas de Soporte Vectorial

    Get PDF
    En la actualidad el acceso a la información se da por medio de hipervínculos, los cuales interconectan los textos entre si únicamente si contienen una relación. Varios investigadores han estudiado la forma en que los humanos crean los hipervínculos y han tratado de replicar el modo de trabajo específicamente de la colección de Wikipedia. El uso de hipervínculos se ha pensado como un prometedor recurso para la recuperación de información, que fue inspirado por el análisis de citas de la literatura (Merlino-Santesteban, 2003). Según Dreyfus (Dreyfus, 2003) la hipervinculación no tiene ningún criterio específico, ni tampoco jerarquías. Por ello cuando todo puede vincularse indiscriminadamente y sin obedecer un propósito o significado en particular, el tamaño de la red y la arbitrariedad entre sus hipervínculos, hacen extremadamente difícil para un usuario encontrar exactamente el tipo de información que busca. En las organizaciones, la familiaridad y la confianza durante mucho tiempo han sido identificadas como las dimensiones de credibilidad de la fuente de información en publicidad (Eric Haley, 1996). Un hipervínculo, como una forma de información, puede, por lo tanto, tener un mayor impacto cuando se presenta por un objetivo conocido (Stewart & Zhang, 2003). Mientras tanto, los hipervínculos entre los sitios web pueden generan confianza en el remitente y el receptor del enlace, por lo que estas interacciones tienen efectos positivos de reputación para el destinatario (Stewart, 2006) (Lee, Lee, & Hwang, 2014). El estudio de documentos por medio de los hipervínculos es un área importante de investigación en minería de datos, en una red social a menudo lleva una gran cantidad de información estructural formada por los hipervínculos creando nodos compartidos dentro de la comunidad. Algunas importantes aplicaciones de los métodos de minería de datos para redes sociales son la recomendación social mediante las experiencias similares de los usuarios (Alhajj & Rokne, 2014). En marketing y publicidad se aprovechan las cascadas en las redes sociales y se obtienen beneficios sobre modelos de propagación de la información (Domingos & Richardson, 2001). Las empresas de publicidad están interesados en cuantificar el valor de un solo nodo en la red, tomando en cuenta que sus acciones pueden desencadenar cascadas a sus nodos vecinos. Los resultados de (Allan, 1997) (Bellot et al., 2013) (Agosti, Crestani, & Melucci, 1997) (Blustein, Webber, & Tague-Sutcliffe, 1997) sugieren que el descubrimiento de hipervínculos automatizado no es un problema resuelto y que cualquier evaluación de los sistemas de descubrimiento de Hipervínculos de Wikipedia debe basarse en la evaluación manual, no en los hipervínculos existentes

    Comprensión y generación de lenguaje natural en un sistema de diálogo usando inteligencia artificial para servicios telefónicos de información de cines

    Get PDF
    El presente documento es resultado de la investigación sobre automatización inteligente - comprensión y generación de lenguaje natural- en un Sistema de Diálogo, para optimar el servicio de atención al cliente actualmente brindado por un operador vía telefónica.Tesi

    Análisis de los comentarios en español de usuarios de Facebook para la clasificación de publicaciones utilizando técnicas inteligentes 

    Get PDF
    Actualmente, la interacción de las personas mediante redes sociales está crecimiento exponencialmente. Motivo por el cual se optó elegir una de ellas, como nuestra fuente de información, y a partir de la misma poder captar las espontáneas manifestaciones de sentimientos por parte de los usuarios. Los datos en cuestión fueron transformados, utilizando diversas técnicas de Procesamiento del Lenguaje Natural. Posteriormente se realizó el entrenamiento de algoritmos de Machine Learning, con el fin de ser utilizado para el Análisis de Sentimiento, llevando a cabo un estudio comparativo respecto de la performance de los mismos.Facultad de Informátic

    Análisis de los comentarios en español de usuarios de Facebook para la clasificación de publicaciones utilizando técnicas inteligentes 

    Get PDF
    Actualmente, la interacción de las personas mediante redes sociales está crecimiento exponencialmente. Motivo por el cual se optó elegir una de ellas, como nuestra fuente de información, y a partir de la misma poder captar las espontáneas manifestaciones de sentimientos por parte de los usuarios. Los datos en cuestión fueron transformados, utilizando diversas técnicas de Procesamiento del Lenguaje Natural. Posteriormente se realizó el entrenamiento de algoritmos de Machine Learning, con el fin de ser utilizado para el Análisis de Sentimiento, llevando a cabo un estudio comparativo respecto de la performance de los mismos.Facultad de Informátic

    Las humanidades digitales como expresión y estudio del patrimonio digital

    Get PDF
    Las Humanidades Digitales son, sin más, las Humanidades de hoy. E l quehacer humanista ha devenido en labor interdisciplinar, multidisciplinar y pluridisciplinar. Profundizando en esta idea, reconocemos que la base de este nuevo medio y canal se sustenta, en gran medida, en la existencia del hipertexto, podríamos afirmar que la labor del humanista del siglo XXI es hiperdisciplinar, tomando prestado el prefijo del griego clásico ὑπέρ —híper— con el significado de ‘por encima de’, ‘más allá de’. Aceptamos, así, desde este punto de vista que cualquier trabajo de y en Humanidades va más allá de lo que tradicionalmente se ha considerado nuestra disciplina, y que se actualiza a través del diálogo entre lo científico y tecnológico y lo humanístico, como si existiera, en realidad, algo más humano que la propia técnica, τέχνη, que no es otra cosa que la habilidad para realizar un oficio. El nuestro, de este modo, bien podría ser el de tecnohumanistas, pero no por la necesidad de salvar lo que un día fue nuestro trabajo y que parece que se desdibuja hoy entre los dominios de la digitalización, sino por continuar con lo que siempre ha sido, que no es sino la materialización de la suma de las tres categorías del pensamiento humano que dibujó Aristóteles: ἐπιστήμη, epistḗmē, o conocimiento científico; δόξα, dóxa, u opinión, y τέχνη, téchne, o técnica. No cabe duda de que conocimiento científico, opinión y uso de la técnica son, y siempre lo han sido, el sujeto y el objeto de nuestra labor

    Modelo de servicio semántico de difusión selectiva de información (DSI) para bibliotecas digitales

    Get PDF
    We present the theoretical and methodological foundations for the development of a multi-agent SDI service model for specialized digital libraries, applying semantic web technologies that permit more efficient information management, improving agent-user communication processes and facilitating accurate access to relevant resources. To do this, rss feeds are used as "current awareness bulletins" to generate personalized bibliographic alerts. The SDI service model has an rss feeds management module and an information push module. In the first module, resources are represented as rss feed items and are also semi-automatically assigned subject terms by matching their associated keywords against the terms of a SKOS Core format thesaurus. In the information push module, bibliographic alerts are customized according to the preferences defined on users' profiles
    corecore