2,908 research outputs found

    Ontología y Procesamiento de Lenguaje Natural

    Get PDF
    At present, the convergence of several areas of knowledge has led to the design and implementation of ICT systems that support the integration of heterogeneous tools, such as artificial intelligence (AI), statistics and databases (BD), among others. Ontologies in computing are included in the world of AI and refer to formal representations of an area of knowledge or domain. The discipline that is in charge of the study and construction of tools to accelerate the process of creation of ontologies from the natural language is the ontological engineering. In this paper, we propose a knowledge management model based on the clinical histories of patients (HC) in Panama, based on information extraction (EI), natural language processing (PLN) and the development of a domain ontology.Keywords: Knowledge, information extraction, ontology, automatic population of ontologies, natural language processing

    Inducción de medidas de similitud utilizadas en tareas de procesamiento de lenguaje natural, mediante regresión simbólica

    Get PDF
    El procesamiento de lenguaje natural es un conjunto de tareas capaces de procesar el lenguaje oral y escrito mediante técnicas y métodos computacionales que permitan la manipulación de lenguajes naturales. Algunas de las tareas creadas para el procesamiento de lenguaje natural son: Recuperación de información, Detección de plagio, Desambiguación del sentido de las palabras, Generación automática de resúmenes, Detección de nombres de medicamentos confusos, Detección de palabras clave, Clasificación de tópicos, Clasificación de documentos, entre otras. A pesar de que el objetivo de las tareas del procesamiento de lenguaje natural es especifico para cada una de ellas, estas tareas comparten algunas características en común. Las características que comparten la mayoría de las tareas de procesamiento de lenguaje natural son: 1) Precisan una forma de representación de la información, 2) Requieren una función de similitud, 3) Necesitan un paradigma de evaluación. Estos tres elementos son de gran importancia al momento de desarrollar una aplicación de procesamiento de lenguaje natural, pero el elemento que más impacto tienen en su desarrollo es la función de similitud que se utiliza. Existe una gran cantidad de funciones de similitud que pueden ser aplicadas al procesamiento de lenguaje natural, y aunque estas funciones han demostrado generar buenos resultados, aún no existe una “mejor” función de similitud que genere resultados competitivos para todas las tareas de procesamiento de lenguaje. Existen investigaciones que tratan de resolver el problema de la “mejor” función de similitud, pero centrándose en generar una función de similitud especifica a cada aplicación de procesamiento de lenguaje natural. Una de las maneras de crear funciones de similitud especificas es a través de la inducción de los valores generados por funciones de similitud conocidas. A este proceso se le conoce como inducción de funciones de similitud. Existen diversos métodos de inducción, entre ellos análisis de regresión (técnica estadística), algoritmos genéticos, redes neuronales, regresión simbólica (técnicas computacionales), entre otras. Es esta tesis se propuso la aplicación de un método de inducción de funciones de similitud a través de regresión simbólica. El método propuesto genera funciones de similitud a través de la combinación inducida de valores de similitud generados por funciones conocidas. El método propuesto fue probado en dos tareas del procesamiento de lenguaje natural: detección de nombres de medicamentos confusos y desambiguación del sentido de las palabras. Los resultados del método propuesto aplicado a ambas tareas del procesamiento de lenguaje natural mencionadas generan buenas funciones de similitud, y los resultados al 7 evaluar las tareas con sus respectivos paradigmas de evaluación, muestran resultados superiores a otros métodos del estado del arte de dichas tareas. Los resultados finales de la evaluación de las tareas de procesamiento de lenguaje natural utilizando la función de similitud inducida por el método propuesto general resultados superiores a otros trabajos, por lo cual se comprueba la eficacia del método propuesto. El método propuesto está diseñado de tal forma que puede ser utilizado por diversas tareas del procesamiento de lenguaje natural, siempre y cuando estas cumplan con los tres componentes antes mencionados (una forma de representación de la información, función de similitud y paradigma de evaluación). En esta tesis se demuestra la aplicación del método a la detección de nombres de medicamentos confusos y desambiguación del sentido de las palabras, y se deja abierta la futura aplicación del método a otras tareas del procesamiento de lenguaje natural

    Procesamiento de lenguaje natural para estudiar completitud de requisitos

    Get PDF
    La Ingeniería de Software incluye el estudio inicial de los requisitos del sistema de software a desarrollar. A ello se dedican los Ingenieros de Requisitos, generando modelos que logren representar las necesidades de los clientes y usuarios y las soluciones a las mismas. El desarrollo de modelos de requisitos en lenguaje natural facilita la interacción entre todos los involucrados, aunque contribuye a generar ambigüedades. Por otro lado se ha comprobado la existencia de omisiones en una cantidad muy superior a la imaginada intuitivamente. Por su propia naturaleza, las omisiones son notoriamente elusivas. El desarrollo de un mismo modelo acerca del mismo problema por personas diferentes es la forma más eficaz para vislumbrar la magnitud de las omisiones en el dominio de la Ingeniería de Requisitos y posiblemente en muchas otras áreas. Para realizar estudios sobre la completitud de los modelos desarrollados, a fin de mejorar la calidad de los mismos, se ha propuesto la generación de una herramienta de software que permita comparar modelos escritos en lenguaje natural. Se propone que esta herramienta utilice recursos del Procesamiento del Lenguaje Natural.Eje: Ingeniería de SoftwareRed de Universidades con Carreras en Informátic

    Procesamiento de lenguaje natural para estudiar completitud de requisitos

    Get PDF
    La Ingeniería de Software incluye el estudio inicial de los requisitos del sistema de software a desarrollar. A ello se dedican los Ingenieros de Requisitos, generando modelos que logren representar las necesidades de los clientes y usuarios y las soluciones a las mismas. El desarrollo de modelos de requisitos en lenguaje natural facilita la interacción entre todos los involucrados, aunque contribuye a generar ambigüedades. Por otro lado se ha comprobado la existencia de omisiones en una cantidad muy superior a la imaginada intuitivamente. Por su propia naturaleza, las omisiones son notoriamente elusivas. El desarrollo de un mismo modelo acerca del mismo problema por personas diferentes es la forma más eficaz para vislumbrar la magnitud de las omisiones en el dominio de la Ingeniería de Requisitos y posiblemente en muchas otras áreas. Para realizar estudios sobre la completitud de los modelos desarrollados, a fin de mejorar la calidad de los mismos, se ha propuesto la generación de una herramienta de software que permita comparar modelos escritos en lenguaje natural. Se propone que esta herramienta utilice recursos del Procesamiento del Lenguaje Natural.Eje: Ingeniería de SoftwareRed de Universidades con Carreras en Informátic

    Procesamiento de lenguaje natural para estudiar completitud de requisitos

    Get PDF
    La Ingeniería de Software incluye el estudio inicial de los requisitos del sistema de software a desarrollar. A ello se dedican los Ingenieros de Requisitos, generando modelos que logren representar las necesidades de los clientes y usuarios y las soluciones a las mismas. El desarrollo de modelos de requisitos en lenguaje natural facilita la interacción entre todos los involucrados, aunque contribuye a generar ambigüedades. Por otro lado se ha comprobado la existencia de omisiones en una cantidad muy superior a la imaginada intuitivamente. Por su propia naturaleza, las omisiones son notoriamente elusivas. El desarrollo de un mismo modelo acerca del mismo problema por personas diferentes es la forma más eficaz para vislumbrar la magnitud de las omisiones en el dominio de la Ingeniería de Requisitos y posiblemente en muchas otras áreas. Para realizar estudios sobre la completitud de los modelos desarrollados, a fin de mejorar la calidad de los mismos, se ha propuesto la generación de una herramienta de software que permita comparar modelos escritos en lenguaje natural. Se propone que esta herramienta utilice recursos del Procesamiento del Lenguaje Natural.Eje: Ingeniería de SoftwareRed de Universidades con Carreras en Informátic

    Recuperación de información, procesamiento de lenguaje natural y web semántica

    Get PDF
    UNO DE LOS TÉRMINOS MÁS UTILIZADOS cuando nos referimos a la Web es Web semántica. “Como si de Harry Potter se tratara, todo experto en internet que se precie, debe conocer estas dos palabras mágicas símbolo del futuro de una internet más ordenada, más organizada, más catalogada, en definitiva más bibliotecaria” (Eva Méndez)

    Aplicación del procesamiento de lenguaje natural para verificación de identidad

    Get PDF
    RESUMEN : Las empresas utilizan la verificación de identidad para garantizar que los usuarios y los clientes proporcionen información asociada con la identidad de una persona real. En un ámbito académico, de igual forma, es relevante controlar que la información que los estudiantes dan es verídica y que los procesos que se realizan en las instituciones (tales como trabajos, exámenes, exposiciones, entre otras) sean realizados por aquellas personas que realmente están matriculadas, esto con el fin de controlar el fraude. La verificación de identidad mitiga el riesgo de fraude mediante diferentes estrategias, entre las cuales, las más exitosas son las basadas en biometría. En Colombia, según datos recientes publicados por el ministerio de Educación Nacional, la educación virtual muestra una tasa de crecimiento de 98,9% en el número de matrículas de educación superior, lo cual indica que, en varias instituciones, como por ejemplo, en la Universidad de Antioquia, hay gran cantidad de estudiantes en la modalidad virtual. A pesar de todos los grandes beneficios de la modalidad virtual de educación, esta trae consigo diversos problemas, entre ellos, suplantación de identidad y fraude en actividades evaluativas. Para resolver estos problemas, en este trabajo se propone desarrollar, mediante el procesamiento de lenguaje natural y algoritmos de aprendizaje automático, una metodología que permita verificar a que grupo de estilo lingüístico de escritura (existirán 3 grupos) pertenecen más de 100 usuarios pertenecientes a la comunidad universitaria, los cuales se registraron en una plataforma virtual y realizaron dos tareas que consisten en argumentar una solución a problemas que está sufriendo el país actualmente y dar una opinión sobre un tema social. Los resultados muestran, a pesar de la poca cantidad de datos y la calidad de los textos, que es posible encontrar diferencias entre estilos de escritura de los usuarios de acuerdo con su nivel escolar, obteniendo resultados de eficiencia en clasificación biclase (niveles inferiores vs niveles superiores) de hasta 75% y ciencia en la clasificación triclase (niveles inferiores vs niveles intermedios vs niveles superiores) de hasta 53.3 %. Otro resultado obtenido muestra que, mediante modelos de mezclas Gaussianas, se logra identificar, de una manera muy certera, los usuarios pertenecientes al grupo de usuarios de niveles de escolaridad intermedios y superiores, y diferenciarlos de usuarios con niveles bajos de escolaridad

    Editor de gramáticas relajadas para el procesamiento de lenguaje natural

    Get PDF
    La expansión de las nuevas tecnologías incrementa la necesidad de mejorar las interfaces de comunicación entre humanos y ordenadores. Una de las mejoras más perseguidas es conseguir esta interacción sin que las personas tengan que adquirir previamente conocimientos específicos o realizar un aprendizaje técnico antes de manejar cualquier ordenador o programa informático. La interacción natural está enfocada a imitar el comportamiento de la interacción entre humanos. Con el fin de imitar el comportamiento humano es necesario estudiarlo previamente y extraer el conocimiento a partir de la comunicación entre dos personas. Este conocimiento extraído debe formalizarse de algún modo para que el sistema de interacción sea capaz de utilizarlo. Es necesario distribuir todo el conocimiento que se obtiene de las interacciones en distintos modelos de conocimiento, cada uno de ellos especializado en un aspecto concreto de la interacción. Suelen clasificarse en función de la naturaleza de su conocimiento o el dominio al que hacen referencia y forman parte de la arquitectura cognitiva de un sistema de interacción natural.Ingeniería en Informátic

    Aplicaciones de procesamiento de lenguaje natural y Ciencia de Datos

    Get PDF
    Cada día se generan grandes cantidades de datos de diversos tipos y vinculadas a diversas áreas de conocimiento (textos, imágenes, audios, videos, entre otros). La posibilidad de analizar estos enormes volúmenes de datos permite generar conocimiento que sirva como fundamento para la toma de decisiones en ámbitos tan diversos como la salud, la administración de distintos recursos, el deporte, las actividades turísticas, entre otros. En este contexto resultan de gran utilidad los modelos desarrollados en áreas de conocimiento como la Ciencia de Datos, el Aprendizaje Automático, la Minería de Textos por citar algunas. En el ámbito de análisis automático de textos (para aplicaciones de análisis de sentimientos, minería de opinión, entre otras) la mayoría de los algoritmos, herramientas y recursos disponibles han sido desarrollados para el idioma inglés por lo que no pueden aplicarse a textos escritos en idioma español. En este artículo se presentan soluciones desarrolladas en el proyecto Descubrimiento de Conocimiento en Bases de Datos, basadas en aplicación de técnicas de Procesamiento de Lenguaje Natural y Ciencia de Datos. En particular, se presentan aplicaciones web para seguimiento de la evolución de casos de Dengue y COVID-19 en Argentina, otra aplicación que presenta una aplicación de Topic Modelling a noticias en lenguaje español, otro caso de aplicación de Análisis de Sentimientos a entidades vinculadas al turismo y finalmente un caso de generación de estadísticas avanzadas a partir del procesamiento de conjuntos de datos históricos de básquet.Red de Universidades con Carreras en Informátic
    corecore