79 research outputs found

    Extracción de información en informes médicos

    Get PDF
    El acceso a la información contenida dentro de un informe médico es vital tanto para la investigación como para el tratamiento de los pacientes. Sin embargo, la información relevante suele estar escrita en lenguaje natural, por lo su procesamiento automático no es una tarea trivial. Con este objetivo en mente, hemos desarrollado un sistema capaz de obtener un archivo que represente el contenido más relevante de un informe clínico. Como parte de esta representación se deberán detectar aquellos conceptos médicos pertenecientes a una de las ontologías más utilizadas en este ámbito, UMLS. Además previamente se realizará un proceso automático de corrección ortográfica, expansión de acrónimos y detección de frases afirmadas, negadas y especuladas. Todo esto en dos de los idiomas más hablados a nivel mundial: español e inglés. Esta representación permitirá a su vez desarrollar aplicaciones que la utilicen, por lo que se ha implementado también un buscador de informes médicos como ejemplo de ello. Por último, como parte de este trabajo, también se incluye todo el proceso seguido durante nuestra participación en el Conference and Labs of the Evaluation Forum del año 2013, una de las organizaciones más conocidas a nivel internacional en el campo de la recuperación de información, así como el artículo científico desarrollado para la misma. [ABSTRACT] The information inside a medial report it’s very important for researchers and for the patient. But this information is usually written in natural language, so automatic processing isn’t a trivial task. With this target in mind, we developed a system that is able to generate a representation which contains the most relevant information in a medical report. It detects medical concepts from one of most popular biomedical ontologies, UMLS. Previously will also perform a spelling correction, acronym expansion and affirmed, negated and speculated sentences detection. All this process could be executed into the two most spoken languages in the world, English and Spanish. The representation will allow us to develop applications that use it. In fact it’s been including a searcher for medical reports to show an example of what can be done with our software. Finally, as part of this work, we explain our experience in our participation into the Conference and Labs of the Evaluation Forum 2013, a self-organized body whose is wellknown in the international IR community, and the paper generate for it

    Ontología de la Guerra Civil española

    Get PDF
    En el contexto del crecimiento exponencial del conocimiento humano, estrechamente relacionado con el desarrollo de la sociedad de la información, Internet ha resultado ser una herramienta clave para crear y compartir conocimiento. Gracias a Internet, se hace posible a acceder a una gran cantidad de información permanentemente actualizada. Desde el punto de vista del usuario, esto es posible por el desarrollo de herramientas tecnológicas especializadas y al creciente papel del usuario como fuente de información, todo ello en el contexto de la web 2.0. Sin embargo, a menudo esta información resulta desorganizada, desestructurada y de escasa fiabilidad, por lo que el usuario no puede satisfacer sus necesidades de información. Para solventar estas dificultades, en estos momentos estamos asistiendo a la creación de la web semántica, que es una visión de la web que se caracteriza por hacer posible que las máquinas comprendan el conocimiento humano, permitiendo una recuperación de información mucho más exacta, personalizada y adaptada a los requerimientos de los usuarios. Esta visión de la Red es posible gracias a la adición de metadatos semánticos a Internet y a la aplicación de sistemas de representación de conocimiento especializadas según el dominio y el contexto del conocimiento representado. Entre estas herramientas destacan las ontologías, que pueden definirse como una especificación formal y explícita de un conocimiento compartido. Gracias a las ontologías, es posible representar el conocimiento existente de un dominio de manera formal y comprensible, en consonancia con los principios de la web semántica. Teniendo en cuenta estos aspectos, es posible el desarrollo de ontologías especializadas que, creadas según los principios y las herramientas tecnológicas de la web semántica, sirvan para ofrecer un conocimiento contextualizado a los usuarios de Internet..

    Análisis del uso de la inteligencia colaborativa como herramienta para la construcción de bases de conocimiento consensuadas en procesos de diagnóstico médico

    Get PDF
    En la presente tesis se presenta un estudio que gira entorno principalmente a la Inteligencia Colaborativa como principal característica de las aplicaciones de tipo Social Media y Web 2.0. Estos conceptos han sido combinados con áreas de estudio como la medicina, las tecnologías de Web semántica y los sistemas de soporte a la decisión médica (CDSS), con el objetivo de conocer la forma en cómo la Inteligencia Colaborativa logra afectar de manera positiva a la obtención de diagnósticos. Las redes sociales en esta investigación, han sido identificadas como estructuras sociales conformadas por un grupo de personas cuyo objetivo principal es la participación en actividades comunes, la mayoría de las veces en busca de la solución a problemas. Este fenómeno de participación, compartición de información y colaboración ha sido tomado como base para la creación de redes sociales y demás plataformas colaborativas en Internet, en donde lo que destaca nuevamente es la arquitectura de participación de la que hacen uso. Un caso especial y que ha sido objeto de estudio de esta investigación son aquellas plataformas colaborativas con contenido médico. La Web semántica ha jugado un papel fundamental en este estudio ya que permite la comunicación entre diferentes sistemas para compartir información, es decir, la interoperabilidad entre sistemas. También facilita la representación del conocimiento en diferentes áreas y finalmente también permite realizar procesos de inferencia cuando se aplica a sistemas expertos. Con base en los conceptos anteriores y respaldada en el concepto de Wisdom of the crowd (la sabiduría de las multitudes), esta investigación plantea la definición de tres métodos de consenso que han sido aplicados a bases de conocimiento con contenido médico. Para la evaluación de los resultados se han utilizado las métricas comunes a los CDSS siguiendo los criterios propuestos por Kaplan en las diferentes bases de conocimiento consensuadas, las cuales se han comparado con los valores en las mismas métricas generadas por un CDSS tradicional que ha sido tomado como estándar de oro. Finalmente, esta tesis presenta las mejoras que la Inteligencia Colaborativa aporta a la medicina en términos de exactitud de los diagnósticos y las ventajas que esta representa cuando se aplica a estos sistemas. -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------In this thesis a study that primarily revolves around the main characteristic Collaborative Intelligence of Social Media type applications and Web 2.0 is presented. These concepts have been combined with areas of study such as medicine, Semantic Web technologies and Clinical Decision Support Systems (CDSS) with the aim to know the way how the Collaborative Intelligence does positively affect the development of diagnostics. In this research, social networks have been identified as social structures formed by a group of people whose main objective is the participation in common activities, most of the time looking for the solution of problems. This participation, collaboration an information sharing phenomenon has been taken as the basis for social networking and other online collaborative platforms, where it is again highlighting the participation architecture that those systems use. A special case has been studied in this research are those with medical content collaborative platforms. The Semantic Web has played a key role in this study because it allows communication between different systems to share information, ie interoperability between systems. It also facilitates knowledge representation in different areas and finally also allows inference processes when it is applied to expert systems. Based on the above concepts and supported by the concept of Wisdom of the crowd, this research presents the definition of three consensus methods that has been applied to knowledge bases with medical content. For evaluating the results common metrics to CDSS were used following the criteria proposed by Kaplan in the different consensus knowledge bases. The results have been compared with the same metrics values generated by a traditional CDDS which is taken as the gold standard. Finally, this thesis presents the improvements that the Collaborative Intelligence brings to medicine in terms of diagnostic accuracy and the advantages that this represents when applied to this kind of systems

    Implementación de un software para búsqueda de publicaciones científicas en bases de datos estructuradas mediante datos enlazados

    Get PDF
    En la actualidad, la información es uno de los activos más importantes tanto en niveles personales, educativos y organizacionales. La información permite el desarrollo y el avance de los estados del conocimiento. Desde la aparición del Internet y su exponencial evolución, el acceso a la información se ha vuelto universal y su cantidad disponible sigue aumentando considerablemente. Para las organizaciones es muy valioso el resguardo y uso de la información ya que, de esta administración depende su capacidad para seguir creciendo y obteniendo valor dentro de sus respectivos campos de acción. Del mismo modo, para una persona el obtener información importante es adquirir conocimientos que serán relevantes para la consecución de sus objetivos planteados. En cualquiera de los ámbitos el uso de la información permite la formulación y la ejecución de los planes estratégicos. Sin embargo, el encontrar aquella información que realmente se necesita se ha vuelto una tarea cada vez más complicada. En el campo de la investigación científica la recopilación de fuentes de información representa el punto de partida. Trasladando esta necesidad al contexto peruano, se observa que la producción científica está en aumento y en un ritmo acorde al crecimiento de otras naciones. Sin embargo, actualmente resulta complicado para los investigadores el obtener la información relevante para iniciar sus investigaciones con la certeza de que no existen investigaciones previas o que abarquen el mismo campo de estudio. Para lograr una buena recopilación se debe navegar entre los distintos repositorios digitales existentes que son de libre acceso o incluso pagados. En tal sentido, existe una solución conocida como Datos Enlazados, un enfoque que no se contrapone a la web actual que permite el vínculo entre páginas web (documentos HTML), pero sí lo complementa ya que permite la vinculación de datos entre distintos contextos y fuentes de información. El presente trabajo de fin de carrera propone una alternativa de solución para la búsqueda integral y automatizada en distintos repositorios digitales que son de libre acceso y cuyas bases de datos están estructuradas mediante Datos Enlazados. Se implementó un método de búsqueda adaptativo en base a las ontologías que manejan los distintos repositorios digitales (datasets). De tal manera, se obtiene una ontología de dominio adaptable que permite la extracción de datos relevantes de cada repositorio, para su posterior reestructuración y su visualización. Para lograr la ontología dinámica se implementó un algoritmo adaptador que analiza el vocabulario ontológico del dataset e identifica las entidades relevantes para el dominio de investigaciones y publicaciones. Luego, se implementaron métodos de extracción con funciones en SPARQL que dependen de la ontología y finalmente, los datos relevantes son guardados en grafos RDF para luego ser serializados en documentos RDF/XML y Turtle. Se concluye que el proyecto ha sido exitoso en cuanto que el software permite realizar la búsqueda de publicaciones de distintos autores peruanos que tienen indexados sus documentos en repositorios digitales como DBLP o IEEE Library Project, contribuyendo de esta manera a la búsqueda integral de información.Tesi

    APO : aplicación para la población de ontologías

    Get PDF
    Se ha conseguido desarrollar una herramienta capaz de proporcionar al usuario un editor de ontologías, con la que se pueda crear tanto las relaciones como características de los componentes que integran una ontología. Es un sistema seguro, amigable y fácilmente modulable. Se dejan las puertas abiertas para multitud de funcionalidades nuevas a implementar. De la misma forma se ha establecido un esquema ontológico representado en una base de datos, lo que facilita la adaptabilidad de cualquier ontología poblada para poder ser reutilizada en el sistema.Ingeniería Técnica en Informática de Gestió

    Text Mining and Medicine: An approach to early detection of diseases

    Get PDF
    El futuro próximo de los servicios sanitarios vendrá marcado por el envejecimiento de la población y la cronicidad de las enfermedades. Junto a los cambios demográficos y sociales, se está produciendo un claro aumento de la frecuentación en los distintos servicios de atención primaria y especializada y, por supuesto, todo esto se traduce en un fuerte incremento del gasto sanitario. Todo este problemático contexto hace que las instituciones sanitarias se marquen como principales objetivos la priorización de la prevención, el control de los factores de riesgo y la detección precoz de enfermedades. Para apoyar la prevención primaria es muy importante que el profesional sanitario tenga todos los medios disponibles a su alcance para extraer conocimiento de su principal fuente de información que es la historia clínica informatizada del paciente. Así, el profesional sanitario debería disponer de herramientas que permitan conocer e interrelacionar eventos clínicos de interés, alertar sobre la aparición de futuros riesgos para la salud o pronosticar el posible desarrollo de una enfermedad. Sin embargo, el esfuerzo, tiempo y coste que supondría extraer este conocimiento de la simple lectura de los múltiples informes clínicos contenidos en la historia de un paciente (escritos en su mayoría en lenguaje natural), sería incalculable e imposible de asumir por la mayoría de los profesionales sanitarios en la clínica diaria. Hasta el momento, los sistemas de información existentes en la mayoría de instituciones sanitarias sólo han sido utilizados como sistemas de almacenaje de información, es decir sistemas que recopilan y almacenan toda la información asistencial generada en la interacción médico-paciente, pero todavía no se ha dado el paso de convertir estos grandes “almacenes de información” en “fuentes de conocimiento” que aporten valor para facilitar y apoyar la toma de decisiones clínicas. Sin embargo, el reto de automatizar este proceso, transformar almacenes de información en fuentes de conocimiento, no es una tarea trivial. Se estima que en un complejo hospitalario regional se pueden generar al año más de 3 millones de documentos clínicos, el 80% de esta documentación clínica contiene información no estructurada, una de la más destacable es la información textual. Hasta ahora la información clínica textual ha sido prácticamente ignorada por la mayoría de las instituciones sanitarias debido a la gran complejidad en su explotación para generar valor de su contenido. La principal fuente de conocimiento contenida en la historia clínica electrónica, que es la narrativa clínica textual, es en la práctica altamente desaprovechada. A la dificultad de las organizaciones sanitarias para obtener valor del texto, con las herramientas de análisis hasta ahora utilizadas, se suman las peculiares características que posee la terminología clínica donde prima: una alta ambigüedad y complejidad del vocabulario, la narrativa textual libre, una escasa normalización terminológica y un uso excesivo de acrónimos y negaciones. En este complejo marco y ante la creciente necesidad de adquirir conocimiento para apoyar el proceso de prevención y toma de decisiones clínicas, se hace imprescindible el uso de Sistemas Inteligentes que ayuden a extraer el valor encerrado en el contenido textual de los múltiples documentos que integran la historia clínica electrónica. Pero a pesar de esta acuciante necesidad, actualmente existen muy pocos sistemas reales que extraigan conocimiento del texto clínico para facilitar el trabajo diario al profesional sanitario en tareas arduas y complejas como la detección de factores de riesgo o la predicción diagnóstica. En la actualidad, para abordar la problemática de extraer valor del texto clínico, en el entorno de la medicina computacional, disponemos de las técnicas avanzadas que nos proporciona la disciplina de la Minería de Textos (MT). Esta disciplina puede definirse como un área orientada a la identificación y extracción de nuevo conocimiento adquirido a partir de información textual, es un campo multidisciplinar que puede integrar técnicas de otras disciplinas como el Procesamiento del Lenguaje Natural (PLN) o Aprendizaje Automático (AA). En este sentido, abordamos esta tesis doctoral con un análisis exhaustivo y pormenorizado del estado del arte sobre la disciplina de la MT en el ámbito de la Medicina, recogiendo los métodos, técnicas, tareas, recursos y tendencias más destacadas en la literatura. De esta amplia revisión se detecta que en la práctica los sistemas existentes para apoyar el proceso de toma de decisiones clínicas basados en información clínica textual son escasos y generalmente resuelven una única tarea principal centrándose en un área específica de conocimiento y siendo desarrollados para dominios muy específicos difícilmente reproducibles en otros entornos. Ante las problemáticas observadas en los sistemas de MT existentes y las necesidades de las instituciones sanitarias, se propone la creación de un novedoso sistema, denominado MiNerDoc, que permita apoyar la toma de decisiones clínicas en base a una combinación de técnicas de la disciplina de la MT, junto con el enriquecimiento terminológico y semántico proporcionado por la herramienta MetaMap y el metathesaurus UMLS, recursos que aportan características esenciales en el dominio médico. MiNerDoc permite, entre otras funcionalidades, detectar factores de riesgo o eventos clínicos de interés e inferir automáticamente códigos normalizados de diagnósticos tomando como fuente exclusiva la información textual contenida en informes clínicos, en definitiva, permite llevar a cabo tareas complejas que facilitan y apoyan la labor del profesional sanitario en la prevención primaria y la toma de decisiones clínicas. El sistema de MT propuesto ha sido evaluado en base a un amplio análisis experimental, los resultados demostraron la efectividad y viabilidad del sistema propuesto y verificaron el prometedor rendimiento de MiNerDoc en las dos tareas evaluadas, reconocimiento de entidades médicas y clasificación diagnóstica multietiqueta.The near future of health services will be marked by the ageing of the population and the chronicity of diseases. Together with the demographic and social changes, there is a clear increase in the number of people attending both primary and specialized care services, and, of course, all this produces a sharp increase in healthcare expenditure. All this context makes health institutions to set a series of main objectives: prioritization of prevention, control of risk factors and early detection of diseases. To support primary prevention, it is important that health professionals have all the available means at their disposal to extract knowledge from main sources of information, that is, the patient’s electronic health records. Thus, health professionals should have tools that allow them to know and interrelate clinical events of interest, receive alerts about upcoming health risks or predict the development of a disease. However, the effort, time and cost required to extract this knowledge by just reading of the multiple clinical reports belonging to a patient's history (mostly written in natural language), are incalculable and hardly affordable for most health professionals in the daily clinic practice. Until now, the existing information systems in most health institutions have only been used as information storage systems, that is, systems that collect and store any healthcare information generated in the practitioner-patient interaction. By now, the step of transforming such raw data into useful "knowledge" that eases and supports the final clinical decision-making process has not been applied yet. Nevertheless, such challenge of transforming raw data into knowledge is not trivial. It is estimated that in a regional hospital more than 3 million clinical documents can be generated per year, 80% of them contain unstructured or textual information. Up to now, textual clinical information has been practically ignored by most health institutions mainly due to the arduous process required to take advantage of the content of such vast amount of data. Thus, the main source of knowledge contained in the electronic medical records, which is in textual clinical narrative, is practically untapped. Additionally to the difficulty of the health organizations to obtain value from the text by using traditional tools, the peculiar characteristics of the clinical terminology is an added problem: high ambiguity and complexity of the vocabulary, free textual narrative, a poor terminological standardization and an overuse of acronyms and negations. In this complex framework and in view of the growing need to acquire knowledge to support the decision-making process, it is essential to use Intelligent Systems that help to extract the value from textual documents. Currently, there are very few real systems able to extract knowledge from clinical texts and to really ease the daily work of healthcare professionals in complex tasks such as risk factor detection or diagnostic prediction. In recent years, to face these problems up, there are a number of advanced techniques provided by the Text Mining (TM) discipline. TM might be defined as an area focused on the identification and extraction of new knowledge from textual information, and it is seen as a multidisciplinary field gathering techniques from other disciplines such as Natural Language Processing (NLP) and Machine Learning (ML). In this sense, this doctoral Thesis first provides an exhaustive and detailed analysis of the state-of-the-art on the TM discipline in Medicine. This analysis includes the most outstanding methods, techniques, tasks, resources and trends in the field. As a result, this review revealed that the existing systems to support the clinical decision-making process by applying a textual clinical information are scarce, and they generally perform a single task on a specific area of knowledge and for very specific domains hardly applied to problems on different environments. In this regard, this Thesis proposes the development of a new system, called MiNerDoc, to support clinical decision-making by applying a combination of techniques from the TM discipline, along with the terminological and semantic enrichment provided by the MetaMap tool and the UMLS metathesaurus. MiNerDoc allows, among other functionalities, the detection of risk factors or clinical events of interest and automatic inference of standardized diagnostic codes based on the textual information included in clinical reports. The proposed TM system has been evaluated based on an extensive experimental study and the results have demonstrated the effectiveness and viability of such system in two tasks, recognition of medical entities and multi-label diagnostic classification

    Ontología de características de la baldosa cerámica desde la terminología

    Get PDF
    El trabajo se centra en la formalización de las características del concepto en forma de ontología. Desde un punto de vista terminológico, los conceptos se pueden clasificar en cuatro tipos de categorías: las entidades, las actividades, las relaciones y las características (Sager y Kageura, 1994: 193). Las características constituyen un elemento de estudio fundamental para describir conceptos y sirven para distinguir unos de otros, y pueden ser muy variadas. Así, encontramos características de distinta naturaleza, como, por ejemplo, en el campo de la cerámica, características de color, de forma o de función. Además, no todas ellas son igual de importantes para la definición del concepto; por ejemplo, encontramos características que sirven para diferenciarlo y otras que son compartidas por todos los tipos de conceptos de un campo. Por esta razón, la descripción de conceptos a partir de la especificación de sus características requiere la indicación del "rango", de la "importancia", de la "naturaleza" o procedencia de cada característica. En este trabajo nos proponemos profundizar en el tipo de información que proporciona una característica y que esta requiere como elemento descriptor y como concepto en sí mismo, observaremos cómo contribuye a la formalización de otros conceptos y cómo podemos formalizarla y representarla en una ontología de manera que proporcione información sobre ella y sobre los conceptos a los que suele describir en un determinado ámbito. Como material de trabajo, nos ocupamos de las características del ámbito de la cerámica, y más concretamente, de la baldosa cerámica. El objetivo principal es representar las características de un dominio de especialidad en un sistema de ontologías con un lenguaje de representación de ontologías estándar y teniendo en cuenta los criterios de clasificación de características que aparecen en la bibliografía sobre terminología, lexicografía e ingeniería del conocimiento El resultado de la representación está orientado a servir de herramienta de consulta a terminólogos y especialistas lingüísticos/técnicos interesados en conocer esta forma de representación de conceptos y, en concreto, la representación de las características de la baldosa cerámica y su naturaleza

    WICC 2016 : XVIII Workshop de Investigadores en Ciencias de la Computación

    Get PDF
    Actas del XVIII Workshop de Investigadores en Ciencias de la Computación (WICC 2016), realizado en la Universidad Nacional de Entre Ríos, el 14 y 15 de abril de 2016.Red de Universidades con Carreras en Informática (RedUNCI

    Contribución a la alineación de ontologías utilizando lógica difusa

    Get PDF
    En la actualidad, con el aumento de la cantidad de información disponible en Internet se hace cada vez más necesario crear mecanismos para facilitar la organización el intercambio de información y conocimiento entre las aplicaciones. La Web Semántica está destinada a resolver una de las carencias fundamentales de la Web actual, que es la falta de capacidad de las representaciones para expresar significados. Esta tarea se puede simplificar enormemente aądiendo información semántica y de contexto a las formas actuales de representación del conocimiento, utilizadas en la Web, de modo que los equipos puedan procesar, interpretar y conectar la información presentada en la WWW. Las ontologías se han convertido en un componente crucial dentro de la Web semántica, ya que permiten el diseǫ de exhaustivos y rigurosos esquemas conceptuales para facilitar la comunicación y el intercambio de información entre diferentes sistemas y entidades. Sin embargo, la heterogeneidad en la representación del conocimiento en las ontologías dificulta la interacción entre las aplicaciones que utilizan este conocimiento. Por ello, para compartir información, cuando se utiliza vocabularios heterogéneos se debe poder traducir los datos de un marco ontológico a otro. El proceso de encontrar correspondencias entre ontologías diferentes se conoce como alineación de ontologías. En esta tesis doctoral se propone un método de alineación de ontologías utilizando técnicas de lógica difusa para combinar diversas medidas de similitud entre entidades de ontologías diferentes. Las medidas de similitud propuestas se basan en dos elementos fundamentales de las ontologías: la terminología y la estructura. En cuanto a la terminología se propone una medida de similitud lingüística utilizando varias relaciones léxicas entre los nombres de las entidades, combinada con una medida de similitud semántica que tiene en cuenta la información del contexto de las entidades en las ontologías. En cuanto a la estructura se proponen medidas de similitud que utilizan tanto la estructura relacional como la estructura interna de los conceptos en las ontologías
    corecore