Search CORE

3 research outputs found

Platform for the automatic extraction and coding of concepts within the scope of Oncohematology (COCO Project)

Author: Gutiérrez Ruiz María C.
Martín Sánchez Jesús
Moreno Conde Jesús
Parra Calderón Carlos L.
Pérez León Francisco de Paula
Pérez Simón José Antonio
Rodríguez Guillermo
Sánchez Seda Silvia
Publication venue: Sociedad Española para el Procesamiento del Lenguaje Natural
Publication date: 01/01/2018
Field of study

El proyecto COCO tiene como objetivo diseñar, desarrollar y validar un sistema de extracción de conocimiento que, a partir de los textos de la Historia de Salud Electrónica, codifique automáticamente los diagnósticos de Oncohematología mediante Tecnologías del Lenguaje basada en un estándar de pipeline interoperable. La necesidad de normalizar el conocimiento de la Historia Clínica constituye un gran desafío. Puesto que la CIE-10 presenta limitaciones para representar esta información, se desarrolló la norma CIE-O-3, para dar soporte a este tipo de patologías. Se propone desarrollar el primer pipeline de Procesamiento del Lenguaje Natural de componentes interoperables, así como, el primer codificador automático CIE-O-3 y CIE-10. Nuestro sistema servirá de apoyo a la decisión, investigación y gestión clínica en este campo.The COCO project aims to design, develop and validate a knowledge extraction system that, based on the texts of the Electronic Health Record, automatically codes Oncohematology diagnostics using Language Technologies based on an interoperable pipeline standard. The need to standardize knowledge of the Electronic Health Record is a major challenge. Since ICD-10 has limitations in representing this information, ICD-O-3 was developed to support this type of pathology. It is proposed to develop the first Natural Language Processing pipeline of interoperable components, as well as the first ICD-O-3 and ICD-10 automatic encoder. Our system will support clinical decision making, research and management in this field.Esta investigación ha sido financiada en parte por la Plataforma de Innovación en Tecnologías Médicas y Salud (Plataforma ITEMAS, PT13/0006/0036) financiado por el Instituto de Salud Carlos III y por el proyecto COCO (PIN-0121-2017) financiado por la consejería de Salud de la Junta de Andalucía ambos cofinanciados a través de los Fondos Europeos de Desarrollo Regional (FEDER)

Repositorio Institucional de la Universidad de Alicante

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Applying deep learning extreme multi-label classification to the biomedical and multilingual panoramas

Author: Neves André Daniel Costa das
Publication venue
Publication date: 01/01/2020
Field of study

Tese de mestrado em Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2020A indexação automática de documentos é um passo fundamental para a organização de dados e para a extração de informação relevante dos mesmos. Esta extração de informação é realizada através de processos de prospecção de texto e de técnicas de processamento de linguagem natural que tornam a linguagem natural perceptível para o computador. Actualmente, muitas das soluções que são aplicadas a estes processos consistem em soluções de aprendizagem automática. No entanto, tem se assistido a um aumento contínuo da aplicação de soluções de aprendizagem profunda em tarefas de prospecção de texto e de processamento de linguagem natural visto que, graças aos desenvolvimentos contínuos ao longo dos últimos anos, estas soluções têm conseguido obter cada vez melhores resultados. Uma dessas técnicas é a classificação multi-rótulo extrema, uma técnica de processamento de linguagem natural que consiste na indexação de documentos com rótulos pertencentes a um conjunto que pode conter milhares ou mesmo milhões de possíveis rótulos. Este trabalho apresenta um sistema desenvolvido para as ciências biomédicas e para o domínio multilinguístico, através da adaptação de um algoritmo de classificação multi-rótulo extrema usando aprendizagem profunda. O sistema desenvolvido combina ainda um software de reconhecimento de entidades nomeadas com o algoritmo de classificação multi-rótulo extrema de forma a melhorar a atribuição de rótulos aos documentos biomédicos. Para testar o sistema desenvolvido, participei em três competições internacionais com foco na área das ciências biomédicas, nomeadamente na BioASQ task 8a, BioASQ task MESINESP e ainda na subtarefa CODING da competição CANTEMIST. O objectivo comum destas três competições consistia na indexação de documentos biomédicos com rótulos pertencentes a um dado vocabulário biomédico. No entanto, enquanto na task 8a os dados estavam escritos em Inglês, na task MESINESP e na CANTEMIST, os dados biomédicos estavam escritos em Espanhol. Nas competições da BioASQ, o sistema desenvolvido destacou-se sobretudo nas medidas de precisão, superando a grande maioria dos sistemas e ainda alcançando o 1º lugar por duas semanas consecutivas numa das medidas da BioASQ task 8a. Na subtarefa CODING da CANTEMIST, o sistema atingiu uma pontuação de 0.506 na medida mais relevante.Automatic document indexation is a fundamental step for data organization and information retrieval tasks. Information retrieval can be realized through processes of text mining and natural language processing techniques that make natural language understandable to the computer. Nowadays, most solutions that are applied to these processes use machine learning algorithms. However, thanks to continuous developments through recent years, there has been an increasing usage of deep learning solutions applied to text mining and natural language processing tasks, due to the continuous achievement of better results. One of those techniques is extreme multi-label classification, a natural language processing task consisting in the indexation of documents with labels from a label set that may contain thousands or even millions of possible labels. This work presents a system developed for the biomedical and multilingual panoramas based on the adaptation of a deep learning extreme multi-label classification algorithm. The developed system also combines a named entity recognition software with the extreme multi-label classification algorithm in order to improve the label classification of the biomedical documents. To test the developed system, I participated in three international challenges focused on the biomedical sciences, namely in the BioASQ task 8a, BioASQ task MESINESP and in CANTEMIST CODING subtask. The common goal of these three competitions was the indexation of biomedical documents with labels belonging to a specific biomedical vocabulary. However, while the data in task 8a was in English, in task MESINESP and in CANTEMIST the biomedical data was written in Spanish. In the BioASQ competitions, the system stood out in the precision measures, surpassing most competing systems and achieving the 1st place for two consecutive weeks in one evaluation measure in the BioASQ task 8a. In the CANTEMIST CODING subtask, the system achieved a score of 0.506 in the most relevant measure

Universidade de Lisboa: Repositório.UL

Anuario FIS 1998-1999-2000

Author: FIS Instituto de Salud Carlos III
Publication venue: 'SciELO Espana/Repisalud'
Publication date: 01/01/2002
Field of study

Introducción, Subvenciones concedidas en el año 1998, Proyectos de investigación concedidos en 1998, Becas de Formación en Investigación (BEFI)concedidas en 1998, Becas de Ampliación de Estudios (BAE)concedidas en 1998, Becas de Corta Duración (BECE)concedidas en 1998 Bolsas de Viaje concedidas en 1998, Reuniones Científicas subvencionadas en 1998, Publicaciones Científicas subvencionadas en 1998, Contratos de Investigadores concedidos en 1998, Subvenciones concedidas en el año 1999, Proyectos de investigación concedidos en 1999, Becas de Formación en Investigación (BEFI)concedidas en 1999 Becas de Ampliación de Estudios (BAE)concedidas en 1999, Becas de Corta Duración (BECE) concedidas en 1999, Bolsas de Viaje concedidas en 1999 Índice por beneficiario, Reuniones Científicas subvencionadas en 1999 Publicaciones Científicas subvencionadas en 1999, Contratos de Investigadores concedidos en 1999, Subvenciones concedidas en el año 2000, Proyectos de investigación concedidos en 2000, Becas de Formación en Investigación (BEFI)concedidas en 2000, Becas de Ampliación de Estudios (BAE)concedidas en 2000, Becas de Corta Duración (BECE)concedidas en 2000, Bolsas de Viaje concedidas en 2000, Reuniones Científicas subvencionadas en 2000, Contratos de Investigadores concedidos en 2000, Otras subvenciones gestionadas por otras unidades del Instituto de Salud Carlos III que en 2001 pasan a ser gestionadas por la Subdirección General de Investigación Sanitaria, Proyectos de investigación evaluativa, Becas del Instituto de Salud Carlos III Extramurales concedidas en 1998, Becas del Instituto de Salud Carlos III Extramurales concedidas en 1999, Becas del Instituto de Salud Carlos III Extramurales concedidas en 2000, Estructura territorial y por áreas de las ayudas concedidas y resultado de las acciones e Índice

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

REPISALUD