913 research outputs found
Multi-Engine Approach for Named Entity Recognition in Bengali
PACLIC / The University of the Philippines Visayas Cebu College Cebu City, Philippines / November 20-22, 200
Recommended from our members
Revisiting Linking Early Geospatial Documents with Recogito
Recogito is a web-based environment for collaborative semantic annotation. It is open source software, and provides support for working with either text or image documents, including those served via the IIIF protocol. Originally, the tool has been designed for geographic annotation, i.e. the transcription, marking up and geo-resolving of maps and geographical texts (such as itineraries and travel reports) in the context of historical scholarship, e.g. to map or extract data from a source, or to prepare a digital edition. Over time, however, Recogito’s feature set has grown to provide more general annotation functionality, broadening the scope for further potential application areas. Following up from an earlier article we published in e-Perimetron in 2015, in which we first introduced Recogito, this article looks back on the past four years of use and development. We present how Recogito has technologically evolved; how it has been applied in practice in different projects and for different purposes; and how a vibrant user community has sprung up around it that is shaping its further development. The paper also looks forward to some planned next steps, and sets out our future vision for Recogito’s long-term development and sustainability
Arabic named entity recognition
En esta tesis doctoral se describen las investigaciones realizadas con el objetivo de determinar
las mejores tecnicas para construir un Reconocedor de Entidades Nombradas
en Arabe. Tal sistema tendria la habilidad de identificar y clasificar las entidades
nombradas que se encuentran en un texto arabe de dominio abierto.
La tarea de Reconocimiento de Entidades Nombradas (REN) ayuda a otras tareas de
Procesamiento del Lenguaje Natural (por ejemplo, la Recuperacion de Informacion, la
Busqueda de Respuestas, la Traduccion Automatica, etc.) a lograr mejores resultados
gracias al enriquecimiento que a~nade al texto. En la literatura existen diversos trabajos
que investigan la tarea de REN para un idioma especifico o desde una perspectiva
independiente del lenguaje. Sin embargo, hasta el momento, se han publicado muy
pocos trabajos que estudien dicha tarea para el arabe.
El arabe tiene una ortografia especial y una morfologia compleja, estos aspectos aportan
nuevos desafios para la investigacion en la tarea de REN. Una investigacion completa
del REN para elarabe no solo aportaria las tecnicas necesarias para conseguir
un alto rendimiento, sino que tambien proporcionara un analisis de los errores y una
discusion sobre los resultados que benefician a la comunidad de investigadores del
REN. El objetivo principal de esta tesis es satisfacer esa necesidad. Para ello hemos:
1. Elaborado un estudio de los diferentes aspectos del arabe relacionados con dicha
tarea;
2. Analizado el estado del arte del REN;
3. Llevado a cabo una comparativa de los resultados obtenidos por diferentes
tecnicas de aprendizaje automatico;
4. Desarrollado un metodo basado en la combinacion de diferentes clasificadores,
donde cada clasificador trata con una sola clase de entidades nombradas y emplea
el conjunto de caracteristicas y la tecnica de aprendizaje automatico mas
adecuados para la clase de entidades nombradas en cuestion.
Nuestros experimentos han sido evaluados sobre nueve conjuntos de test.Benajiba, Y. (2009). Arabic named entity recognition [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/8318Palanci
- …