Search CORE

5 research outputs found

Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos

Author: Braña Juan Pablo
Fernández Alejandro
Litterio Alejandra
Publication venue
Publication date: 01/04/2016
Field of study

El proyecto de investigación en curso, que aquí se presenta, propone un modelo híbrido enriquecido semánticamente, en el cual aplicar un etiquetador morfosintáctico con el fin de identificar cómo una determinada secuencia de palabras, a partir de una estructura sintáctica, refleja un indicador de sentimiento, esto es, clasificar una cláusula en positivo, negativo o neutro, dentro de un contexto específico, en nuestro caso particular los Mercados Financieros Argentinos. Con el propósito de llevar a cabo este estudio recolectamos, analizamos y clasificamos opiniones extraídas de usuarios de Twitter, comentarios de blogs especializados en finanzas, artículos periodísticos en economía y finanzas – que constituirá nuestro corpora ampliado−, aplicando principios y técnicas de Sentiment Analysis y Machine Learning.Eje: Bases de Datos y Minería de Dato

Centro de Servicios en Gestión de Información

Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos : Un modelo híbrido de POST enriquecido semánticamente

Author: Braña Juan Pablo
Fernández Alejandro
Litterio Alejandra
Publication venue
Publication date: 01/04/2016
Field of study

Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos : Un modelo híbrido de POST enriquecido semánticamente

Author: Braña Juan Pablo
Fernández Alejandro
Litterio Alejandra
Publication venue
Publication date: 01/04/2016
Field of study

Centro de Servicios en Gestión de Información

Servicio de Difusión de la Creación Intelectual

Ampliación automática de corpus mediante la colaboración de varios etiquetadores

Author: Cruz Mata Fermín
Enríquez de Salamanca Ros Fernando
Ortega Rodríguez Francisco Javier
Troyano Jiménez José Antonio
Publication venue: Sociedad Española para el Procesamiento del Lenguaje Natural
Publication date: 01/01/2006
Field of study

La disponibilidad de grandes corpus con texto etiquetado es un aspecto esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se requiere para etiquetar manualmente este gran número de frases ha animado a los investigadores a crear aplicaciones automáticas para este trabajo. Nuestra propuesta representa un método para incrementar el tamaño de un corpus pequeño de manera totalmente automática o con un mínimo esfuerzo, hasta que adquiera el número deseado de frases. El contenido que se añade al corpus se obtiene de cualquier fuente como puede ser Internet, de la cual se puedan extraer frases sin etiquetar para ser analizadas. Si consideramos el pequeño corpus etiquetado como la semilla, nuestro método hace que evolucione hasta lograr el tamaño deseado. El proceso se basa en la opinión de varios etiquetadores mediante la técnica de co-training y de la aplicación de un segundo nivel de aprendizaje mediante stacking. Esta última será la técnica que nos servirá para decidir cuáles de las nuevas frases etiquetadas serán seleccionadas para pasar a formar parte del corpus.The availability of extense tagged data corpus is an essential aspect in many NLP tasks. The effort required for tagging manually this large number of phrases has encouraged many researchers like us to create automatic applications for this issue. Our approach represents a completely automatic method (optionally applying a minimum effort) for enlarging an already existing corpus, so it acquires the desired number of tagged phrases. The extra content of the corpus will be obtained from any knowledge source like the web, from where we extract untagged sentences to be analyzed. Considering the initial small corpus as the seed, our method makes it evolve until it reaches the goal size. The process is based on several taggers using the co-training technique, achieving the results after a number of iterations and applying the stacking scheme for deciding which new tagged sentences must be incorporated to the new corpus.Parcialmente financiado por el Ministerio de Educación y Ciencia (TIN2004-07246-C03-03)

Repositorio Institucional de la Universidad de Alicante

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

idUS. Depósito de Investigación Universidad de Sevilla

WICC 2016 : XVIII Workshop de Investigadores en Ciencias de la Computación

Author: Red de Universidades con Carreras en Informática (RedUNCI)
Publication venue: Facultad de Ciencias de la Administración (UNER)
Publication date: 12/05/2016
Field of study

Actas del XVIII Workshop de Investigadores en Ciencias de la Computación (WICC 2016), realizado en la Universidad Nacional de Entre Ríos, el 14 y 15 de abril de 2016.Red de Universidades con Carreras en Informática (RedUNCI

Servicio de Difusión de la Creación Intelectual