5 research outputs found
Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos
El proyecto de investigación en curso, que aquà se presenta, propone un modelo hÃbrido enriquecido semánticamente, en el cual aplicar un etiquetador morfosintáctico con el fin de identificar cómo una determinada secuencia de palabras, a partir de una estructura sintáctica, refleja un indicador de sentimiento, esto es, clasificar una cláusula en positivo, negativo o neutro, dentro de un contexto especÃfico, en nuestro caso particular los Mercados Financieros Argentinos. Con el propósito de llevar a cabo este estudio recolectamos, analizamos y clasificamos opiniones extraÃdas de usuarios de Twitter, comentarios de blogs especializados en finanzas, artÃculos periodÃsticos en economÃa y finanzas – que constituirá nuestro corpora ampliado−, aplicando principios y técnicas de Sentiment Analysis y Machine Learning.Eje: Bases de Datos y MinerÃa de Dato
Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos : Un modelo hÃbrido de POST enriquecido semánticamente
El proyecto de investigación en curso, que aquà se presenta, propone un modelo hÃbrido enriquecido semánticamente, en el cual aplicar un etiquetador morfosintáctico con el fin de identificar cómo una determinada secuencia de palabras, a partir de una estructura sintáctica, refleja un indicador de sentimiento, esto es, clasificar una cláusula en positivo, negativo o neutro, dentro de un contexto especÃfico, en nuestro caso particular los Mercados Financieros Argentinos. Con el propósito de llevar a cabo este estudio recolectamos, analizamos y clasificamos opiniones extraÃdas de usuarios de Twitter, comentarios de blogs especializados en finanzas, artÃculos periodÃsticos en economÃa y finanzas – que constituirá nuestro corpora ampliado−, aplicando principios y técnicas de Sentiment Analysis y Machine Learning.Eje: Bases de Datos y MinerÃa de DatosRed de Universidades con Carreras en Informática (RedUNCI
Sentiment Analysis para la clasificación de noticias financieras en los mercados argentinos : Un modelo hÃbrido de POST enriquecido semánticamente
El proyecto de investigación en curso, que aquà se presenta, propone un modelo hÃbrido enriquecido semánticamente, en el cual aplicar un etiquetador morfosintáctico con el fin de identificar cómo una determinada secuencia de palabras, a partir de una estructura sintáctica, refleja un indicador de sentimiento, esto es, clasificar una cláusula en positivo, negativo o neutro, dentro de un contexto especÃfico, en nuestro caso particular los Mercados Financieros Argentinos. Con el propósito de llevar a cabo este estudio recolectamos, analizamos y clasificamos opiniones extraÃdas de usuarios de Twitter, comentarios de blogs especializados en finanzas, artÃculos periodÃsticos en economÃa y finanzas – que constituirá nuestro corpora ampliado−, aplicando principios y técnicas de Sentiment Analysis y Machine Learning.Eje: Bases de Datos y MinerÃa de DatosRed de Universidades con Carreras en Informática (RedUNCI
Ampliación automática de corpus mediante la colaboración de varios etiquetadores
La disponibilidad de grandes corpus con texto etiquetado es un aspecto
esencial en muchas tareas del procesamiento del lenguaje natural. El esfuerzo que se
requiere para etiquetar manualmente este gran número de frases ha animado a los
investigadores a crear aplicaciones automáticas para este trabajo. Nuestra propuesta
representa un método para incrementar el tamaño de un corpus pequeño de manera
totalmente automática o con un mÃnimo esfuerzo, hasta que adquiera el número
deseado de frases. El contenido que se añade al corpus se obtiene de cualquier fuente
como puede ser Internet, de la cual se puedan extraer frases sin etiquetar para ser
analizadas. Si consideramos el pequeño corpus etiquetado como la semilla, nuestro
método hace que evolucione hasta lograr el tamaño deseado. El proceso se basa en la
opinión de varios etiquetadores mediante la técnica de co-training y de la aplicación
de un segundo nivel de aprendizaje mediante stacking. Esta última será la técnica que
nos servirá para decidir cuáles de las nuevas frases etiquetadas serán seleccionadas
para pasar a formar parte del corpus.The availability of extense tagged data corpus is an essential aspect
in many NLP tasks. The effort required for tagging manually this large number of
phrases has encouraged many researchers like us to create automatic applications for
this issue. Our approach represents a completely automatic method (optionally applying
a minimum effort) for enlarging an already existing corpus, so it acquires the
desired number of tagged phrases. The extra content of the corpus will be obtained
from any knowledge source like the web, from where we extract untagged sentences
to be analyzed. Considering the initial small corpus as the seed, our method makes it
evolve until it reaches the goal size. The process is based on several taggers using the
co-training technique, achieving the results after a number of iterations and applying
the stacking scheme for deciding which new tagged sentences must be incorporated
to the new corpus.Parcialmente financiado por el Ministerio de Educación y Ciencia (TIN2004-07246-C03-03)
WICC 2016 : XVIII Workshop de Investigadores en Ciencias de la Computación
Actas del XVIII Workshop de Investigadores en Ciencias de la Computación (WICC 2016), realizado en la Universidad Nacional de Entre RÃos, el 14 y 15 de abril de 2016.Red de Universidades con Carreras en Informática (RedUNCI