4 research outputs found

    Sistemas inteligentes para la evaluación de la calidad de la información en la web

    Get PDF
    En este artículo se describen, en forma resumida, los trabajos de investigación y desarrollo que se están llevando a cabo en la línea de investigación “Sistemas Inteligentes” en las áreas de Text Mining, Web Mining y Web Intelligence, y que abordan principalmente tareas como: clustering de textos cortos multilingües, categorización semántica de textos, medidas de calidad de la información en la Web, detección de plagio y atribución de autoría, minería de opinión y sentimientos, integración de agentes y técnicas de minería de textos, y uso de arquitecturas cognitivas para agentes web; en especial aquellas basadas en lógica, razonamiento argumentativo y teoría de decisión cualitativa. En particular, pondremos especial énfasis en aquellas problemáticas que se están comenzando a investigar en forma conjunta con investigadores de Alemania, Austria, España y Grecia en el contexto de un proyecto FP7, recientemente aprobado en la Unión Europea.Eje: Agentes y sistemas inteligentesRed de Universidades con Carreras en Informática (RedUNCI

    A Particle Swarm Optimizer to Cluster Parallel Spanish-English Short-text Corpora

    Full text link
    Short-texts clustering is currently an important research area because of its applicability to web information retrieval, text summarization and text mining. These texts are often available in different languages and parallel multilingual corpora. Some previous works have demonstrated the effectiveness of a discrete Particle Swarm Optimizer algorithm, named CLUDIPSO, for clustering monolingual corpora containing very short documents. In all the considered cases, CLUDIPSO outperformed different algorithms representative of the state-of-the-art in the area. This paper presents a preliminary study showing the performance of CLUDIPSO on parallel Spanish-English corpora. The idea is to analyze how this bilingual information can be incorporated in the CLUDIPSO algorithm and to what extent this information can improve the clustering results. In order to adapt CLUDIPSO to a bilingual environment, some alternatives are proposed and evaluated. The results were compared considering CLUDIPSO in both environments, bilingual and monolingual. The experimental work shows that bilingual information allows to obtain just comparable results to those obtained with monolingual corpora. More work is required to make an effective use of this kind of information.Ingaramo, DA.; Errecalde, ML.; Cagnina, L.; Rosso, P. (2011). A Particle Swarm Optimizer to Cluster Parallel Spanish-English Short-text Corpora. CEUR Workshop Proceedings. 824:43-48. http://hdl.handle.net/10251/33475S434882

    Data Preprocessing for Improving Cluster Analysis and Its Application to Short Text Data

    Get PDF
    13301甲第4317号博士(工学)金沢大学博士論文本文Full 以下に掲載:Journal of Software Engineering and Applications 7(8) pp.639-654 2015. Scientific Research Publishing Inc. 共著者:Vu Anh Tran, Osamu Hirose, Thammakorn Saethang, Lan Anh T. Nguyen, Xuan Tho Dang, Tu Kien T. Le, Duc Luu Ngo, Gavrilov Sergey, Mamoru Kubo, Yoichi Yamada, Kenji Sato
    corecore