Classificação automática de texto buscando similaridade de palavras e significados ocultos

Catae, Fabricio S.; Rocha, Ricardo Luis de Azevedo da

Classificação automática de texto buscando similaridade de palavras e significados ocultos

Authors: Fabricio S. Catae
Ricardo Luis de Azevedo da Rocha
Publication date: 6 November 2012
Publisher

Abstract

Adotamos o m etodo da indexação da semântica latente (LSI) para classifi car documentos que estejam relacionados por algum meio não restrito apenas aos termos presentes, mas buscando outras formas de similaridades. A redu cão de dimensionalidade da matriz Termo-Documento n~ao e novidade, sendo normalmente adotado entre 200 a 300 dimensões. Nesse trabalho, transformamos o LSI em um algoritmo semi-supervisionado e determinamos o n umero ideal de dimensão durante a fase de treinamento. O algoritmo utiliza um espa co isom etrico a aquele de nido pela matriz Termo-Documento para acelerar os c alculos.Eje: Workshop Bases de datos y minería de datos (WBDDM)Red de Universidades con Carreras en Informática (RedUNCI

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

SEDICI - Repositorio de la UNLP

oai:sedici.unlp.edu.ar:10915/2...

Last time updated on 10/04/2020

Servicio de Difusión de la Creación Intelectual

oai:sedici.unlp.edu.ar:10915/2...

Last time updated on 04/09/2013