19 research outputs found

    Multi-label Text Categorization Using VG-RAM Weightless Neural Networks

    Full text link

    Using a weightless neural network to forecast stock prices: A case study of Nigerian stock exchange

    Get PDF
    This research work, proposes forecasting stock prices in the stock market industry in Nigeria using a Weightless Neural Network (WNN). A neural network application used to demonstrate the application of the WNN in the forecasting of stock prices in the market is designed and implemented in Visual Foxpro 6.0. The proposed network is tested with stock data obtained from the Nigeria Stock Exchange. This system is compared with Single Exponential Smoothing (SES) model. The WNN error value is found to be 0.39 while that of SES is 9.78, based on these values, forecasting with the WNN is observed to be more accurate and closer to the real data than those using the SES model

    Efeito do Ranking Sobre Métricas de Categorização Multi Rótulo de Texto

    Get PDF
    Dado um documento para categorização, um sistema de categorização multi-rótulo de texto tipicamente ordena um conjunto de categorias pré-definido, de acordo com a adequação delas ao documento, e seleciona as categorias do topo do ranking como o conjunto de categorias do documento. Empates no ranking eventualmente existentes podem ser tratados de diferentes maneiras, mas, muito embora isso possa afetar as métricas utilizadas para avaliar o desempenho dos categorizadores multi-rótulo de texto, este problema parece ter sido pouco estudado na literatura. Neste trabalho, analisamos o impacto de diferentes tipos de ranking sobre diversas métricas de avaliação de desempenho de categorizadores multi-rótulo de texto, a saber: one-error, coverage, ranking loss, average precision, R-precision, Hamming loss, exact match, precision, recall, e 1 F . Para isso, reformulamos sua definição de modo a considerar empates de acordo com o tipo de ranking empregado. Utilizamo-las então para avaliar o desempenho das técnicas de categorização multi-rótulo de texto k -vizinhos mais próximos ( k NN), k -vizinhos mais próximos multi-rótulo (ML- k NN), rede neural sem peso do tipo VG-RAM (VG-RAM WNN) e VG-RAM com correlação de dados (VG-RAM WNNCOR) na categorização de duas bases multi-rótulo de texto com grande número de categorias (105 e 692 categorias). Descobrimos que, dependendo do tipo de ranking empregado, os resultados de desempenho são significativamente diferentes para muitas das métricas analisadas, o que sugere que o tipo de ranking deve ser claramente indicado na avaliação de técnicas de categorização multi-rótulo de texto

    Medida de Certeza na Categorização Multi-Rótulo de Texto e sua Utilização como Estratégia de Poda de Ranking de Categorias

    Get PDF
    Dado um documento de entrada, um sistema de categorização multi-rótulo de texto tipicamente computa graus de crença para as categorias de um conjunto prédefinido, ordena as categorias por grau de crença, e atribui ao documento as categorias com grau de crença superior a um determinado limiar de poda. Idealmente, o grau de crença deveria informar a probabilidade do documento de fato pertencer à categoria. Infelizmente, ainda não existem categorizadores que computam tais probabilidades e mapear graus de crença em probabilidades é um problema ainda pouco explorado na área de RI. Neste trabalho, propomos um método baseado na regra de Bayes para mapear graus de crença em medidas de certeza de categorização multi-rótulo de texto. Propomos também uma estratégia para determinar limiares de poda baseada na medida de certeza de categorização - bayesian cut (BCut) - e uma variante para BCut - position based bayesian CUT (PBCut). Avaliamos experimentalmente o impacto dos métodos propostos no desempenho de duas técnicas de categorização multi-rótulo de texto, kvizinhos mais próximos multi-rótulo (ML-kNN) e rede neural sem peso do tipo VGRAM com correlação de dados (VG-RAM WNN-COR), no contexto da categorização de descrições de atividades econômicas de empresas brasileiras segundo a Classificação Nacional de Atividades Econômicas (CNAE). Investigamos também o impacto no desempenho de categorização multi-rótulo de texto de três métodos de poda comumente usados na literatura de RI - RCut, PCut, e SCut e uma variante de RCut - RTCut. Além disso, propomos novas variantes para PCut e SCut PCut* e SCut*, respectivamente para tratar problemas existentes nestas abordagens. Nossos resultados experimentais mostram que, usando nosso método de geração de medidas de certeza de categorização, é possível prever o quão certo está o categorizador de que as categorias por ele preditas são de fato pertinentes para um dado documento. Nossos resultados mostram também que o uso de nossas estratégias de poda BCut e PBCut produz desempenho de categorização superior ao de todas as outras estratégias consideradas em termos de precisão

    Sistema de Rastreamento Visual de Objetos Baseado em Movimentos Oculares Sacádicos

    Get PDF
    A busca visual é o mecanismo por meio do qual, a partir do conhecimento prévio da imagem de um objeto de interesse, conseguimos encontrá-lo no campo visual se o mesmo nele estiver presente. A região cerebral responsável pela realização da busca visual, realizada através dos movimentos sacádicos dos olhos, é conhecida como Superior Culliculus. A criação de um sistema computacional de busca visual a partir de um conjunto de imagens do mundo externo que busque similaridade com o sistema biológico requer modelar o sistema biológico de movimentos sacádicos dos olhos, as transformações sofridas pelas imagens captadas pelos olhos em seu caminho para o Superior Culliculus (SC) no cérebro e a resposta dos neurônios do SC para padrões aprendidos anteriormente. Neste trabalho apresentamos uma modelagem matemático-computacional de uma arquitetura neural que representa o Superior Culliculus. Esta arquitetura neural é baseada em Generalização Virtual de Memória de Acesso Aleatório em Redes Neurais Sem Peso (Virtual Generalizing Random Access Memory Weightless Neural Networks VGRAM WNN) e no mapeamento log-polar da retina para o Superior Culliculus. Com a nossa implementação desta arquitetura é possível, a partir de pontos de interesse em uma determinada imagem bidimensional previamente treinados, realizar a busca visual por estes pontos em imagens diferentes da treinada. O modelo de busca visual biologicamente inspirado foi incorporado em um sistema automático de rastreamento (tracking) de longo prazo de objetos de interesse em vídeo para lidar com todos os desafios apresentados que se equipara ao estado da arte

    Theoretical results on a weightless neural classifier and application to computational linguistics

    Get PDF
    WiSARD é um classificador n-upla, historicamente usado em tarefas de reconhecimento de padrões em imagens em preto e branco. Infelizmente, não era comum que este fosse usado em outras tarefas, devido á sua incapacidade de arcar com grandes volumes de dados por ser sensível ao conteúdo aprendido. Recentemente, a técnica de bleaching foi concebida como uma melhoria à arquitetura do classificador n-upla, como um meio de coibir a sensibilidade da WiSARD. Desde então, houve um aumento na gama de aplicações construídas com este sistema de aprendizado. Pelo uso frequente de corpora bastante grandes, a etiquetação gramatical multilíngue encaixa-se neste grupo de aplicações. Esta tese aprimora o mWANN-Tagger, um etiquetador gramatical sem peso proposto em 2012. Este texto mostra que a pesquisa em etiquetação multilíngue com WiSARD foi intensificada através do uso de linguística quantitativa e que uma configuração de parâmetros universal foi encontrada para o mWANN-Tagger. Análises e experimentos com as bases da Universal Dependencies (UD) mostram que o mWANN-Tagger tem potencial para superar os etiquetadores do estado da arte dada uma melhor representação de palavra. Esta tese também almeja avaliar as vantagens do bleaching em relação ao modelo tradicional através do arcabouço teórico da teoria VC. As dimensões VC destes foram calculadas, atestando-se que um classificador n-upla, seja WiSARD ou com bleaching, que possua N memórias endereçadas por n-uplas binárias tem uma dimensão VC de exatamente N (2n − 1) + 1. Um paralelo foi então estabelecido entre ambos os modelos, onde deduziu-se que a técnica de bleaching é uma melhoria ao método n-upla que não causa prejuízos à sua capacidade de aprendizado.WiSARD é um classificador n-upla, historicamente usado em tarefas de reconhecimento de padrões em imagens em preto e branco. Infelizmente, não era comum que este fosse usado em outras tarefas, devido á sua incapacidade de arcar com grandes volumes de dados por ser sensível ao conteúdo aprendido. Recentemente, a técnica de bleaching foi concebida como uma melhoria à arquitetura do classificador n-upla, como um meio de coibir a sensibilidade da WiSARD. Desde então, houve um aumento na gama de aplicações construídas com este sistema de aprendizado. Pelo uso frequente de corpora bastante grandes, a etiquetação gramatical multilíngue encaixa-se neste grupo de aplicações. Esta tese aprimora o mWANN-Tagger, um etiquetador gramatical sem peso proposto em 2012. Este texto mostra que a pesquisa em etiquetação multilíngue com WiSARD foi intensificada através do uso de linguística quantitativa e que uma configuração de parâmetros universal foi encontrada para o mWANN-Tagger. Análises e experimentos com as bases da Universal Dependencies (UD) mostram que o mWANN-Tagger tem potencial para superar os etiquetadores do estado da arte dada uma melhor representação de palavra. Esta tese também almeja avaliar as vantagens do bleaching em relação ao modelo tradicional através do arcabouço teórico da teoria VC. As dimensões VC destes foram calculadas, atestando-se que um classificador n-upla, seja WiSARD ou com bleaching, que possua N memórias endereçadas por n-uplas binárias tem uma dimensão VC de exatamente N (2n − 1) + 1. Um paralelo foi então estabelecido entre ambos os modelos, onde deduziu-se que a técnica de bleaching é uma melhoria ao método n-upla que não causa prejuízos à sua capacidade de aprendizado

    Preditor de alto desempenho para retornos de ações baseado em redes neurais sem peso.

    Get PDF
    Este trabalho apresenta um novo preditor de séries temporais baseado em rede neural sem peso que utiliza Virtual Generalized Random Access Memory para predizer retorno futuro de ações. Esse novo preditor foi avaliado na predição de retornos futuros semanais de 46 ações de mercado de ações brasileiro. Os resultados mostram que preditores neurais sem peso podem produzir predições de retornos com os mesmo níveis de erros e propriedades de um preditor neural autoregressivo, entretando, 5.000 vezes mais rápido
    corecore