3 research outputs found

    Efeito do Ranking Sobre Métricas de Categorização Multi Rótulo de Texto

    Get PDF
    Dado um documento para categorização, um sistema de categorização multi-rótulo de texto tipicamente ordena um conjunto de categorias pré-definido, de acordo com a adequação delas ao documento, e seleciona as categorias do topo do ranking como o conjunto de categorias do documento. Empates no ranking eventualmente existentes podem ser tratados de diferentes maneiras, mas, muito embora isso possa afetar as métricas utilizadas para avaliar o desempenho dos categorizadores multi-rótulo de texto, este problema parece ter sido pouco estudado na literatura. Neste trabalho, analisamos o impacto de diferentes tipos de ranking sobre diversas métricas de avaliação de desempenho de categorizadores multi-rótulo de texto, a saber: one-error, coverage, ranking loss, average precision, R-precision, Hamming loss, exact match, precision, recall, e 1 F . Para isso, reformulamos sua definição de modo a considerar empates de acordo com o tipo de ranking empregado. Utilizamo-las então para avaliar o desempenho das técnicas de categorização multi-rótulo de texto k -vizinhos mais próximos ( k NN), k -vizinhos mais próximos multi-rótulo (ML- k NN), rede neural sem peso do tipo VG-RAM (VG-RAM WNN) e VG-RAM com correlação de dados (VG-RAM WNNCOR) na categorização de duas bases multi-rótulo de texto com grande número de categorias (105 e 692 categorias). Descobrimos que, dependendo do tipo de ranking empregado, os resultados de desempenho são significativamente diferentes para muitas das métricas analisadas, o que sugere que o tipo de ranking deve ser claramente indicado na avaliação de técnicas de categorização multi-rótulo de texto

    Medida de Certeza na Categorização Multi-Rótulo de Texto e sua Utilização como Estratégia de Poda de Ranking de Categorias

    Get PDF
    Dado um documento de entrada, um sistema de categorização multi-rótulo de texto tipicamente computa graus de crença para as categorias de um conjunto prédefinido, ordena as categorias por grau de crença, e atribui ao documento as categorias com grau de crença superior a um determinado limiar de poda. Idealmente, o grau de crença deveria informar a probabilidade do documento de fato pertencer à categoria. Infelizmente, ainda não existem categorizadores que computam tais probabilidades e mapear graus de crença em probabilidades é um problema ainda pouco explorado na área de RI. Neste trabalho, propomos um método baseado na regra de Bayes para mapear graus de crença em medidas de certeza de categorização multi-rótulo de texto. Propomos também uma estratégia para determinar limiares de poda baseada na medida de certeza de categorização - bayesian cut (BCut) - e uma variante para BCut - position based bayesian CUT (PBCut). Avaliamos experimentalmente o impacto dos métodos propostos no desempenho de duas técnicas de categorização multi-rótulo de texto, kvizinhos mais próximos multi-rótulo (ML-kNN) e rede neural sem peso do tipo VGRAM com correlação de dados (VG-RAM WNN-COR), no contexto da categorização de descrições de atividades econômicas de empresas brasileiras segundo a Classificação Nacional de Atividades Econômicas (CNAE). Investigamos também o impacto no desempenho de categorização multi-rótulo de texto de três métodos de poda comumente usados na literatura de RI - RCut, PCut, e SCut e uma variante de RCut - RTCut. Além disso, propomos novas variantes para PCut e SCut PCut* e SCut*, respectivamente para tratar problemas existentes nestas abordagens. Nossos resultados experimentais mostram que, usando nosso método de geração de medidas de certeza de categorização, é possível prever o quão certo está o categorizador de que as categorias por ele preditas são de fato pertinentes para um dado documento. Nossos resultados mostram também que o uso de nossas estratégias de poda BCut e PBCut produz desempenho de categorização superior ao de todas as outras estratégias consideradas em termos de precisão

    A Study of Predictive Control Strategies for Optimally Designed Solar Homes

    Get PDF
    This thesis investigates the development of predictive control strategies for optimally or near-optimally designed solar homes. Optimal design refers to the integration of renewable energy technologies (mainly active and passive solar) with a high-quality building envelope as well as efficiency and conservation measures to achieve substantial reductions in energy consumption and peak demand. Effective implementation of these technologies requires an integrated design approach, which considers their interactions with the building and its services. Furthermore, control strategies must be an essential part of the integrated design of a building to improve energy performance and ensure occupant comfort. In optimally designed solar homes, control strategies should incorporate the collection, storage and delivery of solar energy. Weather forecasts along with an understanding of the building’s thermal dynamics (e.g., time delays due to thermal mass) enable predicting and managing loads and solar energy availability. Design and operation strategies of a case study, the Alstonvale House, are presented. Features of this house include passive solar design, a building-integrated photovoltaic/thermal (BIPV/T) system coupled with a solar-assisted heat pump, a thermal energy storage tank and a radiant floor heating system in a thermally massive concrete slab. Design and control approaches developed for the Alstonvale House provided the basis for generalized control strategies applicable to optimally designed solar homes. Simplified building models, which can be derived from more detailed models or on-site measurements, can facilitate the implementation of predictive control techniques. In this investigation, model-based predictive control was applied to a radiant floor heating system and the position of roller blinds in a room with high solar gains. Predictive control can also be applied to optimize the operation of renewable energy systems. In this study, forecasts of heating loads and solar radiation were used in a dynamic programming algorithm to select a near-optimal set-point trajectory for an energy storage tank heated with a heat pump assisted by a BIPV/T system
    corecore