120 research outputs found
Facilitando a avaliação de taxonomias de tópicos automaticamente geradas no domínio do agronegócio.
O custo de avaliação de taxonomias automaticamente geradas costuma ser alto se realizado exclusivamente por especialistas do domínio. Neste trabalho propõe-se uma forma de validação objetiva para o vocabulário automaticamente obtido, com o qual uma taxonomia automaticamente gerada é representada. Para isso, o vocabulário gerado é comparado ao de uma taxonomia pré-existente, já validada, bem aceita e que use um thesaurus ou dicionário específico do domínio. Como taxonomias validadas foram utilizadas algumas árvores da Agência de Informação Embrapa e como vocabulário padrão o contido no Thesagro.SBIAgro 2009
A proposal for building domain topic taxonomies.
In this work a methodology to aid the process of organizing text collections is proposed, aiming to reflect exactly the existent and recoverable publications in a specific domain
Um modelo para a seleção de n-gramas significativos e não redundantes em tarefas de mineração de textos.
Uma proposta completa para resolver o problema de selecionar automaticamente atributos não redundantes do tipo n-gramas é apresentada neste trabalho. Geralmente, o uso de n-gramas é um requisito para melhorar a interpretação subjetiva dos resultados em tarefas de mineração de textos, nesses casos, eles são estatisticamente gerados e selecionados. Após a seleção, em geral, há a presença de redundâncias, por exemplo, o termo "informática agropecuária" e seus componentes "informática" e "agropecuária". Assim, propõe-se um modelo que envolve a remoção de stopwords estatisticamente identificadas, uma seleção estatística eficiente para os atributos do tipo n-grama e a remoção das redundâncias apresentadas após a seleção. Observa-se, pelos resultados experimentais apresentados, sobre os atributos originais e os atributos sem as redundâncias, que, como esperado, após a eliminação das redundâncias não há perda de representatividade. Além disso, a redução no número de atributos é expressiva, o que pode significar ganhos em desempenho nas tarefas de extração de padrões, bem como na interpretabilidade subjetiva dos resultados. Deve-se salientar que o método proposto é útil a qualquer algoritmo de aprendizado de máquina aplicado a uma tarefa de mineração de textos, e, parece ser igualmente aplicável a textos em quaisquer línguas.bitstream/item/32458/1/BolPesq23.pd
Winning some of the document preprocessing challenges in a text mining process.
Considering the huge growth of the number of documents in the digital universe and the possibility of obtaining some competitive advantage in processing them, this paper describes some of the difficulties of working with text collections. More specifically, it shows some of the challenges on the step considered one of the most important of the Text Mining process - the data preprocessing - focusing on two of its main tasks: attribute generation and selection, considering not only single terms but composed terms too. In order to overcome the challenges imposed by these problems, this paper presents efficient unsupervised solutions. The application of these solutions in three real data sets is presented in order to evaluate them and to show a way to treat the data step by step. Good results were obtained at the end of the whole process
Temperatura e umidade relativa nos processos de infecção do agente causal do oídio do cajueiro.
Objetivou-se avaliar os elementos climáticos temperatura e umidade relativa sobre os processos de infecção de Erysiphe quercicola, agente causal do oídio do cajueiro. Foi avaliado in vitro o efeito de onze temperaturas e cinco umidades relativas sobre a germinação, o comprimento do tubo germinativo e a formação de apressórios de conídios do fungo coletados em flores, e o efeito de três temperaturas e quatro umidades relativas sobre os conídios coletados em maturis.bitstream/item/214290/1/BP-203.pd
A“Dirty” Footprint: Macroinvertebrate diversity in Amazonian Anthropic Soils
International audienceAmazonian rainforests, once thought to be pristine wilderness, are increasingly known to have been widely inhabited, modified, and managed prior to European arrival, by human populations with diverse cultural backgrounds. Amazonian Dark Earths (ADEs) are fertile soils found throughout the Amazon Basin, created by pre-Columbian societies with sedentary habits. Much is known about the chemistry of these soils, yet their zoology has been neglected. Hence, we characterized soil fertility, macroinvertebrate communities, and their activity at nine archeological sites in three Amazonian regions in ADEs and adjacent reference soils under native forest (young and old) and agricultural systems. We found 673 morphospecies and, despite similar richness in ADEs (385 spp.) and reference soils (399 spp.), we identified a tenacious pre-Columbian footprint, with 49% of morphospecies found exclusively in ADEs. Termite and total macroinvertebrate abundance were higher in reference soils, while soil fertility and macroinvertebrate activity were higher in the ADEs, and associated with larger earthworm quantities and biomass. We show that ADE habitats have a unique pool of species, but that modern land use of ADEs decreases their populations, diversity, and contributions to soil functioning. These findings support the idea that humans created and sustained high-fertility ecosystems that persist today, altering biodiversity patterns in Amazonia
- …