35 research outputs found

    Ainfo: a experiência da Embrapa na disponibilização e recuperação de informação

    Get PDF
    O Ainfo é um sistema de informação desenvolvido pela Embrapa-CNPTIA que permite o gerenciamento, de forma integrada, de bases de dados documentais e processos bibliográficos, proporcionando rapidez e flexibilidade na captura, gerenciamento e recuperação de informações, além de oferecer aos seus usuários facilidade de uso. A partir da sua utilização nas bibliotecas da Embrapa, foi possível disponibilizar à sociedade em geral tanto a literatura adquirida quanto as teses e a produção científica dos pesquisadores da Embrapa e, também, uma grande e importante coleção de periódicos nacionais e internacionais, para consulta em CD-ROM e via Internet

    Analysis of rainfall homogeneous areas in time series of precipitation in the State of Bahia, Brazil

    Get PDF
    The aim of this study was to identify rainfall homogeneous areas in the State of Bahia, Brazil and analyze the climatic conditions of each area for the period between 1981 and 2010. It was applied a data mining technique, clustering (grouping of data), by using the k-means algorithm for transforming time series of precipitation in five rainfall homogeneous areas, in response to topography, maritime dimension, and weather systems operating in the region of study. Data of average monthly rainfall of 92 meteorological stations were used. The results indicate that the driest areas are situated in the central part of the state, from north to south, mainly in the north with the lowest annual volumes, around 480 mm. The area located in the north of the state contrasts with that one located on the coast, where the largest volumes of annual rainfall of the study were observed (approximately 1.380 mm). The high rainfall variability occurs in almost all areas, especially in two of those of semiarid ones with Coefficients of Variation (CV) reaching 42 and 28%. This characteristic differs from the area belonging to the coastal area, which presents regular rainfall during all the year and a CV of 15%. The rainy and dry seasons are well defined. Precipitation values of the rainy season accounts for about 81% of the annual total, with emphasis on the zones located in the central-west and west of the state with 95 and 96% of the annual total.O objetivo deste trabalho foi identificar zonas pluviometricamente homogêneas no Estado da Bahia e analisar as condições climáticas de cada zona entre 1981 e 2010. Foi aplicada a técnica de mineração de dados, Clusterização (agrupamento de dados), por meio do uso do algoritmo k-means, para transformação das séries históricas de precipitação em cinco zonas pluviometricamente homogêneas, em resposta à orografia, maritimidade e sistemas meteorológicos atuantes na região. Foram utilizados dados de médias mensais de precipitação de 92 estações meteorológicas. Os resultados apontam que as zonas mais secas estão situadas na parte central, de norte a sul do estado, principalmente ao norte com os menores volumes anuais, em torno de 480 mm. A zona localizada ao norte do estado é contrastante com a faixa litorânea, em que são observados os maiores volumes anuais de precipitação (1.380 mm aproximadamente). A alta variabilidade pluviométrica ocorre em quase todas as zonas, principalmente em duas do semiárido com coeficientes de variação (CV) iguais a 42 e 28%. Diferencia-se dessa característica a zona pertencente à faixa litorânea, que apresenta regularidade de chuvas durante todo o ano e CV de 15%. As estações chuvosas e secas estão bem definidas. Os valores de precipitação da estação chuvosa representam em torno de 81% dos totais anuais, com destaque para as zonas situadas no centro-oeste e oeste do estado, com 95 e 96% dos totais anuais.19219

    Mineração de dados e estimativa da mortalidade alta de frangos quando expostos a onda de calor

    Get PDF
    As ondas de calor provocam perdas na produção animal pela sua exposição ao estresse por calor aumentando a mortalidade, e consequentemente, perdas econômicas. Bancos de dados zootécnicos e meteorológicos históricos podem conter informações que permitem modelar a mortalidade de frangos devido à incidência de ondas de calor. O objetivo foi analisar bancos de dados de frangos de corte associados a dados meteorológicos utilizando técnicas de mineração de dados, seleção de atributos e classificação (árvore de decisão) para modelar o impacto da incidência de onda de calor na mortalidade de frangos de corte. O Índice de Temperatura e Umidade (ITU) foi utilizado para descrever parte dos dados ambientais. A técnica de Mineração de Dados permitiu a construção de três modelos compreensíveis para estimar a alta mortalidade em frangos de corte. Os modelos gerados pela abordagem de seleção de atributos por Análise dos Componentes Principais e Wrapper apresentaram igual desempenho com uma precisão total de 89,3% e a classificação para alta mortalidade foi de 83,3%. Quando a seleção foi feita por especialistas do domínio, a precisão do modelo foi de 85,7%, e a da classificação para alta mortalidade foi de 76,9%. Resultados meteorológicos e o ITU calculada a partir de estações meteorológicas permitiram identificar condições ambientais prejudiciais para frangos entre 29 e 42 dias de vida. A técnica de Mineração de Dados é aplicável para construir modelos preditivos para a produção animal.Heat waves usually result in losses of animal production since they are exposed to thermal stress inducing an increase in mortality and consequent economical losses. Animal science and meteorological databases from the last years contain enough data in the poultry production business to allow the modeling of mortality losses due to heat wave incidence. This research analyzes a database of broiler production associated to climatic data, using data mining techniques such as attribute selection and data classification (decision tree) to model the impact of heat wave incidence on broiler mortality. The temperature and humidity index (THI) was used for screening environmental data. The data mining techniques allowed the development of three comprehensible models for estimating specifically high mortality during broiler production. Two models yielded a classification accuracy of 89.3% by using Principal Component Analysis (PCA) and Wrapper feature selection approaches. Both models obtained a class precision of 0.83 for classifying high mortality. When the feature selection was made by the domain experts, the model accuracy reached 85.7%, while the class precision of high mortality was 0.76. Meteorological data and the calculated THI from meteorological stations were helpful to select the range of harmful environmental conditions for broilers 29 and 42 days old. The data mining techniques were useful for building animal production models

    Mineração de dados para inferência de relações solo-paisagem em mapeamentos digitais de solo

    Get PDF
    The objective of this work was to develop a methodology for digital soil mapping at a 1:100,000 scale by applying data mining techniques to preexisting relief descriptors and data from pedological and geological maps. A digital database was created from topographic and thematic maps, and allowed the generation of a digital elevation model (DEM) of the Dois Córregos (SP, Brazil) sheet (1:50,000 scale). The slope gradient, slope profile, contour profile, basin contributing area, and diagonal distance to drainage geomorphometric parameters were extracted from the DEM. The matrix which associated this georeferred data was analyzed by means of decision trees within the Weka machine-learning environment, and a model for soil mapping unit prediction was generated. The overall model accuracy increased from 54 to 61% when soil classes with no chances of being predicted were excluded. The association of data mining techniques with geographical information systems produced digital soil maps feasible to be used in studies requiring less detail than those made with the original reference soil maps.O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original

    Validação de um subconjunto de SNPs específicos para certificação racial de ovinos no Brasil

    Get PDF
    O objetivo deste trabalho foi avaliar a utilidade de um subconjunto de 18 polimorfismos de nucleotídeo único (SNPs) para a certificação das raças de ovinos Crioula Brasileira, Morada Nova (MN) e Santa Inês (SI). Dados de 588 animais foram analisados com o programa Structure. Em 82% dos casos, observou-se designação racial correta com confiança acima de 90%. A maioria dos casos de designação incorreta de raça foi observada em MN e SI. Portanto, apesar de o subconjunto de 18 SNPs ter confiabilidade elevada, ele não é suficiente para a inequívoca certificação das raças estudadas, principalmente das deslanadas. É necessário o desenvolvimento de um painel mais preciso para uso amplo em certificação racial.The objective of this work was to evaluate the usefulness of a subset of 18 single nucleotide polymorphisms (SNPs) for breed identification of Brazilian Crioula, Morada Nova (MN), and Santa Inês (SI) sheep. Data of 588 animals were analyzed with the Structure software. Assignments higher than 90% confidence were observed in 82% of the studied samples. Most of the low-value assignments were observed in MN and SI breeds. Therefore, although there is a high reliability in this subset of 18 SNPs, it is not enough for an unequivocal assignment of the studied breeds, mainly of hair breeds. A more precise panel still needs to be developed for the widespread use in breed assignment

    Ainfo: a experiência da Embrapa na disponibilização e recuperação de informação

    Get PDF
    O Ainfo é um sistema de informação desenvolvido pela Embrapa-CNPTIA que permite o gerenciamento, de forma integrada, de bases de dados documentais e processos bibliográficos, proporcionando rapidez e flexibilidade na captura, gerenciamento e recuperação de informações, além de oferecer aos seus usuários facilidade de uso. A partir da sua utilização nas bibliotecas da Embrapa, foi possível disponibilizar à sociedade em geral tanto a literatura adquirida quanto as teses e a produção científica dos pesquisadores da Embrapa e, também, uma grande e importante coleção de periódicos nacionais e internacionais, para consulta em CD-ROM e via Internet

    Preprocessing procedures and supervised classification applied to a database of systematic soil survey

    No full text
    Data Mining techniques play an important role in the prediction of soil spatial distribution in systematic soil surveying, though existing methodologies still lack standardization and a full understanding of their capabilities. The aim of this work was to evaluate the performance of preprocessing procedures and supervised classification approaches for predicting map units from 1:100,000-scale conventional semi-detailed soil surveys. Sheets of the Brazilian National Cartographic System on the 1:50,000 scale, “Dois Córregos” (“Brotas” 1:100,000-scale sheet), “São Pedro” and “Laras” (“Piracicaba” 1:100,000-scale sheet) were used for developing models. Soil map information and predictive environmental covariates for the dataset were obtained from the semi-detailed soil survey of the state of São Paulo, from the Brazilian Institute of Geography and Statistics (IBGE) 1:50,000-scale topographic sheets and from the 1:750,000-scale geological map of the state of São Paulo. The target variable was a soil map unit of four types: local “soil unit” name and soil class at three hierarchical levels of the Brazilian System of Soil Classification (SiBCS). Different data preprocessing treatments and four algorithms all having different approaches were also tested. Results showed that composite soil map units were not adequate for the machine learning process. Class balance did not contribute to improving the performance of classifiers. Accuracy values of 78 % and a Kappa index of 0.67 were obtained after preprocessing procedures with Random Forest, the algorithm that performed best. Information from conventional map units of semi-detailed (4th order) 1:100,000 soil survey generated models with values for accuracy, precision, sensitivity, specificity and Kappa indexes that support their use in programs for systematic soil surveying
    corecore