1,175 research outputs found

    Aplicando Mineração de Imagens na Agricultura de Precisão.

    Get PDF
    RESUMO: Análise de imagens de plantações estão consolidados no mercado da agricultura de precisão. Nesse sentido, a utilização de técnicas de processamento de imagem, mineração de imagem e inteligência artificial são ferramentas fundamentais. Podendo aplicar essas técnicas de maneira individual ou em conjunto. Um problema comum em análises de imagens é que pequenas mudanças na iluminação e no momento de tirar fotos podem influenciar como as técnicas computacionais identificam seus elementos. O custo é muito alto ou mesmo inviável para identificar ou segmentar uma imagem de forma universal. Sendo assim, é necessário um ponto de partida solido para guiar as técnicas existentes. Este estudo apresenta um experimento utilizando técnicas de mineração de imagens, associado a algoritmos de associação customizado. Utilizando o conhecimento do especialista para criar e rotular conjunto de pixel de interesse. Assim, ao processar uma imagem as classes de interesse são facilmente identificadas e ajustadas para cada realidade. Os resultados empíricos indicam que nossa solução aprimora a forma de seleção de padrões identificando as classes de interesse, identificando de maneira correta solo e vegetação. Os testes foram realizados em sete mosaicos diferentes da mesma plantação. O processo de identificação das classes desejadas (solo, plantação), ocorreram de maneira satisfatória validado assim nosso estudo como uma solução viável para agricultura de precisão. ABSTRACT: Crop image analysis are consolidated in the precision farming market. In this sense, the use of image processing techniques, image mining and artificial intelligence are fundamental tools. Being able to apply these techniques individually or together. A common problem in image analysis is that small changes in lighting and timing can influence how computational techniques identify its elements. The cost is too high or even unfeasible to universally identify or segment an image. As such, a solid starting point is needed to guide existing techniques. This study presents an experiment using image mining techniques, associated with custom association algorithms. Using expert knowledge to create and label pixel set of interest. Thus, when processing an image, the classes of interest are easily identified and adjusted for each reality. The empirical results indicate that our solution improves the way of selecting patterns by identifying the classes of interest, correctly identifying soil and vegetation. Tests were performed on seven different mosaics from the same culture. The process of identifying the desired classes (soil, plantation) occurred satisfactorily, thus validating our study as a viable solution for precision agriculture

    Extração de regras de associação em textos para apoiar a construção de portfólios tecnológicos.

    Get PDF
    O objetivo deste trabalho foi explorar o uso de técnicas para extração de regras de associação em um conjunto de textos para auxiliar a construção de portfólios tecnológicos. A metodologia adotada foi constituída de um processo de busca de documentos na literatura e um processo de mineração de textos, com a intenção de obter regras que indiquem relações entre tecnologias existentes, geolocalidades, tipos de solos, entre outras. Os resultados dos experimentos revelaram a necessidade de mudanças no processo de geração de regras, pois o formato e a quantidade dos dados utilizados resultou em matrizes altamente esparsas, com muitas classes e poucos atributos, o que não nos permitiu obter inferências com um nível de precisão aceitável. Nos próximos passos serão realizados ajustes nos experimentos para que as regras de associação geradas apresentem um nível de precisão aceitável, em termos de suporte e confiança

    Determinação das regras de associação de variáveis de tempo ponderadas baseadas em utilidades mediante a aplicação de uma árvore de padrões frequentes

    Get PDF
    Introduction: The present research was conducted at Birla Institute of Technology, off Campus in Noida, India, in 2017. Methods: To assess the efficiency of the proposed approach for information mining a method and an algorithm were proposed for mining time-variant weighted, utility-based association rules using fp-tree. Results: A method is suggested to find association rules on time-oriented frequency-weighted, utility-based data, employing a hierarchy for pulling-out item-sets and establish their association. Conclusions: The dimensions adopted while developing the approach compressed a large time-variant dataset to a smaller data structure at the same time fp-tree was kept away from the repetitive dataset, which finally gave us a noteworthy advantage in articulations of time and memory use. Originality: In the current period, high utility recurrent-pattern pulling-out is one of the mainly noteworthy study areas in time-variant information mining due to its capability to account for the frequency rate of item-sets and assorted utility rates of every item-set. This research contributes to maintain it at a corresponding level, which ensures to avoid generating a big amount of candidate-sets, which ensures further development of less execution time and search spaces. Limitations: The research results demonstrated that the projected approach was efficient on tested datasets with pre-defined weight and utility calculations.Introducción: la presente investigación se realizó en el Birla Institute of Technology, fuera del campus en Noida, India, en 2017. Métodos: para evaluar la eficacia del enfoque propuesto para la minería de información, se propusieron un método y un algoritmo para minar las reglas de asociación basadas en la utilidad ponderada en el tiempo usando un árbol de patrones frecuentes (fp). Resultados: se sugiere un método para encontrar reglas de asociación en datos basados en la utilidad ponderada en frecuencia orientada al tiempo, que emplea una jerarquía para extraer conjuntos de elementos y establecer su asociación. Conclusiones: las dimensiones adoptadas al desarrollar el enfoque comprimieron un gran conjunto de datos de variante de tiempo hasta alcanzar una estructura de datos más pequeña. A su vez, el árbol fp se mantuvo alejado del conjunto de datos repetitivos, lo que finalmente generó una ventaja considerable en tiempo y uso de memoria. Originalidad: en la actualidad, la extracción de patrones recurrentes de alta utilidad es una de las áreas de estudio más desarrollada en la minería de información con respecto a la variable temporal debido a su capacidad de dar cuenta de la frecuencia de los conjuntos de elementos y las tasas de servicios varios de cada conjunto de elementos. Esta investigación contribuye a mantener el estudio sobre el tema a un buen nivel, lo que permite evitar generar una gran cantidad de conjuntos posibles, y por ende garantiza mayor desarrollo en menores tiempos de ejecución y espacios de búsqueda. Limitaciones: Los resultados de la investigación demostraron que la aproximación fue eficiente en conjuntos de datos probados con cálculos predefinidos de peso y utilidad.Introdução: esta pesquisa foi realizada no Instituto Birla de Tecnologia e Ciência, fora do campus, em Noida, na Índia, em 2017. Métodos: para avaliar a eficácia do enfoque proposto para mineração de informação, foram propostos um método e um algoritmo para minerar as regras de associação baseadas na utilidade ponderada no tempo usando uma árvore de padrões frequentes (fp).Resultados: é recomendado um método para encontrar regras de associação nos dados baseados na utilidade ponderada em frequência orientada ao tempo, que emprega uma hierarquia para extrair conjuntos de elementos e estabelecer a associação entre eles.Conclusões: as dimensões utilizadas ao desenvolver o enfoque comprimiram um grande conjunto de dados de variante de tempo até alcançar uma estrutura de dados menor, enquanto isso, a árvore fp se manteve distante do conjunto de dados repetitivos, o que finalmente gerou uma vantagem considerável em tempo e uso de memória.Originalidade: na atualidade, a extração de padrões recorrentes de alta utilidade é uma das áreas de estudo mais desenvolvidas na mineração de informação com respeito à variável temporal, devido a sua capacidade de dar conta da frequência dos conjuntos de elementos e das taxas de serviços vários de cada conjunto de elementos. Esta pesquisa ajuda a manter o estudo desse tema em um nível avançado, o que garante evitar gerar uma grande quantidade de conjuntos possíveis e, dessa forma, um maior desenvolvimento em um menor tempo de execução e espaço de busca.Limitações: os resultados da pesquisa demonstraram que a aproximação foi eficiente em conjuntos de dados provados com cálculos predefinidos de peso e utilidade

    EXTRAÇÃO DE CONHECIMENTO A PARTIR DE REGRAS DE ASSOCIAÇÃO ENTRE MÉTRICAS DE CÓDIGO FONTE

    Get PDF
    Following and register all the produced artifacts along the software development with the source code metrics and commits messages can be a hard task as the software grows in size and complexity. Data Mining tools, such as the Knowledge Discovery in Database (KDD), can be a helpful resource to detect patterns, characteristics and aspects of the development process and team. This paper presents the use of Association Rules in source code metrics with the goal to extract knowledge of source code repositories to identify important features in software's development. A model based on KDD described and a prototype implementing this model was developed. The prototype is characterized as a primary study relative to the application of the model in an example. This study was conducted aiming to characterize the use of the model in a specific context and serves as proof of concept. Various Apache Foundation’s projects evaluated to extract generalizable patterns of the developers and the impacts in the software product. Based on the outcomes of this tool, project managers can easily identify when the development process is in unwanted way and decide new strategies to put it on the right way. With this, it is concluded that knowledge extraction in source code repositories can be a helpful tool to support the decision-making on the software development

    Desvelando ecossistemas de inovação no setor público : um estudo Brasil-Espanha

    Get PDF
    Tese (doutorado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade e Gestão Pública, Programa de Pós-Graduação em Administração, 2021.Diante da relevância que o fenômeno inovação representa para as organizações públicas frente aos desafios sociais atuais, esta tese objetivou analisar a inovação no setor público à luz de uma perspectiva ecossistêmica e interacional. A pesquisa está estruturada em torno de três estudos em formato de artigo científico, precedidos de introdução e sucedidos por conclusão. A partir de revisão sistemática de literatura que abrange produção científica relevante, o estudo 1 se utilizou dos pressupostos teóricos dos autores Gallouj e Weinstein (1997); Djellal e Gallouj (2008); Djellal, Gallouj e Miles (2013); e Gallouj et al. (2018), para evidenciar lacuna teórico- metodológica de pesquisa relativa ao sistema que mobiliza um conjunto de atores, componentes e recursos para criação e implementação, de forma colaborativa, de inovações que gerem valor público para a sociedade e para as organizações públicas, sendo este conceituado na presente pesquisa como ecossistema de inovação no setor público. Entende-se como atores, componentes e recursos o conjunto de dimensões e categorias essenciais à configuração e ao funcionamento do referido ecossistema. Não obstante, foi proposta uma matriz analítica desse ecossistema por meio de sete dimensões principais relacionadas com a inovação no setor público: atores do ecossistema e suas respectivas naturezas; competências e preferências desses atores; meios para inovação; natureza da inovação; e, geração de valor público. O estudo 2 possui abordagem qualitativa e comparada com o objetivo de caracterizar os atores, componentes e recursos dos ecossistemas de inovação no setor público do Brasil e Espanha. Para tal, foram utilizadas como objeto de análise de conteúdo 224 experiências de inovação no setor público premiadas dos respectivos países, no período de 2007 a 2018. Os resultados apresentam uma base de dados com descrição longitudinal do fenômeno que consolidam evidências empíricas classificadas em sete dimensões e 33 categorias relacionadas com os ecossistemas de inovação no setor público brasileiro e espanhol. Para além do exposto, os dados analisados revelaram ecossistemas com característica endógena, três novas categorias relacionadas com as dimensões preferências dos atores do ecossistema (melhoria de desempenho) e geração de valor público (sustentabilidade e transparência da informação), bem como variáveis que traduzem práticas da inovação pública. E o estudo 3 dispõe de abordagem multimétodo, por meio da aplicação da Inteligência Artificial, mineração de dados e regras de associação, cujo objetivo é mapear as relações entre os atores, componentes e recursos associados aos ecossistemas de inovação no setor público brasileiro e espanhol. Os resultados revelam 12 regras de associação oriundas da extração de conhecimento relativo aos ecossistemas de inovação pública dos dois países. Outrossim, resulta como pressuposto desta tese que o ecossistema de inovação no setor público está associado à interação de competências, preferências, naturezas e meios, mobilizados por múltiplos atores, na busca pela geração de valor público. Oportuniza-se com esta pesquisa, o avanço do conhecimento teórico-empírico da inovação do setor público, visando subsidiar informações aos projetos e políticas sociais inovadoras.Given the relevance that the innovation phenomenon represents to public organizations in the face of current social challenges, this thesis aimed to analyze public sector innovation from an ecosystem and interactional perspective. The research is structured around three studies in scientific article format, preceded by an introduction and followed by a conclusion. Based on a systematic review of literature that covers relevant scientific production, study 1 used the theoretical frameworks of authors Gallouj and Weinstein (1997), Djellal and Gallouj (2008), Djellal, Gallouj and Miles (2013), and Gallouj et al. (2018), to highlight a theoretical- methodological research gap related to the system that mobilizes a set of actors, components, and resources for the collaborative creation and implementation of innovations that generate public value for society and public organizations, which was conceptualized in the research as public sector innovation ecosystem. Actors, components, and resources mean the set of dimensions and categories which are essential to the configuration and functioning of the ecosystem. Nevertheless, an analytical matrix of this ecosystem was proposed through seven main dimensions related to public sector innovation: ecosystem actors and their respective natures; skills and preferences of these actors; means for innovation; nature of innovation; and, generating public value. Study 2 has a qualitative and comparative approach in order to characterize the actors, components, and resources of the public sector innovation ecosystem in Brazil and Spain. For this purpose, 224 award-winning public sector innovation experiences from the respective countries, from 2007 to 2018, were used as the object of content analysis. The results present a database with a longitudinal description of the phenomenon that consolidates empirical evidence classified into seven dimensions and 33 categories related to the innovation ecosystems in the Brazilian and Spanish public sector. In addition, the analyzed data revealed ecosystems with endogenous characteristics, three new categories related to the dimension preferences of ecosystem actors (performance improvement) and generation of public value (sustainability and transparency of information), as well as variables that reflect practices of public innovation. In addition, study 3 has a multi-method approach, through the application of Artificial Intelligence, data mining, and association rules, whose objective is to map the relationships between the actors, components, and resources associated with innovation ecosystems in the Brazilian and Spanish public sector. The results reveal 12 association rules derived from the extraction of knowledge related to the public innovation ecosystems of the two countries. Furthermore, this thesis presupposes that the public sector innovation ecosystem is associated with the interaction of competences, preferences, natures, and means, mobilized by multiple actors, in the search for the generation of public value. This research provides opportunities for the advancement of theoretical-empirical knowledge of public sector innovation, aiming to support information for innovative social projects and policies.Ante la relevancia que el fenómeno innovación representa para las organizaciones públicas frente a los desafíos sociales actuales, esta tesis tiene como objetivo analizar la innovación en el sector público desde una perspectiva ecosistémica e interaccional. La investigación se estructura en torno a tres estudios en formato de artículo científico, precedidos de una introducción y seguidos de una conclusión. A partir de la revisión sistemática de la literatura que cubre la producción científica relevante, el estudio 1 utilizó los supuestos teóricos de los autores Gallouj y Weinstein (1997), Djellal y Gallouj (2008), Djellal, Gallouj y Miles (2013) y Gallouj et al. (2018), para resaltar la laguna teórico-metodológica de investigación relacionada con el sistema que moviliza un conjunto de actores, componentes y recursos para la creación e implementación colaborativa de innovaciones que generen valor público para la sociedad y las organizaciones públicas, que se conceptualiza en la presente investigación como ecosistema de innovación en el sector público. Los actores, componentes y recursos se entienden como el conjunto de dimensiones y categorías esenciales para la configuración y funcionamiento de ese ecosistema. No obstante, se ha propuesto una matriz analítica de este ecosistema a través de siete dimensiones principales relacionadas con la innovación en el sector público: actores del ecosistema y sus respectivas naturalezas; competencias y preferencias de estos actores; medios para la innovación; naturaleza de la innovación; y generación de valor público. El estudio 2 tiene un enfoque cualitativo y comparativo para caracterizar los actores, componentes y recursos de los ecosistemas de innovación en el sector público en Brasil y España. Para ello, fueron utilizadas como objeto de análisis de contenido 224 experiencias de innovación en el sector público premiadas en los respectivos países, en el período de 2007 a 2018. Los resultados presentan una base de datos con una descripción longitudinal del fenómeno que consolida evidencias empíricas clasificadas en siete dimensiones y 33 categorías relacionadas con los ecosistemas de innovación en el sector público brasileño y español. Además, los datos analizados revelaron ecosistemas con características endógenas, tres nuevas categorías relacionadas con las dimensiones preferencias de los actores del ecosistema (mejora del desempeño) y generación de valor público (sostenibilidad y transparencia de la información), así como variables que traducen prácticas de innovación pública. Y el estudio 3 tiene un enfoque multimétodo, a través de la aplicación de Inteligencia Artificial, minería de datos y reglas de asociación, cuyo objetivo es mapear las relaciones entre los actores, componentes y recursos asociados a los ecosistemas de innovación en el sector público brasileño y español. Los resultados revelan 12 reglas de asociación que permiten la extracción de conocimiento relacionado con el ecosistema de innovación pública de los dos países. Como resultado de esta tesis, el ecosistema de innovación en el sector público se asocia a la interacción de competencias, preferencias, naturalezas y medios, movilizados por múltiples actores, en la búsqueda de la generación de valor público. Esta investigación oportuniza el avance del conocimiento teórico-empírico de la innovación del sector público, con el objetivo de subvencionar informaciones para los proyectos y políticas sociales innovadores

    Extração de associações entre itens de um portfólio de tecnologias agrícolas.

    Get PDF
    Este trabalho apresenta uma metodologia para a extração de regras de associação de um portfólio de tecnologias agrícolas, geradas a partir de publicações científicas. Foi necessário semiautomatizar o processo de construção do portfólio, dada a quantidade expressiva de textos que foram selecionados do Sistema Aberto e Integrado de Informação em Agricultura (SABIIA). A partir desse portfólio foram geradas regras de associação para identificar as relações existentes entre atributos como solo, tecnologias, localidade e culturas, a fim de subsidiar especialistas do domínio, especialmente de agricultura irrigada, na verificação de quais tecnologias podem ser adaptadas para os biomas brasileiro

    Resumos expandidos...

    Get PDF
    A Mostra, que acontece anualmente na Embrapa Informática Agropecuária, tem como objetivo divulgar os trabalhos desenvolvidos pelos estudantes na Unidade, além permitir que os mesmos vivenciem a experiência de um evento científico.Editores técnicos: Giampaolo Queiroz Pellegrino, Maria Giulia Croce, Poliana Fernanda Giachetto, Stanley Robson de Medeiros Oliveira

    Aplicação de kdd em dados de iterações de desenvolvimento de software

    Get PDF
    Orientador: Prof. Dr. Jaime WojciechowskiMonografia (especialização) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Curso de Especialização em Inteligência Artificial Aplicada.Inclui referências: 26-27Resumo: O software está presente em várias categorias de sistemas atualmente. Ele pode ser desenvolvido de diferentes formas, o Desenvolvimento Iterativo é uma delas. Esse modelo de processo de software é a base para processos ou métodos amplamente praticados na indústria de software. Ele é capaz de lidar mais facilmente com softwares modernos, os quais estão cada vez complexos e exigindo entregas mais frequentes que agreguem valor ao serviço ou produto do cliente. Nessa abordagem o software é desenvolvido por meio de várias iterações. Esse processo pode gerar um grande volume de dados tornando- se inviável uma análise manual. É comum, portanto, que grandes empresas apliquem métodos ou processos específicos para obter conhecimento a partir desses dados para na sequência difundi-lo dentre os seus integrantes buscando melhorar seus processos produtivos. Nesse contexto, o objetivo deste trabalho foi identificar modelos e padrões que sejam válidos e potencialmente interpretáveis de tal forma que possam auxiliar as equipes de software na tomada de decisões inerente à realização de iterações de desenvolvimento de software. Esse objetivo foi norteado pelas seguintes questões, dadas as informações históricas dessas iterações: "é possível prever o resultado de uma iteração?" e "esses dados podem revelar algum padrão relacionado às práticas das equipes de software?". Para alcançar esse objetivo, foi aplicado um método de estudo baseado no KDD-process envolvendo dados de projetos reais e as técnicas de mineração de dados Árvore de Decisão e Floresta Aleatória. Foram identificados modelos capazes de prever o sucesso (ou falha) de uma iteração de software com até 93% de acurácia e padrões que evidenciam, por exemplo, a importância da prática de constantemente analisar e refinar os itens do backlog do produto

    Técnicas de mineração incrementais em recuperação de informação

    Get PDF
    [EN] A desirable property of learning algorithms is the ability of incorporating new data in an incremental way. Incremental algorithms have received attention on the last few years. Particulary Bayesian networks, this is due to the hardness of the task. In Bayesian networks one example can change the whole structure of the Bayesian network. In this theses we focus on incremental induction of Tree Augmented Naive Bayes (TAN) algorithm. A incremental version of TAN saves computing time, is more suite to data mining and concept drift. But, as usual in Bayesian learning TAN is restricted to discrete attributes. Complementary to the incremental TAN, we propose an incremental discretization algorithm, necessary to evaluate TAN in domains with continuous attribute. Discretization is a fundamental pre-processing step for some well- known algorithms, the topic of incremental discretization has received few attention from the community. This theses has two major contributions, the benefict of both proposals is incremental learning, one for TAN and the other for discretization.We present and test a algorithm that rebuilds the network structure of tree augmented naive Bayes (TAN) based on the weighted sum of vectors containing the mutual information. We also present a new discretization method, this works in two layers. This two-stage architecture is very fexible. It can be used as supervised or unsupervised. For the second layer any base discretization method can be used: equal width, equal frequency, recursive entropy discretization, chi-merge, etc. The most relevant aspect is that the boundaries of the intervals of the second layer can change when new data is available. We tested experimentally the incremental approach to discretization with batch and incremental learners. The experimental evaluation of incremental TAN shows a perfor mance similar to the batch version. Similar remarks apply to incremental discretization. This is a relevant aspect, because few works in machine learning address the fundamental aspect of incremental discretization. We believe that with Incremental discretization, the evaluation of the incremental algorithms can become more realistic and accurate. We evaluated two versions of incremental discretization: supervised and unsupervised. We have seen that this feature can improve accuracy for the incremental learners and that the preview of future algorithm performance can be more precise. This method of discretization has another advantages, like, can be used with large data set's or can be used in dynamic environments with concept drift, areas where a batch discretization can be difficult or is not adequate.[ES] Esta tesis tenía como objetivo el estudio de una red Bayesiana (TAN) incremental. Durante el transcurso de esta se verificó la laguna en el área de una discretización incremental para la evaluación de un algoritmo incremental. Así se procuró dar como contribución para el área no solo un clasificador Bayesiano incremental sino también un modo de evaluación correcto del clasificador. Los Sistemas de Recuperación de Información tienen como objetivo la realización de las tareas de indexación, búsqueda y clasificación de documentos (expresos en la forma textual), con el fin de satisfacer la necesidad de información del individuo, generalmente expresa a través de consultas. La necesidad de información puede ser entendida como la búsqueda de respuestas para determinadas cuestiones que tienen que ser resueltas, la recuperación de documentos que tratan sobre un determinado asunto o incluso la relación entre asuntos

    Extração de portfólio de tecnologias de irrigação a partir de publicações científicas.

    Get PDF
    O objetivo do trabalho é apresentar uma metodologia para extração de portfólio de tecnologias de irrigação, a partir de publicações científicas, para melhorar o uso sustentável da água na agricultura
    corecore