1,175 research outputs found
Aplicando Mineração de Imagens na Agricultura de Precisão.
RESUMO: Análise de imagens de plantações estão consolidados no mercado da agricultura de precisão. Nesse sentido, a utilização de técnicas de processamento de imagem, mineração de imagem e inteligência artificial são ferramentas fundamentais. Podendo aplicar essas técnicas de maneira individual ou em conjunto. Um problema comum em análises de imagens é que pequenas mudanças na iluminação e no momento de tirar fotos podem influenciar como as técnicas computacionais identificam seus elementos. O custo é muito alto ou mesmo inviável para identificar ou segmentar uma imagem de forma universal. Sendo assim, é necessário um ponto de partida solido para guiar as técnicas existentes. Este estudo apresenta um experimento utilizando técnicas de mineração de imagens, associado a algoritmos de associação customizado. Utilizando o conhecimento do especialista para criar e rotular conjunto de pixel de interesse. Assim, ao processar uma imagem as classes de interesse são facilmente identificadas e ajustadas para cada realidade. Os resultados empíricos indicam que nossa solução aprimora a forma de seleção de padrões identificando as classes de interesse, identificando de maneira correta solo e vegetação. Os testes foram realizados em sete mosaicos diferentes da mesma plantação. O processo de identificação das classes desejadas (solo, plantação), ocorreram de maneira satisfatória validado assim nosso estudo como uma solução viável para agricultura de precisão. ABSTRACT: Crop image analysis are consolidated in the precision farming market. In this sense, the use of image processing techniques, image mining and artificial intelligence are fundamental tools. Being able to apply these techniques individually or together. A common problem in image analysis is that small changes in lighting and timing can influence how computational techniques identify its elements. The cost is too high or even unfeasible to universally identify or segment an image. As such, a solid starting point is needed to guide existing techniques. This study presents an experiment using image mining techniques, associated with custom association algorithms. Using expert knowledge to create and label pixel set of interest. Thus, when processing an image, the classes of interest are easily identified and adjusted for each reality. The empirical results indicate that our solution improves the way of selecting patterns by identifying the classes of interest, correctly identifying soil and vegetation. Tests were performed on seven different mosaics from the same culture. The process of identifying the desired classes (soil, plantation) occurred satisfactorily, thus validating our study as a viable solution for precision agriculture
Extração de regras de associação em textos para apoiar a construção de portfólios tecnológicos.
O objetivo deste trabalho foi explorar o uso de técnicas para extração de regras de associação em um conjunto de textos para auxiliar a construção de portfólios tecnológicos. A metodologia adotada foi constituída de um processo de busca de documentos na literatura e um processo de mineração de textos, com a intenção de obter regras que indiquem relações entre tecnologias existentes, geolocalidades, tipos de solos, entre outras. Os resultados dos experimentos revelaram a necessidade de mudanças no processo de geração de regras, pois o formato e a quantidade dos dados utilizados resultou em matrizes altamente esparsas, com muitas classes e poucos atributos, o que não nos permitiu obter inferências com um nível de precisão aceitável. Nos próximos passos serão realizados ajustes nos experimentos para que as regras de associação geradas apresentem um nível de precisão aceitável, em termos de suporte e confiança
Determinação das regras de associação de variáveis de tempo ponderadas baseadas em utilidades mediante a aplicação de uma árvore de padrões frequentes
Introduction: The present research was conducted at Birla Institute of Technology, off Campus in Noida, India, in 2017.
Methods: To assess the efficiency of the proposed approach for information mining a method and an algorithm were proposed for mining time-variant weighted, utility-based association rules using fp-tree.
Results: A method is suggested to find association rules on time-oriented frequency-weighted, utility-based data, employing a hierarchy for pulling-out item-sets and establish their association.
Conclusions: The dimensions adopted while developing the approach compressed a large time-variant dataset to a smaller data structure at the same time fp-tree was kept away from the repetitive dataset, which finally gave us a noteworthy advantage in articulations of time and memory use.
Originality: In the current period, high utility recurrent-pattern pulling-out is one of the mainly noteworthy study areas in time-variant information mining due to its capability to account for the frequency rate of item-sets and assorted utility rates of every item-set. This research contributes to maintain it at a corresponding level, which ensures to avoid generating a big amount of candidate-sets, which ensures further development of less execution time and search spaces.
Limitations: The research results demonstrated that the projected approach was efficient on tested datasets with pre-defined weight and utility calculations.Introducción: la presente investigación se realizó en el Birla Institute of Technology, fuera del campus en Noida, India, en 2017.
Métodos: para evaluar la eficacia del enfoque propuesto para la minería de información, se propusieron un método y un algoritmo para minar las reglas de asociación basadas en la utilidad ponderada en el tiempo usando un árbol de patrones frecuentes (fp).
Resultados: se sugiere un método para encontrar reglas de asociación en datos basados en la utilidad ponderada en frecuencia orientada al tiempo, que emplea una jerarquía para extraer conjuntos de elementos y establecer su asociación.
Conclusiones: las dimensiones adoptadas al desarrollar el enfoque comprimieron un gran conjunto de datos de variante de tiempo hasta alcanzar una estructura de datos más pequeña. A su vez, el árbol fp se mantuvo alejado del conjunto de datos repetitivos, lo que finalmente generó una ventaja considerable en tiempo y uso de memoria.
Originalidad: en la actualidad, la extracción de patrones recurrentes de alta utilidad es una de las áreas de estudio más desarrollada en la minería de información con respecto a la variable temporal debido a su capacidad de dar cuenta de la frecuencia de los conjuntos de elementos y las tasas de servicios varios de cada conjunto de elementos. Esta investigación contribuye a mantener el estudio sobre el tema a un buen nivel, lo que permite evitar generar una gran cantidad de conjuntos posibles, y por ende garantiza mayor desarrollo en menores tiempos de ejecución y espacios de búsqueda.
Limitaciones: Los resultados de la investigación demostraron que la aproximación fue eficiente en conjuntos de datos probados con cálculos predefinidos de peso y utilidad.Introdução: esta pesquisa foi realizada no Instituto Birla de Tecnologia e Ciência, fora do campus, em Noida, na Índia, em 2017. Métodos: para avaliar a eficácia do enfoque proposto para mineração de informação, foram propostos um método e um algoritmo para minerar as regras de associação baseadas na utilidade ponderada no tempo usando uma árvore de padrões frequentes (fp).Resultados: é recomendado um método para encontrar regras de associação nos dados baseados na utilidade ponderada em frequência orientada ao tempo, que emprega uma hierarquia para extrair conjuntos de elementos e estabelecer a associação entre eles.Conclusões: as dimensões utilizadas ao desenvolver o enfoque comprimiram um grande conjunto de dados de variante de tempo até alcançar uma estrutura de dados menor, enquanto isso, a árvore fp se manteve distante do conjunto de dados repetitivos, o que finalmente gerou uma vantagem considerável em tempo e uso de memória.Originalidade: na atualidade, a extração de padrões recorrentes de alta utilidade é uma das áreas de estudo mais desenvolvidas na mineração de informação com respeito à variável temporal, devido a sua capacidade de dar conta da frequência dos conjuntos de elementos e das taxas de serviços vários de cada conjunto de elementos. Esta pesquisa ajuda a manter o estudo desse tema em um nível avançado, o que garante evitar gerar uma grande quantidade de conjuntos possíveis e, dessa forma, um maior desenvolvimento em um menor tempo de execução e espaço de busca.Limitações: os resultados da pesquisa demonstraram que a aproximação foi eficiente em conjuntos de dados provados com cálculos predefinidos de peso e utilidade
EXTRAÇÃO DE CONHECIMENTO A PARTIR DE REGRAS DE ASSOCIAÇÃO ENTRE MÉTRICAS DE CÓDIGO FONTE
Following and register all the produced artifacts along the software development with the source code metrics and commits messages can be a hard task as the software grows in size and complexity. Data Mining tools, such as the Knowledge Discovery in Database (KDD), can be a helpful resource to detect patterns, characteristics and aspects of the development process and team. This paper presents the use of Association Rules in source code metrics with the goal to extract knowledge of source code repositories to identify important features in software's development. A model based on KDD described and a prototype implementing this model was developed. The prototype is characterized as a primary study relative to the application of the model in an example. This study was conducted aiming to characterize the use of the model in a specific context and serves as proof of concept. Various Apache Foundation’s projects evaluated to extract generalizable patterns of the developers and the impacts in the software product. Based on the outcomes of this tool, project managers can easily identify when the development process is in unwanted way and decide new strategies to put it on the right way. With this, it is concluded that knowledge extraction in source code repositories can be a helpful tool to support the decision-making on the software development
Desvelando ecossistemas de inovação no setor público : um estudo Brasil-Espanha
Tese (doutorado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade e Gestão Pública, Programa de Pós-Graduação em Administração, 2021.Diante da relevância que o fenômeno inovação representa para as organizações públicas frente
aos desafios sociais atuais, esta tese objetivou analisar a inovação no setor público à luz de uma
perspectiva ecossistêmica e interacional. A pesquisa está estruturada em torno de três estudos
em formato de artigo científico, precedidos de introdução e sucedidos por conclusão. A partir
de revisão sistemática de literatura que abrange produção científica relevante, o estudo 1 se
utilizou dos pressupostos teóricos dos autores Gallouj e Weinstein (1997); Djellal e Gallouj
(2008); Djellal, Gallouj e Miles (2013); e Gallouj et al. (2018), para evidenciar lacuna teórico-
metodológica de pesquisa relativa ao sistema que mobiliza um conjunto de atores, componentes
e recursos para criação e implementação, de forma colaborativa, de inovações que gerem valor
público para a sociedade e para as organizações públicas, sendo este conceituado na presente
pesquisa como ecossistema de inovação no setor público. Entende-se como atores,
componentes e recursos o conjunto de dimensões e categorias essenciais à configuração e ao
funcionamento do referido ecossistema. Não obstante, foi proposta uma matriz analítica desse
ecossistema por meio de sete dimensões principais relacionadas com a inovação no setor
público: atores do ecossistema e suas respectivas naturezas; competências e preferências desses
atores; meios para inovação; natureza da inovação; e, geração de valor público. O estudo 2
possui abordagem qualitativa e comparada com o objetivo de caracterizar os atores,
componentes e recursos dos ecossistemas de inovação no setor público do Brasil e Espanha.
Para tal, foram utilizadas como objeto de análise de conteúdo 224 experiências de inovação no
setor público premiadas dos respectivos países, no período de 2007 a 2018. Os resultados
apresentam uma base de dados com descrição longitudinal do fenômeno que consolidam
evidências empíricas classificadas em sete dimensões e 33 categorias relacionadas com os
ecossistemas de inovação no setor público brasileiro e espanhol. Para além do exposto, os dados
analisados revelaram ecossistemas com característica endógena, três novas categorias
relacionadas com as dimensões preferências dos atores do ecossistema (melhoria de
desempenho) e geração de valor público (sustentabilidade e transparência da informação), bem
como variáveis que traduzem práticas da inovação pública. E o estudo 3 dispõe de abordagem
multimétodo, por meio da aplicação da Inteligência Artificial, mineração de dados e regras de
associação, cujo objetivo é mapear as relações entre os atores, componentes e recursos
associados aos ecossistemas de inovação no setor público brasileiro e espanhol. Os resultados
revelam 12 regras de associação oriundas da extração de conhecimento relativo aos
ecossistemas de inovação pública dos dois países. Outrossim, resulta como pressuposto desta
tese que o ecossistema de inovação no setor público está associado à interação de competências,
preferências, naturezas e meios, mobilizados por múltiplos atores, na busca pela geração de
valor público. Oportuniza-se com esta pesquisa, o avanço do conhecimento teórico-empírico
da inovação do setor público, visando subsidiar informações aos projetos e políticas sociais
inovadoras.Given the relevance that the innovation phenomenon represents to public organizations in the
face of current social challenges, this thesis aimed to analyze public sector innovation from an
ecosystem and interactional perspective. The research is structured around three studies in
scientific article format, preceded by an introduction and followed by a conclusion. Based on a
systematic review of literature that covers relevant scientific production, study 1 used the
theoretical frameworks of authors Gallouj and Weinstein (1997), Djellal and Gallouj (2008),
Djellal, Gallouj and Miles (2013), and Gallouj et al. (2018), to highlight a theoretical-
methodological research gap related to the system that mobilizes a set of actors, components,
and resources for the collaborative creation and implementation of innovations that generate
public value for society and public organizations, which was conceptualized in the research as
public sector innovation ecosystem. Actors, components, and resources mean the set of
dimensions and categories which are essential to the configuration and functioning of the
ecosystem. Nevertheless, an analytical matrix of this ecosystem was proposed through seven
main dimensions related to public sector innovation: ecosystem actors and their respective
natures; skills and preferences of these actors; means for innovation; nature of innovation; and,
generating public value. Study 2 has a qualitative and comparative approach in order to
characterize the actors, components, and resources of the public sector innovation ecosystem
in Brazil and Spain. For this purpose, 224 award-winning public sector innovation experiences
from the respective countries, from 2007 to 2018, were used as the object of content analysis.
The results present a database with a longitudinal description of the phenomenon that
consolidates empirical evidence classified into seven dimensions and 33 categories related to
the innovation ecosystems in the Brazilian and Spanish public sector. In addition, the analyzed
data revealed ecosystems with endogenous characteristics, three new categories related to the
dimension preferences of ecosystem actors (performance improvement) and generation of
public value (sustainability and transparency of information), as well as variables that reflect
practices of public innovation. In addition, study 3 has a multi-method approach, through the
application of Artificial Intelligence, data mining, and association rules, whose objective is to
map the relationships between the actors, components, and resources associated with
innovation ecosystems in the Brazilian and Spanish public sector. The results reveal 12
association rules derived from the extraction of knowledge related to the public innovation
ecosystems of the two countries. Furthermore, this thesis presupposes that the public sector
innovation ecosystem is associated with the interaction of competences, preferences, natures,
and means, mobilized by multiple actors, in the search for the generation of public value. This
research provides opportunities for the advancement of theoretical-empirical knowledge of
public sector innovation, aiming to support information for innovative social projects and
policies.Ante la relevancia que el fenómeno innovación representa para las organizaciones públicas
frente a los desafíos sociales actuales, esta tesis tiene como objetivo analizar la innovación en
el sector público desde una perspectiva ecosistémica e interaccional. La investigación se
estructura en torno a tres estudios en formato de artículo científico, precedidos de una
introducción y seguidos de una conclusión. A partir de la revisión sistemática de la literatura
que cubre la producción científica relevante, el estudio 1 utilizó los supuestos teóricos de los
autores Gallouj y Weinstein (1997), Djellal y Gallouj (2008), Djellal, Gallouj y Miles (2013) y
Gallouj et al. (2018), para resaltar la laguna teórico-metodológica de investigación relacionada
con el sistema que moviliza un conjunto de actores, componentes y recursos para la creación e
implementación colaborativa de innovaciones que generen valor público para la sociedad y las
organizaciones públicas, que se conceptualiza en la presente investigación como ecosistema de
innovación en el sector público. Los actores, componentes y recursos se entienden como el
conjunto de dimensiones y categorías esenciales para la configuración y funcionamiento de ese
ecosistema. No obstante, se ha propuesto una matriz analítica de este ecosistema a través de
siete dimensiones principales relacionadas con la innovación en el sector público: actores del
ecosistema y sus respectivas naturalezas; competencias y preferencias de estos actores; medios
para la innovación; naturaleza de la innovación; y generación de valor público. El estudio 2
tiene un enfoque cualitativo y comparativo para caracterizar los actores, componentes y
recursos de los ecosistemas de innovación en el sector público en Brasil y España. Para ello,
fueron utilizadas como objeto de análisis de contenido 224 experiencias de innovación en el
sector público premiadas en los respectivos países, en el período de 2007 a 2018. Los resultados
presentan una base de datos con una descripción longitudinal del fenómeno que consolida
evidencias empíricas clasificadas en siete dimensiones y 33 categorías relacionadas con los
ecosistemas de innovación en el sector público brasileño y español. Además, los datos
analizados revelaron ecosistemas con características endógenas, tres nuevas categorías
relacionadas con las dimensiones preferencias de los actores del ecosistema (mejora del
desempeño) y generación de valor público (sostenibilidad y transparencia de la información),
así como variables que traducen prácticas de innovación pública. Y el estudio 3 tiene un enfoque
multimétodo, a través de la aplicación de Inteligencia Artificial, minería de datos y reglas de
asociación, cuyo objetivo es mapear las relaciones entre los actores, componentes y recursos
asociados a los ecosistemas de innovación en el sector público brasileño y español. Los
resultados revelan 12 reglas de asociación que permiten la extracción de conocimiento
relacionado con el ecosistema de innovación pública de los dos países. Como resultado de esta
tesis, el ecosistema de innovación en el sector público se asocia a la interacción de
competencias, preferencias, naturalezas y medios, movilizados por múltiples actores, en la
búsqueda de la generación de valor público. Esta investigación oportuniza el avance del
conocimiento teórico-empírico de la innovación del sector público, con el objetivo de
subvencionar informaciones para los proyectos y políticas sociales innovadores
Extração de associações entre itens de um portfólio de tecnologias agrícolas.
Este trabalho apresenta uma metodologia para a extração de regras de associação de um portfólio de tecnologias agrícolas, geradas a partir de publicações científicas. Foi necessário semiautomatizar o processo de construção do portfólio, dada a quantidade expressiva de textos que foram selecionados do Sistema Aberto e Integrado de Informação em Agricultura (SABIIA). A partir desse portfólio foram geradas regras de associação para identificar as relações existentes entre atributos como solo, tecnologias, localidade e culturas, a fim de subsidiar especialistas do domínio, especialmente de agricultura irrigada, na verificação de quais tecnologias podem ser adaptadas para os biomas brasileiro
Resumos expandidos...
A Mostra, que acontece anualmente na Embrapa Informática Agropecuária, tem como objetivo divulgar os trabalhos desenvolvidos pelos estudantes na Unidade, além permitir que os mesmos vivenciem a experiência de um evento científico.Editores técnicos: Giampaolo Queiroz Pellegrino, Maria Giulia Croce, Poliana Fernanda Giachetto, Stanley Robson de Medeiros Oliveira
Aplicação de kdd em dados de iterações de desenvolvimento de software
Orientador: Prof. Dr. Jaime WojciechowskiMonografia (especialização) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Curso de Especialização em Inteligência Artificial Aplicada.Inclui referências: 26-27Resumo: O software está presente em várias categorias de sistemas atualmente. Ele pode ser desenvolvido de diferentes formas, o Desenvolvimento Iterativo é uma delas. Esse modelo de processo de software é a base para processos ou métodos amplamente praticados na indústria de software. Ele é capaz de lidar mais facilmente com softwares modernos, os quais estão cada vez complexos e exigindo entregas mais frequentes que agreguem valor ao serviço ou produto do cliente. Nessa abordagem o software é desenvolvido por meio de várias iterações. Esse processo pode gerar um grande volume de dados tornando- se inviável uma análise manual. É comum, portanto, que grandes empresas apliquem métodos ou processos específicos para obter conhecimento a partir desses dados para na sequência difundi-lo dentre os seus integrantes buscando melhorar seus processos produtivos. Nesse contexto, o objetivo deste trabalho foi identificar modelos e padrões que sejam válidos e potencialmente interpretáveis de tal forma que possam auxiliar as equipes de software na tomada de decisões inerente à realização de iterações de desenvolvimento de software. Esse objetivo foi norteado pelas seguintes questões, dadas as informações históricas dessas iterações: "é possível prever o resultado de uma iteração?" e "esses dados podem revelar algum padrão relacionado às práticas das equipes de software?". Para alcançar esse objetivo, foi aplicado um método de estudo baseado no KDD-process envolvendo dados de projetos reais e as técnicas de mineração de dados Árvore de Decisão e Floresta Aleatória. Foram identificados modelos capazes de prever o sucesso (ou falha) de uma iteração de software com até 93% de acurácia e padrões que evidenciam, por exemplo, a importância da prática de constantemente analisar e refinar os itens do backlog do produto
Técnicas de mineração incrementais em recuperação de informação
[EN] A desirable property of learning algorithms is the ability of incorporating new data in an incremental way. Incremental algorithms have received attention on the last few years. Particulary Bayesian networks, this is due to the hardness of the task. In Bayesian networks one example can change the whole structure of the Bayesian network. In this theses we focus on incremental induction of Tree Augmented Naive Bayes (TAN)
algorithm. A incremental version of TAN saves computing time, is more suite to data mining and concept drift. But, as usual in Bayesian learning TAN is restricted to discrete attributes. Complementary to the incremental TAN, we propose an incremental discretization algorithm, necessary to evaluate TAN in domains with continuous attribute. Discretization is a fundamental pre-processing step for some well- known
algorithms, the topic of incremental discretization has received few attention
from the community.
This theses has two major contributions, the benefict of both proposals is incremental learning, one for TAN and the other for discretization.We present and test a algorithm that rebuilds the network structure of tree augmented naive Bayes (TAN) based on the weighted sum of vectors containing the mutual information. We also present a new discretization method, this works in two layers. This two-stage architecture is very
fexible. It can be used as supervised or unsupervised. For the second layer any base discretization method can be used: equal width, equal frequency, recursive entropy discretization, chi-merge, etc. The most relevant aspect is that the boundaries of the intervals of the second layer can change when new data is available. We tested experimentally the incremental approach to discretization with batch and incremental learners.
The experimental evaluation of incremental TAN shows a perfor mance similar to the batch version. Similar remarks apply to incremental discretization. This is a relevant aspect, because few works in machine learning address the fundamental aspect of incremental discretization.
We believe that with Incremental discretization, the evaluation of the incremental algorithms can become more realistic and accurate.
We evaluated two versions of incremental discretization: supervised and unsupervised. We have seen that this feature can improve accuracy for the incremental learners and that the preview of future algorithm performance can be more precise. This method of discretization has another advantages, like, can be used with large data set's or can be used in dynamic environments with concept drift, areas where a batch discretization can be difficult or is not adequate.[ES] Esta tesis tenía como objetivo el estudio de una red Bayesiana (TAN) incremental. Durante el transcurso de esta se verificó la laguna en el área de una discretización incremental para la evaluación de un algoritmo incremental. Así se procuró dar como contribución para el área no solo un clasificador Bayesiano incremental sino también un modo de evaluación correcto del clasificador.
Los Sistemas de Recuperación de Información tienen como objetivo la realización de las tareas de indexación, búsqueda y clasificación de documentos (expresos en la forma textual), con el fin de satisfacer la necesidad de información del individuo, generalmente expresa a través de consultas. La necesidad de información puede ser entendida como la búsqueda de respuestas para determinadas cuestiones que tienen que ser resueltas, la recuperación de documentos que tratan sobre un determinado asunto o incluso la relación entre asuntos
Extração de portfólio de tecnologias de irrigação a partir de publicações científicas.
O objetivo do trabalho é apresentar uma metodologia para extração de portfólio de tecnologias de irrigação, a partir de publicações científicas, para melhorar o uso sustentável da água na agricultura
- …