24 research outputs found

    Documentação de atividades de planejamento ambiental centrada em bancos de dados

    Get PDF
    Orientador : Claudia Bauzer MedeirosDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação CientificaResumo: O processo de planejamento ambiental é uma tarefa complexa que cobre aspectos variados, envolve uma série de etapas e é alimentado por vários conjuntos de dados. Normalmente exige a cooperação de equipes multidisciplinares que discutem várias alternativas de planejamento, considerando por exemplo questões referentes ao uso ou recuperação de recursos ambientais. Um dos grandes problemas desse processo é a falta de documentação associada. Como em qualquer atividade cooperativa, a documentação é importante para a revisão, manutenção e evolução do plano e para a comunicação entre os projetistas, dentre outros fatores. O objetivo desta dissertação é resolver parcialmente este problema, através da especificação e implementação parcial de um ambiente para gerenciar, de forma unificada, três tipos de documentos: descrição do produto final do planejamento (documentos O QUE), descrição do processo usado para obter o produto final (documentos COMO) e descrição das razões que estão por trás das decisões para se chegar a este produto (documentos PORQUE). Estes documentos foram especificados visando armazenamento e gerenciamento em um banco de dados. Documentos O QUE são representados através de estruturas de hipermídia, documentos COMO através de workfiows científicos e o PORQUE é baseado em estruturas de design rationale. As principais contribuições desta pesquisa são: (a) especificação centrada em bancos de dados das estruturas dos documentos O QUE, COMO e PORQUE; (b) especificação do ambiente para gerenciá-los, visando facilitar trabalho cooperativo na área de planejamento ambiental; (c) implementação parcial deste ambienteAbstract: The environmental planning process is a complex task that covers various aspects, involving a series of steps and is fed by many data sources. Normally, this process demands the cooperation of multidisciplinary teams that discuss many planning alternatives. These alternatives consider, for instance, multiple issues on preservation or recovery of environmental resources. One of the main problems in this process is the incompleteness of associated documentation. As in any cooperative activity, documentation is important for revision, maintenance and evolution of the plan, and for communication among designers. The goal of this dissertation is to partially solve this problem, through the specification and partial implementation of an environment to manage, in a unified way, three kinds of documents: description of the final product - the plan (WHAT documents), description of the process used to obtain the final product (HOW documents) and description of the reasons behind the decisions of planning (WHY documents). These documents were specified so as to allow them to be stored and managed in a database. WHAT documents are represented through hypermedia structures, HOW documents using scientific workfiows, and WHY documents are based in design rationale structures. The main contributions of this research are: (a) database-centered specification and design of the WHY, HOW and WHAT documents; (b) specification of an environment to support management of these documents, thus fostering cooperative work in environmental planning; (c) partial implementation of this environmentMestradoMestre em Ciência da Computaçã

    Conceptual-level workflow modeling of scientific experiments using NMR as a case study

    Get PDF
    BACKGROUND: Scientific workflows improve the process of scientific experiments by making computations explicit, underscoring data flow, and emphasizing the participation of humans in the process when intuition and human reasoning are required. Workflows for experiments also highlight transitions among experimental phases, allowing intermediate results to be verified and supporting the proper handling of semantic mismatches and different file formats among the various tools used in the scientific process. Thus, scientific workflows are important for the modeling and subsequent capture of bioinformatics-related data. While much research has been conducted on the implementation of scientific workflows, the initial process of actually designing and generating the workflow at the conceptual level has received little consideration. RESULTS: We propose a structured process to capture scientific workflows at the conceptual level that allows workflows to be documented efficiently, results in concise models of the workflow and more-correct workflow implementations, and provides insight into the scientific process itself. The approach uses three modeling techniques to model the structural, data flow, and control flow aspects of the workflow. The domain of biomolecular structure determination using Nuclear Magnetic Resonance spectroscopy is used to demonstrate the process. Specifically, we show the application of the approach to capture the workflow for the process of conducting biomolecular analysis using Nuclear Magnetic Resonance (NMR) spectroscopy. CONCLUSION: Using the approach, we were able to accurately document, in a short amount of time, numerous steps in the process of conducting an experiment using NMR spectroscopy. The resulting models are correct and precise, as outside validation of the models identified only minor omissions in the models. In addition, the models provide an accurate visual description of the control flow for conducting biomolecular analysis using NMR spectroscopy experiment

    Uma ferramenta unificada para projeto, desenvolvimento, execução e recomendação de experimentos de aprendizado de máquina

    Get PDF
    Orientadores: Ricardo da Silva Torres, Anderson de Rezende RochaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Devido ao grande crescimento do uso de tecnologias para a aquisição de dados, temos que lidar com grandes e complexos conjuntos de dados a fim de extrair conhecimento que possa auxiliar o processo de tomada de decisão em diversos domínios de aplicação. Uma solução típica para abordar esta questão se baseia na utilização de métodos de aprendizado de máquina, que são métodos computacionais que extraem conhecimento útil a partir de experiências para melhorar o desempenho de aplicações-alvo. Existem diversas bibliotecas e arcabouços na literatura que oferecem apoio à execução de experimentos de aprendizado de máquina, no entanto, alguns não são flexíveis o suficiente para poderem ser estendidos com novos métodos, além de não oferecerem mecanismos que permitam o reuso de soluções de sucesso concebidos em experimentos anteriores na ferramenta. Neste trabalho, propomos um arcabouço para automatizar experimentos de aprendizado de máquina, oferecendo um ambiente padronizado baseado em workflow, tornando mais fácil a tarefa de avaliar diferentes descritores de características, classificadores e abordagens de fusão em uma ampla gama de tarefas. Também propomos o uso de medidas de similaridade e métodos de learning-to-rank em um cenário de recomendação, para que usuários possam ter acesso a soluções alternativas envolvendo experimentos de aprendizado de máquina. Nós realizamos experimentos com quatro medidas de similaridade (Jaccard, Sorensen, Jaro-Winkler e baseada em TF-IDF) e um método de learning-to-rank (LRAR) na tarefa de recomendar workflows modelados como uma sequência de atividades. Os resultados dos experimentos mostram que a medida Jaro-Winkler obteve o melhor desempenho, com resultados comparáveis aos observados para o método LRAR. Em ambos os casos, as recomendações realizadas são promissoras, e podem ajudar usuários reais em diferentes tarefas de aprendizado de máquinaAbstract: Due to the large growth of the use of technologies for data acquisition, we have to handle large and complex data sets in order to extract knowledge that can support the decision-making process in several domains. A typical solution for addressing this issue relies on the use of machine learning methods, which are computational methods that extract useful knowledge from experience to improve performance of target applications. There are several libraries and frameworks in the literature that support the execution of machine learning experiments. However, some of them are not flexible enough for being extended with novel methods and they do not support reusing of successful solutions devised in previous experiments made in the framework. In this work, we propose a framework for automating machine learning experiments that provides a workflow-based standardized environment and makes it easy to evaluate different feature descriptors, classifiers, and fusion approaches in a wide range of tasks. We also propose the use of similarity measures and learning-to-rank methods in a recommendation scenario, in which users may have access to alternative machine learning experiments. We performed experiments with four similarity measures (Jaccard, Sorensen, Jaro-Winkler, and a TF-IDF-based measure) and one learning-to-rank method (LRAR) in the task of recommending workflows modeled as a sequence of activities. Experimental results show that Jaro-Winkler yields the highest effectiveness performance with comparable results to those observed for LRAR. In both cases, the recommendations performed are very promising and might help real-world users in different daily machine learning tasksMestradoCiência da ComputaçãoMestre em Ciência da Computaçã

    Combinando bancos de dados e raciocinio baseado em casos para apoio a decisão em planejamento ambiental

    Get PDF
    Orientadores : Claudia Maria Bauzer Medeiros, Heloisa Vieira da RochaDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoMestrad

    Anotação semântica de dados geoespaciais para a agricultura.

    Get PDF
    Dados geoespaciais são base para sistemas de decisão em vários domínios. Para serem usados esses dados precisam ser analisados e interpretados por especialistas. Essas interpretações geralmente não são armazenadas ou correspondem apenas a alguma informação textual e em linguagem própria, gravadas em arquivos técnicos. A ausência de soluções eficientes para armazená-las leva a problemas como retrabalho e dificuldades de compartilhamento de informação. Este trabalho apresenta uma solução para esse problema que baseia-se no uso de anotações semânticas, uma abordagem que promove um entendimento comum dos conceitos usados. Com a adoção de workflows científicos e também de um esquema de metadados e de ontologias bem conhecidos, foi especificado e parcialmente implementado um framework para anotação semântica de dados geoespaciais, focando na solução de problemas em agricultura.bitstream/item/32414/1/BolPesq25.pd

    Using domain ontologies to help track data provenance.

    Get PDF
    Motivating example. POESIA ontologies and ontological coverages. Ontological estimation of data provenance. Ontological nets for data integration. Data integration operators. Data reconciling through articulation of ontologies. Semantic workflows. Related work. Conclusions

    Mechanisms of semantic annotation for scientific workflows

    Get PDF
    Orientador: Claudia Maria Bauzer MedeirosDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: O compartilhamento de informações, processos e modelos de experimentos entre cientistas de diferentes organizações e domínios do conhecimento vem aumentando com a disponibilização dessas informações e modelos na Web. Muitos destes modelos de experimentos são descritos como workflows científicos. Entretanto, não existe uma padronização para a sua descrição, dificultando assim o reaproveitamento de workflows e seus componentes já existentes. A dissertação contribui para a solução deste problema com os seguintes resultados: a análise dos problemas relativos ao compartilhamento e projeto cooperativo de workflows científicos na Web, análise de aspectos de semântica e metadados relacionados a estes workflows, a disponibilização de um editor Web de workflows usando padrões WFMC e, o desenvolvimento de um modelo de anotação semântica para workflows científicos. Com isto, a dissertação cria a base para permitir a descoberta, reuso e compartilhamento de workflows científicos nas Web. O editor permite que pesquisadores construam seus workflows e anotações de forma online, e permite o consequente teste, com dados externos, do sistema de anotaçõesAbstract: The sharing of information, processes and models of experiments is increasing among scientists from many organizations and areas of knowledge, and thus there is a need for supply mechanisms of workflow discovery. Many of these models are described as scientific workflows. However, there is no default specification to describe them, which complicates the reuse of workflows and components that are available. This thesis contributes to solving this problem by presenting the following results: analysis of issues related to the sharing and cooperative design of scientific workflows on the Web; analysis of semantic aspects and metadata related to workflows, the development of a Web-based workflow editor, which incorporates our semantic annotation model for scientific workflows. Given these factors, this work creates the basis to allow the discovery, reuse and sharing of scientific workflows in the WebMestradoBanco de DadosMestre em Ciência da Computaçã

    A abordagem POESIA para a integração de dados e serviços na Web semantica

    Get PDF
    Orientador: Claudia Bauzer MedeirosTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: POESIA (Processes for Open-Ended Systems for lnformation Analysis), a abordagem proposta neste trabalho, visa a construção de processos complexos envolvendo integração e análise de dados de diversas fontes, particularmente em aplicações científicas. A abordagem é centrada em dois tipos de mecanismos da Web semântica: workflows científicos, para especificar e compor serviços Web; e ontologias de domínio, para viabilizar a interoperabilidade e o gerenciamento semânticos dos dados e processos. As principais contribuições desta tese são: (i) um arcabouço teórico para a descrição, localização e composição de dados e serviços na Web, com regras para verificar a consistência semântica de composições desses recursos; (ii) métodos baseados em ontologias de domínio para auxiliar a integração de dados e estimar a proveniência de dados em processos cooperativos na Web; (iii) implementação e validação parcial das propostas, em urna aplicação real no domínio de planejamento agrícola, analisando os benefícios e as limitações de eficiência e escalabilidade da tecnologia atual da Web semântica, face a grandes volumes de dadosAbstract: POESIA (Processes for Open-Ended Systems for Information Analysis), the approach proposed in this work, supports the construction of complex processes that involve the integration and analysis of data from several sources, particularly in scientific applications. This approach is centered in two types of semantic Web mechanisms: scientific workflows, to specify and compose Web services; and domain ontologies, to enable semantic interoperability and management of data and processes. The main contributions of this thesis are: (i) a theoretical framework to describe, discover and compose data and services on the Web, inc1uding mIes to check the semantic consistency of resource compositions; (ii) ontology-based methods to help data integration and estimate data provenance in cooperative processes on the Web; (iii) partial implementation and validation of the proposal, in a real application for the domain of agricultural planning, analyzing the benefits and scalability problems of the current semantic Web technology, when faced with large volumes of dataDoutoradoCiência da ComputaçãoDoutor em Ciência da Computaçã

    Integrating case based reasoning and geographic information systems in a planing support system: Çeşme Peninsula study

    Get PDF
    Thesis (Doctoral)--Izmir Institute of Technology, City and Regional Planning, Izmir, 2009Includes bibliographical references (leaves: 110-121)Text in English; Abstract: Turkish and Englishxii, 140 leavesUrban and regional planning is experiencing fundamental changes on the use of of computer-based models in planning practice and education. However, with this increased use, .Geographic Information Systems. (GIS) or .Computer Aided Design.(CAD) alone cannot serve all of the needs of planning. Computational approaches should be modified to deal better with the imperatives of contemporary planning by using artificial intelligence techniques in city planning process.The main aim of this study is to develop an integrated .Planning Support System. (PSS) tool for supporting the planning process. In this research, .Case Based Reasoning. (CBR) .an artificial intelligence technique- and .Geographic Information Systems. (GIS) .geographic analysis, data management and visualization techniqueare used as a major PSS tools to build a .Case Based System. (CBS) for knowledge representation on an operational study. Other targets of the research are to discuss the benefits of CBR method in city planning domain and to demonstrate the feasibility and usefulness of this technique in a PSS. .Çeşme Peninsula. case study which applied under the desired methodology is presented as an experimental and operational stage of the thesis.This dissertation tried to find out whether an integrated model which employing CBR&GIS could support human decision making in a city planning task. While the CBS model met many of predefined goals of the thesis, both advantages and limitations have been realized from findings when applied to the complex domain such as city planning
    corecore