24 research outputs found

    As Tarefas de Associação e de Classificação na Shell de Data Mining Orion

    Get PDF
    A análise de dados que compreende a busca de conhecimento, pode tornar-se complexa e exaustiva quando é realizada a partir de um grande volume de dados. Uma maneira eficaz e inteligente de analisar esses dados pode ser realizada por meio do processo de Knowledge Discovery inDatabases, tendo-se como uma de suas etapas a de Data Mining, que é responsável por extrair o conhecimento da base de dados. Este artigo apresenta a Shell de Data Mining, denominada de Orion, que encontra-se em desenvolvimento e já tem finalizado os módulos das tarefas de associação pelo algoritmo Apriori e de classificação pelo algoritmo ID3 para indução das árvores de decisão. A shell Orion permite conexão com os sistemas gerenciadores de banco de dados PostgreSQL e Firebird e está sendo implementada no ambiente de desenvolvimento NetBeans 4.1 que utilizaarquitetura Java

    Integrando bancos de dados heterogêneos através do padrão XML

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.Com objetivo de organizar e estruturar o armazenamento das informações necessárias às organizações, SGBDs são utilizados a fim de prover o acesso de maneira ágil, eficiente e segura a estas informações pelas aplicações. Os dados armazenados em um SGBD são organizados de acordo com um esquema definido em cada organização, assim, quando estas precisam integrar/trocar informações armazenadas em seus respectivos bancos de dados, vários problemas surgem devido a heterogeneidade dos esquemas ou plataformas de hardware/software, necessitando de uma estrutura capaz de mediar tal intercâmbio. Para prover a integração de diversos bancos de dados heterogêneos, são utilizados os Sistemas Gerenciados de Bancos de Dados Distribuídos Heterogêneos, que controlam e possibilitam as aplicações acesso de maneira transparente aos dados distribuídos entre as bases heterogêneas. Com a especificação do padrão XML, o mesmo passou a ser utilizado para intercâmbio de dados, uma vez que é capaz de agregar a seu conteúdo informações que o descrevem(metadados), possibilitando assim a representação de dados que não poderiam ser representadas através do modelo relacional utilizado pela maioria dos SGBDs. Com o padrão XML é possível então a criação de visões materializadas dos dados armazenados em um SGBD local e utilizar esta visão para os mais variados fins. O presente trabalho apresenta uma proposta de um sistema capaz de prover o acesso - de maneira integrada e transparente para as aplicações - às informações armazenadas em bases heterogêneas e distribuídas, utilizando o padrão XML para representa-las através da criação de visões materializadas dos dados presentes em cada uma das bases a serem integradas, agrupando posteriormente as diversas visões em uma única visão XML. Tal integração traz a tona uma série de questões a serem tratadas, como a integridade dos dados que antes era controlada por cada um dos SGBDs e que agora precisa ser observada na visão integrada para garantir que os dados nela presentes possuam a mesma integridade, possibilitando assim que haja um serialização dos dados entre a visão e as bases distribuídas sem que ocorram problemas de integridade

    Um portal de banco de imagens médicas distrubuído usando corba para integração de serviços de teleradiologia

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação.A área do diagnóstico por imagem é um dos campos da medicina mais propensos a uso da Telemedicina, porque normalmente não existe a obrigação do contato direto com o paciente pelo radiologista responsável durante a elaboração do diagnóstico. A carência de especialistas em locais distantes de grandes centros urbanos faz da Telemedicina uma importante ferramenta para melhorar os serviços de atenção à saúde. Neste trabalho é apresentado um modelo baseado em uma abordagem federada chamo Portal de Teleradiologia, para a integração de bancos de imagens médicas DICOM distribuído geograficamente. O objetivo é prover uma visão única e transparente dos dados compartilhados sem sacrificar a autonomia dos sistemas integrantes ou interferir com operações locais. Um requisito obrigatório para sistemas desta natureza é a garantia de um contexto seguro para a execução das operações. O modelo proposto prevê também a identificação única de pacientes entre as diversas bases de dados através de técnicas de relacionamento de registros. Para a implementação do protótipo do sistema foi utilizada a tecnologia de objetos distribuídos através da arquitetura CORBA

    Solução de Data Warehouse para possibilitar a análise estratégica integrada e distribuída dos indicadores de desempenho (IDS) do Estado de SC

    Get PDF
    Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de Produção.Os indicadores de desenvolvimento social, desenvolvidos pela Durb, visam oferecer uma visão da realidade local através da apresentação do desempenho social e econômico do município (mais desenvolvido e menos desenvolvido). No entanto, a simples apresentação dos indicadores, seja em forma de tabelas ou gráficos, não supre a necessidade de informação comparativa e estratégicamente apresentada. Este trabalho tem como objetivo utilizar tecnologias de sistemas de informações, data warehouse, data webhouse, geoprocessamento e classificação de informações com análise multivariada, com o objetivo de apresentar uma ferramenta de apoio à análise estratégica dos indicadores de desenvolvimento do estado de SC, para uso de políticos e da comunidade catarinense. São obtidos dados externos de organizações com Prefeitura, IBGE, Secretarias estaduais de educação, saúde, entre outros que passam por um pré processamento, processo este que gera uma base com os dados integrados e voltados ao mesmo assunto. Esta base de data warehouse é garimpada passando por processos de análise de similaridade, gerando uma base de conhecimento que gera informação estratégica, essencial ao à tomada de decisão de políticos e da população

    Interface NoSQL integrada a banco relacional para gerenciamento de dados em nuvem privada

    Get PDF
    Enquanto bancos de dados NoSQL são tecnologias fundamentais para startups web, as aplicações desenvolvidas neste paradigma podem ter deficiência quanto à consistência, ou facilidades da linguagem SQL, características fortes do modelo relacional. Em contrapartida, este último modelo pode apresentar insuficiências de desempenho como na combinação de dados em tabelas diferentes, falta de flexibilidade no esquema ou dificuldades ao escalar. Atrelado à esta problemática, cresce uma outra concepção, a computação em nuvem, um paradigma de computação orientado a serviços que mudou a forma como a infraestrutura de computação é disponibilizada e utilizada. Com esta motivação, a dualidade lógica relacional e não relacional têm sido repensada de forma a avaliar as vantagens e desvantagens de cada uma. As aplicações que surgirão provavelmente irão se deparar com uma escolha que não terá alguma característica essencial que o outro modelo fornece. Portanto, este trabalho visa promover a coexistência das identidades de cada modelo e oferecer como alternativa uma solução específica oriunda de um problema de cunho prático, usando metodologias da computação, além de apresentar os principais conceitos neste contexto, como gerenciamento de dados em nuvem, arquiteturas de interface e comunicação para web, e comparativos dos modelos de dados NoSQL. Por fim, são apresentadas as considerações finais sobre o tema, destacando desafios e tendências para o desenvolvimento de soluções de bancos de dados híbridos

    A tecnologia da informação no chão de fábrica: as novas ferramentas e a gestão integrada da informação

    Get PDF
    Dissertação(mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de ProduçãoEste trabalho apresenta as tecnologias envolvidas na elaboração de um sistema Management Execution System (MES), tendo como ponto de partida a informação no chão de fábrica. Estas informações estão baseadas nos sistemas de controle e automação das indústrias, utilizando equipamentos de controle como os Controladores Lógicos Programáveis (CLP's) e os softwares Human-Machine Interface / Supervisory Control and Data Acquisition System (HMI/SCADA), Bancos de Dados e padrões de comunicação como OLE for Process Control (OPC). Na seqüência são apresentados os softwares disponíveis no mercado brasileiro, enfocando as novas ferramentas disponibilizadas para a integração dos dados nos diversos níveis da fabrica. A seguir é feita uma definição de um sistema MES, apresentando as principais funções e módulos que o compõe, inclusive com os modelos de dois órgãos internacionais que buscam a padronização destes sistemas, como a Manufactoring Enterprise Solutions Association (MESA) e a American Manufacturing Research (AMR). Complementando o trabalho, é feita uma análise do mercado brasileiro e é apresentado um case de sucesso na implementação de um MES

    Análise e predição de evasão na Educação a Distância de uma Universidade Comunitária utilizando técnicas de mineração de dados

    Get PDF
    A Mineração de dados vem crescendo nos últimos anos juntamente com o interesse das mais diversas áreas de atuação na descoberta de dados que auxilie a alcançar uma vantagem no mercado e, dentro da área da educação, o comportamento dos estudantes muitas vezes indica seus interesses e motivações. Esta pesquisa tem o objetivo de relacionar estes dois extremos aplicando técnicas de mineração de dados e aprendizado de máquina em dados provenientes do banco de dados de uma universidade comunitária do interior do Rio Grande do Sul explorando os conceitos da mineração de dados educacional para verificar a tendência dos alunos a evadirem dos cursos da modalidade EaD, dentro de um período de dois anos. Os resultados obtidos através dos experimentos utilizando diferentes técnicas de mineração de dados são comparados para se encontrar a forma mais eficiente de prever a evasão dos alunos. Após o treinamento dos modelos preditivos e a aplicação deles sobre o conjunto de teste, ficou constatado que os algoritmos Random Tree e Decision Tree obtiveram os melhores resultados, atingindo percentuais superiores a 98% nos melhores resultados. Os resultados também são comparados com outros resultados observados em estudos dentro do mesmo campo de pesquisa ou que também se utilizam das técnicas de mineração de dados educacionais, verificando-se resultados semelhantes em alguns deles.Data mining has been growing in recent years along with the great interest of the most diverse areas of activity in the discovery of data that helps on achieving some advantage in the market and, within the area of education, the behavior of students often indicates their interests and motivations. This research aims to relate these two extremes by applying data mining and machine learning techniques to data from the database of a community university in the interior of Rio Grande do Sul state exploring the concepts of educational data mining to verify the trend of students to evade on distance education courses, within a period of two years. The results obtained through the experiments using different data mining techniques are compared to find the most efficient way to predict students' dropout. After training the predictive models and applying them to the test set, it was found that the Random Tree and Decision Tree algorithms obtained the best results, reaching percentages greater than 98% in the best results. The results are also compared with other results observed in studies within the same research field or studies that also use educational data mining techniques, with similar results being seen in some of them

    Um repositório chave-valor com garantia de localidade de dados

    Get PDF
    Orientador : Prof. Dr. Carmem Satie HaraDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 09/08/2016Inclui referências : f. 67-76Resumo: Grandes volumes de dados produzidos diariamente trouxeram desafios envolvendo a definição de formas eficientes de como extraí-los, armazená-los e acessá-los. Entretanto, soluções tradicionais de bancos de dados não se mostraram eficientes diante de tais desafios, principalmente no requisito de escalabilidade. Uma possível abordagem para prover escalabilidade horizontal aos sistemas gerenciadores de banco de dados é a adoção de uma arquitetura estratificada, tendo como base um sistema de armazenamento distribuído com uma interface simples para o acesso a dados remotamente armazenados. Esta dissertação apresenta o ALOCS, um repositório distribuído de dados que adota o modelo chave-valor, mas que permite a alocação de um conjunto de pares agrupados em uma única estrutura, cuja localidade é controlada pela aplicação usuária do sistema. O controle de localidade permite que dados usualmente utilizados em conjunto possam ser alocados em um mesmo servidor, reduzindo a quantidade de comunicações entre servidores no processamento de suas consultas. Isto é essencial para prover escalabilidade e melhorar o desempenho de processamento das consultas em ambientes distribuídos. Os estudos experimentais mostram a melhoria no tempo de resposta das consultas utilizando a solução proposta.Abstract:Large volumes of data produced every day brought new challenges involving the definition of efficient ways to extract, store and access them. However, traditional database solutions are not efficient to solve these challenges, especially with respect to the scalability requirement. One approach to provide horizontal scalability to database management systems is the adoption of a layered architecture, based on a distributed storage system with a simple interface to access data remotely stored. This dissertation presents ALOCS, a distributed storage repository of data which adopts the key-value model, and which allows the allocation of a set of pairs grouped into a single structure whose location is controlled by the user application of the system. This control allows data commonly used together to be allocated on the same server, reducing the amount of communications between servers for query processing. This is essential to provide scalability and improve the processing of query execution in distributed environments. Experimental studies shows that ALOCS improves query response times by reducing the amount of remote data accesse

    Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas

    Get PDF
    Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia de ProduçãoSoluções de Business Intelligence visam prover informação estratégica a partir das fontes de dados da organização. Entretanto, verificam-se desafios que permanecem não resolvidos nestas soluções no contexto da sociedade do conhecimento. Entre as principais deficiências das soluções atuais verificam-se a falta de perspectiva de utilização da semântica do negócio (i.e. sua terminologia e regras) no apoio ao processamento analítico e a falta de flexibilidade para a extensão das funcionalidades exploratórias de acordo com as especificidades de cada organização. Propõe-se uma arquitetura para BI - a arquitetura SBI - baseada em um novo paradigma que prevê a utilização intensiva do conhecimento do negócio para guiar o processamento analítico. A semântica do negócio na abordagem utilizada é representada em uma ontologia e mapeada aos dados e serviços em outras duas ontologias. O suporte à inferência sobre essa semântica é agregado aos módulos de gerenciamento de serviços e de análises da arquitetura, permitindo: a) extensão e composição de funcionalidades exploratórias através de Web services semânticos; b) recomendação de informação, serviços e inferências de acordo com o contexto da análise em um processo analítico-interativo assistido pela arquitetura; e c) manipulação de dados e serviços utilizando a terminologia do negócio. A viabilidade da proposta é demonstrada através do protótipo de ferramenta analítica OntoDSS, o qual é integrado a arquitetura SBI e aplicado em um estudo de caso no domínio da gestão de Ciência & Tecnologia. O ineditismo da contribuição está na busca de insumos na engenharia de conhecimento para prover alternativas de solução para as limitações nas soluções de BI atuais

    SISTEMA INTEGRADO DE DADOS GEOESPACIAIS APLICADO À GESTÃO DE INFORMAÇÃO AERONÁUTICA

    Get PDF
    Esta tese explora a necessidade de uma investigação aprofundada, de incremento de conhecimento e experiência tecnológica, no âmbito do futuro do Céu Único Europeu (Single European Sky - SES), enquanto projeto ambicioso promovido pela União Europeia para solucionar os problemas de congestionamento de tráfego aéreo na Europa, e apresenta uma proposta para um Sistema Integrado de Dados Geoespaciais aplicado à Gestão da Informação Aeronáutica (SIDG-AIM). O SIDG-AIM, aliando as Tecnologias de Informação Geográfica (TIG) e a Gestão da Informação Aeronáutica (Aeronautical Information Management - AIM), efetua uma modificação radical na forma como os dados aeronáuticos são geridos e disponibilizados, resultando desse facto um incremento de valor face às necessidades emergentes no sector da aeronáutica. O produto deste trabalho permitirá desenvolver um modelo integrado que possibilitará partilhar informação aeronáutica normalizada, em tempo real, junto dos diversos utilizadores, compatível com o System Wide Information Management (SWIM) que funcionará como um grande repositório de dados aeronáuticos nos seus diversos domínios, sendo prevista a sua implementação no ano de 2020. Os Serviços de Informação Aeronáutica (AIS)1 constituem um domínio que envolve a diversidade de informação necessária à atividade de todos os intervenientes nas operações de voo e do Air Traffic Management (ATM). A Publicação de Informação Aeronáutica (AIP) 2 e documentação associada constituem a fonte de informação básica para informações permanentes e alterações temporárias de longa duração (3 meses ou superior). As caraterísticas da informação aeronáutica têm subjacente a descrição da realidade da infraestrutura de navegação aérea dentro do seu contexto geoespacial e o estado e condição dessa infraestrutura à medida que ela muda ao longo do tempo. Assim, a informação aeronáutica é caracterizada como informação geoespacial, composta por três dimensões “x, y, e z”, e pela informação considerada temporal, que se altera numa dimensão “t”. Além do uso pretendido da informação, também a forma como se pretende divulgar a informação aeronáutica afeta as suas características genéricas. Neste âmbito e ao longo desta tese serão destacadas características como o formato digital, a integrabilidade, a visualização gráfica, o formato aberto, o facto de ser pesquisável espacialmente e temporalmente acessível, monitorizada e adaptada a determinados utilizadores finais. De acordo com o conceito AIM, a noção de temporalidade também deve respeitar o critério "apto para o uso pretendido", no sentido de que a informação deve estar disponível para os utilizadores finais quando eles precisam. Este requisito afeta diretamente os meios de disseminação da informação, dependendo sempre da criticidade da informação. Em última análise, o objetivo da informação aeronáutica é reduzir a incerteza e aumentar a previsibilidade do sistema ATM e um meio de o conseguir é através da disponibilidade de informação atempada, nunca descurando a preservação da qualidade da informação em termos de exatidão, resolução e integridade, como será referido ao longo desta tese. É importante destacar a singularidade da informação aeronáutica em relação a outros domínios de informação, na medida em que não descreve apenas recursos físicos de navegação aérea, como aeroportos, pistas de aterragem e transmissores de rádio de navegação, mas também recursos virtuais, como o espaço aéreo, as vias aéreas e os procedimentos por instrumentos. O presente trabalho decorre num processo de transformação dos Serviços de Informação Aeronáutica, visando desenvolver as suas atividades num modelo de globalização da informação que corresponda às necessidades das operações de voo e do ATM e que pressupõe a migração da informação para um formato eletrónico, harmonizado, de alta qualidade, interoperável e assente num grande desenvolvimento tecnológico. O processo de transição do AIS para o AIM e a execução do Regulamento (EU) 73/2010 determinam novas e exigentes inovações tecnológicas. O SIDG-AIM permitirá à NAV Portugal, E.P.E., empresa utilizada como estudo de caso, adaptar-se em direção a esse objetivo.Within the framework of the Single European Sky’s (SES) future, as an ambitious project promoted by the European Union to solve air traffic congestion problems in Europe, this thesis explores the need for in-depth research, increased knowledge and technological experience. It also presents a proposal for an Integrated Geospatial Data System applied to Aeronautical Information Management (SIDG-AIM). Allying Geographic Information Technologies (GIT) with Aeronautical Information Management (AIM), the SIDG-AIM makes a radical change in the way aeronautical data are managed and made available, resulting in gains to the emerging needs in the aeronautics sector. The outcome of this work will allow the development of an integrated model that will share real-time standardized aeronautical information among users, compatible with System Wide Information Management (SWIM), which will act as a large repository of aeronautical data in its various domains. Its implementation is predicted to the year 2020. Aeronautical Information Services (AIS) is an area that involves the variaty of information required for the activity of all stakeholders involved in flight operations and Air Traffic Management (ATM). The Aeronautical Information Publication (AIP) and its associated documentation provides the main source for permanent information and long-term temporary changes (3 months or more). The description of the reality of the air navigation infrastructure within its geospatial context and the state and condition of aeronautical information. It is characterized as geospatial information, consisting of three dimensions "x, y, and z", and information considered temporal, which changes in a "t" dimension. Its generic characteristics are affected by the intended use of the information and the way of intended disclosure the aeronautical information. In this context and throughout this thesis will highlight features such as digital format, integrability, graphic display, open format, the fact that it is searchable spatially and temporally accessible,monitored and adapted to certain stakeholders. According to the AIM concept, the notion of temporality should also respect the touchstone "fit for intended use", which means that information should be available to end users whenever they need it. This requirement directly affects the means of information dissemination, always depending on the criticality of the information. As ultimate parsing, the main goal of aeronautical information is to reduce the dimness and increase the predictability of the ATM system. One way to achieve this is through the availability of timely information, never neglecting the preservation of the quality of information in terms of accuracy, resolution and integrity, as will be mentioned throughout this thesis. It is important to highlight the uniqueness of aeronautical information related to other information domains. Besides it describes physical air navigation resources such as airports, landing strips and radio navigation transmitters, it also describes virtual resources such as space airway, airway and procedures by instrument. This work is carried out in a process of transformation of the Aeronautical Information Services, aiming to develop its activities within a model of information globalization that comes upon the needs of the flight operations and the ATM. Which presupposes the migration of information to an electronic format, high quality, interoperable and based on a great technological development. The transition process from AIS to AIM and the implementation of Regulation (EU) 73/2010 determine demanding technological innovations. The SIDG-AIM will allow NAV Portugal, E.P.E., a company used here as a case study, to adjust towards that goal
    corecore