13 research outputs found

    MR-Radix: a multi-relational data mining algorithm

    Get PDF
    Abstract\ud \ud \ud \ud Background\ud \ud Once multi-relational approach has emerged as an alternative for analyzing structured data such as relational databases, since they allow applying data mining in multiple tables directly, thus avoiding expensive joining operations and semantic losses, this work proposes an algorithm with multi-relational approach.\ud \ud \ud \ud Methods\ud \ud Aiming to compare traditional approach performance and multi-relational for mining association rules, this paper discusses an empirical study between PatriciaMine - an traditional algorithm - and its corresponding multi-relational proposed, MR-Radix.\ud \ud \ud \ud Results\ud \ud This work showed advantages of the multi-relational approach in performance over several tables, which avoids the high cost for joining operations from multiple tables and semantic losses. The performance provided by the algorithm MR-Radix shows faster than PatriciaMine, despite handling complex multi-relational patterns. The utilized memory indicates a more conservative growth curve for MR-Radix than PatriciaMine, which shows the increase in demand of frequent items in MR-Radix does not result in a significant growth of utilized memory like in PatriciaMine.\ud \ud \ud \ud Conclusion\ud \ud The comparative study between PatriciaMine and MR-Radix confirmed efficacy of the multi-relational approach in data mining process both in terms of execution time and in relation to memory usage. Besides that, the multi-relational proposed algorithm, unlike other algorithms of this approach, is efficient for use in large relational databases.This project was financed by CAPES. We thank David R. M. Mercer for English language review and translation

    Sistema computacional para análise de notificações de acidentes de trabalho por meio de recursos georeferenciados

    Get PDF
    Introdução: O Sistema de Vigilância de Acidentes de Trabalho - SIVAT foi desenvolvido pelo Grupo de Banco de Dados - GBD em convênio com as prefeituras municipais e o Centro de Referência em Saúde do Trabalhador - CEREST de São José do Rio Preto e Ilha Solteira. Neste trabalho é apresentada uma extensão do SIVAT que incorpora um Sistema de Informação Geográfica (SIG) para possibilitar maior interatividade e flexibilidade na análise das notificações de acidentes. Objetivos: O SIG foi desenvolvido para permitir que o usuário identificasse no mapa a distribuição dos acidentes do trabalho, bem como as relações existentes entre as características comuns destes acidentes ao analisar as regiões selecionadas. Métodos: O sistema gerenciador de banco de dados utilizado foi o PostgreSQL com extensão Postgis [1]. As informações contidas no banco de dados do SIVAT são projetadas por meio do GeoServer [2], um servidor de informação geoespacial e para a comunicação entre as projeções do GeoServer com a interface Web do sistema utilizou-se a biblioteca do OpenLayers [3]. Resultados: As notificações de acidentes do trabalho armazenadas na base do SIVAT vêm sendo georreferenciadas para possibilitar a utilização do SIG. Atualmente, mais de 15.000 registros já passaram por este processo.Dentre as funcionalidades do SIG destacam-se: visualização das ocorrências no mapa de acordo com o ano, o que permite a análise da distribuição das ocorrências; seleção de áreas por meio de polígonos para a geração de relatórios sobre estas regiões e uso de filtros para avaliar apenas as características de interesse, por exemplo: tipo de acidente, ocupação do acidentado e máquina causadora. Tais funcionalidades auxiliam na análise das notificações de forma ágil e flexível. Um exemplo disso é a facilidade que a interface SIG proporciona para identificar as vias públicas em que vários acidentes do trabalho ocorreram. Assim, a extensão SIG contribui para que os órgãos envolvidos planejem com eficiência medidas preventivas e corretivas sobre tais acidentes.

    Sistema computacional para análise de notificações de acidentes de trabalho por meio de recursos georeferenciados

    Get PDF
    Introdução: O Sistema de Vigilância de Acidentes de Trabalho - SIVAT foi desenvolvido pelo Grupo de Banco de Dados - GBD em convênio com as prefeituras municipais e o Centro de Referência em Saúde do Trabalhador - CEREST de São José do Rio Preto e Ilha Solteira. Neste trabalho é apresentada uma extensão do SIVAT que incorpora um Sistema de Informação Geográfica (SIG) para possibilitar maior interatividade e flexibilidade na análise das notificações de acidentes. Objetivos: O SIG foi desenvolvido para permitir que o usuário identificasse no mapa a distribuição dos acidentes do trabalho, bem como as relações existentes entre as características comuns destes acidentes ao analisar as regiões selecionadas. Métodos: O sistema gerenciador de banco de dados utilizado foi o PostgreSQL com extensão Postgis [1]. As informações contidas no banco de dados do SIVAT são projetadas por meio do GeoServer [2], um servidor de informação geoespacial e para a comunicação entre as projeções do GeoServer com a interface Web do sistema utilizou-se a biblioteca do OpenLayers [3]. Resultados: As notificações de acidentes do trabalho armazenadas na base do SIVAT vêm sendo georreferenciadas para possibilitar a utilização do SIG. Atualmente, mais de 15.000 registros já passaram por este processo.Dentre as funcionalidades do SIG destacam-se: visualização das ocorrências no mapa de acordo com o ano, o que permite a análise da distribuição das ocorrências; seleção de áreas por meio de polígonos para a geração de relatórios sobre estas regiões e uso de filtros para avaliar apenas as características de interesse, por exemplo: tipo de acidente, ocupação do acidentado e máquina causadora. Tais funcionalidades auxiliam na análise das notificações de forma ágil e flexível. Um exemplo disso é a facilidade que a interface SIG proporciona para identificar as vias públicas em que vários acidentes do trabalho ocorreram. Assim, a extensão SIG contribui para que os órgãos envolvidos planejem com eficiência medidas preventivas e corretivas sobre tais acidentes.

    Sistema computacional para análise de notificações de acidentes de trabalho por meio de recursos georeferenciados

    Get PDF
    Introdução: O Sistema de Vigilância de Acidentes de Trabalho - SIVAT foi desenvolvido pelo Grupo de Banco de Dados - GBD em convênio com as prefeituras municipais e o Centro de Referência em Saúde do Trabalhador - CEREST de São José do Rio Preto e Ilha Solteira. Neste trabalho é apresentada uma extensão do SIVAT que incorpora um Sistema de Informação Geográfica (SIG) para possibilitar maior interatividade e flexibilidade na análise das notificações de acidentes. Objetivos: O SIG foi desenvolvido para permitir que o usuário identificasse no mapa a distribuição dos acidentes do trabalho, bem como as relações existentes entre as características comuns destes acidentes ao analisar as regiões selecionadas. Métodos: O sistema gerenciador de banco de dados utilizado foi o PostgreSQL com extensão Postgis [1]. As informações contidas no banco de dados do SIVAT são projetadas por meio do GeoServer [2], um servidor de informação geoespacial e para a comunicação entre as projeções do GeoServer com a interface Web do sistema utilizou-se a biblioteca do OpenLayers [3]. Resultados: As notificações de acidentes do trabalho armazenadas na base do SIVAT vêm sendo georreferenciadas para possibilitar a utilização do SIG. Atualmente, mais de 15.000 registros já passaram por este processo.Dentre as funcionalidades do SIG destacam-se: visualização das ocorrências no mapa de acordo com o ano, o que permite a análise da distribuição das ocorrências; seleção de áreas por meio de polígonos para a geração de relatórios sobre estas regiões e uso de filtros para avaliar apenas as características de interesse, por exemplo: tipo de acidente, ocupação do acidentado e máquina causadora. Tais funcionalidades auxiliam na análise das notificações de forma ágil e flexível. Um exemplo disso é a facilidade que a interface SIG proporciona para identificar as vias públicas em que vários acidentes do trabalho ocorreram. Assim, a extensão SIG contribui para que os órgãos envolvidos planejem com eficiência medidas preventivas e corretivas sobre tais acidentes.  </p

    Regulação médica em emergência pela plataforma web: um estudo piloto

    Get PDF
    OBJECTIVE: To describe a management system for emergency medical coordination based on the worldwide web of computers. METHODS: The emergency coordination system was developed according to an evolving software model for prototype development. Communication between users and the system was implemented by means of web technologies. The system was developed on a personal homepage and the database was developed using MySQL. The prototype was based on the medical coordination process of the Thirteenth Regional Healthcare Division of the State of São Paulo (Southeastern Brazil) and was applied to 26 municipalities within this regional division, for four consecutive weeks in September 2009. The system made it possible to document requests in chronological order, without allowing editing of data already entered, and ensured hierarchical confidential access to the information for each participant in the system. RESULTS: The system presented 100% availability, reliability and integrity of information. A total of 1,046 requests were made to the system, of which 703 (68%) were completed. The solicitants already presented 98% adherence to the system in the first week of application, while adherence among service providers gradually increased (37% in the fourth week). The municipalities closest to Ribeirão Preto that did not have high-complexity providers were the ones that most used the system. CONCLUSIONS: Medical coordination of emergency requests through the worldwide web of computers was shown to be feasible and reliable, and it enabled transparency within the process and direct access to information for managers. It allowed indicators to be constructed in order to monitor and improve the process, from the perspective of creating semi-automated coordination and advances in system organization.OBJETIVO: Describir un sistema gestor de regulación médica en emergencia basada en la red mundial de computadores. MÉTODOS: El Sistema de Regulación de Urgencias y Emergencias fue desarrollado según modelo evolutivo de software de prototipación. La comunicación entre los usuarios y el sistema fue implementada utilizando tecnologías web; el sistema fue desarrollado en personal home page (PHP) y el banco de datos, en MySQL. El prototipo fue basado en el proceso de regulación médica de la División Regional de Salud XIII del Estado de Sao Paulo (Sureste de Brasil) y aplicado a 26 municipios de esta regional durante caro semanas consecutivas en septiembre de 2009. El Sistema posibilitó la documentación de las solicitudes en orden cronológico, sin permitir edición de datos ya insertados y garantizando el acceso jerarquizado y sigiloso a las informaciones de cada participante del sistema. RESULTADOS: El Sistema presentó 100% de disponibilidad, confiabilidad e integridad de la información. Se realizaron 1.046 solicitudes al sistema, de las cuales 703 (68%) fueron completadas Los solicitantes presentaron 98% de adhesión al sistema en la primera semana de aplicación, y la adhesión de los prestadores de servicio fue gradual, (37% en la cuarta semana). Los municipios más próximos de Ribeirao Preto que no poseen prestadores de alta complejidad fueron los que más utilizaron el Sistema. CONCLUSIONES: La regulación médica de solicitudes de emergencia por la red mundial de computadores se mostró exequible y confiable, posibilitando la transparencia del proceso y acceso directo a las informaciones por parte de los gestores. Posibilitó la construcción de indicadores para monitorizar y mejorar el proceso, en la perspectiva de la creación de una regulación semi-automatizada y de avances en la organización del sistema.OBJETIVO: Descrever um sistema gestor de regulação médica em emergência baseado na rede mundial de computadores. MÉTODOS: O Sistema de Regulação de Urgências e Emergências foi desenvolvido segundo modelo evolutivo de software de prototipação. A comunicação entre os usuários e o sistema foi implementada utilizando tecnologias web; o sistema foi desenvolvido em personal home page (PHP) e o banco de dados, em MySQL. O protótipo foi baseado no processo de regulação médica da Divisão Regional de Saúde XIII do Estado de São Paulo e aplicado a 26 municípios dessa regional durante quatro semanas consecutivas em setembro de 2009. O sistema possibilitou a documentação das solicitações em ordem cronológica, sem permitir edição de dados já inseridos e garantindo o acesso hierarquizado e sigiloso às informações para cada participante do sistema. RESULTADOS: O sistema apresentou 100% de disponibilidade, confiabilidade e integridade da informação. Foram realizadas 1.046 solicitações ao sistema, das quais 703 (68%) foram completadas. Os solicitantes apresentaram 98% de adesão ao sistema na primeira semana de aplicação, e a adesão dos prestadores de serviço foi gradativa (37% na quarta semana). Os municípios mais próximos de Ribeirão Preto que não possuem prestadores de alta complexidade foram os que mais utilizaram o sistema. CONCLUSÕES: A regulação médica de solicitações de emergência pela rede mundial de computadores mostrou-se exeqüível e confiável, possibilitando a transparência do processo e acesso direto às informações por parte dos gestores. Possibilitou a construção de indicadores para monitorizar e aprimorar o processo, na perspectiva da criação de uma regulação semi-automatizada e de avanços na organização do sistema

    Regulação médica em emergência pela plataforma web: um estudo piloto

    Get PDF
    OBJECTIVE: To describe a management system for emergency medical coordination based on the worldwide web of computers. METHODS: The emergency coordination system was developed according to an evolving software model for prototype development. Communication between users and the system was implemented by means of web technologies. The system was developed on a personal homepage and the database was developed using MySQL. The prototype was based on the medical coordination process of the Thirteenth Regional Healthcare Division of the State of São Paulo (Southeastern Brazil) and was applied to 26 municipalities within this regional division, for four consecutive weeks in September 2009. The system made it possible to document requests in chronological order, without allowing editing of data already entered, and ensured hierarchical confidential access to the information for each participant in the system. RESULTS: The system presented 100% availability, reliability and integrity of information. A total of 1,046 requests were made to the system, of which 703 (68%) were completed. The solicitants already presented 98% adherence to the system in the first week of application, while adherence among service providers gradually increased (37% in the fourth week). The municipalities closest to Ribeirão Preto that did not have high-complexity providers were the ones that most used the system. CONCLUSIONS: Medical coordination of emergency requests through the worldwide web of computers was shown to be feasible and reliable, and it enabled transparency within the process and direct access to information for managers. It allowed indicators to be constructed in order to monitor and improve the process, from the perspective of creating semi-automated coordination and advances in system organization.OBJETIVO: Describir un sistema gestor de regulación médica en emergencia basada en la red mundial de computadores. MÉTODOS: El Sistema de Regulación de Urgencias y Emergencias fue desarrollado según modelo evolutivo de software de prototipación. La comunicación entre los usuarios y el sistema fue implementada utilizando tecnologías web; el sistema fue desarrollado en personal home page (PHP) y el banco de datos, en MySQL. El prototipo fue basado en el proceso de regulación médica de la División Regional de Salud XIII del Estado de Sao Paulo (Sureste de Brasil) y aplicado a 26 municipios de esta regional durante caro semanas consecutivas en septiembre de 2009. El Sistema posibilitó la documentación de las solicitudes en orden cronológico, sin permitir edición de datos ya insertados y garantizando el acceso jerarquizado y sigiloso a las informaciones de cada participante del sistema. RESULTADOS: El Sistema presentó 100% de disponibilidad, confiabilidad e integridad de la información. Se realizaron 1.046 solicitudes al sistema, de las cuales 703 (68%) fueron completadas Los solicitantes presentaron 98% de adhesión al sistema en la primera semana de aplicación, y la adhesión de los prestadores de servicio fue gradual, (37% en la cuarta semana). Los municipios más próximos de Ribeirao Preto que no poseen prestadores de alta complejidad fueron los que más utilizaron el Sistema. CONCLUSIONES: La regulación médica de solicitudes de emergencia por la red mundial de computadores se mostró exequible y confiable, posibilitando la transparencia del proceso y acceso directo a las informaciones por parte de los gestores. Posibilitó la construcción de indicadores para monitorizar y mejorar el proceso, en la perspectiva de la creación de una regulación semi-automatizada y de avances en la organización del sistema.OBJETIVO: Descrever um sistema gestor de regulação médica em emergência baseado na rede mundial de computadores. MÉTODOS: O Sistema de Regulação de Urgências e Emergências foi desenvolvido segundo modelo evolutivo de software de prototipação. A comunicação entre os usuários e o sistema foi implementada utilizando tecnologias web; o sistema foi desenvolvido em personal home page (PHP) e o banco de dados, em MySQL. O protótipo foi baseado no processo de regulação médica da Divisão Regional de Saúde XIII do Estado de São Paulo e aplicado a 26 municípios dessa regional durante quatro semanas consecutivas em setembro de 2009. O sistema possibilitou a documentação das solicitações em ordem cronológica, sem permitir edição de dados já inseridos e garantindo o acesso hierarquizado e sigiloso às informações para cada participante do sistema. RESULTADOS: O sistema apresentou 100% de disponibilidade, confiabilidade e integridade da informação. Foram realizadas 1.046 solicitações ao sistema, das quais 703 (68%) foram completadas. Os solicitantes apresentaram 98% de adesão ao sistema na primeira semana de aplicação, e a adesão dos prestadores de serviço foi gradativa (37% na quarta semana). Os municípios mais próximos de Ribeirão Preto que não possuem prestadores de alta complexidade foram os que mais utilizaram o sistema. CONCLUSÕES: A regulação médica de solicitações de emergência pela rede mundial de computadores mostrou-se exeqüível e confiável, possibilitando a transparência do processo e acesso direto às informações por parte dos gestores. Possibilitou a construção de indicadores para monitorizar e aprimorar o processo, na perspectiva da criação de uma regulação semi-automatizada e de avanços na organização do sistema

    Estratégia para extração, transformação e armazenamento em Data Warehouse ativo baseada em políticas configuráveis de propagação de dados

    No full text
    Em arquiteturas de Data Warehouse os dados são integrados periodicamente por meio da execução de processos de Extração, Transformação e Armazenamento – ETA. A atualização desses dados de forma periódica provoca um problema referente à desatualização das informações, uma vez que as ferramentas ETAs são executadas geralmente uma vez ao dia. A crescente necessidade do mundo corporativo por análises sobre dados cada vez mais recentes evidencia a necessidade de arquiteturas DW que possuam um maior grau de atualização. Nesse contexto, surgiram os DW ativos cujo intervalo de tempo entre as execuções do processo ETAs diminuem significativamente. Para suportar o aumento da frequência das atualizações, surge a necessidade de criação de critérios para priorização dos dados a serem transferidos, uma vez que a transferência de todo e qualquer dado inserido nas fontes pode sobrecarregar os sistemas envolvidos. O trabalho proposto consiste na construção de uma estratégia denominada ETA-PoCon, que tem como objetivo a execução do processo ETA em DW ativos. A estratégia distingue-se das existentes, pois possui políticas configuráveis de propagação de informações com base em parâmetros como intervalo de tempo em que a informação deve ser transferida, volume que deve ser propagado e relevância dos dados em relação às informações contidas no repositório. É demonstrado por meio dos experimentos executados que a aplicação da estratégia proporciona uma redução considerável no número de transferência de dados ao DW, uma vez que em todos os resultados a redução no total de atualizações foi superior a 60%In Data Warehouse (DW) architectures data are periodically integrated by means of execution of Extraction, Transformation and Load (ETL) processes which lead to the problem of outdated information. The growing necessity in the corporate world for analysis of constantly renewed data bespeaks of the need for DW architectures with higher level of freshness. In that context, active DWs appeared having a significant reduction of the interval of time between the executions of ETL processes. To support the increased frequency of the refreshment it’s necessary to create criteria to prioritise the data to be transferred, since a transfer of all and any data from the sources would overload the systems. This work consists of the construction of a strategy called ETL-PoCon to execute ETL processes in active DWs. The original contribution of this work is to provide a strategy that considerably reduces the quantity of data transfers to active DWs, besides maintaining a satisfactory level of data freshness. Said reduction is obtained by means of configurable policies of data propagation based on parameters such as: the time in which the data must be transferred, the volume to be propagated and the relevance of the data regarding to the information stored in the DW. Experiments have shown that the ETL-PoCon strategy significantly contributes towards a reduction of the overload on the systems involved in the active DW environment, since all results presented a reduction higher than 60% in the amount of DW refreshment

    Comparative study of algorithms for mining association rules: Traditional approach versus multi-relational approach

    No full text
    The multi-relational Data Mining approach has emerged as alternative to the analysis of structured data, such as relational databases. Unlike traditional algorithms, the multi-relational proposals allow mining directly multiple tables, avoiding the costly join operations. In this paper, is presented a comparative study involving the traditional Patricia Mine algorithm and its corresponding multi-relational proposed, MR-Radix in order to evaluate the performance of two approaches for mining association rules are used for relational databases. This study presents two original contributions: the proposition of an algorithm multi-relational MR-Radix, which is efficient for use in relational databases, both in terms of execution time and in relation to memory usage and the presentation of the empirical approach multirelational advantage in performance over several tables, which avoids the costly join operations from multiple tables. © 2011 IEEE

    A model for analysing data portal performance: The biodiversity case

    No full text
    Currently, many museums, botanic gardens and herbariums keep data of biological collections and using computational tools researchers digitalize and provide access to their data using data portals. The replication of databases in portals can be accomplished through the use of protocols and data schema. However, the implementation of this solution demands a large amount of time, concerning both the transfer of fragments of data and processing data within the portal. With the growth of data digitalization in institutions, this scenario tends to be increasingly exacerbated, making it hard to maintain the records updated on the portals. As an original contribution, this research proposes analysing the data replication process to evaluate the performance of portals. The Inter-American Biodiversity Information Network (IABIN) biodiversity data portal of pollinators was used as a study case, which supports both situations: conventional data replication of records of specimen occurrences and interactions between them. With the results of this research, it is possible to simulate a situation before its implementation, thus predicting the performance of replication operations. Additionally, these results may contribute to future improvements to this process, in order to decrease the time required to make the data available in portals. © Rinton Press
    corecore