5 research outputs found

    REDUZINDO O ESFORÇO NA PREPARAÇÃO DE METADADOS: USO DE SOFTWARE LIVRE PARA DOCUMENTAR DADOS ESPACIAIS NO PERFIL MGB

    Get PDF
    The settlement of the National Infrastructure for Spatial Data (Infraestrutura Nacional de Dados Espaciais - INDE) is an initiative to help organizing the generation, storage, access, sharing, dissemination and use of geographic data about the Brazilian territory. Now-a-days, there are several initiatives of implementation and management of Spatial Data Infrastructures. However, only a few organizations are really documenting the metadata in their geospatial databases. This is mainly due to the fact that the process of documenting data is time consuming and complex, requiring training on the part of data producers. This paper discusses an alternative process for the extraction and documentation of metadata using free open software to increase efficiency and providing incentive to the generation of metadata for the data produced in Brazil. We performed the customization of the MGB profile using CatMDEdit software for viewing and editing the metadata in this profile. This tool was also used to extract and document metadata from files in shapefile format and to edit metadata fields after extraction. The file generated in XML was imported and converted to an MGB profile contained in the application Geonetwork. Results show that it is possible to extract information contained in the data and easily and quickly generate metadata in MGB profile, if the activity is well planned and supported by model files (templates).O estabelecimento da Infraestrutura Nacional de Dados Espaciais (INDE) é uma iniciativa para ordenar a geração, armazenamento, acesso, compartilhamento, divulgação e uso dos dados geoespaciais sobre o território brasileiro. Atualmente, existem várias iniciativas de implantação e gestão de Infraestruturas de Dados Espaciais, entretanto, apenas algumas organizações estão realmente documentando os metadados em suas bases geoespaciais. Isto ocorre, principalmente, devido ao processo de documentação do dado ser demorado e complexo, exigindo capacitação por parte dos produtores de dados. Este artigo apresenta um processo alternativo de extração e documentação de informações sobre os dados, por meio de softwares livres, visando a aumentar a eficiência e o incentivo na produção de metadados para os dados produzidos no Brasil. Para tanto, foi realizada a customização do perfil MGB no software CatMDEdit, facilitando a visualização e edição dos metadados neste perfil. Essa ferramenta também é utilizada para extrair e documentar metadados, a partir de arquivos no formato shapefile, e editar os campos do metadado após a extração. O arquivo gerado em XML é importado e transformado para o perfil MGB contido na aplicação Geonetwork. Os resultados obtidos demonstraram que é possível extrair informações contidas em dados e documentar metadados no perfil MGB, com facilidade e rapidez se a atividade for bem planejada e apoiada em arquivos modelo (templates)

    TensorAnalyzer: Urban Patterns Identifications in Big Cities using Non-Negative Tensor Factorization

    Get PDF
    Grandes cidades como São Paulo (a maior da América Latina), tipicamente apresentam grandes volumes de crimes que vão desde roubos até homicídios. O aumento de atividades criminais em São Paulo tem despertado o interesse de especialistas de criminologia em compreender o relacionamento entre atividades criminais e as características no entorno de escolas, homicídios, etc. No entanto, a extração de relevantes padrões pode se tornar uma tarefa complicada ao empregar algoritmos de clusterização clássicos, isso porque existem muitos parâmetros para configurar e também o usuário ainda tem que se preocupar com os outliers presentes nos dados. Deste modo, este trabalho apresenta uma nova abordagem para detectar padrões relevantes de múltiplas fontes de dados baseada em decomposição de tensor. O desempenho da abordagem proposta é atestada para validar a qualidade dos padrões identificados em comparação com abordagens clássicas. O resultado indica que a abordagem pode efetivamente identificar padrões úteis para caracterizar o conjunto de dados para análise posterior na obtenção de uma boa qualidade de agrupamento. Além disso, um framework genérico nomeado TensorAnalyzer foi desenvolvido, em que a eficácia e a utilidade da metodologia proposta são destacadas por experimentos em conjuntos de dados sintéticos e do mundo real, sendo desenvolvidos dois estudos de caso, em que o primeiro estudo mostra a relação entre o entorno das escolas e os padrões criminais e o segundo estudo busca compreender os padrões no entorno dos homicídios.Extracting relevant patterns from multiple data sources can be difficult using classical clustering algorithms since we have to make the suitable configuration of the hyperparameters of the algorithms and deal with outliers. In many contexts, pattern extraction is crucial and should be addressed correctly. In criminology, for example, one of the main interests of the experts of São Paulo is the comprehension of the relationship between crimes and the characteristics around specific targets. This work presents a new approach to detecting the most relevant patterns from multiple data sources based on tensor decomposition. Compared to classical methods, the proposed approachs performance is attested to validate the identified patterns quality. The result indicates the approach can effectively identify useful patterns to characterize the data set for further analysis in achieving good clustering quality. Furthermore, we developed a generic framework named TensorAnalyzer, where the effectiveness and usefulness of the proposed methodology are tested by a set of experiments and two real-world cases studies showing the relationship between the crime events, urban characteristics, and other variables involved in the analysis

    A library to support the development of applications that process huge matrices in external memory

    No full text
    Este trabalho apresenta uma biblioteca, chamada TiledMatrix, para auxiliar o desenvolvimento de aplicações que processam grandes matrizes armazenadas na memória externa. A biblioteca é baseada em algumas estratégias similares ao gerenciamento de uma memória cache e seu objetivo básico é permitir que uma aplicação, desenvolvida para processamento na memória interna, possa ser adaptada para ser processada na memória externa. Ela oferece uma interface para acessar a memória externa similar ao tradicional método de acesso a uma matriz. Além disso, ela divide a matriz em blocos bidimensionais, sendo que os blocos são organizados no disco de modo a tirar proveito do padrão de acesso das aplicações. A fim de reduzir o tempo de transferência do bloco para e do disco, a TiledMatrix utiliza um algoritmo de compressão/descompressão de dados que foi implementado em paralelo para melhorar ainda mais a eficiência da biblioteca. Assim, a TiledMatrix foi implementada e testada em algumas aplicações que requerem intensivo processamento de matrizes tais como: calcular a transposta da matriz, calcular a área de Visibilidade, fluxo acumulado e filrto da mediana. Estas aplicações foram implementadas em duas Versões: uma usando a TiledMatrix e outra usando a Segment, uma biblioteca que está incluída no GRASS, um sistema de informação geográfica open sourca Em média, elas foram 7 Vezes mais rápidas com a TiledMatrix e, em alguns casos, foram em torno de 18 Vezes mais rápidas. A TiledMatrix também foi avaliada com 0 ArcGIS e considerou-se duas aplicações que estão incluídas no ArcGIS: calcular a área de Visibilidade e 0 ñuxo acumulado. Como os testes mostraram, em alguns casos, as aplicações foram mais do que 200 Vezes mais rápidas ao utilizarem a TiledMatrix.This Work presents a new library, named TiledMatrix, to support the development of applications that process large matrices stored in external memory. The library is based on some strategies similar to cache memory management and its basic purpose is to allow that an application, designed for internal memory processing, can be adapted for external memory. It provides an interface for external memory access that is similar to the traditional method to access a matrix Moreover, it divides the matrix into tWo-dimensional blocks, Where the blocks are organized in the disk to take advantage of access pattern of applications. In order to reduce the transfer time of a block to and from the disk, TiledMatrix uses an algorithm for compression/decompression of data that Was implemented in parallel to further improve the efñciency of the library. The TiledMatrix Was implemented and tested in some applications that require intensive matrix processing such asz computing the transposed matrix and the computation of Viewshed, ñow accumulation and median. These applications Were implemented in two Versionsz one using TiledMatrix and another one using the Segment library that is included in GRASS, an open source GIS. In average, they Were 7 times faster With TiledMatrix and, in some cases, more than 18 times faster. The TiledMatrix performance Was also compared With the ArcGLSÍ For these tests, it Was considered only two applications that are included in ArcGIS: the Uiewshed and the ñow accumulation. As tests have shown, in some cases, the applications Were more than 200 times faster using the TiledMatrix.Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

    Núcleos de Ensino da Unesp: artigos 2012: volume 6: formação de professores e trabalho docente

    No full text
    Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES

    Núcleos de Ensino da Unesp: artigos 2009

    No full text
    corecore