25 research outputs found

    The Strategic Role of Semantic Web in the Big Data Context

    Get PDF
    Artigo apresentado no I Workshop de Informação, Dados e Tecnologia, realizado entre nos dias 04 e 06 de setembro de 2017, na cidade de Florianópolis (SC), no Auditório do Espaço Físico Integrado (EFI) da Universidade Federal de Santa Catarina (UFSC).A Web Semântica apresenta um corpus teórico e diversas tecnologias e aplicações que demonstram a sua consistência, inclusive no que tange ao uso de seus conceitos e de suas tecnologias em outros escopos não se limitando unicamente a Web. Neste sentido, os projetos de Big Data podem tirar proveito da aplicação dos princípios e dos desenvolvimentos realizados na área da Web Semântica, para aperfeiçoar os processos de análises de dados, em especial na inserção de características semânticas para contextualização dos dados. Assim, esta pesquisa tem como objetivo analisar e discutir o potencial das tecnologias da Web Semântica como meio de integração e desenvolvimento de aplicações de Big Data. Utilizou-se uma metodologia qualitativa exploratória, onde buscou-se pontos de convergência entre a Web Semântica e Big Data. Foram identificados e discutidos três pontos principais: a aplicação do Linked Data enquanto fonte de dados para o Big Data; o uso de ontologias nas análises de dados; e o uso das tecnologias da Web Semântica para promoção da interoperabilidade em cenários de Big Data. Neste sentido, foi possível identificar que a Web Semântica, em especial no que permeia suas tecnologias e aplicações, pode auxiliar significativamente o desenvolvimento do Big Data, por fornecer um paradigma complementar dos aplicados majoritariamente nas análises de dados.The Semantic Web presents a theoretical corpus and a range of technologies and applications that demonstrate its consistency, including in use of its concepts and its technologies in other scopes than the Web. In this sense, Big Data's projects can take advantage of the application of principles and developments in the area of the Semantic Web, to improve the processes of data analysis, especially in the insertion of semantic characteristics for data contextualization. Thus, this research aims to analyze and discuss the potential of Semantic Web technologies as a means of integrating and developing Big Data applications. An exploratory qualitative methodology was used, where we searched for points of the literature and documentary texts dealt with the convergence between the Semantic Web and the Big Data. Three main points were identified and discussed: the application of Linked Data as a data source for Big Data; the use of ontologies in data analysis; the use of Semantic Web technologies to promote interoperability in Big Data scenarios. Therefore, it was possible to identify that the Semantic Web, especially with regard to its technologies, can help Big Data, since it provides a paradigm different from those applied mainly in data analysis

    Big Data: fatores potencialmente discriminatórios em análise de dados

    Get PDF
    The experienced technological changes from the turn of the century caused a revolution in the Big Data society, in which the data analysis to determine patterns and behaviors could use large amounts of data. It is possible to notice that some analyses in the context of the Big Data are being conducted to generate discriminatory results. This study aims to identify factors that can potentially lead to discrimination in the process of data analysis. The methodology used was qualitative, exploratory and bibliographical, enumerating the discrimination cases. As the result, we identified possibly discriminatory factors and we provided an explanation of these factors. Through research, we noticed the need of showing deep reflection about the results that are obtained from the data analysis and the need of Information Science approaching such questions, in order to point out the paths to be taken.As mudanças tecnológicas vividas a partir da virada do século causaram uma revolução na sociedade, chamada de Big Data, em que as análises de dados para determinar padrões e comportamentos puderam utilizar grandes quantidades de dados. Verifica-se que algumas análises, no contexto do Big Data, estão sendo conduzidas a gerar resultados discriminatórios. O estudo tem como objetivo identificar fatores que, potencialmente, possam gerar discriminação durante o processo de análise de dados. Para tal, a metodologia utilizada foi de natureza qualitativa, exploratória e bibliográfica, enumerando em um quadro os casos de discriminação. Como resultado, identificam-se fatores possivelmente discriminatórios, além de ser feita uma explanação desses fatores. Por meio da pesquisa, verifica-se uma necessidade de existir reflexões profundas dos resultados que são obtidos a partir de análises de dados, ficando clara a necessidade da Ciência da Informação retratar tais questões, a fim de apontar os caminhos a serem tomados

    Tecnologias da web semântica para a recuperação da informação no wikidata

    Get PDF
    A Recuperação da Informação é responsável pelo armazenamento e pela recuperação automática de informação, podendo estes documentos ser constituídos por textos, páginas Web, áudio, vídeo, imagens, gráficos e figuras. Técnicas de Recuperação de Informação ganharam importância com o crescimento da Web, pois a quantidade ilimitada de informação pode expressar as mais diversas formas e níveis de qualidade ao que se espera. Pensando nisso o presente trabalho estuda métodos e tecnologias capazes de recuperar essas informações, dando enfoque a buscar em bases de dados estruturadas chamadas Linked Data, mas especificamente no Wikidata, uma base de dados estruturada utilizando conceitos da Web Semântica, que reúne conhecimentos da Wikipédia. Buscando compreender como é feita essa recuperação da informação no projeto Wikidata, esta pesquisa tem como objetivo apresentar os meios que o Wikidata fornece para a RI e como eles usam os princípios da Web Semântica. A metodologia utilizada foi um estudo exploratório com embasamento para a pesquisa e aplicada, uma vez que testes foram feitos na base de dados do Wikidata. Como resultados, identificou-se características das diversas formas de acesso e de recuperação dos dados, traçando correlações existentes entre cada uma destas formas, com o arcabouço teórico da Web Semântica e da Recuperação da Informação. Concluiu-se que o Wikidata se coloca como uma base de dados sólida, com um grande volume de conteúdo que possui uma série de mecanismos de recuperação, capazes de atender às mais diversas aplicações existentes na Web, devido a estes mecanismos serem construídos com distintas tecnologias e configurações

    Audiovisuais e Linked data: um estudo das bases DBpedia e LMDB

    Get PDF
    AAs proponent of the Semantic Web and Linked data principles, the Linking Open Data initiative offers an enormous proportion of audiovisual data, which can assist in the search and retrieval of more accurate information. In this sense, the objective of this work is to explore the possible relations between audiovisual databases and Linking Open Data, to present the potential of this initiative for users who seek detailed sources of information about the audiovisual resources. A qualitative research was used, with an exploratory and applied nature, based on the scientific literature of the Linked Data, Semantic Web and audiovisual, and subsequently the DBpedia and LMDB with the use of the SPARQL protocol. The study considers that datasets available in the Linking Open Data can assist the link between information on audiovisual resources, as well as, it may be a source for the construction of more dynamic catalogues, reducing rework during the process of description of informational resources.Como proponente da Web Semântica e dos princípios Linked Data, a iniciativa Linking Open Data oferece uma enorme proporção de dados de audiovisuais que podem auxiliar nas buscas e na recuperação de informações mais precisas. Nesse cenário, o objetivo é explorar os possíveis relacionamentos de bases de dados de audiovisuais no Linking Open Data, no intuito de apresentar o potencial dessa iniciativa para usuários que buscam fontes de informação detalhadas sobre os audiovisuais. Utilizou-se uma pesquisa de natureza qualitativa, com caráter exploratório e aplicado, baseada na literatura científica dos temas Linked Data, Web Semântica e audiovisual. Posteriormente, foram consultadas as bases DBpedia e LMDB com o uso do protocolo SPARQL. Considera-se que os conjuntos de dados disponíveis no Linking Open Data não só podem auxiliar na ligação entre informações sobre recursos audiovisuais, como também, podem ser fonte para a construção de catálogos mais dinâmicos, reduzindo o retrabalho durante o processo de descrição de recursos informacionais

    Disponibilização de metadados em Linked Data para repositórios digitais

    Get PDF
    Considering the expansion of scientific production in digital information environments and the new forms of data availability following the principles of Linked Data, the objective is to discuss possibilities of relationships of datasets and semantic enrichment of metadata in digital repositories and present a model of conversion of records in RDF. It is a theoretical and exploratory research, performing a bibliographic review on digital repositories and Linked Data. In this way, we have demostrated possibilities of the conversion process,identifying databases, vocabularies and standards that must be adopted so that the generated data is enriched semantically. The work presented a model that reflects the steps that must be taken in the process of making available the metadata of a digital repository in Linked Data. It is concluded that the integration between digital repositories and Semantic Web technologies allows the availability of data in Linked Data, which provides new means for the dissemination and integration of resources on Web

    Disponibilização de metadados em Linked Data para repositórios digitais

    Get PDF
    Considering the expansion of scientific production in digital information environments and the new forms of data availability following the principles of Linked Data, the objective is to discuss possibilities of relationships of datasets and semantic enrichment of metadata in digital repositories and present a model of conversion of records in RDF. It is a theoretical and exploratory research, performing a bibliographic review on digital repositories and Linked Data. In this way, we have demostrated possibilities of the conversion process,identifying databases, vocabularies and standards that must be adopted so that the generated data is enriched semantically. The work presented a model that reflects the steps that must be taken in the process of making available the metadata of a digital repository in Linked Data. It is concluded that the integration between digital repositories and Semantic Web technologies allows the availability of data in Linked Data, which provides new means for the dissemination and integration of resources on Web

    Responsible data science: impartiality, accuracy, confidentiality and transparency of data

    Get PDF
    Introdução: no contexto Big Data, surge, como necessidade urgente, a aplicação de direitos individuais e empresariais e de normas regulatórias que resguardem a privacidade, a imparcialidade, a precisão e a transparência. Nesse cenário, a Responsible Data Science desponta como uma iniciativa que tem como base as diretrizes FACT, que correspondem à adoção de quatro princípios: imparcialidade, precisão, confidencialidade e transparência. Objetivo: abordar alternativas que podem assegurar a aplicação das diretrizes FACT. Metodologia: foi desenvolvida investigação exploratória e descritiva com abordagem qualitativa. Foram realizadas pesquisas nas bases de dados bibliográficas Web of Science, Scopus e pelo motor de busca Scholar Google com a utilização dos termos “Responsible Data Science”, “Fairness, Accuracy, Confidentiality, Transparency + Data Science”, FACT e FAT relacionados com Data Science. Resultados: a Responsible Data Science desponta como uma iniciativa que tem como base as diretrizes FACT, que correspondem à adoção dos princípios: imparcialidade, precisão, confidencialidade e transparência. Para a implementação dessas diretrizes, deve-se considerar o uso de técnicas e abordagens que estão sendo desenvolvidas pela Green Data Science. Conclusões: concluiu-se que a Green Data Science e as diretrizes FACT contribuem significativamente para a salvaguarda dos direitos individuais, não sendo necessário recorrer a medidas que impeçam o acesso e a reutilização de dados. Os desafios para implementar as diretrizes FACT requerem estudos, condição sine qua non para que as ferramentas para análise e disseminação dos dados sejam desenvolvidas ainda na fase de concepção de metodologias.Introduction: In the Big Data context, as an urgent need arises the application of individual and corporate rights and regulatory standards that safeguard privacy, impartiality, accuracy and transparency. In this scenario, Responsible Data Science emerges as an initiative based on the FACT guidelines, which correspond to the adoption of four principles: impartiality, accuracy, confidentiality and transparency. Objective: To address alternatives that can ensure the application of the FACT guidelines. Methodology: An exploratory and descriptive research with a qualitative approach was developed. Searches were performed on the Web of Science, Scopus, and Scholar Google search engines using Responsible Data Science, Fairness, Accuracy, Confidentiality, Transparency Data Science, FACT, and FAT related to Data Science. Results: Responsible Data Science emerges as an initiative based on the FACT guidelines, which correspond to the adoption of the principles: impartiality, accuracy, confidentiality and transparency. In implementing these guidelines, consideration should be given to the use of techniques and approaches being developed by Green Data Science. Conclusions: It is concluded that Green Data Science and the FACT guidelines contribute significantly to safeguarding individual rights and that no measures need to be taken to prevent access and reuse of data. Challenges for implementing the FACT guidelines require studies, sine qua non conditions for tools for data analysis and dissemination to be developed at the design stage of methodologies.Introducción: en el contexto de Big Data, como una necesidad urgente surge la aplicación de los derechos individuales y corporativos y las normas reguladoras que salvaguardan la privacidad, imparcialidad, precisión y transparencia. En este escenario, Responsible Data Science surge como una iniciativa basada en las pautas de FACT, que corresponden a la adopción de cuatro principios: imparcialidad, precisión, confidencialidad y transparencia. Objetivo: abordar alternativas que puedan garantizar la aplicación de las pautas de FACT. Metodología: se desarrolló una investigación exploratoria y descriptiva con un enfoque cualitativo. Las búsquedas se realizaron en los motores de búsqueda de Web of Science, Scopus y Scholar Google utilizando los términos "Ciencia de datos responsable", "Justicia, precisión, confidencialidad, transparencia + ciencia de datos", FACT y FAT relacionados con ciência de los datos. Resultados: Responsible Data Science surge como una iniciativa basada en los lineamientos de FACT, que corresponden a la adopción de los principios: imparcialidad, precisión, confidencialidad y transparencia. Al implementar estas pautas, se debe considerar el uso de técnicas y enfoques desarrollados por Green Data Science. Conclusiones: Se concluye que Green Data Science y las pautas FACT contribuyen significativamente a salvaguardar los derechos individuales y que no es necesario tomar medidas para evitar el acceso y la reutilización de datos. Los desafíos para implementar las pautas FACT requieren estudios, condiciones sine qua non para desarrollar herramientas para el análisis y la difusión de datos en la etapa de diseño de las metodologias

    Tecnologias da Web Semântica na arquitetura da informação; Tecnologias da Web Semântica na arquitetura da informação; Tecnologías de la Web Semántica en arquitectura de la información

    Get PDF
    The researches of Information Architecture and Semantic Web are increasingly necessary, due to the need to have an understanding of the context of the information, both from the perspective of human users and non-humans/machines users. These two study fields contribute to improving the way informational content is presented and used in digital environments. Thus, this paper identified and analyzed the relationships between Information Architecture systems and Semantic Web resources, presenting how each Information Architecture system can benefit from the incorporation of Semantic Web technologies. For this, a qualitative methodology was used, with a descriptive and exploratory approach, relating the five systems of Information Architecture with the concepts, technologies and applications of the Semantic Web. As results, it was possible to verify that all systems of Information Architecture can be enriched with Semantic Web technologies. In this way, it was concluded that the application of Semantic Web technologies in Information Architecture systems contributes to a semantic structure of digital information environments

    Europeana no Linked Open Data: conceitos de Web Semântica na dimensão aplicada das Humanidades Digitais

    No full text
    http://dx.doi.org/10.5007/1518-2924.2017v22n48p88 O surgimento de novas tecnologias, tem introduzido meios para a divulgação e a disponibilização das informações mais eficientemente. Uma iniciativa, chamada de Europeana, vem promovendo esta adaptação dos objetos informacionais dentro da Web, e mais especificamente no Linked Data. Desta forma, o presente estudo tem como objetivo apresentar uma discussão acerca da relação entre as Humanidades Digitais e o Linked Open Data, na figura da Europeana. Para tal, utilizamos uma metodologia exploratória e que busca explorar as questões relacionadas ao modelo de dados da Europeana, EDM, por meio do SPARQL. Como resultados, compreendemos as características do EDM, pela utilização do SPARQL. Identificamos, ainda, a importância que o conceito de Humanidades Digitais possui dentro do contexto da Europeana
    corecore