102 research outputs found
The data mining of discursive practices in a Chat : a pedagogical perspective in Distance Education context
Este artigo apresenta a utilização da ferramenta de mineração textual SOBEK com vistas ao acompanhamento pedagógico de práticas discursivas escritas decorrentes de um Chat em EAD. O papel central da língua no desenvolvimento humano está concebido por meio de um agir linguageiro enquanto Sistema Adaptativo Complexo (SAC). Nessa perspectiva, compreende-se que a linguagem se situa em práticas interacionais e está em permanente transformação. Este estudo tem caráter empírico de cunho qualitativo, inserido na plataforma Moodle, investigando a especificidade das interações realizadas em um Chat, em uma disciplina de Ensino a Distância (EAD) em nível de graduação, na perspectiva da Teoria da Complexidade e do Interacionismo Sociodiscursivo - ISD. As relações discursivas situadas foram observadas quanto à forma como os interagentes se adaptavam ao contexto discursivo. O estudo permitiu evidenciar que os alunos adaptavam o vocabulário, na medida em que se apropriavam desse. Desde modo, o acompanhamento pedagógico precisa levar em consideração a adaptabilidade do vocabulário presente no conteúdo oferecido aos alunos.This paper presents the use of SOBEK a data mining tool with the objective of promoting a pedagogical observation of written discursive practices from a Chat in Distance Learning Modality. The central role of language in the human development is conceived through a language acting as a Complex Adaptive System (CAS). In this perspective, it’s understood that language is situated in interactional practices and it is in permanent transformation. This study has an empirical character and a qualitative nature, inserted in Moodle’s platform, investigating the specificity of interactions made in a Chat of a Distance Learning undergraduate discipline, under the Complexity Theory and Sociodiscursive Interactionism perspectives. The discursive interactions were observed related to the manner interactants adapted themselves to the discursive context. The study allowed us to identify that the students adapted the vocabulary as they appropriated themselves of it. Thus, the pedagogic observation has to take into account the adaptability of the involved vocabulary offered to the students
A mineração textual de práticas discursivas em um Chat: uma perspectiva pedagógica em contexto de EAD
Este artigo apresenta a utilização da ferramenta de mineração textual SOBEK com vistas ao acompanhamento pedagógico de práticas discursivas escritas decorrentes de um Chat em EAD. O papel central da língua no desenvolvimento humano está concebido por meio de um agir linguageiro enquanto Sistema Adaptativo Complexo (SAC). Nessa perspectiva, ompreende-se que a linguagem se situa em práticas interacionais e está em permanente transformação. Este estudo tem caráter empírico de cunho qualitativo, inserido na plataforma Moodle, investigando a especificidade das interações realizadas em um Chat, em uma disciplina de Ensino a Distância (EAD) em nível de graduação, na perspectiva da Teoria da Complexidade e do Interacionismo Sociodiscursivo - ISD. As relações discursivas situadas foram observadas quanto à forma como os interagentes se adaptavam ao contexto discursivo. O estudo permitiu evidenciar que os alunos adaptavam o vocabulário, na medida em que se apropriavam desse. Desde modo, o acompanhamento pedagógico precisa levar em consideração a adaptabilidade do vocabulário presente no conteúdo oferecido aos alunos
Visualização analítica do sentimento negativo em opiniões acerca de serviços de telecomunicações emitidas por usuários do Twitter
Monografia (graduação)—Universidade de Brasília, Faculdade de Tecnologia, 2015.Este trabalho objetiva realizar o tratamento de grande volume de dados extraídos da rede social Twitter, de modo a revelar padrões na quantidade de reclamações dos usuários de serviços relacionados a telecomunicações.Cria-se um ambiente de visualização em tempo real dos resultados obtidos a partir de um sistema web com uma interface acolhedora. Desenvolve-se com o software Gephi gráficos relacionados a grandes volumes de dados que auxiliam a interpretação humana e a visão global da informação gerada a partir do estudo de Big Data e mineração de dados em redes sociais. A partir dos dados coletados no Twitter, foi gerado um estudo sobre a percepção por parte dos usuários dos serviços de telecomunicações das principais empresas atuantes no mercado brasileiro. Este estudo ilustra quantitativamente e de forma comprovável, através de um tratamento de inteligência artificial, uma análise do possível sentimento de insatisfação vivenciado por alguns usuários, não sendo, no entanto, capaz de acertar na totalidade dos casos sua percepção.This study aims to carry out the treatment of large volume of data extracted from the social network Twitter, to reveal patterns in the number of complaints from users of services related to telecommunications. It creates a display environment in real time the results obtained from a web system with a warm interface. It develops with the graphics software Gephi related to large volumes of data that help human interpretation and the global vision of information generated from the study of Big Data and data mining on social networks. From the data collected in Twitter, a study was generated on the perception of the users of telecommunications services of the leading companies in the Brazilian market. This study illustrates quantitatively and verifiable manner through a treatment artificial intelligence, analysis of the possible feeling of dissatisfaction experienced by some users, which does not, however, able to hit in all cases perception
Uma análise comparativa de sistemas de gerenciamento de bancos de dados NoSQL multimodelo
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Sistemas de Informação.O aumento crescente do número de aplicações na Web, ou que utilizam dados da Web, como redes sociais e aplicações voltadas à Internet das coisas, teve um papel importante para o aumento exponencial de dados. Esses dados são obtidos das mais diversas fontes e assim se tornam mais complexos, possuem maior variedade e tem uma alta taxa de crescimento. Nesse sentido, é necessário desenvolver tecnologias de gerenciamento de dados que consigam suportar as distintas características de cada grupo de dados e ainda possuir um bom desempenho. Para obter esses resultados foram criados os sistemas de gerenciamento de banco de dados (SGBDs) chamados de NoSQL multimodelo. Eles oferecem mais funcionalidades e flexibilidade, podendo suportar vários modelos de dados em um único SGBD. Para os desenvolvedores que necessitam utilizar tais sistemas ainda não é claro qual solução combina e se adapta melhor ao seu projeto, pois essas tecnologias são consideradas novas no mercado. Na literatura é possível encontrar trabalhos comparando SGBDs, entretanto os que comparam SGBDs NoSQL multimodelo são escassos e não abrangem muitos sistemas. Sendo assim, esse trabalho de conclusão de curso tem como objetivo apresentar uma análise comparativa de SGBDs NoSQL multimodelo populares no mercado e não abordados por trabalhos relacionados.The increasing number of web applications, or those using web data, such as social networks and IoT applications, has played an important role in exponentially increasing data. These data are obtained from various sources and thus become more complex, have greater variety and have a high growth rate. In this sense, it is necessary to develop data management technologies that can support the distinct characteristics of each data group and still have a good performance. To achieve these results, database management systems (DBMSs) called multi-model NoSQL have been created. They offer more functionality and flexibility and may support multiple data models in a single DBMS. For developers who need to use such systems it is not yet clear which solution best fits their project as these technologies are considered new to the market. In the literature it is possible to find out works comparing DBMSs, however those comparing multimodel NoSQL DBMSs are scarce and do not cover many systems. Thus, this undergraduate conclusion paper aims to present a comparative analysis of the most used multimodel NoSQL DBMS in the market that were not covered by the related work
Ambiente de dados do sistema de informação de agravos de notificação com Neo4J
O Ministério da Saúde Brasileiro mantém o Sistema de Informação de Agravos de Notificação (SINAN) que tem como objetivo coletar, transmitir e disseminar dados gerados rotineiramente pela Vigilância Epidemiológica. Tais dados são oferecidos em padrões e tipos de arquivos que não permitem uma análise em cima de eventos. O objetivo deste trabalho é realizar uma extração, transformação e carga(ETL) dos dados da base de notificação de tuberculose(SINAN-TB) para um banco de dados em grafos (Neo4J), produzindo um ambiente analítico adequado para a análise de eventos a fim de extrair conhecimento para entendimento e propostas de melhoria em saúde coletiva. Foi escolhido o banco de dados Neo4J, pelas diversas ferramentas já desenvolvidas que facilita a construção e visualização da análise feita. O processo envolve uma série de etapas de conversão dos arquivos originais e conversões e adaptações de um banco relacional para o formato de um banco de dados em grafos ligados. Após o processo de ETL, foram obtidas visualizações de sequência de diagnósticos obtidas por pacientes no tratamento de tuberculose. A metodologia desenvolvida neste trabalho pode ser aplicada em análises de diversos eventos, tanto para área de saúde quanto para outras áreas
Estudo de dados industriais no contexto de Mobility SAP HANA
A computação em memória tem ganho uma importância ímpar nas últimas décadas com a emergência de diversos sistemas gestores de bases de dados com uma capacidade de processamento e eficiência difíceis de igualar, com respostas em tempo real para volumes de dados gigantescos e complexos. Estes dados consomem bastantes recursos computacionais, mas, na verdade, grande parte deles, são descartados e ignorados pelas organizações, levando a um pobre aproveitamento da informação. Ao longo dos últimos anos, as arquiteturas dos sistemas de informação têm-se revelado mais e mais complexas. A quantidade de informação necessária à gestão de uma organização, tende a crescer de uma forma muito célere, originando tempos de resposta,a consultas da base de dados muito indesejáveis, inoportunos e custosos em tempo e, consequentemente, em dinheiro. O surgimento desta tecnologia inovadora foi possível devido aos avanços cruciais desenvolvidos ao longo das últimas décadas, ao nível do hardware, nomeadamente um aumento da capacidade de memória RAM e um maior poder de processamento da CPU, com a emergência de processadores com vários núcleos que maximizam o uso de paralelismo, indispensável em sistemas como o SAP HANA.O foco desta dissertação será o estudo de dados industriais relativos a uma indústria de construção, onde os tempos de resposta estão a revelar-se muito longos e penosos. De forma a avaliar o impacto no negócio de uma solução em memória, neste caso, o SAP HANA (que opera 100% em memória RAM) será comparado com a solução existente, o SAP R/3, através da medição de tempos de execução de determinadas queries analíticas. Espera-se, de uma base de dados deste tipo, obter tempos de resposta às consultas bastante mais reduzidos e, desta forma, criar vantagem competitiva para a organização. Pretende-se ainda mostrar a possível criação de valor para o negócio adjacente a estes sistemas, nomeadamente, ao nível da gestão de inventário e listagem de materiais. Para isso, irá ser desenvolvida uma aplicação web, com a função de maximizar o auxílio e a flexibilidade na toma de decisões no mundo empresarial.Com o crescente impacto dos dispositivos móveis, a computação em memória será a chave para a sua integração com o negócio das empresas, permitindo aos administradores tomarem decisões em qualquer altura e em qualquer lugar, assegurando uma vantagem competitiva da empresa num futuro cada vez mais presente.Memory computing has gained unprecedented importance in recent decades with the emergence of many database management systems with a processing and efficiency capacity difficult to match, with real-time answers to a huge and complex volume of data. These data consume a lot of computational resources, but, actually, many of them are discarded and ignored by the organizations, what takes to a poor use of information.Over the last few years, the architectures of information systems revealed more and more complex. The amount of information needed to manage an organization tends to grow very fast, resulting in response times to database queries which are very undesirable, inopportune and costly in time and, consequently, expensive. The emergence of this innovative technology was possible due to the crucial advances that have been developed over the last decades at the hardware level, namely an increase of the capacity of memory RAM and a greater power of processing of the CPU, with the emergence of multi-core processors that maximize the use of parallelism, crucial in systems such as SAP HANA.The focus of this dissertation will be the study of industrial data related to a construction industry, were the response times are proving to be very long and painful. In order to evaluate the business impact of an in-memory solution, in this case, SAP HANA (which operates 100% in RAM) will be compared to the existing solution, SAP R/3, by measuring the execution times of certain analytic queries. It is expected from a database of this type to obtain response times to the queries considerably lower and, in this way, create competitive advantage for an organization. It is also intended to show the possible value creation for the adjacent business to these systems, namely at the level of inventory management. For this, a web application will be developed, in order to maximize the aid and flexibility of decision-making in the business world.With the growing impact of mobile devices, memory computing will be the key to their integration with the company business, allowing administrators to make decisions anytime and anywhere, ensuring a competitive advantage of the company in an increasingly present future
Processo de publicação de dados abertos multidimensionais em bancos de dados NoSQL
Com o advento da vasta quantidade de dados com que as organizações se propõem a lidar, ainda há uma discussão sobre as vantagens do consagrado modelo relacional. Apesar dos esforços para a melhoria da representação destes dados neste modelo, ainda foram encontrados outros desafios como a capacidade de lidar com a diversidade de informações decorrentes do volume de dados. Isto significa que podemos encontrar não apenas conjuntos de dados caracterizados por diferentes formatos, como também oriundos de fontes distintas, o que pode levar a limitações básicas no que diz respeito à modelagem de dados. Esta motivação fez surgir uma nova categoria de banco de dados, conhecida como NoSQL. Neste trabalho, apresentamos as principais características desses bancos de dados, que são complementadas através de uma abordagem prática, com a comparação entre dois tipos de bancos de dados em um contexto particular. Nesse contexto, foram realizados experimentos sobre o mesmo conjunto de dados, utilizando o armazenamento em um banco de dados MySQL, que representa o modelo relacional, e o Apache Cassandra, na representação do modelo de dados não-relacional e livre de esquemas. Além da comparação do desempenho entre eles, também foi investigada a solução mais funcional e adequada para uma aplicação de publicação de dados, com o intuito de estimular futuras implementações e correlações destas análises, adicionando novas fontes de dados e considerando a integração de fontes de dados heterogêneas
Morphological aspects of data processing in school management. The Analytics potential
As ondas de choque da Sociedade de Informação chegaram à Universidade e as plataformas tecnológicas impuseram-se como suportes fundamentais na transformação pedagógica e na gestão das várias dimensões de atuação das Instituições do Ensino Superior (IES). Estas plataformas recolhem um enorme volume de dados que progressivamente têm sido aproveitados para uma análise avançada e no suporte à tomada de decisão informada, nomeadamente através de sistemas de Learn Analytics (centrados em métricas que fornecem informação aos departamentos, professores e alunos sobre questões relacionadas com a organização e funcionamento dos cursos ou atividades de aprendizagem dos estudantes) e Academic Analytics (direcionados para o plano da gestão institucional, visando dotar os diretores e administradores de informação relativa às vertentes financeira, capital humano ou alocação de recursos, podendo ter também uma componente nacional ou internacional na comparação de sistemas). Neste trabalho, apresenta-se o estado da arte da utilização dos sistemas de Analytics na Educação, com exploração de casos práticos da sua aplicação, enfatizando-se os aspetos morfológicos desde o acesso e preparação dos dados até à partilha e tomada de decisão. Paralelamente, são exploradas questões relacionadas com aspetos éticos e implicações na organização e cultura das IES que decorrem da utilização destes sistemas.The shock waves of the Information Society have reached University and technology platforms have imposed themselves as key supports in the pedagogical transformation and management of the different dimensions of the performance of Higher Education Institutions (HEIs). These platforms collect a huge volume of data that has gradually been used for advanced analysis and as a support for informed decision making, in particular through the Learn Analytics systems (focusing on metrics that provide information to departments, teachers and students on issues related to the organization and functions of the courses or students learning activities) and Academic Analytics (directed for the planning of institutional management, to provide the directors and managers with information on financial aspects, human capital or allocation of resources, and may also have a national or international component in comparison of systems). In this paper, we present the state of the art of usage of the Analytics systems in education, with the analysis of practical cases of its implementation, with emphasis on the morphological aspects from access and data preparation to sharing and decision making. At the same time, issues related to ethical aspects are explored, as well as the implications in the organization and culture of HEIs that result from the use of these systems.info:eu-repo/semantics/publishedVersio
Proposta de aplicação web para análise de dados abertos usando um banco de dados orientado a grafos
Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2017.O presente trabalho apresenta o desenvolvimento de uma aplicação Web cliente, a
Ana Lisa, para inserir e visualizar dados em um formato de grafo. Seu principal objetivo é
trazer um modo de interpretar os dados de forma mais clara, a fim de criar relações entre as
entidades executando um processo de investigação para o melhoramento do entendimento
dos dados. Esse software permite, a partir de um arquivo CSV (como uma forma de
estruturar os dados de entrada), inserir as entidades em um banco de dados orientado a
grafos e criar os relacionamentos entre elas, utilizando a ontologia como uma maneira de se
estabelecer a semântica do que se está sendo visualizado. Para saber qual seria o banco de
dados orientado a grafo escolhido no trabalho, foi feita uma comparação entre o Neo4j e o
OrientDB, onde se estabeleceu suas vantagens e suas características para guiar a opção de
qual SGBD usar. No seu desenvolvimento, utilizou-se bibliotecas baseadas em JavaScript e
CSS de visualização, de construção de interface e de transformação de dados. Por fim, a
Usabilidade foi empregada na implantação do software para garantir uma experiência do
usuário adequada aos objetivos da Ana Lisa.The present work shows the development of a client-side Web application to upload
and visualize data in a graph format. The name of the software is Ana Lisa. Its main purpose
is to provide a way of interpreting data more clearly to create relationships between the input
entities performing a process of research to improve the data understanding. This software
allows, from a CSV file (as a way of structuring the input data), to insert entities in a graph
database and create the relationships between them, using ontology concepts to establish
the Semantics of what is being visualized. To choose a graph database that best fits this job,
a comparison was made between Neo4j and OrientDB, to determine their advantages and
their characteristics. In its development, this work used libraries based on JavaScript and
CSS for visualization, interface construction and data transformation. Finally, Usability played
an important role in the software development process to ensure a user experience
appropriate to Ana Lisa's goals
UnBGOLDProv : arquitetura de proveniência de dados para um workflow de publicação de dados abertos governamentais
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.O governo brasileiro aderiu à política de publicação de dados abertos governamentais que
possibilita uma administração mais transparente e aberta, permitindo maior participação
da sociedade, fortalecimento da democracia e combate à corrupção. No entanto, a forma
como os dados abertos são publicados levanta questões como a origem e a autoria dos
dados. A realização da proveniência sobre esse dados disponibiliza informações de como,
quando e por que os dados foram criados e publicados. Diante desse cenário, considerou-se
que a combinação de dados e sua proveniência enriquecem a rastreabilidade dos dados,
expondo os métodos e os agentes envolvidos em sua criação, além de promover a possibili-
dade de reprodutibilidade desses dados. Este trabalho apresenta uma solução tecnológica
de proveniência de dados para aprimorar a publicação de dados públicos abertos governa-
mentais, empregando uma arquitetura de informações que pode fornecer a proveniência
de dados abertos governamentais públicos, usando o PROV-DM e um banco de dados de
grafos. É apresentado como estudo de caso, a implementação de uma arquitetura de infor-
mações proposta para coleta, gerenciamento, armazenamento e publicação da proveniência
do workflow de publicação de dados abertos governamentais conectados. Essa publicação
da proveniência, coletada da execução da publicação de um conjunto de dados coletados
dos sistemas de informação da UnB, é realizada na plataforma CKAN em conjunto com
os dados conectados publicados na plataforma.The Brazilian Government has adhered to the Linked Open Government Data publica-
tion policy that allows for a more transparent and open administration, allowing greater
participation of society, strengthening democracy and fighting corruption. However, the
way open data is published raises questions such as the origin and authorship of the data.
Making the provenance of this data provides information on how, when, and why the
data was created and published. Given this scenario, we consider that the combination of
data and its origin enriches the traceability of the data, exposing the methods and agents
involved in its creation, and promoting the possibility of reproducibility of this data.
This paper presents a data provenance technology solution to enhance public open gov-
ernment data publishing by employing an information architecture that can provide the
provenance of open government public data using PROV-DM and a graph database. The
implementation of a proposed information architecture for collecting, managing, storing
and publication of the provenance of the textit workflow for publication of linked open
government data is presented as a case study. This provenance publication, collected
from the execution of the publication of a set of data collected from UnB’s information
systems, is carried out on the CKAN platform together with the linked data published
on the platform
- …