19 research outputs found

    Ciência de dados em políticas públicas: uma experiência de formação

    Get PDF
    Os últimos anos têm vivenciado uma revolução na forma como os dados são produzidos e como circulam entre pessoas, empresas e governos. As novas tecnologias existentes potencializaram a importância dos dados para a humanidade, e o mesmo ocorreu nos governos ao redor do mundo.Em 2020, foram lançadas pelo Governo Federal as 7 competências transversais de um setor público de alto desempenho, incluindo “resolução de problemas com base em dados”. Isso indica que todo e qualquer servidor deve desenvolver essa competência para ter um bom desempenho. Diante desses diagnósticos, a Enap vem oferecendo um conjunto de cursos e ações de formação para contribuir fortemente com o desenvolvimento de capacidades relacionadas ao processo de aquisição, manipulação, processamento e análise de dados, gerando novos conhecimentos e novas possibilidades para a solução de problemas complexos no Governo Federal. Como consequência desse conjunto de ofertas, a Enap decidiu começar a desenvolver a Especialização em Ciência de Dados aplicada a Políticas Públicas, gerando oportunidade para que os servidores públicos pudessem desenvolver e aprimorar suas capacidades e competências profissionais, tornando-os capazes de aplicar os conhecimentos de Ciências de Dados na análise e avaliação de Políticas Públicas no âmbito do governo brasileiro em suas diferentes esferas. O curso teve carga horária total de 375 horas, foi desenvolvido em parceria com a CGU e ofertou ao todo 40 vagas, incluídas vagas para pessoas autodeclaradas negras, indígenas e com deficiência. Este livro é um grande resultado dessa Especialização, apresentando trabalhos de conclusão de curso com reflexões aplicadas aos problemas públicos que os alunos selecionaram.269 páginasAnálise e Ciência de DadosPolíticas PúblicasEspecialização em Ciência de Dados aplicada a Políticas Públicas

    Conformidade em processos de negócio baseada em classificação de documentos e mineração de log de eventos

    Get PDF
    The growing necessity for quality involves information systems and business processes. As a consequence, there is a growing demand to align the mapped and understood process of organizations with the performance of how the process is actually performed on a daily basis. With automated systems, the technology industry currently records events in information systems and generates data with ease, which are produced to generate value and insights to improve performance in the most diverse areas of organizations. In this work, we propose a study on conformance checking for generated models from the event log of an information system. A study that considers the main algorithms and metrics used in the literature to measure conformance checking in process mining, how the algorithms are defined and in which tools the approaches are tested. The proposed approach evaluates the semi-structured event log; for thus, text classification techniques are used to prepare the required structure of the event log. The main objective is to evaluate the conformance checking applied to the process mining area in order to analyze the extracted log, contextualizing the value approach with the definition of the existing process mapped from the manager understanding. To support this use in other data sets, the proposed model intends to be extensive for modification and use in other scenarios.A progressiva demanda pela qualidade subsidia os sistemas de informação e processos de negócios. Consequentemente, há uma crescente carência para o alinhamento do processo entendido e mapeado nas organizações, além de uma escassez no entendimento da execução do processo no dia a dia. Com sistemas automatizados, a indústria de tecnologia registra eventos e gera dados com facilidade, dados esses que podem produzir valor e insights, visando melhoria de desempenho em diversas áreas organizacionais. Pensando nisso, neste trabalho propõe-se um estudo sobre a avaliação da conformidade nos modelos gerados a partir do log de eventos de um sistema de informação. Um estudo que contemple os principais algoritmos e métricas utilizados na literatura para mensurar a conformidade em mineração de processos, como algoritmos são definidos e em quais ferramentas as abordagens são testadas. A abordagem proposta avalia o log de eventos semiestruturados; para isso, técnicas de classificação de texto são utilizadas na preparação da estrutura requerida do log de eventos. O objetivo é avaliar a abordagem da conformidade aplicada à área de mineração de processos para analisar o log extraído, contextualizando o valor da abordagem com a definição do processo existente mapeado a partir da visão do gestor. Para apoiar o uso em outros conjuntos de dados, o modelo proposto pretende ser extensivo para modificação e uso em outros cenários

    Data Science : um estudo dos métodos no mercado e na academia

    Get PDF
    Para análise de dados são utilizados sistemas de informação e de apoio à decisão, sempre alinhados aos métodos de descoberta de conhecimento. Com o crescimento do volume, variedade e velocidade dos dados, as empresas estão conseguindo informações mais qualificadas e reestruturando seus posicionamentos estratégicos a partir da análise dos dados. Desde 1989, diversos métodos foram propostos, mas, atualmente, com a disseminação e os desafios do Big Data e do valor do conhecimento extraído dos dados para as organizações, foi preciso buscar novas formas de se realizar as análises abrangendo, assim, o campo da Data Science. A Data Science entra, então, como área de estudo capaz de auxiliar as empresas a lidar com essa nova sistemática de análise dos dados, permitindo a extração de conhecimento a partir dos dados de forma mais eficaz. Este trabalho propõe um estudo exploratório, multi-caso sobre o ciclo de vida dos dados nas empresas e na literatura, a fim de identificar, nos métodos utilizados atualmente, possíveis gargalos e dificuldades.Information and decision support systems are used for analysis, always aligned with the methods of knowledge discovery. With the growth of volume, variety and speed of data, companies are getting more qualified information and restructuring their strategic positions from the data analysis. Since 1989, several methods have been proposed, but nowadays, with the dissemination and challenges of Big Data and the value of the knowledge extracted from the data for the organizations, it was necessary to look for new ways of performing the analysis, thus covering the field of Data Science. Data Science is then a study area capable of helping companies deal with this new system of data analysis, allowing the extraction of knowledge from the data more effectively. This paper proposes an exploratory, multi-case study on the data life cycle in companies and literature, in order to identify possible bottlenecks and difficulties in the current methods

    Recomendação de desenvolvedores externos para projetos de software baseada na análise de contribuições prévias

    Get PDF
    The software development industry has evolved in the recent years and new challenges have emerged. Among these changes came Software Ecosystems, a new development paradigm, where external contributors support software production by providing solutions that complement a common platform for these developers. Due to the large number of technologies, frameworks and domains that an ecosystem can host, an equally large number of contributors acquainted with varied topics of their knowledge and skills have also emerged. However, recruiting collaborators with desired characteristics becomes a complex task due to the varying degrees of knowledge and skill that each developer has in their various competencies. Given this, we present a architecture of a recommendation system (RS) supported by an ontology capable of recommending collaborators who have shown expertise in the topics of interest. In order to do so, the RS uses retrieval expertise techniques to score the developers´ level of knowledge about topics represented in a query. The architecture is then able to provide the contextual information of the recommendation, i.e., a visualization of where one can find the knowledge topics that led to the recommendation of each contributor. Proof of Concepts were conducted on two software ecosystems to demonstrate feasibility of the architecture, which have shown evidence that the architecture is able to perform recommendations and still offers context information, important to the decision-making process over the recommendations made.A indústria de desenvolvimento de software evoluiu nos últimos anos e novos desafios surgiram. Dentre estas mudanças surgiram os ecossistemas de software, um novo paradigma de desenvolvimento, onde colaboradores externos apoiam a produção de software ao disponibilizar soluções que complementam uma plataforma comum a estes desenvolvedores. Devido à grande diversidade de tecnologias, frameworks e domínios que um ecossistema pode abrigar, a todo momento surgem colaboradores com variados tópicos de conhecimento e habilidades. Entretanto, recrutar colaboradores com as características desejadas se torna um trabalho complexo devido aos diferentes graus de conhecimento e habilidades que cada colaborador tem em suas diversas competências. Diante disso, apresenta-se uma arquitetura de um sistema de recomendação (SR) apoiado por uma ontologia capaz de recomendar colaboradores que tenham mostrado expertise nos tópicos de interesse. Para tanto, o SR utiliza técnicas da área de expertise retrieval para pontuar o grau de aderência dos colaboradores sobre os tópicos de conhecimento representados em uma query. A arquitetura é então capaz de fornecer as informações de contexto da recomendação, ou seja, uma visualização sobre onde pode-se encontrar os tópicos de conhecimento que levaram à recomendação de cada colaborador. Provas de conceito foram realizadas sobre dois ecossistemas de software para verificar a viabilidade da arquitetura, as quais mostraram indícios de que a arquitetura é capaz de realizar recomendações, e ainda oferece informações de contexto que são importantes à tomada de decisão sobre as recomendações realizadas.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

    Abordagem avaliativa multidimensional para previsão da evasão do discente em cursos online.

    Get PDF
    A evasão discente foi apontada, por grande parte das instituições brasileiras de Educação a Distância (EaD), como um dos maiores obstáculos enfrentados pelos cursos online da atualidade. Reflexo disto, foram as taxas de evasão elevadas, entre 25 e 50% em todos os tipos de curso online, em relação à educação presencial em 2015 no Brasil. Além disto, a problemática não se restringe ao contexto brasileiro, pois diversas organizações internacionais relataram índices tão alarmantes quando os nacionais. É possível afirmar, de acordo com a literatura, que as estratégias adotadas na minimização dos índices de desistência do discente muitas vezes se limitam à avaliação pontual de um recurso pedagógico (fórum, bate-papo, etc). Há ainda uma carência de estudos que discutam sobre as interações educacionais do aluno evadido e considerem as incertezas avaliativas envolvidas no processo. Diversas metodologias podem ser utilizadas pelo docente para lidar com a subjetividade e incerteza associadas ao processo avaliativo, tais como: lógica fuzzy, redes bayesianas, etc. O presente estudo destacou a lógica fuzzy (ou difusa), pois esta técnica lida com a ambiguidade encontrada na avaliação presente na EaD. Esta modelagem permite que estados indeterminados possam ser tratados por dispositivos de controle e conceitos não quantificáveis possam ser avaliados pelo especialista. Assim, o presente estudo propôs uma abordagem avaliativa (FuzzySD) voltada ao docente para monitorar as turmas virtuais na predição e combate à evasão discente em cursos online. Para tanto, a pesquisa se subsidiou nas informações relacionadas às ações dos alunos durante o processo de ensino-aprendizagem. A análise realizada envolve fatores comportamentais do estudante com base em múltiplos critérios. Estes critérios comportamentais foram fundamentais na descrição das três métricas principais ao entendimento da evasão do aluno no contexto estudado, a saber: Autorregulação, Interação e Motivação do aluno. A avaliação com a FuzzySD foi realizada por meio da análise de precisão em recortes da amostra com base em dados de cursos online do IFPB Virtual. A precisão da abordagem, analisando as amostras teste, proporciona valores entre 65% e 95% de acertos. Por fim, a partir dos resultados, foram discutidos os desafios da aplicação de um módulo avaliativo multidimensional diante do contexto de cursos online brasileiros.The student’s dropout in online courses was pointed out as one of the biggest issue in the area according to the educational organizations. The main result was the high dropout rates in these courses compared to face-to-face courses in 2015 in Brazil (between 25% and 50%). Moreover, this challenge belongs to the virtual learning worldwide. In this sense, the literature review showed that several approaches are adopted to minimize the student’s dropout rates. However, they limited their focus on a learning unique resource (forum, chat, upload, download, submissions). Regarding these approaches, the current research detected an insufficiency of studies about the educational interactions of the dropout student and uncertainties in the assessment. Many methodologies are used by teachers to manage a subjectivity and uncertainty associated to the evaluation process, such as: fuzzy logic, Bayesian networks, Markov chains, etc. This thesis emphasized the fuzzy logic, because this technique solves the ambiguity found in the learning evaluation by the expert. We present an assessment framework (FuzzySD) to track the virtual classroom and to support the teacher to make a prediction of students’ dropout in online courses. In this sense, we analyzed the information related to the students’ actions during the teaching-learning process in online courses. It can be denominated as multidimensional analysis because we assessed multiple variables related to the student’s behavior. Such behavioral variables were fundamental in the definition of three main metrics to the understanding of student avoidance, they are: Self-regulation, Interaction and Motivation. It is important to consider a presence of fuzzy logic to deal with the input metrics of the FuzzySD framework. The evaluation of FuzzySD was performed by means of precision analysis on sample cut-outs based on dataset from courses of “IFPB Virtual”. The accuracy of the approach is analyzed as results of its own indicators between 65% and 95% of hits. Finally, the results discussed about the challenges of applying a multidimensional evaluative module to the context of Brazilian online courses.Cape

    AVALIAÇÃO DAS APRENDIZAGENS EM JOGOS DIGITAIS BASEADA EM LEARNING ANALYTICS SOBRE DADOS MULTIMODAIS

    Get PDF
    A utilização de jogos digitais como ferramenta pedagógica vem sendo aplicada no desenvolvimento das competências, habilidades e atitudes, requeridas ao profissional do século 21, tanto no ensino fundamental e médio, quanto na formação profissional. Entretanto, a pouca disponibilidade de recursos consolidados para avaliação das aprendizagens dos alunos durante o jogar tem sido um dos principais fatores que dificultam um alargamento mais acelerado de seu uso para fins educacionais. Para obtenção de informações que possam dar suporte a esse tipo de avaliação, alguns métodos, técnicas e ferramentas têm sido pesquisados, porém, apesar desses trabalhos já terem obtido alguns resultados, eles ainda não foram suficientes para propiciar avaliações claras, seguras e abrangentes. A importância de se tratar a avaliação da aprendizagem baseada em recursos computacionais, inclusive jogos digitais, levou ao surgimento de uma área de pesquisa denominada de Learning Analytics, que aplica técnicas e métodos de Ciência da Computação, Pedagogia, Sociologia, Psicologia, Neurociência e Estatística para analisar os dados recolhidos durante os processos educacionais. As pesquisas indicaram que tais dados não precisam se restringir a dados numéricos e textuais, surgindo então a Multimodal Learning Analytics que inclui também a coleta e a análise de dados provenientes de diversas manifestações do aprendiz, capturadas por sensores, durante o processo de aprendizagem (toques, gestos, vozes e expressões faciais). A ECD (Evidency Centered Design) é uma abordagem desenvolvida para dar suporte ao projeto de qualquer tipo de avalição da aprendizagem que tem despontado entre pesquisadores da área de Educação. Este trabalho traz uma proposta de contribuição para a solução desse problema através da criação de um framework para avaliação das aprendizagens em jogos digitais baseada em Learning Analytics, e na abordagem ECD (Evidency Center Design), sobre dados multimodais

    Práticas e saberes de profissionais que trabalham com dados à luz da teoria ator-rede

    Get PDF
    Era digital, quarto paradigma, indústria 4.0, futurismo, segurança cibernética e big data são alguns termos que, cotidianamente, figuram na mídia, correspondendo a um período de intensas transformações que impactam a vida social. Discussões sobre o futuro do trabalho, a extinção de empregos em virtude da substituição de pessoas por robôs e o surgimento de novas profissões estão presentes, entendidas como efeitos destas mudanças. Os dados, neste contexto sócio-histórico-cultural, são soberanos, entendidos como fonte primordial para tomada de decisões relacionadas aos negócios. Considerando tais mudanças, o presente estudo tem por objetivo compreender como e quais saberes constituem-se a partir das práticas desenvolvidas por profissionais que trabalham com dados, em duas empresas distintas, tendo como questão norteadora: como e quais são os saberes que se constituem a partir das práticas desenvolvidas por profissionais de dois coletivos que trabalham com dados? Para este estudo, considera-se profissionais que trabalham com dados aqueles que incorporam as metodologias de ciência de dados, desenvolvimento e inteligência ao lidar com dados em suas práticas cotidianas. A pesquisa foi realizada em duas empresas, por meio de observações não participantes da rotina de trabalho e de treze entrevistas, com a orientação teórico-metodológica da TAR e da noção de knowing-in-practice. Identificou-se que, apesar da singularidade das empresas, refletida nos conceitos diferentes que orientam suas práticas, os processos de aprendizagem mostram-se bastante semelhantes. Práticas que as diferenciam e outras que as aproximam, como as de desenvolvimento e manutenção de produtos e projetos; constituição e trabalho através de base de dados; combinação de metodologias e ferramentas de trabalho; seguir os atores e estabelecer relações constituem situações de aprendizagem. Os saberes são constituídos, no cotidiano, pela relação com elementos humanos e não humanos, como as tecnologias, incluindo a relação com colegas, novos projetos, problemas enfrentados e autodidatismo. A associação nos coletivos pesquisados mostrou-se permeada por discursos de eficiência, perspectivas de ganho financeiro, modismo, entusiasmo e identificação com a área. Este estudo contribui para o enriquecimento da literatura, especialmente a pertinente à ciência de dados. Ele também auxilia a preencher o gap, nos estudos de aprendizagem nas organizações, referente ao caráter processual do knowing. Mais especificamente, demonstra: como a aprendizagem ocorre no decorrer do trabalho cotidiano evidenciando seu caráter sociomaterial e coletivo; a agência dos não humanos nesse processo criando condições de possibilidade e impossibilidade; e o caráter artesanal das práticas científicas que se sobrepõe à estruturação e racionalização. Do ponto de vista das empresas pesquisadas, ressalta-se como contribuição a promoção de reflexividade sobre as práticas cotidianas.Digital era, fourth paradigm, industry 4.0, futurism, cyber security and big date are some terms that, daily, appear in the media, corresponding to a period of intense transformations that impact the social life. Discussions about the future of work, the extinction of jobs due to the replacement of people by robots and the emergence of new professions are present, understood as effects of these changes. Data, in this socio-historical-cultural context, are sovereign, understood as the primary source for business-related decision making. Considering these changes, the present study aims to understand how and what knowledge are formed from the practices develop by professionals working with data, in two different companies, having as a guiding question: how and what are the knowledges that are formed from the practices developed by professionals from two collectives who work with data? For this study, professionals working with data are those who incorporate the methodologies of data science, development and intelligence when dealing with data in their daily practices. The research was carried out in two companies, through non-participating observations of the work routine and thirteen interviews, with the theoretical-methodological orientation of the ART and the notion of knowing-in-practice. It was identified that, despite the singularity of the companies, reflected in the different concepts that guide their practices, the learning processes are very similar. Practices that differentiate them and others that approach them, such as the development and maintenance of products and projects; constitution and work through database; combination of methodologies and work tools; following the actors and establishing relationships are learning situations. Knowledge is constituted, in daily life, by the relationship with human and non-human elements, like the technologies, including the relationship with colleagues, new projects, problems faced and self-learning. The association in the collectives surveyed was permeated by discourses of efficiency, perspectives of financial gain, fad, enthusiasm and identification with the area. This study contributes to the enrichment of the literature, especially that pertinent to data science. It also helps to fill the gap, in learning studies in organizations, concerning the procedural nature of knowing. More specifically, it shows: how learning takes place in the course of daily work, showing its sociomaterial and collective character; the agency of non-humans in this process creating conditions of possibility and impossibility; and the artisanal character of scientific practices that overlaps with structuring and rationalization. From the point of view of the companies researched, as a contribution to the promotion of reflexivity about everyday practices

    Agricultura digital: pesquisa, desenvolvimento e inovação nas cadeias produtivas.

    Get PDF
    A transformação digital no campo rumo à agricultura sustentável e inteligente. Agricultura digital: definições e tecnologias. Modelagem agroambiental e a transformação digital da agricultura. Geotecnologias na agricultura digital. Computação científica na agricultura. Visão computacional aplicada na agricultura. Tecnologias desenvolvidas em Agricultura de Precisão. Engenharia da informação: contribuições para a agricultura digital. DPIN: um dicionário dos nanoambientes internos das proteínas e seu potencial para transformação em ativos para a agricultura. Aplicações da bioinformática na agricultura. Genômica aplicada às mudanças climáticas: biotecnologia para a agricultura digital. Ecossistema de inovação em agricultura: evolução e contribuições da Embrapa. O direito frente à digitalização da agricultura. Inovando a comunicação na era da agricultura digital. Forças motrizes para a agropecuária brasileira na próxima década: implicações para a agricultura digital. Desafios, tendências e oportunidades em agricultura digital no Brasil

    Cognição e aprendizagem em mundo virtual imersivo

    Get PDF
    2.ed
    corecore