17 research outputs found

    Visualização de dados abertos no contexto da pós-graduação em Ciência da Informação: análise bibliométrica dos estudos defendidos

    Get PDF
    The visualization of open data has become an indication of credibility on the part of institutions in different social segments, including research institutions. Within this theme, this study aimed to present the panorama of academic production in Brazilian Graduate Studies in the area of Information Science. The studies defended in the theses and dissertations in the Postgraduate Programs in this area were defined as a cut of analysis, based on the analysis of the following facets: year, program modality, academic degree of the courses, types of production, programs and institutions offering . This is a descriptive and quantitative study, whose data were collected through a bibliometric survey carried out in the Catalog of Theses and Dissertations, within the scope of the Open Data Plan of the Coordination for the Improvement of Higher Education Personnel. The results revealed a gradual growth between general production, programs and courses, prevalence of dissertations and a heterogeneous distribution between programs and institutions, located in different Brazilian regions. It was concluded that the research defended in the Graduate Programs are visible in the Open Data Plan, that the area of Information Science is in development and that the data allow cross-sectional analysis that can benefit educational policies.La visualización de datos abiertos se ha convertido en un indicador de credibilidad por parte de instituciones en diferentes segmentos sociales, incluidas las instituciones de investigación. Dentro de este tema, este estudio tuvo como objetivo presentar el panorama de la producción académica en los Estudios de Posgrado brasileños en el área de Ciencias de la Información. Los estudios defendidos en las tesis y disertaciones en los Programas de Posgrado en esta área fueron definidos como un corte de análisis, a partir del análisis de las siguientes facetas: año, modalidad del programa, grado académico de los cursos, tipos de producción, programas e instituciones ofrenda Se trata de un estudio descriptivo y cuantitativo, cuyos datos fueron recolectados a través de un levantamiento bibliométrico realizado en el Catálogo de Tesis y Disertaciones, en el ámbito del Plan de Datos Abiertos de la Coordinación de Perfeccionamiento del Personal de Educación Superior. Los resultados revelaron un crecimiento gradual entre la producción general, programas y cursos, prevalencia de disertaciones y una distribución heterogénea entre programas e instituciones, ubicadas en diferentes regiones brasileñas. Se concluyó que las investigaciones defendidas en los Programas de Posgrado son visibles en el Plan de Datos Abiertos, que el área de Ciencias de la Información está en desarrollo y que los datos permiten análisis transversales que pueden beneficiar las políticas educativas.A visualização de dados abertos vem se tornando um indicativo de credibilidade por parte das instituições nos diversos segmentos sociais, incluindo as instituições de pesquisa. No âmbito dessa temática, este estudo objetiva apresentar o panorama da produção acadêmica na Pós-Graduação brasileira na área da Ciência da Informação. Definiram-se como recorte de análise os estudos defendidos nas teses e dissertações nos Programas de Pós-Graduação dessa área, a partir da análise das seguintes facetas: ano, modalidade do programa, grau acadêmico dos cursos, tipos de produção, programas e instituições ofertantes. Trata-se de um estudo aplicado e descritivo, de abordagem quantitativa, cujos dados foram coletados por meio de um levantamento bibliométrico realizado no Catálogo de Teses e Dissertações, no âmbito do Plano de Dados Abertos da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior. Os resultados revelaram um crescimento gradativo entre a produção geral, os programas e os cursos, prevalência das dissertações e uma distribuição heterogênea entre os programas e as instituições, localizadas nas diferentes regiões brasileiras. Conclui-se que as pesquisas defendidas nos Programas de Pós-Graduação estão visíveis no Plano de Dados Abertos, que a área da Ciência da Informação está em desenvolvimento e que os dados permitem análises transversais que podem beneficiar as políticas educacionais

    Erratum to: Mirnacle: machine learning with SMOTE and random forest for improving selectivity in pre-miRNA ab initio prediction

    Get PDF
    MicroRNAs (miRNAs) are key gene expression regulators in plants and animals. Therefore, miRNAs are involved in several biological processes, making the study of these molecules one of the most relevant topics of molecular biology nowadays. However, characterizing miRNAs in vivo is still a complex task. As a consequence, in silico methods have been developed to predict miRNA loci. A common ab initio strategy to find miRNAs in genomic data is to search for sequences that can fold into the typical hairpin structure of miRNA precursors (pre-miRNAs). The current ab initio approaches, however, have selectivity issues, i.e., a high number of false positives is reported, which can lead to laborious and costly attempts to provide biological validation. This study presents an extension of the ab initio method miRNAFold, with the aim of improving selectivity through machine learning techniques, namely, random forest combined with the SMOTE procedure that copes with imbalance datasets. By comparing our method, termed Mirnacle, with other important approaches in the literature, we demonstrate that Mirnacle substantially improves selectivity without compromising sensitivity. For the three datasets used in our experiments, our method achieved at least 97% of sensitivity and could deliver a two-fold, 20-fold, and 6-fold increase in selectivity, respectively, compared with the best results of current computational tools. The extension of miRNAFold by the introduction of machine learning techniques, significantly increases selectivity in pre-miRNA ab initio prediction, which optimally contributes to advanced studies on miRNAs, as the need of biological validations is diminished. Hopefully, new research, such as studies of severe diseases caused by miRNA malfunction, will benefit from the proposed computational tool

    Visualization of candidate data for socioeconomic aid in graphs: case study at the Federal Institute of Minas Gerais (IFMG)

    Get PDF
    Introdução: A expansão da rede federal de ensino superior brasileira nas últimas duas décadas foi possível, em grande parte, graças à implementação de ações governamentais como o Programa Nacional de Assistência Estudantil (PNAES). Nele, os recursos orçamentários são descentralizados para as instituições de ensino que, por sua vez, ficam responsáveis por selecionar aqueles candidatos que apresentam maior demanda para recebimento de auxílios socioeconômicos. Este artigo propõe uma abordagem diferenciada para visualizar as relações entre os dados de tais candidatos, aprimorando o processo de análise conduzido por Assistentes Sociais. Método: Foi realizado um estudo de caso no Instituto Federal de Minas Gerais (IFMG) para demonstrar a viabilidade de implementação e uso da solução proposta a partir de dados reais da instituição, coletados diretamente da base de candidatos a auxílios socioeconômicos. Resultados: A apresentação dos dados e dos relacionamentos entre as entidades podem ser melhor visualizados pelos Assistentes Sociais e contribuir diretamente para entender a real situação dos candidatos. Conclusão: A análise das informações dos candidatos pode se beneficiar da construção de conhecimentos a partir de dados organizados em grafos, em vez de representações textuais.Introduction: The expansion of the Brazilian federal higher education network in the last two decades was made possible, in large part, thanks to the implementation of governmental actions such as the National Student Assistance Program (PNAES). In it, budgetary resources are decentralized to educational institutions, which, in turn, are responsible for selecting those candidates who have the greatest demand for receiving socio-economic assistance. This paper proposes a differentiated approach to visualize the relationships between the data of such candidates, improving the analysis process conducted by Social Assistants. Method: A case study was carried out at the Federal Institute of Minas Gerais (IFMG) to demonstrate the feasibility of implementing and using the proposed solution based on real data from the institution, collected directly from the base of applicants for socioeconomic assistance. Results: The presentation of data and relationships between entities can be better viewed by Social Workers and contribute directly to understanding the real situation of the candidates. Conclusions: Analyzis of candidate information can benefit from the ability to build knowledge based on the visualization of data in graphs compared to that based on textual reports

    Open data from the Federal Institutes of Education: analysis of themes suggested by the Office of the Comptroller General

    Get PDF
    Introdução: A abertura das bases de dados governamentais pode contribuir positivamente com a democracia, transparência e controle social, pois oportuniza ao cidadão o acesso, reutilização, modificação e redistribuição livre das informações não sigilosas dos órgãos públicos. Porém, nem todos os dados de interesse da sociedade se encontram publicados em formatos abertos no presente momento. Esse estudo verifica se os dados referentes aos Institutos Federais de Educação, Ciência e Tecnologia, que são comumente solicitados à Controladoria-Geral da União pela sociedade civil, estão sendo catalogados no Portal Brasileiro de Dados Abertos. Método: Foi conduzida uma pesquisa quantitativa no Portal Brasileiro de Dados Abertos com suporte da técnica de pesquisa documental, o que permitiu analisar os conjuntos de dados publicados pelos Institutos Federais. Criou-se um índice para analisar cada um dos 14 temas coletados, o qual originou um indicador quantitativo utilizado na comparação dos resultados de cada Instituto Federal envolvido na pesquisa. Resultados: Identificou-se que 73,70% dos Institutos Federais catalogaram pelo menos um conjunto de dados no Portal Brasileiro de Dados Abertos. No entanto, verificaram-se contundentemente diversas lacunas na disponibilização de dados abertos por parte dessas instituições, além da baixa aderência à abertura de dados em conformidade às recomendações da Controladoria-Geral da União. Conclusão: Estudos como o realizado neste artigo contribuem para que a Administração Pública, especialmente considerando o contexto dos Institutos Federais, tenham subsídios que indiquem possíveis pontos de melhorias no que tange às demandas da sociedade sobre transparência e governança.Introduction: Opening government databases can positively contribute to democracy, transparency and social control, as it provides opportunities for citizens to access, reuse, modify and redistribute non-confidential information from public bodies. However, not all data of interest to society are currently published in open formats. This study verifies whether the data referring to the Federal Institutes of Education, Science and Technology, which are commonly requested from the Office of the Comptroller General by civil society, are being cataloged in the Brazilian Open Data Portal. Method: Quantitative research was conducted on the Brazilian Open Data Portal with the support of the documentary research technique, which allowed us to analyze the datasets published by the Federal Institutes. An index was created to analyze each of the 14 collected themes, which originated a quantitative indicator used to compare the results of each Federal Institute involved in the research. Results: It was identified that 73.70% of the Federal Institutes cataloged at least one dataset on the Brazilian Open Data Portal. However, there were strikingly several gaps in the availability of open data by these institutions, in addition to the low adherence to opening data in accordance with the recommendations of the Office of the Comptroller General. Conclusions: Studies such as the one carried out in this paper contribute to the Public Administration, especially considering the context of Federal Institutes, to have subsidies that indicate points for improvement with regard to society's demands on transparency and governance

    Semantic data dictionary for annotating performance indicators for hospital management

    Get PDF
    Introdução: A gestão hospitalar é uma atividade fundamental para atender a legislações e regulações, especialmente em momentos de crise sanitária. Estratégias de gestão utilizam diferentes indicadores (KPI ou Key Performance Indicator) para controlar os processos dentro de um hospital. KPIs neste segmento podem ser a taxa de ocupação (diária ou mensal), o índice de permanência de pacientes, o índice de renovação de pacientes ou a relação de pacientes internados por classificações de doenças, entre outros. A gestão dos dados gerados pelos indicadores visa suportar a tomada de decisão e melhorar os serviços de saúde prestados pela organização. Boas práticas de nomeação de dados evitam combinações de dados incompatíveis para não comprometer a tomada de decisão. Método: Foi aplicado neste artigo um processo sistemático para preparar e integrar dados de indicadores hospitalares com base na modelagem ontológica. Resultado: Um processo para anotação semântica dos dados suportado pela técnica SDD (Semantic Data Dictionary) que usa templates de metadados para facilitar a preparação, integração e reuso de dados na área hospitalar, especificamente, para o indicador de tempo médio de internação. Conclusão: O uso de  ontologias na anotação semântica permite desambiguar termos, preservar a semântica dos valores extraídos dos KPIs e abre caminho para a ingestão de dados de KPIs hospitalares a partir de diferentes fontes de dados da rede hospitalar (pública e privada). A abordagem apresentada contribui com a curadoria dos dados, uma vez que a técnica SDD segue as boas práticas para a gestão de dados em diferentes áreas.Introduction: Hospital management is a fundamental activity to comply with laws and regulations, especially in times of health crisis. Management strategies use different indicators (KPI or Key Performance Indicator) to control the processes within a hospital. KPIs in this segment can be the occupancy rate (daily or monthly), patient permanence index, patient renewal index or the list of hospitalized patients for disease classifications, among others. The management of the data generated by the indicators aims to support decision making and improve health services provided by the organization. Good data naming practices avoid incompatible data combinations so as not to compromise decision making. Method: It was applied in this article aims to put in practice a systematic process to prepare and integrate data from hospital indicators based on ontological modeling. Results: A process for semantic annotation of data supported by SDD (Semantic Data Dictionary) technique, which uses metadata templates to facilitate the preparation, integration and reuse of data in the hospital area, specifically for the average length of stay indicator. Conclusions: The use of ontologies in semantic annotation allows disambiguation of terms and preserves the semantics of values extracted from KPIs and opens the way for ingesting hospital KPI data from different data sources in the hospital network (public and private). Finally, the presented approach contributes to data curation, since the SDD technique follows good practices for data management in different areas.

    COVID-19 symptoms at hospital admission vary with age and sex: results from the ISARIC prospective multinational observational study

    Get PDF
    Background: The ISARIC prospective multinational observational study is the largest cohort of hospitalized patients with COVID-19. We present relationships of age, sex, and nationality to presenting symptoms. Methods: International, prospective observational study of 60 109 hospitalized symptomatic patients with laboratory-confirmed COVID-19 recruited from 43 countries between 30 January and 3 August 2020. Logistic regression was performed to evaluate relationships of age and sex to published COVID-19 case definitions and the most commonly reported symptoms. Results: ‘Typical’ symptoms of fever (69%), cough (68%) and shortness of breath (66%) were the most commonly reported. 92% of patients experienced at least one of these. Prevalence of typical symptoms was greatest in 30- to 60-year-olds (respectively 80, 79, 69%; at least one 95%). They were reported less frequently in children (≤ 18 years: 69, 48, 23; 85%), older adults (≥ 70 years: 61, 62, 65; 90%), and women (66, 66, 64; 90%; vs. men 71, 70, 67; 93%, each P < 0.001). The most common atypical presentations under 60 years of age were nausea and vomiting and abdominal pain, and over 60 years was confusion. Regression models showed significant differences in symptoms with sex, age and country. Interpretation: This international collaboration has allowed us to report reliable symptom data from the largest cohort of patients admitted to hospital with COVID-19. Adults over 60 and children admitted to hospital with COVID-19 are less likely to present with typical symptoms. Nausea and vomiting are common atypical presentations under 30 years. Confusion is a frequent atypical presentation of COVID-19 in adults over 60 years. Women are less likely to experience typical symptoms than men

    Mirnacle: machine learning with SMOTE and random forest for improving se- lectivity in pre-miRNA ab initio prediction

    No full text
    Os microRNAs (miRNAs) são importantes reguladores da expressão gênica em plantas e animais. Assim, miRNAs estão envolvidos na maioria dos processos biológicos, tor- nando o estudo dessas moléculas um dos temas mais relevantes da biologia molecular atualmente. Uma estratégia para encontrar novos miRNAs é procurar seus precursores (pre-miRNAs), que são estruturas ligeiramente maiores (70-120 nt) e têm uma estru- tura secundária na forma de hairpin (grampo de cabelo). No entanto, caracterizar pre-miRNAs in vivo ainda é uma tarefa complexa. Como consequência disto, méto- dos in silico foram desenvolvidos para prever a localização genômica de pre-miRNAs. No entanto, as ferramentas computacionais atuais têm problemas de seletividade, isto é, uma grande quantidade de falsos positivos é reportada. Este trabalho apresenta uma extensão do método desenvolvido por Tempel e Tahi, 2012, com o objetivo de melhorar a seletividade através da técnica de aprendizagem de máquina denominada Random Forest, combinada com o método SMOTE, que lida com conjuntos de dados desbalanceados. Comparando o método proposto com outras importantes abordagens na literatura, mostramos que os procedimentos descritos neste trabalho puderam me- lhorar substancialmente a seletividade, sem comprometer a sensibilidade. Para três conjuntos de dados utilizados nos experimentos realizados, a abordagem proposta al- cançou pelo menos 97 % de sensibilidade e proporcionou um aumento de duas, vinte e seis vezes na seletividade, respectivamente, em comparação com os resultados de ferramentas computacionais atuais.MicroRNAs (miRNAs) are key gene expression regulators in plants and animals. Thus, miRNAs are involved in the majority of biological process, making the study of these molecules one of the most relevant topics of molecular biology nowadays. A strategy to find new miRNAs is to search for its precursors (pre-miRNAs), which are slightly lar- ger structures (70-120 nt) and have a hairpin structural form. However, characterizing pre-miRNAs in vivo is still a complex task. As a consequence, in silico methods were developed to predict the genomic location of pre-miRNAs. Nevertheless, the current computational tools have problems of selectivity, i.e., a higher number of false positives is reported. This work presents an extension of the method developed by Tempel and Tahi, 2012, with the aim of improving selectivity through machine learning techniques, namely, random forests combined with the SMOTE method that copes with imbalance datasets. Comparing our method with other important approaches in the literature, we have shown that our procedures could substantially improve selectivity without com- promising sensibility. For three datasets used in our experiments, our method achieved at least 97% of sensitivity and could deliver a two-fold, 20-fold, and 6-fold increase in selectivity, respectively, compared with the best results of current computational tools.Sem Agência de Fomento

    Association of Country Income Level With the Characteristics and Outcomes of Critically Ill Patients Hospitalized With Acute Kidney Injury and COVID-19

    No full text
    Introduction: Acute kidney injury (AKI) has been identified as one of the most common and significant problems in hospitalized patients with COVID-19. However, studies examining the relationship between COVID-19 and AKI in low- and low-middle income countries (LLMIC) are lacking. Given that AKI is known to carry a higher mortality rate in these countries, it is important to understand differences in this population. Methods: This prospective, observational study examines the AKI incidence and characteristics of 32,210 patients with COVID-19 from 49 countries across all income levels who were admitted to an intensive care unit during their hospital stay. Results: Among patients with COVID-19 admitted to the intensive care unit, AKI incidence was highest in patients in LLMIC, followed by patients in upper-middle income countries (UMIC) and high-income countries (HIC) (53%, 38%, and 30%, respectively), whereas dialysis rates were lowest among patients with AKI from LLMIC and highest among those from HIC (27% vs. 45%). Patients with AKI in LLMIC had the largest proportion of community-acquired AKI (CA-AKI) and highest rate of in-hospital death (79% vs. 54% in HIC and 66% in UMIC). The association between AKI, being from LLMIC and in-hospital death persisted even after adjusting for disease severity. Conclusions: AKI is a particularly devastating complication of COVID-19 among patients from poorer nations where the gaps in accessibility and quality of healthcare delivery have a major impact on patient outcomes
    corecore