    Development of a recommendation system for scientific literature based on deep learning

    Dissertação de mestrado em BioinformaticsThe previous few decades have seen an enormous volume of articles from the scientific commu nity on the most diverse biomedical topics, making it extremely challenging for researchers to find relevant information. Methods like Machine Learning (ML) and Deep Learning (DL) have been used to create tools that can speed up this process. In that context, this work focuses on examining the performance of different ML and DL techniques when classifying biomedical documents, mainly regarding their relevance to given topics. To evaluate the different techniques, the dataset from the BioCreative VI Track 4 challenge was used. The objective of the challenge was to identify documents related to protein-protein interactions altered by mutations, a topic extremely important in precision medicine. Protein-protein interactions play a crucial role in the cellular mechanisms of all living organisms, and mutations in these interaction sites could be indicative of diseases. To handle the data to be used in training, some text processing methods were implemented in the Omnia package from OmniumAI, the host company of this work. Several preprocessing and feature extraction methods were implemented, such as removing stopwords and TF-IDF, which may be used in other case studies. They can be used either with generic text or biomedical text. These methods, in conjunction with ML pipelines already developed by the Omnia team, allowed the training of several traditional ML models. We were able to achieve a small improvement on performance, compared to the challenge baseline, when applying these traditional ML models on the same dataset. Regarding DL, testing with a CNN model, it was clear that the BioWordVec pre-trained embedding achieved the best performance of all pre-trained embeddings. Additionally, we explored the application of more complex DL models. These models achieved a better performance than the best challenge submission. BioLinkBERT managed an improvement of 0.4 percent points on precision, 4.9 percent points on recall, and 2.2 percent points on F1.As décadas anteriores assistiram a um enorme aumento no volume de artigos da comunidade científica sobre os mais diversos tópicos biomédicos, tornando extremamente difícil para os investigadores encontrar informação relevante. Métodos como Aprendizagem Máquina (AM) e Aprendizagem Profunda (AP) tem sido utilizados para criar ferramentas que podem acelerar este processo. Neste contexto, este trabalho centra-se na avaliação do desempenho de diferentes técnicas de AM e AP na classificação de documentos biomédicos, principalmente no que diz respeito à sua relevância para determinados tópicos. Para avaliar as diferentes técnicas, foi utilizado o conjunto de dados do desafio BioCreative VI Track 4. O objectivo do desafio era identificar documentos relacionados com as interações proteína-proteína alteradas por mutações, um tópico extremamente importante na medicina de precisão. As interacções proteína-proteína desempenham um papel crucial nos mecanismos celulares de todos os organismos vivos, e as mutações nestes locais de interacção podem ser indicativas de doenças. Para tratar os dados a utilizar no treino, alguns métodos de processamento de texto foram implementados no pacote Omnia da OmniumAI, a empresa anfitriã deste trabalho. Foram implementados vários métodos de pré-processamento e extracção de características, tais como a remoção de palavras irrelevantes e TF-IDF, que podem ser utilizados em outros casos de estudos, tanto com texto genérico quer com texto biomédico. Estes métodos, em conjunto com as pipelines de AM já desenvolvidas pela equipa da Omnia, permitiram o treino de vários modelos tradicionais de AM. Conseguimos alcançar uma pequena melhoria no desempenho, em comparação com a linha de referência do desafio, ao aplicar estes modelos tradicionais de AM no mesmo conjunto de dados. Relativamente a AP, testando com um modelo CNN, ficou claro que o embedding pré-treinado BioWordVec alcançou o melhor desempenho de todos os embeddings pré-treinados. Adicionalmente, exploramos a aplicação de modelos de AP mais complexos. Estes modelos alcançaram um melhor desempenho do que a melhor submissão do desafio. BioLinkBERT conseguiu uma melhoria de 0,4 pontos percentuais na precisão, 4,9 pontos percentuais no recall, e 2,2 pontos percentuais em F1

    A relação entre a contextualização e a neurolingüística no ensino de língua estrangeira

    A compreensão da linguagem é o conjunto de processos, graças aos quais uma conexão lingüística ou extra-lingüística torna-se um enriquecimento de informações e experiências. Nossa intenção é demonstrar o embasamento científico pontuando alguns pontos cruciais para o entendimento da relação entre a contextualização e a neurolingüística. Temos um duplo conhecimento: lingüístico e experimental. Este conhecimento que vem do exterior é armazenado em nós sob a forma de representação interna do conhecimento. Para o ensino-aprendizagem de língua estrangeira isto implica que devem ser oferecidos aos alunos input e atividades diferenciadas que contemplem ambas as modalidades do cérebro, língua e contexto, para que a aprendizagem se realize de maneira mais aprofundada e rica. &nbsp

    Um deslocamento do olhar sobre o conhecimento especializado em enfermagem: debate epistemológico

    This theoretical study results from the observation and problematization of inexperienced nurses' insertion in technological environments, which requires specialized knowledge and practices. We pose the question if the use of this knowledge leads to a fragmented practice. The objective is to discuss the specialized knowledge necessary for nursing work in this setting, at the light of the principles that guide the new scientific paradigm. A bibliographical survey and literature review were carried out. The discussion is based on the assertion that, although specialized knowledge originates in a reductionist, objective, rational and mechanistic paradigm, its application in specialized nursing practice is not necessarily based on these principles, but on the scientific paradigm that guides them as individuals in the world. This suggests a change in the perspective on this issue.Se trata de un estudio de naturaleza teórica originado a la observación y problematización de la inserción de enfermeros novatos en ambientes tecnológicos, los cuales presuponen la necesidad de conocimientos/prácticas especializados. Se cuestiona si la utilización de este conocimiento presupone una práctica fragmentada. Se objetiva discutir el conocimiento especializado necesario para la actuación del enfermero en estos escenarios a la luz de los principios orientadores del nuevo paradigma de la ciencia. A través del levantamiento bibliográfico y la revisión de literatura, se construye la discusión en la defensa de que, a pesar de que el conocimiento especializado se origine de un paradigma reduccionista, objetivo, racional y mecanicista, su aplicación en la práctica especializada del enfermero no se guía necesariamente por estos principios; lo hace más bien con el paradigma de la ciencia que orienta el sujeto en el mundo, sugerido así una nueva perspectiva sobre esta cuestión.Estudo de natureza teórica, originado da observação e problematização da inserção de enfermeiros novatos em ambientes tecnológicos, os quais pressupõem a necessidade de saber/prática especializada. Questiona-se se a utilização desse saber pressupõe prática fragmentada. Objetiva-se discutir o conhecimento especializado necessário para atuação do enfermeiro nesses cenários, à luz dos princípios norteadores do novo paradigma da ciência. Através do levantamento bibliográfico e revisão de literatura, construiu-se a discussão na defesa de que, embora o conhecimento especializado se origine de paradigma reducionista, objetivo, racional e mecanicista, a sua aplicação na prática especializada do enfermeiro não se pauta necessariamente nesses princípios, mas no paradigma da ciência que o orienta, enquanto sujeito no mundo, sugerindo assim , deslocamento do olhar sobre essa questão

    Unveiling User Behavior on Summit Login Nodes as a User

    We observe and analyze usage of the login nodes of the leadership class Summit supercomputer from the perspective of an ordinary user -- not a system administrator -- by periodically sampling user activities (job queues, running processes, etc.) for two full years (2020-2021). Our findings unveil key usage patterns that evidence misuse of the system, including gaming the policies, impairing I/O performance, and using login nodes as a sole computing resource. Our analysis highlights observed patterns for the execution of complex computations (workflows), which are key for processing large-scale applications.Comment: International Conference on Computational Science (ICCS), 202

    Análise qualitativa de corpos hídricos superficiais na Cidade de Cajazeiras-PB

    O uso das águas superficiais na Paraíba tem aumentado de forma considerável ao longo dos anos, tanto devido ao abastecimento urbano quanto ao rural. Além disso, esses corpos hídricos estão cada vez mais sujeitos a agentes contaminantes, provenientes do lançamento de esgotos sem tratamento e por ações antropogênicas. O presente trabalho buscou analisar a influência dos impactos ambientais de origem antrópicas em corpos hídricos superficiais na cidade de Cajazeiras – PB, a partir de amostras coletadas em seis corpos d’água superficiais, onde foram realizadas análises físico-químicas e microbiológicas. Os parâmetros adotados para avaliar a qualidade da água foram: temperatura, cor, turbidez, potencial hidrogeniônico (pH), condutividade, sólidos totais dissolvidos, salinidade, oxigênio consumido, oxigênio dissolvido, gás carbônico livre, alcalinidade, cloretos, dureza, coliformes totais e fecais. Comparando-se os resultados obtidos, com as legislações vigentes, as análises qualitativas bacteriológicas para coliformes totais e fecais apresentaram os resultados mais críticos, com indicação de presença das bactérias em todos os corpos hídricos. Nas análises físico-químicas os parâmetros que apresentaram os índices mais elevados foram oxigênio consumido e oxigênio dissolvido. Dessa maneira, os seis corpos hídricos estudados foram determinados como pertencentes à Classe 4, onde essa má qualidade ressalva a dimensão dos impactos ambientais realizados pelo homem em corpos hídricos superficiais, associando os elevados graus de poluição às contribuições de esgoto, lançamento de resíduos sólidos pela população, uso e ocupação de seu entorno e mineraçã

    Understanding User Behavior: From HPC to HTC

    AbstractIn this paper, we investigate the differences and similarities in user job submission behavior in High Performance Computing (HPC) and High Throughput Computing (HTC). We consider job submission behavior in terms of parallel batch-wise submissions, as well as delays and pauses in job submission. Our findings show that modeling user-based HTC job submission behavior requires knowledge of the underlying bags of tasks, which is often unavailable. Furthermore, we find evidence that subsequent job submission behavior is not influenced by the different complexities and requirements of HPC and HTC jobs

    Moisturizing emulsion with Attalea speciosa (babassu) oil as an alternative treatment for cutaneous xerosis in leprosy

    This study investigated the moisturizing action of a topical emulsion containing babassu coconut almond oil in xerotic skin volunteers treated or undergoing leprosy treatment. A total of 20 volunteers (16 men and 4 women, with a mean age of 52.2 ± 15.3) with cutaneous xerosis performed the tests after signing the informed consent form. The research subjects were instructed to use the product under investigation (Attalea speciosa almond oil gel-cream formulation) 1 (one) once a day, in two 15-day cycles: first with the gel-cream formulation with babassu oil (treatment A) and the second with the gel-cream formulation without babassu oil (treatment B). The moisturizing emulsion did not significantly alter (p> 0.05) the xerotic skin pH of the volunteers, treatment A (11.6 ± 0.1), treatment B (8.8 ± 0.2) and control (11.4 ± 0.2) at week W7, when compared to week W15, treatment A (11.0 ± 0.4), treatment B (11.6 ± 0.1) and control (11.4 ± 0.2). Clinical evaluations showed the efficacy and good tolerability of topical emulsion in the hydration of xerotic skin. The biophysical evaluation of the moisturizing emulsion proved the significant improvement of skin moisture

    Determining factors of domestic accidents in early childhood

    Introduction: Domestic accidents are one of the main causes of death among children, characterized by an event that involves multiple determinants, emphasizing, among others, intrapersonal, interpersonal, cultural and institutional factors. Objective: To analyse the determinants of domestic accidents in early childhood. Methods: This is an exploratory, descriptive, and cross-sectional study carried out in the Emergency Hospital of Teresina city, Piauí, Brazil, between January and March 2016. The population was composed of 21 caregivers of children under five years old, hospitalized between January and March 2016. For data collection, a structured interview was conducted on aspects related to the risk factors associated with the incidence of domestic accidents involving children. A descriptive analysis was performed, with absolute and relative frequencies for the variables. The Human Research Ethics Committee approved the research with Protocol No. 1324184. Results: In relation to intrapersonal factors, pre-school children were the main victims (57.2%). For interpersonal factors, it was observed that most of participants (85.7%) considered the household unsafe for children. The evaluation of institutional factors showed that most caregivers (52.4%) had not been advised about the prevention of accidents at home. In  terms of cultural factors, most participants (81%) had not heard news about domestic accidents. Conclusion: Parents and caregivers have very limited knowledge about the prevention of childhood accidents at home, with male pre-schoolers the main victims of domestic accidents

    A science-gateway workload archive application to the self-healing of workflow incidents

    Information about the execution of distributed workload is important for studies in computer science and engineering, but workloads acquired at the infrastructure-level reputably lack information about users and application-level middleware. Meanwhile, workloads acquired at science-gateway level contain detailed information about users, pilot jobs, task sub-steps, bag of tasks and workflow executions. In this work, we present a science-gateway archive, we illustrate its possibilities on a few case studies, and we use it for the autonomic handling of workflow incidents