719 research outputs found
A Python graphical user interface for molecular descriptors based on RDKit
Funding Information:
It was also funded by the project “NORTE‐01‐0247‐FEDER‐047212”, supported by Northern Portugal Regional Operational Programme (Norte2020), under the Portugal 2020 Partnership Agreement, through the European Regional Development Fund (ERDF) and the Portuguese National Innovation Agency (ANI).
Publisher Copyright:
© 2023 Wiley-VCH GmbH.GUIDEMOL is a Python computer program based on the RDKit software to process molecular structures and calculate molecular descriptors with a graphical user interface using the tkinter package. It can calculate descriptors already implemented in RDKit as well as grid representations of 3D molecular structures using the electrostatic potential or voxels. The GUIDEMOL app provides easy access to RDKit tools for chemoinformatics users with no programming skills and can be adapted to calculate other descriptors or to trigger other procedures. A command line interface (CLI) is also provided for the calculation of grid representations. The source code is available at https://github.com/jairesdesousa/guidemol.preprintpublishe
Forecasting Demand in the Pharmaceutical Industry Using Machine Learning
Internship Report presented as the partial requirement for obtaining a Master's degree in Data Driven Marketing, specialization in Data Science for MarketingThis study delves into the exploitation of three machine learning models, namely the Extreme Gradient
Boosting (XGBoost), the Long Short-Term Memory (LSTM), and the novel Prophet algorithm, to surpass
the challenge of demand forecast within the pharmaceutical industry. Following the CRISP-DM
framework, we enabled accurate sales forecasting by studying, treating, transforming, and training a
dataset containing historical sales data from a major Portuguese pharmaceutical company. Our
findings align with the literature, underlying the robustness of the XGBoost and the inefficacy of the
LSTM for the delineated task, considering the singularities of the provided data. Furthermore, this
research highlights the potential of the Prophet for both its effectiveness and efficiency. This endeavor
allowed us to reinforce the literature’s conviction of the need for product-specific forecasting,
showcasing that no single model achieves the best accuracy for all drugs
Atomic Descriptors and Molecular Operators
Funding Information: This work was supported by the Associate Laboratory for Green Chemistry (LAQV), which is financed by national funds from the Funda\u00E7\u00E3o para a Ci\u00EAncia e Tecnologia (FCT/MECI), Portugal, under grants LA/P/0008/2020 DOI 10.54499/LA/P/0008/2020, UIDP/50006/2020 DOI 10.54499/UIDP/50006/2020, and UIDB/50006/2020 DOI 10.54499/UIDB/50006/2020. This work was co-funded by the European Union through scholarships awarded to N.B. and X.G. by the Erasmus Mundus Joint Masters ChEMoinformaticsplus project (program ERASMUS2027, ERASMUS-EDU-2021-PEX-EMJM-MOB; project number 101050809). Publisher Copyright: © 2024 by the authors.A variational heteroencoder based on recurrent neural networks, trained with SMILES linear notations of molecular structures, was used to derive the following atomic descriptors: delta latent space vectors (DLSVs) obtained from the original SMILES of the whole molecule and the SMILES of the same molecule with the target atom replaced. Different replacements were explored, namely, changing the atomic element, replacement with a character of the model vocabulary not used in the training set, or the removal of the target atom from the SMILES. Unsupervised mapping of the DLSV descriptors with t-distributed stochastic neighbor embedding (t-SNE) revealed a remarkable clustering according to the atomic element, hybridization, atomic type, and aromaticity. Atomic DLSV descriptors were used to train machine learning (ML) models to predict 19F NMR chemical shifts. An R2 of up to 0.89 and mean absolute errors of up to 5.5 ppm were obtained for an independent test set of 1046 molecules with random forests or a gradient-boosting regressor. Intermediate representations from a Transformer model yielded comparable results. Furthermore, DLSVs were applied as molecular operators in the latent space: the DLSV of a halogenation (H→F substitution) was summed to the LSVs of 4135 new molecules with no fluorine atom and decoded into SMILES, yielding 99% of valid SMILES, with 75% of the SMILES incorporating fluorine and 56% of the structures incorporating fluorine with no other structural change.publishersversionpublishe
Origin and diagnosis of SAR-CoV-2
A doença COVID-19 caracteriza-se por uma síndrome respiratória aguda grave (SARS), tendo surgido pela primeira
vez na China, em dezembro de 2019, associada a um grande mercado de peixe em Wuhan. A doença é causada por
um novo Coronavírus (CoV), designado SARS-CoV-2 pela semelhança com o SARS-CoV que foi responsável por um
surto de SARS em 2002-2004 na China. A análise filogenética de genomas completos mostrou que o SARS-CoV-2
pode ter origem num CoV do morcego (96% de identidade genética). Sem uma vacina nem medicamentos antivirais
específicos para a COVID-19, a deteção precoce e fiável do novo Coronavírus é fundamental. Nesta revisão,
apresentamos os métodos de diagnóstico atuais para o SARS-CoV-2, incluindo manifestações clínicas, imagem
torácica e deteção laboratorial, discutindo as respetivas vantagens e limitações.info:eu-repo/semantics/publishedVersio
Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de
dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco
híbrido que possui um modelo baseado em grafo e em documento para persistência de
dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases
de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração
de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela
possibilidade de se armazenar os dados gerados ao longo do processamento do workflow
e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de
um workflow científico, visto que não seria necessário buscar novamente os dados que
foram utilizados em um dado experimento. Como resultado, este trabalho demonstra
como os dados gerados pelo workflow e seus dados de proveniência foram armazenados
no ArangoDB utilizando o modelo PROV-DM.This work presents a study about the use of the database management system NoSQL
ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid
model based on graph and document for data persistence. It was studied the storing of
data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance
graph generated by the used process. The study was motivated by the possibility of
storing data generated during the processing of the workflow and data about its execution
in one place, which would facilitate the re-execution of a scientific workflow, because it
would not be necessary to look again the data that were used in a given experiment. As
a result, this work demonstrates how the data generated by workflow and its provenance
were stored on ArangoDB using the PROV-DM model
Modeling Strategies to Improve the Dependability of Cloud Infrastructures
Cloud computing presents some challenges that need to be overcome, such as planning infrastructures that maintain availability when failure events and repair activities occur. Cloud infrastructure planning that addresses the dependability aspects is an essential activity because it ensures business continuity and client satisfaction. Redundancy mechanisms cold standby, warm standby and hot standby can be allocated to components of the cloud infrastructure to maintain the availability levels agreed in service level agreement (SLAs). Mathematical formalisms based on state space such as stochastic Petri nets and based on combinatorial as reliability block diagrams can be adopted to evaluate the dependability of cloud infrastructures considering the allocation of different redundancy mechanisms to its components. This chapter shows the adoption of the mathematical formalisms stochastic Petri nets and reliability block diagrams to dependability evaluation of cloud infrastructures with different redundancy mechanisms
High prevalence of carbapenemase-producing enterobacteriaceae among hospitalized children in luanda, angola
This study aimed to evaluate the prevalence of carbapenemase-producing Enterobacteriaceae in Luanda, Angola. A total of 157 rectal samples were collected from children visiting a pediatric hospital in Luanda in March 2015. Fifty-seven imipenem-nonsusceptible enterobacterial isolates were recovered, most of which were non-clonally related. The blaOXA-181 (50/57) and blaNDM-1 (7/57) carbapenemase genes were identified. Notably, OXA-181-producing Escherichia coli isolates rarely coproduced extended-spectrum β-lactamases and consequently remained susceptible to broad-spectrum cephalosporins. The blaOXA-181 gene was always located on an IncX3 plasmid, while the blaNDM-1 gene was located on either IncFIA or IncA/C plasmids. The study identified a high prevalence of OXA-181 among hospitalized children in Angola
Síntese de N-arilaziridinas quirais
Dissertação apresentada para obtenção do
Grau de Doutor em Química,especialidade de Química Orgânica,pela Universidade Nova de Lisboa,Faculdade de Ciências e TecnologiaFoi estudada a verificação de enantiosselectividade ou diastereosselectividade na síntese
de aziridinas a partir de olefinas electrodeficientes e ácidos N-aril-hidroxâmicos na presença de uma base.
A aziridinação das olefinas quirais acrilato de (-)-8-fenilmentol e acrilato de (-)-2,5sultamabornano deu origem a excessos diastereoisoméricos inferiores a 50%. Num dos casos foi possível separar os dois diastereoisómeros e, após metanólise, obter cada uma das carbometoxi-aziridinas respectivas (enantioméricas) enantiomericamentepuras.
Foram testados ácidos N-fenil-hidroxâmicos quirais derivados do ácido dehidroabiético,
ácido canfânico e ácido de Mosher tendo ocorrido aziridinação apenas com os
dois primeiros e com e.e. não superior a 18%.
A utilização de reagentes não quirais num meio heterogéneo (base aquosa / solvente
orgânico) com catálise de transferência de fase quiral por sais quaternários de cinchonina permitiu obter aziridinas com e.e. até 62%. Foram estudados os factores que influenciam a reacção, nomeadamente as estruturas da olefina, ácido hidroxâmico e catalisador, tipo de base, solvente e temperatura. Observou-se nomeadamente que os sais de cinchonidina dão origem aos mesmos enantiómeros maioritários. Foi proposto um modelo explicativo das enantiosselectividades observadas, no qual é essencial a intervenção do grupo vinilo do
catalisador.
Cristalografia de raios X de uma aziridina derivada do acrilato de (-)-2,5sultamabornano
permitiu deduzir a configuração absoluta da carbometoxi-aziridina obtida a partir dela, por metanólise, assim como de outras carbometoxi-, carboetoxi- e carboterbutoxiaziridinas,com base em considerações mecanísticas, rotação óptica e espectroscopia de 1H RMN com complexos quirais de lantanídeos.JNICT, Bolsa de Doutoramento 2658/93 dos Programas Ciência e Praxis XX
Língua Portuguesa – ganho de afeto e bases didáticas.
The main objective of this work was to discuss how the affection gain and didactic
bases, aimed at the use of technological resources, such as cellular, and the use of
music, comics and advertising, can bring benefits for teaching Portuguese. The
methodology adopted was a bibliographical one, based on books, research and
scientific articles about the themes involved. The reflections and studies have shown
that despite the challenges encountered by professionals, the aforementioned
resources are of great importance for the creation of affections in the teaching and
learning process, especially in the Portuguese language. As an unfolding, it is pointed
out the need for a more adequate training and preparation of these professionals,
considering that one of their main functions is to critically follow the aspirations of
globalized society.O objetivo principal assumido neste trabalho foi o de abordar sobre como o ganho de
afeto e bases didáticas, voltadas para a utilização de recursos tecnológicos, como o
celular, e para a utilização da música, da história de quadrinhos e da publicidade,
podem trazer benefícios para o ensino de língua portuguesa. A metodologia adotada
foi a de cunho bibliográfico, com base em livros, pesquisas e artigos científicos acerca
das temáticas envolvidas. As reflexões e estudos realizados demonstraram que,
apesar dos desafios encontrados pelos profissionais, os recursos supracitados são de
grande importância para a criação de afetos no processo de ensino e aprendizagem,
especialmente o da língua portuguesa. Como desdobramento, aponta-se a
necessidade de uma formação e uma preparação mais adequada desses
profissionais, uma vez que uma de suas principais funções é acompanhar de forma
crítica os anseios da sociedade globalizada
Desenvolvimento de competências num centro hospitalar E.P.E. - estudo de caso
Pretendemos com este estudo, num Centro Hospitalar do sector empresarial do Estado, dar um contributo para a compreensão dos procedimentos adoptados para a tomada de decisão sobre os processos de desenvolvimento de competências e acções adoptadas para os implementar. A metodologia seguida é de Estudo de Caso com abordagem qualitativa (não-experimental) procedendo-se à análise de documentos e de entrevistas a responsáveis por desenvolvimento de competências. Os resultados mostram que o quadro teórico e conceptual inferido da análise do processo de desenvolvimento de competências no Centro Hospitalar tem como constituinte fundamental a identificação de dois modos distintos de funcionamento e que a diferença depende do nível da estrutura organizacional considerado. Propomos uma intervenção na Organização, no âmbito dos processos de desenvolvimento profissional e pessoal, baseada na introdução de informação manipulada; Abstract:
Training and development on a State Public Company Hospital Center - Case study
With this study we intend, on a Hospital Center of the State enterprise sector, to give a contribute to the understanding of the adopted procedures to the decision about the process in development of competences and adopted actions to implement. Case Study is the methodology followed with a qualitative approach (non-experimental) by analyzing documents and the interviews to people in charge for the competences development. The theoretical and conceptual framework that we inferred from the analysis of the process on development of competences in the Hospital Center, has as its fundamental constituent the identification of two different sets of operation, whose difference depends on the organizational structure's level considered
- …