2,094 research outputs found
Classification and Scoring of Protein Complexes
Proteins interactions mediate all biological systems in a cell; understanding their interactions
means understanding the processes responsible for human life. Their structure can
be obtained experimentally, but such processes frequently fail at determining structures
of protein complexes. To address the issue, computational methods have been developed
that attempt to predict the structure of a protein complex, using information of its constituents.
These methods, known as docking, generate thousands of possible poses for
each complex, and require effective and reliable ways to quickly discriminate the correct
pose among the set of incorrect ones. In this thesis, a new scoring function was developed
that uses machine learning techniques and features extracted from the structure of the
interacting proteins, to correctly classify and rank the putative poses. The developed
function has shown to be competitive with current state-of-the-art solutions
Otimização da estrutura de geradores eletromagnéticos
The importance of autonomous energy harvesting systems has been rising
among the scientific community. These systems are seen as the answer
for the dissatisfaction felt towards the actual energy harvesting devices.
Different approaches to modulate, simulate, and analyse the mechanical
and electrical dynamics of these transductors are described in the literature.
However, no methodology has been proved effective in the optimization of
these non linear generators’ performance, especially in what the occurrence
of different excitations than the ones to which it was geometrically projected
is concerned. The present thesis focus in the optimization of energy
harvesting from the oscillations of magnetic levitation. The main goal of this
work is to maximize the harvesters’ performance. This was accomplished
through the development of a geometric optimization tool, by means of a
sophisticated method that controls the levitating magnet’s dynamics for
either a priori known or variable frequencies. Based on a model that
analytically approaches the fundamental dynamics of these harvesters, the
frequency, acceleration, length of the generator and mass of the levitating
magnet(s) were varied. The optimal adaptive length was examined, which
allowed a higher efficiency when faced with variations in the excitation
patterns.A importância dos sistemas de geração autónoma de energia tem vindo a
crescer significativamente na comunidade científica, visando solucionar a
insatisfação perante as soluções atuais de fornecimento de energia. Este
trabalho foca-se na otimização dos sistemas eletromagnéticos de geração
de energia com arquitetura em levitação magnética. Na literatura estão
descritos diferentes tipos de abordagens para modular, simular e analisar
a dinâmica das componentes mecânica e elétrica destes transdutores.
Contudo, nenhuma metodologia se mostrou adequada para otimizar o
desempenho destes geradores não lineares, principalmente na ocorrência
de excitações diferentes da qual foi geometricamente projetado. O principal
objetivo deste estudo é a maximização do desempenho destes geradores,
através do desenvolvimento de uma metodologia de otimização geométrica.
Desenvolveu-se uma ferramenta de otimização para controlar a dinâmica
do(s) íman(es) em levitação, tanto para excitações conhecidas a priori, como
para excitações variáveis. Usando um modelo que aborda analiticamente a
dinâmica fundamental destes geradores, foi variada a frequência, aceleração,
comprimento do gerador e a massa do(s) íman(es) em levitação. O
comprimento adaptativo ótimo foi explorado a partir da análise paramétrica,
permitindo deste modo obter maiores eficiências face a variações nos
padrões de excitação.Mestrado em Engenharia Mecânic
Extensive intragenic recombination and patterns of linkage disequilibrium at the CSN3 locus in European rabbit
Kappa-casein (CSN3) plays an important role in stabilising the Ca-sensitive caseins in the micelle. The European rabbit (Oryctolagus cuniculus) CSN3 has previously been shown to possess two alleles (A and B), which differ deeply in their intronic regions (indels of 100 and 1550 nucleotides in introns 1 and 4, respectively). Furthermore, a correlation between several reproductive performance traits and the different alleles was described. However, all these data were exclusively collected in rabbit domestic breeds, preventing a deeper understanding of the extensive polymorphism observed in the CSN3 gene. Additionally, the techniques available for the typing of both indel polymorphisms were until now not suitable for large-scale studies. In this report, we describe a simple, PCR-based typing method to distinguish rabbit CSN3 alleles. We analyse both ancient wild rabbit populations from the Iberian Peninsula and France, and the more recently derived English wild rabbits and domestic stocks. A new allele (C) showing another major indel (250 bp) in intron 1 was found, but exclusively detected in Iberian wild rabbits. In addition, our survey revealed the occurrence of new haplotypes in wild populations, suggesting that intragenic recombination is important in creating genetic diversity at this locus. This easy and low cost single-step PCR-based method results in an improvement over previous described techniques, can be easily set up in a routine molecular laboratory and would probably be a valuable tool in the management of rabbit domestic breeds
Feature selection strategies for improving data-driven decision support in bank telemarketing
The usage of data mining techniques to unveil previously undiscovered knowledge has
been applied in past years to a wide number of domains, including banking and marketing. Raw
data is the basic ingredient for successfully detecting interesting patterns. A key aspect of raw
data manipulation is feature engineering and it is related with the correct characterization or
selection of relevant features (or variables) that conceal relations with the target goal.
This study is particularly focused on feature engineering, aiming at the unfolding
features that best characterize the problem of selling long-term bank deposits through
telemarketing campaigns. For the experimental setup, a case-study from a Portuguese bank,
ranging the 2008-2013 year period and encompassing the recent global financial crisis, was
addressed. To assess the relevance of such problem, a novel literature analysis using text
mining and the latent Dirichlet allocation algorithm was conducted, confirming the existence of a
research gap for bank telemarketing.
Starting from a dataset containing typical telemarketing contacts and client information,
research followed three different and complementary strategies: first, by enriching the dataset
with social and economic context features; then, by including customer lifetime value related
features; finally, by applying a divide and conquer strategy for splitting the problem in smaller
fractions, leading to optimized sub-problems. Each of the three approaches improved previous
results in terms of model metrics related to prediction performance. The relevance of the
proposed features was evaluated, confirming the obtained models as credible and valuable for
telemarketing campaign managers.A utilização de técnicas de data mining para a descoberta de conhecimento tem sido
aplicada nos últimos anos a uma grande variedade de domínios, incluindo banca e marketing.
Os dados no seu estado primitivo constituem o ingrediente básico para a deteção de padrões
de informação. Um aspeto chave da manipulação de dados em bruto consiste na "engenharia
de atributos", que compreende uma correta definição e seleção de atributos relevantes (ou
variáveis) que se relacionem com o alvo da descoberta de conhecimento.
Este trabalho foca-se numa abordagem de "engenharia de atributos" para definir as
variáveis que melhor caraterizam o problema de vender depósitos bancários a prazo através de
campanhas de telemarketing. Sendo um estudo empírico, foi utilizado um caso de estudo de
um banco português, abrangendo o período 2008-2013, que inclui os efeitos da crise financeira
internacional. Para aferir da importância deste problema, foi realizada uma inovadora análise
da literatura recorrendo a text mining e ao algoritmo latent Dirichlet allocation, confirmando a
existência de uma lacuna nesta matéria.
Utilizando como base um conjunto de dados de contactos de telemarketing e
informação sobre os clientes, três estratégias diferentes e complementares foram propostas:
primeiro, os dados foram enriquecidos com atributos socioeconómicos; posteriormente, foram
adicionadas características associadas ao valor do cliente ao longo do seu tempo de vida;
finalmente, o problema foi dividido em problemas mais específicos, permitindo abordagens
otimizadas a cada subproblema. Cada abordagem melhorou as métricas associadas à
capacidade preditiva do modelo. Adicionalmente, a relevância dos atributos foi avaliada,
confirmando os modelos obtidos como credíveis e valiosos para gestores de campanhas de telemarketing
A machine learning approach to The Big Five Personality Test
Dissertação de mestrado em Engenharia InformáticaOne of the most accurate personality assessments available is the Goldberg’s ’The Big
Five Personality Test’, which measures the five OCEAN dimensions: Openness, Conscientiousness, Extraversion, Agreeableness and Neuroticism. This assessment is performed by
presenting a total of forty adjectives requesting the subject to rate each word using a scale
of 1 to 9 indicating whether it accurately (9) describes herself or not (1). Nonetheless, scientific research has shown that this test may, accurately, suggest personality traits such as
aggressive reactions, work performance, fitness on specific expertise areas and also mental illnesses. However, one big disadvantage of this test, it simply takes too much time
to perform, which can result on undesirable measurements. Indeed, several developments
have been done in order to reduce the required effort to perform this test, an example is
The Mini Marker Test by Saucier. This study aims to propose a viable shorter alternative to
this by applying machine learning techniques, i.e., although measurement precision may be
reduced, is it possible to build a much shorter version losing as little precision as possible
by just requiring the subject to select the adjectives that characterise him the most?
For this study, it was developed a platform to collect data, requesting both the subject to
rate each adjective but also to select those he most identifies with. With this, the available
data contains both ratings and the selections of the words that most characterise the subject.
Three different machine learning architectures are developed and tested. Both regression
and classification approaches are considered. The main input for these architectures are
the words selected by each evaluated subject. Data collected by this work showed to be
insufficient, requiring the use of data augmentation techniques. For this, different versions
are proposed, one including the use of frequent itemset mining techniques. The proposed
machine learning architectures shown a very high precision, with an RMSE of around 7%.
The results show the proposed solutions to be able to perform a shorter version of this
test with a minimum precision loss. It was also possible to define a list of common sets
of selected words. Further research can be performed mainly on two different streamlines,
i.e., strength the data collection process and develop an even shorter version of this test.Uma das avaliações de personalidade mais precisas foi criada por Goldberg, chamada 'The Big Five Personality Test', que mede um total de cinco dimensões denominadas de OCEAN: Openness, Conscientiousness, Extraversion, Agreeableness and Neuroticism. A avaliaçao em causa é realizada apresentando um total de quarenta adjetivos a um individuo solici-tando lhe que classifique cada uma das palavras usando uma escala de a a 9, indicando se esta o descreve de forma exata (9) ou não (1). Assim sendo, estudos científicos sugerem que este teste poderá, de forma precisa, indicar outros traços da personalidade, tais como reações agressivas, desempenho no trabalho, aptidão para áreas de especialidade e doenças mentais. No entanto, uma grande desvantagem deste teste, é que este pode ser demasiado extenso e demorado, podendo gerar resultados indesejados. Na verdade, múltiplos desenvolvimentos foram feitos de modo a reduzir o esforço necessário para a realização do mesmo. Este estudo pretende assim propor uma alternativa mais curta e viável aplicando técnicas de machine learning, isto é, apesar da precisão dos resultados poder ser degradada, é possível construir uma versão muito mais curta com o mínimo possível de degradação da qualidade dos resultados apenas solicitando ao sujeito que este selecione os adjetivos que melhor o caracterizam? Para este estudo, foi desenvolvida uma plataforma para recolha de dados, solicitando ao individuo tanto para classificar cada adjetivo, usando a escala, como também para selecionar aqueles com que este mais se identifica. Assim, os dados disponíveis contém tanto as escalas como a seleção das palavras que mais caracterizam cada um dos sujeitos. Três diferentes arquiteturas de machine learning são desenvolvidas e testadas. Tanto abordagens de regressão como classificação são consideradas. O principal input para estas arquiteturas é a seleção de cada uma das palavras por parte dos sujeitos avaliados. Os dados recolhidos durante este estudo demonstraram ser insuficientes, exigindo o uso de técnicas de data augmentation. Nesse sentido, diferentes versões são propostas, sendo que uma delas incluí o uso de técnicas de frequent itemset mining. As arquiteturas de machine learning propostas apresentaram uma precisão bastante elevada nos resultados, com um RMSE de cerca de 7%. Os resultados obtidos mostram que as soluções propostas são capazes de gerar uma versão reduzida do teste em causa com uma degradação mínima dos resultados. Foi também possível definir uma lista de conjuntos frequentes de palavras selecionadas. Desenvolvimentos futuros podem ser feitos em duas direções distintas, isto é, melhorar o processo de recolha de dados ou desenvolver uma versão ainda mais reduzida deste teste
The effect of physical strength on persuasion attempts between two parties
This article studies the impact of communicator and recipient physical strength on persuasion under a context of purchase. It consists of measuring purchase intentions of individuals with various levels of self-reported physical strength under the same context of purchase with three different conditions. Each of these conditions is defined by a picture of an advisor with a different body physique and muscularity. Results showed that advisor physical strength played a significant role among weak and strong individuals but not on medium ones, increasing purchase intentions on these categories. Lastly, several possibly explanatory variables were explored (e.g. Confidence, Attractiveness) as well as potential mediators on vigilance against persuasion
Investors along the company life-cycle : evidence for Portugal
Este trabalho de pesquisa examina a presença dos investidores ao longo do ciclo-de-vida das empresas portuguesas, juntamente com a estrutura de capital e acionista. Recorrendo a exemplos estilizados do ciclo financeiro das empresas, existentes nas obras de Berger e Udell (1998) e Caselli (2009), foi possível criar um exemplo alternativo que estabelece previsões para o sequenciamento dos investidores ao longo do desenvolvimento das empresas. Variáveis de tamanho e idade das sociedades financiadas são comparadas e usadas para situar cada tipo de investidor.
A análise empírica realizada mostra que, à medida que as empresas crescem e envelhecem, a estrutura acionista e de capital altera-se. De modo geral, a presença dos investidores externos cresce. Tal faz-se notar pelo aumento do nível de dívida, em percentagem da totalidade do capital investido, enquanto a participação de investidores externos no capital próprio também aumenta. Por último, os investidores identificados no ciclo-de-vida, tendem a financiar empresas nas fases de desenvolvimento esperadas segundo a literatura.This research work examines the presence of several investor types along the life-cycle of Portuguese firms, alongside the shareholder and capital structure. By using stylized financial growth cycles found in Berger and Udell (1998) and Caselli (2009), it was possible to build an alternative example that sets predictions for the sequencing of investors in the development of firms. Size and age variables of financed Portuguese companies are compared and used to situate each investor type.
The empirical analysis shows that, as firms become larger and older, the shareholder and capital structure change. Overall, outside investors increase their presence over the life-cycle. The level of debt tends to grow in the global structure, while, at the same time, the participation of outside investors in the equity also rises. Finally, investors tend to finance companies in the stages of development as expected by literature
Una lectura de la instalación Los textos (aula-historia-muerte)
No presenta resumen
- …