2,094 research outputs found

    Classification and Scoring of Protein Complexes

    Get PDF
    Proteins interactions mediate all biological systems in a cell; understanding their interactions means understanding the processes responsible for human life. Their structure can be obtained experimentally, but such processes frequently fail at determining structures of protein complexes. To address the issue, computational methods have been developed that attempt to predict the structure of a protein complex, using information of its constituents. These methods, known as docking, generate thousands of possible poses for each complex, and require effective and reliable ways to quickly discriminate the correct pose among the set of incorrect ones. In this thesis, a new scoring function was developed that uses machine learning techniques and features extracted from the structure of the interacting proteins, to correctly classify and rank the putative poses. The developed function has shown to be competitive with current state-of-the-art solutions

    Otimização da estrutura de geradores eletromagnéticos

    Get PDF
    The importance of autonomous energy harvesting systems has been rising among the scientific community. These systems are seen as the answer for the dissatisfaction felt towards the actual energy harvesting devices. Different approaches to modulate, simulate, and analyse the mechanical and electrical dynamics of these transductors are described in the literature. However, no methodology has been proved effective in the optimization of these non linear generators’ performance, especially in what the occurrence of different excitations than the ones to which it was geometrically projected is concerned. The present thesis focus in the optimization of energy harvesting from the oscillations of magnetic levitation. The main goal of this work is to maximize the harvesters’ performance. This was accomplished through the development of a geometric optimization tool, by means of a sophisticated method that controls the levitating magnet’s dynamics for either a priori known or variable frequencies. Based on a model that analytically approaches the fundamental dynamics of these harvesters, the frequency, acceleration, length of the generator and mass of the levitating magnet(s) were varied. The optimal adaptive length was examined, which allowed a higher efficiency when faced with variations in the excitation patterns.A importância dos sistemas de geração autónoma de energia tem vindo a crescer significativamente na comunidade científica, visando solucionar a insatisfação perante as soluções atuais de fornecimento de energia. Este trabalho foca-se na otimização dos sistemas eletromagnéticos de geração de energia com arquitetura em levitação magnética. Na literatura estão descritos diferentes tipos de abordagens para modular, simular e analisar a dinâmica das componentes mecânica e elétrica destes transdutores. Contudo, nenhuma metodologia se mostrou adequada para otimizar o desempenho destes geradores não lineares, principalmente na ocorrência de excitações diferentes da qual foi geometricamente projetado. O principal objetivo deste estudo é a maximização do desempenho destes geradores, através do desenvolvimento de uma metodologia de otimização geométrica. Desenvolveu-se uma ferramenta de otimização para controlar a dinâmica do(s) íman(es) em levitação, tanto para excitações conhecidas a priori, como para excitações variáveis. Usando um modelo que aborda analiticamente a dinâmica fundamental destes geradores, foi variada a frequência, aceleração, comprimento do gerador e a massa do(s) íman(es) em levitação. O comprimento adaptativo ótimo foi explorado a partir da análise paramétrica, permitindo deste modo obter maiores eficiências face a variações nos padrões de excitação.Mestrado em Engenharia Mecânic

    Extensive intragenic recombination and patterns of linkage disequilibrium at the CSN3 locus in European rabbit

    Get PDF
    Kappa-casein (CSN3) plays an important role in stabilising the Ca-sensitive caseins in the micelle. The European rabbit (Oryctolagus cuniculus) CSN3 has previously been shown to possess two alleles (A and B), which differ deeply in their intronic regions (indels of 100 and 1550 nucleotides in introns 1 and 4, respectively). Furthermore, a correlation between several reproductive performance traits and the different alleles was described. However, all these data were exclusively collected in rabbit domestic breeds, preventing a deeper understanding of the extensive polymorphism observed in the CSN3 gene. Additionally, the techniques available for the typing of both indel polymorphisms were until now not suitable for large-scale studies. In this report, we describe a simple, PCR-based typing method to distinguish rabbit CSN3 alleles. We analyse both ancient wild rabbit populations from the Iberian Peninsula and France, and the more recently derived English wild rabbits and domestic stocks. A new allele (C) showing another major indel (250 bp) in intron 1 was found, but exclusively detected in Iberian wild rabbits. In addition, our survey revealed the occurrence of new haplotypes in wild populations, suggesting that intragenic recombination is important in creating genetic diversity at this locus. This easy and low cost single-step PCR-based method results in an improvement over previous described techniques, can be easily set up in a routine molecular laboratory and would probably be a valuable tool in the management of rabbit domestic breeds

    Feature selection strategies for improving data-driven decision support in bank telemarketing

    Get PDF
    The usage of data mining techniques to unveil previously undiscovered knowledge has been applied in past years to a wide number of domains, including banking and marketing. Raw data is the basic ingredient for successfully detecting interesting patterns. A key aspect of raw data manipulation is feature engineering and it is related with the correct characterization or selection of relevant features (or variables) that conceal relations with the target goal. This study is particularly focused on feature engineering, aiming at the unfolding features that best characterize the problem of selling long-term bank deposits through telemarketing campaigns. For the experimental setup, a case-study from a Portuguese bank, ranging the 2008-2013 year period and encompassing the recent global financial crisis, was addressed. To assess the relevance of such problem, a novel literature analysis using text mining and the latent Dirichlet allocation algorithm was conducted, confirming the existence of a research gap for bank telemarketing. Starting from a dataset containing typical telemarketing contacts and client information, research followed three different and complementary strategies: first, by enriching the dataset with social and economic context features; then, by including customer lifetime value related features; finally, by applying a divide and conquer strategy for splitting the problem in smaller fractions, leading to optimized sub-problems. Each of the three approaches improved previous results in terms of model metrics related to prediction performance. The relevance of the proposed features was evaluated, confirming the obtained models as credible and valuable for telemarketing campaign managers.A utilização de técnicas de data mining para a descoberta de conhecimento tem sido aplicada nos últimos anos a uma grande variedade de domínios, incluindo banca e marketing. Os dados no seu estado primitivo constituem o ingrediente básico para a deteção de padrões de informação. Um aspeto chave da manipulação de dados em bruto consiste na "engenharia de atributos", que compreende uma correta definição e seleção de atributos relevantes (ou variáveis) que se relacionem com o alvo da descoberta de conhecimento. Este trabalho foca-se numa abordagem de "engenharia de atributos" para definir as variáveis que melhor caraterizam o problema de vender depósitos bancários a prazo através de campanhas de telemarketing. Sendo um estudo empírico, foi utilizado um caso de estudo de um banco português, abrangendo o período 2008-2013, que inclui os efeitos da crise financeira internacional. Para aferir da importância deste problema, foi realizada uma inovadora análise da literatura recorrendo a text mining e ao algoritmo latent Dirichlet allocation, confirmando a existência de uma lacuna nesta matéria. Utilizando como base um conjunto de dados de contactos de telemarketing e informação sobre os clientes, três estratégias diferentes e complementares foram propostas: primeiro, os dados foram enriquecidos com atributos socioeconómicos; posteriormente, foram adicionadas características associadas ao valor do cliente ao longo do seu tempo de vida; finalmente, o problema foi dividido em problemas mais específicos, permitindo abordagens otimizadas a cada subproblema. Cada abordagem melhorou as métricas associadas à capacidade preditiva do modelo. Adicionalmente, a relevância dos atributos foi avaliada, confirmando os modelos obtidos como credíveis e valiosos para gestores de campanhas de telemarketing

    A machine learning approach to The Big Five Personality Test

    Get PDF
    Dissertação de mestrado em Engenharia InformáticaOne of the most accurate personality assessments available is the Goldberg’s ’The Big Five Personality Test’, which measures the five OCEAN dimensions: Openness, Conscientiousness, Extraversion, Agreeableness and Neuroticism. This assessment is performed by presenting a total of forty adjectives requesting the subject to rate each word using a scale of 1 to 9 indicating whether it accurately (9) describes herself or not (1). Nonetheless, scientific research has shown that this test may, accurately, suggest personality traits such as aggressive reactions, work performance, fitness on specific expertise areas and also mental illnesses. However, one big disadvantage of this test, it simply takes too much time to perform, which can result on undesirable measurements. Indeed, several developments have been done in order to reduce the required effort to perform this test, an example is The Mini Marker Test by Saucier. This study aims to propose a viable shorter alternative to this by applying machine learning techniques, i.e., although measurement precision may be reduced, is it possible to build a much shorter version losing as little precision as possible by just requiring the subject to select the adjectives that characterise him the most? For this study, it was developed a platform to collect data, requesting both the subject to rate each adjective but also to select those he most identifies with. With this, the available data contains both ratings and the selections of the words that most characterise the subject. Three different machine learning architectures are developed and tested. Both regression and classification approaches are considered. The main input for these architectures are the words selected by each evaluated subject. Data collected by this work showed to be insufficient, requiring the use of data augmentation techniques. For this, different versions are proposed, one including the use of frequent itemset mining techniques. The proposed machine learning architectures shown a very high precision, with an RMSE of around 7%. The results show the proposed solutions to be able to perform a shorter version of this test with a minimum precision loss. It was also possible to define a list of common sets of selected words. Further research can be performed mainly on two different streamlines, i.e., strength the data collection process and develop an even shorter version of this test.Uma das avaliações de personalidade mais precisas foi criada por Goldberg, chamada 'The Big Five Personality Test', que mede um total de cinco dimensões denominadas de OCEAN: Openness, Conscientiousness, Extraversion, Agreeableness and Neuroticism. A avaliaçao em causa é realizada apresentando um total de quarenta adjetivos a um individuo solici-tando lhe que classifique cada uma das palavras usando uma escala de a a 9, indicando se esta o descreve de forma exata (9) ou não (1). Assim sendo, estudos científicos sugerem que este teste poderá, de forma precisa, indicar outros traços da personalidade, tais como reações agressivas, desempenho no trabalho, aptidão para áreas de especialidade e doenças mentais. No entanto, uma grande desvantagem deste teste, é que este pode ser demasiado extenso e demorado, podendo gerar resultados indesejados. Na verdade, múltiplos desenvolvimentos foram feitos de modo a reduzir o esforço necessário para a realização do mesmo. Este estudo pretende assim propor uma alternativa mais curta e viável aplicando técnicas de machine learning, isto é, apesar da precisão dos resultados poder ser degradada, é possível construir uma versão muito mais curta com o mínimo possível de degradação da qualidade dos resultados apenas solicitando ao sujeito que este selecione os adjetivos que melhor o caracterizam? Para este estudo, foi desenvolvida uma plataforma para recolha de dados, solicitando ao individuo tanto para classificar cada adjetivo, usando a escala, como também para selecionar aqueles com que este mais se identifica. Assim, os dados disponíveis contém tanto as escalas como a seleção das palavras que mais caracterizam cada um dos sujeitos. Três diferentes arquiteturas de machine learning são desenvolvidas e testadas. Tanto abordagens de regressão como classificação são consideradas. O principal input para estas arquiteturas é a seleção de cada uma das palavras por parte dos sujeitos avaliados. Os dados recolhidos durante este estudo demonstraram ser insuficientes, exigindo o uso de técnicas de data augmentation. Nesse sentido, diferentes versões são propostas, sendo que uma delas incluí o uso de técnicas de frequent itemset mining. As arquiteturas de machine learning propostas apresentaram uma precisão bastante elevada nos resultados, com um RMSE de cerca de 7%. Os resultados obtidos mostram que as soluções propostas são capazes de gerar uma versão reduzida do teste em causa com uma degradação mínima dos resultados. Foi também possível definir uma lista de conjuntos frequentes de palavras selecionadas. Desenvolvimentos futuros podem ser feitos em duas direções distintas, isto é, melhorar o processo de recolha de dados ou desenvolver uma versão ainda mais reduzida deste teste

    The effect of physical strength on persuasion attempts between two parties

    Get PDF
    This article studies the impact of communicator and recipient physical strength on persuasion under a context of purchase. It consists of measuring purchase intentions of individuals with various levels of self-reported physical strength under the same context of purchase with three different conditions. Each of these conditions is defined by a picture of an advisor with a different body physique and muscularity. Results showed that advisor physical strength played a significant role among weak and strong individuals but not on medium ones, increasing purchase intentions on these categories. Lastly, several possibly explanatory variables were explored (e.g. Confidence, Attractiveness) as well as potential mediators on vigilance against persuasion

    Investors along the company life-cycle : evidence for Portugal

    Get PDF
    Este trabalho de pesquisa examina a presença dos investidores ao longo do ciclo-de-vida das empresas portuguesas, juntamente com a estrutura de capital e acionista. Recorrendo a exemplos estilizados do ciclo financeiro das empresas, existentes nas obras de Berger e Udell (1998) e Caselli (2009), foi possível criar um exemplo alternativo que estabelece previsões para o sequenciamento dos investidores ao longo do desenvolvimento das empresas. Variáveis de tamanho e idade das sociedades financiadas são comparadas e usadas para situar cada tipo de investidor. A análise empírica realizada mostra que, à medida que as empresas crescem e envelhecem, a estrutura acionista e de capital altera-se. De modo geral, a presença dos investidores externos cresce. Tal faz-se notar pelo aumento do nível de dívida, em percentagem da totalidade do capital investido, enquanto a participação de investidores externos no capital próprio também aumenta. Por último, os investidores identificados no ciclo-de-vida, tendem a financiar empresas nas fases de desenvolvimento esperadas segundo a literatura.This research work examines the presence of several investor types along the life-cycle of Portuguese firms, alongside the shareholder and capital structure. By using stylized financial growth cycles found in Berger and Udell (1998) and Caselli (2009), it was possible to build an alternative example that sets predictions for the sequencing of investors in the development of firms. Size and age variables of financed Portuguese companies are compared and used to situate each investor type. The empirical analysis shows that, as firms become larger and older, the shareholder and capital structure change. Overall, outside investors increase their presence over the life-cycle. The level of debt tends to grow in the global structure, while, at the same time, the participation of outside investors in the equity also rises. Finally, investors tend to finance companies in the stages of development as expected by literature

    Una lectura de la instalación Los textos (aula-historia-muerte)

    Get PDF
    No presenta resumen
    corecore