2,513 research outputs found

    Information profiles for DNA pattern discovery

    Full text link
    Finite-context modeling is a powerful tool for compressing and hence for representing DNA sequences. We describe an algorithm to detect genomic regularities, within a blind discovery strategy. The algorithm uses information profiles built using suitable combinations of finite-context models. We used the genome of the fission yeast Schizosaccharomyces pombe strain 972 h- for illustration, unveilling locations of low information content, which are usually associated with DNA regions of potential biological interest.Comment: Full version of DCC 2014 paper "Information profiles for DNA pattern discovery

    Query driven sequence pattern mining

    Get PDF
    The discovery of frequent patterns present in biological sequences has a large number of applications, ranging from classification, clustering and understanding sequence structure and function. This paper presents an algorithm that discovers frequent sequence patterns (motifs) present in a query sequence in respect to a database of sequences. The query is used to guide the mining process and thus only the patterns present in the query are reported. Two main types of patterns can be identified: flexible and rigid gap patterns. The user can choose to report all or only maximal patterns. Constraints and Substitution Sets are pushed directly into the mining process. Experimental evaluation shows the efficiency of the algorithm, the usefulness and the relevance of the extracted patterns.Fundação para a Ciência e a Tecnologia (FCT

    Protein sequence pattern mining with constraints

    Get PDF
    Considering the characteristics of biological sequence databases, which typically have a small alphabet, a very long length and a relative small size (several hundreds of sequences), we propose a new sequence mining algorithm (gIL). gIL was developed for linear sequence pattern mining and results from the combination of some of the most efficient techniques used in sequence and itemset mining. The algorithm exhibits a high adaptability, yielding a smooth and direct introduction of various types of features into the mining process, namely the extraction of rigid and arbitrary gap patterns. Both breadth or a depth first traversal are possible. The experimental evaluation, in synthetic and real life protein databases, has shown that our algorithm has superior performance to state-of-the art algorithms. The use of constraints has also proved to be a very useful tool to specify user interesting patternsFundação para a Ciência e a Tecnologia (FCT

    The 'S' Word: The Spectre of Syphilis within Middle-Class Marriage in Late Victorian and Edwardian Britain

    Get PDF
    The years between 1870 and 1914 witnessed profound shifts in the medical understanding of, social responses to, and cultural representations of syphilis and its sufferers. Prostitutes had traditionally been recognised as the primary carriers of disease and men their ‘unsuspecting victims.’ However, responsibility for the spread of syphilis into middle-class homes had been redistributed across the gender divide by the end of the century. This thesis charts the changing medical and social attitudes towards the conjugal and congenital transmission of syphilis during the fin-de-siècle and the effects of these changes upon the construction of middle-class male identity and gender relations

    Suporte à Decisão em Tecnologias de Comunicação : um caso com utilização de metodologias OLAP e Data Mining

    Get PDF
    Este artigo descreve um Sistema de Apoio à Decisão capaz de fornecer informação precisa e de qualidade sobre as comunicações na Electricidade Dos Açores (EDA). A decisão imediata a apoiar consistia em saber se as comunicações entre ilhas deveriam passar para tecnologias Voice over IP (VoIP), um serviço actualmente contratado a uma empresa de comunicações externa. Num projecto de business intelligence e usando tecnologias Microsoft SQL Server, o sistema lê e pré-processa ficheiros CSV de grande dimensão, recebidas da empresa de comunicações, combina esses dados com bases de dados existentes e apresenta os resultados sobre a forma de cubos multidimensionais. Posteriormente, este trabalho foi integrado num projecto de data minig, usando a metodologia CRISP-DM, tendo sido possível além de apoiar a decisão pretendida identificar situações ineficientes e mesmo de utilização fraudulenta de equipamentos de comunicação. Vários modelos foram construídos e disponibilizados a diferentes decisores para apoiar decisões estratégicas e de controlo.info:eu-repo/semantics/publishedVersio

    Business intelligence no suporte a decisões sobre comunicações: descrição de um caso.

    Get PDF
    O projecto descrito tem o objectivo de apoiar decisões de investimento em infraestruturas de comunicação na Electricidade Dos Açores (EDA), a empresa responsável pela geração, transporte e venda de corrente eléctrica na Região Autónoma dos Açores. A decisão imediata a apoiar consistia em saber se as comunicações entre ilhas deveriam passar para tecnologias Voice over IP (VoIP), um serviço actualmente contratado em regime de outsourcing. Foi estabelecido um projecto de business intelligence, usando tecnologias OLAP do Microsoft SQL Server, para ler e pré-processar os ficheiros CSV de grande dimensão, combinar esses dados com bases de dados existentes e apresentar os resultados sobre a forma de cubos multidimensionais. Posteriormente, implementaram-se igualmente algoritmos de data mining, integrando na metodologia CRISP-DM as duas técnicas utilizadas. Construindo vários modelos foi possível, além de apoiar a decisão pretendida, identificar situações ineficientes e mesmo fraudulentas. Os modelos construídos foram ainda disponibilizados aos decisores estratégicos e de controlo, assim como toda a estrutura de reutilização, manutenção e realimentação que suporta o OLAP e os modelos de data mining.ABSTRACT: This project addresses decisions of investment on communication infrastructures in Electricidade dos Açores (EDA), the local Electric Company in the Azores Islands. The main decision was that EDA communications should be moving to Voice over IP (VoIP) from present telephone lines, outsourced to an external communications company. At the beginning, a business intelligence project was set, with the objective of getting data from the communications company and analyzing it in order to offer useful information to decision makers. The system uses Microsoft SQL server technologies to establish an OnLine Analytical Processing (OLAP) application. It translates big CSV flat files in a ROLAP infrastructure and presents the results as multidimensional data cubes. Latter some data mining models were implemented and both techniques were incorporated in the CRISP-DM process model. Different models identified several inefficient procedures and even fraud situations as long as supporting the investment decision. These models as long as all the technology developed for gathering data, maintain an manage the OLAP cubes and data mining models were made available to control and strategic decision makers

    Suporte à decisão em tecnologias de comunicação: utilização de OLAP e data mining.

    Get PDF
    3ª Conferência Ibérica de Sistemas e Tecnologias de Informação (CISTI 2008), 19 a 21 de Junho de 2008, organizada pela Universidad de Vigo.Este artigo descreve um Sistema de Apoio à Decisão capaz de fornecer informação precisa e de qualidade sobre as comunicações na Electricidade Dos Açores (EDA). A decisão imediata a apoiar consistia em saber se as comunicações entre ilhas deveriam passar para tecnologias Voice over IP (VoIP), um serviço actualmente contratado a uma empresa de comunicações externa. Num projecto de business intelligence e usando tecnologias Microsoft SQL server, o sistema lê e pré-processa ficheiros CSV de grande dimensão, recebidas da empresa de comunicações, combina esses dados com bases de dados existentes e apresenta os resultados sobre a forma de cubos multidimensionais. Posteriormente, este trabalho foi integrado num projecto de data minig, usando a metodologia CRISP-DM, tendo sido possível além de apoiar a decisão pretendida identificar situações ineficientes e mesmo de utilização fraudulenta de equipamentos de comunicação. Vários modelos foram construídos e disponibilizados a diferentes decisores para apoiar decisões estratégicas e de controlo

    Classifying heart sounds using multiresolution time series motifs : an exploratory study

    Get PDF
    The aim of this work is to describe an exploratory study on the use of a SAX-based Multiresolution Motif Discovery method for Heart Sound Classification. The idea of our work is to discover relevant frequent motifs in the audio signals and use the discovered motifs and their frequency as characterizing attributes. We also describe different configurations of motif discovery for defining attributes and compare the use of a decision tree based algorithm with random forests on this kind of data. Experiments were performed with a dataset obtained from a clinic trial in hospitals using the digital stethoscope DigiScope. This exploratory study suggests that motifs contain valuable information that can be further exploited for Heart Sound Classification
    corecore