8 research outputs found

    Notas sobre Soft Sets - Preliminaries

    Get PDF
    [ES]Muchos problemas de la vida real requieren el uso de datos imprecisos o inciertos. Su análisis debe implicar la aplicación de principios matemáticos capaces de captar estas características. La teoría de los conjuntos difusos supuso un cambio paradigmático en las Matemáticas al permitir la pertenencia parcial. Para una definición y argumentos acerca de su aplicabilidad a varios campos, nos interesa especialmente una generalización de los conjuntos difusos: la aplicación de la teoría de los soft sets y sus extensiones a los problemas de toma de decisiones

    Evaluating Wikipedia as a source of information for disease understanding

    Full text link
    The increasing availability of biological data is improving our understanding of diseases and providing new insight into their underlying relationships. Thanks to the improvements on both text mining techniques and computational capacity, the combination of biological data with semantic information obtained from medical publications has proven to be a very promising path. However, the limitations in the access to these data and their lack of structure pose challenges to this approach. In this document we propose the use of Wikipedia - the free online encyclopedia - as a source of accessible textual information for disease understanding research. To check its validity, we compare its performance in the determination of relationships between diseases with that of PubMed, one of the most consulted data sources of medical texts. The obtained results suggest that the information extracted from Wikipedia is as relevant as that obtained from PubMed abstracts (i.e. the free access portion of its articles), although further research is proposed to verify its reliability for medical studies.Comment: 6 pages, 5 figures, 5 tables, published at IEEE CBMS 2018, 2018 IEEE 31st International Symposium on Computer-Based Medical Systems (CBMS

    Notas sobre N-soft sets – Definiciones

    Get PDF
    [ES]Muchos problemas en los campos de la economía, la informática, la medicina, el medio ambiente y otras ciencias conllevan incertidumbre, imprecisión o subjetividad. Introducida por Molodtsov, la teoría de los soft sets ha demostrado su aplicabilidad a diversos campos. Fatimah et al. proponen el modelo de soft sets ampliado que denominan N-soft sets. Debido a la importancia de las calificaciones en situaciones del mundo real, los N-soft sets introducen descripciones parametrizadas del universo de opciones que dependen de un nu ́mero finito de calificaciones

    Extracting diagnostic knowledge from MedLine Plus: a comparison between MetaMap and cTAKES Approaches

    Get PDF
    The development of diagnostic decision support systems (DDSS) requires having a reliable and consistent knowledge base about diseases and their symptoms, signs and diagnostic tests. Physicians are typically the source of this knowledge, but it is not always possible to obtain all the desired information from them. Other valuable sources are medical books and articles describing the diagnosis of diseases, but again, extracting this information is a hard and time-consuming task. In this paper we present the results of our research, in which we have used Web scraping, natural language processing techniques, a variety of publicly available sources of diagnostic knowledge and two widely known medical concept identifiers, MetaMap and cTAKES, to extract diagnostic criteria for infectious diseases from MedLine Plus articles. A performance comparison of MetaMap and cTAKES is also presented

    Compressão e análise de dados genómicos

    Get PDF
    Doutoramento em InformáticaGenomic sequences are large codi ed messages describing most of the structure of all known living organisms. Since the presentation of the rst genomic sequence, a huge amount of genomics data have been generated, with diversi ed characteristics, rendering the data deluge phenomenon a serious problem in most genomics centers. As such, most of the data are discarded (when possible), while other are compressed using general purpose algorithms, often attaining modest data reduction results. Several speci c algorithms have been proposed for the compression of genomic data, but unfortunately only a few of them have been made available as usable and reliable compression tools. From those, most have been developed to some speci c purpose. In this thesis, we propose a compressor for genomic sequences of multiple natures, able to function in a reference or reference-free mode. Besides, it is very exible and can cope with diverse hardware speci cations. It uses a mixture of nite-context models (FCMs) and eXtended FCMs. The results show improvements over state-of-the-art compressors. Since the compressor can be seen as a unsupervised alignment-free method to estimate algorithmic complexity of genomic sequences, it is the ideal candidate to perform analysis of and between sequences. Accordingly, we de ne a way to approximate directly the Normalized Information Distance, aiming to identify evolutionary similarities in intra- and inter-species. Moreover, we introduce a new concept, the Normalized Relative Compression, that is able to quantify and infer new characteristics of the data, previously undetected by other methods. We also investigate local measures, being able to locate speci c events, using complexity pro les. Furthermore, we present and explore a method based on complexity pro les to detect and visualize genomic rearrangements between sequences, identifying several insights of the genomic evolution of humans. Finally, we introduce the concept of relative uniqueness and apply it to the Ebolavirus, identifying three regions that appear in all the virus sequences outbreak but nowhere in the human genome. In fact, we show that these sequences are su cient to classify di erent sub-species. Also, we identify regions in human chromosomes that are absent from close primates DNA, specifying novel traits in human uniqueness.As sequências genómicas podem ser vistas como grandes mensagens codificadas, descrevendo a maior parte da estrutura de todos os organismos vivos. Desde a apresentação da primeira sequência, um enorme número de dados genómicos tem sido gerado, com diversas características, originando um sério problema de excesso de dados nos principais centros de genómica. Por esta razão, a maioria dos dados é descartada (quando possível), enquanto outros são comprimidos usando algoritmos genéricos, quase sempre obtendo resultados de compressão modestos. Têm também sido propostos alguns algoritmos de compressão para sequências genómicas, mas infelizmente apenas alguns estão disponíveis como ferramentas eficientes e prontas para utilização. Destes, a maioria tem sido utilizada para propósitos específicos. Nesta tese, propomos um compressor para sequências genómicas de natureza múltipla, capaz de funcionar em modo referencial ou sem referência. Além disso, é bastante flexível e pode lidar com diversas especificações de hardware. O compressor usa uma mistura de modelos de contexto-finito (FCMs) e FCMs estendidos. Os resultados mostram melhorias relativamente a compressores estado-dearte. Uma vez que o compressor pode ser visto como um método não supervisionado, que não utiliza alinhamentos para estimar a complexidade algortímica das sequências genómicas, ele é o candidato ideal para realizar análise de e entre sequências. Em conformidade, definimos uma maneira de aproximar directamente a distância de informação normalizada (NID), visando a identificação evolucionária de similaridades em intra e interespécies. Além disso, introduzimos um novo conceito, a compressão relativa normalizada (NRC), que é capaz de quantificar e inferir novas características nos dados, anteriormente indetectados por outros métodos. Investigamos também medidas locais, localizando eventos específicos, usando perfis de complexidade. Propomos e exploramos um novo método baseado em perfis de complexidade para detectar e visualizar rearranjos genómicos entre sequências, identificando algumas características da evolução genómica humana. Por último, introduzimos um novo conceito de singularidade relativa e aplicamo-lo ao Ebolavirus, identificando três regiões presentes em todas as sequências do surto viral, mas ausentes do genoma humano. De facto, mostramos que as três sequências são suficientes para classificar diferentes sub-espécies. Também identificamos regiões nos cromossomas humanos que estão ausentes do ADN de primatas próximos, especificando novas características da singularidade humana

    Políticas de Copyright de Publicações Científicas em Repositórios Institucionais: O Caso do INESC TEC

    Get PDF
    A progressiva transformação das práticas científicas, impulsionada pelo desenvolvimento das novas Tecnologias de Informação e Comunicação (TIC), têm possibilitado aumentar o acesso à informação, caminhando gradualmente para uma abertura do ciclo de pesquisa. Isto permitirá resolver a longo prazo uma adversidade que se tem colocado aos investigadores, que passa pela existência de barreiras que limitam as condições de acesso, sejam estas geográficas ou financeiras. Apesar da produção científica ser dominada, maioritariamente, por grandes editoras comerciais, estando sujeita às regras por estas impostas, o Movimento do Acesso Aberto cuja primeira declaração pública, a Declaração de Budapeste (BOAI), é de 2002, vem propor alterações significativas que beneficiam os autores e os leitores. Este Movimento vem a ganhar importância em Portugal desde 2003, com a constituição do primeiro repositório institucional a nível nacional. Os repositórios institucionais surgiram como uma ferramenta de divulgação da produção científica de uma instituição, com o intuito de permitir abrir aos resultados da investigação, quer antes da publicação e do próprio processo de arbitragem (preprint), quer depois (postprint), e, consequentemente, aumentar a visibilidade do trabalho desenvolvido por um investigador e a respetiva instituição. O estudo apresentado, que passou por uma análise das políticas de copyright das publicações científicas mais relevantes do INESC TEC, permitiu não só perceber que as editoras adotam cada vez mais políticas que possibilitam o auto-arquivo das publicações em repositórios institucionais, como também que existe todo um trabalho de sensibilização a percorrer, não só para os investigadores, como para a instituição e toda a sociedade. A produção de um conjunto de recomendações, que passam pela implementação de uma política institucional que incentive o auto-arquivo das publicações desenvolvidas no âmbito institucional no repositório, serve como mote para uma maior valorização da produção científica do INESC TEC.The progressive transformation of scientific practices, driven by the development of new Information and Communication Technologies (ICT), which made it possible to increase access to information, gradually moving towards an opening of the research cycle. This opening makes it possible to resolve, in the long term, the adversity that has been placed on researchers, which involves the existence of barriers that limit access conditions, whether geographical or financial. Although large commercial publishers predominantly dominate scientific production and subject it to the rules imposed by them, the Open Access movement whose first public declaration, the Budapest Declaration (BOAI), was in 2002, proposes significant changes that benefit the authors and the readers. This Movement has gained importance in Portugal since 2003, with the constitution of the first institutional repository at the national level. Institutional repositories have emerged as a tool for disseminating the scientific production of an institution to open the results of the research, both before publication and the preprint process and postprint, increase the visibility of work done by an investigator and his or her institution. The present study, which underwent an analysis of the copyright policies of INESC TEC most relevant scientific publications, allowed not only to realize that publishers are increasingly adopting policies that make it possible to self-archive publications in institutional repositories, all the work of raising awareness, not only for researchers but also for the institution and the whole society. The production of a set of recommendations, which go through the implementation of an institutional policy that encourages the self-archiving of the publications developed in the institutional scope in the repository, serves as a motto for a greater appreciation of the scientific production of INESC TEC

    Insights into bacterial colony morphology evolution and diversification during infection development in cystic fibrosis

    Get PDF
    Tese de Doutoramento em Engenharia Biomédica.Pseudomonas aeruginosa infections are the major cause of high morbidity and mortaiity in cystic fibrosis (CF) patients. Despite the long and aggressive antibiotic treatments, P. aeruginosa still persists causing chronic infections. Its Iong-persistence is due to sophisticated mechanisms of adaptation, including cional diversification into specialized CF-adapted phenotypes. While CF community awaits the development of effective therapies targeting conductance regulator mutations, the gold standard of CF disease management is the eradication of P. aeruginosa from CF lungs as soon as detected. Early eradication of P. aeruginosa avoids or, at ieast, retards the development of chronic infections preserving lung function. But to achieve a successful eradication, it is need understanding the eariy adaptations mechanisms used by P. aeruginosa for antimicrobial agents target them. Up to now these mechanisms are unclear. Being so, this project aimed to determine the early adaptations undergone by P. aeruginosa after CF lungs colonization and their driven forces in several clinical scenarios. Alterations in colony morphology are one of the indicators of cional diversification of bacteria in CF iungs and are also associated with different virulence factors expression and antibiotic resistance. Therefore, it was take the advantage of this macroscopic feature of P. aeruginosa to monitor its evolution in CF environment after in vitro initial colonization. Despite its potential, colony morphology characterisation method exhibit has some restrictions, such as the unclear impact of the experimental parameters in colony morphogenesis and detection of colony diversity, variability of vocabulary and inconsistent concepts about morphoiogical traits and the time to return results. Therefore, before analysing P. aeruginosa clonal diversification in CF environment, it was attempted to introduce some improvements on this method related to standardisation of the experimental parameters and vocabulary and speed up colony analysis in three different studies. The results of the first study demonstrated that ali experimental parameters anaiysed, including colony growth time, colony density per plate, culture media, bacterial mode of growth and bacterial genetic background influenced colony morphogenesis and the detection of bacterial diversity. Therefore, a set of guidelines was created and proposed to clinical community in order to standardise the experimental parameters. Further, a morphological classification system to unambiguously characterise and describe bacterial colonies was constructed based on literature. The system was deeply tested and demonstrated to be accurate for bacterial colonies characterisation. The third study, it was aimed to introduce some quickness and highthroughput features to coiony morpholog' characterisation verifying whether MALDI-TOF MS could distinguished morphotypes. MALDI-TOF MS colony classification did not totaily match with manual colony characterisation, leading to conclude that MALDI-TOF MS provided additional information about colony variants not visible at naked eye. MALDI-TOF MS cannot thus "replace" colony morphology method but rather complement it. The data obtained in the first study demonstrated that colony morphology characterisation could be used as a reliable method to detect biofilm-derived colony morphotypes. So, it was tried to find out a colony morphology variant characteristic of biofllm lifestyle, which' could be used as a marker of P. aeruginosa bioflim growth and the development of chronic infections. Thrèsults revealed that bioflim population diversity was highly strain-dependent, hindering the unambiguous establishrrent of a coiony variant marker of P. aeruginosa biof'ilms. Nonetheless, small colony variants (SCV) demonstrated to be a strong hint of bioflim growth. In order to investigate the early adaptations undergone by P. aeruginosa after CF Iungs colonisation, bacteria grow in artificial sputum medium during ten days in the presence and absence of ciprofloxacin, an antibiotic often used in CF context. Data revealed that substantial phenotypic diversity is likely to be present in P. aeruginosa populations shortly after CF lungs colonization. Ciprofloxacin concentrations at this simulated early stage of disease demonstrated to play dose-dependent role. lnhibitory concentrations of ciprofloxacin, established based on the MIC of biofllm celI, were effective in bacterial eradication, in contrast to the sub-inhibitory doses that triggered P. aeruginosa diversification into new "fitter" variants. lmpaired swimming motility was one of the first signs of adaptation noticed in ali P. aeruginosa clonal variants, either in the presence or absence of ciprofloxacin. It was speculated that this adaptation was triggered by the environmental CF conditions due to the absence of mutators. Being so, impaired swimming motility was considered a potential disease marker for early P. aeruginosa adaptation and infection development. It was also found that some coiony morphology traits, including sheath, size and colour, could be useful indicators of antimicrobial resistance towards some antibiotics and of some virulence factors expression. During the development of this project the comparison of morphological traits and phenotypic data among colony morphotypes was a hard task. So, to easily perform this kind of analyses it was created a new ontology-based tool for the description of colony morphologies formed by bacteria, called MorphoCol. MorphoCoi establishes and standardises in consistent way the minimum information necessary to describe colony morphotypes and also the phenotypic data related to the colony-forming bacteria. In near future, this knowledgebase will transform the findings of this project and upcoming results related to colony morphology variation into valuable information for clinical decision making. The overali data will have great impact on CF disease management because relevant improvements were introduced in the colony morphology characterisation method that will strengthen clinical diagnosis. Clonai diversification in CF lungs and other host sites could be now better monitored and accurately described. Moreover, the identification of a putative CF disease marker of eariy P. aeruginosa adaptation and infection development will also assist in the design of tailored effective antimicrobial therapies.Pseudomonas aeruginosa é a maior causa das elevadas taxas de morbidez e mortalidade associada a pacientes com fibrose cística (FC). Apesar dos longos e agressivos tratamentos com antibióticos, a P. aeruginosa persiste originando infecções crónicas. A sua longa persistência deve-se a sofisticados mecanismos de adaptação, designadamente a diversificação clonal em fenótipos altamente adaptados às condições de FC. Enquanto a comunidade médica aguarda pelo desenvolvimento de terapias eficazes direcionadas ao regulador mutacional de condutância, o standard terapêutico seguido é a erradicação da P. aeruginosa logo que detetada. A erradicação atempada da P. aeruginosa evita ou, pelo menos retarda, o desenvolvimento de infecções crónicas, preservando assim a função respiratória. Contudo, para obter a erradicação bacteriana é necessário perceber os mecanismos iniciais de adaptação da P. aeruginosa para que os agentes antimicrobianos os possam bloquear. Assim sendo, este projeto pretendeu determinar quais as adaptações iniciais da P. aeruginosa após colonização das vias respiratórias de pacientes com FC e as suas respetivas forças impulsionadoras para diversas situações clínicas. As alterações na morfologia de colónia é um dos indicadores de diversificação clonal das bactérias em ambiente de FC. Estas alterações estão igualmente associadas à expressão diferencial de factores de virulência e à resistência a antibióticos. Assim, utilizou-se esta característica macroscópica da P. aeruginosa para monitorizar a sua evolução e adaptação em ambiente FC. Apesar do seu potencial, a caracterização de morfologia de colónias apresenta algumas restrições, tais como o impacto incerto dos parâmetros experimentais na morfogénese das colónias e na detecção de diversidade de colónias, a variabilidade de vocabulário e conceitos inconsistentes sobre os traços morfológicos, e o tempo de obtenção de resultados. Assim, antes da análise da diversidade clonal da P. aeruginosa em ambiente FC, tentou-se introduzir alguns melhoramentos neste método em três diferentes estudos, nomeadamente na estandardização dos parâmetros experimentais e vocabulário, bem como acelerar a obtenção de resultados. Os resultados do primeiro estudo demonstraram que todos os parâmetros experimentais analisados (tempo de crescimento das colónias, densidade de colónias por placa de cultura, meio de cultura, modo de crescimento bacteriano e os antecedentes genéticos) influenciaram a morfogénese das colónias e na detecção de diversidade bacteriana. Assim sendo, foi elaborado e proposto um conjunto de linhas de orientação para estandardização dos parâmetros experimentais. Posteriormente, foi construído um sistema de classificação para inequivocamente caracterizar a morfologia de colónias com base na literatura. Este sistema foi amplamente testado e demonstrou-se adequado para a caracterização de colónias bacterianas. No terceiro estudo tentou-se introduzir alguma celeridade e aumento do débito de resultados verificando se MALDI-TOF MS seria capaz de distinguir os moríótipos. Esta técnica forneceu uma classificação dos morfótipos ligeiramente diferente comparativamente à classificação manual. Tal, leva a concluir que MALDI-TOF MS fornece informação adicional sobre os morfótipos que não foi observável macroscopicamente. Assim, o MALDITOF MS não pode assim substituir" o método de caracterização manual de morfologia de colónias mas pode ser um método complementar. Os dados obtidos com o primeiro estudo demonstraram que a caracterização de morfologia de colónias pode ser usado na detecção de morfótipos derivados de biofilmes. Assim, tentou-se identificar um variante morfológico característico do crescimento em biofilmes que possa ser posteriormente usado para detectar este modo de crescimento e, consequentemente o desenvolvimento de infecções crónicas. Os resultados revelaram que diversidade população dos biofilmes foi dependente da estirpe, dificultando assim a identificação do variante morfológico característico de biofilme. Ainda assim, verificou-se que as small colony vanants (SCV) são um forte indicador do crescimento séssil. De forma a investigar as adaptações iniciais da P. aeruginosa após colonização de vias respiratórias com FC, as bactérias foram crescidas em muco artificial (MA) na presença e ausência de ciprofloxacina durante 10 dias. Os resultados deste estudo revelaram que é provável a existência de diversidade fenotípica logo após a colonização das vias respiratórias. As diferentes concentrações de ciprofloxacina testadas demonstraram desempenhar uma ação dose-dependente. Concentrações inibitórias, estabelecidas com base na MIC de células de biofilme, foram eficazes na erradicação da P. aeruginosa em MA, contrariamente às concentrações sub-inibitórias. Estas concentrações "acionaram" a diversificação fenotípica em variantes melhor adaptados ao ambiente FC. A limitada capacidade de swimming foi um dos sinais de adaptação inicial da P. aeruginosa verificada em todos os variantes fenótipicos. Foi assim especulado que esta adaptação foi promovida pelas condições típicas de FC devido à ausência de mutators. Como tal, a capacidade limitada de swimming foi considerada um potencial marcador dos estágios iniciais do desenvolvimento de infecções em FC. Foi igualmente verificado que alguns traço morfológicos de colónias, nomeadamente a bainha, tamanho e cor, foram indicadores de alterações na expressão de fatores de virulência e resistência a antibióticos. Durante o desenvolvimento deste projeto a comparação de traços morfológicos das colónias, bem como de dados fenótipos foi uma tarefa árdua. Neste sentido, foi desenvolvida uma base de dados, designada por MorphoCol, para a descrição de morfologia de colónias formadas por bactérias. MorphoCol estabelece e uniformiza a informação mínima necessária de uma forma estruturada e consistente. Num futuro próximo, esta base de dados transformará os resultados deste projeto e outros subsequentes em informação relevante para a tomada de decisão clínica. O conjunto de resultados obtidos neste projeto terá um impacto considerável na gestão clínica da FC devido aos consideráveis melhoramentos introduzidos no método de caracterização de colónias pois fortalecerão o diagnóstico clínico. A diversificação clonal nas vias respiratórias de FC e nos outros locais pode ser assim melhor monitorizada e descrita adequadamente. Para além disso, a identificação de possíveis marcadores para estágios iniciais de adaptação de P. aeruginosa em FC ajudarão na definição de terapias antimicrobianas eficazes

    Memòria del curs acadèmic 2010-2011

    Get PDF
    corecore