6 research outputs found

    Gene function finding through cross-organism ensemble learning

    Get PDF
    Background: Structured biological information about genes and proteins is a valuable resource to improve discovery and understanding of complex biological processes via machine learning algorithms. Gene Ontology (GO) controlled annotations describe, in a structured form, features and functions of genes and proteins of many organisms. However, such valuable annotations are not always reliable and sometimes are incomplete, especially for rarely studied organisms. Here, we present GeFF (Gene Function Finder), a novel cross-organism ensemble learning method able to reliably predict new GO annotations of a target organism from GO annotations of another source organism evolutionarily related and better studied. Results: Using a supervised method, GeFF predicts unknown annotations from random perturbations of existing annotations. The perturbation consists in randomly deleting a fraction of known annotations in order to produce a reduced annotation set. The key idea is to train a supervised machine learning algorithm with the reduced annotation set to predict, namely to rebuild, the original annotations. The resulting prediction model, in addition to accurately rebuilding the original known annotations for an organism from their perturbed version, also effectively predicts new unknown annotations for the organism. Moreover, the prediction model is also able to discover new unknown annotations in different target organisms without retraining.We combined our novel method with different ensemble learning approaches and compared them to each other and to an equivalent single model technique. We tested the method with five different organisms using their GO annotations: Homo sapiens, Mus musculus, Bos taurus, Gallus gallus and Dictyostelium discoideum. The outcomes demonstrate the effectiveness of the cross-organism ensemble approach, which can be customized with a trade-off between the desired number of predicted new annotations and their precision.A Web application to browse both input annotations used and predicted ones, choosing the ensemble prediction method to use, is publicly available at http://tiny.cc/geff/. Conclusions: Our novel cross-organism ensemble learning method provides reliable predicted novel gene annotations, i.e., functions, ranked according to an associated likelihood value. They are very valuable both to speed the annotation curation, focusing it on the prioritized new annotations predicted, and to complement known annotations available

    Políticas de Copyright de Publicações Científicas em Repositórios Institucionais: O Caso do INESC TEC

    Get PDF
    A progressiva transformação das práticas científicas, impulsionada pelo desenvolvimento das novas Tecnologias de Informação e Comunicação (TIC), têm possibilitado aumentar o acesso à informação, caminhando gradualmente para uma abertura do ciclo de pesquisa. Isto permitirá resolver a longo prazo uma adversidade que se tem colocado aos investigadores, que passa pela existência de barreiras que limitam as condições de acesso, sejam estas geográficas ou financeiras. Apesar da produção científica ser dominada, maioritariamente, por grandes editoras comerciais, estando sujeita às regras por estas impostas, o Movimento do Acesso Aberto cuja primeira declaração pública, a Declaração de Budapeste (BOAI), é de 2002, vem propor alterações significativas que beneficiam os autores e os leitores. Este Movimento vem a ganhar importância em Portugal desde 2003, com a constituição do primeiro repositório institucional a nível nacional. Os repositórios institucionais surgiram como uma ferramenta de divulgação da produção científica de uma instituição, com o intuito de permitir abrir aos resultados da investigação, quer antes da publicação e do próprio processo de arbitragem (preprint), quer depois (postprint), e, consequentemente, aumentar a visibilidade do trabalho desenvolvido por um investigador e a respetiva instituição. O estudo apresentado, que passou por uma análise das políticas de copyright das publicações científicas mais relevantes do INESC TEC, permitiu não só perceber que as editoras adotam cada vez mais políticas que possibilitam o auto-arquivo das publicações em repositórios institucionais, como também que existe todo um trabalho de sensibilização a percorrer, não só para os investigadores, como para a instituição e toda a sociedade. A produção de um conjunto de recomendações, que passam pela implementação de uma política institucional que incentive o auto-arquivo das publicações desenvolvidas no âmbito institucional no repositório, serve como mote para uma maior valorização da produção científica do INESC TEC.The progressive transformation of scientific practices, driven by the development of new Information and Communication Technologies (ICT), which made it possible to increase access to information, gradually moving towards an opening of the research cycle. This opening makes it possible to resolve, in the long term, the adversity that has been placed on researchers, which involves the existence of barriers that limit access conditions, whether geographical or financial. Although large commercial publishers predominantly dominate scientific production and subject it to the rules imposed by them, the Open Access movement whose first public declaration, the Budapest Declaration (BOAI), was in 2002, proposes significant changes that benefit the authors and the readers. This Movement has gained importance in Portugal since 2003, with the constitution of the first institutional repository at the national level. Institutional repositories have emerged as a tool for disseminating the scientific production of an institution to open the results of the research, both before publication and the preprint process and postprint, increase the visibility of work done by an investigator and his or her institution. The present study, which underwent an analysis of the copyright policies of INESC TEC most relevant scientific publications, allowed not only to realize that publishers are increasingly adopting policies that make it possible to self-archive publications in institutional repositories, all the work of raising awareness, not only for researchers but also for the institution and the whole society. The production of a set of recommendations, which go through the implementation of an institutional policy that encourages the self-archiving of the publications developed in the institutional scope in the repository, serves as a motto for a greater appreciation of the scientific production of INESC TEC

    Anuário Científico – 2011 Resumos de Artigos, Comunicações, Livros e Monografias de Mestrado

    Get PDF
    Há mais de uma década que o ISEL vem firmando a sua aposta na busca e na divulgação do conhecimento científico na área da Engenharia, assentes na inovação e no desenvolvimento de novas tecnologias, procurando que os resultados alcançados nos projetos de investigação tenham impacto na indústria e na vida dos cidadãos como forma de responder às necessidades cada vez mais complexas e exigentes da sociedade no seu todo. Nesta relação, o ISEL tem contribuído para a evolução da produção e do conhecimento científicos, assumindo, por vezes numa posição de vanguarda, ora em iniciativa própria ora em parceria com diversas instituições, quer de ensino quer do tecido empresarial. Como forma de dar visibilidade ao trabalho desenvolvido pelos docentes (com afiliação ISEL) e alunos do ISEL, o Anuário Científico tornou-se num meio de divulgação privilegiado, estando disponível em acesso livre a toda a comunidade científica mas também a todos os cidadãos, podendo ser consultado em formato eletrónico no sítio institucional do ISEL, bem como no Repositório Científico do Instituto Polítécnico de Lisboa.1 Fazendo uma análise comparativa em relação às publicações referentes a 2009 e a 2010, constata-se que o número de publicações duplicou em 2011

    Anuário Científico – 2009 & 2010 Resumos de Artigos, Comunicações, Teses, Patentes, Livros e Monografias de Mestrado

    Get PDF
    O Conselho Técnico-Científico do Instituto Superior de Engenharia de Lisboa (ISEL), na senda da consolidação da divulgação do conhecimento e da ciência desenvolvidos pelo nosso corpo docente, propõe-se publicar mais uma edição do Anuário Científico, relativa à produção científica de 2009 e 2010. A investigação, enquanto vertente estratégica do Instituto Superior de Engenharia de Lisboa (ISEL), tem concorrido para o seu reconhecimento nacional e internacional como instituição de referência e de qualidade na área do ensino das engenharias. É também nesta vertente que o ISEL consubstancia a sua ligação à sociedade portuguesa e internacional através da transferência de tecnologia e de conhecimento, resultantes da sua atividade científica e pedagógica, contribuindo para o seu desenvolvimento e crescimento de forma sustentada. São parte integrante do Anuário Científico todos os conteúdos com afiliação ISEL resultantes de resumos de artigos publicados em livros, revistas e atas de congressos que os docentes do ISEL apresentaram em fóruns e congressos nacionais e internacionais, bem como teses e patentes. Desde 2002, ano da publicação da primeira edição, temos assistido a uma evolução crescente do número de publicações de conteúdos científicos, fruto do trabalho desenvolvido pelos docentes que se têm empenhado com afinco e perseverança. Contudo, nestes dois anos (2009 e 2010) constatou-se um decréscimo no número de publicações, principalmente em 2010. Uma das causas poderá estar diretamente relacionada com a redução do financiamento ao ensino superior uma vez que limita toda a investigação no âmbito da atividade de I&D e da produção científica. Na sequência da implementação do Processo de Bolonha em 2006, o ISEL promoveu a criação de cursos de Mestrado disponibilizando uma oferta educativa mais completa e diversificada aos seus alunos, mas também de outras instituições, dotando-os de competências inovadoras apropriadas ao mercado de trabalho que hoje se carateriza mais competitivo e dinâmico. Terminados os períodos escolar e de execução das monografias dos alunos, os resumos destas são igualmente parte integrante deste Anuário, no que concerne à conclusão dos Mestrados em 2009 e 2010.A fim de permitir uma maior acessibilidade à comunidade científica e à sociedade civil, o Anuário Científico será editado de ora avante em formato eletrónico. Excecionalmente esta edição contempla publicações referentes a dois anos – 2009 e 2010

    Business Intelligence no suporte ao conceito e à prática de student relationship management em instituições de ensino superior

    Get PDF
    Tese de doutoramento Tecnologias e Sistemas de InformaçãoA promoção do sucesso escolar no ensino superior é um tema da maior relevância, sobretudo devido às significativas taxas de insucesso e de abandono escolar registadas (cerca de 30%). Neste sentido têm sido promovidos e desenvolvidos diversos estudos que pretendem identificar e analisar as causas do insucesso escolar, bem como têm sido desenvolvidos programas e medidas que visam a promoção do sucesso. Uma das medidas consiste no acompanhamento adequado e personalizado dos alunos ao longo do seu percurso académico. No entanto, devido às condições existentes na maioria das instituições de ensino superior portuguesas, não tem sido possível assegurar da forma mais eficaz a implementação das actividades e dos mecanismos necessários para assegurar um eficaz processo de acompanhamento dos alunos. Tal deve-se ao facto de não existir na grande maioria das instituições de ensino superior portuguesas uma prática instituída nesse sentido e também porque não existe um adequado suporte tecnológico que efectue a automatização de muitas das actividades envolvidas nessa prática. Defende-se, neste trabalho, que é possível definir e concretizar nas instituições de ensino superior uma prática, tecnologicamente suportada, que permita um acompanhamento personalizado, adequado e eficaz dos alunos ao longo do seu percurso académico e que contribua para a promoção do sucesso escolar. Com este objectivo, propõe-se neste trabalho a definição de um conceito e de uma prática que abarque este entendimento e de um sistema que suporte o conceito, a prática e as actividades nela envolvidas. O sistema proposto é designado por sistema de SRM (Student Relationship Management) e irá suportar o conceito de SRM e a prática de SRM. O sistema de SRM evoluiu a partir dos princípios dos sistemas de CRM (Customer Relationship Management) e é implementado recorrendo a conceitos e tecnologias associadas aos sistemas de Business Intelligence, nomeadamente conceitos e tecnologias associadas aos sistemas de data warehousing, data mining e on-line analytical processing. A validação do conceito e da prática de SRM foi efectuada adoptando uma metodologia de investigação baseada nos princípios da Grounded Theory e que integrou a realização e a análise de entrevistas. A validação do sistema de SRM foi efectuada adoptando uma metodologia baseada numa prova de conceito. Nesta foi implementado um protótipo do sistema de SRM, cuja utilidade é atestada através de um conjunto de casos de demonstração que ocorreram em contexto real. O protótipo demonstrou a exequibilidade do sistema de SRM e os casos de demonstração evidenciaram a sua utilidade no suporte ao conceito e à prática de SRM. Os resultados obtidos confirmam que a concretização da prática de SRM em contexto real, suportada pelo sistema de SRM proposto neste trabalho, contribui para a promoção e para o aumento do sucesso escolar dos alunos, e consequentemente para o sucesso das instituições de ensino superior. Assim, com um efectivo relacionamento instituição-aluno, obtêm-se vantagens para as instituições e para os alunos.The students’ academic success promotion is a subject of great importance in a higher education context. Several studies have been undertaken to identify and to analyze the students’ failure and to propose measures against this problem. One of the actions usually undertaken to promote the students’ success is associated to their closely monitoring and with the approximation of the teacher/tutor to the students’ day-by-day academic activities. Although essential, the implementation of the activities involved in this complex processes does not take place in many higher education institutions mainly due to the lack of institutional practices specifically defined to overcome this problem and also to the lack of an adequate technological support to these practices. To overcome this complex problem, a conceptual and a technological framework were proposed and integrated in a Student Relationship Management system – SRM system. The SRM system emerged as an evolution of the CRM (Customer Relationship Management) systems principles, and supports the SRM concept and the SRM practice, also proposed in this work. The SRM system was implemented using concepts and technologies associated to the Business Intelligence systems, namely data warehousing, data mining and on-line analytical processing technologies. To validate the SRM concept and the SRM practice the principles of the Grounded Theory research methodology were followed and included the concretization of several interviews and their respective analysis. To validate the SRM system it was adopted a methodology based on a proof-of-concept. A prototype of the SRM system was implemented and a set of demonstration cases carried out in real contexts were concretized and analysed. The prototype demonstrates the SRM system feasibility and the demonstration cases show the SRM system usefulness supporting the SRM concept and the SRM practice. The obtained results confirm that the implementation of a SRM practice in real contexts allow the promotion of the students success, being an added value to the students and to the institution. This SRM practice must be properly supported by a SRM system, like the proposed in this thesis
    corecore