Search CORE

556 research outputs found

Modélisation et comparaison de la structure de gènes

Author: Jammali Safa
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2022
Field of study

La bio-informatique est un domaine de recherche multi-disciplinaire, à la croisée de différents domaines : biologie, médecine, mathématiques, statistiques, chimie, physique et informatique. Elle a pour but de concevoir et d’appliquer des modèles et outils statistiques et computationnels visant l’avancement des connaissances en biologie et dans les sciences connexes. Dans ce contexte, la compréhension du fonctionnement et de l’évolution des gènes fait l’objet de nombreuses études en bio-informatique. Ces études sont majoritairement fondées sur la comparaison des gènes et en particulier sur l’alignement de séquences génomiques. Cependant, dans leurs calculs d’alignement de séquences génomiques, les méthodes existantes se basent uniquement sur la similarité des séquences et ne tiennent pas compte de la structure des gènes. L’alignement prenant en compte la structure des séquences offre l’opportunité d’en améliorer la précision ainsi que les résultats des méthodes développées à partir de ces alignements. C’est dans cette hypothèse que s’inscrit l’objectif de cette thèse de doctorat : proposer des modèles tenant compte de la structure des gènes lors de l’alignement des séquences de familles de gènes. Ainsi, par cette thèse, nous avons contribué à accroître les connaissances scientifiques en développant des modèles d’alignement de séquences biologiques intégrant des informations sur la structure de codage et d’épissage des séquences. Nous avons proposé un algorithme et une nouvelle fonction du score pour l’alignement de séquences codantes d’ADN (CDS) en tenant compte de la longueur des décalages du cadre de traduction. Nous avons aussi proposé un algorithme pour aligner des paires de séquences d’une famille de gènes en considérant leurs structures d’épissage. Nous avons également développé un algorithme pour assembler des alignements épissés par paire en alignements multiples de séquences. Enfin, nous avons développé un outil pour la visualisation d’alignements épissés multiples de famille de gènes. Dans cette thèse, nous avons souligné l’importance et démontré l’utilité de tenir compte de la structure des séquences en entrée lors du calcul de leur alignement

Savoirs UdeS

Développement de méthodes et d’outils chémoinformatiques pour l’analyse et la comparaison de chimiothèques

Author: Le Guilloux Vincent
Publication venue: HAL CCSD
Publication date: 13/12/2013
Field of study

Some news areas in biology ,chemistry and computing interface, have emerged in order to respond the numerous problematics linked to the drug research. This is what this thesis is all about, as an interface gathered under the banner of chimocomputing. Though, new on a human scale, these domains are nevertheless, already an integral part of the drugs and medicines research. As the Biocomputing, his fundamental pillar remains storage, representation, management and the exploitation through computing of chemistry data. Chimocomputing is now mostly used in the upstream phases of drug research. Combining methods from various fields ( chime, computing, maths, apprenticeship, statistics, etc…) allows the implantation of computing tools adapted to the specific problematics and data of chime such as chemical database storage, understructure research, data visualisation or physoco-chimecals and biologics properties prediction.In that multidisciplinary frame, the work done in this thesis pointed out two important aspects, both related to chimocomputing : (1) The new methods development allowing to ease the visualization, analysis and interpretation of data related to set of the molecules, currently known as chimocomputing and (2) the computing tools development enabling the implantation of these methods.De nouveaux domaines ont vu le jour, à l’interface entre biologie, chimie et informatique, afin de répondre aux multiples problématiques liées à la recherche de médicaments. Cette thèse se situe à l’interface de plusieurs de ces domaines, regroupés sous la bannière de la chémo-informatique. Récent à l’échelle humaine, ce domaine fait néanmoins déjà partie intégrante de la recherche pharmaceutique. De manière analogue à la bioinformatique, son pilier fondateur reste le stockage, la représentation, la gestion et l’exploitation par ordinateur de données provenant de la chimie. La chémoinformatique est aujourd’hui utilisée principalement dans les phases amont de la recherche de médicaments. En combinant des méthodes issues de différents domaines (chimie, informatique, mathématique, apprentissage, statistiques, etc.), elle permet la mise en oeuvre d’outils informatiques adaptés aux problématiques et données spécifiques de la chimie, tels que le stockage de l’information chimique en base de données, la recherche par sous-structure, la visualisation de données, ou encore la prédiction de propriétés physico-chimiques et biologiques.Dans ce cadre pluri-disciplinaire, le travail présenté dans cette thèse porte sur deux aspects importants liés à la chémoinformatique : (1) le développement de nouvelles méthodes permettant de faciliter la visualisation, l’analyse et l’interprétation des données liées aux ensembles de molécules, plus communément appelés chimiothèques, et (2) le développement d’outils informatiques permettant de mettre en oeuvre ces méthodes

Thèses en Ligne

HAL-CEA

Étude de données spatio-temporelles pour l’analyse du contrôle environnemental en milieu industriel pharmaceutique

Author: Vielfaure Alexandre
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2020
Field of study

Une quantité importante de procédés industriels sont aujourd’hui monitorés à l’aide de capteurs et d’analyses afin d’avoir de l’information sur l’état des opérations et faciliter la réponse à d’éventuelles déviations. Bien que l’analyse de ces données soit une pratique de plus en plus courante dans l’industrie, l’étude de données spatio-temporelles (avec de l’information répartie à la fois dans l’espace et dans le temps) comportant un important niveau de bruit représente encore un défi. Dans ce projet, des données spatio-temporelles historiques d’un programme de contrôle environnemental en milieu pharmaceutique ont été récoltées pour mieux comprendre les dynamiques de contamination entre les zones aseptiques de productions. Un défi majeur pour l’analyse de ce genre de données est la présence importante de bruit en raison de la rareté des résultats non-nuls et de l’incertitude reliée à la détection de microorganismes. Les objectifs principaux du projet étaient donc l’étude des données spatio-temporelles et le développement d’outils algorithmiques permettant de faciliter l’interprétation des résultats. Dans un premier temps, un nouvel indice de similarité qui utilise une combinaison de la corrélation de Pearson et le « dynamic time warping » a été développé. Cet indice, employé pour la recherche de similarité entre variables, permet de mieux traduire les dynamiques de contamination dans les données de contrôle environnemental. En combinant les résultats des recherches de similarité avec des outils de visualisation, les patrons de contamination entre les différentes zones de productions ont pu facilement être mis en évidence. Dans un second temps, une nouvelle approche multivariée pour l’étude de données spatio-temporelles fortement bruitées à l’aide de l’algorithme MCR-LLM a aussi été explorée. Cette méthode, précédemment développée pour l’analyse de données spectroscopiques, a permis d’extraire des composants représentant les différents patrons de contamination dans les données de contrôle environnemental. L’application de cette méthode a grandement facilité l’étude des données en mettant en évidence les principales dynamiques spatiales présentes et en simplifiant la visualisation des variations temporelles. Les approches présentées peuvent aussi être utilisées sur d’autres jeux de données avec des caractéristiques spatio-temporelles similaires

Savoirs UdeS

Acquisitions d'IRM de diffusion à haute résolution spatiale : nouvelles perspectives grâce au débruitage spatialement adaptatif et angulaire

Author: St-Jean Samuel
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2015
Field of study

Le début des années 2000 a vu la cartographie du génome humain se réaliser après 13 ans de recherche. Le défi du prochain siècle réside dans la construction du connectome humain, qui consiste à cartographier les connexions du cerveau en utilisant l’imagerie par résonance magnétique (IRM) de diffusion. Cette technique permet en effet d’étudier la matière blanche du cerveau de façon complètement non invasive. Bien que le défi soit monumental, la résolution d’une image d’IRM se situe à l’échelle macroscopique et est environ 1000 fois inférieure à la taille des axones qu’il faut cartographier. Pour aider à pallier à ce problème, ce mémoire propose une nouvelle technique de débruitage spécialement conçue pour l’imagerie de diffusion. L’algorithme Non Local Spatial and Angular Matching (NLSAM) se base sur les principes du block matching et du dictionary learning pour exploiter la redondance des données d’IRM de diffusion. Un seuillage sur les voisins angulaire est aussi réalisé à l’aide du sparse coding, où l’erreur de reconstruction en norme l2 est bornée par la variance locale du bruit. L’algorithme est aussi conçu pour gérer le biais du bruit Ricien et Chi non centré puisque les images d’IRM contiennent du bruit non Gaussien. Ceci permet ainsi d’acquérir des données d’IRM de diffusion à une plus grande résolution spatiale que présentement disponible en milieu clinique. Ce travail ouvre donc la voie à un meilleur type d’acquisition, ce qui pourrait contribuer à révéler de nouveaux détails anatomiques non discernables à la résolution spatiale présentement utilisée par la communauté d’IRM de diffusion. Ceci pourrait aussi éventuellement contribuer à identifier de nouveaux biomarqueurs permettant de comprendre les maladies dégénératives telles que la sclérose en plaques, la maladie d’Alzheimer et la maladie de Parkinson

Savoirs UdeS

Contribution à l'analyse des séquences de protéines similarité, clustering et alignement

Author: Kelil Abdellali
Publication venue: 'Universite de Sherbrooke'
Publication date: 01/01/2011
Field of study

La prédiction des fonctions biologiques des protéines est primordiale en biologie cellulaire. On peut comprendre facilement tout l'enjeu de pouvoir différencier efficacement les protéines par leurs fonctions, quand on sait que ceci peut rendre possible la réparation des protéines anormales causants des maladies, ou du moins corriger ou améliorer leurs fonctions. Les méthodes expérimentales, basées sur la structure tridimensionnelle des protéines sont les plus fiables pour la prédiction des fonctions biologiques des protéines. Néanmoins, elles sont souvent coûteuses en temps et en ressources, et ne permettent pas de traiter de grands nombres de protéines. Il existe toutefois des algorithmes qui permettent aux biologistes d'arriver à de bons résultats de prédictions en utilisant des moyens beaucoup moins coûteux. Le plus souvent, ces algorithmes sont basés sur la similarité, le clustering, et l'alignement. Cependant, les algorithmes qui sont basés sur la similarité et le clustering utilisent souvent l'alignement des séquences et ne sont donc pas efficaces sur les protéines non alignables. Et lorsqu'ils ne sont pas basés sur l 'alignement, ces algorithmes utilisent souvent des approches qui ne tiennent pas compte de l'aspect biologique des séquences de protéines. D'autre part, l'efficacité des algorithmes d'alignements dépend souvent de la nature structurelle des protéines, ce qui rend difficile le choix de l'algorithme à utiliser quand la structure est inconnue. Par ailleurs, les algorithmes d'alignement ignorent les divergences entre les séquences à aligner, ce qui contraint souvent les biologistes à traiter manuellement les séquences à aligner, une tâche qui n'est pas toujours possible en pratique. Dans cette thèse nous présentons un ensemble de nouveaux algorithmes que nous avons conçus pour l'analyse des séquences de protéines. Dans le premier chapitre, nous présentons CLUSS, le premier algorithme de clustering capable de traiter des séquences de protéines non-alignables. Dans le deuxième chapitre, nous présentons CLUSS2 une version améliorée de CLUSS, capable de traiter de plus grands ensembles de protéines avec plus de de fonctions biologiques. Dans le troisième chapitre, nous présentons SCS, une nouvelle mesure de similarité capable de traiter efficacement non seulement les séquences de protéines mais aussi plusieurs types de séquences catégoriques. Dans le dernier chapitre, nous présentons ALIGNER, un algorithme d'alignement, efficace sur les séquences de protéines indépendamment de leurs types de structures. De plus, ALIGNER est capable de détecter automatiquement, parmi les protéines à aligner, les groupes de protéines dont l'alignement peut révéler d'importantes propriétés biochimiques structurelles et fonctionnelles, et cela sans faire appel à l'utilisateur

Savoirs UdeS

Société Francophone de Classification (SFC) Actes des 26èmes Rencontres

Author: Couceiro Miguel
Napoli Amedeo
Publication venue: HAL CCSD
Publication date: 01/01/2019
Field of study

National audienceLes actes des rencontres de la Société Francophone de Classification (SFC, http://www.sfc-classification.net/) contiennent l'ensemble des contributions,présentés lors des rencontres entre les 3 et 5 septembre 2019 au Centre de Recherche Inria Nancy Grand Est/LORIA Nancy. La classification sous toutes ces formes, mathématiques, informatique (apprentissage, fouille de données et découverte de connaissances ...), et statistiques, est la thématique étudiée lors de ces journées. L'idée est d'illustrer les différentes facettes de la classification qui reflètent les intérêts des chercheurs dans la matière, provenant des mathématiques et de l'informatique

INRIA a CCSD electronic archive server

L'application des mécanismes d' information retrieval pour la construction automatique des systèmes hypertextes

Author: D'Haeyere Vincent
Publication venue
Publication date: 01/01/1995
Field of study

Repository of the University of Namur

Corridors de demande : modélisation et contributions à l'évaluation du niveau de durabilité

Author: Bahbouh Kinan
Publication venue
Publication date: 01/12/2016
Field of study

RÉSUMÉ Le corridor de transport apparaît dans la littérature comme un concept permettant de traiter à la fois des enjeux traditionnels liés à la mobilité que des impacts et interactions liés au développement durable tels que l’occupation du sol, l’environnement, la santé humaine et le développement économique. L’utilisation du concept dans le domaine du transport n’est pas nouvelle. En effet, il existe une importante littérature qui étudie le corridor en tant que produit économique et politique issu du développement urbain notamment associé à la présence de services et d’infrastructures de transport (offre de transport). Cependant, l’utilisation de ce concept plurivoque dans la planification et l’évaluation de l’offre au niveau urbain demeure encore limitée, compte tenu de l’absence d’une définition claire et d’une approche de modélisation adaptée à la nature des déplacements, très dispersés, dans l’aire urbaine.----------ABSTRACT Many researchers have benefited from the concept of the transport corridor to cover mobility issues and their interactions with land use, the environment, human health, and economic development. However, most of the available literature examines the economic and the political impacts of corridors and links it to the presence of transportation services and infrastructures (the supply). Moreover, the use of this concept in the urban transportation assessment and planning process remains limited due to the lack of a clear definition and modeling approach adapted to the very scattered nature of travel in urban areas. This thesis provides a deep reflection on the transport corridor’s definition and characteristics and offers a modeling framework to identify urban transportation corridors using the transport demand, represented by the Origin and Destination (OD), in the absence of supply elements

PolyPublie

Prédiction du comportement d'un attaquant à partir de métriques de distances sémantiques dérivées d'un grand darknet

Author: EVRARD LAURENT
Publication venue
Publication date: 22/06/2018
Field of study

Repository of the University of Namur

Algorithmes de recommandation musicale

Author: Maillet François
Publication venue
Publication date: 01/12/2009
Field of study

Ce mémoire est composé de trois articles qui s’unissent sous le thème de la recommandation musicale à grande échelle. Nous présentons d’abord une méthode pour effectuer des recommandations musicales en récoltant des étiquettes (tags) décrivant les items et en utilisant cette aura textuelle pour déterminer leur similarité. En plus d’effectuer des recommandations qui sont transparentes et personnalisables, notre méthode, basée sur le contenu, n’est pas victime des problèmes dont souffrent les systèmes de filtrage collaboratif, comme le problème du démarrage à froid (cold start problem). Nous présentons ensuite un algorithme d’apprentissage automatique qui applique des étiquettes à des chansons à partir d’attributs extraits de leur fichier audio. L’ensemble de données que nous utilisons est construit à partir d’une très grande quantité de données sociales provenant du site Last.fm. Nous présentons finalement un algorithme de génération automatique de liste d’écoute personnalisable qui apprend un espace de similarité musical à partir d’attributs audio extraits de chansons jouées dans des listes d’écoute de stations de radio commerciale. En plus d’utiliser cet espace de similarité, notre système prend aussi en compte un nuage d’étiquettes que l’utilisateur est en mesure de manipuler, ce qui lui permet de décrire de manière abstraite la sorte de musique qu’il désire écouter.This thesis is composed of three papers which unite under the general theme of large-scale music recommendation. The first paper presents a recommendation technique that works by collecting text descriptions of items and using this textual aura to compute the similarity between them using techniques drawn from information retrieval. We show how this representation can be used to explain the similarities between items using terms from the textual aura and further how it can be used to steer the recommender. Because our system is content-based, it is not victim of the usual problems associated with collaborative filtering recommenders like the cold start problem. The second paper presents a machine learning model which automatically applies tags to music. The model uses features extracted from the audio files and was trained on a very large data set constructed with social data from the online community Last.fm. The third paper presents an approach to generating steerable playlists. We first demonstrate a method for learning song transition probabilities from audio features extracted from songs played in professional radio station playlists. We then show that by using this learnt similarity function as a prior, we are able to generate steerable playlists by choosing the next song to play not simply based on that prior, but on a tag cloud that the user is able to manipulate to express the high-level characteristics of the music he wishes to listen to

Dépôt Institutionnel Numérique