86 research outputs found

    Méthodes qualitatives pour la construction et l'analyse des réseaux moléculaires SBGN

    Get PDF
    Two fundamental tasks of Systems Biology are the construction of molecular networks from experimental data, and their analysis with a view to discovering their emergent properties. With the increase of available experimental data, these two tasks can no longer be realized by hand. Based on this observation, numerous bioinformatics methods aiming at the automation of these two task have been developped.In parallel, standards aiming at defining and organizing terms of systems biology, or representing networks and mathematical models, have been developped. Among these standards, the Standard Biology Graphical Notation is composed of three languages that allow the representation of molecular networks. The two main SBGN languages are SBGN-PD for the representation of reaction networks, and SBGN-AF for the representation of influence graphs. The SBGN notation not only standardizes the representation of networks, but also gives the concepts of systems biology that are most often used to express knowledge of the field.Our work takes its root in this general background. We have developped a number of methods to construct molecular networks and analyze their dynamics. All the methods that we propose are based on qualitative formalisms, such as logics or automata networks. These formalisms have solid theoretical bases and can be used by numerous pieces of software. All our methods also rely on the biological concepts given by the SBGN standard, and can therefore be blended in the same theoretical framework.First, we introduce two sets of predicates that allow to translate any SBGN-PD or SBGN-AF network into a set of ground atoms. Then, we show how these sets of predicates can be used to reason on networks, by proposing a transformation method of SBGN-PD signaling networks into SBGN-AF influence graphs.Second, we present a first-order logic based method to construct signaling networks from experimental results. This method formalizes and automatizes biologists' reasoning using explicit reasoning rules.On the contrary to existing methods, it allows to take into account numerous types of experimental results while reconstructing precise molecular mecanisms.Third, we show a new method to compute the finite traces and attractor points of Boolean networks that model SBGN-AF networks and that are parameterized using general principles.Finally, we introduce two new qualitative semantics for the computation of the dynamics of SBGN-PD reaction networks. These semantics are expressed using automata networks. The first semantics extends the classical Boolean semantics by taking into account inhibitions. As to the second one, it relies on the concept of story which introduces a new point of view on reaction networks. Indeed, it allows to model different physical states of the same molecular entity using a unique variable.All the methods that we have developped show how qualitative formalisms can be used to reason on the relations represented by molecular networks in order to discorver new knowledge in systems biology.La construction des rĂ©seaux molĂ©culaires Ă  partir de rĂ©sultats expĂ©rimentaux, ainsi que leur analyse en vue d'en exhiber des propriĂ©tĂ©s Ă©mergentes, sont deux tĂąches fondamentales de la biologie des systĂšmes. Avec l'augmentation du nombre de donnĂ©es expĂ©rimentales, elles ne peuvent plus ĂȘtre rĂ©alisĂ©es manuellement. Partant de ce constat, un certain nombre de mĂ©thodes bioinformatiques visant Ă  les automatiser ont Ă©tĂ© dĂ©veloppĂ©es.En parallĂšle du dĂ©veloppement des mĂ©thodes, un certain nombre de standards ont vu le jour. Parmi ceux-ci, la Standard Biology Graphical Notation (SBGN) se compose de trois langages permettant la reprĂ©sentation des rĂ©seaux molĂ©culaires.Les deux langages SBGN les plus couramment utilisĂ©s sont SBGN-PD pour la reprĂ©sentation des rĂ©seaux de rĂ©actions, et SBGN-AF pour celle des graphes d'influences. La notation SBGN, en plus de standardiser la reprĂ©sentation des rĂ©seaux, donne l'ensemble des concepts de la biologie des systĂšmes qui sont le plus souvent utilisĂ©s pour exprimer les connaissances du domaine.C'est dans ce cadre gĂ©nĂ©ral que se placent l'ensemble de nos travaux. Nous avons dĂ©veloppĂ© un ensemble de mĂ©thodes pour la construction des rĂ©seaux molĂ©culaires et l'analyse de leur dynamique. L'ensemble des mĂ©thodes que nous proposons reposent sur des formalismes qualitatifs, tels que la logique ou les rĂ©seaux d'automates. Ces formalismes on non seulement des bases thĂ©oriques solides, mais peuvent aussi ĂȘtre utilisĂ©s par de nombreux logiciels.L'ensemble de nos mĂ©thodes reposent Ă©galement sur les concepts biologiques fournis par le standard SBGN, et peuvent ainsi ĂȘtre intĂ©grĂ©es dans un mĂȘme cadre thĂ©orique.Nous introduisons d'abord deux ensembles de prĂ©dicats qui permettent de traduire n'importe quel rĂ©seau SBGN-PD ou SBGN-AF sous la forme d'atomes instanciĂ©s. Nous montrons ensuite comment ces deux ensembles peuvent ĂȘtre utilisĂ©s pour raisonner automatiquement sur des rĂ©seaux molĂ©culaires, en proposant une mĂ©thode de transformation automatique des rĂ©seaux de signalisation SBGN-PD en graphes d'influences SBGN-AF.Nous prĂ©sentons ensuite une mĂ©thode de construction des rĂ©seaux de signalisation Ă  partir de rĂ©sultats expĂ©rimentaux, basĂ©e sur la logique du premier ordre. Cette mĂ©thode formalise et automatise le raisonnement rĂ©alisĂ© par les biologistes Ă  l'aide de rĂšgles de raisonnement explicites. Contrairement aux mĂ©thodes dĂ©veloppĂ©es jusqu'Ă  maintenant, celle que nous prĂ©sentons prend en compte un grand nombre de types d'expĂ©riences, tout en permettant la reconstruction de mĂ©canismes molĂ©culaires prĂ©cis.Puis nous montrons une nouvelle mĂ©thode pour le calcul des traces finies et des points attracteurs de rĂ©seaux BoolĂ©ens modĂ©lisant des rĂ©seaux SBGN-AF et paramĂ©trĂ©s Ă  l'aide de principes gĂ©nĂ©raux. Notre mĂ©thode repose sur l'utilisation de programmes logiques normaux du premier ordre, qui formalisent ces principes gĂ©nĂ©raux.Enfin, nous proposons deux nouvelles sĂ©mantiques qualitatives pour le calcul de la dynamique des rĂ©seaux de rĂ©actions SBGN-PD, exprimĂ©es Ă  l'aide de rĂ©seaux d'automates. La premiĂšre de ces sĂ©mantiques Ă©tend la sĂ©mantique BoolĂ©enne des rĂ©seaux de rĂ©actions en prenant en compte les inhibitions. Quant Ă  la deuxiĂšme, elle introduit le concept d'histoire (story) qui offre un nouveau point de vue sur les rĂ©seaux de rĂ©actions, en permettant de modĂ©liser diffĂ©rents Ă©tats physiques d'une mĂȘme entitĂ© molĂ©culaire par une seule variable.L'ensemble des mĂ©thodes que nous avons dĂ©veloppĂ©es montrent comment les formalismes qualitatifs, et en particulier la logique, peuvent ĂȘtre utilisĂ©s pour raisonner Ă  partir des relations reprĂ©sentĂ©es par les rĂ©seaux molĂ©culaires, afin de dĂ©couvrir de nouvelles connaissances en biologie des systĂšmes

    Exploration et analyse immersives de données moléculaires guidées par la tùche et la modélisation sémantique des contenus

    Get PDF
    In structural biology, the theoretical study of molecular structures has four main activities organized in the following scenario: collection of experimental and theoretical data, visualization of 3D structures, molecular simulation, analysis and interpretation of results. This pipeline allows the expert to develop new hypotheses, to verify them experimentally and to produce new data as a starting point for a new scenario.The explosion in the amount of data to handle in this loop has two problems. Firstly, the resources and time dedicated to the tasks of transfer and conversion of data between each of these four activities increases significantly. Secondly, the complexity of molecular data generated by new experimental methodologies greatly increases the difficulty to properly collect, visualize and analyze the data.Immersive environments are often proposed to address the quantity and the increasing complexity of the modeled phenomena, especially during the viewing activity. Indeed, virtual reality offers a high quality stereoscopic perception, useful for a better understanding of inherently three-dimensional molecular data. It also displays a large amount of information thanks to the large display surfaces, but also to complete the immersive feeling with other sensorimotor channels (3D audio, haptic feedbacks,...).However, two major factors hindering the use of virtual reality in the field of structural biology. On one hand, although there are literature on navigation and environmental realistic virtual scenes, navigating abstract science is still very little studied. The understanding of complex 3D phenomena is however particularly conditioned by the subject’s ability to identify themselves in a complex 3D phenomenon. The first objective of this thesis work is then to propose 3D navigation paradigms adapted to the molecular structures of increasing complexity. On the other hand, the interactive context of immersive environments encourages direct interaction with the objects of interest. But the activities of: results collection, simulation and analysis, assume a working environment based on command-line inputs or through specific scripts associated to the tools. Usually, the use of virtual reality is therefore restricted to molecular structures exploration and visualization. The second thesis objective is then to bring all these activities, previously carried out in independent and interactive application contexts, within a homogeneous and unique interactive context. In addition to minimizing the time spent in data management between different work contexts, the aim is also to present, in a joint and simultaneous way, molecular structures and analyses, and allow their manipulation through direct interaction.Our contribution meets these objectives by building on an approach guided by both the content and the task. More precisely, navigation paradigms have been designed taking into account the molecular content, especially geometric properties, and tasks of the expert, to facilitate spatial referencing in molecular complexes and make the exploration of these structures more efficient. In addition, formalizing the nature of molecular data, their analysis and their visual representations, allows to interactively propose analyzes adapted to the nature of the data and create links between the molecular components and associated analyzes. These features go through the construction of a unified and powerful semantic representation making possible the integration of these activities in a unique interactive context.En biologie structurale, l’étude thĂ©orique de structures molĂ©culaires comporte quatre activitĂ©s principales organisĂ©es selon le processus sĂ©quentiel suivant : la collecte de donnĂ©es expĂ©rimentales/thĂ©oriques, la visualisation des structures 3d, la simulation molĂ©culaire, l’analyse et l’interprĂ©tation des rĂ©sultats. Cet enchaĂźnement permet Ă  l’expert d’élaborer de nouvelles hypothĂšses, de les vĂ©rifier de maniĂšre expĂ©rimentale et de produire de nouvelles donnĂ©es comme point de dĂ©part d’un nouveau processus.L’explosion de la quantitĂ© de donnĂ©es Ă  manipuler au sein de cette boucle pose dĂ©sormais deux problĂšmes. PremiĂšrement, les ressources et le temps relatifs aux tĂąches de transfert et de conversion de donnĂ©es entre chacune de ces activitĂ©s augmentent considĂ©rablement. DeuxiĂšmement, la complexitĂ© des donnĂ©es molĂ©culaires gĂ©nĂ©rĂ©es par les nouvelles mĂ©thodologies expĂ©rimentales accroĂźt fortement la difficultĂ© pour correctement percevoir, visualiser et analyser ces donnĂ©es.Les environnements immersifs sont souvent proposĂ©s pour aborder le problĂšme de la quantitĂ© et de la complexitĂ© croissante des phĂ©nomĂšnes modĂ©lisĂ©s, en particulier durant l’activitĂ© de visualisation. En effet, la RĂ©alitĂ© Virtuelle offre entre autre une perception stĂ©rĂ©oscopique de haute qualitĂ© utile Ă  une meilleure comprĂ©hension de donnĂ©es molĂ©culaires intrinsĂšquement tridimensionnelles. Elle permet Ă©galement d’afficher une quantitĂ© d’information importante grĂące aux grandes surfaces d’affichage, mais aussi de complĂ©ter la sensation d’immersion par d’autres canaux sensorimoteurs.Cependant, deux facteurs majeurs freinent l’usage de la RĂ©alitĂ© Virtuelle dans le domaine de la biologie structurale. D’une part, mĂȘme s’il existe une littĂ©rature fournie sur la navigation dans les scĂšnes virtuelles rĂ©alistes et Ă©cologiques, celle-ci est trĂšs peu Ă©tudiĂ©e sur la navigation sur des donnĂ©es scientifiques abstraites. La comprĂ©hension de phĂ©nomĂšnes 3d complexes est pourtant particuliĂšrement conditionnĂ©e par la capacitĂ© du sujet Ă  se repĂ©rer dans l’espace. Le premier objectif de ce travail de doctorat a donc Ă©tĂ© de proposer des paradigmes navigation 3d adaptĂ©s aux structures molĂ©culaires complexes. D’autre part, le contexte interactif des environnements immersif favorise l’interaction directe avec les objets d’intĂ©rĂȘt. Or les activitĂ©s de collecte et d’analyse des rĂ©sultats supposent un contexte de travail en "ligne de commande" ou basĂ© sur des scripts spĂ©cifiques aux outils d’analyse. Il en rĂ©sulte que l’usage de la RĂ©alitĂ© Virtuelle se limite souvent Ă  l’activitĂ© d’exploration et de visualisation des structures molĂ©culaires. C’est pourquoi le second objectif de thĂšse est de rapprocher ces diffĂ©rentes activitĂ©s, jusqu’alors rĂ©alisĂ©es dans des contextes interactifs et applicatifs indĂ©pendants, au sein d’un contexte interactif homogĂšne et unique. Outre le fait de minimiser le temps passĂ© dans la gestion des donnĂ©es entre les diffĂ©rents contextes de travail, il s’agit Ă©galement de prĂ©senter de maniĂšre conjointe et simultanĂ©e les structures molĂ©culaires et leurs analyses et de permettre leur manipulation par des interactions directes.Notre contribution rĂ©pond Ă  ces objectifs en s’appuyant sur une approche guidĂ©e Ă  la fois par le contenu et la tĂąche. Des paradigmes de navigation ont Ă©tĂ© conçus en tenant compte du contenu molĂ©culaire, en particulier des propriĂ©tĂ©s gĂ©omĂ©triques, et des tĂąches de l’expert, afin de faciliter le repĂ©rage spatial et de rendre plus performante l’activitĂ© d’exploration. Par ailleurs, formaliser la nature des donnĂ©es molĂ©culaires, leurs analyses et leurs reprĂ©sentations visuelles, permettent notamment de proposer Ă  la demande et interactivement des analyses adaptĂ©es Ă  la nature des donnĂ©es et de crĂ©er des liens entre les composants molĂ©culaires et les analyses associĂ©es. Ces fonctionnalitĂ©s passent par la construction d’une reprĂ©sentation sĂ©mantique unifiĂ©e et performante rendant possible l’intĂ©gration de ces activitĂ©s dans un contexte interactif unique

    Modélisation générique d'un retour d'expérience cognitif. Application à la prévention des risques

    Get PDF
    Nous avons défini dans cette thÚse une architecture logicielle générique permettant de réaliser des applications de retour d'expérience cognitif. Ces derniers intÚgrent une formalisation de l'analyse experte et sont une alternative aux SystÚmes à Bases de Connaissance. Les applications sont opérationnalisées à partir de la définition du modÚle de l'expérience qui est basé sur une structure objet simple couplée avec le modÚle des croyances transférables pour prendre en compte les intertitudes. Nous avons développé des algorithmes génériques de recherche adaptés à la formalisation retenue de l'entité expérience ainsi qu'un alogorithme d'extraction d'un indicateur du risque. Ces algorithmes sont basés sur une proposition de similarité ensembliste particuliÚre. Le modÚle générique est basé sur un modÚle adaptatif (Adaptive Object Model). Nous avons appliqué une partie des résultats de la thÚse dans le cadre d'un projet Européen INTERREG SUP (Sécurité Urgence Pyrénées)

    Acquisition de liens sémantiques à partir d'éléments de mise en forme des textes: exploitation des structures énumératives

    Get PDF
    The past decade witnessed significant advances in the field of relation extraction from text, facilitating the building of lexical or semantic resources. However, the methods proposed so far (supervised learning, kernel methods, distant supervision, etc.) don't fully exploit the texts: they are usually applied at the sentential level and they don't take into account the layout and the formatting of texts.In such a context, this thesis aims at expanding those methods and makes them layout-aware for extracting relations expressed beyond sentence boundaries. For this purpose, we rely on the semantics conveyed by typographical (bullets, emphasis, etc.) and dispositional (visual indentations, carriage returns, etc.) features. Those features often substitute purely discursive formulations. In particular, the study reported here is dealing with the relations carried by the vertical enumerative structures. Although they display discontinuities between their various components, the enumerative structures can be dealt as a whole at the semantic level. They form textual structures prone to hierarchical relations.This study was divided into two parts. (i) The first part describes a model representing the hierarchical structure of documents. This model is falling within the theoretical framework representing the textual architecture: an abstraction of the layout and the formatting, as well as a strong connection with the rhetorical structure are achieved. However, our model focuses primarily on the efficiency of the analysis process rather than on the expressiveness of the representation. A bottom-up method intended for building automatically this model is presented and evaluated on a corpus of PDF documents.(ii) The second part aims at integrating this model into the process of relation extraction. In particular, we focused on vertical enumerative structures. A multidimensional typology intended for characterizing those structures was established and used into an annotation task. Thanks to corpus-based observations, we proposed a two-step method, by supervised learning, for qualifying the nature of the relation and identifying its arguments. The evaluation of our method showed that exploiting the formatting and the layout of documents, in combination with standard lexico-syntactic features, improves those two tasks.Ces derniĂšres annĂ©es de nombreux progrĂšs ont Ă©tĂ© faits dans le domaine de l'extraction de relations Ă  partir de textes, facilitant ainsi la construction de ressources lexicales ou sĂ©mantiques. Cependant, les mĂ©thodes proposĂ©es (apprentissage supervisĂ©, mĂ©thodes Ă  noyaux, apprentissage distant, etc.) n’exploitent pas tout le potentiel des textes : elles ont gĂ©nĂ©ralement Ă©tĂ© appliquĂ©es Ă  un niveau phrastique, sans tenir compte des Ă©lĂ©ments de mise en forme.Dans ce contexte, l'objectif de cette thĂšse est d'adapter ces mĂ©thodes Ă  l'extraction de relations exprimĂ©es au-delĂ  des frontiĂšres de la phrase. Pour cela, nous nous appuyons sur la sĂ©mantique vĂ©hiculĂ©e par les indices typographiques (puces, emphases, etc.) et dispositionnels (indentations visuelles, retours Ă  la ligne, etc.), qui complĂštent des formulations strictement discursives. En particulier, nous Ă©tudions les structures Ă©numĂ©ratives verticales qui, bien qu'affichant des discontinuitĂ©s entre leurs diffĂ©rents composants, prĂ©sentent un tout sur le plan sĂ©mantique. Ces structures textuelles sont souvent rĂ©vĂ©latrices de relations hiĂ©rarchiques. Notre travail est divisĂ© en deux parties. (i) La premiĂšre partie dĂ©crit un modĂšle pour reprĂ©senter la structure hiĂ©rarchique des documents. Ce modĂšle se positionne dans la suite des modĂšles thĂ©oriques proposĂ©s pour rendre compte de l'architecture textuelle : une abstraction de la mise en forme et une connexion forte avec la structure rhĂ©torique sont faites. Toutefois, notre modĂšle se dĂ©marque par une perspective d'analyse automatique des textes. Nous en proposons une implĂ©mentation efficace sous la forme d'une mĂ©thode ascendante et nous l'Ă©valuons sur un corpus de documents PDF. (ii) La seconde partie porte sur l'intĂ©gration de ce modĂšle dans le processus d'extraction de relations. Plus particuliĂšrement, nous nous sommes focalisĂ©s sur les structures Ă©numĂ©ratives verticales. Un corpus a Ă©tĂ© annotĂ© selon une typologie multi-dimensionnelle permettant de caractĂ©riser et de cibler les structures Ă©numĂ©ratives verticales porteuses de relations utiles Ă  la crĂ©ation de ressources. Les observations faites en corpus ont conduit Ă  procĂ©der en deux Ă©tapes par apprentissage supervisĂ© pour analyser ces structures : qualifier la relation puis en extraire les arguments. L'Ă©valuation de cette mĂ©thode montre que l'exploitation de la mise en forme, combinĂ©e Ă  un faisceau d'indices lexico-syntaxiques, amĂ©liore les rĂ©sultats

    33Úmes Journées Francophones des Langages Applicatifs

    Get PDF
    International audienceLes 33Ăšmes JournĂ©es Francophones des Langages Applicatifs (JFLA) se sont tenues Ă  Saint-MĂ©dard-d'Excideuil, plus prĂ©cisĂ©ment Domaine d'EssendiĂ©ras (PĂ©rigord), du mardi 28 juin 2022 au vendredi 1er juillet 2022.Les JFLA rĂ©unissent concepteurs, utilisateurs et thĂ©oriciens ; elles ont pour ambition de couvrir les domaines des langages applicatifs, de la preuve formelle, de la vĂ©rification de programmes, et des objets mathĂ©matiques qui sous-tendent ces outils. Ces domaines doivent ĂȘtre pris au sens large : nous souhaitons promouvoir les ponts entre les diffĂ©rentes thĂ©matiques.- Langages fonctionnels et applicatifs : sĂ©mantique, compilation, optimisation, typage, mesures, extensions par d'autres paradigmes.- Assistants de preuve : implĂ©mentation, nouvelles tactiques, dĂ©veloppements prĂ©sentant un intĂ©rĂȘt technique ou mĂ©thodologique.- Logique, correspondance de Curry-Howard, rĂ©alisabilitĂ©, extraction de programmes, modĂšles.- SpĂ©cification, prototypage, dĂ©veloppements formels d'algorithmes.- VĂ©rification de programmes ou de modĂšles, mĂ©thode dĂ©ductive, interprĂ©tation abstraite, raffinement.- Utilisation industrielle des langages fonctionnels et applicatifs, ou des mĂ©thodes issues des preuves formelles, outils pour le web.Les articles soumis aux JFLA sont relus par au moins deux personnes s'ils sont acceptĂ©s, trois personnes s'ils sont rejetĂ©s. Les critiques des relecteurs sont toujours bienveillantes et la plupart du temps encourageantes et constructives, mĂȘme en cas de rejet

    SCADE - Modélisation formelle de systÚmes réactifs critiques

    Get PDF

    Programmation par contraintes sur les flux de données

    Get PDF
    We study the generalization of constraint programming on variables finite domains with variable flow. On the one hand, the flow of concepts, infinite sequences and infinite words have been the subject of numerous studies, and a goal is to achieve a state of the art covering language theory, classical and temporal logics as well as many related formalisms. The reconciliation performed with temporal logics is a first step towards unification formalisms on flows and temporal logics being themselves many, we establish a classification of these will allow the extrapolation of contributions to other contexts. The second objective is to identify the elements of these formalisms that allow the processing of satisfaction problems with the techniques of constraint programming on finite domain variables. Compared to the expressiveness of temporal logic, that of our formalism is more limited. This is due to the fact that constraint programming allows only the conjunction of constraints and requires integrating the disjunction in the notion of constraint propagator. Our formalism allows a gain in conciseness and reuse of the concept of propagator. The issue of generalization to more expressive logics is left open.Nous Ă©tudions la gĂ©nĂ©ralisation de la programmation par contraintes sur les variables Ă  domaines finis aux variables flux. D'une part, les concepts de flux, de sĂ©quences infinies et de mots infinis ont fait l'objet de nombreux travaux, et un objectif consiste Ă  rĂ©aliser un Ă©tat de l'art qui couvre la thĂ©orie des langages, les logiques classiques et temporelles, ainsi que les nombreux formalismes apparentĂ©s. Le rapprochement effectuĂ© avec les logiques temporelles est un premier pas vers l'unification des formalismes sur les flux, et les logiques temporelles Ă©tant elles-mĂȘme nombreuses, nous Ă©tablissons une classification de celles-ci qui permettra l'extrapolation des contributions Ă  d'autres contextes. Le second objectif consiste Ă  identifier les Ă©lĂ©ments de ces formalismes qui permettent le traitement des problĂšmes de satisfaction avec les techniques de la programmation par contraintes sur les variables Ă  domaines finis. ComparĂ©e Ă  l'expressivitĂ© des logiques temporelles, celle de notre formalisme est plus limitĂ©e. Ceci est dĂ» au fait que la programmation par contraintes ne permet que la conjonction de contraintes, et impose d'intĂ©grer la disjonction dans la notion de propagateur de contraintes. Notre formalisme permet un gain en concision et la rĂ©utilisation de la notion de propagateur. La question de la gĂ©nĂ©ralisation Ă  des logiques plus expressives est laissĂ©e ouverte

    Vers une nouvelle ingénierie de l'information

    Get PDF
    • 

    corecore