3 research outputs found
Scientific Workflow Integration For Services Computing
In recent years, significant scientific advances are increasingly achieved through complex scientific processes. As the exponential growth in computing technologies and scientific data, a scientific workflow may comprise a large number of heterogeneous scientific services and applications, provided by different organizations. These services, applications, and their associated data are usually distributed across heterogeneous computing environments. The integration and management of such scientific workflows are pushing the limits of current workflow technology. This dissertation presents an integrated solution to composing, scheduling, executing and developing scientific workflows and scientific workflow management systems.
To provide a foundation for workflow composition, scheduling, execution and management, we propose the first reference architecture for scientific workflow management systems. The reference architecture not only provides a high-level organization of subsystems and their interactions in a workflow system, but also provides a basis for comparison between different systems and a guidance for the architectural design of an SWFMS in a specific scientific domain. To integrate heterogeneous services and applications and enable them composed to workflows, we propose a task template model which not only provides an appropriate abstraction of heterogeneous services and applications, but also encapsulates the composition and mapping of shims and functional task components within a task interface. Our proposed task specification language (TSL) not only integrates heterogeneous services and applications into uniform workflow tasks, but also provides a solution to address both TYPE-I and TYPE-II shimming problems in composing scientific workflows. To schedule scientific workflows in emerging services computing environments, we propose two workflow scheduling algorithms, the SHEFT algorithm and the SCPOR algorithm, to prioritize tasks in a workflow, map tasks onto suitable resources and order the execution of tasks on the assigned resources, so that the workflow makespan can be minimized. Our extensive experiments have shown that our proposed algorithms not only outperform other algorithms for large-scale, data-intensive and compute intensive workflows, but also allow the assigned resources elastically change on demand of the size of workflows. To execute workflows on distributed computing environments, we propose a task run model to model the run-time behaviors of tasks. The proposed task run description language (TRDL) enables the execution of task instances constructed from heterogeneous services and applications. We also develop an SOA based task management subsystem to manage all task templates, task instances and task runs for the invocation and execution of various heterogeneous task components. Finally, our developed SOA based workflow management system, the VIEW system, and a VIEW based workflow application system, the FiberFlow system, validate our architectures, models, languages, and algorithms
IngĂ©nierie et Architecture dâEntreprise et des SystĂšmes dâInformation - Concepts, Fondements et MĂ©thodes
L'ingĂ©nierie des systĂšmes d'information s'est longtemps cantonnĂ©e Ă la modĂ©lisation du produit (objet) qu'est le systĂšme dâinformation sans se prĂ©occuper des processus d'usage de ce systĂšme. Dans un environnement de plus en plus Ă©volutif, la modĂ©lisation du fonctionnement du systĂšme dâinformation au sein de l'entreprise me semble primordiale. Pendant les deux derniĂšres dĂ©cennies, les pratiques de management, dâingĂ©nierie et dâopĂ©ration ont subi des mutations profondes et multiformes. Nous devons tenir compte de ces mutations dans les recherches en ingĂ©nierie des systĂšmes dâinformation afin de produire des formalismes et des dĂ©marches mĂ©thodologiques qui sauront anticiper et satisfaire les nouveaux besoins, regroupĂ©s dans ce document sous quatre thĂšmes:1) Le systĂšme dâinformation est le lieu mĂȘme oĂč sâĂ©labore la coordination des actes et des informations sans laquelle une entreprise (et toute organisation), dans la diversitĂ© des mĂ©tiers et des compĂ©tences quâelle met en Ćuvre, ne peut exister que dans la mĂ©diocritĂ©. La comprĂ©hension des exigences de coopĂ©ration dans toutes ses dimensions (communication, coordination, collaboration) et le support que lâinformatique peut et doit y apporter deviennent donc un sujet digne dâintĂ©rĂȘt pour les recherches en systĂšme dâinformation.2) Le paradigme de management des processus dâentreprise (BPM) est en forte opposition avec le dĂ©veloppement traditionnel des systĂšmes dâinformation qui, pendant plusieurs dĂ©cennies, a cristallisĂ© la division verticale des activitĂ©s des organisations et favorisĂ© ainsi la construction dâĂźlots dâinformation et dâapplications. Cependant, les approches traditionnelles de modĂ©lisation de processus ne sont pas Ă la hauteur des besoins dâingĂ©nierie des processus dans ce contexte en constant changement, que ce dernier soit de nature contextuelle ou permanente. Nous avons donc besoin de formalismes (i) qui permettent non seulement de reprĂ©senter les processus dâentreprise et leurs liens avec les composants logiciels du systĂšme existant ou Ă venir mais (ii) qui ont aussi lâaptitude Ă reprĂ©senter la nature variable et/ou Ă©volutive (donc parfois Ă©minemment dĂ©cisionnelle) de ces processus.3) Les systĂšmes dâinformation continuent aujourdâhui de supporter les besoins classiques tels que lâautomatisation et la coordination de la chaĂźne de production, lâamĂ©lioration de la qualitĂ© des produits et/ou services offerts. Cependant un nouveau rĂŽle leur est attribuĂ©. Il sâagit du potentiel offert par les systĂšmes dâinformation pour adopter un rĂŽle de support au service de la stratĂ©gie de lâentreprise. Les technologies de lâinformation, de la communication et de la connaissance se sont ainsi positionnĂ©es comme une ressource stratĂ©gique, support de la transformation organisationnelle voire comme levier du changement. Les modĂšles dâentreprise peuvent reprĂ©senter lâĂ©tat actuel de lâorganisation afin de comprendre, de disposer dâune reprĂ©sentation partagĂ©e, de mesurer les performances, et Ă©ventuellement dâidentifier les dysfonctionnements. Ils permettent aussi de reprĂ©senter un Ă©tat futur souhaitĂ© afin de dĂ©finir une cible vers laquelle avancer par la mise en Ćuvre des projets. Lâentreprise Ă©tant en mouvement perpĂ©tuel, son Ă©volution fait partie de ses multiples dimensions. Nous avons donc besoin de reprĂ©senter, a minima, un Ă©tat futur et le chemin de transformation Ă construire pour avancer vers cette cible. Cependant planifier/imaginer/se projeter vers une cible unique et, en supposant que lâon y arrive, croire quâil puisse exister un seul chemin pour lâatteindre semble irrĂ©aliste. Nous devons donc proposer des formalismes qui permettront de spĂ©cifier des scenarii Ă la fois pour des cibles Ă atteindre et pour des chemins Ă parcourir. Nous devons aussi dĂ©velopper des dĂ©marches mĂ©thodologiques pour guider de maniĂšre systĂ©matique la construction de ces modĂšles dâentreprise et la rationalitĂ© sous-jacente.4) En moins de cinquante ans, le propos du systĂšme dâinformation a Ă©voluĂ© et sâest complexifiĂ©. Aujourdâhui, le systĂšme dâinformation doit supporter non seulement les fonctions de support de maniĂšre isolĂ©e et en silos (1970-1990), et les activitĂ©s appartenant Ă la chaĂźne de valeur [Porter, 1985] de lâentreprise (1980-2000) mais aussi les activitĂ©s de contrĂŽle, de pilotage, de planification stratĂ©gique ainsi que la cohĂ©rence et lâharmonie de lâensemble des processus liĂ©s aux activitĂ©s mĂ©tier (2000-201x), en un mot les activitĂ©s de management stratĂ©gique et de gouvernance dâentreprise. La gouvernance d'entreprise est l'ensemble des processus, rĂ©glementations, lois et institutions influant la maniĂšre dont l'entreprise est dirigĂ©e, administrĂ©e et contrĂŽlĂ©e. Ces processus qui produisent des âdĂ©cisionsâ en guise de âproduitâ ont autant besoin dâĂȘtre instrumentalisĂ©s par les systĂšmes dâinformation que les processus de nature plus opĂ©rationnels de lâentreprise. De mĂȘme, ces processus stratĂ©giques (dits aussi âde dĂ©veloppementâ) nĂ©cessitent dâavoir recours Ă des formalismes de reprĂ©sentation qui sont trĂšs loin, en pouvoir dâexpression, des notations largement adoptĂ©es ces derniĂšres annĂ©es pour la reprĂ©sentation des processus dâentreprise.Ainsi, il semble peu judicieux de vouloir (ou penser pouvoir) isoler, pendant sa construction, lâobjet âsystĂšme dâinformationâ de son environnement dâexĂ©cution. Si le sens donnĂ© Ă lâinformation dĂ©pend de la personne qui la reçoit, ce sens ne peut ĂȘtre entiĂšrement capturĂ© dans le systĂšme technique. Il sera plutĂŽt apprĂ©hendĂ© comme une composante essentielle dâun systĂšme socio-technique incluant les usagers du systĂšme dâinformation technologisĂ©, autrement dit, les acteurs agissant de lâentreprise. De mon point de vue, ce systĂšme socio-technique qui mĂ©rite lâintĂ©rĂȘt scientifique de notre discipline est lâentreprise. Les recherches que jâai rĂ©alisĂ©es, animĂ©es ou supervisĂ©es , et qui sont structurĂ©es en quatre thĂšmes dans ce document, visent Ă rĂ©soudre les problĂšmes liĂ©s aux contextes de l'usage (l'entreprise et son environnement) des systĂšmes dâinformation. Le point discriminant de ma recherche est l'intĂ©rĂȘt que je porte Ă la capacitĂ© de reprĂ©sentation :(i) de l'Ă©volutivitĂ© et de la flexibilitĂ© des processus d'entreprise en particulier de ceux supportĂ©s par un systĂšme logiciel, dâun point de vue microscopique (modĂšle dâun processus) et macroscopique (reprĂ©sentation et configuration dâun rĂ©seau de processus) : thĂšme 2(ii) du systĂšme dâentreprise dans toutes ses dimensions (stratĂ©gie, organisation des processus, systĂšme dâinformation et changement) : thĂšme 3Pour composer avec ces motivations, il fallait :(iii) sâintĂ©resser Ă la nature mĂȘme du travail coopĂ©ratif et Ă lâintentionnalitĂ© des acteurs agissant afin dâidentifier et/ou proposer des formalismes appropriĂ©s pour les dĂ©crire et les comprendre : thĂšme 1(iv) se questionner aussi sur les processus de management dont le rĂŽle est de surveiller, mesurer, piloter lâentreprise afin de leur apporter le soutien quâils mĂ©ritent du systĂšme dâinformation : thĂšme