12 research outputs found
Adaptation au repartitionnement de graphes d'une méthode d'optimisation globale par diffusion
National audienceLa résolution parallèle efficace de simulations numériques dont les coûts de calcul évoluent au cours du temps (telles que celles mettant en oeuvre un remaillage dynamique) nécessite des méthodes efficaces de redistribution des données attribuées à chaque processeur. L'objet de cet article est d'étudier l'adaptation au repartitionnement de graphes, qui est un modèle courant du problème de redistribution des données, d'un ensemble d'algorithmes utilisés avec succès dans le cadre du partitionnement parallèle de graphes, et tout particulièrement d'un algorithme d'optimisation globale de la forme des partitions par diffusion. Le modèle expérimental exposé ici est séquentiel,mais les algorithmes présentés peuvent facilement être transposés en parallèle. Afin de valider notre approche, nous comparons nos résultats, implémentés au sein du logiciel SCOTCH, à la routine de repartitionnement mise en oeuvre au sein du logiciel ParMETIS
Multiscale modelling of blood flow in cerebral microcirculation: Details at capillary scale control accuracy at the level of the cortex
Aging or cerebral diseases may induce architectural modifications in human brain microvascular networks, such as capillary rarefaction. Such modifications limit blood and oxygen supply to the cortex, possibly resulting in energy failure and neuronal death. Modelling is key in understanding how these architectural modifications affect blood flow and mass transfers in such complex networks. However, the huge number of vessels in the human brain—tens of billions—prevents any modelling approach with an explicit architectural representation down to the scale of the capillaries. Here, we introduce a hybrid approach to model blood flow at larger scale in the brain microcirculation, based on its multiscale architecture. The capillary bed, which is a space-filling network, is treated as a porous medium and modelled using a homogenized continuum approach. The larger arteriolar and venular trees, which cannot be homogenized because of their fractal-like nature, are treated as a network of interconnected tubes with a detailed representation of their spatial organization. The main contribution of this work is to devise a proper coupling model at the interface between these two components. This model is based on analytical approximations of the pressure field that capture the strong pressure gradients building up in the capillaries connected to arterioles or venules. We evaluate the accuracy of this model for both very simple architectures with one arteriole and/or one venule and for more complex ones, with anatomically realistic tree-like vessels displaying a large number of coupling sites. We show that the hybrid model is very accurate in describing blood flow at large scales and further yields a significant computational gain by comparison with a classical network approach. It is therefore an important step towards large scale simulations of cerebral blood flow and lays the groundwork for introducing additional levels of complexity in the future
Recommended from our members
Optimising subdomain aspect ratios for parallel load balancing
In parallel adaptive Finite Element simulations the work load 011the individual processors can change frequently. To (re)distribute the load evenly over the processors a load balancing heuristic is needed. Common strategies try to minimise subdomain dependencies by minimising the number of cut edges in the partition. For many solvers this is the most influential factor. However for example, for certain preconditioned Conjugate Gradient solvers this cutsize can play only a minor role, but their convergence can be highly dependent on the subdomain shapes. Degenerated subdomain shapes can cause them to need significantly more iterations to converge. Common heuristics often fail to address these requirements. In this thesis a new strategy is introduced which directly addresses the problem of generating and conserving reasonably good subdomain shapes while balancing the load in a dynamically changing Finite Element Simulation. A new definition of Aspect Ratio is presented which assesses subdomain shapes. The common methodology of using adjacency information to select the best elements to be migrated is not considered since it is not necessarily related to the subdomain shapes. Instead, geometric data is used to formulate several cost functions to rate elements in terms of their suitability to be migrated. The well known diffusive and Generalised Dimension Exchange methods which calculate the necessary load flow are enhanced by weighting the subdomain edges in order to influence their impact on the resulting partition positively. The results of comprehensive tests are presented and demonstrate that the proposed methods are competitive with state-of-the-art load balancing tools
Redistribution dynamique parallèle efficace de la charge pour les problèmes numériques de très grande taille
Cette thèse traite du problème de la redistribution dynamique parallèle efficace de la charge pour les problèmes numériques de très grande taille. Nous présentons tout d'abord un état de l'art des algorithmes permettant de résoudre les problèmes du partitionnement, du repartitionnement, du placement statique et du re-placement. Notre première contribution vise à étudier, dans un cadre séquentiel, les caractéristiques algorithmiques souhaitables pour les méthodes parallèles de repartitionnement. Nous y présentons notre contribution à la conception d'un schéma multi-niveaux k-aire pour le calcul sequentiel de repartitionnements. La partie la plus exigeante de cette adaptation concerne la phase d'expansion. L'une de nos contributions majeures a été de nous inspirer des méthodes d'influence afin d'adapter un algorithme de raffinement par diffusion au problème du repartitionnement.Notre deuxième contribution porte sur la mise en oeuvre de ces méthodes sur machines parallèles. L'adaptation du schéma multi-niveaux parallèle a nécessité une évolution des algorithmes et des structures de données mises en oeuvre pour le partitionnement. Ce travail est accompagné d'une analyse expérimentale, qui est rendue possible grâce à la mise en oeuvre des algorithmes considérés au sein de la bibliothèque Scotch.This thesis concerns efficient parallel dynamic load balancing for large scale numerical problems. First, we present a state of the art of the algorithms used to solve the partitioning, repartitioning, mapping and remapping problems. Our first contribution, in the context of sequential processing, is to define the desirable features that parallel repartitioning tools need to possess. We present our contribution to the conception of a k-way multilevel framework for sequential repartitioning. The most challenging part of this work regards the uncoarsening phase. One of our main contributions is the adaptation of influence methods to a global diffusion-based heuristic for the repartitioning problem. Our second contribution is the parallelization of these methods. The adaptation of the aforementioned algorithms required some modification of the algorithms and data structure used by existing parallel partitioning routines. This work is backed by a thorough experimental analysis, which is made possible thanks to the implementation of our algorithms into the Scotch library.BORDEAUX1-Bib.electronique (335229901) / SudocSudocFranceF
Estrategias de descomposición en dominios para entornos Grid
En este trabajo estamos interesados en realizar simulaciones numéricas basadas en elementos finitos con integración explÃcita en el tiempo utilizando la tecnologÃa Grid.Actualmente, las simulaciones explÃcitas de elementos finitos usan la técnica de descomposición en dominios con particiones balanceadas para realizar la distribución de los datos. Sin embargo, esta distribución de los datos presenta una degradación importante del rendimiento de las simulaciones explÃcitas cuando son ejecutadas en entornos Grid. Esto se debe principalmente, a que en un ambiente Grid tenemos comunicaciones heterogéneas, muy rápidas dentro de una máquina y muy lentas fuera de ella. De esta forma, una distribución balanceada de los datos se ejecuta a la velocidad de las comunicaciones más lentas. Para superar este problema proponemos solapar el tiempo de la comunicación remota con el tiempo de cálculo. Para ello, dedicaremos algunos procesadores a gestionar las comunicaciones más lentas, y el resto, a realizar cálculo intensivo. Este esquema de distribución de los datos, requiere que la descomposición en dominios sea no balanceada, para que, los procesadores dedicados a realizar la gestión de las comunicaciones lentas tengan apenas carga computacional. En este trabajo se han propuesto y analizado diferentes estrategias para distribuir los datos y mejorar el rendimiento de las aplicaciones en entornos Grid. Las estrategias de distribución estáticas analizadas son: 1. U-1domains: Inicialmente, el dominio de los datos es dividido proporcionalmente entre las máquinas dependiendo de su velocidad relativa. Posteriormente, en cada máquina, los datos son divididos en nprocs-1 partes, donde nprocs es el número de procesadores total de la máquina. Cada subdominio es asignado a un procesador y cada máquina dispone de un único procesador para gestionar las comunicaciones remotas con otras máquinas. 2. U-Bdomains: El particionamiento de los datos se realiza en dos fases. La primera fase es equivalente a la realizada para la distribución U-1domains. La segunda fase, divide, proporcionalmente, cada subdominio de datos en nprocs-B partes, donde B es el número de comunicaciones remotas con otras máquinas (dominios especiales). Cada máquina tiene más de un procesador para gestionar las comunicaciones remotas. 3. U-CBdomains: En esta distribución, se crean tantos dominios especiales como comunicaciones remotas. Sin embargo, ahora los dominios especiales son asignados a un único procesador dentro de la máquina. De esta forma, cada subdomino de datos es dividido en nprocs-1 partes. La gestión de las comunicaciones remotas se realiza concurrentemente mediante threads. Para evaluar el rendimiento de las aplicaciones sobre entornos Grid utilizamos Dimemas. Para cada caso, evaluamos el rendimiento de las aplicaciones en diferentes entornos y tipos de mallas. Los resultados obtenidos muestran que:· La distribución U-1domains reduce los tiempos de ejecución hasta un 45% respecto a la distribución balanceada. Sin embargo, esta distribución no resulta efectiva para entornos Grid compuestos de una gran cantidad de máquinas remotas.· La distribución U-Bdomains muestra ser más eficiente, ya que reduce el tiempo de ejecución hasta un 53%. Sin embargo, la escalabilidad de ésta distribución es moderada, debido a que puede llegar a tener un gran número de procesadores que no realizan cálculo intensivo. Estos procesadores únicamente gestionan las comunicaciones remotas. Como limite sólo podemos aplicar esta distribución si más del 50% de los procesadores en una máquina realizan cálculo.· La distribución U-CBdomains reduce los tiempos de ejecución hasta 30%, pero no resulta tan efectiva como la distribución U-Bdomains. Sin embargo, esta distribución incrementa la utilización de los procesadores en 50%, es decir que disminuye los procesadores ociosos
Développement d'algorithmes parallèles pour la simulation d'écoulements de fluides dans les milieux poreux
Problématique de la mécanique des fluides numérique en milieu poreux -- Méthode de Boltzmann sur réseau -- Origines -- Principe de la méthode -- Implantation numérique de MBR-BGK -- Réduction de la mémoire utilisée par MBR-BGK -- Amélioration de la performance de calcul de MBR-BGK -- Méthodes de MBR-BGK adaptatives -- Aspects parallèles de la méthode de Boltzmann sur réseau -- Contenu parallèle -- Communications -- Équilibrage de tâches -- Résumé et objectifs spécifiques -- On improving the performance of large parallel Lattice Boltzmann flow simulations in heterogeneous porous media -- The Lattice Boltzmann method -- Data structure and memory usage optimization -- Parallel workload balance & communication strategies -- Numerical experiments -- Conclusions and perspectives -- Development of theoretical parallel performance models for heterogeneous porous media -- A parallel workload balanced and memory efficient Lattice-Boltzmann algorithm with single unit BGK relaxation time -- LBM implementation, data structure and memory requirements -- Parallel workload balance & communication strategies -- Results and discussions -- Concluding remarks -- Effect of particle size distribution and packing compression on fluid permeability as predicted by Lattice-Boltzmann simulations
Parallel optimisation algorithms for multilevel mesh partitioning
Three parallel optimisation algorithms, for use in the context of multilevel graph partitioning of unstructured meshes, are described. The first, interface optimisation, reduces the computation to a set of independent optimisation problems in interface regions. The next, alternating optimisation, is a restriction of this technique in which mesh entities are only allowed to migrate between subdomains in one direction. The third treats the gain as a potential field and uses the concept of relative gain for selecting appropriate vertices to migrate. The results are compared and seen to produce very high global quality partitions, very rapidly. The results are also compared with another partitioning tool and shown to be of higher quality although taking longer to compute