12 research outputs found

    Adaptation au repartitionnement de graphes d'une méthode d'optimisation globale par diffusion

    Get PDF
    National audienceLa résolution parallèle efficace de simulations numériques dont les coûts de calcul évoluent au cours du temps (telles que celles mettant en oeuvre un remaillage dynamique) nécessite des méthodes efficaces de redistribution des données attribuées à chaque processeur. L'objet de cet article est d'étudier l'adaptation au repartitionnement de graphes, qui est un modèle courant du problème de redistribution des données, d'un ensemble d'algorithmes utilisés avec succès dans le cadre du partitionnement parallèle de graphes, et tout particulièrement d'un algorithme d'optimisation globale de la forme des partitions par diffusion. Le modèle expérimental exposé ici est séquentiel,mais les algorithmes présentés peuvent facilement être transposés en parallèle. Afin de valider notre approche, nous comparons nos résultats, implémentés au sein du logiciel SCOTCH, à la routine de repartitionnement mise en oeuvre au sein du logiciel ParMETIS

    A new diffusion-based multilevel algorithm for computing graph partitions of very high quality

    Full text link

    A Parallel Multilevel Metaheuristic for Graph Partitioning

    Full text link

    Multiscale modelling of blood flow in cerebral microcirculation: Details at capillary scale control accuracy at the level of the cortex

    Get PDF
    Aging or cerebral diseases may induce architectural modifications in human brain microvascular networks, such as capillary rarefaction. Such modifications limit blood and oxygen supply to the cortex, possibly resulting in energy failure and neuronal death. Modelling is key in understanding how these architectural modifications affect blood flow and mass transfers in such complex networks. However, the huge number of vessels in the human brain—tens of billions—prevents any modelling approach with an explicit architectural representation down to the scale of the capillaries. Here, we introduce a hybrid approach to model blood flow at larger scale in the brain microcirculation, based on its multiscale architecture. The capillary bed, which is a space-filling network, is treated as a porous medium and modelled using a homogenized continuum approach. The larger arteriolar and venular trees, which cannot be homogenized because of their fractal-like nature, are treated as a network of interconnected tubes with a detailed representation of their spatial organization. The main contribution of this work is to devise a proper coupling model at the interface between these two components. This model is based on analytical approximations of the pressure field that capture the strong pressure gradients building up in the capillaries connected to arterioles or venules. We evaluate the accuracy of this model for both very simple architectures with one arteriole and/or one venule and for more complex ones, with anatomically realistic tree-like vessels displaying a large number of coupling sites. We show that the hybrid model is very accurate in describing blood flow at large scales and further yields a significant computational gain by comparison with a classical network approach. It is therefore an important step towards large scale simulations of cerebral blood flow and lays the groundwork for introducing additional levels of complexity in the future

    Redistribution dynamique parallèle efficace de la charge pour les problèmes numériques de très grande taille

    Get PDF
    Cette thèse traite du problème de la redistribution dynamique parallèle efficace de la charge pour les problèmes numériques de très grande taille. Nous présentons tout d'abord un état de l'art des algorithmes permettant de résoudre les problèmes du partitionnement, du repartitionnement, du placement statique et du re-placement. Notre première contribution vise à étudier, dans un cadre séquentiel, les caractéristiques algorithmiques souhaitables pour les méthodes parallèles de repartitionnement. Nous y présentons notre contribution à la conception d'un schéma multi-niveaux k-aire pour le calcul sequentiel de repartitionnements. La partie la plus exigeante de cette adaptation concerne la phase d'expansion. L'une de nos contributions majeures a été de nous inspirer des méthodes d'influence afin d'adapter un algorithme de raffinement par diffusion au problème du repartitionnement.Notre deuxième contribution porte sur la mise en oeuvre de ces méthodes sur machines parallèles. L'adaptation du schéma multi-niveaux parallèle a nécessité une évolution des algorithmes et des structures de données mises en oeuvre pour le partitionnement. Ce travail est accompagné d'une analyse expérimentale, qui est rendue possible grâce à la mise en oeuvre des algorithmes considérés au sein de la bibliothèque Scotch.This thesis concerns efficient parallel dynamic load balancing for large scale numerical problems. First, we present a state of the art of the algorithms used to solve the partitioning, repartitioning, mapping and remapping problems. Our first contribution, in the context of sequential processing, is to define the desirable features that parallel repartitioning tools need to possess. We present our contribution to the conception of a k-way multilevel framework for sequential repartitioning. The most challenging part of this work regards the uncoarsening phase. One of our main contributions is the adaptation of influence methods to a global diffusion-based heuristic for the repartitioning problem. Our second contribution is the parallelization of these methods. The adaptation of the aforementioned algorithms required some modification of the algorithms and data structure used by existing parallel partitioning routines. This work is backed by a thorough experimental analysis, which is made possible thanks to the implementation of our algorithms into the Scotch library.BORDEAUX1-Bib.electronique (335229901) / SudocSudocFranceF

    Estrategias de descomposición en dominios para entornos Grid

    Get PDF
    En este trabajo estamos interesados en realizar simulaciones numéricas basadas en elementos finitos con integración explícita en el tiempo utilizando la tecnología Grid.Actualmente, las simulaciones explícitas de elementos finitos usan la técnica de descomposición en dominios con particiones balanceadas para realizar la distribución de los datos. Sin embargo, esta distribución de los datos presenta una degradación importante del rendimiento de las simulaciones explícitas cuando son ejecutadas en entornos Grid. Esto se debe principalmente, a que en un ambiente Grid tenemos comunicaciones heterogéneas, muy rápidas dentro de una máquina y muy lentas fuera de ella. De esta forma, una distribución balanceada de los datos se ejecuta a la velocidad de las comunicaciones más lentas. Para superar este problema proponemos solapar el tiempo de la comunicación remota con el tiempo de cálculo. Para ello, dedicaremos algunos procesadores a gestionar las comunicaciones más lentas, y el resto, a realizar cálculo intensivo. Este esquema de distribución de los datos, requiere que la descomposición en dominios sea no balanceada, para que, los procesadores dedicados a realizar la gestión de las comunicaciones lentas tengan apenas carga computacional. En este trabajo se han propuesto y analizado diferentes estrategias para distribuir los datos y mejorar el rendimiento de las aplicaciones en entornos Grid. Las estrategias de distribución estáticas analizadas son: 1. U-1domains: Inicialmente, el dominio de los datos es dividido proporcionalmente entre las máquinas dependiendo de su velocidad relativa. Posteriormente, en cada máquina, los datos son divididos en nprocs-1 partes, donde nprocs es el número de procesadores total de la máquina. Cada subdominio es asignado a un procesador y cada máquina dispone de un único procesador para gestionar las comunicaciones remotas con otras máquinas. 2. U-Bdomains: El particionamiento de los datos se realiza en dos fases. La primera fase es equivalente a la realizada para la distribución U-1domains. La segunda fase, divide, proporcionalmente, cada subdominio de datos en nprocs-B partes, donde B es el número de comunicaciones remotas con otras máquinas (dominios especiales). Cada máquina tiene más de un procesador para gestionar las comunicaciones remotas. 3. U-CBdomains: En esta distribución, se crean tantos dominios especiales como comunicaciones remotas. Sin embargo, ahora los dominios especiales son asignados a un único procesador dentro de la máquina. De esta forma, cada subdomino de datos es dividido en nprocs-1 partes. La gestión de las comunicaciones remotas se realiza concurrentemente mediante threads. Para evaluar el rendimiento de las aplicaciones sobre entornos Grid utilizamos Dimemas. Para cada caso, evaluamos el rendimiento de las aplicaciones en diferentes entornos y tipos de mallas. Los resultados obtenidos muestran que:· La distribución U-1domains reduce los tiempos de ejecución hasta un 45% respecto a la distribución balanceada. Sin embargo, esta distribución no resulta efectiva para entornos Grid compuestos de una gran cantidad de máquinas remotas.· La distribución U-Bdomains muestra ser más eficiente, ya que reduce el tiempo de ejecución hasta un 53%. Sin embargo, la escalabilidad de ésta distribución es moderada, debido a que puede llegar a tener un gran número de procesadores que no realizan cálculo intensivo. Estos procesadores únicamente gestionan las comunicaciones remotas. Como limite sólo podemos aplicar esta distribución si más del 50% de los procesadores en una máquina realizan cálculo.· La distribución U-CBdomains reduce los tiempos de ejecución hasta 30%, pero no resulta tan efectiva como la distribución U-Bdomains. Sin embargo, esta distribución incrementa la utilización de los procesadores en 50%, es decir que disminuye los procesadores ociosos

    Développement d'algorithmes parallèles pour la simulation d'écoulements de fluides dans les milieux poreux

    Get PDF
    Problématique de la mécanique des fluides numérique en milieu poreux -- Méthode de Boltzmann sur réseau -- Origines -- Principe de la méthode -- Implantation numérique de MBR-BGK -- Réduction de la mémoire utilisée par MBR-BGK -- Amélioration de la performance de calcul de MBR-BGK -- Méthodes de MBR-BGK adaptatives -- Aspects parallèles de la méthode de Boltzmann sur réseau -- Contenu parallèle -- Communications -- Équilibrage de tâches -- Résumé et objectifs spécifiques -- On improving the performance of large parallel Lattice Boltzmann flow simulations in heterogeneous porous media -- The Lattice Boltzmann method -- Data structure and memory usage optimization -- Parallel workload balance & communication strategies -- Numerical experiments -- Conclusions and perspectives -- Development of theoretical parallel performance models for heterogeneous porous media -- A parallel workload balanced and memory efficient Lattice-Boltzmann algorithm with single unit BGK relaxation time -- LBM implementation, data structure and memory requirements -- Parallel workload balance & communication strategies -- Results and discussions -- Concluding remarks -- Effect of particle size distribution and packing compression on fluid permeability as predicted by Lattice-Boltzmann simulations

    Parallel optimisation algorithms for multilevel mesh partitioning

    No full text
    Three parallel optimisation algorithms, for use in the context of multilevel graph partitioning of unstructured meshes, are described. The first, interface optimisation, reduces the computation to a set of independent optimisation problems in interface regions. The next, alternating optimisation, is a restriction of this technique in which mesh entities are only allowed to migrate between subdomains in one direction. The third treats the gain as a potential field and uses the concept of relative gain for selecting appropriate vertices to migrate. The results are compared and seen to produce very high global quality partitions, very rapidly. The results are also compared with another partitioning tool and shown to be of higher quality although taking longer to compute
    corecore