34 research outputs found

    Row Compression and Nested Product Decomposition of a Hierarchical Representation of a Quasiseparable Matrix

    Get PDF
    This research introduces a row compression and nested product decomposition of an nxn hierarchical representation of a rank structured matrix A, which extends the compression and nested product decomposition of a quasiseparable matrix. The hierarchical parameter extraction algorithm of a quasiseparable matrix is efficient, requiring only O(nlog(n))operations, and is proven backward stable. The row compression is comprised of a sequence of small Householder transformations that are formed from the low-rank, lower triangular, off-diagonal blocks of the hierarchical representation. The row compression forms a factorization of matrix A, where A = QC, Q is the product of the Householder transformations, and C preserves the low-rank structure in both the lower and upper triangular parts of matrix A. The nested product decomposition is accomplished by applying a sequence of orthogonal transformations to the low-rank, upper triangular, off-diagonal blocks of the compressed matrix C. Both the compression and decomposition algorithms are stable, and require O(nlog(n)) operations. At this point, the matrix-vector product and solver algorithms are the only ones fully proven to be backward stable for quasiseparable matrices. By combining the fast matrix-vector product and system solver, linear systems involving the hierarchical representation to nested product decomposition are directly solved with linear complexity and unconditional stability. Applications in image deblurring and compression, that capitalize on the concepts from the row compression and nested product decomposition algorithms, will be shown

    Méthodes hybrides pour la résolution de grands systèmes linéaires creux sur calculateurs parallèles

    Get PDF
    Nous nous intéressons à la résolution en parallèle de système d’équations linéaires creux et de large taille. Le calcul de la solution d’un tel type de système requiert un grand espace mémoire et une grande puissance de calcul. Il existe deux principales méthodes de résolution de systèmes linéaires. Soit la méthode est directe et de ce fait est rapide et précise, mais consomme beaucoup de mémoire. Soit elle est itérative, économe en mémoire, mais assez lente à atteindre une solution de qualité suffisante. Notre travail consiste à combiner ces deux techniques pour créer un solveur hybride efficient en consommation mémoire tout en étant rapide et robuste. Nous essayons ensuite d’améliorer ce solveur en introduisant une nouvelle méthode pseudo directe qui contourne certains inconvénients de la méthode précédente. Dans les premiers chapitres nous examinons les méthodes de projections par lignes, en particulier la méthode Cimmino en bloc, certains de leurs aspects numériques et comment ils affectent la convergence. Ensuite, nous analyserons l’accélération de ces techniques avec la méthode des gradients conjugués et comment cette accélération peut être améliorée avec une version en bloc du gradient conjugué. Nous regarderons ensuite comment le partitionnement du système linéaire affecte lui aussi la convergence et comment nous pouvons améliorer sa qualité. Finalement, nous examinerons l’implantation en parallèle du solveur hybride, ses performances ainsi que les améliorations possible. Les deux derniers chapitres introduisent une amélioration à ce solveur hybride, en améliorant les propriétés numériques du système linéaire, de sorte à avoir une convergence en une seule itération et donc un solveur pseudo direct. Nous commençons par examiner les propriétés numériques du système résultants, analyser la solution parallèle et comment elle se comporte face au solveur hybride et face à un solveur direct. Finalement, nous introduisons de possible amélioration au solveur pseudo direct. Ce travail a permis d’implanter un solveur hybride "ABCD solver" (Augmented Block Cimmino Distributed solver) qui peut soit fonctionner en mode itératif ou en mode pseudo direct. ABSTRACT : We are interested in solving large sparse systems of linear equations in parallel. Computing the solution of such systems requires a large amount of memory and computational power. The two main ways to obtain the solution are direct and iterative approaches. The former achieves this goal fast but with a large memory footprint while the latter is memory friendly but can be slow to converge. In this work we try first to combine both approaches to create a hybrid solver that can be memory efficient while being fast. Then we discuss a novel approach that creates a pseudo-direct solver that compensates for the drawback of the earlier approach. In the first chapters we take a look at row projection techniques, especially the block Cimmino method and examine some of their numerical aspects and how they affect the convergence. We then discuss the acceleration of convergence using conjugate gradients and show that a block version improves the convergence. Next, we see how partitioning the linear system affects the convergence and show how to improve its quality. We finish by discussing the parallel implementation of the hybrid solver, discussing its performance and seeing how it can be improved. The last two chapters focus on an improvement to this hybrid solver. We try to improve the numerical properties of the linear system so that we converge in a single iteration which results in a pseudo-direct solver. We first discuss the numerical properties of the new system, see how it works in parallel and see how it performs versus the iterative version and versus a direct solver. We finally consider some possible improvements to the solver. This work led to the implementation of a hybrid solver, our "ABCD solver" (Augmented Block Cimmino Distributed solver), that can either work in a fully iterative mode or in a pseudo-direct mode

    The solution of large sparse linear systems on parallel computers using a hybrid implementation of the block Cimmino method

    Get PDF
    We are interested in solving large sparse systems of linear equations in parallel. Computing the solution of such systems requires a large amount of memory and computational power. The two main ways to obtain the solution are direct and iterative approaches. The former achieves this goal fast but with a large memory footprint while the latter is memory friendly but can be slow to converge. In this work we try first to combine both approaches to create a hybrid solver that can be memory efficient while being fast. Then we discuss a novel approach that creates a pseudo-direct solver that compensates for the drawback of the earlier approach. In the first chapters we take a look at row projection techniques, especially the block Cimmino method and examine some of their numerical aspects and how they affect the convergence. We then discuss the acceleration of convergence using conjugate gradients and show that a block version improves the convergence. Next, we see how partitioning the linear system affects the convergence and show how to improve its quality. We finish by discussing the parallel implementation of the hybrid solver, discussing its performance and seeing how it can be improved. The last two chapters focus on an improvement to this hybrid solver. We try to improve the numerical properties of the linear system so that we converge in a single iteration which results in a pseudo-direct solver. We first discuss the numerical properties of the new system, see how it works in parallel and see how it performs versus the iterative version and versus a direct solver. We finally consider some possible improvements to the solver. This work led to the implementation of a hybrid solver, our "ABCD solver" (Augmented Block Cimmino Distributed solver), that can either work in a fully iterative mode or in a pseudo-direct mode

    Cascade equations and hadronic interactions at high energies

    Get PDF
    The new matrix form of cascade equations is convenient to discuss numerical properties and to investigate the role of hadrons and phase-space for atmospheric leptons. Precision is often limited by hadronic interactions models. I improved the event generator DPMJET-III using experimental data including the LHC. A specific curvature in charged-particle multiplicity distributions raised questions about elastic scattering amplitude and the black disk limit at LHC energies

    Iterative and parallel methods for linear systems, with applications in circuit simulation

    Get PDF
    Bij het ontwerp van elektronische schakelingen, ie gebruikt wor en in bijvoorbeeld CD-spelers en mobiele telefoons, maakt e ontwerper veelvul ig gebruik van circuitsimulatie Bij circuitsimulatie wor t het ge rag van een schakeling (circuit) oorgereken met een computer Hier oor wor t het maken van ure prototypes groten eels overbo ig Ook zou zon er eze simulaties het ontwerpen van complexe ge¨integreer e schakelingen, met vele uizen en transistoren, con ensatoren, weerstan en en ergelijke, niet mogelijk zijn Om snel een circuit te kunnen ontwerpen is het voor e ontwerper van belang at e simulatie niet te veel (computer-)rekentij kost Met snellere (slimmere) rekenmetho en en ook met snellere computers, kan e rekentij verkort wor en Dit proefschrift gaat groten eels over metho en ie tot oel hebben e rekentij voor het simuleren van een circuit korter te maken De nieuwe metho en ie we ontwikkel hebben zou en echter ook nuttig kunnen zijn bij e simulatie van an ere verschijnselen, zoals bijvoorbeel vloeistofstromingen en chemische processen Bij het simuleren van circuits wor t e meeste rekentij gebruikt voor het oplossen van grote stelsels lineaire algebra¨ische vergelijkingen Een stelsel van 2 vergelijkingen met 2 onbeken en, x en y, is bijvoorbeel 3x +5y =14 2x 3y =3, met als oplossing x =3eny = 1 Bij circuitsimulatie kunnen e stelsels zeer veel, bijvoorbeel meer an 50000, vergelijkingen hebben en evenveel onbeken en Deze stelsels hebben an wel een ijle structuur Dat wil zeggen at er veel vergelijkingen zijn ie slechts van een klein aantal onbeken en afhangen Door op een slimme manier gebruik te maken van eze structuur kan er veel rekentij bespaar wor en Na het inlei en e eerste hoof stuk beschrijven we in e hoof stukken 2 en 3 een gecombineer e irecte en iteratieve metho e voor het oplossen van eze stelsels vergelijkingen Bij een irecte metho e wor en onbeken en weggewerkt oor een geschikt veelvou van een vergelijking bij een an ere vergelijking op te tellen Op eze manier kan uitein- elijk e oplossing van het grote stelsel uitgereken wor en Bij een iteratieve metho e gebeurt ongeveer hetzelf e, maar e hoeveelhei rekenwerk wor t sterk beperkt oor op geschikte plaatsen in het proces co¨effici¨enten te verwaarlozen Het resultaat is an wel een bena ering van e oplossing in plaats van e exacte oplossing Men tracht e fout in e oplossing te verkleinen oor een correctie op e oplossing aan te brengen Deze correctie wor t gevon en oor een vergelijking voor e fout op te stellen en eze even-eens bij bena ering op te lossen Dit wor t herhaal tot at een vol oen nauwkeurige oplossing gevonden is In e praktijk maken circuitsimulatie-programma s vooral gebruik van irecte metho- en, om at eze sneller bleken te zijn an e tot nu toe bestaan e iteratieve metho en In hoof stuk 2 laten we zien at een gecombineer e irecte en iteratieve metho e wel rie keer sneller kan zijn an een irecte metho e Een prettige bijkomstighei van eze aanpak is at hij ook geschikt is voor parallelle computers Dat zijn computers waarin twee of meer processoren samenwerken Met eze computers kan het rekenwerk ver er versnel wor en met een factor ie kan oplopen tot het aantal processoren Hoofdstuk 4 gaat over het oplossen van lineaire stelsels vergelijkingen die optreden bij het simuleren van de periodieke stabiele toestan van een circuit Het gaat hierbij om circuits waarvan alle spannings- en stroombronnen periodiek zijn in de tijd. Dit heeft tot gevolg dat alle spanningen en stromen in het circuit zich na een bepaalde periode herhalen Simulatie van deze circuits geeft lineaire stelsels met een cyclische structuur Bestaande methoden voor it soort stelsels zijn niet zo goed geschikt voor parallelle computers De methode die we in hoofdstuk 4 voorstellen is dat wel De totale hoeveelheid rekenwerk is bij deze methode iets groter dan bij de bestaande methoden, maar dankzij het parallellisme kunnen de stelsels vergelijkingen op een parallelle computer toch beduiden sneller worden opgelost Hoofdstuk 5 gaat over een iteratieve methode voor lineaire stelsels vergelijkingen waarbij de co¨effici¨entenmatrix een polynoom is van een andere matrix Dit type lineaire stelsels komt onder andere voor bij een toepassing in de natuurkunde Er zijn (nog) geen toepassingen in circuitsimulatie Door de speciale structuur van het stelsel uit te buiten verkrijgen we een effici¨ente methode De nieuwe methode geeft vaak iets nauwkeuriger resultaten dan de bestaande methoden voor dit soort stelsel

    Numerical Boundary Condition Procedures

    Get PDF
    Topics include numerical procedures for treating inflow and outflow boundaries, steady and unsteady discontinuous surfaces, far field boundaries, and multiblock grids. In addition, the effects of numerical boundary approximations on stability, accuracy, and convergence rate of the numerical solution are discussed

    Author index for volumes 101–200

    Get PDF

    A Finite Difference Representation of Neutrino Radiation Hydrodynamics in Spherically Symmetric General Relativistic Space-Time

    Full text link
    We present an implicit finite difference representation for general relativistic radiation hydrodynamics in spherical symmetry. Our code, Agile-Boltztran, solves the Boltzmann transport equation for the angular and spectral neutrino distribution functions in self-consistent simulations of stellar core collapse and postbounce evolution. It implements a dynamically adaptive grid in comoving coordinates. Most macroscopically interesting physical quantities are defined by expectation values of the distribution function. We optimize the finite differencing of the microscopic transport equation for a consistent evolution of important expectation values. We test our code in simulations launched from progenitor stars with 13 solar masses and 40 solar masses. ~0.5 s after core collapse and bounce, the protoneutron star in the latter case reaches its maximum mass and collapses further to form a black hole. When the hydrostatic gravitational contraction sets in, we find a transient increase in electron flavor neutrino luminosities due to a change in the accretion rate. The muon- and tauon-neutrino luminosities and rms energies, however, continue to rise because previously shock-heated material with a non-degenerate electron gas starts to replace the cool degenerate material at their production site. We demonstrate this by supplementing the concept of neutrinospheres with a more detailed statistical description of the origin of escaping neutrinos. We compare the evolution of the 13 solar mass progenitor star to simulations with the MGFLD approximation, based on a recently developed flux limiter. We find similar results in the postbounce phase and validate this MGFLD approach for the spherically symmetric case with standard input physics.Comment: reformatted to 63 pages, 24 figures, to be published in ApJ
    corecore