34 research outputs found
Row Compression and Nested Product Decomposition of a Hierarchical Representation of a Quasiseparable Matrix
This research introduces a row compression and nested product decomposition of an nxn hierarchical representation of a rank structured matrix A, which extends the compression and nested product decomposition of a quasiseparable matrix. The hierarchical parameter extraction algorithm of a quasiseparable matrix is efficient, requiring only O(nlog(n))operations, and is proven backward stable. The row compression is comprised of a sequence of small Householder transformations that are formed from the low-rank, lower triangular, off-diagonal blocks of the hierarchical representation. The row compression forms a factorization of matrix A, where A = QC, Q is the product of the Householder transformations, and C preserves the low-rank structure in both the lower and upper triangular parts of matrix A. The nested product decomposition is accomplished by applying a sequence of orthogonal transformations to the low-rank, upper triangular, off-diagonal blocks of the compressed matrix C. Both the compression and decomposition algorithms are stable, and require O(nlog(n)) operations. At this point, the matrix-vector product and solver algorithms are the only ones fully proven to be backward stable for quasiseparable matrices. By combining the fast matrix-vector product and system solver, linear systems involving the hierarchical representation to nested product decomposition are directly solved with linear complexity and unconditional stability. Applications in image deblurring and compression, that capitalize on the concepts from the row compression and nested product decomposition algorithms, will be shown
Méthodes hybrides pour la résolution de grands systèmes linéaires creux sur calculateurs parallèles
Nous nous intéressons à la résolution en parallèle de système d’équations linéaires creux et de large taille. Le calcul de la solution d’un tel type de système requiert un grand espace mémoire et une grande puissance de calcul. Il existe deux principales méthodes de résolution de systèmes linéaires. Soit la méthode est directe et de ce fait est rapide et précise, mais consomme beaucoup de mémoire. Soit elle est itérative, économe en mémoire, mais assez lente à atteindre une solution de qualité suffisante. Notre travail consiste à combiner ces deux techniques pour créer un solveur hybride efficient en consommation mémoire tout en étant rapide et robuste. Nous essayons ensuite d’améliorer ce solveur en introduisant une nouvelle méthode pseudo directe qui contourne certains inconvénients de la méthode précédente. Dans les premiers chapitres nous examinons les méthodes de projections par lignes, en particulier la méthode Cimmino en bloc, certains de leurs aspects numériques et comment ils affectent la convergence. Ensuite, nous analyserons l’accélération de ces techniques avec la méthode des gradients conjugués et comment cette accélération peut être améliorée avec une version en bloc du gradient conjugué. Nous regarderons ensuite comment le partitionnement du système linéaire affecte lui aussi la convergence et comment nous pouvons améliorer sa qualité. Finalement, nous examinerons l’implantation en parallèle du solveur hybride, ses performances ainsi que les améliorations possible. Les deux derniers chapitres introduisent une amélioration à ce solveur hybride, en améliorant les propriétés numériques du système linéaire, de sorte à avoir une convergence en une seule itération et donc un solveur pseudo direct. Nous commençons par examiner les propriétés numériques du système résultants, analyser la solution parallèle et comment elle se comporte face au solveur hybride et face à un solveur direct. Finalement, nous introduisons de possible amélioration au solveur pseudo direct. Ce travail a permis d’implanter un solveur hybride "ABCD solver" (Augmented Block Cimmino Distributed solver) qui peut soit fonctionner en mode itératif ou en mode pseudo direct. ABSTRACT : We are interested in solving large sparse systems of linear equations in parallel. Computing the solution of such systems requires a large amount of memory and computational power. The two main ways to obtain the solution are direct and iterative approaches. The former achieves this goal fast but with a large memory footprint while the latter is memory friendly but can be slow to converge. In this work we try first to combine both approaches to create a hybrid solver that can be memory efficient while being fast. Then we discuss a novel approach that creates a pseudo-direct solver that compensates for the drawback of the earlier approach. In the first chapters we take a look at row projection techniques, especially the block Cimmino method and examine some of their numerical aspects and how they affect the convergence. We then discuss the acceleration of convergence using conjugate gradients and show that a block version improves the convergence. Next, we see how partitioning the linear system affects the convergence and show how to improve its quality. We finish by discussing the parallel implementation of the hybrid solver, discussing its performance and seeing how it can be improved. The last two chapters focus on an improvement to this hybrid solver. We try to improve the numerical properties of the linear system so that we converge in a single iteration which results in a pseudo-direct solver. We first discuss the numerical properties of the new system, see how it works in parallel and see how it performs versus the iterative version and versus a direct solver. We finally consider some possible improvements to the solver. This work led to the implementation of a hybrid solver, our "ABCD solver" (Augmented Block Cimmino Distributed solver), that can either work in a fully iterative mode or in a pseudo-direct mode
The solution of large sparse linear systems on parallel computers using a hybrid implementation of the block Cimmino method
We are interested in solving large sparse systems of linear equations in parallel. Computing the solution of such systems requires a large amount of memory and computational power. The two main ways to obtain the solution are direct and iterative approaches. The former achieves this goal fast but with a large memory footprint while the latter is memory friendly but can be slow to converge. In this work we try first to combine both approaches to create a hybrid solver that can be memory efficient while being fast. Then we discuss a novel approach that creates a pseudo-direct solver that compensates for the drawback of the earlier approach. In the first chapters we take a look at row projection techniques, especially the block Cimmino method and examine some of their numerical aspects and how they affect the convergence. We then discuss the acceleration of convergence using conjugate gradients and show that a block version improves the convergence. Next, we see how partitioning the linear system affects the convergence and show how to improve its quality. We finish by discussing the parallel implementation of the hybrid solver, discussing its performance and seeing how it can be improved. The last two chapters focus on an improvement to this hybrid solver. We try to improve the numerical properties of the linear system so that we converge in a single iteration which results in a pseudo-direct solver. We first discuss the numerical properties of the new system, see how it works in parallel and see how it performs versus the iterative version and versus a direct solver. We finally consider some possible improvements to the solver. This work led to the implementation of a hybrid solver, our "ABCD solver" (Augmented Block Cimmino Distributed solver), that can either work in a fully iterative mode or in a pseudo-direct mode
Cascade equations and hadronic interactions at high energies
The new matrix form of cascade equations is convenient to discuss numerical properties and to investigate the role of hadrons and phase-space for atmospheric leptons. Precision is often limited by hadronic interactions models. I improved the event generator DPMJET-III using experimental data including the LHC. A specific curvature in charged-particle multiplicity distributions raised questions about elastic scattering amplitude and the black disk limit at LHC energies
Iterative and parallel methods for linear systems, with applications in circuit simulation
Bij het ontwerp van elektronische schakelingen, ie gebruikt wor en in bijvoorbeeld CD-spelers
en mobiele telefoons, maakt e ontwerper veelvul ig gebruik van circuitsimulatie
Bij circuitsimulatie wor t het ge rag van een schakeling (circuit) oorgereken met een
computer Hier oor wor t het maken van ure prototypes groten eels overbo ig Ook
zou zon er eze simulaties het ontwerpen van complexe ge¨integreer e schakelingen, met
vele uizen en transistoren, con ensatoren, weerstan en en ergelijke, niet mogelijk
zijn Om snel een circuit te kunnen ontwerpen is het voor e ontwerper van belang at e
simulatie niet te veel (computer-)rekentij kost Met snellere (slimmere) rekenmetho en
en ook met snellere computers, kan e rekentij verkort wor en
Dit proefschrift gaat groten eels over metho en ie tot oel hebben e rekentij voor
het simuleren van een circuit korter te maken De nieuwe metho en ie we ontwikkel
hebben zou en echter ook nuttig kunnen zijn bij e simulatie van an ere verschijnselen,
zoals bijvoorbeel vloeistofstromingen en chemische processen
Bij het simuleren van circuits wor t e meeste rekentij gebruikt voor het oplossen
van grote stelsels lineaire algebra¨ische vergelijkingen Een stelsel van 2 vergelijkingen
met 2 onbeken en, x en y, is bijvoorbeel
3x +5y =14
2x 3y =3,
met als oplossing x =3eny = 1 Bij circuitsimulatie kunnen e stelsels zeer veel,
bijvoorbeel meer an 50000, vergelijkingen hebben en evenveel onbeken en Deze
stelsels hebben an wel een ijle structuur Dat wil zeggen at er veel vergelijkingen
zijn ie slechts van een klein aantal onbeken en afhangen Door op een slimme manier
gebruik te maken van eze structuur kan er veel rekentij bespaar wor en Na het
inlei en e eerste hoof stuk beschrijven we in e hoof stukken 2 en 3 een gecombineer e
irecte en iteratieve metho e voor het oplossen van eze stelsels vergelijkingen
Bij een irecte metho e wor en onbeken en weggewerkt oor een geschikt veelvou
van een vergelijking bij een an ere vergelijking op te tellen Op eze manier kan uitein-
elijk e oplossing van het grote stelsel uitgereken wor en Bij een iteratieve metho e
gebeurt ongeveer hetzelf e, maar e hoeveelhei rekenwerk wor t sterk beperkt oor op
geschikte plaatsen in het proces co¨effici¨enten te verwaarlozen Het resultaat is an wel
een bena ering van e oplossing in plaats van e exacte oplossing Men tracht e fout
in e oplossing te verkleinen oor een correctie op e oplossing aan te brengen Deze
correctie wor t gevon en oor een vergelijking voor e fout op te stellen en eze even-eens
bij bena ering op te lossen Dit wor t herhaal tot at een vol oen nauwkeurige
oplossing gevonden is In e praktijk maken circuitsimulatie-programma s vooral gebruik van irecte metho-
en, om at eze sneller bleken te zijn an e tot nu toe bestaan e iteratieve metho en
In hoof stuk 2 laten we zien at een gecombineer e irecte en iteratieve metho e wel
rie keer sneller kan zijn an een irecte metho e Een prettige bijkomstighei van eze
aanpak is at hij ook geschikt is voor parallelle computers Dat zijn computers waarin
twee of meer processoren samenwerken Met eze computers kan het rekenwerk ver er
versnel wor en met een factor ie kan oplopen tot het aantal processoren
Hoofdstuk 4 gaat over het oplossen van lineaire stelsels vergelijkingen die optreden
bij het simuleren van de periodieke stabiele toestan van een circuit Het gaat hierbij om
circuits waarvan alle spannings- en stroombronnen periodiek zijn in de tijd. Dit heeft
tot gevolg dat alle spanningen en stromen in het circuit zich na een bepaalde periode
herhalen Simulatie van deze circuits geeft lineaire stelsels met een cyclische structuur
Bestaande methoden voor it soort stelsels zijn niet zo goed geschikt voor parallelle
computers De methode die we in hoofdstuk 4 voorstellen is dat wel De totale hoeveelheid
rekenwerk is bij deze methode iets groter dan bij de bestaande methoden, maar dankzij het parallellisme kunnen de stelsels vergelijkingen op een parallelle computer
toch beduiden sneller worden opgelost
Hoofdstuk 5 gaat over een iteratieve methode voor lineaire stelsels vergelijkingen
waarbij de co¨effici¨entenmatrix een polynoom is van een andere matrix Dit type lineaire
stelsels komt onder andere voor bij een toepassing in de natuurkunde Er zijn (nog) geen
toepassingen in circuitsimulatie Door de speciale structuur van het stelsel uit te buiten
verkrijgen we een effici¨ente methode De nieuwe methode geeft vaak iets nauwkeuriger
resultaten dan de bestaande methoden voor dit soort stelsel
Numerical Boundary Condition Procedures
Topics include numerical procedures for treating inflow and outflow boundaries, steady and unsteady discontinuous surfaces, far field boundaries, and multiblock grids. In addition, the effects of numerical boundary approximations on stability, accuracy, and convergence rate of the numerical solution are discussed
A Finite Difference Representation of Neutrino Radiation Hydrodynamics in Spherically Symmetric General Relativistic Space-Time
We present an implicit finite difference representation for general
relativistic radiation hydrodynamics in spherical symmetry. Our code,
Agile-Boltztran, solves the Boltzmann transport equation for the angular and
spectral neutrino distribution functions in self-consistent simulations of
stellar core collapse and postbounce evolution. It implements a dynamically
adaptive grid in comoving coordinates. Most macroscopically interesting
physical quantities are defined by expectation values of the distribution
function. We optimize the finite differencing of the microscopic transport
equation for a consistent evolution of important expectation values. We test
our code in simulations launched from progenitor stars with 13 solar masses and
40 solar masses. ~0.5 s after core collapse and bounce, the protoneutron star
in the latter case reaches its maximum mass and collapses further to form a
black hole. When the hydrostatic gravitational contraction sets in, we find a
transient increase in electron flavor neutrino luminosities due to a change in
the accretion rate. The muon- and tauon-neutrino luminosities and rms energies,
however, continue to rise because previously shock-heated material with a
non-degenerate electron gas starts to replace the cool degenerate material at
their production site. We demonstrate this by supplementing the concept of
neutrinospheres with a more detailed statistical description of the origin of
escaping neutrinos. We compare the evolution of the 13 solar mass progenitor
star to simulations with the MGFLD approximation, based on a recently developed
flux limiter. We find similar results in the postbounce phase and validate this
MGFLD approach for the spherically symmetric case with standard input physics.Comment: reformatted to 63 pages, 24 figures, to be published in ApJ