3 research outputs found

    Parallel bidiagonalization of a dense matrix

    Get PDF
    A new stable method for the reduction of rectangular dense matrices to bidiagonal form has been proposed recently. This is a one-sided method since it can be entirely expressed in terms of operations with (full) columns of the matrix under transformation. The algorithm is well suited to parallel computing and, in order to make it even more attractive for distributed memory systems, we introduce a modification which halves the number of communication instances. In this paper we present such a modification. A block organization of the algorithm to use level~3 BLAS routines seems difficult and, at least for the moment, it relies upon level~2 BLAS routines. Nevertheless, we found that our sequential code is competitive with the LAPACK DGEBRD routine. We also compare the time taken by our parallel codes and the ScaLAPACK PDGEBRD routine. We investigated the best data distribution schemes for the different codes and we can state that our parallel codes are also competitive with the ScaLAPACK routine.Funda莽茫o para a Ci锚ncia e a Tecnologia (FCT) - programa POCI 2010

    Algoritmos de Altas Prestaciones para el C谩lculo de la Descomposici贸n en Valores Singulares y su Aplicaci贸n a la Reducci贸n de Modelos de Sistemas Lineales de Control

    Full text link
    P ARA calcular la descomposici贸n en valores singulares (DVS) de una matriz real densa, los m茅todos tradicionales empiezan por reducir la matriz a una forma bidiagonal y seguidamente calculan la DVS de esa matriz bidiagonal. El proceso para reducir la matriz inicial a la forma bidiagonal es conocido como el m茅todo de la bidiagonalizaci贸n, que en general consiste en la aplicaci贸n de sucesivas transformaciones de Householder, por la izquierda y por la derecha de la matriz. El hecho de que las transformaciones sean aplicadas por los dos lados de la matriz, repercute negativamente en los costes de comunicaciones de una implementaci贸n paralela destinada a sistemas de memoria distribuida. Ralha y Barlow presentaron dos nuevos m茅todos para la bidiagonalizaci贸n de matrices densas en los que las transformaciones de Householder son aplicadas solamente por el lado derecho de la matriz. Esto permite de nir todas las operaciones en t茅rminos de las columnas de la matriz a transformar, facilitando as铆 el desarrollo de implementaciones paralelas y que adem谩s reducen las comunicaciones necesarias. En esta tesis se ha realizado un estudio comparativo entre las implementaciones secuenciales y paralelas de los m茅todos presentados por Ralha y por Barlow, desarrolladas en el entorno de las librer铆as LAPACK y SCALAPACK, y las correspondientes rutinas de estas librer铆as. Como trabajo novedoso se han introducido algunas modi caciones en el m茅todo de Barlow con el objetivo de reducir el n煤mero de comunicaciones en la implementaci贸n paralela. Tras estas l铆neas de investigaci贸n, el paso siguiente es calcular la DVS de la matriz bidiagonal superior. Sin embargo, el problema de calcular la DVS de una matriz bidiagonal superior puede verse como el problema de calcular la descomposici贸n en valores propios (DVP) de una matriz tridiagonal sim茅trica. Una vez calculada la DVP de la matriz tridiagonal sim茅trica es posible obtener la DVS de la matriz bidiagonal superior y con ella, la DVS de la matriz inicial. La principal motivaci贸n para esta estrategia es el desarrollo de una implementaci贸n paralela, sin comunicaciones, del m茅todo zeroinNR propuesto por Ralha en su tesis doctoral, para el c谩lculo de la DVP de matrices tridiagonales sim茅tricas y el correspondiente estudio comparativo con la implementaci贸n paralela est谩ndar, la cual contiene comunicaciones. Como 谩mbito de aplicaci贸n de la DVS se ha estudiado la reducci贸n de modelos de sistemas lineales de control, basado en la diagonalizaci贸n simult谩nea de los Gramianos de controlabilidad y de observabilidad, y nuestro enfoque va dirigido a la reducci贸n a la forma bidiagonal superior del producto matricial sin calcular expl铆citamente ese producto y, para ello, se han desarrollado implementaciones secuenciales y paralelas del m茅todo propuesto por Golub, por S酶lna y por van Dooren. Los resultados presentados en esta tesis han sido obtenidos en los recursos computacionales ofrecidos por el Grupo de Redes y Computaci贸n de Altas Prestaciones (GRyCAP) de la Universitat Polit猫cnica de Val猫ncia (UPV) y por el consorcio SEARCH1 de la Universidad del Minho (UM).Da Silva Sanches De Campos, CA. (2014). Algoritmos de Altas Prestaciones para el C谩lculo de la Descomposici贸n en Valores Singulares y su Aplicaci贸n a la Reducci贸n de Modelos de Sistemas Lineales de Control [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/48531TESI

    Algoritmos paralelos para la reducci贸n de sistemas lineales de control estables

    Full text link
    [EN] In the field of control theory, sometimes system models of big size (with many state variables) appear. When one of these high order systems needs to be simulated, studied or controlled, it is convenient to perform a previous work of model reduction in order to reduce the necessary (economic and temporal) costs. This process of obtaining a low order adequate representation of the original system usually has a high cost, because it has to be done with the original unreduced system. Thus, it is important to have high performance implementations for the problem of reducing linear control systems. In this thesis high performance implementations for some methods of model reduction have been developed. Current algorithms for model reduction of stable linear control systems and their implementation in the control library SLICOT have been analysed. New parallel algorithms for the methods strongly based on solving Lyapunov equations have been proposed. The new developed routines are incorporated in the high performance library for control PSLICOT. Apart from the main functions in charge of model reduction, all operations appearing in the problem and not having a high performance version yet have also been parallelised. One of these operations is the solution of Lyapunov equations in standard form. Parallel routines for solving these equations have been developed. These routines solve the equation obtaining directly the Cholesky factor of the solution, which fits better their application in model reduction. For this, Hammarling's method has been parallelised. The new routines solve in parallel and for dense matrices the four possible variants of standard Lyapunov equations: discrete and continuous versions, both transposed and not transposed. Interfaces offered by all the parallelised routines are similar to that of the existing routines in ScaLAPACK library, so they are easy to use from a user of this kind of libraries. The new routines work with the same data distribution used in this library: 2D block cyclic distribution, which allows many other distributions. Thanks to the developed work, now there are available high performance parallel routines to reduce linear control systems by using different variants of the Square-Root Balance & Truncate model reduction method: with or without balancing and with or without using the singular perturbation approximation formulas. They are parallel implementations of the same algorithms and methods used in the sequential routines of the SLICOT library. This allows to efficiently reduce models of linear control systems of big size. Moreover, existing software in ScaLAPACK for the eigenvalue problem has been improved by covering cases not treated there: the solution of the generalised problem (by transforming it into standard form, which is not always possible) and the computation of the eigenvectors. This part of the work has been applied to a real problem of simulation of oceanic flows. Here, it is necessary to compute all the eigenvalues and eigenvectors of a generalised eigenvalue problem with a very big dimension. As a consequence, enormous eigenvalue problems have been solved (with matrices of order greater than 400000), that could not be solved previously. Solving them allows to improve the precision in the studies of the behaviour of oceanic flows.[ES] En el campo de la teor铆a de control en ocasiones aparecen modelos de sistemas con un tama帽o elevado (muchas variables de estado). Cuando se pretende simular, estudiar o controlar uno de estos sistemas de orden elevado, conviene realizar un trabajo previo de reducci贸n del modelo del sistema con el prop贸sito de reducir los costes (econ贸micos/temporales) necesarios en un tratamiento posterior. El proceso de obtenci贸n de un sistema de orden reducido que represente adecuadamente el sistema original suele ser costoso, ya que necesariamente se tiene que hacer con el sistema original sin reducir. Por esto, resulta conveniente disponer de implementaciones de altas prestaciones para el problema de reducci贸n de sistemas lineales de control. En esta tesis se han desarrollado implementaciones de altas prestaciones para algunos m茅todos de reducci贸n de modelos. Se han analizado los algoritmos existentes para la reducci贸n de modelos de sistemas lineales de control estables y sus implementaciones en la librer铆a de control SLICOT. Se han propuesto nuevos algoritmos paralelos para los m茅todos cuyo n煤cleo principal es la resoluci贸n de ecuaciones de Lyapunov. Las nuevas rutinas desarrolladas se incorporan a la librer铆a de computaci贸n de altas prestaciones para control PSLICOT. Aparte de las funciones principales a cargo de la reducci贸n de modelos, se han tenido que paralelizar tambi茅n todas aquellas operaciones num茅ricas que aparecen en este problema y de las que no se dispon铆a de versiones de altas prestaciones. De estas operaciones, cabe destacar rutinas paralelas para la resoluci贸n de la ecuaci贸n de Lyapunov en su forma est谩ndar obteniendo directamente el factor de Cholesky de la soluci贸n, que es lo que se necesita para la reducci贸n de modelos. El m茅todo utilizado es una versi贸n paralela del m茅todo de Hammarling. Las rutinas implementadas resuelven en paralelo y para matrices densas las cuatro variantes posibles de la ecuaci贸n de Lyapunov: en su forma discreta y continua, traspuestas y sin trasponer. Todas las rutinas paralelizadas ofrecen una interfaz como la de las rutinas de la librer铆a ScaLAPACK, para que puedan ser usadas con facilidad por el usuario habituado a trabajar con este tipo de librer铆as. Se permiten las mismas distribuciones de datos que en esta librer铆a: una distribuci贸n c铆clica 2D por bloques, que engloba muchas otras distribuciones. Gracias al trabajo desarrollado, ahora se dispone de versiones paralelas de altas prestaciones para reducir sistemas lineales de control mediante diferentes variantes del m茅todo de balanceado y truncamiento de la ra铆z cuadrada (the Square-Root Balance & Truncate model reduction method): con o sin balanceado y con o sin usar las f贸rmulas de perturbaci贸n singular. Se trata de versiones paralelas de los mismos algoritmos y m茅todos que se utilizan en las versiones secuenciales de la librer铆a SLICOT. Esto permitir谩 reducir de forma eficiente modelos de sistemas lineales de control de gran tama帽o. Tambi茅n se ha mejorado la aplicabilidad del software existente en ScaLAPACK para el problema de valores propios cubriendo casos que no se contemplaban. Se ha trabajado en la soluci贸n del problema generalizado (mediante su transformaci贸n a forma est谩ndar, lo que no es aplicable en todos los casos) y tambi茅n en el c谩lculo de los vectores propios. Ambas operaciones se han utilizado en un problema real de simulaci贸n de flujos oce谩nicos. En esta aplicaci贸n se requiere el c谩lculo de todos los valores y vectores propios de un problema generalizado de gran dimensi贸n. Como consecuencia, ha sido posible resolver problemas de valores propios generalizados enormes (con matrices de m谩s de 400000 filas y columnas) que no hab铆an podido resolverse con anterioridad, permitiendo as铆 un estudio m谩s preciso del comportamiento de las corrientes oce谩nicas.[CA] En el camp de la teoria de control de vegades apareixen models de sistemes amb un tamany elevat (moltes variables d'estat). Quan es pret茅n simular, estudiar o controlar un d'aquests sistemes d'ordre elevat, conv茅 realitzar un treball previ de reducci贸 del model del sistema amb el prop貌sit de reduir els costos (econ貌mics/temporals) necesaris en un tractament posterior. El proc茅s d'obtenci贸 d'un sistema d'ordre reduit que represente adequadament el sistema original sol ser cost贸s, perque necess脿riament ha de fer-se amb el sistema original sense reduir. Per aquest motiu, resulta convenient disposar d'implementacions d'altes prestacions per al problema de reducci贸 de sistemes lineals de control. En aquesta tesis s'han desenvolupat implementacions d'altes prestacions per a alguns m猫todes de reducci贸 de models. S'han anal路litzat els algoritmes existents per a la reducci贸 de models de sistemes lineals de control estables i les seues implementacions en la llibreria de control SLICOT. S'han proposat nous algoritmes paral路lels per als m猫todes basats en la resoluci贸 d'equacions de Lyapunov. Les noves rutines desenvolupades s'incorporen a la llibreria de computaci贸 d'altes prestacions per a control PSLICOT. Apart de les funcions principals a c脿rrec de la reducci贸 de models, s'han hagut de paral路le\-lit\-zar tamb茅 totes aquelles operacions num猫riques que apareixen en aquest problema i per a les que no es disposava de versions d'altes prestacions. D'aquestes operacions, destaquen rutines paral路leles per a la resoluci贸 de l'equaci贸 de Lyapunov en la seua forma est脿ndard obtenint directament el factor de Cholesky de la soluci贸, que 茅s el que es necessita per a la reducci贸 de models. El m猫tode emprat 茅s una versi贸 paral路lela del m猫tode de Hammarling. Les rutines implementades resolen en paral路lel i per a matrius denses les quatre variants possibles de l'equaci贸 de Lyapunov: en la seua forma discreta i cont铆nua, traspostes i sense trasposar. Totes les rutines paral路lelitzades ofereixen una interfa莽 com la de les rutines de la llibreria ScaLAPACK, per a que puguen ser usades f脿cilment per l'usuari acostumat a treballar amb aquest tipus de llibreries. Es permeten les mateixes distribucions de dades que en aquesta llibreria: distribuci贸 c铆clica 2D per blocs, que engloba moltes altres distribucions. Gr脿cies al treball desenvolupat, ara es disposa de versions paral路leles d'altes prestacions per a reduir sistemes lineals de control mitjan莽ant diferents variants del m猫tode de balancejat i truncament de l'arrel quadrada (the Square-Root Balance & Truncate model reduction method): amb o sense balancejat i amb o sense usar les f贸rmules de perturbaci贸 singular. Son versions paral路leles dels mateixos algoritmes i m猫todes que s'utilitzen en les versions sequencials de la llibreria SLICOT. Aix貌 permetr脿 reduir de forma eficient models de sistemes lineals de control de gran tamany. Tamb茅 s'ha mitjorat l'aplicabilitat del software existent en ScaLAPACK per al problema de valors propis cobrint casos que no es contemplaven. S'ha treballat en la soluci贸 del problema generalitzat (mitjan莽ant la seua transformaci贸 a forma est脿ndard, cosa que no es pot fer sempre) i tamb茅 en el c脿lcul dels vectors propis. Ambdues operacions s'han utilitzat en un problema real de simulaci贸 de fluxos oce脿nics. En aquesta aplicaci贸 es requereix el c脿lcul de tots els valors i vectors propis d'un problema generalitzat de gran dimensi贸. Com a conseq眉猫ncia, ha sigut possible resoldre problemes de valors propis generalitzats molt grans (amb matrius de m茅s de 400000 files i columnes) que no s'havien pogut resoldre anteriorment, permetent aix铆 un estudi m茅s prec铆s del comportament de les corrents oce脿niques.Guerrero L贸pez, D. (2015). Algoritmos paralelos para la reducci贸n de sistemas lineales de control estables [Tesis doctoral no publicada]. Universitat Polit猫cnica de Val猫ncia. https://doi.org/10.4995/Thesis/10251/59415TESI
    corecore