15 research outputs found
The pyramids method application for the synthesis of a parallel algorithm solving finite differential equations scheme Yee. One-dimensional case
In this paper, we propose a modification of the method of the pyramids to build parallel algorithms for explicit difference equations. Its efficiency is shown on a practical example of the differential solution of the one-dimensional equations of the Maxwell in two tasks efficiency. In comparison with a usual parallel algorithm acceleration of calculations is increased by 1.6 times. We investigated the efficiency of the author's approach depending on the height of the pyramid, indicated the limits of applicability of the proposed changes.The research leading to these results has received funding from the Russian Science Foundation grant №16-47-630560-r_a
Block algorithms to solve Zheng/Chen/Zhang's finite-difference equations
Работа посвящена синтезу блочных алгоритмов FDTD-метода для расчетов по неявной разностной схеме Zheng/Chen/Zhang. Существенное внимание уделяется экспериментальному исследованию построенных алгоритмов, выявлению особенностей организации блочных вычислений по неявным сеточным уравнениям. Эффективность предложенных подходов подтверждена шестикратным ускорением вычислений.
This paper is devoted to the design of multiblock algorithms of the FDTD-method intended for computations based on a Zheng-Chen-Zhang implicit finite-difference scheme. Special emphasis is placed on experimental research of the designed algorithms and detecting specific features of the multiblock computing based on implicit finite-difference equations. The efficiency of the proposed approaches is proved by a six-fold speed-up of computations.Работа выполнена при поддержке гранта РФФИ 19-07-00423 А
Modeling the effect of the wall angle on the light focusing capability of cylindrical, high-aperture microlenses
Block algorithms to solve Zheng/Chen/Zhang's finite-difference equations
This paper is devoted to the design of multiblock algorithms of the FDTD-method intended for computations based on a Zheng-Chen-Zhang implicit finite-difference scheme. Special emphasis is placed on experimental research of the designed algorithms and detecting specific features of the multiblock computing based on implicit finite-difference equations. The efficiency of the proposed approaches is proved by a six-fold speed-up of computations
Implementation of the FDTD method block algorithm in the MATLAB language using a graphics processing unit. 2D- decomposition case
В данной статье рассматривается проблема ограниченности объёма видеопамяти при организации параллельных вычислений по методу FDTD на непрофессиональном графическом процессоре. В качестве решения предложен двумерный блочный алгоритм FDTD-метода и его реализация на языке MATLAB. В результате была решена проблема ограниченности графической памяти, максимально возможная дискретизация сетки при вычислениях на GPU была расширена с 10 млн. до 85 млн. узлов со средним ускорением в 7,5 раз для двумерного случая FDTD-метода. The problem of limited video memory when organizing parallel computing using the FDTD method on a non-professional graphics processor was considered in this article. As a solution, a block algorithm of the FDTD method with 2-D decomposition and its implementation in the MATLAB language are proposed. As a result, the problem of limited graphics memory was solved, the maximum possible discretization of the grid in calculations on the GPU was expanded from 10 million to 85 million nodes with an average acceleration of 7,5 times for the two-dimensional case of the FDTD method.Работа выполнена при поддержке гранта РФФИ 19-07-00423 А
Block algorithm for the joint difference solution of the d’Alembert and Maxwell equations
Характерной особенностью математического моделирования на современном этапе развития, по мнению авторов настоящего доклада, является учет архитектуры вычислительной системы не только на этапе составления программы для ЭВМ, но и в ходе разработки численного метода и синтеза математической модели. Указанный прием существенно расширит возможности исследователя по поиску оптимального (в смысле ускорения вычислений) отображения численного метода на упомянутую архитектуру. В предлагаемой работе данная идея иллюстрируется на примерах основной математической модели вычислительных электродинамики и оптики, уравнениях Максвелла, и FDTD-метода. Недавно были сформулированы блочные алгоритмы для разностного решения дифференциальных уравнений, в том числе уравнений Максвелла (FDTD-метод). Их успех вдохновил авторов доклада на следующий шаг — модификацию самой модели, ориентированную на сокращение упомянутых коммуникаций. Данная модификация основана на совместном решении уравнений Даламбера и Максвелла, которое позволяет с одной стороны в несколько раз сократить интенсивность обмена данных между оперативной и кэш-памятью за счет большего количества арифметических операций, приходящихся на одну сеточную функцию при решении уравнения Даламбера, с другой – свободно пользоваться детально разработанными за долгую историю FDTD-метода технологиями и готовыми программными реализациями задания падающей волны, наложения поглощающих слоев, учета дисперсии среды и др. за счет включения фрагментов сеточной области Yee в основную сеточную область. A characteristic feature of mathematical modelling at the present stage of development of this scientific branch, according to the authors of this report, is the consideration of the architecture of the computer system not only at the stage of compiling a computer program, but also in the development of a numerical method and the synthesis of a mathematical model. This method significantly broadens the researcher's ability to search for the optimal (in the sense of accelerating computations) mapping of the numerical method to the
mentioned architecture. In this paper, this idea is illustrated by examples of the basic mathematical model of computational electrodynamics and optics, Maxwell's equations, and the FDTD. This modification is based on the joint solution of the d’Alembert and Maxwell equations, which allows one to several times reduce the data exchange rate between the operational and cache memory due to the greater number of arithmetic operations per one grid function in solving the d’Alembert equation, on the other hand, freely use the technologies developed in the long history of the FDTD method and ready-made software implementations for setting the incident wave, imposing the absorbing layers, taking into account the dispersion of the medium and others.Работа выполнена при поддержке Федерального агентства научных организаций (соглашение No 007-ГЗ/Ч3363/26) и гранта РФФИ 16-47-630560-p_a
Design features of block algorithms of FDTD-method implemented on a GPU using MATLAB
The paper is devoted to the investigation of the implementation features of a block algorithm for the FDTD-method on GPU. The block algorithm in general and in the context of the FDTD-method in particular is discussed. The main attention is paid to specifics of determining the shape and volume of blocks, which stem from the use of MATLAB and its Parallel Computing Toolbox. The practical efficiency of the proposed techniques is shown. Possible applications and prospects are discussed.</jats:p
Acceleration of calculations using block algorithms for the difference solution of the heat equation
Учет особенностей архитектуры конкретной вычислительной системы при разработке нового алгоритма известного численного метода давно считается необходимым при синтезе параллельных и векторных алгоритмов. В настоящей работе предлагается принимать во внимание архитектурные особенности процессора еще на этапе конструирования самого численного метода, как это когда-то предлагалось академиком Гурием Ивановичем Марчуком, однако так и не закрепилось в широкой вычислительной практике. Данная идея иллюстрируется на примере синтеза новой разностной схемы для уравнения теплопроводности, традиционно являющимся объектом для испытания новшеств в теории разностных схем. В качестве упомянутой архитектурной особенности выбрана иерархическая структура памяти ЭВМ, обуславливающая появление коммуникационных издержек даже при использовании одного аппаратного вычислительного потока для организации расчетов. Учет данной особенности в вычислительной линейной алгебре связывают с блочными алгоритмами, в теории разностных схем – с приемом программирования «tiling». Однако для двухслойных разностных схем блочных алгоритмов решения сеточных уравнений до предлагаемой работы известно не было в силу невозможности организации блочных вычислений по существующим схемам. Для восполнения этого пробела авторы предлагают новый прием конструирования двухслойных разностных схем и смешанную схему со сдвигом как пример применения этого приема. В ходе экспериментов демонстрируется пятикратное ускорение расчетов по такой схеме относительно традиционной явной при той же вычислительной сложности. In this paper, proposing to take into account the architectural features of the processor at the stage of constructing the numerical method itself. This idea is illustrating by the example of the synthesis of a new difference scheme for the heat conduction equation, which has traditionally been the object of testing innovations in the theory of difference schemes. Architectural feature hierarchical structure of computer memory chosen causes the appearance of communication costs even when using a single hardware computational flow for organizing calculations. Accounting for this feature in computational linear algebra is associated with block algorithms. Accounting for this feature in the theory of difference schemes is associated with the technique of programming "tiling". However, for two-layer difference schemes of block algorithms for solving grid equations, prior to the proposed work, it was not known due to the impossibility of organizing block calculations using existing schemes. The authors propose a new method of constructing two-layer difference schemes and a mixed scheme with a shift as an example of the application of this method. In the course of the experiments, a fivefold acceleration of calculations according to this scheme is demonstrated relative to the traditional explicit, with the same computational complexity.Работа выполнена при поддержке гранта РФФИ 19-07-00423 А
