CORE
CO
nnecting
RE
positories
Services
Services overview
Explore all CORE services
Access to raw data
API
Dataset
FastSync
Content discovery
Recommender
Discovery
OAI identifiers
OAI Resolver
Managing content
Dashboard
Bespoke contracts
Consultancy services
Support us
Support us
Membership
Sponsorship
Research partnership
About
About
About us
Our mission
Team
Blog
FAQs
Contact us
Community governance
Governance
Advisory Board
Board of supporters
Research network
Innovations
Our research
Labs
research
多数の仮想GPUを用いた際の計算性能モデルの構築
Authors
Yukitoshi Setoguchi
瀬戸口 幸寿
Publication date
16 September 2016
Publisher
Abstract
GPUを科学計算などの汎用的な目的で使用する技術はGPGPU(General-Purpose computing on Graphics Processing Units)として知られている.DS-CUDA(Distributed Shared CUDA)はネットワークを通じたサーバ上のGPUを仮想化するミドルウェアで,クライアント側でソフトを書き換えることなくGPU資源を用いたGPGPUが可能である.ただし,クライアントとサーバー間の通信がボトルネックになり易い.そこで本研究ではMDシミュレーションと行列の乗算を題材に,最大8つのGPUを用いて計算時間の測定を行い,DS-CUDAによる仮想GPUを用いた場合と,物理GPUをPCI Express拡張Boxを用いて直接扱う場合とで,性能モデルを構築し実際の時間と比較した.MDシミュレーションを通じて,DS-CUDAはPCI Express拡張Boxと比較して,GPU内の演算であるkernel関数の発行による通信に多くの時間がかかることがわかった.このことが,計算データ量小,GPU並列数大の条件下(1000粒子,8GPU)では,仮想GPUと物理GPUとの計算時間に高速なネットワーク(Infiniband)で1.5倍,低速なネットワーク(GigabitEthernet)では6倍の差が生じることがわかった.一方でGPU内での計算量が増大するに従って相対的に通信時間が占める割合は小さくなり,計算性能の向上のためにGPU並列数を大きくすることの有効性を示すことができた.行列の乗算においても同様の傾向が得られた一方で,計算データ量に対する通信量が多いことから通信スループットの影響により,GPU並列数を増やすことによる計算性能の向上は通信性能が十分,かつ計算データ量が十分大きい場合に限られることを示した.低速なGigabitEthernetネットワークではGPU並列数を大きくすることによる計算性能の向上を,測定実験の計算データ量領域内(最大8,190次行列,8GPU)で確認することはできず,構築したモデルもその事実を示した.以上の測定実験とモデル構築から,計算データ量が十分大きくGPU並列数が小さい場合は,仮想GPUがパフォーマンスを発揮できることを示した.電気通信大学201
Similar works
Full text
Open in the Core reader
Download PDF
Available Versions
C-RECS (Creative Repository of Electro-Communications)
See this paper in CORE
Go to the repository landing page
Download from data provider
oai:uec.repo.nii.ac.jp:0000196...
Last time updated on 09/02/2018