3 research outputs found

    マルチノードFPGAによるストリームデータ分散結合処理

    Get PDF
    本研究報告では,ストリームデータの結合処理を行うHandshake Join のFPGA アクセラレータをマルチノードに拡張する手法を提案し,その性能評価を報告する.マルチノード拡張は,データ通信の2 つの工夫によって実現する.FPGA 上に複数のJoin Core を実装すると共に,FPGA ボード上のDRAM を介してFPGA 間でJoin Coreを接続する仕組みを導入する.また,データ通信と結合演算をオーバラップすることで,通信に要するオーバヘッドを隠蔽する.これらのデータ配布方法の工夫により,単一のFPGA では実装できなかった大きなウインドウサイズの結合演算が可能となる.最大16 ノードでの性能評価の結果,マルチノードに拡張した場合においても,結合演算のスループットが維持されるとともに,並列化効果が得られることが確認された

    FPGAを用いたストリームデータ集約演算のウィンドウサイズ拡大

    Get PDF
     高度化したネットワークや情報機器が生活や経済活動に欠かせないインフラとして定着し,生成されるデータ量は年々増加を続けている.これらのネットワークを流れる連続的なストリームデータを実時間処理するアプリケーションの重要性が高まっている.金融情報処理や通信トラフィック監視などのアプリケーションでは,ストリームデータ演算に厳しい時間成約が課せられる.ストリームデータの演算機構であるデータストリーム管理システム(Data Stream Management System ,DSMS)は,ネットワークから流入するストリームデータに対して,SQLライクなクエリを継続的に実行することでリアルタイム処理を実現する.このような背景の中で,実時間解析が必要なストリームデータ処理に対してFPGAを活用する研究が活発化している. 本論文では,ストリームデータ集約演算を対象とした専用ハードウェアCQPH(Configurable Query Processing Hardware)とそのスライディング・ウィンドウサイズを大きくするための実装について述べる.著者らの研究グループが研究開発に取り組んでいるCQPHは,集約演算クエリを動的に変更できる特徴を有するが,集約演算の中間データを保持するバッファとしてFPGA内のBlockRAMを利用すると,容量制限により対応可能なウィンドウサイズが制限されてしまう.そこで,大量の中間データを保持する必要のある集約演算クエリを実行する場合には,オフチップDRAMを格納先として利用可能にすることで,ウィンドウサイズの拡大に対応する.このとき,先読みキャッシュと中間データの多段階集約演算の2つの仕組みを導入し,DRAMアクセス遅延を隠蔽する.実験により,単一FPGAボードではウィンドウサイズを拡大しても先行研究のCQPH と同等の集約演算スループットで動作し,マルチノードFPGA環境ではネットワークのストリームデータ入力スループット(最大1入力タプル/CQPHのクロックサイクル)で動作することを確認した.また,独自実装した集約演算ソフトウェアよりもCQPHは30~40倍高速であることを示した.電気通信大学201

    マルチノードFPGAによるストリームデータ分散結合処理

    Get PDF
     多彩なWebサービスの普及とセンサ技術の発達にともない,データセンタに収集されるデータの速度と量は増大を続けている.金融情報処理やネットワークトラフィック監視のようなアプリケーションでは途切れなく到着するストリームデータに対して厳しい時間的制約が課せられるため,従来のデータ処理モデルではインターフェイスがボトルネックになるなど十分な処理性能を実現できない. リアルタイム性が求められるアプリケーションを処理する仕組みであるData Stream Management System(DSMS)に対して性能向上を目的としてField Programmable Gate Array(FPGA)を利用した支援HWに関する研究が数多く行われている.その中でもストリームデータ結合処理の並列処理アルゴリズムであるHandshake JoinのHW実装では,CPU処理と比較して高い並列性とスループットを実現している.しかしFPGAで実行できる処理の規模を示すウィンドウサイズの拡大は単一のFPGAがもつリソース量に制約を持つという問題がある. 本研究報告では,ストリームデータの結合処理を行うHandshake JoinのFPGAアクセラレータをマルチノードに拡張する手法を提案し,その性能評価を報告する.マルチノード拡張は,データ通信の2つの工夫によって実現する.FPGA上に複数のJoin Core を実装すると共に,FPGAボード上のDRAMを介してFPGA間でJoin Coreを接続する仕組みを導入する.またデータ通信と結合演算をオーバラップすることで,通信に要するオーバヘッドを隠蔽する.これらのデータ配布方法の工夫により,単一のFPGAでは実装できなかった大きなウィンドウサイズの結合演算が可能となる.最大16ノードでの性能評価の結果,マルチノードに拡張した場合においても,結合演算のスループットが維持されるとともに,並列化効果が得られることが確認された.電気通信大学201
    corecore