理化学研究所(理研)、九州大学、フィックスターズ、富士通による共同研究グループは、スーパーコンピュータ「富岳」を用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において、世界第1位を7期連続で獲得したと発表した。
このランキングは、現在ドイツ ハンブルクのコングレス・センター・ハンブルクおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2023」に合わせて、Graph500 Committeeから5月22日(日本時間5月23日)に発表されるとのことだ。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標。
1.「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード(全体の約95.7%)を用いて、約4.4兆個の頂点と70.4兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.51秒で解いたという。
「Graph500」のスコアは、137,096GTEPS(ギガテップス)で前回(2022年11月時点)の性能を約33%(1ノード単位では約39%)向上させたとのことだ。
2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされているという。
例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられる。さらにSociety 5.0に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されているとのことだ。
これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されているという。
このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」であるとのことだ。
「Graph500」には、BFS(Breadth-First Search:幅優先探索)部門とSSSP(Single-Source Shortest Path:単一始点最短路)部門があり、2010年に始まり(SSSP部門は2017年11月から)、そのランキングは年に2回更新されるという。
BFS部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)あたりの処理数でランキング。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になるとのことだ。
共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(4)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しているという。
(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
(4)アルゴリズムの最適なパラメータを実行時に自動探索する機構
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものであるという。
また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもある。今後、共同研究グループは、さらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組む予定であるとのことだ。