理化学研究所(理研)と富士(富士通)が共同で開発しているスーパーコンピュータ「富岳」は、世界のスーパーコンピュータに関するランキングの、①「TOP500」、②「HPCG(High Performance Conjugate Gradient)」、③「HPL-AI」、④「Graph500」のすべてにおいて、第2位に大きな差をつけて、第1位を獲得したと発表した。
この結果は「富岳」のフルスペック(432筐体、158,976ノード)によるもので、「ISC2020」(2020年6月時)の数値を上回り2期連続の世界第1位になるという。
以下が、各ランキングの内容となる。
1.TOP500
「TOP500」リストは、LINPACKの実行性能を指標として世界で最も高速なコンピュータシステムの上位500位までを定期的にランク付けし、評価するプロジェクト。1993年に発足し、スーパーコンピュータのランキングを年2回(6月、11月)発表している。
LINPACKは、米国のテネシー大学のジャック・ドンガラ博士によって開発された行列計算による連立一次方程式の解法プログラムであり、「TOP500」リストはこのプログラムを処理する際の実行性能を指標としたランキング。
多くの科学技術計算や産業アプリケーションで使用される倍精度浮動小数点数の演算能力を測ることで、コンピュータの計算速度ランキングを決定する。
なお、同ベンチマークで高いスコアを出すためには、大規模ベンチマークを長時間測定する必要があるという。
そのため、LINPACKによる高いスコアは計算能力と信頼性を総合的に示していると一般的にいわれている。
今回、TOP500リストに登録した「富岳」のシステムは、396筐体(152,064ノード、全体の約95.6%の構成で、ランキングの指標となるLINPACK性能は415.53PFLOPS(ペタフロップス)、実行効率は80.87%。
日本のスーパーコンピュータがTOP500で第1位を獲得するのは、「京」による2011年11月(第38回TOP500リスト)以来となる。
なお、2020年6月時点の「TOP500」のランキング第2位は、米国の「Summit」で、測定結果は148.6PFLOPS。すなわち、第2位とは約2.8倍の性能差となる。
2.HPCG
「TOP500」は、密な係数行列から構成される連立一次方程式を解く、重要な性能指標であり、演算能力を主に評価するベンチマークとして長年親しまれてきた。
しかし、プロジェクトが発足した1993年から20年以上が経過し、近年、実際のアプリケーションで求められる性能要件との乖離やベンチマークテストにかかる時間の長時間化が指摘されている。
そこで、ジャック・ドンガラ博士らにより、産業利用など実際のアプリケーションでよく使われる、疎な係数行列から構成される連立一次方程式を解く計算手法である共役勾配法を用いた新たなベンチマーク・プログラム「HPCG」が提案された。
2014年6月のISC14で世界の主要なスーパーコンピュータ15システムでの測定結果の発表を経て、同年11月に米国ニューオーリンズで開催されたHPCに関する国際会議SC14から正式なランキングとして発表された。
「HPCG」の測定には「富岳」の432筐体(158,976ノード)を用い、16.00PFLOPS(ペタフロップス)という高いベンチマークのスコアを達成。これは「ISC2020」(2020年6月時)での13.40PFLOPSを上回り、今回「富岳」は2期連続の世界第1位を獲得した。
この結果は、「富岳」が産業利用などにおいて実際のアプリケーションを効率よく処理し、高い性能を発揮することを証明している。
なお、2020年11月時点の「HPCG」のランキング第2位は米国の「Summit」で、測定結果は2.93PFLOPS。すなわち、今回「富岳」は第2位と約5.5倍の性能差をつけたことになる。
また、「京」での測定結果は、0.603PFLOPS(2016年11月時点)であったため、「京」と比較して26倍以上の性能向上を達成した。
3.HPL-AI
「TOP500」と「HPCG」では、連立一次方程式を解く計算性能でランクをつけてきた。
どちらも科学技術計算や産業利用の中で多く用いられてきた倍精度演算(10進で16桁の浮動小数点数)のみで計算することがルールに定められていた。
近年、GPUや人工知能向けの専用チップで低精度演算(10進で5桁、もしくは10桁)の演算器を搭載し、高性能化した計算機が多数現れている。
これらの高性能演算能力が「TOP500」に反映されないとの実情があり、ジャック・ドンガラ博士を中心にLINPACKベンチマークを改良し低精度演算で解くことを認めた新しいベンチマーク「HPL-AI」が2019年11月に提唱された
「HPL-AI」はLINPACKが連立一次方程式をLU分解を用いて解く際に, 低精度計算で実施することを認めている。
しかし、倍精度計算よりも計算精度が劣ってしまうため、引き続き反復改良と呼ばれる技術で倍精度計算と同等の精度にすることを求めているとのことだ。
つまり、2段階の計算過程で構成されたベンチマークとなる。
この測定には、「富岳」が持つ330筐体(126,720ノード、全体の約79.7%)を用いて1.421EFLOPS(エクサフロップス)という高いスコアを記録した。
この記録は、世界で初めてHPL系ベンチマークで1エクサ(10の18乗)を達成した歴史的な快挙でもあるとのことだ。
「富岳」の高い性能を証明するとともに、人工知能計算やビッグデータ解析の研究基盤として、Society5.0社会の推進に大いに貢献し得ることを示している。
4.Graph500
「Graph500」では1兆個の頂点を超えるような大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」や「京」のような大規模ネットワークを持つシステムでは通信性能最適化も重要になる。
共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記 1. ~ 3. の先進的なソフトウェア技術を高度に組合せることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功している。
- 複数のノード間におけるグラフデータの効率的な分割方法
- 冗長なグラフ探索を削減するアルゴリズム
- スーパーコンピュータの大規模ネットワークにおける通信性能最適化
共同研究グループは、「富岳」のフルスペックである158,976ノード(432筐体)を用いて、通信性能の最適化等を行うことによって、約2.2兆個の頂点と35.2兆個の枝から構成される超大規模グラフに対する幅優先探索問題を調和平均0.34秒で解くことに成功。
Graph500のスコアは、102,955GTEPS(ギガテップス)で、「ISC2020」(2020年6月時点)のスコアである70,980GTEPSを大きく上回った。
また、「京」での測定結果は、31,302GTEPS(2019年6月時点)であったため、「京」と比較して3倍以上の性能向上を達成した。
なお、2020年11月時点の「Graph500」のランキング第2位は、中国の「Sunway TaihuLight」で、測定結果は23,756GTEPS。今回「富岳」は第2位と約4倍以上の性能差をつけたとのことだ。
これらのランキングは、現在オンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「SC20」において、11月16日付(日本時間11月17日)で発表されるとのことだ。
これら4つのランキングすべてにおける2期連続での第1位獲得は、「富岳」の総合的な性能の高さを示すものであり、新たな価値を生み出す超スマート社会の実現を目指すSociety5.0において、シミュレーションによる社会的課題の解決やAI開発および情報の流通・処理に関する技術開発を加速するための情報基盤技術として、「富岳」が十分に対応可能であることを実証するものだという。