付録. 新旧TSUBAME比較¶
付録.1. システム概要比較¶
T3/T4のシステム概要比較
| TSUBAME3.0 | TSUBAME4.0 | |
|---|---|---|
| 倍精度総理論演算性能 | 12.5PFLOPS | 66.8PFLOPS |
| 半精度総理論演算性能 | 47.2PFLOPS | 952PFLOPS |
| 総主記憶容量 | 135TiB | 180TiB |
| 総ハードディスク容量 | 15.9PB | 44.2PB |
| 総SSD容量 | 327TB | |
| 計算ノード数 | 540台 | 240台 |
| 総コア数 | 15,120コア | 46,080コア |
| 総GPU数 | 2,160台 | 960台 |
| インターコネクト | Intel Omni-Path HFI 100Gbps | InfiniBand NDR200 200Gbps |
| インターネット接続 | SINET5 100Gbps | SINET6 100Gbps |
付録.2. 計算ノード比較¶
T3/T4の計算ノード比較
| TSUBAME3.0 | TSUBAME4.0 | |
|---|---|---|
| 演算部名 | 計算ノード HPE SGI ICE-XA 540台 | 計算ノード HPE Cray XD665 240台 |
| ノード構成(1台あたり) | ||
| CPU | Intel Xeon E5-2680 v4 2.4GHz × 2 Socket | AMD EPYC 9654 2.4GHz × 2 Socket |
| コア数/スレッド | 14コア / 28スレッド×2CPU | 96コア / 192スレッド×2CPU |
| メモリ | 256GiB | 768GiB (DDR5-4800) |
| GPU | NVIDIA TESLA P100 for NVlink-Optimized Servers ×4 | NVIDIA H100 SXM5 94GB HBM2e × 4 |
| SSD | 2TB | 1.92TB NVMe U.2 SSD |
| インターコネクト | Intel Omni-Path HFI 100Gbps ×4 | InfiniBand NDR200 200Gbps × 4 |
付録.3. ソフトウェア比較¶
T3/T4のソフトウェア比較
付録.3.1 システムソフトウェア比較¶
T3/T4の比較
| TSUBAME3.0 (2023.4.6 現在) | TSUBAME4.0 | |
|---|---|---|
| OS | SUSE Linux Enterprise Server 12 SP5 | RedHat Enterprise Linux Server 9.3 |
| ジョブスケジューラ | Univa Grid Engine 8.6.11 | Altair Grid Engine 2023.1.1 |
| コンパイラ | GCC 4.8.5, 12.2.0 Intel Compiler 23.0.0 NVIDIA HPC SDK 22.2 |
GCC 11.4.1 Intel oneAPI compiler 2024.0 and MKL NVIDIA HPC SDK 24.1 AOCC 4.1.0 |
| MPI | Intel MPI 21.8.0 SGI MPT 2.16 OpenMPI 3.1.4 |
Intel MPI 2021.11 OpeMPI 5.0.2 |
| CUDAライブラリ | 11.0.3 (12.1.0利用可) | 12.3.2 |
| CUDAドライバ | 450.172.01 | 545.23.08 |
| OmniPathドライバ(OPA) | 10.10.3.1.1 | |
| InfiniBandドライバ(OFED) | 23.10-1.1.9 |
付録.3.2 商用アプリケーション比較¶
T3/T4の商用アプリケーション比較
| ソフトウェア名 | 概要 | TSUBAME3.0 | TSUBAME4.0 |
|---|---|---|---|
| ANSYS | 解析ソフトウェア | ○ | ○ |
| ABAQUS | 解析ソフトウェア | ○ | ○ |
| ABACUS CAE | 解析ソフトウェア | ○ | ○ |
| MSC Nastran | 解析ソフトウェア | ○ | |
| MSC Patran | 解析ソフトウェア | ○ | |
| Gaussian | 量子化学計算プログラム | ○ | ○ |
| GaussView | 量子化学計算プログラム プリポストツール | ○ | ○ |
| AMBER | 分子動力学計算プログラム | ○ | ○ |
| Materials Studio | 化学シミュレーションソフトウェア | ○ | ○ |
| Discovery Studio | 化学シミュレーションソフトウェア | ○ | ○ |
| Mathematica | 数式処理ソフトウェア | ○ | ○ |
| Maple | 数式処理ソフトウェア | ○ | |
| AVS/Express | 可視化ソフトウェア | ○ | |
| AVS/Express PCE | 可視化ソフトウェア | ○ | |
| LS-DYNA | 解析ソフトウェア | ○ | ○ ※ANSYSに含む |
| COMSOL | 解析ソフトウェア | ○ | ○ |
| Schrodinger | 化学シミュレーションソフトウェア | ○ | ○ |
| MATLAB | 数値計算ソフトウェア | ○ | ○ |
| VASP | 量子分子動力学計算プログラム | ○ | ○ |
| Linaro forge(旧:Arm Forge) | デバッガ | ○ | ○ |
| Intel Compiler | コンパイラ | ○ | ○ ※oneAPIに含む |
| PGI Compiler | コンパイラ | ○ | ○ ※NVIDIA HPC SDKに含む |
付録.3.3 フリーウェア比較¶
T3/T4のフリーウェア比較
| ソフトウェア名 | 概要 | TSUBAME3.0 | TSUBAME4.0 |
|---|---|---|---|
| GAMESS | ソルバ・シミュレータ | ○ | ○ |
| Tinker | ソルバ・シミュレータ | ○ | ○ |
| GROMACS | ソルバ・シミュレータ | ○ | ○ |
| LAMMPS | ソルバ・シミュレータ | ○ | ○ |
| NAMMD | ソルバ・シミュレータ | ○ | ○ |
| QUANTUM ESPRESSO | ソルバ・シミュレータ | ○ | ○ |
| CP2K | ソルバ・シミュレータ | ○ | ○ |
| OpenFOAM | ソルバ・シミュレータ、可視化 | ○ | ○ |
| CuDNN | GPUライブラリ | ○ | ○ |
| NCCL | GPUライブラリ | ○ | ○ |
| Caffe | DeepLearningフレームワーク | ○ | |
| Chainer | DeepLearningフレームワーク | ○ | |
| TensorFlow | DeepLearningフレームワーク | ○ | ○ |
| DeePMD-kit | MD用DeepLearningフレームワーク | ○ | ○ |
| R | インタプリタ(Rmpi,rpudに対応) | ○ | ○ |
| clang | コンパイラ | ○ | ○ ※AOCC |
| Apache Hadoop | 分散データ処理ツール | ○ | ○ |
| POV-Ray | 可視化 | ○ | ○ |
| ParaView | 可視化 | ○ | ○ |
| VisIt | 可視化 | ○ | ○ |
| turbovnc | リモートGUI(X11) 表示 | ○ | ○ |
| gnuplot | データ可視化 | ○ | ○ |
| Tgif | 画像表示・編集 | ○ | ○ |
| GIMP | 画像表示・編集 | ○ | ○ |
| ImageMagick | 画像表示・編集 | ○ | ○ |
| TeX Live | TeX ディストリビューション | ○ | ○ |
| Java SDK | 開発環境 | ○ | ○ |
| PETSc | リニアシステムソルバ、ライブラリ | ○ | ○ |
| FFTW | 高速フーリエ変換ライブラリ | ○ | ○ |
| DMTCP | チェックポイント・リスタート | ○ | ○ |
| Singularity | Linux container for HPC | ○ | ○ ※Apptainer |
| Open OnDemand | HPC向けWebポータル | ○ |
付録.4. ストレージ比較¶
T3/T4のストレージ比較
| TSUBAME3.0 | 用途 | マウント | 容量 | ファイルシステム |
|---|---|---|---|---|
| ホームディレクトリ 共有アプリケーション配備 |
/home /apps |
40TB | GPFS+cNFS | |
| 高速ストレージ領域1 | /gs/hs0 | 4.8PB | Lustre | |
| 高速ストレージ領域2 | /gs/hs1 | 4.8PB | Lustre | |
| 高速ストレージ領域3 | /gs/hs2 | 4.8PB | Lustre | |
| ローカルスクラッチ領域 | /scr | 各ノード1.9TB | xfs (SSD) | |
| 共有スクラッチ領域 | /beeond | 計算ノード依存 | BeeGFS |
| TSUBAME4.0 | 用途 | マウント | 容量 | ファイルシステム |
|---|---|---|---|---|
| 高速ストレージ領域 ホームディレクトリ |
/gs/fs /home |
372TB | Lustre | |
| 大容量ストレージ領域 共有アプリケーション配備 ワークディレクトリ |
/gs/bs /apps /work |
44.2PB | Lustre | |
| ローカルスクラッチ領域 | /local | 各ノード1.62TiB | xfs(SSD) |