システム紹介
計算サーバー
ノードタイプ | CPU | GPU | メモリ[GiB] | ノード数 | ローカル作業領域 (NVMe SSD上)[GB] |
総演算性能 [TFLOPS] |
---|---|---|---|---|---|---|
TypeC |
AMD EPYC 7763 (64コア 2.45 GHz) [2 CPUs/ノード] |
- | 256 | 804 | 1536 | 4,034 |
TypeF | 1,024 | 14 | 70.2 | |||
TypeG |
NVIDIA A100 80 GB (NVLink) [8 GPUs/ノード] |
256 | 16 |
80.3 (CPU)
2,496 (GPU)
|
計算サーバーはそれぞれ AMD EPYC 7763 を2基(計 128 コア/ノード)を搭載しています。TypeF のサーバーは 1,024 GiB のメモリを搭載しており、大量のメモリを必要とする計算向けとなっています。TypeG のサーバーには NVIDIA A100 80 GB (NVLink) をノードあたり8枚搭載しており、GPU 間は NVLink で接続されています。また、各サーバーの NVMe SSD 上にはローカル作業領域(/lwork)として利用可能な領域を用意しており、ジョブの一時ファイルを置く場所として利用できます。
ストレージ
高速な分散ファイルシステムである Lustre で構成されており、計算サーバーやログインサーバーからアクセスできます。実効容量は 14.8 PB となっています。各ユーザーのホームディレクトリもこのストレージ上に置かれます。グローバルな一時ファイル置き場としても使えるようになっており(/gwork)、計算サーバーのローカル NVMe SSD 上に置けないような大容量の一時ファイルを配置する用途でも利用できます。
インターコネクト
計算サーバーやログインサーバー、ストレージの間は InfiniBand で接続されており、広帯域・低遅延の通信が可能となっています。
ログインサーバー(ccfep)
CPU | メモリ[GiB] | ノード数 |
---|---|---|
AMD EPYC 7763 (64コア 2.45 GHz) [2 CPUs/ノード] |
256 | 4 |
ログインサーバー(ccfep)は計算ノードと同様のハードウェア構成となっており、ジョブの投入を行うだけでなく、プログラムのビルドやテストをしたり、簡単な解析まで行えるようになっています。