Gromacs 2023.2
ウェブページ
バージョン
2023.2
ビルド環境
- GCC 9.2.1 (gcc-toolset-9)
- HPC-X 2.11 (Open MPI 4.1.4)
必要なファイル
- gromacs-2023.2.tar.gz
- regressiontests-2023.2.tar.gz
ビルド手順
#!/bin/sh
VERSION=2023.2
INSTALL_PREFIX=/apl/gromacs/${VERSION}
BASEDIR=/home/users/${USER}/Software/Gromacs/${VERSION}/
GROMACS_TARBALL=${BASEDIR}/gromacs-${VERSION}.tar.gz
REGRESSION_TARBALL=${BASEDIR}/regressiontests-${VERSION}.tar.gz
WORKDIR=/gwork/users/${USER}
REGRESSION_PATH=${WORKDIR}/regressiontests-${VERSION}
PARALLEL=12
export LANG=C
#---------------------------------------------------------------------
umask 0022
module -s purge
module -s load gcc-toolset/9
module -s load openmpi/4.1.4-hpcx/gcc9
cd ${WORKDIR}
if [ -d gromacs-${VERSION} ]; then
mv gromacs-${VERSION} gromacs_erase
rm -rf gromacs_erase &
fi
if [ -d regressiontests-${VERSION} ]; then
mv regressiontests-${VERSION} regressiontests_erase
rm -rf regressiontests_erase &
fi
tar xzf ${GROMACS_TARBALL}
tar xzf ${REGRESSION_TARBALL}
cd gromacs-${VERSION}
# single precision, no MPI
mkdir rccs-s
cd rccs-s
cmake .. \
-DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX} \
-DCMAKE_VERBOSE_MAKEFILE=ON \
-DCMAKE_C_COMPILER=gcc \
-DCMAKE_CXX_COMPILER=g++ \
-DGMX_MPI=OFF \
-DGMX_GPU=OFF \
-DGMX_DOUBLE=OFF \
-DGMX_THREAD_MPI=ON \
-DGMX_BUILD_OWN_FFTW=ON \
-DREGRESSIONTEST_DOWNLOAD=OFF \
-DREGRESSIONTEST_PATH=${REGRESSION_PATH}
make -j${PARALLEL} && make check && make install
cd ..
# double precision, no MPI
mkdir rccs-d
cd rccs-d
cmake .. \
-DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX} \
-DCMAKE_VERBOSE_MAKEFILE=ON \
-DCMAKE_C_COMPILER=gcc \
-DCMAKE_CXX_COMPILER=g++ \
-DGMX_MPI=OFF \
-DGMX_GPU=OFF \
-DGMX_DOUBLE=ON \
-DGMX_THREAD_MPI=ON \
-DGMX_BUILD_OWN_FFTW=ON \
-DREGRESSIONTEST_DOWNLOAD=OFF \
-DREGRESSIONTEST_PATH=${REGRESSION_PATH}
make -j${PARALLEL} && make check
make install
cd ..
# single precision, with MPI
mkdir rccs-mpi-s
cd rccs-mpi-s
cmake .. \
-DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX} \
-DCMAKE_VERBOSE_MAKEFILE=ON \
-DCMAKE_C_COMPILER=mpicc \
-DCMAKE_CXX_COMPILER=mpicxx \
-DGMX_MPI=ON \
-DGMX_GPU=OFF \
-DGMX_DOUBLE=OFF \
-DGMX_THREAD_MPI=OFF \
-DGMX_BUILD_OWN_FFTW=ON \
-DREGRESSIONTEST_DOWNLOAD=OFF \
-DREGRESSIONTEST_PATH=${REGRESSION_PATH}
make -j${PARALLEL} && make check && make install
cd ..
# double precision, with MPI
mkdir rccs-mpi-d
cd rccs-mpi-d
cmake .. \
-DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX} \
-DCMAKE_VERBOSE_MAKEFILE=ON \
-DCMAKE_C_COMPILER=mpicc \
-DCMAKE_CXX_COMPILER=mpicxx \
-DGMX_MPI=ON \
-DGMX_GPU=OFF \
-DGMX_DOUBLE=ON \
-DGMX_THREAD_MPI=OFF \
-DGMX_BUILD_OWN_FFTW=ON \
-DREGRESSIONTEST_DOWNLOAD=OFF \
-DREGRESSIONTEST_PATH=${REGRESSION_PATH}
make -j${PARALLEL} && make check
make install
cd ..
テスト
倍精度版で ConvertTprTest.generateVelocitiesTest テストが失敗(MPI, thread MPI 版両方)- https://gitlab.com/gromacs/gromacs/-/issues/4824
- 上記 issue の記述より、数値精度が厳しすぎただけなので問題無し。次のリリース時には修正されると思われる。
メモ
- GCC 10, 11, 12 では速度が出ない。nonbond ペア相互作用の部分が遅いように見える(ログ中で "Force" の項目)
- GCC 9 では以前のバージョンと遜色ない速度が出ている。GCC 8 以前ではビルドできず。
- 2022 以前のバージョンに比べて速度が出ないケースが発生するかもしれない。
- 公式サイトにも情報あり https://gitlab.com/gromacs/gromacs/-/issues/4752
- こちらのシステム(AMD EPYC 7763 64 Cores 2.45 GHz (Zen3))では 30 % 以上遅いケースが確認できている。
- ベンチマークには以下の STMV 系を使用。GCC 9-12 のどれを使った場合でも AVX2_256 の SIMD instruction が自動的に指定されている。
- https://aip.scitation.org/doi/10.1063/5.0018516
- https://zenodo.org/record/3893789
- AVX512 が使える環境では影響が出にくいらしい?
- こちらのシステム(AMD EPYC 7763 64 Cores 2.45 GHz (Zen3))では 30 % 以上遅いケースが確認できている。
- GCC 9 では以前のバージョンと遜色ない速度が出ている。GCC 8 以前ではビルドできず。
- インテルコンパイラ(今回より icx, icpx 系を使う必要有)は若干 gcc9 よりも速度が出ていない
- AOCC についてもインテル同様に若干 gcc9 よりも速度が出ていない
- VMD molfile plugin はバグのため回避。
- https://gitlab.com/gromacs/gromacs/-/issues/4832