DIRAC 19.0
ウェブページ
http://www.diracprogram.org/doku.php
バージョン
19.0
ビルド環境
- Intel Compiler 19.1.2
- ifort 19.1.2
- icc 19.1.2
- icpc 19.1.2
- Intel MKL 2020.0.2
- cmake 3.16.3
ビルドに必要なファイル
- DIRAC-19.0-Source.tar.gz
- openmpi-3.1.0.tar.bz2
- (デフォルトを 8 バイト整数にするために既存のものとは別にビルド)
- diff_memcon (see /local/apl/lx/dirac190/patches/diff_memcon)
- 利用可能なメモリ量を増やすためのパッチです
ビルド手順
#!/bin/sh
VERSION=19.0
INSTALL_PREFIX=/local/apl/lx/dirac190
# openmpi (8-byte integer)
OMPI_VERSION=3.1.0
OMPI_INSTALL_PREFIX=${INSTALL_PREFIX}/openmpi310_i8
OMPI_TARBALL=/home/users/${USER}/Software/OpenMPI/${OMPI_VERSION}/openmpi-${OMPI_VERSION}.tar.bz2
PBSROOT=/local/apl/lx/pbs14
# dirac
BASEDIR=/home/users/${USER}/Software/DIRAC/${VERSION}
TARBALL=${BASEDIR}/DIRAC-${VERSION}-Source.tar.gz
PATCH_README=${BASEDIR}/README.patch
PATCH_MEMCONTROL=${BASEDIR}/diff_memcon
WORKDIR=/work/users/${USER}
PARALLEL=8
#-------------------------------------------------------------------------
umask 0022
export LC_ALL=C
export LANG=C
export OMP_NUM_THREADS=1
ulimit -s unlimited
module purge
module load intel/19.1.2
module load mkl/2020.0.2
module load cmake/3.16.3
# openmpi (8-byte integer default)
cd ${WORKDIR}
if [ -d openmpi-${OMPI_VERSION} ]; then
mv openmpi-${OMPI_VERSION} openmpi_erase
rm -rf openmpi_erase &
fi
tar jxf ${OMPI_TARBALL}
cd openmpi-${OMPI_VERSION}
mkdir rccs-i8 && cd rccs-i8
CC=icc CXX=icpc FC=ifort FCFLAGS=-i8 CFLAGS=-m64 CXXFLAGS=-m64 \
../configure --prefix=${OMPI_INSTALL_PREFIX} \
--with-tm=${PBSROOT} \
--enable-mpi-cxx \
--with-psm2
make -j ${PARALLEL} && make install && make check
# dirac
cd ${WORKDIR}
if [ -d DIRAC-${VERSION}-Source ]; then
mv DIRAC-${VERSION}-Source DIRAC_erase
rm -rf DIRAC_erase &
fi
export PATH="${OMPI_INSTALL_PREFIX}/bin:$PATH"
export LIBRARY_PATH="${OMPI_INSTALL_PREFIX}/lib:$LIBRARY_PATH"
export LD_LIBRARY_PATH="${OMPI_INSTALL_PREFIX}/lib:$LD_LIBRARY_PATH"
export DIRAC_TMPDIR=${WORKDIR}
tar zxf ${TARBALL}
cd DIRAC-${VERSION}-Source
patch -p0 < ${PATCH_MEMCONTROL}
./setup --mpi \
--fc=mpif90 \
--cc=mpicc \
--cxx=mpicxx \
--mkl=parallel \
--int64 \
--extra-fc-flags="-xHost -I${OMPI_INSTALL_PREFIX}/lib" \
--extra-cc-flags="-xHost" \
--extra-cxx-flags="-xHost" \
--prefix=${INSTALL_PREFIX} \
build.rccs
cd build.rccs
make -j ${PARALLEL} && make install
# copy license and patch files
cp -f ../LICENSE ${INSTALL_PREFIX}
cp -f ${PATCH_README} ${INSTALL_PREFIX}
mkdir ${INSTALL_PREFIX}/patches
cp -f ${PATCH_MEMCONTROL} ${INSTALL_PREFIX}/patches
# store test results
mkdir ${INSTALL_PREFIX}/test_results
mkdir ${INSTALL_PREFIX}/test_results/serial
mkdir ${INSTALL_PREFIX}/test_results/parallel
# serial test
export DIRAC_MPI_COMMAND="mpirun -np 1"
make test
cp Testing/Temporary/LastTest.log ${INSTALL_PREFIX}/test_results/serial
if [ -f Testing/Temporary/LastTestsFailed.log ]; then
cp Testing/Temporary/LastTestsFailed.log ${INSTALL_PREFIX}/test_results/serial
fi
# parallel test
export DIRAC_MPI_COMMAND="mpirun -np ${PARALLEL}"
make test
cp Testing/Temporary/LastTest.log ${INSTALL_PREFIX}/test_results/parallel
if [ -f Testing/Temporary/LastTestsFailed.log ]; then
cp Testing/Temporary/LastTestsFailed.log ${INSTALL_PREFIX}/test_results/parallel
fi
exit 0
テスト結果
失敗したテスト: シリアル版(mpirun -np 1)
- 20 - eomcc
- 65 - eedm_mhyp_ensps_krci
- 73 - bss_energy
- 74 - pam_test
- 129 - operators_mo_mtx_elements
- 131 - spinrot
失敗したテスト: 並列版(mpirun -np 8)
- 18 - polprp_ph
- 46 - fscc_restart
- 65 - eedm_mhyp_ensps_krci
- 73 - bss_energy
- 74 - pam_test
- 95 - mp2_srdft_energies (Timeout)
- 111 - lucita_short
- 129 - operators_mo_mtx_elements
- 131 - spinrot
メモ
- テスト結果については /local/apl/lx/dirac190/test_resutls 以下にコピーしてあります。(個々のアウトプットは保存していません)
- インテルコンパイラの方が速度的に優位なため、こちらを採用。
- OpenMPI 4.0.2 を使うと 71 - basis_input_scripted のテストが Timeout するため回避
- テスト18 (polprp_ph) 並列時は常にエラー
- テスト20 (eomcc) int64 指定時にシリアル版のみで発生。一部数値が異なる。インテルコンパイラでも gcc でも発生
- テスト46 (fscc_restart) 並列時は常に数値エラー
- テスト65 (eedm_mhyp_ensps_krci) は軽微な数値エラーに見える。インテルコンパイラでも gcc でも発生
- テスト73 (bss_energy) int64 の指定が原因と思われるため回避できず
- テスト74 (pam_test) 良くわからないエラー。インテルコンパイラでも gcc でも発生
- テスト95 (mp2_srdft_energies) 並列時には常に Timeout。
- テスト111 (lucita_short) int64 指定時のみエラーとなる気配(73 と同様のエラー)。シリアル時には通る。
- テスト129 (operators_mo_mtx_elements) 良くわからないエラー。インテルコンパイラでも gcc でも発生
- テスト131 (spinrot) インテルコンパイラ時のみ、一部のデータが B と C で入れ替わっているように見える。