AlphaFold2 (2021/8/19)
インストールの具体的手順等については https://ccportal.ims.ac.jp/node/2945 をご覧ください。
ウェブページ(コード)
https://github.com/deepmind/alphafold
リファレンス
- 論文(Nature): https://doi.org/10.1038/s41586-021-03819-2
- RCCS での初期導入時メモ: https://ccportal.ims.ac.jp/node/2945
2021/8/23 更新内容
- /local/apl/lx/alphafold2 以下に導入しています。
- 2021/8/19 時点の alphafold です。(/local/apl/lx/alphafold2/alphafold-20210819)
- サンプルは /local/apl/lx/alphafold2/samples 以下にあります。
- run_alphafold_rccs.sh の改修
- 2021/8/20 時点のデータベースを利用するようにしています
- -p reduced_dbs への対応
- uniclust30 のかわりに UniRef30* を使えるように(自動的に指定しますが、UniRef30* が複数ある場合はおそらく正常に動作しません)
- -a で alphafold コードの場所を指定できるように
- パラメータを変更した独自バージョンを容易に呼び出すことができます(alphafold/common/residue_constants.py の修正はおそらく必要です)
サンプルスクリプト
#!/bin/sh
#PBS -l select=1:ncpus=12:mpiprocs=1:ompthreads=12:jobtype=core
#PBS -l walltime=72:00:00
# at least 8 cpu cores will be requested internally.
# in this sample, we employ 12 cores to get enough amount of memory.
# not sure how much is necessary/required, though.
# note about available memory:
# Available memory amount is proportional to ncpus value.
# If you need more memory, please increase ncpus in the header.
if [ ! -z "${PBS_O_WORKDIR}" ]; then
cd "${PBS_O_WORKDIR}"
fi
AF2ROOT=/local/apl/lx/alphafold2
RUNAF2=${AF2ROOT}/run_alphafold_rccs.sh
# load miniconda environment (where necessary binaries reside)
. ${AF2ROOT}/conda_init.sh
# Required:
# -o [output directory]
# -f [sequence file (FASTA)]
# Optional arguments:
# -a [alphafold code root]
# (default: /local/apl/lx/alphafold2/alphafold-20210819)
# /local/apl/lx/alphafold2/alphafold-20210720 can be used instead.
# -d [database root]
# (default: /local/apl/lx/alphafold2/databases-20210819)
# -t [max template date] (default: 2021-08-20)
# in the original example 2020-05-14 was used (CASP14 target case?)
# -m [model names]
# (default: model_1,model_2,model_3,model_4,model_5)
# -p [preset] (default: full_dbs)
# speed/quality control. available values are casp14, full_dbs, reduced_dbs
# -Q
# change model names to _ptm version; additional scores will be available
# in output file. plDDT score will be in B-factor column of output pdbs.
sh ${RUNAF2} \
-o ./dummy_test/ \
-f query.fasta \
-Q