https://github.com/deepmind/alphafold
2.1.1 (2021/11/6; データベースは 2021/11/5 に取得)
2021/7 の初期導入時に準備した python 環境を再利用しています。
ただし、このバージョンでは pandas が入っていなかったため、今回追加で pandas を導入しています。
すでに conda と pip のパッケージが混在した環境ではありましたが、あまり無理なく導入できる状況だったため、
別環境を作ったりはせず、そのまま導入しています。既存の alphafold への影響も無いと想定しています。
以下の 4 つを除くデータベースについては 2021/8/19 のものを流用しています。
なお、uniclust30 については、2021/8/19 のバージョンと同じく、少し新しい 2021/6 のデータベースを使っています。ご注意ください。
[root@ccfep4 uniprot]$ lfs migrate -c 20 uniprot.fasta
alphafold 本体側でオプション指定に変更があったため、実行スクリプトも更新しています。
run_alphafold21x_rccs.sh
multimer の場合には、-f で与えるファイルは multi-FASTA 形式で複数の配列を含む必要があります。
また、model_preset(-m) に multimer の指定も必要です。
#!/bin/sh
#PBS -l select=1:ncpus=12:mpiprocs=1:ompthreads=12:jobtype=core
#PBS -l walltime=72:00:00# NOTE: sample for alphafold 2.1.x (downloaded Nov 2021)
# this may be imcompatible with previous versions!# at least 8 cpu cores will be requested internally.
# in this sample, we employ 12 cores to get enough amount of memory.
# not sure how much is necessary/required, though.# note about available memory:
# Available memory amount is proportional to ncpus value.
# If you need more memory, please increase ncpus in the header.if [ ! -z "${PBS_O_WORKDIR}" ]; then
cd "${PBS_O_WORKDIR}"
fiAF2ROOT=/local/apl/lx/alphafold2
RUNAF2=${AF2ROOT}/run_alphafold21x_rccs.sh# pass "-a $AF2DIR" to $RUNAF2 if you want to change alphafold version
#AF2DIR=/local/apl/lx/alphafold2/alphafold-20211106# load miniconda environment (where necessary binaries reside)
. ${AF2ROOT}/conda_init.sh# Required:
# -o [output directory]
# -f [sequence file (FASTA)]# Optional arguments:
# -a [alphafold code root]
# (default: /local/apl/lx/alphafold2/alphafold-20211106)
# -d [database root]
# (default: /local/apl/lx/alphafold2/databases-20211105)
# -t [max template date] (default: 2021-11-05)
# in the original example 2020-05-14 was used (CASP14 target case?)
# -m [model_preset] (default: monomer)
# model control. available values: monomer, monomer_casp14, monomer_ptm, multimer
# -p [db_preset] (default: full_dbs)
# database control. available values: full_dbs, reduced_dbs
# -Q
# change model names to _ptm version; additional scores will be available
# in output file. plDDT score will be in B-factor column of output pdbs.
# (same as "-p monomer_ptm")
${RUNAF2} \
-o ./multimer_test/ \
-m multimer \
-f complex.fasta