複数人で一つのユーザーアカウントを共有する行為、ユーザーアカウントの他人への貸与は許されていません。
年度途中でのメンバー追加や削除は可能です。メンバー管理申請のページに情報がありますので、そちらをご覧下さい。
1,000 を超えるような数のジョブを実行する場合には以下の点にご注意ください。
また、以下の「ファイルシステム利用についての留意点」の内容についてもご確認ください。
大量のジョブを同時に実行する場合は、どうしても必要な場合以外ではメール通知(#PBS -m abe など)は避けるようお願いいたします。
大量のジョブが同時に終了した場合にはメールの配送遅延等が発生する可能性がありますし、メールを受け取るサーバやソフトから
スパムと判断される可能性もあります。
計算時間が1分に満たないようなジョブを常にジョブ制限の上限ぎりぎりまで投入し、ジョブが常に大量実行開始、
終了を繰り返しているような状況では、ジョブのスケジューラーの負荷が非常に大きくなり、運用に支障が出る場合があります。
このような場合にはいくつかのジョブを1つにまとめるような対応をご検討ください。
負荷状況によってはジョブを強制削除するなどの対応をとらざるを得ない場合もあります。
大容量ディスクでは、大量のファイルの扱い(特に同一ディレクトリーにある場合)は弱いです。
小容量のファイルを多数格納しておく必要がある場合は、tar コマンドによりアーカイブを行い、1 ファイルとして保存しておくことを推奨します。
さらに gzip 等のコマンドによりファイルの圧縮を行い、必要な時に gunzip コマンドにより解凍を行えば、ディスク容量の有効活用も可能です。
大容量ディスクでは一つの巨大なファイルにアクセスが集中するとディスク全体のパフォーマンス低下が起こることがあります。
例えば、1 つの 100 GB のファイルを 500 個のジョブが同時に読み込むような場合がそれにあたります。
このような利用方法は極力避けるようお願いいたします。どうしても避けられないようであれば、まずは一度ご相談下さい。
ジョブ中の標準出力や標準エラー出力は一旦計算ノードのローカルファイルに保存され、ジョブ終了時に指定場所(デフォルトは実行ディレクトリ)にコピーされます。
標準出力や標準エラー出力が大きくなりすぎると、ジョブ終了時のコピーに失敗したり、予期せぬエラーで計算が異常終了する可能性があります。
下記のように領域ごとに用途を分けて設定しておりますので、適切なディスク領域のご利用をお願いします。
領域名 | バックアップ | 保存期間 | 使用量制限 | 用途 |
/home | × | 利用終了後 1 年 | 〇 | データ置き場 現在は /home と /save は全く同様に扱われます。 |
/save | ||||
/gwork | × | 基本的にはジョブ実行期間のみ | × | ジョブ実行時の一時領域 |
/lwork | x | ジョブ実行期間限定 | 〇 | ジョブ実行時の一時領域。 /lwork/users/${USER}/${PBS_JOBID} に作成されます。 ジョブ終了時に機械的にすぐさま消去されます。 |
システムがハードウェアやソフトウェアの問題で突然停止することがあります。この場合、ジョブがエラー終了するまでの CPU 点数は消費されません。
そして、システム障害でエラーとなったジョブはデフォルト設定では自動的に再実行されます。
再実行となったジョブについては、再実行時の時間分だけ CPU 点数が消費されます。
ログインサーバには、短時間のテストジョブ実行や計算結果データの圧縮や集計などの用途においてプログラム実行が可能なように、計算ノードと同様の環境を設定しております。ただし、以下の制限があります。