Comments
Description
Transcript
新PCクラスタの利用について
2014.3.4 生田メディア支援事務室 新 PC クラスタの利用について 1 概要 生田教育研究用システムの更新により,PCクラスタも新しいシステムに置き換えられます。 切替日時 3月9日(日)10:00~17:00 切替時に,実行中であったジョブは強制終了され,実行待ちジョブもクリアされてしまい ます。新システム稼働後にジョブの再投入をお願いします。 新 PC クラスタの使用方法は,基本的には現システムと同じですが、次の変更点が有りますので, 該当する場合は変更をお願いします。 新システムでの主な変更点 クラスタソフトは Intel Cluster Studio のみになります。 SCore は廃止となりますので,まだ SCore を使用しているユーザは Intel Cluster へ切り 替える必要があります。 既に Intel Cluster を使用しているユーザは,そのまま使用することができます。 CPU数(コア数) ,メモリが増え,性能が向上します。 それに伴い,より大きなジョブが投入できるよう,使用できる CPU 数(コア数)を増やすな どジョブクラスの構成が変更されます。 なお,ホスト名は現システムと同じ pcc-mgr ですので,新 PC クラスタも従来通り pcc-mgr にリ モートログインして使用します。 2 SCore を使用していた場合の変更点 ソースプログラムの再コンパイル及び実行方法の変更が必要です。 (1) ソースプログラムの再コンパイル Score でコンパイルし作成した実行ファイルは互換性が無いため Intel Cluster では実行 できません。Intel Cluster のコンパイルコマンドを使って再コンパイルする必要があり ます。 1/3 <コンパイルコマンド> ソースプログラム言語 Intel Cluster のコマンド SCore のコマンド C mpiicc mpicc C++ mpiicpc mpic++ Fortran77 mpiifort mpif77 Fortran90,95 mpiifort mpif90 新 PC クラスタでも mpicc,mpif77,mpif90 コマンドはありますが,それらは,Intel コンパ イラではなく,GNU コンパイラが使用されます。 (2) 実行方法の変更 bsub コマンドで指定していた scrun.lsf が mpirun.lsf になります。 <例> (新) bsub –q A –n 16 –o out.%J mpirun.lsf (旧) bsub –q A –n 16 –o out.%J scrun.lsf a.out a.out 3 Intel Cluster を使用していた場合 基本的にはそのまま使用することができますが,注意点があります。 Intel Cluster のバージョンがアップしますので,プログラムによっては,ソースプログラ ムの再コンパイルが必要となる場合があります。 使用するときに入力していた use-intel コマンドは不要となります。 4 ジョブクラスの変更 新 PC クラスタは,ノード数は同じですが,CPU数(コア数) ,メモリが増え,性能が向上しま す。 計算ノード数 計算ノードCPU 計算ノードメモリ 新 48 Xeon E5-2690(8コア) × 2 32GB 旧 48 Xeon X5570(4コア) × 2 12GB 総コア数:384 コア→768 コア 総メモリ:576GB→1,538GB より大きなジョブが投入できるよう,ジョブクラスで使用できるCPU数(コア数)が多くなりま す。また,計算時間の制限は,CPU 時間ではなく,ジョブ経過時間(ジョブが開始してから終了す るまでの時間)となります。 2/3 <新PCクラスタでのジョブクラス構成表> ジョブ クラス キュー名 ジョブで使用 一人で使用でき キューで使用で 最大ジョブ経過時間 できるコア数 る最大コア数 きる最大コア数 (デフォルト値) A A 2~64 64 128 B B 2~64 64 128 C C 2~256 256 448 1時間以下 (10 分) 10 時間以下 (1 時間) 7 日間以下 (10 時間) ジョブクラスの構成は,今後,利用状況を見ながらより最適なものに変更してゆく予定です。 5 ジョブ経過時間による計算時間の制限について bsub コマンドの-W オプションで指定します(W は大文字)。 -W オプションの書式: -W [hour:]minute -W オプションの指定がない場合は,デフォルト値が使用されます。 <例> (1) bsub –q A –n 8 –o out.%J mpirun.lsf a.out ジョブクラスが A,-W オプション無し 開始してから 10 分経過しても終了しない場合,ジョブは強制終了します。 (2) bsub –q A –n 8 –W 60 –o out.%J mpirun.lsf a.out -W 60 でジョブ経過時間を 60 分に指定 開始してから 60 分経過しても終了しない場合,ジョブは強制終了します。 (3) bsub –q C –n 128 –o out.%J mpirun.lsf a.out ジョブクラスが C,-W オプション無し 開始してから 10 時間経過しても終了しない場合,ジョブは強制終了します。 (4) bsub –q C –n 128 –W 168:00 –o out.%J mpirun.lsf a.out 開始してから 168 時間(7 日間)経過しても終了しない場合,ジョブは強制終了します。 以上 3/3