...

新PCクラスタの利用について

by user

on
Category: Documents
7

views

Report

Comments

Transcript

新PCクラスタの利用について
2014.3.4
生田メディア支援事務室
新 PC クラスタの利用について
1 概要
生田教育研究用システムの更新により,PCクラスタも新しいシステムに置き換えられます。

切替日時 3月9日(日)10:00~17:00
切替時に,実行中であったジョブは強制終了され,実行待ちジョブもクリアされてしまい
ます。新システム稼働後にジョブの再投入をお願いします。
新 PC クラスタの使用方法は,基本的には現システムと同じですが、次の変更点が有りますので,
該当する場合は変更をお願いします。
新システムでの主な変更点

クラスタソフトは Intel Cluster Studio のみになります。
SCore は廃止となりますので,まだ SCore を使用しているユーザは Intel Cluster へ切り
替える必要があります。
既に Intel Cluster を使用しているユーザは,そのまま使用することができます。

CPU数(コア数)
,メモリが増え,性能が向上します。
それに伴い,より大きなジョブが投入できるよう,使用できる CPU 数(コア数)を増やすな
どジョブクラスの構成が変更されます。
なお,ホスト名は現システムと同じ pcc-mgr ですので,新 PC クラスタも従来通り pcc-mgr にリ
モートログインして使用します。
2 SCore を使用していた場合の変更点
ソースプログラムの再コンパイル及び実行方法の変更が必要です。
(1) ソースプログラムの再コンパイル
Score でコンパイルし作成した実行ファイルは互換性が無いため Intel Cluster では実行
できません。Intel Cluster のコンパイルコマンドを使って再コンパイルする必要があり
ます。
1/3
<コンパイルコマンド>
ソースプログラム言語
Intel Cluster のコマンド
SCore のコマンド
C
mpiicc
mpicc
C++
mpiicpc
mpic++
Fortran77
mpiifort
mpif77
Fortran90,95
mpiifort
mpif90
新 PC クラスタでも mpicc,mpif77,mpif90 コマンドはありますが,それらは,Intel コンパ
イラではなく,GNU コンパイラが使用されます。
(2) 実行方法の変更
bsub コマンドで指定していた scrun.lsf が mpirun.lsf になります。
<例>
(新) bsub –q A –n 16 –o out.%J mpirun.lsf
(旧) bsub –q A –n 16 –o out.%J scrun.lsf
a.out
a.out
3 Intel Cluster を使用していた場合
基本的にはそのまま使用することができますが,注意点があります。

Intel Cluster のバージョンがアップしますので,プログラムによっては,ソースプログラ
ムの再コンパイルが必要となる場合があります。

使用するときに入力していた use-intel コマンドは不要となります。
4 ジョブクラスの変更
新 PC クラスタは,ノード数は同じですが,CPU数(コア数)
,メモリが増え,性能が向上しま
す。
計算ノード数
計算ノードCPU
計算ノードメモリ
新
48
Xeon E5-2690(8コア) × 2
32GB
旧
48
Xeon X5570(4コア) × 2
12GB
総コア数:384 コア→768 コア
総メモリ:576GB→1,538GB
より大きなジョブが投入できるよう,ジョブクラスで使用できるCPU数(コア数)が多くなりま
す。また,計算時間の制限は,CPU 時間ではなく,ジョブ経過時間(ジョブが開始してから終了す
るまでの時間)となります。
2/3
<新PCクラスタでのジョブクラス構成表>
ジョブ
クラス
キュー名
ジョブで使用
一人で使用でき
キューで使用で
最大ジョブ経過時間
できるコア数
る最大コア数
きる最大コア数
(デフォルト値)
A
A
2~64
64
128
B
B
2~64
64
128
C
C
2~256
256
448
1時間以下
(10 分)
10 時間以下
(1 時間)
7 日間以下
(10 時間)
ジョブクラスの構成は,今後,利用状況を見ながらより最適なものに変更してゆく予定です。
5 ジョブ経過時間による計算時間の制限について
bsub コマンドの-W オプションで指定します(W は大文字)。
-W オプションの書式: -W [hour:]minute
-W オプションの指定がない場合は,デフォルト値が使用されます。
<例>
(1) bsub –q A –n 8 –o out.%J
mpirun.lsf a.out
ジョブクラスが A,-W オプション無し
開始してから 10 分経過しても終了しない場合,ジョブは強制終了します。
(2) bsub –q A –n 8 –W 60 –o out.%J mpirun.lsf a.out
-W 60 でジョブ経過時間を 60 分に指定
開始してから 60 分経過しても終了しない場合,ジョブは強制終了します。
(3) bsub –q C –n 128 –o out.%J mpirun.lsf a.out
ジョブクラスが C,-W オプション無し
開始してから 10 時間経過しても終了しない場合,ジョブは強制終了します。
(4) bsub –q C –n 128 –W 168:00 –o out.%J mpirun.lsf a.out
開始してから 168 時間(7 日間)経過しても終了しない場合,ジョブは強制終了します。
以上
3/3
Fly UP