Comments
Description
Transcript
WIEN2k ベンチマーク On FOCUS Supercomputer
作成: 2014年9月18日(木) WIEN2k ベンチマーク On FOCUS Supercomputer 株式会社アフィニティサイエンス help@affinity-science.com 微細粒度並列計算(MPI)ベンチマーク Benchmark Environment: FOCUS - A System Total 224 nodes Xeon L5640-2.26GHz(6 cores) x2 CPUs, 48GB RAM, 500 GB HDD, InfiniBand QDR WIEN2k 14.1(Release 8/9/2014) mpi-benchmark (lapw1; Matrix size: 11571) 250 Elapsed time / sec 200 229.95 150 123.41 100 71.53 50 45.74 39.06 39.64 144 192 0 12 mpi-benchmark.struct 24 48 96 Number of Cores k点分割並列計算ベンチマーク Benchmark Environment: FOCUS - A System Total 224 nodes Xeon L5640-2.26GHz(6 cores) x2 CPUs, 48GB RAM, 500 GB HDD, InfiniBand QDR WIEN2k 14.1(Release 8/9/2014) k-point parallel (lapw1c; Matrix size: 26132650) 700 Elapsed time / sec 600 627.89 500 400 300 320.52 200 189.89 100 153.74 103.56 0 12 cd16te15sb.struct 24 40 60 Division Number of k-points(i.e. #cores) 120 ジョブ投入スクリプト slurm_para 使用方法 $ slurm_para usage : slurm_para <queue name> <total cores> <mpi-cores in node> <div of kp> <'job'> [-p] ! ! 実行例 <queue name> : キュー名(※SLURMではパーティション名) <total cores> : 全CPUコア数 <mpi-cores in node> : ノード内MPI並列用CPUコア数 <div of kp> : k点並列計算分割数 <‘job’> : WIEN2k 実行コマンド(e.g. x lapw1 -p, runsp_lapw -p) ※ 引数の最後に” -p “を追加すると、ジョブ投入を行わず、実行用スクリプトの生成のみを行います。 $ slurm_para a024h 48 12 2 ‘run_lapw -p -i 1’ Submitted batch job 52979 $ squeue JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 52979 a024h LiCoO2_1 uito0001 R 0:12 4 a[210-213] $ cat .machines dstart: a210:12 a211:12 a213:12 a212:12 lapw0: a210:12 a211:12 a213:12 a212:12 1:a210:12 a211:12 1:a213:12 a212:12 granularity:1 extrafine:1 $ tail STDOUT SLURM_NPROCS: 48 kdiv x nodes_per_kdiv, core: 2 x 2 x 12 LAPW0 END LAPW1 END LAPW1 END $ w2web キューイング対応(セットアップ) 並列オプション有効 キューイング対応 SCF計算開始(ジョブ投入) ※テキストベースWWWブラウザ w3m を用いて フロントエンドサーバ上で実行中のw2webにアクセス w2web キューイング対応(ジョブ投入) 実行ジョブ 実行ジョブの標準出力・エラー出力はSTDOUTファイルへ出力 w2web キューイング対応(標準出力) 実行ホストが確定した時点で.machines ファイル自動生成