...

STAR-CCM+ Power Session

by user

on
Category: Documents
35

views

Report

Comments

Transcript

STAR-CCM+ Power Session
STAR-CCM+ の大規模並列化仕様と
クラウドライセンス(PoD) ソリューション
株式会社CD-adapco 吉田 稔彦
大規模モデルと STAR-CCM+
ソフトウエア側の対応機能
–
–
–
–
クライアント – サーバ アーキテクチャ (リリース当初からの設計仕様)
区分化(Partitioning) 機能 の実装 (V8.04)
パフォーマンス改善 (V8.02, V8.04)
パラレルトリマーの実装 (V8.06)
ライセンス種別による対応
– hpcdomain オプション (Partitioning 数に応じたライセンス)
– PowerSession オプション (並列無制限ライセンス)
クラウド側のハードウエア利用
– Power of Demand ライセンス(必要な計算時間での課金システム)
1
© CD-adapco 2013
STAR-CCM+ クライアント・サーバ アーキテクチャ
クライアントプロセス-サーバプロセス
STAR-CCM+ は開発当初から
GUI 操作などを行う クライアントプロセスと
CFD の実態処理を行う サーバプロセスが分離された設計となっています。
ユーザのプラットフォーム環境に応じた最適パフォーマンスを提供します。
新規作成、読み込
み画面から並列数
を簡単に指定
2
© CD-adapco 2013
V8.04 から実装された区分化 機能
対象となる解析事例
 複数領域のある解析
 車両熱害解析など
物理連続体ごとの領域分割
(Continuum-Wide Partitioning)
– 並列計算時に物理連続体ベースで
領域分割をするオプション機能(従
来は領域ベース)
– 並列計算効率が改善
– 従来の手法で並列効率が著しく悪
くなっていた大きな解析領域中に小
さな領域があるようなケースを解決
従来の領域分割
3
別領域だが、同じ物理連続体
12並列
© CD-adapco 2013
新しい領域分割
ラグランジェ/DEM ロードバランスの改善(V8.02)
対象となる解析事例
 SCR デバイス
 スプレードライヤ
 化学反応スプレー
Elapsed time per step [s]
計算実行中に自動、且つ計算結果依存した再
パーティション分割実行機能を搭載
計算速度(並列性能)パフォーマンスを大幅に改善
4
50
45
40
35
30
25
20
15
10
5
0
2.5倍以上の計算速度改善を達成
With Load Balancing
Without Load Balancing
0
8
16
24
32
40
48 ©
56CD-adapco
64 72 2013
80 88
Cores
96 104 112 120 128
直接インターフェイス生成の改善 (V8.04)
不連続メッシュのインターフェース生成の時間短縮
定常 & 非定常解析
最大2倍のスピードアップ
5
対象となる解析事例
 移動メッシュケース
 回転翼機
 ファン
 自動車熱害
STAR-CCM+
1000万セル非定常軸流ファン解析
インターフェース x2 – 149k & 228k フェース
各時間ステップあたりの所要計算時間
1700万セル非定常ヘリコプター解析
インターフェース x1 – 560k フェース
各時間ステップあたりの所要計算時間
v8.02
21.91s
5,98s
v8.04
11.39s
2.72s
© CD-adapco 2013
パラレルトリマーの実装 (V8.06)
トリムメッシュの並列化処理機能を実装
–
–
–
–
最大で3倍のスピードアップ
シリアルメッシングと同等のメッシュサイズ、メッシュ品質を再現できるよう設計
100万cell を下回ると予想された区分は自動的にシリアル処理
ロードバランスを意識した均等区分化設計
Image courtesy of Daimler A.G.
6
© CD-adapco 2013
STAR-CCM+ パフォーマンステスト
STAR-CCM+のパフォーマンスは開発サイクル
を通しモニターされます
– 毎日17ケースのテストデータが実行されます
• パラレルとシングルコアのパフォーマンスがチェック
されます
• 実行環境
– Linux と Windows 64bit ワークステーション
– 最大192コアのLinux クラスタ
– 24 コア Windows server 2008 R2 クラスタ
– 毎月そして、主要な開発マイルストーン時に9ケースの大規模
テストデータが実行されます
• Linux 64 bit クラスタ上での最大1152コアでのパフォーマンステスト
– 必要に応じて、追加のテストが上記以外にも実行される可能性があります
• 特定の開発のテスト、パートナーであるハードウェアベンダーのクラスタ上にて
実行環境
すべてのテストの実行環境は :
– 64bit Scientific Linuxで実行される
64 ブレードクラスタ
– 各ブレード
• 2 Intel E5-2680 2.70 GHz 8 コア
CPU
• 32 GB 物理メモリ
– Mellanox QDR Infiniband 相互接続
– Panassas パラレルファイルシステム
実行環境
–
–
–
–
使用可能なパラレル I/O
MPI CPU 親和性を有効化
前もって40イタレーションの助走計算
パフォーマンスは20イタレーション以上
の平均経過時間を基に計測
データセット : 車両アンダーフード
車両のアンダーフード冷却解析
– 4千6百万 トリムメッシュ
• 7 Region(76 万セル~ 4 千万セル)
– 分離型ソルバ
– 物理連続体 毎 の並列区分化設定のテスト
データセット : HL-20 MACH 10
極超音速の抗力 Polar
– 640万セルのポリヘドラルメッシュ
– 連成型解法
イタレーション毎の経過時間
8
7
6
8.06
5
8.04
4
3
2
1
0
32
64
128
256
512
1024
データセット : ターボチャージャ
複数領域のターボチャージャ CHT
– 700万セルのポリヘドラルメッシュ
– 分離型解法
イタレーション毎の経過時間
4.5
4
3.5
8.06
3
8.04
2.5
2
1.5
1400
1
0.5
パラレル効率
1200
0
32
64
128
256
512
1024
Ideal speedup
8.02
1000
8.04
800
600
400
200
0
0
144
288
432
576
720
864
1008
1152
データセット : 原子炉
内部流れ
– 900万セルのポリヘドラルメッシュ
– 分離型解法
イタレーション毎の経過時間
6
5
8.06
4
8.04
3
2
1
0
32
64
128
256
512
1024
データセット : 民間定期航空機
外部空力
– 2000万セルのトリムメッシュ
– 連成型解法
イタレーション毎の経過時間
8
7
6
8.06
5
8.04
4
3
2
1
0
64
128
256
512
1024
データセット : ルマン車両
外部空力
– 1700万セルのポリヘドラルメッシュ
– 分離型解法
イタレーション毎の経過時間
10
9
8
8.06
7
8.04
6
5
4
3
2
1
0
32
64
128
256
512
1024
データセット : ルマン車両
外部空力
– 1億4百万セルのトリムメッシュ
– 分離型解法
大規模モデルと STAR-CCM+
ソフトウエア側の対応機能
– クライアント – サーバ アーキテクチャ (リリース当初からの設計仕様)
– 区分化(Partitioning) 機能 の実装 (V8.04)
– パフォーマンス改善 (V8.02, V8.04)
ライセンス種別による対応
– hpcdomain オプション (Partitioning 数に応じたライセンス)
– PowerSession オプション (並列無制限ライセンス)
クラウド側のハードウエア利用
– Power of Demand ライセンス(必要な計算時間での課金システム)
hpcdomain オプション ライセンスの特徴
hpcdomain ライセンス
契約並列数に応じた計算利用可
ライセンスファイル内に hpcdomain フィーチャ が明記
※ccmpsuite フィーチャ (通常の STAR-CCM+ 起動ライ
センス)の数だけ 指定並列数が使用できます。
契約してる Partition 数であれば
複数ジョブも利用可能。
例: hpcdomain=100 partition で
以下のようなアレンジが可能です。
100 partition を1ジョブで利用
50 partition を 2 ジョブで利用
25 partition を 4ジョブで利用
・・・・・・
Power Session オプション ライセンスの特徴
Power Session ライセンス
1 ジョブにつき並列数無制限利用可
1ジョブ計算に対して
解析対象や、
ハードウエアの空き状況に応じて
自由に並列数を増やせます。
ライセンスファイル内に ccmppower フィーチャ が明記
・・・・並列
32 並列
16 並列
8 並列
4 並列
大規模モデルと STAR-CCM+
ソフトウエア側の対応機能
– クライアント – サーバ アーキテクチャ (リリース当初からの設計仕様)
– 区分化(Partitioning) 機能 の実装 (V8.04)
– パフォーマンス改善 (V8.02, V8.04)
ライセンス種別による対応
– hpcdomain オプション (Partitioning 数に応じたライセンス)
– PowerSession オプション (並列無制限ライセンス)
クラウド側のハードウエア利用
– Power of Demand ライセンス(必要な計算時間での課金システム)
STAR-CCM+ Power-on-Demand
• 必要なときに STAR-CCM+ Power Session にアクセスできる革新的な
製品ライセンスモデル
– スループットの向上
• 非常に多くのパーティションとセッション
– 柔軟性の向上
• クラスター、クラウド、ネットワークで
動作 (独自のクラスターを含む)
– 強力なライセンス機能
• クラウド上の CAE へのゲートウェイ
使い方は?
• 1 時間単位のリアルタイムライセンス(PoDクレジット)を購入
(500 時間以上)
• PoDクレジットは 12 か月間有効
• カスタマーポータルにログインしライセンスタブを開きます
– 複数のタブが表示されます
• Account Activity、Account Usage、Manage Keys
具体的には...
• PoDクレジットの使い方
– 例
• 500 時間のPoDクレジットが利用できる場合
– 1 つの Power Session ジョブを 16 コアで 500 時間使用可能
– 5 つの Power Sessions ジョブを 128 コアで 100 時間ずつ使用可能
– 500 の Power Sessions ジョブを 64 コアで 1 時間ずつ使用可能
– お持ちのPoDクレジットをどのように分割し、使用するかはユーザー次第です
– 複数のジョブをPoDライセンスを用いて並列で実行する場合、ジョブ実行の際の
合計のPoDクレジット予約時間がお持ちのPoDクレジットを超えることができな
いという制限があります
キー
• キーは使用状況の記録に使用されます
• 1 つのキーでいくつでもジョブを開始できます
• 必要に応じてキーの作成と削除を行うことができます。キーにアクセスして
いる間、予約時間が使用されます
• キーには有効期間があります。この期間以外は使用できません
キーの作成と管理
• キーは [Manage keys] タブで作成して管理します
使用状況の確認
• PoDクレジット の使用状況は [Account Usage] タブで確認できます。ま
た、レポートを作成することもできます
Power-On-Demand の使用
• STAR-CCM+ を対話モードで実行すると、sim ファイルの読み込み画面か
ら PoD セッションが開始します
• この操作を行うには、新しいセッションを開始するか、既存の sim ファイル
を読み込んで関連するボックスに情報を入力します
• Power-on-Demand キーをバッチで設定するには、次のフラグを使用しま
す
-podkey <key value>
Power-On-Demand クレジット消費に関する注意点
PoDクレジットの持ち時間により、同時実行できるセッション数に制限があ
ります
同時実行されるセッションすべてに対して、PoDクレジットの予約時間が確
保されます
予約時間の合計がお持ちのPoDクレジットを超えてセッションを実行するこ
とができません
* 100時間のPoDクレジットをお持ちの場合
•
•
•
•
世界標準時で1時に計算開始:23時間分の予約時間が確保されます
4つのセッションを実行:92時間分の予約時間が確保されます
PoDクレジット残は、“8”時間ですが、5つ目のセッションまで実行することが可能です
6つ目のセッションを起動した際に、クレジット残が“0”時間のため、実行することができ
ません
お問い合わせ先
株式会社CD-adapco
横浜オフィス
Tel: 045-475-3285 Fax: 045-475-3295
横浜市港北区新横浜2-3-12 新横浜スクエアビル 16F
大阪オフィス
Tel: 06-4807-7840 Fax: 06-4807-7845
大阪市淀川区宮原1-6-1 新大阪ブリックビル 9F
E-mail
[email protected]
28
© CD-adapco 2013
Your CAE Partner for Success
www.cd-adapco.com/ja
Fly UP