...

GPGPU 高速化ソリューションのご案内 ① ハードウェアを選ぶ

by user

on
Category: Documents
21

views

Report

Comments

Transcript

GPGPU 高速化ソリューションのご案内 ① ハードウェアを選ぶ
GPGPU 高速化ソリューションのご案内
① ハードウェアを選ぶ
② CUDA対応アプリを使う
☞ GPGPUエントリーワークステーション
☞ CUDA対応アプリケーションの計算環境構築をおこないます!
■EvoHG1 (最小構成/SIPなし)
■対応アプリケーション (2010年4月現在)
CPU:Intel Xeon W3520 (2.66GHz)
Mem:6GB (2GB ×3)
HDD:500GB ×2
GPU:NVIDIA GeForce GTX 470
OS:Cent0S 5.3 x86_64
[分子力学と量子科学]
ACE MD (近日提供),AMBER,Big DFT (近日提供),
GROMACS,GROMOS (近日提供),HOOMD,
LAMMPS,NAMD,TeraChem (QC),VMD
[バイオインフォマティクス]
CUDA-BLASTP,CUDA-EC.CUDA-MEME,
CUDASW++(Smith-Waterman),
GPU-HMMER,MUMmerGPU
¥298,000
単体価格 (税込):
SIP [CUDA環境構築済] 価格 (税込):¥374,850
¥198,000~
アカデミック価格 (税込) :
※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。
③ CUDAで高速化する
④ 無料お試しサービスに申し込む
☞ ご自作のアプリケーションをCUDAで高速化します!
☞ GPUの効果を確認したい方におすすめします!
■ご依頼事例
《お客様の自作コード》
・分子動力学(MD)計算用アプリ
・流体計算用アプリ
・構造解析用アプリなど
✓性能プロファイリング
✓GPGPU化可能性の検討
✓評価用プロトタイプの作成
✓評価用プロトタイプの性能評価
✓評価用プロトタイプの提供※
[対応可能要件]
OS:Linux (ディストリビューション問わず)
開発言語:C/C++、Fortran
GPGPUコーディング:CUDA
¥98,000~
アカデミック価格 (税込):
※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。
HPCシステムズ株式会社 www.hpc.co.jp
〒135-8073
■サービス内容
東京都江東区青海2-4-32 タイム24ビル 10F北
30
day s
先着
20名
自作コードのGPGPU化を
ご検討中の方に最適です!
¥0
※評価期間には制限があります。詳細は当社スタッフまでお問い合わせください。
お問合せは
03-3599-3652まで
2010/6/21更新
① ハードウェアを選ぶ
EvoHG1(水冷ワークステーション/Tesla 搭載可能)
GCS-LV1
EvoHG2(タワー型ワークステーション/Tesla 4基搭載可能)
仕様一覧
CPU:Intel ® Xeon® W3680 (3.33GHz, 6core)
Intel ® Xeon® W3565 (3.20GHz, 4core) 他
[搭載数 1CPU(4~6コア)]
Mem:標準 2GB×3
※2GB、4GB 最大6枚搭載可、最大容量24GB
[搭載数 3 or 6]
HDD:標準 160GB ×1 (SATA、7200rpm、8MB)
最上位モデル 2TB(SATA、7200rpm、64MB)
※最大2台搭載可能
[搭載数 1 or 2]
VGA:標準 NVIDIA® GeForce GTX 470×2
※詳細はお問い合わせください。
[搭載数 1 or 2]
GPGPU:NVIDIA® Tesla™ C1060、NVIDIA® Tesla™ C2050
※VGAが必要です
[搭載数 1]
OS: CentOS 4/5 x86_64
RedHat® Enterprise Linux WS 4/5 x86_64
Microsoft® Windows® 7 64-bit Edition
Microsoft® Windows® XP Professional 64-bit Edition SP2※
・GPGPU用エントリーモデル
・水冷による静音性確保
・GTX470を標準搭載
・Tesla C2050搭載可能
仕様一覧
・GPGPU用アドバンスモデル
・ Tesla C1060を最大4基搭載可能
・Tesla C2050搭載可能
CPU:Intel ® Xeon® X5680 (3.33GHz, 6core)
Intel ® Xeon® X5677 (3.46GHz, 4core) 他
[搭載数 2CPU(8~12コア)]
Mem:標準 4GB×12
※2GB、4GB、8GB 最大12枚搭載可、最大容量96GB
(搭載数 6 or 12)
HDD:標準 500GB ×2 (SATA、7200rpm、16MB)
最上位モデル 2TB(SATA、7200rpm、64MB)
※最大6台搭載可能(光学ドライブ搭載時は最大5台)
(搭載数 1~6)
VGA:NVIDIA® GeForce GTX 470/480
NVIDIA® Quadro ® FX 1800/3800/4800/5800
※詳細はお問い合わせください。
(搭載数 1 or 2)
GPGPU:NVIDIA® Tesla™ C1060、NVIDIA® Tesla™ C2050
※VGAが必要です
(搭載数 1~4)
OS: CentOS 4/5 x86_64
RedHat® Enterprise Linux WS 4/5 x86_64
(※ Vista Business / 7 Professionalからのダウングレードによる)
単体価格 (税込):¥298,000~
EvoHG3(1Uラックマウントシステム/Tesla 2基搭載可能)
仕様一覧
CPU:Intel ® Xeon® E5540 (2.53GHz, 4core)
Intel ® Xeon® W3565 (3.20GHz, 4core)
[搭載数 2CPU(8コア)]
Mem:標準 2GB×6
HDD:標準 500GB ×3 (Hot swap HDD)
GPGPU:標準 NVIDIA® Tesla™ M1060×2
OS: CentOS 4/5 x86_64
RedHat® Enterprise Linux WS 4/5 x86_64
・1Uラックマウントシステム
※システムの仕様、構成、価格等の詳細はお問い合わせください。
・ Tesla C1060を最大4基搭載可能
単体価格 (税込):¥1,880,000~
オプション
・ PGI Accelerator Workstation
(ノードロック・シングルユーザ用サポート1年付) …… ¥103.530(教育機関)
¥220,395(一般・官公庁)
・ インテル®コンパイラースイート
(Linux版/プロフェッショナルエディション) ……………¥59,900(アカデミック)
¥175,300(商用)
・モニタ [ 24型LCDワイドモニタ (E2420HD) ] ………… ¥38,000
・UPS(1500VA)………………………………………………¥158,000
《用語解説》
・Tesla C2050搭載可能
・GPU…3Dグラフィックスの表示に必要な計算処理を行なう半導体チップ。グラフィックカード。
・GPGPU… General Purpose computing on GPUの略。GPUを汎用計算に利用する技術。
・Tesla… GeForceやQuadroをベースに開発されたNVIDIA社のGPGPU専用チップ。
単体価格 (税込):¥1,298,000~
・CUDA…NVIDIA社が提供するGPU向けC言語統合開発環境。コンパイラやライブラリ等から構成されている。
2010/6/21更新
② CUDA対応アプリを使う
GCS-LV2
☞ CUDA対応アプリケーションの計算環境構築をおこないます!
OS,コンパイラ,CUDAの
セットアップ
STEP 2
STEP 3
CUDA対応アプリのセットアップ
動作確認、高速化の体感
STEP 1
OS,コンパイラ,CUDAをセットアップします。
STEP 2
CUDA対応アプリケーションをセットアップします。
STEP 3
アプリケーションの動作確認と高速化を体感していただきます。
■GPGPU対応版NAMDベンチマーク
分子動力学コードNAMDホームページで公開されているコードを評価いたしました。
インプット:DNA (92,224atom)
x6.37
高速化
200
実行時間 [sec]
STEP 1
150
100
50
0
Xeon®E5520 2.26GHz
x1コア
Xeon®E5520 2.26GHz
x1コア + Tesla ™C1060
備考
CUDA対応アプリケーション (2010年4月現在):
[分子力学と量子科学]
ACE MD (近日提供),AMBER,Big DFT (近日提供),GROMACS,GROMOS (近日提供),HOOMD,LAMMPS,NAMD,TeraChem (QC),VMD
[バイオインフォマティクス]
CUDA-BLASTP,CUDA-EC.CUDA-MEME,CUDASW++(Smith-Waterman),GPU-HMMER,MUMmerGPU
※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。
¥198,000~
アカデミック価格 (税込) :
2010/6/21更新
③ CUDAで高速化する
GCS-LV3
☞ ご自作のアプリケーションをCUDAで高速化します!
STEP 1
STEP 2
STEP 3
ソースコードのお預かり
OpenMPによる
並列化コーディング
GPGPUコーディング
・自作コード
⇒ 性能プロファイリング
成果物の受け渡し
・ソースコード
・高速化報告書※
⇒ GPGPU化可能性の検討
[対応可能要件]OS:Linux (ディストリビューション問わず) / Windows
※オプションサービス
開発言語:C/C++、Fortran GPGPUコーディング:CUDA
■ ご依頼事例
STEP 1
ソースコード※1をお預かりします。
STEP 2
OpenMPによる並列化コーディングをします。
STEP 3
CUDAによる並列化コーディングをします。
STEP 4
STEP 4
成果物※2をお渡しします。
■注意事項
A大学様/MD計算
B大学様/乱流計算
C研究所様/MD計算
高速化前:12833 sec.
高速化後:
(OpenMP)2052 sec. (6.25倍)
(Tesla C1060 ×2)
Float
198 sec. (64.65倍)
Double 994 sec. (12.92倍)
(Tesla C2050 ×1)
Float
未測定
Double 3494 sec. (29.10倍)
高速化前:33772 sec.
高速化後:
(OpenMP)17922 sec. (1.88倍)
(Tesla C1060 ×1)
Float
未測定
Double 5398 sec. (6.26倍)
(Tesla C2050 ×1)
Float
未測定
Double 3479 sec. (8.71倍)
高速化前:32878 sec.
高速化後:
(OpenMP)9875 sec. (3.36倍)
(Tesla C1060 ×1)
Float
4496 sec. (7.31倍)
Double 10926 sec. (3.01倍)
(Tesla C2050 ×1)
Float
2769 sec. (11.87倍)
Double 3494 sec. (9.41倍)
[ベンチマーク環境]
GPU:Tesla C1060 ×2 および Tesla C2050 ×1
[ベンチマーク環境]
GPU:Tesla C1060 ×1 および Tesla C2050 ×1
[ベンチマーク環境]
GPU:Tesla C1060 ×1 および Tesla C2050 ×1
■ 最新ニュース
「粒子法計算が高速化、1億粒子1万ステップで約10日」
詳細はこちら☞ http://topsecret.hpc.co.jp
※1 ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、プログラムの
背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち合わせを行います。
※2 成果物はソースコードで販売いたします。詳細は当社スタッフまでお問い合わせください。
¥98,000~
■オプションサービス
・高速化報告書(A4サイズ 1枚程度)…アカデミック価格(税込):21,000円
アカデミック価格 (税込):
※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。
2010/6/21更新
④ 無料お試しサービスに申込む
GCS-LV4
☞ GPUの効果を無料で確認したい方におすすめします!
STEP 1
STEP 2
STEP 3
ソースコードのお預かり
OpenMPによる
並列化コーディング
GPGPUコーディング
・自作コード
⇒ 性能プロファイリング
⇒ GPGPU化可能性の検討
STEP 4
成果物の受け渡し
・使用期限付きバイナリコード
(評価用プロトタイプ)
30
day s
[対応可能要件]OS:Linux (ディストリビューション問わず) / Windows
開発言語:C/C++、Fortran GPGPUコーディング:CUDA
STEP 1
ソースコード※1をお預かりします。
STEP 2
OpenMPによる並列化コーディングをします。
STEP 3
CUDAによる並列化コーディングをします。
STEP 4
成果物 (使用期限付きバイナリコード) ※2をお渡しします。
先着
20名
■注意事項
※1
ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、
プログラムの背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち
合わせを行います。
※2
成果物は使用期限付きバイナリコード(評価用プロトタイプ)でお渡しします。GPUの効果を30日間無償でお試しいただけます。
¥0
2010/6/21更新
HPCシステムズ ハイパフォーマンスコンピューティングソリューション
☞ 取扱アプリケーション一覧
量子科学計算
第一原理電子状態計算
分子動力学計算
気象解析
数式・統計処理
Gaussian09
VASP
Amber
WRF
MATLAB
GAMESS
Wien2k
GROMACS
MM5
R
Molpro
PHASE
DL_POLY
Molcas
Dirac
AutoDock
CRYSTAL
OpenMX
構造解析
流体解析
樹脂流動解析
マルチフィジックス
電磁界解析
ANSYS
FLUENT
Moldex3D
COMSOL Multiphysics
HFSS
Femtet
Maxwell 3D
ABAQUS
STAR-CD
Marc
STAR-CCM+
MSC.Nastran
ANSYS-CFX
LS-DYNA
Phoenics
RADIOSS
各種アプリケーションが安定して性能を発揮できるように、弊社システムではOS、ディスクI/O、ネットワークなどを最適化しています。
また、ISV各社との協力により動作検証を実施しているほかホームページで最新のベンチマークテスト結果を掲載しています。
詳細はこちら☞ http://www.hpc.co.jp/software.html
HPCシステムズ株式会社 www.hpc.co.jp
・本社 営業本部(〒135-8073 東京都江東区青海2-4-32 タイム24ビル10F北)
・神戸ポートアイランド営業所(〒650-0047 兵庫県神戸市中央区港島南町5丁目5番2号 神戸国際ビジネスセンター(KIBC) 6F 652-1)
・京都営業所(〒605-0061 京都市東山区白川筋三条下ル梅宮町485番地5 パークハウス108)
・匝瑳工場(〒289-3181 千葉県匝瑳市野手174-1)
・台湾開発センター(5F, No.1, Alley 6, Lane 235, Boa Chaio Road, Hsin Tien City, Taipei Taiwan, R.O.C. 〈台北縣新店市寶橋路235巷6弄1號5樓〉) 青海本社/タイム24ビル10F北
HPCシステムズ株式会社 www.hpc.co.jp
〒135-8073
東京都江東区青海2-4-32 タイム24ビル 10F北
お問合せは
匝瑳工場/千葉県匝瑳市
03-3599-3652まで
2010/6/21更新
Fly UP