Comments
Description
Transcript
GPGPU 高速化ソリューションのご案内 ① ハードウェアを選ぶ
GPGPU 高速化ソリューションのご案内 ① ハードウェアを選ぶ ② CUDA対応アプリを使う ☞ GPGPUエントリーワークステーション ☞ CUDA対応アプリケーションの計算環境構築をおこないます! ■EvoHG1 (最小構成/SIPなし) ■対応アプリケーション (2010年4月現在) CPU:Intel Xeon W3520 (2.66GHz) Mem:6GB (2GB ×3) HDD:500GB ×2 GPU:NVIDIA GeForce GTX 470 OS:Cent0S 5.3 x86_64 [分子力学と量子科学] ACE MD (近日提供),AMBER,Big DFT (近日提供), GROMACS,GROMOS (近日提供),HOOMD, LAMMPS,NAMD,TeraChem (QC),VMD [バイオインフォマティクス] CUDA-BLASTP,CUDA-EC.CUDA-MEME, CUDASW++(Smith-Waterman), GPU-HMMER,MUMmerGPU ¥298,000 単体価格 (税込): SIP [CUDA環境構築済] 価格 (税込):¥374,850 ¥198,000~ アカデミック価格 (税込) : ※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。 ③ CUDAで高速化する ④ 無料お試しサービスに申し込む ☞ ご自作のアプリケーションをCUDAで高速化します! ☞ GPUの効果を確認したい方におすすめします! ■ご依頼事例 《お客様の自作コード》 ・分子動力学(MD)計算用アプリ ・流体計算用アプリ ・構造解析用アプリなど ✓性能プロファイリング ✓GPGPU化可能性の検討 ✓評価用プロトタイプの作成 ✓評価用プロトタイプの性能評価 ✓評価用プロトタイプの提供※ [対応可能要件] OS:Linux (ディストリビューション問わず) 開発言語:C/C++、Fortran GPGPUコーディング:CUDA ¥98,000~ アカデミック価格 (税込): ※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。 HPCシステムズ株式会社 www.hpc.co.jp 〒135-8073 ■サービス内容 東京都江東区青海2-4-32 タイム24ビル 10F北 30 day s 先着 20名 自作コードのGPGPU化を ご検討中の方に最適です! ¥0 ※評価期間には制限があります。詳細は当社スタッフまでお問い合わせください。 お問合せは 03-3599-3652まで 2010/6/21更新 ① ハードウェアを選ぶ EvoHG1(水冷ワークステーション/Tesla 搭載可能) GCS-LV1 EvoHG2(タワー型ワークステーション/Tesla 4基搭載可能) 仕様一覧 CPU:Intel ® Xeon® W3680 (3.33GHz, 6core) Intel ® Xeon® W3565 (3.20GHz, 4core) 他 [搭載数 1CPU(4~6コア)] Mem:標準 2GB×3 ※2GB、4GB 最大6枚搭載可、最大容量24GB [搭載数 3 or 6] HDD:標準 160GB ×1 (SATA、7200rpm、8MB) 最上位モデル 2TB(SATA、7200rpm、64MB) ※最大2台搭載可能 [搭載数 1 or 2] VGA:標準 NVIDIA® GeForce GTX 470×2 ※詳細はお問い合わせください。 [搭載数 1 or 2] GPGPU:NVIDIA® Tesla™ C1060、NVIDIA® Tesla™ C2050 ※VGAが必要です [搭載数 1] OS: CentOS 4/5 x86_64 RedHat® Enterprise Linux WS 4/5 x86_64 Microsoft® Windows® 7 64-bit Edition Microsoft® Windows® XP Professional 64-bit Edition SP2※ ・GPGPU用エントリーモデル ・水冷による静音性確保 ・GTX470を標準搭載 ・Tesla C2050搭載可能 仕様一覧 ・GPGPU用アドバンスモデル ・ Tesla C1060を最大4基搭載可能 ・Tesla C2050搭載可能 CPU:Intel ® Xeon® X5680 (3.33GHz, 6core) Intel ® Xeon® X5677 (3.46GHz, 4core) 他 [搭載数 2CPU(8~12コア)] Mem:標準 4GB×12 ※2GB、4GB、8GB 最大12枚搭載可、最大容量96GB (搭載数 6 or 12) HDD:標準 500GB ×2 (SATA、7200rpm、16MB) 最上位モデル 2TB(SATA、7200rpm、64MB) ※最大6台搭載可能(光学ドライブ搭載時は最大5台) (搭載数 1~6) VGA:NVIDIA® GeForce GTX 470/480 NVIDIA® Quadro ® FX 1800/3800/4800/5800 ※詳細はお問い合わせください。 (搭載数 1 or 2) GPGPU:NVIDIA® Tesla™ C1060、NVIDIA® Tesla™ C2050 ※VGAが必要です (搭載数 1~4) OS: CentOS 4/5 x86_64 RedHat® Enterprise Linux WS 4/5 x86_64 (※ Vista Business / 7 Professionalからのダウングレードによる) 単体価格 (税込):¥298,000~ EvoHG3(1Uラックマウントシステム/Tesla 2基搭載可能) 仕様一覧 CPU:Intel ® Xeon® E5540 (2.53GHz, 4core) Intel ® Xeon® W3565 (3.20GHz, 4core) [搭載数 2CPU(8コア)] Mem:標準 2GB×6 HDD:標準 500GB ×3 (Hot swap HDD) GPGPU:標準 NVIDIA® Tesla™ M1060×2 OS: CentOS 4/5 x86_64 RedHat® Enterprise Linux WS 4/5 x86_64 ・1Uラックマウントシステム ※システムの仕様、構成、価格等の詳細はお問い合わせください。 ・ Tesla C1060を最大4基搭載可能 単体価格 (税込):¥1,880,000~ オプション ・ PGI Accelerator Workstation (ノードロック・シングルユーザ用サポート1年付) …… ¥103.530(教育機関) ¥220,395(一般・官公庁) ・ インテル®コンパイラースイート (Linux版/プロフェッショナルエディション) ……………¥59,900(アカデミック) ¥175,300(商用) ・モニタ [ 24型LCDワイドモニタ (E2420HD) ] ………… ¥38,000 ・UPS(1500VA)………………………………………………¥158,000 《用語解説》 ・Tesla C2050搭載可能 ・GPU…3Dグラフィックスの表示に必要な計算処理を行なう半導体チップ。グラフィックカード。 ・GPGPU… General Purpose computing on GPUの略。GPUを汎用計算に利用する技術。 ・Tesla… GeForceやQuadroをベースに開発されたNVIDIA社のGPGPU専用チップ。 単体価格 (税込):¥1,298,000~ ・CUDA…NVIDIA社が提供するGPU向けC言語統合開発環境。コンパイラやライブラリ等から構成されている。 2010/6/21更新 ② CUDA対応アプリを使う GCS-LV2 ☞ CUDA対応アプリケーションの計算環境構築をおこないます! OS,コンパイラ,CUDAの セットアップ STEP 2 STEP 3 CUDA対応アプリのセットアップ 動作確認、高速化の体感 STEP 1 OS,コンパイラ,CUDAをセットアップします。 STEP 2 CUDA対応アプリケーションをセットアップします。 STEP 3 アプリケーションの動作確認と高速化を体感していただきます。 ■GPGPU対応版NAMDベンチマーク 分子動力学コードNAMDホームページで公開されているコードを評価いたしました。 インプット:DNA (92,224atom) x6.37 高速化 200 実行時間 [sec] STEP 1 150 100 50 0 Xeon®E5520 2.26GHz x1コア Xeon®E5520 2.26GHz x1コア + Tesla ™C1060 備考 CUDA対応アプリケーション (2010年4月現在): [分子力学と量子科学] ACE MD (近日提供),AMBER,Big DFT (近日提供),GROMACS,GROMOS (近日提供),HOOMD,LAMMPS,NAMD,TeraChem (QC),VMD [バイオインフォマティクス] CUDA-BLASTP,CUDA-EC.CUDA-MEME,CUDASW++(Smith-Waterman),GPU-HMMER,MUMmerGPU ※その他アプリケーションの対応状況は、各ソフトウェアベンダーにお問い合わせください。 ¥198,000~ アカデミック価格 (税込) : 2010/6/21更新 ③ CUDAで高速化する GCS-LV3 ☞ ご自作のアプリケーションをCUDAで高速化します! STEP 1 STEP 2 STEP 3 ソースコードのお預かり OpenMPによる 並列化コーディング GPGPUコーディング ・自作コード ⇒ 性能プロファイリング 成果物の受け渡し ・ソースコード ・高速化報告書※ ⇒ GPGPU化可能性の検討 [対応可能要件]OS:Linux (ディストリビューション問わず) / Windows ※オプションサービス 開発言語:C/C++、Fortran GPGPUコーディング:CUDA ■ ご依頼事例 STEP 1 ソースコード※1をお預かりします。 STEP 2 OpenMPによる並列化コーディングをします。 STEP 3 CUDAによる並列化コーディングをします。 STEP 4 STEP 4 成果物※2をお渡しします。 ■注意事項 A大学様/MD計算 B大学様/乱流計算 C研究所様/MD計算 高速化前:12833 sec. 高速化後: (OpenMP)2052 sec. (6.25倍) (Tesla C1060 ×2) Float 198 sec. (64.65倍) Double 994 sec. (12.92倍) (Tesla C2050 ×1) Float 未測定 Double 3494 sec. (29.10倍) 高速化前:33772 sec. 高速化後: (OpenMP)17922 sec. (1.88倍) (Tesla C1060 ×1) Float 未測定 Double 5398 sec. (6.26倍) (Tesla C2050 ×1) Float 未測定 Double 3479 sec. (8.71倍) 高速化前:32878 sec. 高速化後: (OpenMP)9875 sec. (3.36倍) (Tesla C1060 ×1) Float 4496 sec. (7.31倍) Double 10926 sec. (3.01倍) (Tesla C2050 ×1) Float 2769 sec. (11.87倍) Double 3494 sec. (9.41倍) [ベンチマーク環境] GPU:Tesla C1060 ×2 および Tesla C2050 ×1 [ベンチマーク環境] GPU:Tesla C1060 ×1 および Tesla C2050 ×1 [ベンチマーク環境] GPU:Tesla C1060 ×1 および Tesla C2050 ×1 ■ 最新ニュース 「粒子法計算が高速化、1億粒子1万ステップで約10日」 詳細はこちら☞ http://topsecret.hpc.co.jp ※1 ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、プログラムの 背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち合わせを行います。 ※2 成果物はソースコードで販売いたします。詳細は当社スタッフまでお問い合わせください。 ¥98,000~ ■オプションサービス ・高速化報告書(A4サイズ 1枚程度)…アカデミック価格(税込):21,000円 アカデミック価格 (税込): ※コーディング内容によって価格が変わります。詳細は当社スタッフまでお問い合わせください。 2010/6/21更新 ④ 無料お試しサービスに申込む GCS-LV4 ☞ GPUの効果を無料で確認したい方におすすめします! STEP 1 STEP 2 STEP 3 ソースコードのお預かり OpenMPによる 並列化コーディング GPGPUコーディング ・自作コード ⇒ 性能プロファイリング ⇒ GPGPU化可能性の検討 STEP 4 成果物の受け渡し ・使用期限付きバイナリコード (評価用プロトタイプ) 30 day s [対応可能要件]OS:Linux (ディストリビューション問わず) / Windows 開発言語:C/C++、Fortran GPGPUコーディング:CUDA STEP 1 ソースコード※1をお預かりします。 STEP 2 OpenMPによる並列化コーディングをします。 STEP 3 CUDAによる並列化コーディングをします。 STEP 4 成果物 (使用期限付きバイナリコード) ※2をお渡しします。 先着 20名 ■注意事項 ※1 ソースコードをお預かりする前に機密保持契約を締結できます。自作コードに加えて、サンプルインプットファイル(数分~数時間で終了するもの) 、 プログラムの背景や仕様を理解する助けとなる資料、外部ライブラリ(必要時) 等の情報をご提供ください。ご依頼時にメールまたは電話による打ち 合わせを行います。 ※2 成果物は使用期限付きバイナリコード(評価用プロトタイプ)でお渡しします。GPUの効果を30日間無償でお試しいただけます。 ¥0 2010/6/21更新 HPCシステムズ ハイパフォーマンスコンピューティングソリューション ☞ 取扱アプリケーション一覧 量子科学計算 第一原理電子状態計算 分子動力学計算 気象解析 数式・統計処理 Gaussian09 VASP Amber WRF MATLAB GAMESS Wien2k GROMACS MM5 R Molpro PHASE DL_POLY Molcas Dirac AutoDock CRYSTAL OpenMX 構造解析 流体解析 樹脂流動解析 マルチフィジックス 電磁界解析 ANSYS FLUENT Moldex3D COMSOL Multiphysics HFSS Femtet Maxwell 3D ABAQUS STAR-CD Marc STAR-CCM+ MSC.Nastran ANSYS-CFX LS-DYNA Phoenics RADIOSS 各種アプリケーションが安定して性能を発揮できるように、弊社システムではOS、ディスクI/O、ネットワークなどを最適化しています。 また、ISV各社との協力により動作検証を実施しているほかホームページで最新のベンチマークテスト結果を掲載しています。 詳細はこちら☞ http://www.hpc.co.jp/software.html HPCシステムズ株式会社 www.hpc.co.jp ・本社 営業本部(〒135-8073 東京都江東区青海2-4-32 タイム24ビル10F北) ・神戸ポートアイランド営業所(〒650-0047 兵庫県神戸市中央区港島南町5丁目5番2号 神戸国際ビジネスセンター(KIBC) 6F 652-1) ・京都営業所(〒605-0061 京都市東山区白川筋三条下ル梅宮町485番地5 パークハウス108) ・匝瑳工場(〒289-3181 千葉県匝瑳市野手174-1) ・台湾開発センター(5F, No.1, Alley 6, Lane 235, Boa Chaio Road, Hsin Tien City, Taipei Taiwan, R.O.C. 〈台北縣新店市寶橋路235巷6弄1號5樓〉) 青海本社/タイム24ビル10F北 HPCシステムズ株式会社 www.hpc.co.jp 〒135-8073 東京都江東区青海2-4-32 タイム24ビル 10F北 お問合せは 匝瑳工場/千葉県匝瑳市 03-3599-3652まで 2010/6/21更新