...

科学技術計算専用ロジック組込み型 プラットフォーム・アーキテクチャ

by user

on
Category: Documents
15

views

Report

Comments

Transcript

科学技術計算専用ロジック組込み型 プラットフォーム・アーキテクチャ
(中間評価)
科 学 技 術 計 算 専 用ロジック 組込 み 型
プ ラ ッ ト フ ォ ー ム・ ア ー キ テ ク チ ャに 関す る 研究
(研究期間:第 Ⅰ期
研究代表者:村 上
和彰
平成 12年∼14 年)
(九州大学)
研 究 課 題の概 要
超高速 の数値 シ ミ ュ レ ー シ ョ ンが産 業 界 の設 計 開 発 現 場で ツ ー ルと し て低 価 格か つ簡 便
に利用 で き る と い う状況 の実 現を目 指し 、「非 経 験 的 分 子 軌 道 法の よ る巨 大 分 子 電 子 状 態
計算」 「密 度 汎 関 数 法に よ る 物質・ 材 料 設 計 計 算」 を主な 対象 として 、計算物理 ・計 算 化
学等の 各計算科学分野毎 の共 通 性に 立脚 すると 同時 に独 自 性を も反映可能 とした「専用 LSI
組込み 型並列分散処理プ ラ ッ ト フ ォ ー ム (土台 ,共通基盤 )」 のアーキテクチャ を開 発し
てプラットフ ォ ー ムにプ ラ グ イ ンす る こ と で、 従来 は汎用 のス ー パ ー コ ン ピ ュ ー タで 実装
していたため 非常 に高価 についた高 速か つ大 規 模な 数値シ ミ ュ レ ー シ ョ ン を飛 躍 的に 優れ
たコ ス ト・パ フ ォ ー マ ン スに て実現可能 とする 。
(1) 総 評
設計ア ー キ テ ク チ ャお よ び開 発ア プ リ ケ ー シ ョ ンの 成果の 進捗状況と 計算物理・ 計算化学
等の計 算 科 学 分 野 に対す る波及効果 、ハ ー ドと ソ フ トの各 研 究 現 場の 密接 な連携体制 は高
く評価 できる 。し か し、 「科 学 技 術 計 算 専 用∼ アーキテクチャ に関す る研 究」と い う 包括
的なテ ー マ名 は明 らかに 本研究内容 との 整合性 に欠 ける印 象が ある。 さ ら に、ア ー キ テ ク
チャ開 発が完 了し て い な い た め に計 算 機 科 学 分 野の 論 文 発 表が 極端に 少な い点は 非常 に残
念で あ る。以 上の 長所と 短所 の両面 を勘 案して 、総合評価 はb評 価と し た。
<総合評価: b>
技 術 進 展の著 しい 本研究分野 においても 、第Ⅱ 期終了時点 での 本課題 の成 果の優 位 性 と
その波及効果 には 十 分 期 待 出 来る。 当該分野に お け る他の 研究開発プ ロ ジ ェ ク ト の動 向に
も注視 し な が ら、 第Ⅱ期 に予 定している アーキテクチャ開 発を き ち ん と実 施して 、研 究 価
値を確 立する 必要 がある 。し か し一 方で 、現在 の包 括 的な テ ー マ名は 研究内容を 必ず し も
的確に 表 現 出 来て い な い た め 、適切 なテ ー マ名 の検 討を行 う べ き で あ る。 また、 成果 の優
位性を 示し、 そ れ を対 外 的に ア ピ ー ルす る た め に も 、特に アーキテクチャ 成果に 関す る情
報発信 をより 積 極 的に行 うことも必 要で あ る。 <今 後の進 め方 :b>
(2)各 テーマ における評 価 結 果
①プ ラ ッ ト フ ォ ー ムお よ び 専用ロ ジ ッ クのア ー キ テ ク チ ャ開 発
まず プラットフォーム としては 、汎 用マ イ ク ロ プ ロ セ ッ サS H-4(クロック 周 波 数200MHz)
4台と 組込み 用 途 向けリ ア ル タ イ ム OS μITRONを 汎用CPUボ ー ド上 に搭載 し 、ボ ー ド7 枚と
PC/AT互 換CompactPCIボ ー ド( Pentium Ⅲ 搭載 )1枚 をPCI バス 接続に て装 備した シャーシ
を、Ethernet で4 筐 体 接 続し たプ ラ ッ ト フ ォ ー ム・ シ ス テ ムを 開発し 、そ の稼動 に成 功し
た。
また、 下記の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ムを 対象 に、専 用ロジック 化を 検討し 、専 用
ロ ジ ッ クの開 発 方 針を以 下の 通り決 定し た。
・ 分子軌道法で は 、「非 経 験 的 分 子 軌 道 法プ ロ グ ラ ムGAMESS」「フ ラ グ メ ン ト 分 子 軌 道
法プログラム AB INIT-MP 」について 検討 を行い 、コ ア計算部分 の「二 電 子 積 分 計 算」
が専用 ロ ジ ッ ク化 に向い た設 計であ る た め、第 Ⅱ期 に お い て専 用LSI 化を実 施す る予
定。
・ 密度汎関数法 では 、「CP 法プ ロ グ ラ ムKAPPA」 に つ い て検 討を行 い。 コア計 算 部 分で
・ ある「FFT」 は専用 ロジック化 に向 いた設 計で あ る た め、 第Ⅱ期 においてFPGAに て実
装を行 う予定 。ま た、「D V法プ ロ グ ラ ムDVX-α 」に つ い て は、コ ア計算部分 が「行 列
要 素 算 出」で あ る た め、 高 速 化の効 果が 小と判 断し 、専用 ロジック化 は実 施し な い。
・ 有限要素法で は、「 実 空 間 有 限 要 素 法プ ロ グ ラ ムFEMTECK」に つ い て検討 を行 ったが 、
専用ロジック 化す べ きコ ア計算部分 の特定自体 が困 難な た め、専 用ロジック 化は実 施
しない 。
さらに 、上記 の検討結果 に従 って、 二電子積分計算 を対象 に、マ イ ク ロ ア ー キ テ ク チ ャ
は非 均 質CMP( チ ッ プ・マ ル チ プ ロ セ ッ サ)に て、「 初 期 積 分 計 算エンジン×1」「漸 化 計
算エンジン×4」 を実装 した スーパースカラ・ プロセッサ とし 、クロック 周波数 は200MHz
を最 低 達 成 目 標、 「積和演算×(1 +4 )」「 除算 /開平逆数×1 」「指 数 関 数/誤 差 関
数×1」が同 時 実 行 可 能 で あ る倍 精 度 浮 動 小 数 点 演 算 器を 実装 し、ピ ー ク 性能10 演算 /ク
ロッ ク サ イ ク ルの 倍 精 度 浮 動 小 数 点 演 算 性 能を 持つ 、二 電 子 積 分 計 算 専 用LSIの 設 計 開 発
を行っ た。実 際の 製作は 第Ⅱ 期で実 施す る。
なお、 上記の 二 電 子 積 分 計 算 以 外の コア 計算に 関し て、そ の専 用ロジック 化に関 する ラ
ピッド ・プ ロ ト タ イ ピ ン グを 可能と す る た め に 、CompactPCI規格準拠 の基 板 上に 、汎 用マ
イクロプロセッサS H-4( 200MHz)1 つと300万 ゲート 相当FPGA4 つを 実装し 、FPGA当た り
512MB( 来 年 度、1GBに拡 張 予 定)の メ モ リを搭 載し た、FPGA搭 載ボ ー ドを 試作し 、設 計シ
ステム の検証 を行 った。
以上の 通り、 本サ ブ テ ー マで は、本 研 究 プ ロ ジ ェ ク トの基 盤 技 術と な る「 プ ラ ッ ト フ ォ
ーム・ シ ス テ ム」 を構築 し、 計 算 化 学、 計算物理学分野の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ム
のコア 計 算 部 分を 抽出し 、そ の「専 用ロジック 」化 を検討 してその性 能 向 上 度な ら び にコ
スト・ パフォーマンスを 評価 す る な ど、 当 該 分 野 専 用のプ ラ ッ ト フ ォ ー ム ・システム 構築
の基盤 となる 研究開発に つ い て十分 な成 果を得 て お り、概 ね評 価で き る。 今後は 、プ ラ ッ
トフォーム・アーキテクチャの よ り 広い分 野へ の適用 の可 能 性に つ い て も検 討し て ほ し い。
②科 学 技 術 計 算 プログラム のプラ ッ ト フ ォ ー ム向 き並 列 分 散 化お よ び組 込みソ フ ト ウ
ェア化 に関す る研 究
まず、 研 究 開 発 対 象と し て、 分子軌道法 および 密 度 汎 関 数 法の 複数の ア プ リ ケ ー シ ョ ン
・プログラム について、 その ア ル ゴ リ ズ ムの高 速 化 、並 列 分 散 化、等 の改 良を施 すととも
に、この レ ベ ルの最 適 化 に お い て、た と え ば分 子 軌 道 法では 従来 の直 接 法(full direct SCF)
に比べ てス ケ ー ラ ビ リ テ ィに 優れ、 性能 でも約 1桁 高 速な 新し い解法 (buffered direct
SCF)の 開発 に成功 した 。
また、 各種プ ロ グ ラ ムの 一部 をプ ラ ッ ト フ ォ ー ム・ シ ス テ ム上 に移植 し、 下記の 高 速 化
を実現 した。
・ 分子軌道法で は「 非 経 験 的 分 子 軌 道 法プ ロ グ ラ ムGAMESS 」において 、オ リ ジ ナ ルの プ
ロ グ ラ ム(PⅢ -750MHz×1台)に比べ て4 倍の高 速 化 を実現( 汎用CPUボ ー ド×1枚)。
また、 「フ ラ グ メ ン ト分 子 軌 道 法プ ロ グ ラ ムAB INIT -MP」 では 、「Gaussian98」 (P
Ⅲ-750MHz×1台) に比 べて10 倍の 高速化 を実 現(汎 用CPU ボ ー ド×1枚) 。
・ 分子力場法プ ロ グ ラ ム「 Xsi」 では 、PⅢ- 750MHz×1台に 比べて 30倍 の高 速 化を 実現
(シャーシ×4筐 体)
・ 密度汎関数法 では 「CP法 プログラム KAPPA 」において 、PⅢ -750MHz×1台と 同等性能
を実現 (汎用 CPUボ ー ド×2枚 )。
また、 下記の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ムを 対象 に、以 下の 通り そ のコ ア計算部分 の
抽出を 行った 。
・ 分子軌道法:す べ て のプ ロ グ ラ ムに 共通し て、二 電 子 積 分 計 算がコ ア計算部分 と な る。
本計算 は分子 の規 模の4 乗に 比例し た計 算 量を 要し、総プ ロ グ ラ ム実行時間 の90% 以
上の時 間を占 める。二電子積分計算の 各 計 算は互 いに 独立し て い て並 列 化が 容易で あ
り、また 個々の 計算 も倍 精 度 浮 動 小 数 点 数 の積和演算 を主体 としており 専用 ロ ジ ッ ク
化が容 易で あ る 。なお 、現 在 主 流の二 電 子 積 分 計 算ア ル ゴ リ ズ ム である 小 原 法をベ ー
スに、 専用ロ ジ ッ ク化に 適し た新し い二 電 子 積 分 計 算ア ル ゴ リ ズ ム( 新「 小原法 」)
を開発 した。
・ 密度汎関数法: 第一原理分子動力学法(CP法)に関 して、all-band法に 基づ い て直 交
化と高 速フーリエ 変換(FFT )に の み コア計 算 部 分を集 約し たプ ロ グ ラ ムKAPPAを新 規
に開発 した。 ベ ン チ マ ー クの 結果、 数百原子ま で はFFTが 最も支 配 的 な計算 であるこ
と、ま た、本 手 法 はス ケ ー ラ ビ リ テ ィに 優れていることが 判明 し た こ と か ら、本 FFT
を専用 ロジ ッ ク化 することにした。 他の ディスクリート・ バ リ エ イ シ ョ ナ ル法( DV
法)、実 空 間 有 限 要 素 法に 関し て は、検 討の結 果、専 用ロジック 化に よ る高 速 化が 望
めないことが 判明 した。
以上の 通り、 本サ ブ テ ー マで は、本 研 究 プ ロ ジ ェ ク トの対 象と す る、 分子軌道法 お よ び
密度汎関数法 の複 数のア プ リ ケ ー シ ョ ン ・プ ロ グ ラ ムについて 、その ア ル ゴ リ ズ ムの 高速
化、並 列 分 散 化、 等の改 良を 施す と と も に、そ の「 専用ロ ジ ッ ク」化 を検 討す る た め のコ
ア計算部分を 抽出 や性 能 向 上 度ならびに コスト ・パ フ ォ ー マ ン スを評 価するなど 、プ ラ ッ
トフォーム応 用の 基盤と な る 研 究 開 発について 十分 な成果 を得 ており 、非 常に高 く評 価で
きる。
(3)第 Ⅱ期に あ た っ て の 考え 方
実 施 体 制は概 ね計 画 通り で よ い と思 われるが、 成果 の波及対象 などを 十分 に吟味 し、適
切なテ ー マ名 を再 検 討し た上 で実施 す べ き で あ る。
(4)評価結果
総合 今後の
進め方
b
b
1.進捗状況
2.目標設定
3.研究成果
4.研究体制
1.達成
2.進 捗 状
1.設
2.最
1.科 学 価
2.波及
3.情報
1.指 導
2.連携
度
況
定
終
値
効果
発信
性
性
b
a
b
b
b
a
c
b
a
第 Ⅱ期 以 降の 考え 方( 体制移行図 )
第Ⅰ期
第Ⅱ期
1.プラットフォームおよび専用ロジック・
アーキテクチャの開発
1.プラットフォームおよび専用ロジック・
アーキテクチャの開発
アーキテクチャの開発
(1)プラットフォーム・
①プラットフォームシステムの研究開発
②プログラム開発環境の構築
アーキテクチャの開発
(1)プラットフォーム・
①分子軌道法シミュレータの開発
(2)科学技術計算用途向け専用ロジック・
アーキテクチャの開発
①LSI設計用マクロセルの開発
②科学技術計算用途向け専用システムLSI
の設計開発
(2)科学技術計算用途向け専用ロジック・
アーキテクチャの開発
①二電子積分計算専用LSIの製造
②科学技術計算用途専用ロジックの設計
2.科学技術計算プログラムのプラット
フォーム向き並列分散化および組み込
みソフトウェア化に関する研究
2.科学技術計算プログラムのプラット
フォーム向き並列分散化および組み込み
ソフトウェア化に関する研究
(1)分子軌道法プログラムに関する研究
①非経験的分子軌道法
②フラグメント分子軌道法
③分子力場法(第Ⅰ期で終了)
(1)分子軌道法プログラムに関する研究
①分子軌道法
(2)密度汎関数法プログラムに関する研究
①CP法
②DV法 (第Ⅰ期で終了)
③実空間有限要素法(第Ⅰ期で終了)
(2)密度汎関数法プログラムに関する研究
①CP法
Fly UP