Comments
Description
Transcript
科学技術計算専用ロジック組込み型 プラットフォーム・アーキテクチャ
(中間評価) 科 学 技 術 計 算 専 用ロジック 組込 み 型 プ ラ ッ ト フ ォ ー ム・ ア ー キ テ ク チ ャに 関す る 研究 (研究期間:第 Ⅰ期 研究代表者:村 上 和彰 平成 12年∼14 年) (九州大学) 研 究 課 題の概 要 超高速 の数値 シ ミ ュ レ ー シ ョ ンが産 業 界 の設 計 開 発 現 場で ツ ー ルと し て低 価 格か つ簡 便 に利用 で き る と い う状況 の実 現を目 指し 、「非 経 験 的 分 子 軌 道 法の よ る巨 大 分 子 電 子 状 態 計算」 「密 度 汎 関 数 法に よ る 物質・ 材 料 設 計 計 算」 を主な 対象 として 、計算物理 ・計 算 化 学等の 各計算科学分野毎 の共 通 性に 立脚 すると 同時 に独 自 性を も反映可能 とした「専用 LSI 組込み 型並列分散処理プ ラ ッ ト フ ォ ー ム (土台 ,共通基盤 )」 のアーキテクチャ を開 発し てプラットフ ォ ー ムにプ ラ グ イ ンす る こ と で、 従来 は汎用 のス ー パ ー コ ン ピ ュ ー タで 実装 していたため 非常 に高価 についた高 速か つ大 規 模な 数値シ ミ ュ レ ー シ ョ ン を飛 躍 的に 優れ たコ ス ト・パ フ ォ ー マ ン スに て実現可能 とする 。 (1) 総 評 設計ア ー キ テ ク チ ャお よ び開 発ア プ リ ケ ー シ ョ ンの 成果の 進捗状況と 計算物理・ 計算化学 等の計 算 科 学 分 野 に対す る波及効果 、ハ ー ドと ソ フ トの各 研 究 現 場の 密接 な連携体制 は高 く評価 できる 。し か し、 「科 学 技 術 計 算 専 用∼ アーキテクチャ に関す る研 究」と い う 包括 的なテ ー マ名 は明 らかに 本研究内容 との 整合性 に欠 ける印 象が ある。 さ ら に、ア ー キ テ ク チャ開 発が完 了し て い な い た め に計 算 機 科 学 分 野の 論 文 発 表が 極端に 少な い点は 非常 に残 念で あ る。以 上の 長所と 短所 の両面 を勘 案して 、総合評価 はb評 価と し た。 <総合評価: b> 技 術 進 展の著 しい 本研究分野 においても 、第Ⅱ 期終了時点 での 本課題 の成 果の優 位 性 と その波及効果 には 十 分 期 待 出 来る。 当該分野に お け る他の 研究開発プ ロ ジ ェ ク ト の動 向に も注視 し な が ら、 第Ⅱ期 に予 定している アーキテクチャ開 発を き ち ん と実 施して 、研 究 価 値を確 立する 必要 がある 。し か し一 方で 、現在 の包 括 的な テ ー マ名は 研究内容を 必ず し も 的確に 表 現 出 来て い な い た め 、適切 なテ ー マ名 の検 討を行 う べ き で あ る。 また、 成果 の優 位性を 示し、 そ れ を対 外 的に ア ピ ー ルす る た め に も 、特に アーキテクチャ 成果に 関す る情 報発信 をより 積 極 的に行 うことも必 要で あ る。 <今 後の進 め方 :b> (2)各 テーマ における評 価 結 果 ①プ ラ ッ ト フ ォ ー ムお よ び 専用ロ ジ ッ クのア ー キ テ ク チ ャ開 発 まず プラットフォーム としては 、汎 用マ イ ク ロ プ ロ セ ッ サS H-4(クロック 周 波 数200MHz) 4台と 組込み 用 途 向けリ ア ル タ イ ム OS μITRONを 汎用CPUボ ー ド上 に搭載 し 、ボ ー ド7 枚と PC/AT互 換CompactPCIボ ー ド( Pentium Ⅲ 搭載 )1枚 をPCI バス 接続に て装 備した シャーシ を、Ethernet で4 筐 体 接 続し たプ ラ ッ ト フ ォ ー ム・ シ ス テ ムを 開発し 、そ の稼動 に成 功し た。 また、 下記の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ムを 対象 に、専 用ロジック 化を 検討し 、専 用 ロ ジ ッ クの開 発 方 針を以 下の 通り決 定し た。 ・ 分子軌道法で は 、「非 経 験 的 分 子 軌 道 法プ ロ グ ラ ムGAMESS」「フ ラ グ メ ン ト 分 子 軌 道 法プログラム AB INIT-MP 」について 検討 を行い 、コ ア計算部分 の「二 電 子 積 分 計 算」 が専用 ロ ジ ッ ク化 に向い た設 計であ る た め、第 Ⅱ期 に お い て専 用LSI 化を実 施す る予 定。 ・ 密度汎関数法 では 、「CP 法プ ロ グ ラ ムKAPPA」 に つ い て検 討を行 い。 コア計 算 部 分で ・ ある「FFT」 は専用 ロジック化 に向 いた設 計で あ る た め、 第Ⅱ期 においてFPGAに て実 装を行 う予定 。ま た、「D V法プ ロ グ ラ ムDVX-α 」に つ い て は、コ ア計算部分 が「行 列 要 素 算 出」で あ る た め、 高 速 化の効 果が 小と判 断し 、専用 ロジック化 は実 施し な い。 ・ 有限要素法で は、「 実 空 間 有 限 要 素 法プ ロ グ ラ ムFEMTECK」に つ い て検討 を行 ったが 、 専用ロジック 化す べ きコ ア計算部分 の特定自体 が困 難な た め、専 用ロジック 化は実 施 しない 。 さらに 、上記 の検討結果 に従 って、 二電子積分計算 を対象 に、マ イ ク ロ ア ー キ テ ク チ ャ は非 均 質CMP( チ ッ プ・マ ル チ プ ロ セ ッ サ)に て、「 初 期 積 分 計 算エンジン×1」「漸 化 計 算エンジン×4」 を実装 した スーパースカラ・ プロセッサ とし 、クロック 周波数 は200MHz を最 低 達 成 目 標、 「積和演算×(1 +4 )」「 除算 /開平逆数×1 」「指 数 関 数/誤 差 関 数×1」が同 時 実 行 可 能 で あ る倍 精 度 浮 動 小 数 点 演 算 器を 実装 し、ピ ー ク 性能10 演算 /ク ロッ ク サ イ ク ルの 倍 精 度 浮 動 小 数 点 演 算 性 能を 持つ 、二 電 子 積 分 計 算 専 用LSIの 設 計 開 発 を行っ た。実 際の 製作は 第Ⅱ 期で実 施す る。 なお、 上記の 二 電 子 積 分 計 算 以 外の コア 計算に 関し て、そ の専 用ロジック 化に関 する ラ ピッド ・プ ロ ト タ イ ピ ン グを 可能と す る た め に 、CompactPCI規格準拠 の基 板 上に 、汎 用マ イクロプロセッサS H-4( 200MHz)1 つと300万 ゲート 相当FPGA4 つを 実装し 、FPGA当た り 512MB( 来 年 度、1GBに拡 張 予 定)の メ モ リを搭 載し た、FPGA搭 載ボ ー ドを 試作し 、設 計シ ステム の検証 を行 った。 以上の 通り、 本サ ブ テ ー マで は、本 研 究 プ ロ ジ ェ ク トの基 盤 技 術と な る「 プ ラ ッ ト フ ォ ーム・ シ ス テ ム」 を構築 し、 計 算 化 学、 計算物理学分野の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ム のコア 計 算 部 分を 抽出し 、そ の「専 用ロジック 」化 を検討 してその性 能 向 上 度な ら び にコ スト・ パフォーマンスを 評価 す る な ど、 当 該 分 野 専 用のプ ラ ッ ト フ ォ ー ム ・システム 構築 の基盤 となる 研究開発に つ い て十分 な成 果を得 て お り、概 ね評 価で き る。 今後は 、プ ラ ッ トフォーム・アーキテクチャの よ り 広い分 野へ の適用 の可 能 性に つ い て も検 討し て ほ し い。 ②科 学 技 術 計 算 プログラム のプラ ッ ト フ ォ ー ム向 き並 列 分 散 化お よ び組 込みソ フ ト ウ ェア化 に関す る研 究 まず、 研 究 開 発 対 象と し て、 分子軌道法 および 密 度 汎 関 数 法の 複数の ア プ リ ケ ー シ ョ ン ・プログラム について、 その ア ル ゴ リ ズ ムの高 速 化 、並 列 分 散 化、等 の改 良を施 すととも に、この レ ベ ルの最 適 化 に お い て、た と え ば分 子 軌 道 法では 従来 の直 接 法(full direct SCF) に比べ てス ケ ー ラ ビ リ テ ィに 優れ、 性能 でも約 1桁 高 速な 新し い解法 (buffered direct SCF)の 開発 に成功 した 。 また、 各種プ ロ グ ラ ムの 一部 をプ ラ ッ ト フ ォ ー ム・ シ ス テ ム上 に移植 し、 下記の 高 速 化 を実現 した。 ・ 分子軌道法で は「 非 経 験 的 分 子 軌 道 法プ ロ グ ラ ムGAMESS 」において 、オ リ ジ ナ ルの プ ロ グ ラ ム(PⅢ -750MHz×1台)に比べ て4 倍の高 速 化 を実現( 汎用CPUボ ー ド×1枚)。 また、 「フ ラ グ メ ン ト分 子 軌 道 法プ ロ グ ラ ムAB INIT -MP」 では 、「Gaussian98」 (P Ⅲ-750MHz×1台) に比 べて10 倍の 高速化 を実 現(汎 用CPU ボ ー ド×1枚) 。 ・ 分子力場法プ ロ グ ラ ム「 Xsi」 では 、PⅢ- 750MHz×1台に 比べて 30倍 の高 速 化を 実現 (シャーシ×4筐 体) ・ 密度汎関数法 では 「CP法 プログラム KAPPA 」において 、PⅢ -750MHz×1台と 同等性能 を実現 (汎用 CPUボ ー ド×2枚 )。 また、 下記の ア プ リ ケ ー シ ョ ン・プ ロ グ ラ ムを 対象 に、以 下の 通り そ のコ ア計算部分 の 抽出を 行った 。 ・ 分子軌道法:す べ て のプ ロ グ ラ ムに 共通し て、二 電 子 積 分 計 算がコ ア計算部分 と な る。 本計算 は分子 の規 模の4 乗に 比例し た計 算 量を 要し、総プ ロ グ ラ ム実行時間 の90% 以 上の時 間を占 める。二電子積分計算の 各 計 算は互 いに 独立し て い て並 列 化が 容易で あ り、また 個々の 計算 も倍 精 度 浮 動 小 数 点 数 の積和演算 を主体 としており 専用 ロ ジ ッ ク 化が容 易で あ る 。なお 、現 在 主 流の二 電 子 積 分 計 算ア ル ゴ リ ズ ム である 小 原 法をベ ー スに、 専用ロ ジ ッ ク化に 適し た新し い二 電 子 積 分 計 算ア ル ゴ リ ズ ム( 新「 小原法 」) を開発 した。 ・ 密度汎関数法: 第一原理分子動力学法(CP法)に関 して、all-band法に 基づ い て直 交 化と高 速フーリエ 変換(FFT )に の み コア計 算 部 分を集 約し たプ ロ グ ラ ムKAPPAを新 規 に開発 した。 ベ ン チ マ ー クの 結果、 数百原子ま で はFFTが 最も支 配 的 な計算 であるこ と、ま た、本 手 法 はス ケ ー ラ ビ リ テ ィに 優れていることが 判明 し た こ と か ら、本 FFT を専用 ロジ ッ ク化 することにした。 他の ディスクリート・ バ リ エ イ シ ョ ナ ル法( DV 法)、実 空 間 有 限 要 素 法に 関し て は、検 討の結 果、専 用ロジック 化に よ る高 速 化が 望 めないことが 判明 した。 以上の 通り、 本サ ブ テ ー マで は、本 研 究 プ ロ ジ ェ ク トの対 象と す る、 分子軌道法 お よ び 密度汎関数法 の複 数のア プ リ ケ ー シ ョ ン ・プ ロ グ ラ ムについて 、その ア ル ゴ リ ズ ムの 高速 化、並 列 分 散 化、 等の改 良を 施す と と も に、そ の「 専用ロ ジ ッ ク」化 を検 討す る た め のコ ア計算部分を 抽出 や性 能 向 上 度ならびに コスト ・パ フ ォ ー マ ン スを評 価するなど 、プ ラ ッ トフォーム応 用の 基盤と な る 研 究 開 発について 十分 な成果 を得 ており 、非 常に高 く評 価で きる。 (3)第 Ⅱ期に あ た っ て の 考え 方 実 施 体 制は概 ね計 画 通り で よ い と思 われるが、 成果 の波及対象 などを 十分 に吟味 し、適 切なテ ー マ名 を再 検 討し た上 で実施 す べ き で あ る。 (4)評価結果 総合 今後の 進め方 b b 1.進捗状況 2.目標設定 3.研究成果 4.研究体制 1.達成 2.進 捗 状 1.設 2.最 1.科 学 価 2.波及 3.情報 1.指 導 2.連携 度 況 定 終 値 効果 発信 性 性 b a b b b a c b a 第 Ⅱ期 以 降の 考え 方( 体制移行図 ) 第Ⅰ期 第Ⅱ期 1.プラットフォームおよび専用ロジック・ アーキテクチャの開発 1.プラットフォームおよび専用ロジック・ アーキテクチャの開発 アーキテクチャの開発 (1)プラットフォーム・ ①プラットフォームシステムの研究開発 ②プログラム開発環境の構築 アーキテクチャの開発 (1)プラットフォーム・ ①分子軌道法シミュレータの開発 (2)科学技術計算用途向け専用ロジック・ アーキテクチャの開発 ①LSI設計用マクロセルの開発 ②科学技術計算用途向け専用システムLSI の設計開発 (2)科学技術計算用途向け専用ロジック・ アーキテクチャの開発 ①二電子積分計算専用LSIの製造 ②科学技術計算用途専用ロジックの設計 2.科学技術計算プログラムのプラット フォーム向き並列分散化および組み込 みソフトウェア化に関する研究 2.科学技術計算プログラムのプラット フォーム向き並列分散化および組み込み ソフトウェア化に関する研究 (1)分子軌道法プログラムに関する研究 ①非経験的分子軌道法 ②フラグメント分子軌道法 ③分子力場法(第Ⅰ期で終了) (1)分子軌道法プログラムに関する研究 ①分子軌道法 (2)密度汎関数法プログラムに関する研究 ①CP法 ②DV法 (第Ⅰ期で終了) ③実空間有限要素法(第Ⅰ期で終了) (2)密度汎関数法プログラムに関する研究 ①CP法