Comments
Description
Transcript
バイオグリッドの国際連携
ISGC 2003 12/19/2003 ◆ biogrid project Construction of a Super computer Network バイオグリッドの国際連携 文部科学省 「アジアグリッドイニシアティブ」 下條真司 大阪大学サイバーメディアセンター 伊達 進 大阪大学大学院情報科学研究科 ◆スーパーコンピュータネットワークの構築 (BioGrid Project) biogrid project Construction of a Super computer Network • 文部科学省 ITプログラム「e-scienceプロジェクト」の一つ • 生命科学(医学・生物学など)分野におけるIT応用研究を推進するため、大阪大学サイバーメディアセン ターを核として、高度な計算資源とネットワークを利用する基盤環境とソフトウェアをグリッド上に構築する。 • 生命科学とIT分野を結ぶ架け橋となる人材を育成する。 • 国立研究期間、民間企業、国際機関との連携を通じて、スピードの速い開発を行う。 • これらの基盤環境とソフトウェアにより関西における関連機関の連携を強化し、in silico創薬の可能性を開 くとともに我が国の国際競争力の強化をねらう。 • コンピューティンググリッドとデータグリッドの融合を生命科学分野に特化して行う 高輝度光科学 研究センター 産業技術総合 研究所 大阪大学超高圧 電子顕微鏡センター 大阪大学サイバー メディアセンター 大阪大学 蛋白質研究所 彩都ライフ サイエンス パークセンター 医薬基盤技術 研究施設 国立遺伝学 研究所 大阪大学大学院 情報科学研究科 San Diego Supercomputer Center (USA) 神戸医療 産業都市 国家高速電脳 中心 (台湾) www.biogrid.jp 大阪大学大学院 理学研究科 大阪大学大学院 情報科学研究科 奈良先端科学 技術大学院大学 生物分子 工学研究所 大阪大学遺伝 情報実験センター Nanyang Technological UniversityPharmaceutical (Singapore) Industry 製薬企業 神戸大学理学部 ◆ 研究開発体制 biogrid project Construction of a Super computer Network プロジェクトリーダー 下條真司 (大阪大学) 外部助言委員会 運営委員会 プロジェクト管理 グリッド基盤グループ 千里国際情報事業財団 リーダー : 伊達 進 (大阪大学) 大阪大学、 NECシステムテクノロジー、三井情報開発、千里国際情報事業財団 データグリッドグループ リーダー : 松田 秀雄 (大阪大学) 大阪大学、京都大学、日立ソフトウェアエンジニアリング、蛋白質研究奨励会、日本ヒューレット・パッカード、 富士通九州システムエンジニアリング、三菱スペースソフトウェア、アズテックシステム コンピューティンググリッドグループ リーダー : 中村 春木 (大阪大学) 大阪大学、NEC基礎研究所、日立製作所、生物分子工学研究所 HTCグループ リーダー : 藤川 和利 (奈良先端科学技術大学院大学) 大阪大学、神戸大学、奈良先端科学技術大学院大学、日本原子力研究所 Telescieneグループ 大阪大学大学院 医学系研究科 日本原子力 研究所 京都大学 化学研究所 蛋白質研究 奨励会 IT企業 ◆ 世界の関連プロジェクト BioGrid network www.biogrid.jp biogrid project Construction of a Super computer Network • ITBL • BIRN (BioMedical Information Research Network) • NC Biogrid • BII@SINGAPORE • 東京ゲノムベイ/OBIGRID • 大阪大学COE「ネットワーク共生環境」 • UK E-Science Project • GGF/Semantic Grid RG リーダー : 八木 直人 (高輝度光科学研究センター) 大阪大学、高輝度光科学研究センター、産業技術総合研究所 ◆ 国内外での連携 • 産総研ライフエレクトロニクスラボ – MEGプロジェクト • PRAGMA (Pacific Rim Application and Grid Middleware Assembly ) • BIRN • BII http://www.pragma-grid.net • CAS (中国科学技術院) • GGF/Life Science WG biogrid project Construction of a Super computer Network Founding Motivations • Science is an intrinsically global activity IVOA • The grid is transforming computing and collaboration • The problem remains that the grid is too hard to use • Middleware software needs to interoperate Peter Arzberger, [email protected] Philip Papadopoulos, [email protected] Shinji Shiojo, biogrid project, Japan 1 ISGC 2003 12/19/2003 Peter Arzberger, [email protected] Philip Papadopoulos, [email protected] ◆ PRAGMA PARTNERS biogrid project Construction of a Super computer Network Tele-science on Tomography Pacific Rim SDSC Osaka U. Application Grid NCHC Middleware Assembly NCHC will host 5th PRAGMA in Oct. 2003 iGrid 02, joint demo, Sep. 2002 SC 02, HPC Challenge, Nov. 2002 8 Affiliate Member ◆ Goal biogrid project Construction of a Super computer Network • Improve throughput of observation facility providing the following functions by the introduction of Grid: ◆ Telecontrol System for UHVEM Control Signals over TCP/IP – Data analysis function – Knowledge sharing function – Telecontrol function Shutter control for film camera Sun Ultra Solaris WS Server software with GUI Using OS dependent GUI library Developed by Hitachi High Technologies Over International Collaboration biogrid project Construction of a Super computer Network Global Global Network Network Windows PC Control Client with knob box Visual Basic Developed by Hitachi High Technologies Windows PC CCD Control software EMMENU3 Developed by Tietz No control path between client and CCD PC Akiyama ◆ Data analysis function biogrid project Construction of a Super computer Network ◆ Progresses biogrid project Construction of a Super computer Network • Image data analysis on UHVEM and High resolution CT (SPring-8) – Real-time analysis of large scale data obtained from special devices • Dataflow optimiaztion – Adaptive visualization system for handling various environments • GT3 enabled new architecture of telescience portal (NCMIR, SDSC) • Telecontrol and analysis system for UHVEM (Cybermedia Center, NCHC) • Pipelined image processing method (Cybermedia Center) • New HDTV codec using JPEG2000 (KDDI R&D Laboratory) Akiyama Provided by Dr. Naoko Yamada (NCMIR) Shinji Shiojo, biogrid project, Japan 2 ISGC 2003 ◆ Demonstration 12/19/2003 biogrid project Construction of a Super computer Network ◆ HDTV codec using JPEG2000 • Telecontrol and image processing system prototype biogrid project Construction of a Super computer Network • Previous codec was using MPEG2 • JPEG2000 enables us to … – HDTV transfer system (demonstrated at NPACI booth) – Image analysis web portal (demonstrated at BioGrid booth) – Show clear image – Control bandwidth to be required ◆ SC2003 biogrid project Construction of a Super computer Network ◆ Collaborations biogrid project Construction of a Super computer Network MoU among NCMIR (UCSD), CMC, UHVEM, (Osaka Univ), KDDI, KBSI ◆ Our Goals biogrid project Construction of a Super computer Network • Develop telescience portal environment among Japan, Korea, US and other. • International collaboration for Agriculture & Ecogrid – Taiwan, US, Japan, Thailand, Australia, China and other • Integration of Data and Computation on Grid – GGF10 RG may be proposed for instruments on the Grid – from synchrotrons to sensors Shinji Shiojo, biogrid project, Japan ◆ biogrid project Construction of a Super computer Network 中国との農業を通じたグリッド連携 -黄土高原生態文化回復へむけて 大阪大学大学院情報科学研究科 バイオ情報工学専攻 ゲノム情報工学講座 助手 伊達 進 3 ISGC 2003 12/19/2003 ◆ 講演内容 biogrid project Construction of a Super computer Network • バイオグリッド成果(の復習): 中国科学院とのテストベッド – GUIDE (Grid User Interface to the Distributed Environment) – GSI-SFS ( A Secure Filesystem on the Grid) • 今後の方針:黄土高原生態文化回復プロジェクト – プロジェクト概要とその意義 – 導入される技術の紹介 ◆ Collaboration with CAS biogrid project Construction of a Super computer Network • China is a megadiversity country that is said to have 70%+ species. • CAS is moving towards the construction and integration of databases of specimens and names (SDB, Scientific database project, Kai Nan, CAS) Osaka University and CAS team (currently, Juncai Ma’s team) started building a proto-type BioGrid using Osaka’s Grid technologies and CAS’s database technologies and data resource of importance. ◆ GUIDE概要 biogrid project Construction of a Super computer Network • 創薬研究過程において、比 較的利用頻度が高く、共通 性の高いソフトウェア、ツー ルのグリッド化 – JSP (JavaServer Pages) – 動的ウェブページ生成 – Tomcat – Servlet エンジン – Apache – Web サーバ • “Gridified” toolへのポータ ルの提供 • Grid technologies – Java CoG Kit – Javaインタフェースの提供 – Globus Toolkit ver2.0 – Grid機能の提供 – MyProxy – online credential repository – ユーザフレンドリなGUIにより 複雑なグリッドのメカニズムを 隠蔽 ◆ Technical view of GUIDE (2) biogrid project Construction of a Super computer Network WEB Page Servletエンジン Web server biogrid project Construction of a Super computer Network Username Password Servlet Tomcat apache ◆ GUIDE in Action(1) Certificate Servlet Client biogrid project Construction of a Super computer Network • Web technologies – BLAST (相同性検索) – ClustalW (多重整列と系統樹 作成) JSP ◆ Technical view of GUIDE (1) Grid User Interface to the Distributed Environment MyProxy blast選択 ユーザの証明書 が保持されている CoG 0.9.13 Globus Toolkit 2.0 JavaとGridの架け橋 Grid機能の提供 Grid Network Blast ClustalW Shinji Shiojo, biogrid project, Japan Servlet Servlet 入力 サーブレット Client JSP Tomcat apache MyProxy credential CoG 0.9.13 Globus Toolkit 2.0 Grid機能利用 Grid機能利用 single signsign-on Grid Network Blast ClustalW 4 ISGC 2003 12/19/2003 ◆ GUIDE in Action(2) biogrid project Construction of a Super computer Network ◆ 背景 biogrid project Construction of a Super computer Network グリッド環境 大学1 研究所1 ユーザの要求: 製薬会社1 製薬会社3 製薬会社2 1) データ共有環境はほしい 2)他の製薬会社にアクセスしているデータ ベースについて知られたくない。 3) ネットワークのデータをデータ機密性を 保持するため暗号化したい。 4) 利便性は確保しておきたい ◆ 要求される機能 biogrid project Construction of a Super computer Network • SDI (Single Disk Image): ユーザはNFSのように ファイル空間を一元的に扱いたい • Single Sign-on: ファイルにアクセスする際に必要 となる認証の回数を最小限にしたい • On-demand Remote Filesystem Access: アクセス の必要性に応じてファイルにアクセスしたい • データ機密性を確保: アクセスしているデータに関 して、他人に知られたくない • ユーザ利便性:データセキュリティのために不便 になるのは避けたい ◆ SFS (Self-Certifying Filesystem) Server A biogrid project Construction of a Super computer Network Server B Server C ファイルシステム SFS Server 通信路は暗号化 ユーザはon-demand され、データの機密性は /sfs にファイルシステムを SFS Client 保たれる マウントできる Server A/ NFS Client filesystem Client A ◆ SFS (Self-Certifying Filesystem) NFS Server biogrid project Construction of a Super computer Network Client B ◆ GSI-SFS biogrid project Construction of a Super computer Network • GSI (Grid Security Infrastructure)とSFS (SelfCertifying Filesystem)の機能を統合したセキュアファ イルシステム Server A NFS Server Server B Server C Server C ファイルシステム Server B Server A SFS Server SFSサーバとユーザ間ごとに鍵情報を 共有しなければならないため、ユーザ SFS Client 利便性が高くない。グリッド環境での 応用は不向き。 NFS Client Client A Shinji Shiojo, biogrid project, Japan sfsserver filesystem gsisfsd gsisfsd GSI sfsserver filesystem /sfs proxy grid-proxy-init Server C/ Server A/ gsisfsagent ひらけグリッド! Client B filesystemsfsclient filesystem 5 ISGC 2003 12/19/2003 ◆ GSI-SFSの特徴 biogrid project Construction of a Super computer Network ◆ biogrid project Construction of a Super computer Network GUIDE • • • • • SDI (Single Disk Image) Single Sign-on On-demand Remote Filesystem Access データ機密性を確保 ユーザ利便性 Researchers Researchers Institute of Microbiology, CAS Osaka University ClustalW blast ClustalW グリッド環境 グリッドに一度ログインすれば、オンデマンド にユーザレベルでSDIを有するセキュア データグリッド環境を実現できる。 グリッド環境上で機密データ の共有を実現! blast Osaka: 大規模な PDB 計算リソースと解析ソフト Globus (Grid middle ware) GRAM 製薬会社1 製薬会社3 製薬会社2 ◆ 中国科学院ー阪大リサーチテストベッド動作 biogrid project Construction of a Super computer Network Biological Resource database GSI-SFS CAS: 貴重なデータ資源 GSI GASS MDS IPv6 (Future Works) ◆ A testbed on bioinformatics on sc2003 biogrid project Construction of a Super computer Network • Connected data and computational resources Username password Researchers /gsisfs Researchers /gsisfs GUIDE In Action Osaka University cas.host Institute of Microbiology, CAS tokyo.host ClustalW blast ClustalW blast Auto mount GSI-SFS PDB Biological Resource database 32+ processors Globus (Grid middle ware) Bio-scientists Chinese Academy of Science, China File-based bio-DB including much information of Chinese endemic species /gsisfs/cas.host/data プロセス – Chinese valuable biological database – Large computational resources provided by our cluster and PRAGMA collaborators GUIDE Grid Portal GSI- SFS sec ure WWW co nt ro l acce ss 156+ processors Applications Applications GRAM GSI GASS MDS Bioinformatics Institute, Singapore IPv6 (Future Works) ◆ Research Testbed のまとめ biogrid project Construction of a Super computer Network Parallelized BLAST, ClustalW, user applications, etc Osaka University, Japan ◆ 黄土高原の砂漠化 biogrid project Construction of a Super computer Network • 中国CAS, シンガポールBIIのデータ資源と計算資 源を統合 • GSI-SFS + GUIDEにより、データ、計算資源の位置 に依存しないBLAST, ClustalWが実現 • データセキュリテイとユーザ利便性を考慮したデータ アクセスモデルの提供 – 排他性 – 通信路暗号化 – Single sign-on 都会の発展 高原の民は貧しい。 砂漠化の影響 じゃあ今後の方針は?この環境が なににいかされるのか? Shinji Shiojo, biogrid project, Japan 6 ISGC 2003 12/19/2003 ◆ PJ概要:生態循環文化・経済の確立による地域活性化・緑化 biogrid project Construction of a Super computer Network ヒューマンネットワークに よる植林の促進 境 よる環 緑化に ◆ 導入される技術 biogrid project Construction of a Super computer Network ・北海道自然学研究所・青木電器・DGC総研の環境 浄化技術(北海道小清水方式) 改善 ・未来農業集団(北海道芽室町)のIT農業 ・中央農研・三重大学生物資源学部の遠隔監視技術 糞 尿 肥料 無臭化・肥料生産 文 化 振 興 先端技術による運 営・記録 ・中国科学院微生物研究所・北海道農研の土壌・生 物資源管理技術 ・大阪大学サイバーメディアセンターの次世代イン ターネット技術 生産履歴付の有機 野菜の供給 This slide was derived from the presentation materials Of Dr. Hatano, CAS, Beijing,China. This slide was derived from the presentation materials Of Dr. Hatano, CAS, Beijing,China. ◆ 中央農研・三重大学生物資源学部の遠隔監視技術 biogrid project Construction of a Super computer Network ◆ 中国科学院微生物研究所・北海道農研の土壌管理技術 biogrid project Construction of a Super computer Network ・温度、湿度、現場映像をモニ タリン グするフィ ールドサー バー モニタ画面(Web)→ 病害が発生する 微生物のDNAから計算 インターネット接続型気象ロボット 全世界同時収集&配信 ◆ 中国科学院微生物研究所の生物資源管理技術 biogrid project Construction of a Super computer Network 病害が発生しない ◆ 大阪大学サイバーメディアセンターの次世代インターネット技 術 6Grid biogrid project Construction of a Super computer Network [背景] – 世界のグリッドプロジェクトにおいて、グリッド技術のIPv6化を本格的視野 にいれたプロジェクトは非常に少ない。 • IBM and 6net in UCL Grid, e-science – わが国の、裏づけされた高度かつ先進的なIPv6技術 • WIDE Project, http://www.wide.ad.jp/index.html – 数多くの6Gridへ期待する研究パートナー • SDSC, Telescience Group • CAS (China Academy of Sciences) • KISTI(Korea Institute of Science and Technology Information) [これまでの関連成果] – [~H14年度] IPv6 Globus grid toolkit1.1.3, 2.2.3 Release e-Megadiversity Resources in China Shinji Shiojo, biogrid project, Japan • バイオ研究における必須条件であるセキュリテイ対策として、IPv6/IPSecによ るセキュリテイを考慮 7 ISGC 2003 12/19/2003 ◆ 大阪大学サイバーメディアセンターの次世代インターネット技 術 6Grid biogrid project Construction of a Super computer Network • GridFTP: サードパーティ転送、並列転送といったグリッドコン ピューティング用に拡張されたファイル転送プロトコル • Alpha Version, Release AM11:00, Nov. 14, 2003 (JST) • Single Transfer : 単一ファイルを単一ストリームで転送 (実装済み) • Parallel Transfer : 単一ファイルを並列ストリームで転送 (実装済み) passive MPICH-G2 IPv6-based Globus ファイル • Striped Transfer : 複数計算機間で並列的にデータを転送 (実装中) ファイル passive Connector Active Connector Listener IP v6 7node - cluster ov er Construction of a Super computer Network Korea Institute Science and Technology Information khryu Contact: Mr. Dongkyun Kim IP v4 IPv6 network MPICH-G2 IPv6-based Globus MPICH-G2 IPv6-based Globus Senri Biogrid R&D Center Osaka University MPICH-G2 IPv6-based Globus ファイル Listener Connector Connector biogrid project MPICH-G2 IPv6-based Globus IPv6 over IPv4 Connector Connector Connector Active NEC System Technology Contact: Mr. Shogo Fujii Active 3 data pathway Listener ◆ 6Grid Project over Korea-Japan 2 data pathway depllot1 takara exp-grid5 Contact: Mr. Ichiro Hasegawa ◆ 6Grid Project Demonstration: Performance measurement using Network over Korea and Japan NEC System Technology IP v6 7node - cluster Contact: Mr. Shogo Fujii ov er IPv6 over IPv4 MPICH-G2 IPv6-based Globus MPICH-G2 IPv6-based Globus biogrid project Construction of a Super computer Network Korea Institute Science and Technology Information khryu IP v4 Contact: Mr. Dongkyun Kim IPv6 network MPICH-G2 IPv6-based Globus MPICH-G2 IPv6-based Globus Senri Biogrid R&D Center Osaka University exp-grid6 Contact: Mr. Hongyu Shi ◆ 大阪大学サイバーメディアセンターの次世代インターネット技 術 GUIDE biogrid project Construction of a Super computer Network Grid User Interface to the Distributed Environment • 創薬研究過程において、比 較的利用頻度が高く、共通 性の高いソフトウェア、ツー ルのグリッド化 – BLAST (相同性検索) – ClustalW (多重整列と系統樹 作成) • “Gridified” toolへのポータ ルの提供 – ユーザフレンドリなGUIにより 複雑なグリッドのメカニズムを 隠蔽 MPICH-G2 IPv6-based Globus takara depllot1 Contact: Mr. Ichiro Hasegawa exp-grid5 exp-grid6 Contact: Mr. Hongyu Shi ◆ 大阪大学サイバーメディアセンターの次世代インターネット技術による 黄土高原総合情報化 biogrid project Construction of a Super computer Network biogrid project ◆ CRECモデル−伝統文化と生活・生産を技術で再び結びつける Construction of a Super computer Network う 先端技術 文化 生活・生産 さまざまな研究機関、大学などで開発された要素技術を、 大阪大学サイバーメディアセンターのグリッド技術によって 総合情報化していくことにより、農業、文化への技術のフィード バックをおこなっていく Shinji Shiojo, biogrid project, Japan 8 ISGC 2003 ◆ 現状 12/19/2003 biogrid project Construction of a Super computer Network • APAN Honoluluデモンストレーションにむけ奮闘中。 – 黄土高原−(tun6to4 in openvpn)→IMCAS−(tun6to4 in openvpn) →KDD <導通確認> – バイオグリッド6Grid solutionのdeployと、阪大へのIPv6接 続 <現在も作業中> ◆ まとめ biogrid project Construction of a Super computer Network 大阪大学サイバーメディアセンターでは、台湾、韓国、 中国の研究機関と密な連携をとり、大阪大学サイバー メディアセンターのグリッド技術を利用した共同研究 開発を行い、今後の成果への胎動が感じられる。 [アジアグリッドイニシアティブの目的] 本課題ではアジア地域におけるグリッドの先導的研究者 を集め、アジア地域におけるネットワークおよびグリッド 技術の協調的研究開発を促進する ◆ 謝辞 biogrid project Construction of a Super computer Network • 本スライドの一部は、中国科学院微生物研究所信息 网絡中心 馬俊才氏よりご提供いただいたものを利用 させて頂きました。利用させていただきました資料作 成にかかわっております皆様方に感謝いたします。 Shinji Shiojo, biogrid project, Japan 9