Comments
Description
Transcript
発表資料
2013年1月24日 平成24年度 データベース講習会 日時: 1月24日 場所: 産業技術総合研究所 臨海副都心セ ンター バイオIT融合研究棟8階 CBRCセミ ナー室 「食品科学へのメタボロームデータの応用」 かずさDNA研究所 産業基盤開発研究部 柴田 大輔 幅広い食品関連分野 品種 育種学 生育環境 園芸学・植物生理学 調理・加工 流通・貯蔵 食品学・調理学 園芸学・食品学 食品科学の難問 キーとなる成分が多様かつ複雑で把握が困難 原料 ヒトの体内 食品 植物素材 を例にとる と、約20万 種類存在 (単一の植物 体中でも 数千種以上) 貯蔵 加工 発酵 物理的・ 化学的・ 生化学的 変化 20万 x ? 超複合系 (一つの 食品中 でも数千 から数万) 摂取 吸収 消化管や 吸収後の 組織での 代謝変動 (成分の さらなる 変化) 各段階における化合物(代謝物)の多様性 網羅的成分解析手法への期待 (メタボローム解析手法) ヒト中の生体 成分が食品 成分の影響を 受け変動 セミナーの内容 メタボローム解析とは? メタボローム解析の方法 メタボローム解析の課題 食品化学への応用 PowerGetの実演 (櫻井望) メタボローム 解析とは? オミクスとシステム生物学 生物学的要素の網羅的計測 データベース 分析化学の手法 バイオインフォマティクス 生物学的ルールの発見(←実験による実証) KDRI メタボローム 解析とは? 生物学的要素の計測 値 オーム 要素 計測装置 ゲノム 遺伝子 シークエンサー 塩基配列 遺伝子注釈 トランスクリ プトーム RNA 転写量 プロテオーム タンパク質 DNAアレイ 次世代シーク エンサー 質量分析装置 SDS-PAGE メタボローム 代謝物 質量分析装置 NMR 蛋白量 酵素活性 アミノ酸配列 定量値 組成式 構造式 要素の値は、アノテーション(注釈)であることに注意!! メタボローム 解析とは? 分子遺伝学 分子生物学 分子生物学 ゲノミクス 生物学における“曖昧性”の許容 曖昧性を嫌う 遺伝学 遺伝学 生化学 生化学 生理学 生理学 要素還元論 曖昧性の許容が不 可避 トランスク リプトミクス フェノミクス プロテ オミクス メタボ ロミクス 膨大な情報量 システム論 メタボローム 解析とは? 多変量解析に含まれる曖昧性 母集団 欲しい成分 関係ない成分 曖昧 性を含 む 欲しい成分 を逃すことも ある 多変量解析 による抽出 擬陽性を含む フィルタリング (マニュアル補正) それでも完璧というわ けではない あとは、個別に精密な成分分析を行う(従来の研究スタイル) メタボローム 解析とは? メタボロームデータの多変量解析 CSVファイル クロマトグラム 数値データの取出し scan time サンプル m/z ピ ー ク 多変量解析 主成分分析 大規模解析用 テーブル 通常、ピーク数は 500から数千 メタボローム 解析とは? 多変量解析:主成分分析 Principal Component Analysis (PCA) 多変量から構成されるサンプル間の相違を表現する手段 X2 b1 xi x1 X1 xn Xm x2 第一主成分、第二主成分、第三主成分、、第n主成分 寄与率、累積寄与率80%ぐらいまでで十分 メタボローム 解析とは? 主成分分析の実例 GC-TOF-MSで解析されたシロイヌナズナ代謝産物のPCA解析 T87 14days T87 10days T87 7days T87 3days Leaves オミクスデータベースの位置付け トランスクリプトーム 実験データ のDB 遺伝子発現データ GEO (315M) ArrayExpress (240M) プロテオーム メタボローム タンパク質発現データ HumanProteinpedia (3K) Expasy, HRPD 代謝産物データ METLIN (<1K)など 代謝産物データ METLIN (<1K)など MassBase(80K) Komics(8K) 遺伝子共発現 ATTED-II, BAR データマイ ニングDB 情報統合 HUPO, HRPD, Expasy 基本情報 統合DB 基本情報DB タンパク質相互作用 HRPD, MINT, BIND (ヒト) 遺伝子情報 GenBank DDBJ GO タンパク質情報 EC (IUBMB) BRENDA 代謝経路 KEGG PATHWAY MetaCyc 代謝産物情報 KEGG LIGAND DNP, CAS PubChem, KNApSAcK 代謝分析プラットフォーム 分析機器 付属解析ソフト テキスト出力 01101 10110 01010 tool GC-MS ChromaTOF CE-MS ChemStation 01101 10110 01010 tool MassLynx 01101 10110 01010 tool UPLC-QTOF-MS LC-FT-MS 全データ利用 データ解析ソフト開発 (インフォマティクス) PeakIdentifier FragmentAlign Xcalibur 01101 10110 01010 MSGet FAQuant PowerSuite MassBase http://webs2.kazusa.or.jp/massbase/ 解析データの高度利用 分析 個別のデータ解析 ターゲット分析 RnR KaPPA-View http://webs2.kazusa.or.jp/komics/ 27 メタボロームデータの定式化 データ処理パイプライン 全データ クロマトグラム 16 18 20 22 24 全データの 取り出し 26 28 測定機器 ツール開発 1011000010 0110100101 0110101101 0101010110 0101001101 共通フォーマットの作成 共通パラメータの探索 定式化データ ピークの取り出し 定式化ツール開発 GC-TOF-MSの一つのピークのデータ 年間~9,000 分析 ピークの数だけこのファイルが必要 かずさ研代謝分析DB: MassBase http://webs2.kazusa.or.jp/massbase/ かずさDNA研究所で分析した質量分析装置のク ロマトグラムを公開しているサイト(世界最大級) かずさ研代謝分析DB: KomicMarket http://webs2.kazusa.or.jp/komicmarket/ かずさDNA研究所で分析した代謝産物のなかでアノ テーションを付けた化合物を公開しているサイト 1)サンプル情報 2)分析情報 3)データ解析情報 4)ピーク情報 6)データ検索 5)ピークアノテーション情報 KOMICSを使ってみよう Googleで「KOMICS」を検索する、あるいは、 http://www.kazusa.or.jp/komics/にログインする KOMICSを使ってみよう 「KOMICS」の「データベース」をクリックする かずさDNA研究所で開発したメタボロミクスの データベース閲覧サイト KOMICSを使ってみよう 「KOMICS」の「ツール•ソフトウェア」をクリックする かずさDNA研究所で開発したメタボロミクス用の ツール•ソフトウェアのダウンロードサイト 遺伝子発現と代謝情報の統合DB KOMICS等 KaPPA-View システム トランスクリプ メタボロー トームデータ ムデータ カスタム マップ Web Browser Internet 代謝マップ上に表示 DATA MAP データ パスウェイ ライブラリー 情報 http://kpv.kazusa.or.jp/kappa-v メタボローム 解析とは? デ ー タ ベ ー ス 機 能 メタボロームデータベースの利用例 検索機能:どの代謝物がどの植物のどの組織のどの時期にあるか? ユーザーのクロマトグラムと類似した実験の検出 共相関性:代謝物間の挙動の類似性の検出 比較メタボローム解析:実験間、植物種間など 統計処理ツール アライメントツール 共相関性の例 メタボローム データベース バイオインフォマティクス ピーク比較ツール 解析ツールは本研究で整備 実験間の比較例 未知の代謝物、代謝経路・制御方式の発見に貢献 メタボローム 解析の方法 メタボローム解析の対象 代謝物の数(1種類の生物当り) 微生物 1000前後、動物 3000前後、植物 5000以上 (植物界全体で20万種類、微生物界全体:不明) ・多様な代謝物をどのように計測するのか? 種類: 低分子、高分子、複合体 極性、非極性、揮発性 量: 微量(~数分子)~多量(全体の50%) 計測値: 絶対構造、組成式、分子量、UV吸収 ・どのような形式でデータベース化するのか? 装置、測定条件の違いをどうするのか? メタボローム 解析の方法 LC-IT-MS かずさDNA研究所の解析装置 UPLC-Q-TOF-MS UPLC-TOF-MS LC-MS GC-TOF-MS x 2 LTQ Orbitrap CE-MS x2 LC-FT-MS 分析総数 :約11万件 2013年1月現在 FT-IR LC-PDA x2 GPC-MALS メタボローム 解析の方法 各種の代謝産物分析 ガスクロマトグラィー 質量分析装置 (GC-MS) 揮発性物質 誘導体分析(糖、脂肪酸、アミノ酸など) (主に代謝プロファイリングに使用) キャピラリー電気 泳動質量分析装置 (CE-MS) 有機酸、アミノ酸、イオン性代謝物 液体クロマトグラィー 質量分析装置 (LC-MS) 有機化合物一般、二次代謝産物 (カロテノイド、フラボノイドなどの分析に使 用) 有機化合物一般、二次代謝産物 (超精密質量分析:同定・アノテーション) 液体クロマトグラフィー・ フーリエ変換型質量分析 装置(NEDOプロジェクト外で整 (主に迅速なターゲット分析に使用) 備) (LC-FT/ICR-MS) 実績:総数~9万件の試料を分析(年間9000件以上のペース) メタボローム 解析の方法 超精密質量測定の必要性 IT-MSMSスペクトル FT-MSMSスペクトル(精密質量) 液体クロマトグラフ FT-MSスペクトル Kaempferol [C15H10O6] LC-FT/ICR-MS LC-Orbitrap 高速液体クロマトグラフ ―フーリエ変換イオンサイクロトロン共鳴 ハイブリッド質量分析計 精密質量 PDAスペクトル (200 - 650 nm) 液体クロマトグラフ (Retention time / min) FT-MSスペクトル (精密質量) IT-MSMSスペクトル (質量) FT-MSMSスペクトル (精密質量) 12C = 12 (定義により整数) 1H = 1.0078250319 16O = 15.9949146223 ex.) m/z 165.0183 について 候 補 C 8H5O4 C 4H5O7 C12H5O C11HO2 C 5H9O6 理論値 165.01878 質量差 0.50 mmu 165.03404 -14.76 mmu 165.00352 15.76 mmu 165.03991 -20.63 mmu 164.99765 21.63 mmu 組成式の絞込みが可能 フラグメントパターンからの構造推定 不可能な組成 質量差大 メタボローム 解析の方法 超精密質量測定の有効性 OH HO O OH OH HO O OH OH CH2 O O H3C HO HO O OH Flavonoids: 49 novel in 70 detected 850個以上の代謝物を解明した Glycoalkaloids: 77 novel in 93 detected 専門家でも一つのサン プルの情報解析に3ヶ月 以上かかる!! メタボローム 解析の方法 超精密質量解析の高速化 メタボローム解析のブレークスルー技術 LC-FT/ ICR-MS LTQ Orbitrap 従来法の1000倍の効率 精度の向上:5ppm→0.5ppm 組成式絞込み x10 組成式計算速度:x100 全ピークを精密質量で取り出して、 全組成式を3分以内に計算。さらに、全代 謝物を試料間で徹底的に比較し、結果を 明快に表示。 メタボローム 解析の方法 PowerFT:網羅的解析システム 1.自動ノイズ処理 メタボローム解析のブレークス ルー技術!! 2.ピーク検証・組成式演算 アイソトープイオンの評価 バッチ自動組成式 計算 メタボローム 解析の方法 PowerMatch:多試料間での代謝物比較 世界初の複数代謝物間での比較解析技術!! サンプル sample E sample D sample C sample B sample A 溶出時間順 精密質量、溶出時間、MS/MSパターンによる アラインメントが可能 メタボローム 解析の方法 PowerGet(PowerFT+PowerMatch) クロマトグラムの整列化と化学的アノテーション付与が同時に可能 クロマトグラム ・・・・ sample 3 sample 2 sample 1 化合物A 化合物B 化合物C ・・・・ 公共データベース へのリンク メタボローム 解析の課題 従来技術との違い 従来の成分分析 (天然物化学の手法) 植物試料 個別の代謝物(化合物)が対象 同定のための標準化合物が必要 標品 考え方がまったく違う メタボローム解析技術 (ゲノム生物学の手法) 全代謝物(化合物)が対象 標準化合物を使わない (必要に応じて使う) アノテーション(注釈)という 概念の導入(曖昧性の許容) 不完全であっても化学 的情報をなるべく提供 するという考え方 メタボローム 解析の課題 メタボローム解析の限界 メタボローム解析の要素技術 クロマトデータを試料間で整列させる技術 クロマトグラム どこまで正 しく整列でき るのか? sample 3 sample 2 sample 1 化学的アノテーション付与技術 これらを意識して結果 を解釈することが大切 正しく注釈を付けるこ とができるのか? 不十分、不正確な情報は、「あとで補う」という考え方 (最初の絞込みには有用な手法といえる) メタボローム 解析の課題 構造推定へのチャレンジ + + 衝突解離 [M + H]+ + , , + (CID) 検出器 ,… Target ion + 質量分離部 + - Fragment ion 構造に依存 + MSMS spectra 置換基:固有の成分の脱離 フラグメントイオン情報から元の 構造を完全に再構築することは困 難 しかし、類似化合物のMS/MSパターンから推定は可能 メタボローム 解析の課題 フラボノイド構造予測 6800種類のフラボノイド構造情報 データベースを構築することに成功 迅速なフラボノイド同定 メタボローム 解析の課題 MSMSデータ解析用データベース Metabolomics.JP 内 フラボノイド6853化合物の各ページ ID 2nd Category MSMS解析用 構造情報データベース Name IUPAC 名、慣用名が混在 置換基が O-type か C-type か 少々わかりづらい 情報の追加が必要 メタボローム 解析の課題 今後の課題 データ処理パイプ ラインの効率化 å アノテーションの効率化 未知化合物の推定 (ミリマスデータの活用) 産業界との連携 ID問題:生物 学情報と化学 情報の刷り合 わせ (食品、医薬品、工業原料など) 政府との連携 (経済産業省、農林水産省、文科省) 食品科学へ の応用 多変量解析の手法 クロマトグラム成分の整列化 実験k 実験2 実験1 成分1 成分2 . . . 成分n 整列化成分データシート(定量値) 成分1 成分2 成分n 実験1 3 7 5 実験2 2 4 8 実験3 23 34 20 実験4 7 11 35 . . . . . . 実験k 304 455 . . . . 35 多変量解析 食品科学へ の応用 お茶の成分分析(液体クロマト/質量分析) LC-ICRFT/MS分析 RT: 0.00 - 56.95 20.47 600000 19.88 400000 200000 14.26 5.37 0 600000 煎茶(上) 22.76 17.71 16.37 7.02 23.36 25.44 20.39 34.46 35.29 42.88 46.22 49.88 53.88 NL: 6.17E5 Total Scan PDA 091104_F 56.76 011N2_ES p 19.79 400000 6.99 11.47 14.20 200000 6.63 22.73 17.63 16.35 23.33 0 uAU 19.83 400000 17.65 16.34 7.00 200000 6.64 14.19 0 22.71 23.31 25.80 20.44 19.81 17.65 22.75 400000 6.99 9.73 200000 14.19 6.63 16.32 25.43 0 20.41 600000 19.83 400000 7.06 200000 4.01 5.38 9.95 14.21 22.71 17.68 16.38 0 23.31 19.83 17.67 200000 3.63 7.06 11.53 14.27 6.25 22.72 16.35 25.42 27.33 0 0 5 10 25.82 25.80 20.42 400000 煎茶(並) 棒茶(茎茶) 番茶 粉茶 玄米茶 27.32 20.43 15 20 25 30 Time (min) 34.45 35.27 34.45 35 56.75 54.73 NL: 5.52E5 Total Scan PDA 091102_fc 56.75 13_esi_p 54.39 NL: 5.37E5 Total Scan PDA 091102_fc 56.77 14_esi_p 54.75 NL: 6.24E5 Total Scan PDA 091102_fc 56.78 15_esi_p 46.89 49.30 54.73 NL: 5.00E5 Total Scan PDA 091102_fc 56.76 16_esi_p 45 50 47.76 42.21 45.45 35.26 43.17 45.41 34.45 35.28 34.45 54.73 45.45 34.45 35.27 43.24 35.26 45.42 42.15 40 NL: 6.01E5 Total Scan PDA 091102_fc 12_esi_p 49.15 49.57 49.15 55 RT: 0.00 - 56.95 20.46 19.89 17.70 400000 200000 2.93 7.03 5.34 24.05 25.44 33.87 34.47 13.47 16.37 0 38.50 42.85 45.43 48.70 54.73 20.41 19.85 400000 7.07 200000 14.63 5.31 22.75 17.69 16.47 0 600000 uAU ウーロン茶(上) 22.78 ウーロン茶(並) 24.04 25.41 20.41 19.82 22.71 400000 200000 6.24 14.19 13.86 7.05 17.65 0 23.65 34.44 37.49 42.49 45.41 49.55 54.72 紅茶 25.86 34.44 38.79 42.46 44.37 200000 6.66 0 7.02 14.30 17.68 24.59 12.89 ジャスミン茶 25.42 34.44 38.82 NL: 5.39E5 Total S PDA 091104 56.76 18n2_e 50.11 54.73 NL: 6.01E5 Total S PDA 091104 56.76 19n2_e 54.41 NL: 5.72E5 Total S PDA 091104 56.78 20n2_e 20.46 22.75 19.85 400000 NL: 5.99E5 Total S PDA 091104 56.77 17n2_e 45.83 47.60 NL: 7.09 150000 100000 4.39 6.67 4.39 6.67 11.62 34.43 12.37 22.75 26.15 29.40 33.75 39.18 43.33 46.01 50.49 54.73 56.78 1.75E5 Total S PDA 091104 21n2_e 50000 0 NL: 7.09 150000 100000 お茶の種類によって、成分全体が どのように異なっているのか? 50000 0 0 5 特定のお茶成分 はよく研究され ているが 11.62 10 34.43 12.37 15 22.75 26.15 29.40 33.75 20 25 30 Time (min) 35 39.18 43.33 40 46.01 50.49 54.73 45 50 56.78 1.75E5 Total S PDA 091104 21n2_e 55 食品科学へ の応用 お茶成分の商品間での差異 お茶 成分抽出 液クロ/質量分析 テキスト化データ データの整列化 統計学的解析 (主成分分析) 主成分分析 多数のお茶成分の違いによる分類 この違いを決めるお茶成分が分かる (同定、未同定を含めて) 食品科学へ の応用 牛肉を焼くと成分はどう変化する? 9%(403/4737)の化合物に有意差あり 加熱で減少 加熱で増加 Volcano Plot 組成式レベルで化学変化を解析可能 この手法は、新たに生じる成分の分析に幅広く利用できる 食品科学へ の応用 トマトの加工による成分変化 果実 Factor2 (16.7%) 0.5 0.0 ジュース 8859-F 958-J 736-J 8859-J 8860-J 958-F 736-F 8860-F -0.5 ジュース特有成分 ① ② ③ ④ m/z 434 m/z 477 m/z 572 m/z1227 4460-J -1.0 機能性の評価 4460-F -1.0 -0.5 0.0 0.5 Factor1 (64.8%) 1.0 特定の成分変化が一目瞭然!! 食品科学へ の応用 食品成分分析での基盤整備の必要性 食品の高品質化への最大の障害 食品中の成分が複雑、多様であり、解析が困難であること。 (食品の品質は成分の組合せ・相互作用によって決定されるので、 品質の評価および制御が効率的に行えない) 網羅的解析技術によるブレークスルーが必要 ・超精密質量分析装置 ・質量分析データのアノテーション技術 ・品質評価項目と成分分析結果の多変量解析 これらに農業や食品産業に蓄積された知の集積を加える 海外の現状 オランダなどでは、既に農業 食品産業への網羅的解析技術 の適用が開始 農産物・製品の流入 特許使用料の発生 我が国の農業・食品産業 に打撃を与え、国民の健康 栄養の根幹を海外企業に 抑えられる 産官学あげての取り組みが急務 ・共通基盤としの食品成分の データベースの構築 ・データベース活用による農産 物の改良や高機能食品開発の 迅速化 ・知的財産権の確保や技術革新 による経済的メリット 謝辞 NEDO:新エネルギー・産業技術総合開発機構 CREST:科学技術振興機構 · 戦略的創造研究推進事業 BRAIN:生物系特定産業技術研究支援センター 産業基盤開発研究部 分析受託サービス 超精密質量分析の受託サービスを行っています メタボローム解析 メタボローム解析 (定型) (非定型) 自動アノテーション 自動マッチング 高品質 アノテーション 高品質マッチング 受託できる件数が限られていますので、ご興味のあ る方はお早めにご相談ください。 メタボローム解析 コンサルティング (非定型) 実験計画策定 メタボローム 分析・解析 解析レポート作成 問い合わせ先 (財)かずさDNA研究所 バイオ産業技術支援センター(生体物質解析センター) 〒292-0818 千葉県木更津市かずさ鎌足2-6-7 電話: 0438-52-3900 FAX: 0438-52-3901 e-mail: [email protected]