...

発表資料

by user

on
Category: Documents
11

views

Report

Comments

Transcript

発表資料
2013年1月24日
平成24年度 データベース講習会
日時: 1月24日
場所: 産業技術総合研究所 臨海副都心セ
ンター バイオIT融合研究棟8階 CBRCセミ
ナー室
「食品科学へのメタボロームデータの応用」
かずさDNA研究所
産業基盤開発研究部
柴田 大輔
幅広い食品関連分野
品種
育種学
生育環境
園芸学・植物生理学
調理・加工
流通・貯蔵
食品学・調理学
園芸学・食品学
食品科学の難問
キーとなる成分が多様かつ複雑で把握が困難
原料
ヒトの体内
食品
植物素材
を例にとる
と、約20万
種類存在
(単一の植物
体中でも
数千種以上)
貯蔵
加工
発酵
物理的・
化学的・
生化学的
変化
20万 x ?
超複合系
(一つの
食品中
でも数千
から数万)
摂取
吸収
消化管や
吸収後の
組織での
代謝変動
(成分の
さらなる
変化)
各段階における化合物(代謝物)の多様性
網羅的成分解析手法への期待
(メタボローム解析手法)
ヒト中の生体
成分が食品
成分の影響を
受け変動
セミナーの内容
メタボローム解析とは?
メタボローム解析の方法
メタボローム解析の課題
食品化学への応用
PowerGetの実演 (櫻井望)
メタボローム
解析とは?
オミクスとシステム生物学
生物学的要素の網羅的計測
データベース
分析化学の手法
バイオインフォマティクス
生物学的ルールの発見(←実験による実証)
KDRI
メタボローム
解析とは?
生物学的要素の計測
値
オーム
要素
計測装置
ゲノム
遺伝子
シークエンサー
塩基配列
遺伝子注釈
トランスクリ
プトーム
RNA
転写量
プロテオーム
タンパク質
DNAアレイ
次世代シーク
エンサー
質量分析装置
SDS-PAGE
メタボローム
代謝物
質量分析装置
NMR
蛋白量
酵素活性
アミノ酸配列
定量値
組成式
構造式
要素の値は、アノテーション(注釈)であることに注意!!
メタボローム
解析とは?
分子遺伝学
分子生物学
分子生物学
ゲノミクス
生物学における“曖昧性”の許容
曖昧性を嫌う
遺伝学
遺伝学
生化学
生化学
生理学
生理学
要素還元論
曖昧性の許容が不
可避
トランスク
リプトミクス
フェノミクス
プロテ
オミクス
メタボ
ロミクス
膨大な情報量
システム論
メタボローム
解析とは?
多変量解析に含まれる曖昧性
母集団
欲しい成分
関係ない成分
曖昧
性を含
む
欲しい成分
を逃すことも
ある
多変量解析
による抽出
擬陽性を含む
フィルタリング
(マニュアル補正)
それでも完璧というわ
けではない
あとは、個別に精密な成分分析を行う(従来の研究スタイル)
メタボローム
解析とは?
メタボロームデータの多変量解析
CSVファイル
クロマトグラム
数値データの取出し
scan
time
サンプル
m/z
ピ
ー
ク
多変量解析
主成分分析
大規模解析用
テーブル
通常、ピーク数は
500から数千
メタボローム
解析とは?
多変量解析:主成分分析
Principal Component Analysis (PCA)
多変量から構成されるサンプル間の相違を表現する手段
X2
b1
xi
x1
X1
xn
Xm
x2
第一主成分、第二主成分、第三主成分、、第n主成分
寄与率、累積寄与率80%ぐらいまでで十分
メタボローム
解析とは?
主成分分析の実例
GC-TOF-MSで解析されたシロイヌナズナ代謝産物のPCA解析
T87 14days
T87 10days
T87 7days
T87 3days
Leaves
オミクスデータベースの位置付け
トランスクリプトーム
実験データ
のDB
遺伝子発現データ
GEO (315M)
ArrayExpress (240M)
プロテオーム
メタボローム
タンパク質発現データ
HumanProteinpedia (3K)
Expasy, HRPD
代謝産物データ
METLIN (<1K)など
代謝産物データ
METLIN
(<1K)など
MassBase(80K)
Komics(8K)
遺伝子共発現
ATTED-II, BAR
データマイ
ニングDB
情報統合
HUPO, HRPD, Expasy
基本情報
統合DB
基本情報DB
タンパク質相互作用
HRPD, MINT, BIND (ヒト)
遺伝子情報
GenBank
DDBJ
GO
タンパク質情報
EC (IUBMB)
BRENDA
代謝経路
KEGG PATHWAY
MetaCyc
代謝産物情報
KEGG LIGAND
DNP, CAS
PubChem, KNApSAcK
代謝分析プラットフォーム
分析機器
付属解析ソフト
テキスト出力
01101
10110
01010
tool
GC-MS
ChromaTOF
CE-MS
ChemStation
01101
10110
01010
tool
MassLynx
01101
10110
01010
tool
UPLC-QTOF-MS
LC-FT-MS
全データ利用
データ解析ソフト開発
(インフォマティクス)
PeakIdentifier
FragmentAlign
Xcalibur
01101
10110
01010
MSGet
FAQuant
PowerSuite
MassBase
http://webs2.kazusa.or.jp/massbase/
解析データの高度利用
分析
個別のデータ解析
ターゲット分析
RnR
KaPPA-View
http://webs2.kazusa.or.jp/komics/ 27
メタボロームデータの定式化
データ処理パイプライン
全データ
クロマトグラム
16
18
20
22
24
全データの
取り出し
26
28
測定機器
ツール開発
1011000010
0110100101
0110101101
0101010110
0101001101
共通フォーマットの作成
共通パラメータの探索
定式化データ
ピークの取り出し
定式化ツール開発
GC-TOF-MSの一つのピークのデータ
年間~9,000 分析
ピークの数だけこのファイルが必要
かずさ研代謝分析DB: MassBase
http://webs2.kazusa.or.jp/massbase/
かずさDNA研究所で分析した質量分析装置のク
ロマトグラムを公開しているサイト(世界最大級)
かずさ研代謝分析DB: KomicMarket
http://webs2.kazusa.or.jp/komicmarket/
かずさDNA研究所で分析した代謝産物のなかでアノ
テーションを付けた化合物を公開しているサイト
1)サンプル情報
2)分析情報
3)データ解析情報
4)ピーク情報
6)データ検索
5)ピークアノテーション情報
KOMICSを使ってみよう
Googleで「KOMICS」を検索する、あるいは、
http://www.kazusa.or.jp/komics/にログインする
KOMICSを使ってみよう
「KOMICS」の「データベース」をクリックする
かずさDNA研究所で開発したメタボロミクスの
データベース閲覧サイト
KOMICSを使ってみよう
「KOMICS」の「ツール•ソフトウェア」をクリックする
かずさDNA研究所で開発したメタボロミクス用の
ツール•ソフトウェアのダウンロードサイト
遺伝子発現と代謝情報の統合DB
KOMICS等
KaPPA-View
システム
トランスクリプ メタボロー
トームデータ
ムデータ
カスタム
マップ
Web Browser
Internet
代謝マップ上に表示
DATA
MAP
データ パスウェイ
ライブラリー 情報
http://kpv.kazusa.or.jp/kappa-v
メタボローム
解析とは?
デ
ー
タ
ベ
ー
ス
機
能
メタボロームデータベースの利用例
検索機能:どの代謝物がどの植物のどの組織のどの時期にあるか?
ユーザーのクロマトグラムと類似した実験の検出
共相関性:代謝物間の挙動の類似性の検出
比較メタボローム解析:実験間、植物種間など
統計処理ツール
アライメントツール
共相関性の例
メタボローム
データベース
バイオインフォマティクス
ピーク比較ツール
解析ツールは本研究で整備
実験間の比較例
未知の代謝物、代謝経路・制御方式の発見に貢献
メタボローム
解析の方法
メタボローム解析の対象
代謝物の数(1種類の生物当り)
微生物 1000前後、動物 3000前後、植物 5000以上
(植物界全体で20万種類、微生物界全体:不明)
・多様な代謝物をどのように計測するのか?
種類: 低分子、高分子、複合体
極性、非極性、揮発性
量:
微量(~数分子)~多量(全体の50%)
計測値: 絶対構造、組成式、分子量、UV吸収
・どのような形式でデータベース化するのか?
装置、測定条件の違いをどうするのか?
メタボローム
解析の方法
LC-IT-MS
かずさDNA研究所の解析装置
UPLC-Q-TOF-MS
UPLC-TOF-MS
LC-MS
GC-TOF-MS x 2
LTQ Orbitrap
CE-MS x2
LC-FT-MS
分析総数
:約11万件
2013年1月現在
FT-IR
LC-PDA x2
GPC-MALS
メタボローム
解析の方法
各種の代謝産物分析
ガスクロマトグラィー
質量分析装置
(GC-MS)
揮発性物質
誘導体分析(糖、脂肪酸、アミノ酸など)
(主に代謝プロファイリングに使用)
キャピラリー電気
泳動質量分析装置
(CE-MS)
有機酸、アミノ酸、イオン性代謝物
液体クロマトグラィー
質量分析装置
(LC-MS)
有機化合物一般、二次代謝産物
(カロテノイド、フラボノイドなどの分析に使
用)
有機化合物一般、二次代謝産物
(超精密質量分析:同定・アノテーション)
液体クロマトグラフィー・
フーリエ変換型質量分析
装置(NEDOプロジェクト外で整
(主に迅速なターゲット分析に使用)
備)
(LC-FT/ICR-MS)
実績:総数~9万件の試料を分析(年間9000件以上のペース)
メタボローム
解析の方法
超精密質量測定の必要性
IT-MSMSスペクトル
FT-MSMSスペクトル(精密質量)
液体クロマトグラフ
FT-MSスペクトル
Kaempferol
[C15H10O6]
LC-FT/ICR-MS
LC-Orbitrap
高速液体クロマトグラフ
―フーリエ変換イオンサイクロトロン共鳴
ハイブリッド質量分析計
精密質量
PDAスペクトル (200 - 650 nm)
液体クロマトグラフ (Retention time / min)
FT-MSスペクトル (精密質量)
IT-MSMSスペクトル (質量)
FT-MSMSスペクトル (精密質量)
12C
= 12 (定義により整数)
1H =
1.0078250319
16O = 15.9949146223
ex.) m/z 165.0183 について
候 補
C 8H5O4
C 4H5O7
C12H5O
C11HO2
C 5H9O6
理論値
165.01878
質量差
0.50 mmu
165.03404
-14.76 mmu
165.00352
15.76 mmu
165.03991
-20.63 mmu
164.99765
21.63 mmu
組成式の絞込みが可能
フラグメントパターンからの構造推定
不可能な組成
質量差大
メタボローム
解析の方法
超精密質量測定の有効性
OH
HO
O
OH
OH
HO
O
OH
OH
CH2
O
O
H3C
HO
HO
O
OH
Flavonoids:
49 novel in 70 detected
850個以上の代謝物を解明した
Glycoalkaloids:
77 novel in 93 detected
専門家でも一つのサン
プルの情報解析に3ヶ月
以上かかる!!
メタボローム
解析の方法
超精密質量解析の高速化
メタボローム解析のブレークスルー技術
LC-FT/
ICR-MS
LTQ Orbitrap
従来法の1000倍の効率
精度の向上:5ppm→0.5ppm
組成式絞込み x10
組成式計算速度:x100
全ピークを精密質量で取り出して、
全組成式を3分以内に計算。さらに、全代
謝物を試料間で徹底的に比較し、結果を
明快に表示。
メタボローム
解析の方法
PowerFT:網羅的解析システム
1.自動ノイズ処理
メタボローム解析のブレークス
ルー技術!!
2.ピーク検証・組成式演算
アイソトープイオンの評価
バッチ自動組成式
計算
メタボローム
解析の方法
PowerMatch:多試料間での代謝物比較
世界初の複数代謝物間での比較解析技術!!
サンプル
sample E
sample D
sample C
sample B
sample A
溶出時間順
精密質量、溶出時間、MS/MSパターンによる
アラインメントが可能
メタボローム
解析の方法
PowerGet(PowerFT+PowerMatch)
クロマトグラムの整列化と化学的アノテーション付与が同時に可能
クロマトグラム
・・・・
sample 3
sample 2
sample 1
化合物A
化合物B
化合物C
・・・・
公共データベース
へのリンク
メタボローム
解析の課題
従来技術との違い
従来の成分分析 (天然物化学の手法)
植物試料
個別の代謝物(化合物)が対象
同定のための標準化合物が必要
標品
考え方がまったく違う
メタボローム解析技術 (ゲノム生物学の手法)
全代謝物(化合物)が対象
標準化合物を使わない
(必要に応じて使う)
アノテーション(注釈)という
概念の導入(曖昧性の許容)
不完全であっても化学
的情報をなるべく提供
するという考え方
メタボローム
解析の課題
メタボローム解析の限界
メタボローム解析の要素技術
クロマトデータを試料間で整列させる技術
クロマトグラム
どこまで正
しく整列でき
るのか?
sample 3
sample 2
sample 1
化学的アノテーション付与技術
これらを意識して結果
を解釈することが大切
正しく注釈を付けるこ
とができるのか?
不十分、不正確な情報は、「あとで補う」という考え方
(最初の絞込みには有用な手法といえる)
メタボローム
解析の課題
構造推定へのチャレンジ
+
+ 衝突解離
[M + H]+
+
,
,
+
(CID)
検出器
,…
Target ion
+
質量分離部
+
-
Fragment ion
構造に依存
+
MSMS spectra
置換基:固有の成分の脱離
フラグメントイオン情報から元の
構造を完全に再構築することは困
難
しかし、類似化合物のMS/MSパターンから推定は可能
メタボローム
解析の課題
フラボノイド構造予測
6800種類のフラボノイド構造情報
データベースを構築することに成功
迅速なフラボノイド同定
メタボローム
解析の課題
MSMSデータ解析用データベース
Metabolomics.JP 内
フラボノイド6853化合物の各ページ
ID
2nd Category
MSMS解析用 構造情報データベース
Name
IUPAC 名、慣用名が混在
置換基が O-type か C-type か
少々わかりづらい
情報の追加が必要
メタボローム
解析の課題
今後の課題
データ処理パイプ
ラインの効率化
å
アノテーションの効率化
未知化合物の推定
(ミリマスデータの活用)
産業界との連携
ID問題:生物
学情報と化学
情報の刷り合
わせ
(食品、医薬品、工業原料など)
政府との連携
(経済産業省、農林水産省、文科省)
食品科学へ
の応用
多変量解析の手法
クロマトグラム成分の整列化
実験k
実験2
実験1
成分1 成分2
. . . 成分n
整列化成分データシート(定量値)
成分1
成分2
成分n
実験1
3
7
5
実験2
2
4
8
実験3
23
34
20
実験4
7
11
35
.
.
.
.
.
.
実験k
304
455
.
.
.
.
35
多変量解析
食品科学へ
の応用
お茶の成分分析(液体クロマト/質量分析)
LC-ICRFT/MS分析
RT: 0.00 - 56.95
20.47
600000
19.88
400000
200000
14.26
5.37
0
600000
煎茶(上)
22.76
17.71
16.37
7.02
23.36
25.44
20.39
34.46 35.29
42.88
46.22
49.88
53.88
NL:
6.17E5
Total Scan
PDA
091104_F
56.76 011N2_ES
p
19.79
400000
6.99
11.47 14.20
200000
6.63
22.73
17.63
16.35
23.33
0
uAU
19.83
400000
17.65
16.34
7.00
200000
6.64
14.19
0
22.71
23.31
25.80
20.44
19.81
17.65
22.75
400000
6.99
9.73
200000
14.19
6.63
16.32
25.43
0
20.41
600000
19.83
400000
7.06
200000
4.01
5.38
9.95 14.21
22.71
17.68
16.38
0
23.31
19.83
17.67
200000
3.63
7.06
11.53 14.27
6.25
22.72
16.35
25.42 27.33
0
0
5
10
25.82
25.80
20.42
400000
煎茶(並)
棒茶(茎茶)
番茶
粉茶
玄米茶
27.32
20.43
15
20
25
30
Time (min)
34.45
35.27
34.45
35
56.75
54.73
NL:
5.52E5
Total Scan
PDA
091102_fc
56.75 13_esi_p
54.39
NL:
5.37E5
Total Scan
PDA
091102_fc
56.77 14_esi_p
54.75
NL:
6.24E5
Total Scan
PDA
091102_fc
56.78 15_esi_p
46.89
49.30 54.73
NL:
5.00E5
Total Scan
PDA
091102_fc
56.76 16_esi_p
45
50
47.76
42.21 45.45
35.26
43.17 45.41
34.45 35.28
34.45
54.73
45.45
34.45 35.27
43.24
35.26
45.42
42.15
40
NL:
6.01E5
Total Scan
PDA
091102_fc
12_esi_p
49.15
49.57
49.15
55
RT: 0.00 - 56.95
20.46
19.89
17.70
400000
200000
2.93
7.03
5.34
24.05 25.44 33.87 34.47
13.47 16.37
0
38.50 42.85 45.43 48.70 54.73
20.41
19.85
400000
7.07
200000
14.63
5.31
22.75
17.69
16.47
0
600000
uAU
ウーロン茶(上)
22.78
ウーロン茶(並)
24.04
25.41
20.41
19.82
22.71
400000
200000
6.24
14.19
13.86
7.05
17.65
0
23.65
34.44 37.49
42.49
45.41 49.55 54.72
紅茶
25.86
34.44 38.79 42.46 44.37
200000
6.66
0
7.02
14.30
17.68
24.59
12.89
ジャスミン茶
25.42
34.44
38.82
NL:
5.39E5
Total S
PDA
091104
56.76 18n2_e
50.11 54.73
NL:
6.01E5
Total S
PDA
091104
56.76 19n2_e
54.41
NL:
5.72E5
Total S
PDA
091104
56.78 20n2_e
20.46
22.75
19.85
400000
NL:
5.99E5
Total S
PDA
091104
56.77 17n2_e
45.83 47.60
NL:
7.09
150000
100000
4.39
6.67
4.39
6.67
11.62
34.43
12.37
22.75 26.15 29.40 33.75
39.18 43.33
46.01 50.49 54.73
56.78 1.75E5
Total S
PDA
091104
21n2_e
50000
0
NL:
7.09
150000
100000
お茶の種類によって、成分全体が
どのように異なっているのか?
50000
0
0
5
特定のお茶成分
はよく研究され
ているが
11.62
10
34.43
12.37
15
22.75 26.15 29.40 33.75
20
25
30
Time (min)
35
39.18 43.33
40
46.01 50.49 54.73
45
50
56.78 1.75E5
Total S
PDA
091104
21n2_e
55
食品科学へ
の応用
お茶成分の商品間での差異
お茶
成分抽出
液クロ/質量分析
テキスト化データ
データの整列化
統計学的解析
(主成分分析)
主成分分析
多数のお茶成分の違いによる分類
この違いを決めるお茶成分が分かる
(同定、未同定を含めて)
食品科学へ
の応用
牛肉を焼くと成分はどう変化する?
9%(403/4737)の化合物に有意差あり
加熱で減少
加熱で増加
Volcano Plot
組成式レベルで化学変化を解析可能
この手法は、新たに生じる成分の分析に幅広く利用できる
食品科学へ
の応用
トマトの加工による成分変化
果実
Factor2 (16.7%)
0.5
0.0
ジュース
8859-F
958-J
736-J
8859-J
8860-J
958-F
736-F
8860-F
-0.5
ジュース特有成分
①
②
③
④
m/z 434
m/z 477
m/z 572
m/z1227
4460-J
-1.0
機能性の評価
4460-F
-1.0
-0.5
0.0
0.5
Factor1 (64.8%)
1.0
特定の成分変化が一目瞭然!!
食品科学へ
の応用
食品成分分析での基盤整備の必要性
食品の高品質化への最大の障害
食品中の成分が複雑、多様であり、解析が困難であること。
(食品の品質は成分の組合せ・相互作用によって決定されるので、
品質の評価および制御が効率的に行えない)
網羅的解析技術によるブレークスルーが必要
・超精密質量分析装置 ・質量分析データのアノテーション技術
・品質評価項目と成分分析結果の多変量解析
これらに農業や食品産業に蓄積された知の集積を加える
海外の現状
オランダなどでは、既に農業
食品産業への網羅的解析技術
の適用が開始
農産物・製品の流入
特許使用料の発生
我が国の農業・食品産業
に打撃を与え、国民の健康
栄養の根幹を海外企業に
抑えられる
産官学あげての取り組みが急務
・共通基盤としの食品成分の
データベースの構築
・データベース活用による農産
物の改良や高機能食品開発の
迅速化
・知的財産権の確保や技術革新
による経済的メリット
謝辞
NEDO:新エネルギー・産業技術総合開発機構
CREST:科学技術振興機構 · 戦略的創造研究推進事業
BRAIN:生物系特定産業技術研究支援センター
産業基盤開発研究部
分析受託サービス
超精密質量分析の受託サービスを行っています
メタボローム解析
メタボローム解析
(定型)
(非定型)
自動アノテーション
自動マッチング
高品質
アノテーション
高品質マッチング
受託できる件数が限られていますので、ご興味のあ
る方はお早めにご相談ください。
メタボローム解析
コンサルティング
(非定型)
実験計画策定
メタボローム
分析・解析
解析レポート作成
問い合わせ先
(財)かずさDNA研究所 バイオ産業技術支援センター(生体物質解析センター)
〒292-0818 千葉県木更津市かずさ鎌足2-6-7
電話: 0438-52-3900 FAX: 0438-52-3901
e-mail: [email protected]
Fly UP