...

Protein Protein Protein

by user

on
Category: Documents
4

views

Report

Comments

Transcript

Protein Protein Protein
情報処理装置「生命」の
設計図を読み解く
大林武 (東北大・情報)
[email protected]
自己紹介(大林武)
11年
東工大・生命
(千葉大・薬)
生物学
4年
7年
東大・医科研
東北大・情報
バイオ
インフォ
マティクス
情報科学
Bioinformatics / Computational Biology
Biology
Informatics
Bioinformatics
Computational Biology
Biology
Chemistry
Biochemistry
Chemical Biology
もくじ
情報処理システム
細胞システムの解明へ
遺伝子ネットワーク
システムの進化
情報処理システム
Software
入力
111010001001
変換器
出力
CPU / GPU / FPGA
制御装置 / 演算装置 / レジスタ
NANDゲート, NORゲート
トランジスタ
半導体
000000111101
目的
利用者のニーズ
様々な
原子
細胞システム
入力
Pathway
グルコース濃度が上昇
変換器
タンパク質複合体
Genome
タンパク質(遺伝子)
タンパク質ドメイン
出力
タンブリングの抑制
目的
子孫繁栄
変動環境での
アミノ酸
原子
遺伝子型と表現型の関係性
表現型
増殖速度
捕食者対応力
機能
Pathway
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
システムの複製
表現型
増殖速度 捕食者対応力
増殖速度 捕食者対応力
Pathway
Pathway
機能
複合体
Pathway
複合体
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein
Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
ゲノムのコピー
変化するゲノム
表現型
増殖速度 捕食者対応力
増殖速度 捕食者対応力
Pathway
Pathway
機能
複合体
Pathway
複合体
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein
Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
ゲノムの変化
もくじ
情報処理システム
細胞システムの解明へ
遺伝子ネットワーク
システムの進化
細胞システムの研究アプローチ
表現型
遺
伝
学
増殖速度
捕食者対応力
機能
Pathway
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
逆
遺
伝
学
要素は決定できる
表現型
遺
伝
学
増殖速度
捕食者対応力
機能
Pathway
複合体
Pathway
複合体
複合体
複合体
Protein Protein Protein Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
次々と決定されている
ゲノム配列からほぼ決定できる
逆
遺
伝
学
ヒトゲノムの一部
CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTAC
TCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCT
TACATTTGCTTCTGACACAACTGTGTTCACTAGCAAC
TCAAACAGACACCATGGTGCACCTGACACCTGAGGA
GAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAA
CGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGT
TGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAA
TAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTG
GGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGT
CTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCT
TGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTG
TCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGA
AGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTG
ATGGCCTG
11番染色体: ヘモグロビンβサブユニット
ゲノムプロジェクト
1996年 1998年
Yeast Nematode
# Genes
6,698
2000年
# Genes
20,176
2000年 2001年 2002年 2004年
Fly
14,141
Human Mouse
Rat
21,416 23,117 22,593
2004年 2006年 2007年 2008年 2012年
Arabidopsis
Rice
27,025
30,535
Popula Grape
Lotus
45,555 35,434 29,035
Tomato
35,000
20000~30000の遺伝子で生物が作られている
# Gene: Protein-coding genes in Ensembl release 53
Icon: LSDB icon
Vertebrate Genomes in Ensembl DB
2015-11-08
DNA配列解読速度の爆発的上昇
パソコンの進歩よりも遥かに速い速度で発展している
http://www.ncbi.nlm.nih.gov/pubmed/19360079
機能モジュールをどう推定するか?
表現型
増殖速度
捕食者対応力
機能
Pathway
?
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
もくじ
情報処理システム
細胞システムの解明へ
遺伝子ネットワーク
システムの進化
代謝ネットワーク
H
ADH
ALDH
H
エタノール
アセトアルデヒド
酢酸
細胞情報を担う3タイプの分子
設計図
DNA
伝令
RNA
機能の実体
タンパク質
出典: Molecular Biology of THE CELL 5th
アルコール代謝遺伝子の発現パターン
ADH1B
ALDH2
肝臓で発現している
NCBI GEO: GSE2361
活動量データから友人関係を推定できる
東京大学
情報理工学研究科
下坂研究室
http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/
一次代謝系,二次代謝系とも共発現する
グルコース6P
PGI
PFK
BCAT4
FBA
MAM1
TIM
CYP79F1
GAPC
REF2
PGK
SUR1
iPGAM
UGT74B1
ENO
PK
ピルビン酸
MR < 30
メチオニン
SOT17
グルコシノレート
長い生合成経路
PPOX
LIN2
HEME
HEMC
HEMB
HEML
HEMA
グルタミン酸
Protoporphyrin IX
GUN5
CHLM
CHLD
CHLI
CRD1
PORC
全般的に共発現しているが
調節の鍵遺伝子がある
MR < 50
CHLG
クロロフィル a
基質の供給経路が複数ある場合
メバロン酸経路
非メバロン酸経路
アセチルCoA
ピルビン酸
DXPS1
DXR
ISPD
CDPMEK
ISPF
HDS
HDR
ACAT2
MVA1
HMG
MK
MVD
IPP
IPP
FPS1
SQS1
スクアレン
MR < 100
共発現はパスウェイ間の繋がりを表す
複数の代謝系の関係性
C4H
AS
TRP1
トリプトファン
PAI
IGPS
TS
PAL
PSP
ADT
PSAT
DHS
DQS
MEE32
SK
EPSPS
EMB1144
コリスミ酸
MEE17
PGDH
PEP
CM
E4P
3PG
クマロイルCoA
共通経路はどちらのパスウェイとも共発現している
MR < 30
4CL
遺伝子間関係の評価
本当に関係しているのか?
再現性
比較する共発現の質
システムノイズの問題
既知機能と無矛盾
生物種特異的
ゲノム配列と無矛盾
ゲノム情報の複雑さ
既知機能の限界
DHCR7と共発現する遺伝子(ヒト)
共発現が他種でサポートされない例
もくじ
情報処理システム
細胞システムの解明へ
遺伝子ネットワーク
システムの進化
システム進化の研究に向けて
システム動態
システム構造
ゲノム理解
ゲノム配列
ACGTACGATC
GTACAGCTAG
CTAGCTCAGC
ACGTACGATC
GTACAGCTAG
CTAGCTCAGC
ACGTACGATC
GTACAGCTAG
CTAGCTCAGC
階層構造の推定
表現型
増殖速度
捕食者対応力
機能
?
Pathway
複合体
複合体
Pathway
複合体
複合体
Protein Protein Protein Protein Protein Protein Protein
遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子
ゲノム配列
Okamura et al (PLoS One 2015)
Lineage-Specific Coexpression
Monocot plants
Dicot plants
Cellulose
Synthase 6
Dicot
5578 4854
9 306
1176 1776 107 75
Monocot
Dicot
Monocot
127 106 3595 3957
23 69 5487 3049
Substrate
Xylan
Arabinan
Glycoside
Hydrolase 3
Monocot
16
12
101 42
Dicot
97 305
30 28
Dicot
Monocot
16 11407 9476
9
15 300 5565 3459
Glycoside
Hydrolase 9
Substrate
Glucan
Cellulose
Dicot
1980 3509 201 320
Monocot
8529 14523
Unknown
Protein
7
1179
Coex Platforms
Monocot
Osa-m
Zma-m Ath-m Gma-m
Osa-r
Zma-r Ath-r Gma-r
Gene co-expression is evolving to acquire lineage-specific
cellular functions.
Aoki et al (PCP 2016)
Dicot
Gene Coexpression Databases
Animals
Plants
http://coxpresdb.jp
http://atted.jp
Medical
Food
Environmental
Algae
http://alcodb.jp
Biofuel
Users of ATTED-II, COXPRESdb
Country
Yearly citation
(Session)
125
75
100
50
25
0
Y2007
Based on Google Analytics
Y2014
まとめ
情報処理システムとしての生物
細胞システムの解明に向けて
遺伝子ネットワーク
システムの進化
Fly UP