Comments
Description
Transcript
Protein Protein Protein
情報処理装置「生命」の 設計図を読み解く 大林武 (東北大・情報) [email protected] 自己紹介(大林武) 11年 東工大・生命 (千葉大・薬) 生物学 4年 7年 東大・医科研 東北大・情報 バイオ インフォ マティクス 情報科学 Bioinformatics / Computational Biology Biology Informatics Bioinformatics Computational Biology Biology Chemistry Biochemistry Chemical Biology もくじ 情報処理システム 細胞システムの解明へ 遺伝子ネットワーク システムの進化 情報処理システム Software 入力 111010001001 変換器 出力 CPU / GPU / FPGA 制御装置 / 演算装置 / レジスタ NANDゲート, NORゲート トランジスタ 半導体 000000111101 目的 利用者のニーズ 様々な 原子 細胞システム 入力 Pathway グルコース濃度が上昇 変換器 タンパク質複合体 Genome タンパク質(遺伝子) タンパク質ドメイン 出力 タンブリングの抑制 目的 子孫繁栄 変動環境での アミノ酸 原子 遺伝子型と表現型の関係性 表現型 増殖速度 捕食者対応力 機能 Pathway 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 システムの複製 表現型 増殖速度 捕食者対応力 増殖速度 捕食者対応力 Pathway Pathway 機能 複合体 Pathway 複合体 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 ゲノムのコピー 変化するゲノム 表現型 増殖速度 捕食者対応力 増殖速度 捕食者対応力 Pathway Pathway 機能 複合体 Pathway 複合体 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 ゲノムの変化 もくじ 情報処理システム 細胞システムの解明へ 遺伝子ネットワーク システムの進化 細胞システムの研究アプローチ 表現型 遺 伝 学 増殖速度 捕食者対応力 機能 Pathway 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 逆 遺 伝 学 要素は決定できる 表現型 遺 伝 学 増殖速度 捕食者対応力 機能 Pathway 複合体 Pathway 複合体 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 次々と決定されている ゲノム配列からほぼ決定できる 逆 遺 伝 学 ヒトゲノムの一部 CCCTGTGGAGCCACACCCTAGGGTTGGCCAATCTAC TCCCAGGAGCAGGGAGGGCAGGAGCCATCTATTGCT TACATTTGCTTCTGACACAACTGTGTTCACTAGCAAC TCAAACAGACACCATGGTGCACCTGACACCTGAGGA GAAGTCTGCCGTTACTGCCCTGTGGGGCAAGGTGAA CGTGGATGAAGTTGGTGGTGAGGCCCTGGGCAGGT TGGTATCAAGGTTACAAGACAGGTTTAAGGAGACCAA TAGAAACTGGGCATGTGGAGACAGAGAAGACTCTTG GGTTTCAGATAGGCACTGACTCTCTCTGCCTATTGGT CTATTTTCCCACCCTTAGGCTGCTGGTGGTCTACCCT TGGACCCAGAGGTTCTTTGAGTCCTTTGGGGATCTG TCCACTCCTGATGCTGTTATGGGCAACCCTAAGGTGA AGGCTCATGGCAAGAAAGTGCTCGGTGCCTTTAGTG ATGGCCTG 11番染色体: ヘモグロビンβサブユニット ゲノムプロジェクト 1996年 1998年 Yeast Nematode # Genes 6,698 2000年 # Genes 20,176 2000年 2001年 2002年 2004年 Fly 14,141 Human Mouse Rat 21,416 23,117 22,593 2004年 2006年 2007年 2008年 2012年 Arabidopsis Rice 27,025 30,535 Popula Grape Lotus 45,555 35,434 29,035 Tomato 35,000 20000~30000の遺伝子で生物が作られている # Gene: Protein-coding genes in Ensembl release 53 Icon: LSDB icon Vertebrate Genomes in Ensembl DB 2015-11-08 DNA配列解読速度の爆発的上昇 パソコンの進歩よりも遥かに速い速度で発展している http://www.ncbi.nlm.nih.gov/pubmed/19360079 機能モジュールをどう推定するか? 表現型 増殖速度 捕食者対応力 機能 Pathway ? 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 もくじ 情報処理システム 細胞システムの解明へ 遺伝子ネットワーク システムの進化 代謝ネットワーク H ADH ALDH H エタノール アセトアルデヒド 酢酸 細胞情報を担う3タイプの分子 設計図 DNA 伝令 RNA 機能の実体 タンパク質 出典: Molecular Biology of THE CELL 5th アルコール代謝遺伝子の発現パターン ADH1B ALDH2 肝臓で発現している NCBI GEO: GSE2361 活動量データから友人関係を推定できる 東京大学 情報理工学研究科 下坂研究室 http://ics.t.u-tokyo.ac.jp/ja/スマート活動量計データからの人間関係可視化/ 一次代謝系,二次代謝系とも共発現する グルコース6P PGI PFK BCAT4 FBA MAM1 TIM CYP79F1 GAPC REF2 PGK SUR1 iPGAM UGT74B1 ENO PK ピルビン酸 MR < 30 メチオニン SOT17 グルコシノレート 長い生合成経路 PPOX LIN2 HEME HEMC HEMB HEML HEMA グルタミン酸 Protoporphyrin IX GUN5 CHLM CHLD CHLI CRD1 PORC 全般的に共発現しているが 調節の鍵遺伝子がある MR < 50 CHLG クロロフィル a 基質の供給経路が複数ある場合 メバロン酸経路 非メバロン酸経路 アセチルCoA ピルビン酸 DXPS1 DXR ISPD CDPMEK ISPF HDS HDR ACAT2 MVA1 HMG MK MVD IPP IPP FPS1 SQS1 スクアレン MR < 100 共発現はパスウェイ間の繋がりを表す 複数の代謝系の関係性 C4H AS TRP1 トリプトファン PAI IGPS TS PAL PSP ADT PSAT DHS DQS MEE32 SK EPSPS EMB1144 コリスミ酸 MEE17 PGDH PEP CM E4P 3PG クマロイルCoA 共通経路はどちらのパスウェイとも共発現している MR < 30 4CL 遺伝子間関係の評価 本当に関係しているのか? 再現性 比較する共発現の質 システムノイズの問題 既知機能と無矛盾 生物種特異的 ゲノム配列と無矛盾 ゲノム情報の複雑さ 既知機能の限界 DHCR7と共発現する遺伝子(ヒト) 共発現が他種でサポートされない例 もくじ 情報処理システム 細胞システムの解明へ 遺伝子ネットワーク システムの進化 システム進化の研究に向けて システム動態 システム構造 ゲノム理解 ゲノム配列 ACGTACGATC GTACAGCTAG CTAGCTCAGC ACGTACGATC GTACAGCTAG CTAGCTCAGC ACGTACGATC GTACAGCTAG CTAGCTCAGC 階層構造の推定 表現型 増殖速度 捕食者対応力 機能 ? Pathway 複合体 複合体 Pathway 複合体 複合体 Protein Protein Protein Protein Protein Protein Protein 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 遺伝子 ゲノム配列 Okamura et al (PLoS One 2015) Lineage-Specific Coexpression Monocot plants Dicot plants Cellulose Synthase 6 Dicot 5578 4854 9 306 1176 1776 107 75 Monocot Dicot Monocot 127 106 3595 3957 23 69 5487 3049 Substrate Xylan Arabinan Glycoside Hydrolase 3 Monocot 16 12 101 42 Dicot 97 305 30 28 Dicot Monocot 16 11407 9476 9 15 300 5565 3459 Glycoside Hydrolase 9 Substrate Glucan Cellulose Dicot 1980 3509 201 320 Monocot 8529 14523 Unknown Protein 7 1179 Coex Platforms Monocot Osa-m Zma-m Ath-m Gma-m Osa-r Zma-r Ath-r Gma-r Gene co-expression is evolving to acquire lineage-specific cellular functions. Aoki et al (PCP 2016) Dicot Gene Coexpression Databases Animals Plants http://coxpresdb.jp http://atted.jp Medical Food Environmental Algae http://alcodb.jp Biofuel Users of ATTED-II, COXPRESdb Country Yearly citation (Session) 125 75 100 50 25 0 Y2007 Based on Google Analytics Y2014 まとめ 情報処理システムとしての生物 細胞システムの解明に向けて 遺伝子ネットワーク システムの進化