Comments
Description
Transcript
祖先
MEGA5とPerlを用いた 分子進化解析の基礎 野澤 昌文 2012年1月16日 基礎生物学研究所・ハンズオンセミナー 1 分子進化研究における一般的手法 相同な配列の比較 塩基配列 配列名 A B C 塩基配列 A T G G T A C A C A T G A T A C A C A T G G T A C A T アミノ酸配列 配列名 A B C アミノ酸配列 Met Val His Met Ile His Met Val His 塩基/アミノ酸置換に関する膨大な研究データ • 分子時計 • 中立説 • 分子系統樹 • 正の自然選択 2 今日の内容 MEGA5 1.配列の取得 2.配列のアラインメント 3.系統樹の作成 4.分岐年代の推定 5.進化速度、選択圧の推定 6.祖先配列の推定 Perl(時間があれば、たぶん無理) 1.配列の一括アラインメント 2.進化速度、選択圧の一括推定 3 第一部 MEGA5の基本的な使い方 今日のスライド http://www.geocities.jp/nozabey/nozawa_handson120116.pdf デスクトップにハンズオンというフォルダを作成して、そこに保存 4 配列の取得1 1 2 3 5 配列の取得1 4 5 「alcohol dehydrogenase adh drosophila」でサーチ 6 配列の取得1 6 7 8 CDSをクリックし、GenBankを選択 7 配列の取得1 9 10 11 配列がAlignment Explorer に貼り付けられたはず MEGA explorerを閉じる 「dmel adh」でOK 8 配列の取得2:BLAST検索 12 13 Nucleotide collection (nr/nt)を選択 14 9 配列の取得2:BLAST検索 15 Drosophila sechellia alcohol dehydrogenase (Dsec¥Adh), mRNAを別窓で開く 10 配列の取得2:BLAST検索 16 先ほどと同様にしてAlignment Explorerに配列を追加 17 更に Drosophila simulans alcohol dehydrogenase (dsim adh) Drosophila yakuba alcohol dehydrogenase (dyak adh) Drosophila erecta alcohol dehydrogenase (dere adh) Drosophila ananassae alcohol dehydrogenase (dana adh) Drosophila persimilis alcohol dehydrogenase (dper adh) Drosophila pseudoobscura alcohol dehydrogenase (dpse adh) の配列を追加してみましょう 11 配列の取得2:BLAST検索 18 8本の配列がAlignment Explorerに入ったはず 注:Macをご使用の方はMEGA browserが上手く作動しない可能 性があります。その場合は、 https://box.yahoo.co.jp/guest/viewer?sid=box-lx2uhocp3b67rak3cmz4evd5xbe-1001&uniqid=56a32e11-7c9b4bfb-a428-b9de9bb90cde&viewtype=detailにアクセスし、Adh.fas をダウンロードしてください。そのファイルをAlignment Explorerで 開けば、8本のAdh配列が入ったファイルが表示されるはずです。 12 配列のアラインメント 19 20 22 21 13 配列のアラインメント 23 開始コドンの位置を手動で変更する 24 14 配列のアラインメント 25 Adh.masで保存する (保存先はデスクトップ¥ハンズオン) 26 Adh.megで保存する (保存先は先ほどと同じに) 27 タイトルはAdhでOK 15 配列のアラインメント 28 29 Adh.fasで保存する 30 16 系統樹の作成 31 先ほど保存した Adh.megを開く 32 近隣結合系統樹を書いてみる 17 系統樹の作成 33 34 18 系統樹の作成 35 近隣結合系統樹ができた! 36 Adh.mtsで保存 19 系統樹の編集:コンデンス系統樹 37 39 38 70%にセットしてOK 70%コンデンス系統樹ができた! 20 系統樹の編集:Legendの自動生成 40 41 Legendが自動的に 作成された! 21 分岐年代の推定 44 コンデンス系統樹を解 除してオリジナル系統 樹を表示 45 Compute linearized tree をクリック 22 分岐年代の推定 46 Linearized系統樹ができた 47 dmel adhとdsim adhの 分岐点を右クリックし、 Divergence Timeを選択 dmel-dsimの分岐年代が既知である とする 23 分岐年代の推定 48 Divergence Time: 5.4 Time Label: mya と入力 *基準となる分岐年代 が必要 49 分岐年代が表示された! 24 進化速度、選択圧の推定 dS :アミノ酸置換を伴わない塩基置換率 自然選択の対象にならない(中立進化) dN :アミノ酸置換を伴う塩基置換率 自然選択の対象となる可能性がある dN/dS < 1 dN/dS = 1 dN/dS > 1 負の自然選択 中立進化 正の自然選択 機能遺伝子 偽遺伝子 機能遺伝子(適応) 25 進化速度、選択圧の推定 配列1 配列2 配列3 26 進化速度、選択圧の推定 50 51 好きな形式で保存 27 進化速度、選択圧の推定 52 53 非同義置換率 を推定する 28 進化速度、選択圧の推定 54 好きな形式で保存 55 例えばXLを押すとエ クセルファイルで結果 が表示される 29 進化速度、選択圧の推定 56 同様にして同義置換率も推定してみましょう 57 好きな形式で保存 先ほどの非同義置換率と比較する 30 進化速度、選択圧の推定 58 正の自然選択が働いているか統計的にテストする 59 Positive selection, Nei-Gojobori (Jukes-Cantor) を選択し Compute 31 進化速度、選択圧の推定 60 統計量 P-value この遺伝子に正の自然選択は働いていないようである 32 進化速度、選択圧の推定 祖先 dN/dS < 1 dN/dS =< 1 配列1 配列2 dN/dS < 1 系統樹ベースで解析すると良い 33 進化速度の推定:系統樹ベース 61 62 非同義置換で速度 を推定 63 34 進化速度の推定:系統樹ベース 64 ドラッグ&ドロップで枝を移動させる 35 進化速度の推定:系統樹ベース 65 dana adh dsim adh dsec adh dmel adh dyak adh dere adh dpse adh dper adh 最終的にこの樹形にする 36 進化速度の推定:系統樹ベース 66 67 Adh.nwkで保存 37 進化速度の推定:系統樹ベース 68 69 70 指定した樹形で系 統樹が作成された 38 進化速度の推定:系統樹ベース 71 72 39 進化速度の推定:系統樹ベース 73 各枝に非同義置換率が 表示された 74 75 樹形だけが表示され、 見やすくなった 40 進化速度の推定:系統樹ベース 76 同様にして同義置換率も推定してみましょう 77 先ほどのdNと比較して比を求め、選択圧を調べる 41 祖先配列の推定 88 99 69 97 dsec adh dsim adh dmel adh dyak adh dere adh dana adh dper adh 100 dpse adh 0.02 祖先配列を推定できれば、配列の進化的変遷や、 機能的変遷を知ることができる 42 祖先配列の推定 78 最尤法で祖先配列を推定する 79 Use tree from file を選択し、先ほど保存した Adh.nwkを選択 43 祖先配列の推定 80 1番目の塩基の祖先塩基 81 祖先配列の出力 が表示された 矢印の数字を変えるとその塩基の祖先塩基 が表示される 44 祖先配列の推定 82 エクセルファイルで表示してみる 83 祖先配列がエクセルで表示された 45 第二部 Perlを用いた一括分子進化解析の基礎 46 多数の遺伝子(ファイル)を 解析したい 例えば1000個の遺伝子座 MEGA5で「ちまちまと」解析していたのでは 時間がいくらあっても足りない Perl等でスクリプトを自作する必要あり 47 Muscleを用いた一括アラインメント 84 http://www.geocities/ 86 http://www.geocities/nozabe nozabey/nuc.zip にアクセスし、ファイ ルをダウンロード、解 凍 y/scripts.zip にアクセスし、ファイルをダウ ンロード、解凍 85 87 • nucフォルダをCドライブの 直下に移動する • aminoフォルダ、amino_aln フォルダ、nuc_alnフォルダ、 nuc_disフォルダ、batフォルダ をCドライブの直下に作成する • 解凍したPerlスクリプトをCドライブ の直下に移動する 48 Muscleを用いた一括アラインメント 88 塩基配列をアミノ酸配列に翻訳 89 コマンドプロンプトを起動 translation.plをテキストエディタ (メモ帳等)で開いて確認 90 cd C:/scripts とタイプする 91 perl translation.pl とタイプ 92 必要に応じて変更 aminoフォルダ内に10個のファイルができる 49 Muscleを用いた一括アラインメント 93 Muscleを用いたアミノ酸配列のアラインメント make_batch_muscle.plをテキストエディタで開いて確認 必要に応じて変更 94 perl make_batch_muscle.pl とタイプ 50 Muscleを用いた一括アラインメント 95 batフォルダ内にmuscle.batファイルができる 96 Muscleのフォルダに移動 例)cd C:/Program Files (x86)/muscle 97 muscle.batとタイプする(数分待つ) 98 amino_alnフォルダに10個のアラインメントファイルができる 51 Muscleを用いた一括アラインメント 99 アミノ酸配列のアラインメントを塩基配列に反映させる make_batch_aln_dna_aa.plをテキストエディタで開いて確認 必要に応じて変更 100 cd C:/scripts とタイプする 101 perl make_batch_aln_dna_aa.pl とタイプ 102 batフォルダ内にaln_dna_aa.batファイルができる 52 Muscleを用いた一括アラインメント 103 aln_dna_aa.batをC:/scriptsに移動 104 aln_dna_aa.batとタイプする 105 nuc_alnフォルダに10個のアラインメントファイルができる 53 Perlを用いた一括進化速度推定 106 make_batch_dS_dN.plをテキストエディタで開いて確認 必要に応じて変更 107 perl make_batch_dS_dN.pl とタイプ 108 batフォルダ内にdS_dN.batファイルができる 54 Perlを用いた一括進化速度推定 109 dS_dN.batをC:/scriptsに移動 110 dS_dN.batとタイプする(数分待つ) 111 nuc_disフォルダに10個のファイルができるはず 112 1.outをテキストエディタで開いてみる 55 Perlを用いた一括進化速度推定 113 start:各ウィンドウの最初のコドンの番号 end:各ウィンドウの最後のコドンの番号 S:同義座位の数 N:非同義座位の数 s:同義置換の数 pN/pSもしくはdN/dSを計算することで各遺 n:非同義置換の数 伝子ペアにかかる選択圧を推定できる pS:同義置換率(s/S) pN:非同義置換率(n/N) dS:JC法による補正後の同義置換率 dN:JC法による補正後の非同義置換率 56 詳細は 今日のスライド http://www.geocities.jp/nozabey/nozawa_handson120116.pdf 私のウェブサイト http://www.geocities.jp/nozabey/programs.html MEGAチュートリアル(開発者田村博士作成) http://evolgen.biol.se.tmu.ac.jp/MEGA/ 57