...

祖先

by user

on
Category: Documents
81

views

Report

Comments

Description

Transcript

祖先
MEGA5とPerlを用いた
分子進化解析の基礎
野澤 昌文
2012年1月16日
基礎生物学研究所・ハンズオンセミナー
1
分子進化研究における一般的手法
相同な配列の比較
塩基配列
配列名
A
B
C
塩基配列
A T G G T A C A C
A T G A T A C A C
A T G G T A C A T
アミノ酸配列
配列名
A
B
C
アミノ酸配列
Met
Val
His
Met
Ile
His
Met
Val
His
塩基/アミノ酸置換に関する膨大な研究データ
• 分子時計
• 中立説
• 分子系統樹
• 正の自然選択
2
今日の内容
MEGA5 1.配列の取得
2.配列のアラインメント
3.系統樹の作成
4.分岐年代の推定
5.進化速度、選択圧の推定
6.祖先配列の推定
Perl(時間があれば、たぶん無理)
1.配列の一括アラインメント
2.進化速度、選択圧の一括推定
3
第一部
MEGA5の基本的な使い方
今日のスライド
http://www.geocities.jp/nozabey/nozawa_handson120116.pdf
デスクトップにハンズオンというフォルダを作成して、そこに保存
4
配列の取得1
1
2
3
5
配列の取得1
4
5
「alcohol dehydrogenase adh drosophila」でサーチ
6
配列の取得1
6
7
8 CDSをクリックし、GenBankを選択
7
配列の取得1
9
10
11
配列がAlignment Explorer
に貼り付けられたはず
MEGA explorerを閉じる
「dmel adh」でOK
8
配列の取得2:BLAST検索
12
13
Nucleotide collection (nr/nt)を選択
14
9
配列の取得2:BLAST検索
15
Drosophila sechellia alcohol dehydrogenase
(Dsec¥Adh), mRNAを別窓で開く
10
配列の取得2:BLAST検索
16
先ほどと同様にしてAlignment Explorerに配列を追加
17 更に
Drosophila simulans alcohol dehydrogenase (dsim adh)
Drosophila yakuba alcohol dehydrogenase (dyak adh)
Drosophila erecta alcohol dehydrogenase (dere adh)
Drosophila ananassae alcohol dehydrogenase (dana adh)
Drosophila persimilis alcohol dehydrogenase (dper adh)
Drosophila pseudoobscura alcohol dehydrogenase (dpse adh)
の配列を追加してみましょう
11
配列の取得2:BLAST検索
18
8本の配列がAlignment Explorerに入ったはず
注:Macをご使用の方はMEGA browserが上手く作動しない可能
性があります。その場合は、
https://box.yahoo.co.jp/guest/viewer?sid=box-lx2uhocp3b67rak3cmz4evd5xbe-1001&uniqid=56a32e11-7c9b4bfb-a428-b9de9bb90cde&viewtype=detailにアクセスし、Adh.fas
をダウンロードしてください。そのファイルをAlignment Explorerで
開けば、8本のAdh配列が入ったファイルが表示されるはずです。
12
配列のアラインメント
19
20
22
21
13
配列のアラインメント
23
開始コドンの位置を手動で変更する
24
14
配列のアラインメント
25
Adh.masで保存する
(保存先はデスクトップ¥ハンズオン)
26
Adh.megで保存する
(保存先は先ほどと同じに)
27
タイトルはAdhでOK
15
配列のアラインメント
28
29
Adh.fasで保存する
30
16
系統樹の作成
31
先ほど保存した
Adh.megを開く
32
近隣結合系統樹を書いてみる
17
系統樹の作成
33
34
18
系統樹の作成
35
近隣結合系統樹ができた!
36
Adh.mtsで保存
19
系統樹の編集:コンデンス系統樹
37
39
38
70%にセットしてOK
70%コンデンス系統樹ができた!
20
系統樹の編集:Legendの自動生成
40
41
Legendが自動的に
作成された!
21
分岐年代の推定
44
コンデンス系統樹を解
除してオリジナル系統
樹を表示
45
Compute linearized tree
をクリック
22
分岐年代の推定
46
Linearized系統樹ができた
47
dmel adhとdsim adhの
分岐点を右クリックし、
Divergence Timeを選択
dmel-dsimの分岐年代が既知である
とする
23
分岐年代の推定
48
Divergence Time: 5.4
Time Label: mya
と入力
*基準となる分岐年代
が必要
49
分岐年代が表示された!
24
進化速度、選択圧の推定
dS :アミノ酸置換を伴わない塩基置換率
自然選択の対象にならない(中立進化)
dN :アミノ酸置換を伴う塩基置換率
自然選択の対象となる可能性がある
dN/dS < 1
dN/dS = 1
dN/dS > 1
負の自然選択
中立進化
正の自然選択
機能遺伝子
偽遺伝子
機能遺伝子(適応)
25
進化速度、選択圧の推定
配列1
配列2
配列3
26
進化速度、選択圧の推定
50
51
好きな形式で保存
27
進化速度、選択圧の推定
52
53
非同義置換率
を推定する
28
進化速度、選択圧の推定
54
好きな形式で保存
55
例えばXLを押すとエ
クセルファイルで結果
が表示される
29
進化速度、選択圧の推定
56 同様にして同義置換率も推定してみましょう
57
好きな形式で保存
先ほどの非同義置換率と比較する
30
進化速度、選択圧の推定
58 正の自然選択が働いているか統計的にテストする
59
Positive selection,
Nei-Gojobori
(Jukes-Cantor)
を選択し
Compute
31
進化速度、選択圧の推定
60
統計量
P-value
この遺伝子に正の自然選択は働いていないようである
32
進化速度、選択圧の推定
祖先
dN/dS < 1
dN/dS =< 1
配列1
配列2
dN/dS < 1
系統樹ベースで解析すると良い
33
進化速度の推定:系統樹ベース
61
62
非同義置換で速度
を推定
63
34
進化速度の推定:系統樹ベース
64
ドラッグ&ドロップで枝を移動させる
35
進化速度の推定:系統樹ベース
65
dana adh
dsim adh
dsec adh
dmel adh
dyak adh
dere adh
dpse adh
dper adh
最終的にこの樹形にする
36
進化速度の推定:系統樹ベース
66
67
Adh.nwkで保存
37
進化速度の推定:系統樹ベース
68
69
70
指定した樹形で系
統樹が作成された
38
進化速度の推定:系統樹ベース
71
72
39
進化速度の推定:系統樹ベース
73
各枝に非同義置換率が
表示された
74
75
樹形だけが表示され、
見やすくなった
40
進化速度の推定:系統樹ベース
76 同様にして同義置換率も推定してみましょう
77
先ほどのdNと比較して比を求め、選択圧を調べる
41
祖先配列の推定
88
99
69
97
dsec adh
dsim adh
dmel adh
dyak adh
dere adh
dana adh
dper adh
100
dpse adh
0.02
祖先配列を推定できれば、配列の進化的変遷や、
機能的変遷を知ることができる
42
祖先配列の推定
78 最尤法で祖先配列を推定する
79
Use tree from file
を選択し、先ほど保存した
Adh.nwkを選択
43
祖先配列の推定
80 1番目の塩基の祖先塩基 81 祖先配列の出力
が表示された
矢印の数字を変えるとその塩基の祖先塩基
が表示される
44
祖先配列の推定
82 エクセルファイルで表示してみる
83
祖先配列がエクセルで表示された
45
第二部
Perlを用いた一括分子進化解析の基礎
46
多数の遺伝子(ファイル)を
解析したい
例えば1000個の遺伝子座
MEGA5で「ちまちまと」解析していたのでは
時間がいくらあっても足りない
Perl等でスクリプトを自作する必要あり
47
Muscleを用いた一括アラインメント
84 http://www.geocities/
86 http://www.geocities/nozabe
nozabey/nuc.zip
にアクセスし、ファイ
ルをダウンロード、解
凍
y/scripts.zip
にアクセスし、ファイルをダウ
ンロード、解凍
85
87
• nucフォルダをCドライブの
直下に移動する
• aminoフォルダ、amino_aln
フォルダ、nuc_alnフォルダ、
nuc_disフォルダ、batフォルダ
をCドライブの直下に作成する
• 解凍したPerlスクリプトをCドライブ
の直下に移動する
48
Muscleを用いた一括アラインメント
88 塩基配列をアミノ酸配列に翻訳 89 コマンドプロンプトを起動
translation.plをテキストエディタ
(メモ帳等)で開いて確認
90 cd C:/scripts とタイプする
91 perl translation.pl とタイプ
92
必要に応じて変更
aminoフォルダ内に10個のファイルができる
49
Muscleを用いた一括アラインメント
93 Muscleを用いたアミノ酸配列のアラインメント
make_batch_muscle.plをテキストエディタで開いて確認
必要に応じて変更
94
perl make_batch_muscle.pl とタイプ
50
Muscleを用いた一括アラインメント
95 batフォルダ内にmuscle.batファイルができる
96 Muscleのフォルダに移動
例)cd C:/Program Files (x86)/muscle
97 muscle.batとタイプする(数分待つ)
98 amino_alnフォルダに10個のアラインメントファイルができる
51
Muscleを用いた一括アラインメント
99 アミノ酸配列のアラインメントを塩基配列に反映させる
make_batch_aln_dna_aa.plをテキストエディタで開いて確認
必要に応じて変更
100 cd C:/scripts とタイプする
101 perl make_batch_aln_dna_aa.pl とタイプ
102 batフォルダ内にaln_dna_aa.batファイルができる
52
Muscleを用いた一括アラインメント
103 aln_dna_aa.batをC:/scriptsに移動
104
aln_dna_aa.batとタイプする
105 nuc_alnフォルダに10個のアラインメントファイルができる
53
Perlを用いた一括進化速度推定
106 make_batch_dS_dN.plをテキストエディタで開いて確認
必要に応じて変更
107 perl make_batch_dS_dN.pl とタイプ
108 batフォルダ内にdS_dN.batファイルができる
54
Perlを用いた一括進化速度推定
109 dS_dN.batをC:/scriptsに移動
110 dS_dN.batとタイプする(数分待つ)
111 nuc_disフォルダに10個のファイルができるはず
112 1.outをテキストエディタで開いてみる
55
Perlを用いた一括進化速度推定
113
start:各ウィンドウの最初のコドンの番号
end:各ウィンドウの最後のコドンの番号
S:同義座位の数
N:非同義座位の数
s:同義置換の数
pN/pSもしくはdN/dSを計算することで各遺
n:非同義置換の数
伝子ペアにかかる選択圧を推定できる
pS:同義置換率(s/S)
pN:非同義置換率(n/N)
dS:JC法による補正後の同義置換率
dN:JC法による補正後の非同義置換率
56
詳細は
今日のスライド
http://www.geocities.jp/nozabey/nozawa_handson120116.pdf
私のウェブサイト
http://www.geocities.jp/nozabey/programs.html
MEGAチュートリアル(開発者田村博士作成)
http://evolgen.biol.se.tmu.ac.jp/MEGA/
57
Fly UP