...

蛋白質核酸酵素:ヒトゲノム完成版の解析

by user

on
Category: Documents
12

views

Report

Comments

Transcript

蛋白質核酸酵素:ヒトゲノム完成版の解析
ゲノム情報
ヒトゲノム完成版の解析
服部正平
国 際 ヒ トゲ ノム 解 読 コン ソ ー シ ア ム は,ヒ トゲ ノム 完 成 版 の 詳 細 な解 析 をNature誌2004年10
月21日
号 に発 表 した.そ の な か で2001年
定 され た ヒ ト遺 伝 子 数 が 約2.2万
に 発表 さ れ た概 要 版 の論 文 と 大 き く異 な る 点 は,確
個 で,概 要 版 の と き よ りも1万
あ る.こ の 違 い の 理 由 と して は,配 列 の 高 精 度 化,cDNA情
Database Center for Life Science Online Service
に よ る 遺 伝 子 発 見 技 術 の 蓄 積,な
個 も少 な くな って い る こ と で
報 の 充 実,他 生 物 種 の ゲ ノ ム 解 析
どが あ げ られ る.今 回 の 結 果 か ら,フ グ か ら ヒ トに 至 る 脊 椎
動 物 の 遺 伝 子 数 は ほ ぼ 同 じと な り,遺 伝 子 数 よ りも,そ の わ ず か な機 能 と組 合 せ の違 い が 生 物
種 の 違 い に関 係 す る こ と が 示 唆 さ れ る.
Key words
ヒ トゲノム
ゲ ノム
遺伝 子
塩基 配列
は じめ に
時 点 で残 っ て い た 領 域 の 解 読,決 定 した 配 列 の 最 終 的 な
ヒ トの全 遺 伝 情 報 の解 読 を め ざす 「国 際 ヒ トゲ ノ ム 計
画 」 は,日
・米 ・英 な ど6力 国18研
究 機 関か らな る 国
際 ヒ トゲ ノ ム 解 読 コ ン ソー シ ア ム(以 下,国 際 チ ー ム)に
よ り1991年
に 正 式 に 開始 さ れ,2001年2月,ヒ
ム概 要 版 の解 析 結 果 をNature誌
版 で は,ヒ
DNA
トゲ ノ
に 報 告 した1).こ の概 要
精 査,遺
年10月
伝 子 発 見 な ど の完 成 版 の 解 析 作 業 を 進 め,2004
にそ の 結 果 をNature誌
本 稿 で は,ヒ
に 発 表 した の で あ る2).
トゲ ノ ム完 成 版 に至 る まで の経 過 お よ び
発 表 さ れ た 解 析 結 果 の 一 部 に つ い て解 説 す る.な お,ヒ
トゲ ノ ム解 読 に 関 す る読 み物 と総 説 をあ げ て お く3∼5).
トゲ ノ ム の ユ ー ク ロ マ チ ン領 域*1の 約90%
を解 読 し,そ の解 析 か ら ヒ ト遺 伝 子 の 総 数 が3∼4万
個
I.概 要版 か ら完 成 版 へ
で あ る こ とな ど,わ れ わ れ 自 身 の 生 命 の設 計 図 の お お ま
か な 全 体 像 が初 め て 明 らか に な っ た.し
は ゲ ノ ム全 体 の 約10%に
か し,概 要 版 に
相 当 す る15万
概 要 版 の 解 読 は,米
国企 業 セ レ ラ社 に よ る1998年
の
カ所 の 未 決 定
ホ ー ル ゲ ノ ム シ ョ ッ トガ ン法 を 用 い た ヒ トゲ ノ ム 単 独 解
領 域(ギ ャ ッ プ)や 精 度 が 低 い 領 域 な ど,精 査 す べ き箇 所
読 計 画 に対 して 考 え 出 され た,国 際 チ ー ム の 対 抗 戦 略 で
が 多 く含 ま れ て お り,目 標 と した 完 成 版 の 定 義 で あ る ユ
あ っ た.解 読 開 始 当初 は 国際 チ ー ム に は概 要 版 とい う考
ー ク ロ マ チ ン領 域 の95%以
え 方 は な く,染 色 体 ご との 完 成 版(階 層 式 シ ョ ッ トガ ン
上 の 解 読 お よ び99 .99%以
上 の デ ー タ精 度 に は ほ ど遠 い 結 果 で あ っ た.そ の た め,
法)を 積 み 上 げ て い き,2005年
に ヒ トゲ ノ ム の全 解 読 を
国 際 チ ー ム は概 要 版 の 発 表 後 も完 成 版 を め ざ して さ らな
完 了 す る計 画 を立 て て い た.し
か し,セ
る解 読 を続 け て い た.2003年
解 読 計 画 に よ っ て,国
初 頭 に全 染色 体 の解 読 が
完 成 版 の 定 義 に 到 達 した こ と に よ り,そ の4月
に完 成 版
の 解 読 完 了 が 発 表 され た.そ の の ち 国 際 チ ー ム は,そ の
Masahira
Hattori,北
里 大 学 北 里 生 命 科 学 研 究 所
ゲ ノ ム 構 造 情 報 研 究 グ ル ー プ
Finishing
162
the
蛋白質 核酸
euchromatic
酵素
Vol.50
of the
No.2(2005)
human
genome
際 チ ー ム は急 き ょ概 要 版 を2000
ま で に 解 読 す る 計 画 を 設 定 し,さ
2003年 に 完 了 す る 方 針 へ と変 更 した.一
創 薬 科 学 部 門 ゲ ノ ム 情 報 学 研 究 室/理
E-mail:[email protected]
sequence
年6月
http://genome
レ ラ社 の概 要 版
らに完 成 版 を
方 で,21番
染
化 学 研 究 所 ゲ ノ ム 科 学 総 合 研 究 セ ン タ ー
.ls.kitasato-u.ac.jp/index_j.html
図1
ヒ トゲ ノ ム の 解 読 戦 略
国 際 チー ム が と っ た階 層 式 シ ョッ トガ ン
法 と,セ レラ 社 が と った ホ ール ゲ ノム シ
ョ ッ トガ ン法 を示 す.階 層 式 シ ョッ トガ
ン 法 は,位 置 マ ー カ ー を 指 標 に し た
BACク
ロ ー ン の染 色 体 へ の 位 置 決 定 と
ゲ ノ ム歩 行 によ る整 列 化 を 行 な い,つ い
で各BACク
ロ ー ン(約200kb)を
単位 と
した シ ョッ トガ ン シー クエ ン シ ング を く
り返 す戦 略 で あ る.こ の 戦 略 は,高 精度
の デ ー タ決 定,ま た,染 色 体 こ とや チ ー
ム別 での 解 読 を可 能 にす る.一 方,ホ ー
ル ゲ ノ ム シ ョ ッ トガ ン法 は,ゲ ノム を ま
ん べ んな く一 気 に シ ョッ トガ ン シー ク エ
ン シ ン グ す る 戦 略 で,BAGク
ロー ン 整
列化 な どの 中 間行 程 が な い.そ の た め,
ホ ール ゲ ノム シ ョッ トガ ン法 は ゲ ノム 全
体 を 高速 か つ お お まか に決 定 す るの に有
効 な戦 略で あ る が,得 られ た 配列 の 染 色
Database Center for Life Science Online Service
体 上 で の位 置 は 決 ま って お らず,の ち の
位 置 決定 や 高 精度 化 に時 間 が か かる.セ
レラ 社 は,国 際 チ ー ム な ど がDNAデ
ー
タ バ ン ク に公 開 した位 置 情 報 付 きの 配 列
デ ー タ を取 り入 れ て概 要 版 を 決 定 した.
な お,セ レ ラ社 は 概要 版 まで を ヒ トゲ ノ
ム 解 読 の 目標 と して いた.ヒ
トゲ ノム 解
読以降 のほかの 生物種 のゲ ノム解読 で
は,階 層 式 シ ョ ッ トガ ン法 と ホ ール ゲ ノ
ム シ ョッ トガ ン 法 が併 用 さ れ る よ う にな
り,解読 ス ピー ドと精 度 が 向上 して い る.
色 体 や22番
染 色 体 な ど は,概 要 版 発 表 の 前 に そ の 完 全
解 読 が ほ ぼ終 了 し て い た.そ
れ た 概 要 版 は,約70%が
の 結 果,2001年
概 要 版,30%が
な る デ ー タ と な っ た.図1に,ヒ
に発 表 さ
完成 版 か ら
トゲ ノ ム の解 読 戦 略 を
示 す.
上 の で き るか ぎ りの 解 読 が 行 な わ れ た.ま
シ ー ク エ ン シ ング した ク ロー ンの 再 編 成 の有 無 をチ ェ ッ
クす る作 業 も進 め られ た.結 局,こ
れ を 完 成 版 に す る た め,残
り半 分 の 追 加
さ らに1年 以 上 が 費 や され て,よ
れ らの厳 密 な デ ー タ
了 に よっ て ギ ャ ッ プ は250カ
ち が い の修 正,ギ
は約2,850Mb,精
ャ ッ プ を解 読 す る フ ィニ ッ シ ン グ作 業
が 進 め られ た6).そ の た め,概 要 版 の 約1年
完 成 版 に は 約3年
間 が 費 や され た.完
間 に対 して,
成 版 の解 読 完 了 が
発 表 さ れ た 時 点 で も,ギ ャ ッ プ を カ バ ー す る ク ロー ンの
うや く2004年10月
の
論 文 発 表 と な っ た の で あ る.最 終 的 に,完 成 版 の 解 読 完
シー ク エ ン シ ング と,概 要 版 に含 ま れ る配 列 や 位 置 の ま
*1
た 並 行 して,
精 度 の精 査 と論 文 作 成 の た め の遺 伝 子 発 見 の作 業 な どに
概 要 版 は 完 成 版 の 約 半 分 の サ ン プ ル 解 析 で得 られ る 配
列 デ ー タで,そ
単 離 と シー ク エ ン シ ング が 進 め られ て い て,数 値 目標 以
所 に減 少 し,決 定 し た領 域
度 も99.999%以
上 と な っ た.表1に,
完 成 版 発 表 に 至 る ま で の ヒ トゲ ノ ム 解 読 の 系 譜,表2
に,概 要 版 と完 成 版 の 違 い を ま とめ た.ま た,表3に
は,
完 成 版 に お け る 各 染 色 体 別 の 決 定 量 を示 した.
ユ ー クロ マ チ ン領域 とヘ テ ロ ク ロマ チ ン領 域:細 胞 が 細 胞 分 裂 間期 の と きに ほ ぐれ た状 態 を と っ て,遺 伝 子 発 現 が 活 発 な状 態 を と る
領 域 をユ ー ク ロマ チ ン領 域 とい い,中 期 染 色体 に み られ るDNAが
コ ンパ ク トに凝 集 した 状 態 が 問 期 にお い て も ほ ぐれ ず に保 た れ る
領 域 をヘ テ ロ ク ロマ チ ン領 域 とい う.ヘ テ ロ クロ マチ ン領 域 に は遺 伝 子 は存 在 しない と考 え られ て い る.
蛋 白質
核酸 酵素
Vol.50
No.2(2005)
163
表1
ヒ トゲ ノム 計画 と解析 技術 開 発 ・他ゲ ノム 解読 の系 譜
II.配 列 精 度の 精査
ヒ トゲ ノ ム解 読 で シ ー ク エ ン
シ ング され た ク ロ ー ン は合 計 約
6万 個 で,そ
の う ち4.6万 個 が
完 成 版 まで に シ ー クエ ン シ ン グ
さ れ た.重
複 度 が10以
上の シ
ョ ッ トガ ン デ ー タか ら得 られ た
完 成 版 の 各 塩 基 に は,コ ン ピ ュ
ー タ に よ る客 観 的 評 価 と して の
精 度 値*2が 付 与 さ れ て い る.
こ れ に加 え て,一 部 ク ロ ー ンの
再 シー クエ ンシ ングが 行 な わ
Database Center for Life Science Online Service
れ,非
常に厳密な精度評価が
な され た7).そ の 結 果,完
の 精 度 は99.999%以
成版
上 で あ り,
この 数 字 は 完 成 版 中 に わ ず か
1,100塩 基 程 度 の ま ち が い しか
な い こ と を示 して い る.
配 列 以 外 の精 度 につ い て も い
くつ か の 項 目が 精 査 さ れ た.そ
の ひ とつ は,大 腸 菌 中 で 起 こ る
クロー ン中の一部断片 の欠失や
反 転 な ど に よる 再 編 成 の 有 無,
す な わ ち,決
定 し た配 列 が 実 際
の ヒ トゲ ノ ム をそ の ま ま反 映 し
て い る か ど うか の チ ェ ッ クで あ
る.こ の よ うな 大 腸 菌 中 で 起 こ
り う るDNAの
再 編 成 はBAC
ラ イ ブ ラ リ ー 全 体 の 約5%に
存 在 す る と見 積 も ら れ て お り,
こ れ ら再 編 成 を起 こ した ク ロー
ンか ら 配 列 を 決 定 し な い た め
に,多
くの 重 複 ク ロ ー ン を単 離
して そ の フ ィ ンガ ー プ リ ン トを
チ ェ ッ クす る こ とが 前 もっ て 行
な わ れ た.し
か し,一 部 は 見 落
と さ れ,欠 失 や 反 転 が 完 成 版 に
ま ぎれ こん で い る.セ
レラ社 の
デ ー タ を も とに カ ナ ダ の グ ル ー
プが 完 成 した7番 染 色 体 の 配 列
164
蛋 白質
核酸 酵素
Vol.50
No.2(2005)
表2
ヒ トゲ ノ ム概要 版 と完成 版 の比 較
の ま ちが い な ど,い ず れ に よ る も の な の か は 明 らか で は
な い.し
か し最 近,ヒ
ト集 団 に は予 想 以 上 に大 き なサ イ
ズ の 増 幅 や 欠 失 な どの 多 型 が あ る こ とが 報 告 さ れ て い
る9).お そ ら く,両 デ ー タの 違 い は この よ う な 大 型 の 多
型 に よ る もの なの か も しれ な い.
決 定 した 配 列 に か くれ て い る 欠 失 を み つ け る た め,国
際 チ ー ム は約40kbの
イ ンサ ー トDNAを
もつ フ ォ ス ミ
ドク ロ ー ンの大 規 模 な マ ッ ピ ング を行 な っ た.こ
と 国 際 チ ー ム の デ ー タ と の 比 較 か ら,両
デ ー タのあ い
は,100万
だ に は 塩 基 の 違 い と 配 列 の 挿 入 が あ わ せ て0.75%(計
1.2Mb)も
あ る こ と や,相
る こ と な ど,大
相 違 が,異
同 性 の な い 個 所 が132カ
き な 違 い が み つ か っ て い る8).こ
な っ た ヒ トDNAに
Database Center for Life Science Online Service
る い は,配
個 程 度 の フ ォ ス ミ ドク ロ ー ン の 両 端 配 列 を 完
成 版 に貼 り付 け る も の で,両 端 配列 で は さ まれ た距 離 が
所 あ
統 計 上 短 くな っ て い る個 所 にか くれ た 欠 失 の 存 在 を推 定
れ らの
由 来 す る も の な の か,大
腸 菌 中 で の 再 編 成 の た め な の か,あ
し た(図2).こ
れ に よ っ て,242カ
み つ か っ た.こ
れ ら の個 所 のPCRな
そ の うち の 約2/3は
列編集 時
所 の欠 失領 域候 補 が
どに よ る解 析 か ら,
ヒ ト集 団 中 の挿 入/欠 失 の多 型(平 均
で 約6kb)で,残
表3
の作 業
ー ン化DNAの
染色 体別 ヒ トゲ ノム解 読状 況(Build35)
り1/3は
クロ
欠 失 ら しい こ と
が 判 明 した.欠 失 や 再 編 成 は チ
ンパ ンジ ー や マ ウ ス な ど の ゲ ノ
ム との 比 較 に よ っ て もみ つ け る
こ とが 可 能 で あ り,完 成 版 は今
後 も修 正 が 続 け ら れ る と考 え ら
れ る.一 方,個
々 の研 究 にお い
て は,上 記 した こ と に注 意 を は
らっ て 配 列 デ ー タ を利 用 す る必
要 が あ る.
も うひ とつ の 精 査 は,反 復 配
列 以 外 に 複 数 が存 在 す る 非 常 に
相 同性 の 高 い 配 列 の 位 置 の 確 認
で あ る.数+kb以
上 で そ の配
列 相 同性 が99%以
上 あ る領 域
が,と
くにセ ン トロ メ ア や テ ロ
メ ア 近 傍 に 頻 度 高 く存 在(ま
た,ユ
ー ク ロマ チ ン領 域 に も点
在)す る10).こ の 相 同 性 の 高 い
配 列 はsegmenta1
duplicati0n*3
また は相 同 組 換 え に よ っ て生 じ
た と考 え られ て い る.こ の 作 業
ヘ テ ロ ク ロマ チ ンギ ャ ップ は ,セ ン トロ メア,rRNA遺
*2塩
基 の 精 度 値:1998年
に 開 発 さ れ たPHRED/PHRAPプ
版 デ ー タ の 精 度 を 数 値 化 で き る よ う に な っ た.こ
で き る よ う に な り,統
は,わ ず か な 塩 基 の違 い を指 標
伝 子 ク ラス タ ー,短 腕 領 域 な ど も含 む
ロ グ ラ ム に よ っ て,シ
れ に よ っ て,日
ー ク エ ンサ ー か ら 産 生 さ れ る 各 配 列 デ ー タ お よ び 完 成
常 の デ ー タ品 質 管理 と各解 読 セ ン ター の 配 列 デ ー タを 客 観 的 に 評価
一 し た デ ー タ 精 度 で の 解 読 が 可 能 に な っ た.な
お,PHRAP値
が40で
精 度99.99%と
な り,こ
の値 以 上 で あ る
こ と が 完 成 版 の 目安 と な る.
蛋白質 核酸
酵素
Vol.50
No.2(2005)
165
III.遺 伝 子 の発 見
概 要 版 の 解 析 に よ っ て,ヒ
ゲ ノ ム に は 約3∼4万
ト
個 の遺 伝
子 が 存 在 す る と推 定 さ れ た.こ
の 数 字 は,ヒ
ト のcDNA配
列
や 蛋 白質 の ア ミノ酸 配 列 お よ び
他 生 物 種 の 遺 伝 子 デ ー タ と の相
同 性 検 索 お よ び コ ン ピ ュー タ予
測 か ら導 か れ た.セ
レ ラ社 独 自
の 解 析 も同 様 な数 字 を報 告 して
Database Center for Life Science Online Service
図2 BACク
い た が,国
フ ォ ス ミ ドク ロ ー ン を 用 い た 欠 失 領 域 の 検 出
ロー ンの よ うな 長 鎖DNAを
クロ ー ニ ン グ す る 系 で は,ま れ に大 腸 菌 中 で ク ロ ー ン 化 し
たDNAに
遺 伝 子 と一 致 した の は約 半 分 程
欠 失 が 起 こる こと が あ り,こ の よ うな クロ ー ン か ら得 られ る配 列 は 実 際 のゲ ノム 配 列
を反 映 しな い こ とに な る.そ の た め,約40kbの
で 比 較 的安 定 にク ロー ン化DNAを
度 で あ った.こ
均 一 な イ ン サ ー ト長 を も ち,シ ン グ ル コ ピ ー
か くれ て いる 欠 失 の検 出が 行 な われ た.フ ォス ミ ドクロ ー ンの 両 端 約500塩 基 の 配 列 を決 定 し,
精 度 の 高 い もの で な い こ と を示
唆 して い た.し か し,以 前 か ら
れ て 貼 り付 く.し か し,欠 失 が存 在 す る領 域 を カ バ ー す る フ
ォス ミ ドク ロー ン の 両端 は,平 均 よ りも 短 く,た とえ ば30kb離
の 違 い は,当 時
の 遺 伝 子 発 見 は 必 ず し も正 確 で
維 持 で き る フ ォス ミ ドベ クタ ー 系 を利 用 して,完 成 配 列 中 に
そ れ ら を完 成 配 列 に相 同 性 検 索 によ って 貼 り付 けた.こ の と き,完 成 配 列 に 欠失 が な け れ ば 各
ク ロー ン両 端 の 配 列 は約40kb離
際 チ ー ム の 同定 した
い わ れ て い た 遺 伝 子 数 約10万
れ て貼 り付 くこ と にな る.
個 が 下 方 修 正 され た こ とに つ い
に,手 作 業 に よ っ て 行 な わ れ た.す
ェ ック以 前 に,い
で に,完 成 版 で の チ
くつ か の ク ロー ンに つ い て は そ の 位 置
が 修 正 され て い る.
て の 見 解 は 一 致 した.
今 回 の 完 成 版 で は,配 列 が 高 精 度 に な っ た こ と,増 大
し たcDNA情
こ の相 同 性 の 高 い 配 列 は,概 要 版 に あ っ た多 くの ギ ャ
ップ の 原 因 に もな っ て い た.BACク
ロ ー ン整 列 化 の 行
報,マ
ウス な どの他生 物種 ゲ ノムの解 読
が 進 ん で ゲ ノ ム 問 で の 保 存 領 域 の特 定 が 可 能 に な っ た こ
と な どに よ り,よ
り多 角 的 で 正 確 な 遺 伝 子 発 見 を行 な う
程 で,高 い 相 同性 の た め 異 な っ た位 置 にあ る ク ロー ンを
こ とが で き た.ま た,概
ま ち が っ て つ な い で しま う.そ の た め,ギ
タ解 析 に加 え て これ を 手作 業 形 式 で 確 認 す る こ と も行 な
ャ ッ プの 反 対
側 の ク ロー ン とは い つ ま で た っ て もつ なが らな い 状 態 に
わ れ た.そ
な り,そ の結 果,み か け の ギ ャ ップ が 生 じる こ と に な る
落 と しや ま ち が い を 加 味 して2∼2.5万
(図3).み
と結 論 さ れ た(表4).ゲ
か け の ギ ャ ップ は,ゲ
ノム全体 の配列 が 明 ら
の 結 果,ヒ
要 版 で の 反 省 か ら,コ ン ピ ュ ー
か に な る に した が っ て修 正 さ れ た.最 終 的 に 残 っ た ギ ャ
応 し た ヒ トcDNA配
ップ250カ
の99.7%は
所 は 真 の ギ ャ ッ プ で,こ れ らに は 大 腸 菌 中 で
ト遺 伝 子 は 約2.2万 個,こ
不 安 定 な た め に ク ロ ー ニ ン グ で きな い 配 列 が 含 ま れ て い
る.こ
重 複 遺 伝 子 で あ る 可 能 性 が 高 い.残
ら数+kbも
長
cDNAは
く続 い た,数 塩 基 か ら な る単 純 く り返 し配 列 で あ る.
*3
segmental
duplication:数kb∼
数百kbの
大 きさで90∼100%の
所 に対
ー タ ベ ー ス)
ゲ ノ ム 配 列 と問 題 な く一 致 した.こ
の0.5%は2カ
の よ う な 配 列 の 多 くは,数kbか
個 の 範 囲 とな る
ノ ム 配 列 の 約17,500カ
列(RefSeqとMGCデ
れ に見
の うち
所 以 上 で 有 意 な 相 同 性 を示 し,こ れ ら は
り の 約0.3%の
ゲ ノ ム 配 列 に ま っ た く一 致 し な い(0.06%)か,
相 同性 を もつ 配列 が,染 色 体 内 また は 染 色 体 間 で 重 複 して い る こ と
が ヒ トゲ ノ ム概 要 版 の解 析 に よ り発 見 され た.こ れ らの 重複 配列 は,そ の相 同性 の 高 さか らご く最近 に起 こ った ゲ ノム 断 片 の重 複(segmental
duplication)に よっ て生 じた もの と考 え られ,事 実,チ
る.重 複 配列 の総 サ イ ズ は ヒ トゲ ノ ム全 体 の 約5%で,す
近 傍,ま た はY染
ンパ ンジー や ヒ トな どの 類 人 猿 の ゲ ノム に 特 徴 的 に み られ る構 造 で あ
べ ての ヒ ト染 色 体 に分 布 す る が,約80%は
セ ン トロメ ア 近 傍 や テ ロメ ア
色体 に集 中 して い る.重 複 は レ トロポ ゾ ンタ イ プの 反復 配列 とは 異 な っ た機 構 で起 こ っ て い る よ うだ が,そ の 詳細
は不 明 で あ る.大 部 分 の重 複 配 列 は遺 伝 子 を含 ん で い ない が,遺 伝 子 の 一 部や そ の全 体 を含 ん で重 複 す る場 合 もあ る.前 者 は偽 遺伝
子 の生 成 の 原 因 と な り,後 者 は新 しい機 能 を もっ た遺 伝 子創 成 の要 因に な る と考 え られ て い る.
166
蛋 白質
核酸
酵素
Vol.50
No.2(2005)
万 個 少 な くな った が,そ
の要 因
と して い くつ か の こ とが あ げ ら
れ る.そ
れ まで2つ
の遺 伝 子 と
み な され て い た 隣 接 した 遺 伝 子
が 実 は1つ
とや,別
の遺 伝 子 で あ っ た こ
の 染 色 体 にマ ップ され
て い た2つ の 遺 伝 子 で 一 方 が 偽
遺 伝 子 で あ る こ とが わ か っ た こ
と な どで あ る.と
くに,最 近 に
な って 生 じた 偽 遺 伝 子 が 原 因 に
多 くみ られ た.偽 遺 伝 子 に は,
る真 の ギ ャ ップ と,BACク
cDNAタ
ロー ン整 列 化 の 段 階 で あや ま った ク ロー ンを 整 列 化 して し ま った こ
と に よ り生 じる み か けの ギ ャ ッ プが あ る.整 列 化 を ま ち が え る お も な 原 因 は,ゲ ノ ム の 異 な っ
た 位 置 に非 常 に相 同 性 の 高 い 配 列 が2カ 所 以 上 存 在 す る か らで あ る.こ こで は,BAC1か
Database Center for Life Science Online Service
よるまちがいが概要 版の解析 で
図3真
の ギ ャ ップ と み か け の ギ ャ ッ プ
ギ ャ ッ プ に は,大 腸 菌 中 で 不 安 定 な た め ク ロ ー ン化 で き な い 領 域 が 存 在 す る こ とが 原 因 で 生 じ
し くオ ーバ ー ラ ップ するBAC2に
じな い(正).し
とつ な が りギ ャ ップ は 生
か し,相 同 性 の 高 い配 列 を も つ別 の 染 色 体 に位 置 す るBACXを
化 す れ ば,こ れ はBAC3と
は,BACXが
整 列 化 さ れ れ ば,BAC2はBAC3へ
はつ な が らず み か けの ギ ャ ッ プ が生 じる(誤).こ
別 の染 色 体 に正 しく整 列 化 さ れ た と きやBAC3か
ら正
あ や ま って 整 列
の よ うな ま ち が い
らの 整 列 化 を 行 な え ば 容 易 に 気
づ くの だ が,概 要 版 を決 定 して い る 時点 で は,数 十 か ら数 百kbに
わ た っ て9996以
上の相同性
を も った 配 列 が ゲ ノ ム に 複 数 存 在 す る こと 自体 が 知 られ て お らず,ま た,時 間の 制 限 も あ っ て
多 くの み か け のギ ャ ップ が 残 され た.
イ プの プ ロ セ ス さ れ
た偽 遺 伝 子 と,segmental
dupli-
cationに よる 不 完 全 な エ キ ソ ンー
イ ン トロ ン構 造 を もっ た 遺 伝 子
の重 複 とが あ り,こ れ ら と真 の
遺 伝 子 との 区別 が 今 回 の 解 析 で
は厳 密 に 行 な わ れ た,そ の結 果,
ヒ トゲ ノ ム の 偽 遺 伝 子 は 少 な
くと も2万 個 とな っ た.一
表4
蛋 白質 を コー ドする ヒ ト遺 伝 子
方,
100残 基 以 下 の ア ミノ 酸 配 列 か
ら な る蛋 白 質 を コ ー ドす る遺 伝
子 で,い
まの と こ ろ 産 物 が 存 在
す る証 拠 が な い もの は 遺 伝 子 と
して カ ウ ン トされ て い ない.ま
た,シ
ン グ ル エ キ ソ ンで マ ウ ス
との 相 同性 が な い 遺 伝 子 も カ ウ
ン トされ て い な い.こ
れ らの う
ち い くつ か は真 の 遺 伝 子 で あ る
こ とが 考 え られ るの で,そ れ ら
を加 え る と ヒ ト遺 伝 子 数 は 上 限
で2.5万 程 度 に な る.し か し,
一部が
るcDNAの
一
致 す る(0 .23%)も
の で あ っ た.部 分 的 に一 致 す
半分 以上 には その 近傍 に ギ ャ ップが存 在 し
い くつ か の 個 別研 究 で は,遺 伝 子 が 存 在 しな い と され る
領 域 か らmRNAが
検 出 さ れ た り,コ ン ピ ュ ー タ予 測 に
て お り,存 在 しな い 配 列 の大 部 分 は ギ ャ ップ 中 に含 ま れ
よ っ て 遺 伝 子 と して の可 能 性 が 高 い候 補 領 域 もみ つ か っ
て い る よ う で あ る.約0.08%のcDNAに
た り して お り,ヒ
つ い ては まっ
ト遺 伝 子 は2.5万 個 以 上 あ る とい う主
た くゲ ノ ム 配 列 との 一 致 が な く,多 型 また は ク ロー ン化
張 も あ る.こ
DNAの
が ら 有 意 な 長 さ の 蛋 白 質 を コー ドして い な いnon-cod-
欠 失 に よ る か,ま
た は,今 回 対 象 と な ら な か っ
の ほ か,mRNA(cDNA)に
転 写 されてい な
た ヘ テ ロ ク ロ マ チ ン 領 域 に存 在 す る 可 能 性 が 考 え ら れ
ing RNA類
る.
析 で は遺 伝 子 と して カ ウ ン トされ て い ない.
は,そ
の 機 能 が 明 らか で な い た め 今 回 の 解
ヒ トの 遺 伝 子 数 は概 要 版 で の 約3.2万 個 か ら さ ら に1
蛋白質 核酸
酵素
Vol.50
No.2(2005)
167
お わ りに
ヒ トゲ ノ ム 完 成 版 の 論 文 が 掲 載 さ れ た 同 じ号 に,フ
の ゲ ノ ム 解 析 が 報 告 さ れ て お り,そ
伝 子 も2∼2.5万
の な か で は,フ
個 と な っ て い る11).す
文献
グ
グ遺
1)
International Human Genome Sequencing
Nature, 409, 860-921(2001)
International Human Genome Sequencing
Nature, 431, 931-945 (2004)
で に マ ウス 遺伝
2)
子 も約2.2万
個 と 推 定 さ れ て お り,脊
椎 動物 の遺伝 子 数
に は 大 差 の な い こ と が 結 論 の よ う で あ る.ヒ
トゲ ノ ム は
病 気 な ど ヒ トの 生 活 と 密 接 に 関 係 が あ る た め,今
後 は,
3)榊
4)松
5)特
配 列 の 修 正,新
し い 遺 伝 子 や エ キ ソ ン の 発 見 な ど,さ
ざ ま な デ ー タ の ア ッ プ デ ー トを,だ
式 で 継 続 す る か が 問 題 と な る.す
れ が ま た ど うい う形
で に国際チー ムは ヒ ト
ゲ ノ ム 計 画 の 今 後 に つ い て の 議 論 を 始 め て お り,そ
か に は,ヘ
る.こ
の な
の ヒ トゲ ノ ム 完 全 解 読 は,今
像 で き る.な
sequence"と
お,国
回 の 論 文 の タ イ トル
な っ て い る こ と か ら も想
際 チ ー ム は染 色 体 ご と の論 文 発 表 を
今 後 も 続 け る 予 定 で あ り,現
在 ま で に10染
色 体 の解析
が 終 了 し て い る(表3).
ヒ トゲ ノ ム の よ う に 高 精 度 に 全 解 読 さ れ た 生 物 種 は 数
少 な い.マ
ヌ,ニ
6)
7)
8)
ウ ス12),ラ
ッ ト13),フ
グ,チ
ン パ ン ジ ー,イ
ワ ト リ14)な ど の ゲ ノ ム が 解 読 さ れ て い る が,そ
ら は 完 成 版 で は な い.ヒ
れ た ノ ウ ハ ウ は,こ
れ
れ らの ゲ ノ ム の 完 成 版 解 読 に も大 い
トゲ ノ ム,岩 波 書 店(2001)
原 謙 一,遺 伝 子 と ゲ ノ ム,岩 波 書 店(2002)
集
ヒ トゲ ノ ム 解 読 完 了,そ の 先 は?
9)
10)
11)
12)
13)
14)
服 部正 平
了,1984年
大 阪市 立大 学 大 学院 工 学研 究 科博 士 課程 修
九 州 大 学 遺 伝 情 報 実 験 施 設 助 手,1987∼1990
年 ス ク リプ ス 研 究 所 お よ び カ リフ ォ ル ニ ア 大 学 サ ン デ ィ エ
ゴ 校 研 究 員,1991∼1998年
生 命 科 学 研 究 所 教 授.研
ム,微 生 物 ゲ ノム.
168
蛋 白質
核酸
東 京 大 学 医 科 学 研 究 所 ヒ トゲ ノ
ム 解 析 セ ン タ ー 助 教 授,1999年
理 化 学 研 究 所 ゲ ノム 科 学 総
合 研 究 セ ン タ ー チ ー ム リー ダ ー,2002年
に 役 立 っ で あ ろ う.
酵素
Vol.50
No.2(2005)
科 学,73(4)(2003)
lafrate, A. J. et al. : Nature Genet., 36, 949-951 (2004)
Samonte, R. V., Eichler, E. E. : Nature Rev. Genet., 3, 65-72
(2002)
Jaillon, 0. J. et al.: Nature, 431, 946-957 (2004)
Mouse Genome Sequencing Consortium : Nature, 420,520562(2002)
Gibbs, R. A. et al. : Nature, 428, 493-521 (2004)
International Chicken Genome Sequencing Consortium
Nature, 432, 695-716 (2004)
略 歴:1979年
トゲ ノ ム の 完 成 版 の 解 読 で 培 わ
Consortium
Hattori, M., Taylor, T. D. : Nature, 414,854-855 (2001)
Jeremy, S. et al.: Nature, 429, 366-369 (2004)
Scherer, S. et al.: Science, 300, 767-772 (2003)
テ ロ ク ロ マ チ ン領 域 の 解 読 も 目 標 と な っ て い
が"euchromatic
Database Center for Life Science Online Service
ま
佳 之,ヒ
Consortium
究 テ-マ:ヒ
よ り北 里 大 学 北 里
トゲ ノ ム,比
較ゲ ノ
Fly UP