Comments
Description
Transcript
蛋白質核酸酵素:ヒトゲノム完成版の解析
ゲノム情報 ヒトゲノム完成版の解析 服部正平 国 際 ヒ トゲ ノム 解 読 コン ソ ー シ ア ム は,ヒ トゲ ノム 完 成 版 の 詳 細 な解 析 をNature誌2004年10 月21日 号 に発 表 した.そ の な か で2001年 定 され た ヒ ト遺 伝 子 数 が 約2.2万 に 発表 さ れ た概 要 版 の論 文 と 大 き く異 な る 点 は,確 個 で,概 要 版 の と き よ りも1万 あ る.こ の 違 い の 理 由 と して は,配 列 の 高 精 度 化,cDNA情 Database Center for Life Science Online Service に よ る 遺 伝 子 発 見 技 術 の 蓄 積,な 個 も少 な くな って い る こ と で 報 の 充 実,他 生 物 種 の ゲ ノ ム 解 析 どが あ げ られ る.今 回 の 結 果 か ら,フ グ か ら ヒ トに 至 る 脊 椎 動 物 の 遺 伝 子 数 は ほ ぼ 同 じと な り,遺 伝 子 数 よ りも,そ の わ ず か な機 能 と組 合 せ の違 い が 生 物 種 の 違 い に関 係 す る こ と が 示 唆 さ れ る. Key words ヒ トゲノム ゲ ノム 遺伝 子 塩基 配列 は じめ に 時 点 で残 っ て い た 領 域 の 解 読,決 定 した 配 列 の 最 終 的 な ヒ トの全 遺 伝 情 報 の解 読 を め ざす 「国 際 ヒ トゲ ノ ム 計 画 」 は,日 ・米 ・英 な ど6力 国18研 究 機 関か らな る 国 際 ヒ トゲ ノ ム 解 読 コ ン ソー シ ア ム(以 下,国 際 チ ー ム)に よ り1991年 に 正 式 に 開始 さ れ,2001年2月,ヒ ム概 要 版 の解 析 結 果 をNature誌 版 で は,ヒ DNA トゲ ノ に 報 告 した1).こ の概 要 精 査,遺 年10月 伝 子 発 見 な ど の完 成 版 の 解 析 作 業 を 進 め,2004 にそ の 結 果 をNature誌 本 稿 で は,ヒ に 発 表 した の で あ る2). トゲ ノ ム完 成 版 に至 る まで の経 過 お よ び 発 表 さ れ た 解 析 結 果 の 一 部 に つ い て解 説 す る.な お,ヒ トゲ ノ ム解 読 に 関 す る読 み物 と総 説 をあ げ て お く3∼5). トゲ ノ ム の ユ ー ク ロ マ チ ン領 域*1の 約90% を解 読 し,そ の解 析 か ら ヒ ト遺 伝 子 の 総 数 が3∼4万 個 I.概 要版 か ら完 成 版 へ で あ る こ とな ど,わ れ わ れ 自 身 の 生 命 の設 計 図 の お お ま か な 全 体 像 が初 め て 明 らか に な っ た.し は ゲ ノ ム全 体 の 約10%に か し,概 要 版 に 相 当 す る15万 概 要 版 の 解 読 は,米 国企 業 セ レ ラ社 に よ る1998年 の カ所 の 未 決 定 ホ ー ル ゲ ノ ム シ ョ ッ トガ ン法 を 用 い た ヒ トゲ ノ ム 単 独 解 領 域(ギ ャ ッ プ)や 精 度 が 低 い 領 域 な ど,精 査 す べ き箇 所 読 計 画 に対 して 考 え 出 され た,国 際 チ ー ム の 対 抗 戦 略 で が 多 く含 ま れ て お り,目 標 と した 完 成 版 の 定 義 で あ る ユ あ っ た.解 読 開 始 当初 は 国際 チ ー ム に は概 要 版 とい う考 ー ク ロ マ チ ン領 域 の95%以 え 方 は な く,染 色 体 ご との 完 成 版(階 層 式 シ ョ ッ トガ ン 上 の 解 読 お よ び99 .99%以 上 の デ ー タ精 度 に は ほ ど遠 い 結 果 で あ っ た.そ の た め, 法)を 積 み 上 げ て い き,2005年 に ヒ トゲ ノ ム の全 解 読 を 国 際 チ ー ム は概 要 版 の 発 表 後 も完 成 版 を め ざ して さ らな 完 了 す る計 画 を立 て て い た.し か し,セ る解 読 を続 け て い た.2003年 解 読 計 画 に よ っ て,国 初 頭 に全 染色 体 の解 読 が 完 成 版 の 定 義 に 到 達 した こ と に よ り,そ の4月 に完 成 版 の 解 読 完 了 が 発 表 され た.そ の の ち 国 際 チ ー ム は,そ の Masahira Hattori,北 里 大 学 北 里 生 命 科 学 研 究 所 ゲ ノ ム 構 造 情 報 研 究 グ ル ー プ Finishing 162 the 蛋白質 核酸 euchromatic 酵素 Vol.50 of the No.2(2005) human genome 際 チ ー ム は急 き ょ概 要 版 を2000 ま で に 解 読 す る 計 画 を 設 定 し,さ 2003年 に 完 了 す る 方 針 へ と変 更 した.一 創 薬 科 学 部 門 ゲ ノ ム 情 報 学 研 究 室/理 E-mail:[email protected] sequence 年6月 http://genome レ ラ社 の概 要 版 らに完 成 版 を 方 で,21番 染 化 学 研 究 所 ゲ ノ ム 科 学 総 合 研 究 セ ン タ ー .ls.kitasato-u.ac.jp/index_j.html 図1 ヒ トゲ ノ ム の 解 読 戦 略 国 際 チー ム が と っ た階 層 式 シ ョッ トガ ン 法 と,セ レラ 社 が と った ホ ール ゲ ノム シ ョ ッ トガ ン法 を示 す.階 層 式 シ ョッ トガ ン 法 は,位 置 マ ー カ ー を 指 標 に し た BACク ロ ー ン の染 色 体 へ の 位 置 決 定 と ゲ ノ ム歩 行 によ る整 列 化 を 行 な い,つ い で各BACク ロ ー ン(約200kb)を 単位 と した シ ョッ トガ ン シー クエ ン シ ング を く り返 す戦 略 で あ る.こ の 戦 略 は,高 精度 の デ ー タ決 定,ま た,染 色 体 こ とや チ ー ム別 での 解 読 を可 能 にす る.一 方,ホ ー ル ゲ ノ ム シ ョ ッ トガ ン法 は,ゲ ノム を ま ん べ んな く一 気 に シ ョッ トガ ン シー ク エ ン シ ン グ す る 戦 略 で,BAGク ロー ン 整 列化 な どの 中 間行 程 が な い.そ の た め, ホ ール ゲ ノム シ ョッ トガ ン法 は ゲ ノム 全 体 を 高速 か つ お お まか に決 定 す るの に有 効 な戦 略で あ る が,得 られ た 配列 の 染 色 Database Center for Life Science Online Service 体 上 で の位 置 は 決 ま って お らず,の ち の 位 置 決定 や 高 精度 化 に時 間 が か かる.セ レラ 社 は,国 際 チ ー ム な ど がDNAデ ー タ バ ン ク に公 開 した位 置 情 報 付 きの 配 列 デ ー タ を取 り入 れ て概 要 版 を 決 定 した. な お,セ レ ラ社 は 概要 版 まで を ヒ トゲ ノ ム 解 読 の 目標 と して いた.ヒ トゲ ノム 解 読以降 のほかの 生物種 のゲ ノム解読 で は,階 層 式 シ ョ ッ トガ ン法 と ホ ール ゲ ノ ム シ ョッ トガ ン 法 が併 用 さ れ る よ う にな り,解読 ス ピー ドと精 度 が 向上 して い る. 色 体 や22番 染 色 体 な ど は,概 要 版 発 表 の 前 に そ の 完 全 解 読 が ほ ぼ終 了 し て い た.そ れ た 概 要 版 は,約70%が の 結 果,2001年 概 要 版,30%が な る デ ー タ と な っ た.図1に,ヒ に発 表 さ 完成 版 か ら トゲ ノ ム の解 読 戦 略 を 示 す. 上 の で き るか ぎ りの 解 読 が 行 な わ れ た.ま シ ー ク エ ン シ ング した ク ロー ンの 再 編 成 の有 無 をチ ェ ッ クす る作 業 も進 め られ た.結 局,こ れ を 完 成 版 に す る た め,残 り半 分 の 追 加 さ らに1年 以 上 が 費 や され て,よ れ らの厳 密 な デ ー タ 了 に よっ て ギ ャ ッ プ は250カ ち が い の修 正,ギ は約2,850Mb,精 ャ ッ プ を解 読 す る フ ィニ ッ シ ン グ作 業 が 進 め られ た6).そ の た め,概 要 版 の 約1年 完 成 版 に は 約3年 間 が 費 や され た.完 間 に対 して, 成 版 の解 読 完 了 が 発 表 さ れ た 時 点 で も,ギ ャ ッ プ を カ バ ー す る ク ロー ンの うや く2004年10月 の 論 文 発 表 と な っ た の で あ る.最 終 的 に,完 成 版 の 解 読 完 シー ク エ ン シ ング と,概 要 版 に含 ま れ る配 列 や 位 置 の ま *1 た 並 行 して, 精 度 の精 査 と論 文 作 成 の た め の遺 伝 子 発 見 の作 業 な どに 概 要 版 は 完 成 版 の 約 半 分 の サ ン プ ル 解 析 で得 られ る 配 列 デ ー タで,そ 単 離 と シー ク エ ン シ ング が 進 め られ て い て,数 値 目標 以 所 に減 少 し,決 定 し た領 域 度 も99.999%以 上 と な っ た.表1に, 完 成 版 発 表 に 至 る ま で の ヒ トゲ ノ ム 解 読 の 系 譜,表2 に,概 要 版 と完 成 版 の 違 い を ま とめ た.ま た,表3に は, 完 成 版 に お け る 各 染 色 体 別 の 決 定 量 を示 した. ユ ー クロ マ チ ン領域 とヘ テ ロ ク ロマ チ ン領 域:細 胞 が 細 胞 分 裂 間期 の と きに ほ ぐれ た状 態 を と っ て,遺 伝 子 発 現 が 活 発 な状 態 を と る 領 域 をユ ー ク ロマ チ ン領 域 とい い,中 期 染 色体 に み られ るDNAが コ ンパ ク トに凝 集 した 状 態 が 問 期 にお い て も ほ ぐれ ず に保 た れ る 領 域 をヘ テ ロ ク ロマ チ ン領 域 とい う.ヘ テ ロ クロ マチ ン領 域 に は遺 伝 子 は存 在 しない と考 え られ て い る. 蛋 白質 核酸 酵素 Vol.50 No.2(2005) 163 表1 ヒ トゲ ノム 計画 と解析 技術 開 発 ・他ゲ ノム 解読 の系 譜 II.配 列 精 度の 精査 ヒ トゲ ノ ム解 読 で シ ー ク エ ン シ ング され た ク ロ ー ン は合 計 約 6万 個 で,そ の う ち4.6万 個 が 完 成 版 まで に シ ー クエ ン シ ン グ さ れ た.重 複 度 が10以 上の シ ョ ッ トガ ン デ ー タか ら得 られ た 完 成 版 の 各 塩 基 に は,コ ン ピ ュ ー タ に よ る客 観 的 評 価 と して の 精 度 値*2が 付 与 さ れ て い る. こ れ に加 え て,一 部 ク ロ ー ンの 再 シー クエ ンシ ングが 行 な わ Database Center for Life Science Online Service れ,非 常に厳密な精度評価が な され た7).そ の 結 果,完 の 精 度 は99.999%以 成版 上 で あ り, この 数 字 は 完 成 版 中 に わ ず か 1,100塩 基 程 度 の ま ち が い しか な い こ と を示 して い る. 配 列 以 外 の精 度 につ い て も い くつ か の 項 目が 精 査 さ れ た.そ の ひ とつ は,大 腸 菌 中 で 起 こ る クロー ン中の一部断片 の欠失や 反 転 な ど に よる 再 編 成 の 有 無, す な わ ち,決 定 し た配 列 が 実 際 の ヒ トゲ ノ ム をそ の ま ま反 映 し て い る か ど うか の チ ェ ッ クで あ る.こ の よ うな 大 腸 菌 中 で 起 こ り う るDNAの 再 編 成 はBAC ラ イ ブ ラ リ ー 全 体 の 約5%に 存 在 す る と見 積 も ら れ て お り, こ れ ら再 編 成 を起 こ した ク ロー ンか ら 配 列 を 決 定 し な い た め に,多 くの 重 複 ク ロ ー ン を単 離 して そ の フ ィ ンガ ー プ リ ン トを チ ェ ッ クす る こ とが 前 もっ て 行 な わ れ た.し か し,一 部 は 見 落 と さ れ,欠 失 や 反 転 が 完 成 版 に ま ぎれ こん で い る.セ レラ社 の デ ー タ を も とに カ ナ ダ の グ ル ー プが 完 成 した7番 染 色 体 の 配 列 164 蛋 白質 核酸 酵素 Vol.50 No.2(2005) 表2 ヒ トゲ ノ ム概要 版 と完成 版 の比 較 の ま ちが い な ど,い ず れ に よ る も の な の か は 明 らか で は な い.し か し最 近,ヒ ト集 団 に は予 想 以 上 に大 き なサ イ ズ の 増 幅 や 欠 失 な どの 多 型 が あ る こ とが 報 告 さ れ て い る9).お そ ら く,両 デ ー タの 違 い は この よ う な 大 型 の 多 型 に よ る もの なの か も しれ な い. 決 定 した 配 列 に か くれ て い る 欠 失 を み つ け る た め,国 際 チ ー ム は約40kbの イ ンサ ー トDNAを もつ フ ォ ス ミ ドク ロ ー ンの大 規 模 な マ ッ ピ ング を行 な っ た.こ と 国 際 チ ー ム の デ ー タ と の 比 較 か ら,両 デ ー タのあ い は,100万 だ に は 塩 基 の 違 い と 配 列 の 挿 入 が あ わ せ て0.75%(計 1.2Mb)も あ る こ と や,相 る こ と な ど,大 相 違 が,異 同 性 の な い 個 所 が132カ き な 違 い が み つ か っ て い る8).こ な っ た ヒ トDNAに Database Center for Life Science Online Service る い は,配 個 程 度 の フ ォ ス ミ ドク ロ ー ン の 両 端 配 列 を 完 成 版 に貼 り付 け る も の で,両 端 配列 で は さ まれ た距 離 が 所 あ 統 計 上 短 くな っ て い る個 所 にか くれ た 欠 失 の 存 在 を推 定 れ らの 由 来 す る も の な の か,大 腸 菌 中 で の 再 編 成 の た め な の か,あ し た(図2).こ れ に よ っ て,242カ み つ か っ た.こ れ ら の個 所 のPCRな そ の うち の 約2/3は 列編集 時 所 の欠 失領 域候 補 が どに よ る解 析 か ら, ヒ ト集 団 中 の挿 入/欠 失 の多 型(平 均 で 約6kb)で,残 表3 の作 業 ー ン化DNAの 染色 体別 ヒ トゲ ノム解 読状 況(Build35) り1/3は クロ 欠 失 ら しい こ と が 判 明 した.欠 失 や 再 編 成 は チ ンパ ンジ ー や マ ウ ス な ど の ゲ ノ ム との 比 較 に よ っ て もみ つ け る こ とが 可 能 で あ り,完 成 版 は今 後 も修 正 が 続 け ら れ る と考 え ら れ る.一 方,個 々 の研 究 にお い て は,上 記 した こ と に注 意 を は らっ て 配 列 デ ー タ を利 用 す る必 要 が あ る. も うひ とつ の 精 査 は,反 復 配 列 以 外 に 複 数 が存 在 す る 非 常 に 相 同性 の 高 い 配 列 の 位 置 の 確 認 で あ る.数+kb以 上 で そ の配 列 相 同性 が99%以 上 あ る領 域 が,と くにセ ン トロ メ ア や テ ロ メ ア 近 傍 に 頻 度 高 く存 在(ま た,ユ ー ク ロマ チ ン領 域 に も点 在)す る10).こ の 相 同 性 の 高 い 配 列 はsegmenta1 duplicati0n*3 また は相 同 組 換 え に よ っ て生 じ た と考 え られ て い る.こ の 作 業 ヘ テ ロ ク ロマ チ ンギ ャ ップ は ,セ ン トロ メア,rRNA遺 *2塩 基 の 精 度 値:1998年 に 開 発 さ れ たPHRED/PHRAPプ 版 デ ー タ の 精 度 を 数 値 化 で き る よ う に な っ た.こ で き る よ う に な り,統 は,わ ず か な 塩 基 の違 い を指 標 伝 子 ク ラス タ ー,短 腕 領 域 な ど も含 む ロ グ ラ ム に よ っ て,シ れ に よ っ て,日 ー ク エ ンサ ー か ら 産 生 さ れ る 各 配 列 デ ー タ お よ び 完 成 常 の デ ー タ品 質 管理 と各解 読 セ ン ター の 配 列 デ ー タを 客 観 的 に 評価 一 し た デ ー タ 精 度 で の 解 読 が 可 能 に な っ た.な お,PHRAP値 が40で 精 度99.99%と な り,こ の値 以 上 で あ る こ と が 完 成 版 の 目安 と な る. 蛋白質 核酸 酵素 Vol.50 No.2(2005) 165 III.遺 伝 子 の発 見 概 要 版 の 解 析 に よ っ て,ヒ ゲ ノ ム に は 約3∼4万 ト 個 の遺 伝 子 が 存 在 す る と推 定 さ れ た.こ の 数 字 は,ヒ ト のcDNA配 列 や 蛋 白質 の ア ミノ酸 配 列 お よ び 他 生 物 種 の 遺 伝 子 デ ー タ と の相 同 性 検 索 お よ び コ ン ピ ュー タ予 測 か ら導 か れ た.セ レ ラ社 独 自 の 解 析 も同 様 な数 字 を報 告 して Database Center for Life Science Online Service 図2 BACク い た が,国 フ ォ ス ミ ドク ロ ー ン を 用 い た 欠 失 領 域 の 検 出 ロー ンの よ うな 長 鎖DNAを クロ ー ニ ン グ す る 系 で は,ま れ に大 腸 菌 中 で ク ロ ー ン 化 し たDNAに 遺 伝 子 と一 致 した の は約 半 分 程 欠 失 が 起 こる こと が あ り,こ の よ うな クロ ー ン か ら得 られ る配 列 は 実 際 のゲ ノム 配 列 を反 映 しな い こ とに な る.そ の た め,約40kbの で 比 較 的安 定 にク ロー ン化DNAを 度 で あ った.こ 均 一 な イ ン サ ー ト長 を も ち,シ ン グ ル コ ピ ー か くれ て いる 欠 失 の検 出が 行 な われ た.フ ォス ミ ドクロ ー ンの 両 端 約500塩 基 の 配 列 を決 定 し, 精 度 の 高 い もの で な い こ と を示 唆 して い た.し か し,以 前 か ら れ て 貼 り付 く.し か し,欠 失 が存 在 す る領 域 を カ バ ー す る フ ォス ミ ドク ロー ン の 両端 は,平 均 よ りも 短 く,た とえ ば30kb離 の 違 い は,当 時 の 遺 伝 子 発 見 は 必 ず し も正 確 で 維 持 で き る フ ォス ミ ドベ クタ ー 系 を利 用 して,完 成 配 列 中 に そ れ ら を完 成 配 列 に相 同 性 検 索 によ って 貼 り付 けた.こ の と き,完 成 配 列 に 欠失 が な け れ ば 各 ク ロー ン両 端 の 配 列 は約40kb離 際 チ ー ム の 同定 した い わ れ て い た 遺 伝 子 数 約10万 れ て貼 り付 くこ と にな る. 個 が 下 方 修 正 され た こ とに つ い に,手 作 業 に よ っ て 行 な わ れ た.す ェ ック以 前 に,い で に,完 成 版 で の チ くつ か の ク ロー ンに つ い て は そ の 位 置 が 修 正 され て い る. て の 見 解 は 一 致 した. 今 回 の 完 成 版 で は,配 列 が 高 精 度 に な っ た こ と,増 大 し たcDNA情 こ の相 同 性 の 高 い 配 列 は,概 要 版 に あ っ た多 くの ギ ャ ップ の 原 因 に もな っ て い た.BACク ロ ー ン整 列 化 の 行 報,マ ウス な どの他生 物種 ゲ ノムの解 読 が 進 ん で ゲ ノ ム 問 で の 保 存 領 域 の特 定 が 可 能 に な っ た こ と な どに よ り,よ り多 角 的 で 正 確 な 遺 伝 子 発 見 を行 な う 程 で,高 い 相 同性 の た め 異 な っ た位 置 にあ る ク ロー ンを こ とが で き た.ま た,概 ま ち が っ て つ な い で しま う.そ の た め,ギ タ解 析 に加 え て これ を 手作 業 形 式 で 確 認 す る こ と も行 な ャ ッ プの 反 対 側 の ク ロー ン とは い つ ま で た っ て もつ なが らな い 状 態 に わ れ た.そ な り,そ の結 果,み か け の ギ ャ ップ が 生 じる こ と に な る 落 と しや ま ち が い を 加 味 して2∼2.5万 (図3).み と結 論 さ れ た(表4).ゲ か け の ギ ャ ップ は,ゲ ノム全体 の配列 が 明 ら の 結 果,ヒ 要 版 で の 反 省 か ら,コ ン ピ ュ ー か に な る に した が っ て修 正 さ れ た.最 終 的 に 残 っ た ギ ャ 応 し た ヒ トcDNA配 ップ250カ の99.7%は 所 は 真 の ギ ャ ッ プ で,こ れ らに は 大 腸 菌 中 で ト遺 伝 子 は 約2.2万 個,こ 不 安 定 な た め に ク ロ ー ニ ン グ で きな い 配 列 が 含 ま れ て い る.こ 重 複 遺 伝 子 で あ る 可 能 性 が 高 い.残 ら数+kbも 長 cDNAは く続 い た,数 塩 基 か ら な る単 純 く り返 し配 列 で あ る. *3 segmental duplication:数kb∼ 数百kbの 大 きさで90∼100%の 所 に対 ー タ ベ ー ス) ゲ ノ ム 配 列 と問 題 な く一 致 した.こ の0.5%は2カ の よ う な 配 列 の 多 くは,数kbか 個 の 範 囲 とな る ノ ム 配 列 の 約17,500カ 列(RefSeqとMGCデ れ に見 の うち 所 以 上 で 有 意 な 相 同 性 を示 し,こ れ ら は り の 約0.3%の ゲ ノ ム 配 列 に ま っ た く一 致 し な い(0.06%)か, 相 同性 を もつ 配列 が,染 色 体 内 また は 染 色 体 間 で 重 複 して い る こ と が ヒ トゲ ノ ム概 要 版 の解 析 に よ り発 見 され た.こ れ らの 重複 配列 は,そ の相 同性 の 高 さか らご く最近 に起 こ った ゲ ノム 断 片 の重 複(segmental duplication)に よっ て生 じた もの と考 え られ,事 実,チ る.重 複 配列 の総 サ イ ズ は ヒ トゲ ノ ム全 体 の 約5%で,す 近 傍,ま た はY染 ンパ ンジー や ヒ トな どの 類 人 猿 の ゲ ノム に 特 徴 的 に み られ る構 造 で あ べ ての ヒ ト染 色 体 に分 布 す る が,約80%は セ ン トロメ ア 近 傍 や テ ロメ ア 色体 に集 中 して い る.重 複 は レ トロポ ゾ ンタ イ プの 反復 配列 とは 異 な っ た機 構 で起 こ っ て い る よ うだ が,そ の 詳細 は不 明 で あ る.大 部 分 の重 複 配 列 は遺 伝 子 を含 ん で い ない が,遺 伝 子 の 一 部や そ の全 体 を含 ん で重 複 す る場 合 もあ る.前 者 は偽 遺伝 子 の生 成 の 原 因 と な り,後 者 は新 しい機 能 を もっ た遺 伝 子創 成 の要 因に な る と考 え られ て い る. 166 蛋 白質 核酸 酵素 Vol.50 No.2(2005) 万 個 少 な くな った が,そ の要 因 と して い くつ か の こ とが あ げ ら れ る.そ れ まで2つ の遺 伝 子 と み な され て い た 隣 接 した 遺 伝 子 が 実 は1つ とや,別 の遺 伝 子 で あ っ た こ の 染 色 体 にマ ップ され て い た2つ の 遺 伝 子 で 一 方 が 偽 遺 伝 子 で あ る こ とが わ か っ た こ と な どで あ る.と くに,最 近 に な って 生 じた 偽 遺 伝 子 が 原 因 に 多 くみ られ た.偽 遺 伝 子 に は, る真 の ギ ャ ップ と,BACク cDNAタ ロー ン整 列 化 の 段 階 で あや ま った ク ロー ンを 整 列 化 して し ま った こ と に よ り生 じる み か けの ギ ャ ッ プが あ る.整 列 化 を ま ち が え る お も な 原 因 は,ゲ ノ ム の 異 な っ た 位 置 に非 常 に相 同 性 の 高 い 配 列 が2カ 所 以 上 存 在 す る か らで あ る.こ こで は,BAC1か Database Center for Life Science Online Service よるまちがいが概要 版の解析 で 図3真 の ギ ャ ップ と み か け の ギ ャ ッ プ ギ ャ ッ プ に は,大 腸 菌 中 で 不 安 定 な た め ク ロ ー ン化 で き な い 領 域 が 存 在 す る こ とが 原 因 で 生 じ し くオ ーバ ー ラ ップ するBAC2に じな い(正).し とつ な が りギ ャ ップ は 生 か し,相 同 性 の 高 い配 列 を も つ別 の 染 色 体 に位 置 す るBACXを 化 す れ ば,こ れ はBAC3と は,BACXが 整 列 化 さ れ れ ば,BAC2はBAC3へ はつ な が らず み か けの ギ ャ ッ プ が生 じる(誤).こ 別 の染 色 体 に正 しく整 列 化 さ れ た と きやBAC3か ら正 あ や ま って 整 列 の よ うな ま ち が い らの 整 列 化 を 行 な え ば 容 易 に 気 づ くの だ が,概 要 版 を決 定 して い る 時点 で は,数 十 か ら数 百kbに わ た っ て9996以 上の相同性 を も った 配 列 が ゲ ノ ム に 複 数 存 在 す る こと 自体 が 知 られ て お らず,ま た,時 間の 制 限 も あ っ て 多 くの み か け のギ ャ ップ が 残 され た. イ プの プ ロ セ ス さ れ た偽 遺 伝 子 と,segmental dupli- cationに よる 不 完 全 な エ キ ソ ンー イ ン トロ ン構 造 を もっ た 遺 伝 子 の重 複 とが あ り,こ れ ら と真 の 遺 伝 子 との 区別 が 今 回 の 解 析 で は厳 密 に 行 な わ れ た,そ の結 果, ヒ トゲ ノ ム の 偽 遺 伝 子 は 少 な くと も2万 個 とな っ た.一 表4 蛋 白質 を コー ドする ヒ ト遺 伝 子 方, 100残 基 以 下 の ア ミノ 酸 配 列 か ら な る蛋 白 質 を コ ー ドす る遺 伝 子 で,い まの と こ ろ 産 物 が 存 在 す る証 拠 が な い もの は 遺 伝 子 と して カ ウ ン トされ て い ない.ま た,シ ン グ ル エ キ ソ ンで マ ウ ス との 相 同性 が な い 遺 伝 子 も カ ウ ン トされ て い な い.こ れ らの う ち い くつ か は真 の 遺 伝 子 で あ る こ とが 考 え られ るの で,そ れ ら を加 え る と ヒ ト遺 伝 子 数 は 上 限 で2.5万 程 度 に な る.し か し, 一部が るcDNAの 一 致 す る(0 .23%)も の で あ っ た.部 分 的 に一 致 す 半分 以上 には その 近傍 に ギ ャ ップが存 在 し い くつ か の 個 別研 究 で は,遺 伝 子 が 存 在 しな い と され る 領 域 か らmRNAが 検 出 さ れ た り,コ ン ピ ュ ー タ予 測 に て お り,存 在 しな い 配 列 の大 部 分 は ギ ャ ップ 中 に含 ま れ よ っ て 遺 伝 子 と して の可 能 性 が 高 い候 補 領 域 もみ つ か っ て い る よ う で あ る.約0.08%のcDNAに た り して お り,ヒ つ い ては まっ ト遺 伝 子 は2.5万 個 以 上 あ る とい う主 た くゲ ノ ム 配 列 との 一 致 が な く,多 型 また は ク ロー ン化 張 も あ る.こ DNAの が ら 有 意 な 長 さ の 蛋 白 質 を コー ドして い な いnon-cod- 欠 失 に よ る か,ま た は,今 回 対 象 と な ら な か っ の ほ か,mRNA(cDNA)に 転 写 されてい な た ヘ テ ロ ク ロ マ チ ン 領 域 に存 在 す る 可 能 性 が 考 え ら れ ing RNA類 る. 析 で は遺 伝 子 と して カ ウ ン トされ て い ない. は,そ の 機 能 が 明 らか で な い た め 今 回 の 解 ヒ トの 遺 伝 子 数 は概 要 版 で の 約3.2万 個 か ら さ ら に1 蛋白質 核酸 酵素 Vol.50 No.2(2005) 167 お わ りに ヒ トゲ ノ ム 完 成 版 の 論 文 が 掲 載 さ れ た 同 じ号 に,フ の ゲ ノ ム 解 析 が 報 告 さ れ て お り,そ 伝 子 も2∼2.5万 の な か で は,フ 個 と な っ て い る11).す 文献 グ グ遺 1) International Human Genome Sequencing Nature, 409, 860-921(2001) International Human Genome Sequencing Nature, 431, 931-945 (2004) で に マ ウス 遺伝 2) 子 も約2.2万 個 と 推 定 さ れ て お り,脊 椎 動物 の遺伝 子 数 に は 大 差 の な い こ と が 結 論 の よ う で あ る.ヒ トゲ ノ ム は 病 気 な ど ヒ トの 生 活 と 密 接 に 関 係 が あ る た め,今 後 は, 3)榊 4)松 5)特 配 列 の 修 正,新 し い 遺 伝 子 や エ キ ソ ン の 発 見 な ど,さ ざ ま な デ ー タ の ア ッ プ デ ー トを,だ 式 で 継 続 す る か が 問 題 と な る.す れ が ま た ど うい う形 で に国際チー ムは ヒ ト ゲ ノ ム 計 画 の 今 後 に つ い て の 議 論 を 始 め て お り,そ か に は,ヘ る.こ の な の ヒ トゲ ノ ム 完 全 解 読 は,今 像 で き る.な sequence"と お,国 回 の 論 文 の タ イ トル な っ て い る こ と か ら も想 際 チ ー ム は染 色 体 ご と の論 文 発 表 を 今 後 も 続 け る 予 定 で あ り,現 在 ま で に10染 色 体 の解析 が 終 了 し て い る(表3). ヒ トゲ ノ ム の よ う に 高 精 度 に 全 解 読 さ れ た 生 物 種 は 数 少 な い.マ ヌ,ニ 6) 7) 8) ウ ス12),ラ ッ ト13),フ グ,チ ン パ ン ジ ー,イ ワ ト リ14)な ど の ゲ ノ ム が 解 読 さ れ て い る が,そ ら は 完 成 版 で は な い.ヒ れ た ノ ウ ハ ウ は,こ れ れ らの ゲ ノ ム の 完 成 版 解 読 に も大 い トゲ ノ ム,岩 波 書 店(2001) 原 謙 一,遺 伝 子 と ゲ ノ ム,岩 波 書 店(2002) 集 ヒ トゲ ノ ム 解 読 完 了,そ の 先 は? 9) 10) 11) 12) 13) 14) 服 部正 平 了,1984年 大 阪市 立大 学 大 学院 工 学研 究 科博 士 課程 修 九 州 大 学 遺 伝 情 報 実 験 施 設 助 手,1987∼1990 年 ス ク リプ ス 研 究 所 お よ び カ リフ ォ ル ニ ア 大 学 サ ン デ ィ エ ゴ 校 研 究 員,1991∼1998年 生 命 科 学 研 究 所 教 授.研 ム,微 生 物 ゲ ノム. 168 蛋 白質 核酸 東 京 大 学 医 科 学 研 究 所 ヒ トゲ ノ ム 解 析 セ ン タ ー 助 教 授,1999年 理 化 学 研 究 所 ゲ ノム 科 学 総 合 研 究 セ ン タ ー チ ー ム リー ダ ー,2002年 に 役 立 っ で あ ろ う. 酵素 Vol.50 No.2(2005) 科 学,73(4)(2003) lafrate, A. J. et al. : Nature Genet., 36, 949-951 (2004) Samonte, R. V., Eichler, E. E. : Nature Rev. Genet., 3, 65-72 (2002) Jaillon, 0. J. et al.: Nature, 431, 946-957 (2004) Mouse Genome Sequencing Consortium : Nature, 420,520562(2002) Gibbs, R. A. et al. : Nature, 428, 493-521 (2004) International Chicken Genome Sequencing Consortium Nature, 432, 695-716 (2004) 略 歴:1979年 トゲ ノ ム の 完 成 版 の 解 読 で 培 わ Consortium Hattori, M., Taylor, T. D. : Nature, 414,854-855 (2001) Jeremy, S. et al.: Nature, 429, 366-369 (2004) Scherer, S. et al.: Science, 300, 767-772 (2003) テ ロ ク ロ マ チ ン領 域 の 解 読 も 目 標 と な っ て い が"euchromatic Database Center for Life Science Online Service ま 佳 之,ヒ Consortium 究 テ-マ:ヒ よ り北 里 大 学 北 里 トゲ ノ ム,比 較ゲ ノ