Comments
Description
Transcript
16S rRNA 配列解析による 次世代細菌叢解析
Sequence Solution: Application Note 16S rRNA 配列解析による 次世代細菌叢解析 ロシュ 454 シークエンサーとの組み合わせに よる高精度な細菌叢解析ツールのご紹介 February 2013 高価なコンピュータや高度なバイオインフォマティクスの知識を必要とせ ず容易にアプローチすることが可能となりました。 本紙では健常なヒト腸内性細菌叢を GS ジュニアと「16S 解析パイプラ イン」を使用した解析例についてご紹介します。 ワークフロー 検体 成人ヒト健常者の 10 種類の糞便検体からそれぞれ一般的な手法でゲ 本アプリケーションノートは、東京大学大学院 新領域創成科学研究科 服部正平教授のご厚意により作成させていただきました。 参考文献: 服部正平 , 大島健志朗 , 須田亙 . 次世代シークエンサー : 目的別アドバンスト メソッド細菌叢の 16Sとメタゲノム解析 第 6 章メタゲノム解析編 . 細胞工学別冊 , ノム DNA を抽出・精製しました。 ライブラリの調製 16S rRNA は保存性の高い領域と細菌種ごとに多様性のある領域が 交互に出現する構造をしています。2 つの多様性領域(v1 と v2 領 2012, 160 ︲168. 域)を含むように、保存領域からユニバーサルプライマーを設計しまし 須田亙 , 大島健志朗 . 次世代シークエンサーを使用した環境中の細菌叢の 16S た(図 1A)。これらのプライマーにはシークエンシング反応に必要な配 解析およびメタゲノム解析 . 日本細菌生態学会誌 , 2012, 27:63︲ 69. 列や、検体を区別するための配列(MID:Multiplex IDentifier)を 付加しています(図1B)。本実験では 10 種類の検体を GS ジュニア はじめに 土壌、水、ヒト体内などの環境中から採取した検体にどのような細菌 がどのような量比で含まれているかを解析することは、病因の推定、 環境の安全性や安定性、時間的なあるいは病態の変化に伴う細菌 叢の変動などを評価する上で非常に重要です。こうした目的には、保 1 回のシークエンスランで解析する計画のため、合計 10 本の上流側 プライマーと1 本の下流側プライマーを準備し、それぞれの検体由来 のゲノム DNA に対して別々のプライマーセットを用いて、PCR 反応を 行いました。それぞれの PCR 産物は精製した後、PicoGreen 2 本鎖 DNA 定量アッセイキットを用いて定量しました。 存性の高いリボソーム RNA(小サブユニットに含まれる 16S rRNA) のゲノム配列が広く利用されています。検体中に混在している細菌の 16S rRNA 配列をそれぞれ調べ、データベース上の配列情報と比較 することで、細菌種を同定して検体の細菌叢を評価します。 従来こうした 16S rRNA 解析は、単離培養したり16S rRNA 配列を クローニングしたりという手法で実施されていましたが、次世代シークエ ンサーを利用することで、培養等を経ずに一度にデータを得ることがで きるようになりました。 16S rRNA 解析を高い精度で実施するには、シークエンスデータ品質 が良く、なるべく長いシークエンスデータを解析することが非常に重要 となります。このため GS ジュニアや GS FLX+ システムは 16S rRNA 解析に最適なシステムです。また、東京大学服部正平先生の研究室 で開発された解析ツール「16S 解析パイプライン」を利用することで、 本製品はライフサイエンス分野の研究のみを目的としています。 図1. 16S rRNA領域とプライマー。A:16S rRNA領域模式図とプライマー設計 箇所。B:プライマー配列と構造。 エマルジョン PCR(emPCR) 10 種 類のライブラリを等 量 ずつ混 合した溶 液の一 部を分 取して emPCR を行いました。 シークエンシング GS ジュニアでのシークエンスランは、オペレーションソフトウェアの Signal Processing(ベースコール)を「Shotgun」に設定して実施しました。 1 ランで約 10 万リードのデータが得られました。このシークエンスデータ ファイル(.sff)は MID 配列を元に検体ごとのデータに分離し、各検体 の配列ファイル(.fasta)およびクオリティファイル(.qual)を作成しました。 データ解析 「16S 解析パイプライン」を使用して各検体の細菌叢を解析しました。こ の解析ツールでは図 2 に例示したような結果ファイルが自動的に保存され ます。図2の検体では 600 以上の細菌種(Species)が同定されました。 各検体の菌叢の差はエクセルなどの表計算ソフトで簡単に視覚化して 比較することができます(図 3) 。更に別の解析ツールを利用すると、各 菌叢の類似度の解析(Unifrac 解析)を行うことも可能です(図 4) 。 図2. 「 16S 解析パイプライン」による出力データ例。出力データの一つであるsample.filtered.fna.uniq_97_0.fa.m8.taxonファイルの一部を表示しています。OTU (Operational Taxonomic Unit) は、一種類の細菌種であると判断する分類上の単位を意味しています。 「No. of OTU」 カラムはその細菌種のシークエンスリード数で、相 対的な存在量を示しています。 図3. 「16S 解析パイプライン」による出力データの加工例。本実験で解析した検 体の腸内細菌叢の属 (Genus) レベルでの組成解析例を示しています。 グラフの各 部分の色はそれぞれ特定の細菌種を、 幅はその細菌種の存在比を示しています。 図4. 16S rRNA配列解析の応用例。UniFrac解析 (各菌叢の類似度の解析) 結果例を示しています。各検体はグラフ内にドットで表示され、類似したものは近く に、 そうでないものは遠くに配置されます。 まとめとポイント 本方法は 300 bp 以上という長いシークエンスリードデータを解析するこ とから、細菌種を門、属のレベルではなく、種のレベルまで分類・同 定できるため、高精度な解析が可能です。さらに、最大 134 種類の MID タグ配列を適宜利用することで、1 回のシークエンスランで解析 する検体数を調節し、柔軟に実験計画を立てることも可能です。さら に実験の規模が大きい場合や、より長い配列を解析する場合には GS FLX+ システムをご利用ください。 今回ご紹介した「16S 解析パイプライン」は、インフォマティクスのス ペシャリストでなくとも、膨大な量の次世代シークエンサーのデータを容 易に扱うことのできる非常に有用なツールです。各種のクオリティチェッ クや、16S rRNA のデータベースへの参照(相同性検索)がパッケー ジ化されていますので、それぞれの検体の .fasta ファイルと .qual ファ イルをインプット情報として設定するだけの簡単な操作で使用すること ができます。また、本ツールはプライマー設計や参照データベースを変 更することで、16S rRNA 以外の様々な領域の解析にも応用すること ができます。 注意: 「16S 解析パイプライン」は Linux で使用することを前提としたスクリプトです。http:// www.cb.k.u-tokyo.ac.jp/hattorilab/ja/protocol/16s_analysis からダウンロードして ご利用いただくことができます。指定のスクリプトやデータベースをあらかじめインストー ルしてからお使いください。 本資料に記載の情報・説明・仕様等は予告なく変更されることがございます。 本製品はライフサイエンス分野の研究のみを目的としています。 For life science research only. Not for use in diagnostic procedures. 454, 454 LIFE SCIENCES, 454 SEQUENCING, GS FLX, GS FLX TITANIUM, GS JUNIOR, EMPCR, PICOTITERPLATE, PTP, NEWBLER, REM, GS GTYPE, GTYPE, NIMBLEGEN, SEQCAP are trademarks of Roche. All other product names and trademarks are the property of their respective owners. ロシュ・ダイアグノスティックス株式会社 AS 事業部(研究用試薬・機器) 〒 105-0014 東京都港区芝 2 丁目 6 番 1 号 TEL. 03-5443-5287 FAX. 03-5443-7098 © 2013 Roche Diagnostics All rights reserved. 1303C80 -1