Comments
Description
Transcript
GenomeStudioTM データ解析ソフトウェア
ILLUMINA® SYSTEMS AND SOFTWARE GenomeStudio TM データ解析ソフトウェア イルミナは幅広い遺伝解析アッセイをサポートするための包括的なデータ解析ツールを開発し ました。このソフトウェアで、イルミナの3つのプラットフォームから得られるデータの視覚 化および解析が行えます。 はじめに イルミナは革新的で強力な遺伝解析 アッセイを幅広く開発しご提供して います。また実験に必要な製品だけ でなくデータ解析の必要性も重視 Figure1:全てのイルミナプラットフォームから得られるゲノムデータの統合解析がで きるGenomeStudioソフトウェア Genome Analyzer iScan System BeadXpress Reader し、GenomeStudioソフトウェアを開 発いたしました。イルミナの3つのプ ラットフォームである次世代シーケ ンサーGenome Analyzer、BeadArray™ 製品を読み取るiScan™ システム、そ シーケンス データ してVeraCode® テクノロジーを採用 BeadArray データ VeraCode データ したBeadXpress ® リーダーは、この GenomeStudioソフトウェアをゲノム データの共通の一次解析ツールとし て使用します。GenomeStudioソフト GenomeStudioソフトウェアの特長 • 幅広いツール:Genome Analyzer、 iScanシステム、BeadArrayリーダ ーから得られるデータを解析 • 統合解析:同じプロジェクト内で複 数アッセイからのデータを統合化 • 洗練されたプラットフォーム:幅広 いアプリケーションに対応した高性 能アルゴリズムおよび統計計算 • オープンアーキテクチャー:2次、3 次解析のためにプラグインおよび APIを用いたデータエクスポート DS RS RS ChIP シーケ ンス解 析 (Figure.1)。 CS ノ ジェ のモジュールをご提供しています タン パク 質解 析 グ ン リ イ ァ び フ よ ロ お プ 現 A 発 N R 子 ロ 伝 ク グ 遺 イ ピン マ タイ ンごとに適した解析を可能にする7つ 析 解 A ンス N D ーケ シ RN シ A ー ケ ン ス 解 析 できるように統一したフレームワー クを構成し、さらにアプリケーショ リング DNAメチル化プロファイ ウェアでは、共通の解析タスクが GT PT GX M GenomeStudioソフトウェアはイルミナプラットフォーム(上)から得られるデータ解析をサポー トする、複数のモジュール(下)から構成されています。異なるモジュールからのデータも一つの プロジェクトに統合することができます(矢印部分)。 ILLUMINA® SYSTEMS AND SOFTWARE 統合されたフレームワーク データの視覚化 コントロールダッシュボード GenomeStudioソフトウェアはイル ゲノムワイドに大まかな傾向を知り イルミナのアレイを用いたアッセイ ミナアッセイを用いたデータのため たい場合は、IGV (Illumina Genome (InfiniumおよびGoldenGate® ジェ に、優れた視覚化と直感的な解析を Viewer)を使います。また、シーケン ノタイピング、メチル化プロファイ 可能にしました。GenomeStudioソ スあるいはアレイデータを用いた染 リング、Direct フトウェアは、複数のアッセイに対 色体や領域ごとの傾向はICB (Illumina クロRNA発現プロファイリング) 応したモジュールから構成されてい Chromosome Browser)により表示す にはサンプル依存性および非依存性 Hyb、DASL®、マイ る統合プラットフォームです。共通 ることができます。ICBを使い、構造 の内部コントロールを有しており、 のフレームワークではコントロール 変異や遺伝子発現レベル、タンパク データのクォリティを確認すること のための直感的なユーザーインター 結合部位、プロモーター領域のCpG ができます。これらのコントロール フェースとデータ視覚化機能、そし メチル化などを同定できます。シー はGenomeStudioソフトウェアのコ て各モジュールから得られるデータ ケンスデータを用いた高解像な解析 ントロールダッシュボードにて表示 解析結果の表示を行います。イルミ にはISV (Illumiina Sequence Viewer) されます。 ナアッセイから産出される大量の を使って1塩基レベルまで拡大 データを理解するには、様々な角度 し、S N P や C p G 座 位 、 ス プ ラ イ ス からの解析と、全ゲノム網羅的から ジャンクション、cSNPなどを正確に の視点と領域に特化する詳細な情報 同 定 す る こ と が で き ま す 。 サンプ の統合が必要です。GenomeStudio ル、マーカー、そして異なるアッセイ フレームワークではゲノムワイドな 間における傾向を見つけために、 データを高解像度に効率よく解析で GenomeStudioソフトウェアは様々 きるように結果を表示することがで な視覚的なプロットとツールを提供 きます。 しています(Table 1)。折れ線グラフ、 プロジェクトの作成 GenomeStudioソフトウェアは新規 プロジェクトの作成が容易にでき、 直感的なウィザードを使って入力す るデータの場所を指定することがで きます。プロジェクトを作成する と、各実験タイプに関連する全ての データを表示させ、視覚化することが できます。Infinium® LIMS、サンプル トラッキングおよびロボットによ る自動化コントロールをお使いの 場合は、Infiniumジェノタイピング アッセイ用のプロジェクト管理と これらのサンプルトラッキングを GenomeStudioソフトウェアで統合 することが可能です。こうしたシス テムと指定されたイルミナワークフ ローにより、さらなる高スループッ トが実現されるのです。 アプリケーションに特化した解析モ ジュール GenomeStudioモジュールは、幅 広いイルミナアッセイおよびアプリ ケーションに対応しています。ソフ トウェアにモジュールを組み込むこ とでアッセイに対応した強力な解析 を行い、また必要であればモジュー ヒストグラム、散布図、円グラフ、 頻度プロット、ヒートマップなどか TABLE 1: 視覚化される解析結果 らこうした視覚化データを選択する 全体像の可視化 ことができ、遺伝子、タンパク発現 IGV (Illumina Genome Viewer) レベルやメチル化レベルを同定する ICB (Illumina Chromosome Browser) ための異なる実験条件から得られた ISV (Illumina Sequencing Viewer) サンプルを容易に比較することがで GRAPHS きます。 視覚的なツールを用いて大まかな傾 樹状図およびクラスター解析 ヒートマップ 散布図 向や特定領域を見つけた後は、個々 ヒストグラム のデータポイントを観察することが 折れ線グラフ 必須です。GenomeStudioソフトウェ 箱型図 アではSNPジェノタイプ、スプライ 頻度プロット スジャンクション、遺伝子あるいは 円グラフ エクソン発現レベル、CpG座位メチ 表 ル化状態、タンパク結合部位の状態 サンプル表 の各ポイントを理解するために表で シーケンスあるいはレーン表 データを確認することができます。 SNP表 これらの表は並べ替えを行うことが でき、データを非表示、再表示する ことも可能です。また、下流解析の ために表のデータをエクスポートす ることもできます。 アリル表 プローブ表 遺伝子、エクソン、ジャンクション表 その他アッセイ結果表 ILLUMINA® SYSTEMS AND SOFTWARE ルごとにアプリケーションの更新を 行うことができます。GenomeStudio モジュールはDNAシーケンス、クロ FIGURE 2: アラインされたリードからのSNP同定。DNAシーケンスモジュールにて 表示 マチン免疫沈降シーケンス(ChIPSeq)、mRNAシーケンスといったシー ケンスデータに対応したものから、マ イクロアレイから得られるジェノタイ ピング、遺伝子発現、メチル化、免疫 タンパクアッセイなど、多様なイルミ ナのアプリケーションをサポートして います。 DNAシーケンスモジュール(DS) Genome AnalyzerとPipelineソフトウェ アから得られたDNAシーケンスデー タを解析し、SNPや染色体ブレイク ポイント領域の探索および同定を行 います。視覚化ツールではゲノムに マップされたコンセンサスなリード を表示し、文字色を変えてSNPを表 示します(Figure 2)。新規に発見し たSNPは、カスタムのiSelect® ジェ ノタイピングアレイデザインに反映 させることができます。 ChIPシーケンスモジュール(CS) イルミナGenome Analyzerを用 いた 全 ゲ ノ ム ク ロ マ チ ン 免 疫 沈 降 シーケンスから得られたデータを元 に、GenomeStudio ChIPシーケンスモ ジュールで網羅的なDNA関連タンパ ク結合部位マップを表示することが できます。異なる実験グループ間の 結合レベルは、表あるいはICVで塩基 配列、領域、ピークの比較できます。 RNAシーケンスモジュール(RS) Genome AnalyzerおよびPipelineソフ トウェアから得られるmRNAシーケ ンスのデータはGenomeStudio RNA シーケンスモジュールで視覚化し、発 現レベルと多型探索を行います。この モジュールでは、Genome Analyzer Pipelineソフトウェアからのデータを 集め、デジタル遺伝子発現プロファ イリングとしてある特定エクソン、遺 シーケンスリードをアライン(黄色と紫のブロック) し、ICBにてリファレンスゲノムに重ね ます。同定されたSNPは赤文字で表示され、SNPデータ記録されます。リファレンスゲノ ムにアラインされたリードに、SNPコールされた位置を示す定規と共に、同定された2つ のSNPが表示されています。 伝子、スプライスジャンクション内に リティは内部コントロールおよび マップするリードの頻度をカウント QC機能により迅速に確認できま します。データはGenomeStudioソ す。各SNPはGenoPlotで表示し、必 フトウェアで表あるいはプロットと 要であれば修正することも可能です して視覚化されます(Figure 3)。IGV (Figure 4)。ジェノタイプ統計およ では、既知のシーケンスおよびスプ び結果のサマリーは自動的にリポー ライスジャンクションにアラインす トされ、下流解析のための他の解析 ることでトランスクリプトームにお ソフトウェアにエクスポートするこ けるコンセンサスリードを表示しま とができます。 す。cSNPやスプライス多型は、ICB 構造多型の解析は、ジェノタイピン により1塩基解像度での確認および グ用のマーカーと強度のみを使うプ 同定が可能です。 ジェノタイピングモジュール(GT) BeadArrayリーダー、iScanシステ ム、あるいはBeadXpressリーダーか らのGoldenGateおよびInfiniumジェ ノタイピングアッセイを用いたデー タは、GenomeStudioジェノタイピン グモジュールで解析します。生デー タ補正やクラスタリング、ジェノタ イプコールなどの一次解析はジェノ タイピングモジュールのアルゴリズ ムを用いて行われます。データクォ ローブを使い、ヘテロ接合性の消失 (LOH)やコピー数異常多型(CNV) の計算をおこなうアルゴリズムを用 いて同定します。同定された構造多 型はブックマーク(自動ブックマー ク機能を利用)することができ、ICB やIGVを用いて染色体全体にわたって 観察することができます。またIGV で、CNV 値やlog R比、Bアリル頻度 および複数のサンプルのブックマー クを表示するデータプロットも作成 することができます。 ILLUMINA® SYSTEMS AND SOFTWARE タンパク解析モジュール(PT) FIGURE 3: RNAシーケンスアリル表 VeraCodeビーズを用いたカルボキシ ル基のデータはBeadXpressリーダー で読み取りを行い、タンパク解析モ ジュールを用いて解析します。標準 曲線あるいはサンプル間のタンパ ク 発現差から検体の濃度を決定するこ とができます。mRNAの発現レベル と比較することも場合によっては可 能です。折れ線グラフ、ヒストグラム、 樹状図、頻度プロット、円グラフ、箱型 プロット、ヒートマップ、散布図 、 表、遺伝子クラスター樹状図などに より、結果を表示します。 複数のアプリケーションを支える 統合解析 複雑な遺伝多型解析を行うために、 フローセルから得られる1億3000万リード以上のシーケンス情報はRNAシーケンス (左)のシー ケンス表によりリアルタイムに視覚化することができます。cSNPとコールされた塩基はアリル 表(右)にて個々に確認できます。 研究者のみなさまはイルミナの多様 なアッセイおよびプラットフォーム をお使いいただくことができま す。GenomeStudioソフトウェアは 遺伝子発現モジュール(GX) メチル化モジュール(M) BeadArrayリーダー、iScanシステ BeadArrayリーダー、iScanシステ ム、BeadXpressリーダーから得られる ム、BeadXpressリーダーで得られる Hyb、DASL、全ゲノムDASL、 マイクロアレイDNAメチル化データ マイクロRNAプロファイリングの は、メチル化モジュールで解析しま Direct データは遺伝子発現モジュールを用 す。このモジュールはメチル化の度 いて解析します。このモジュールで 合い(β値)を計算し、実験グルー は連続性のあるデータから遺伝子レ プ間のメチル化レベルを解析しま ベルの統計解析ツールを用いて意味 す。CpGアイランドのメチル化状態 のある結果を導きます。発現差解析 はIGVおよびICBを使い、ゲノム全域 には折れ線グラフやヒストグラム、 にわたって視覚化されます。1塩基 樹状図、箱型プロット、ヒートマッ の解像度をもつ結果は折れ線グラ プ、散布図、頻度プロット、円グラ フ、散布図、頻度プロット、円グラ フ、表、遺伝子クラスター樹状図など フ、ヒストグラム、樹状図、箱型プ の様々なツールを使い視覚化します。 ロット、ヒートマップなどを用いて また、GenomeStudioソフトウェアに 表示します。またメチル化データは はサンプルやグループ、グループセッ GenomeStudioプロジェクト内で遺伝 ト、そして関連プロジェクト解析など 子発現プロファイリングデータと統 系統的にまとめられるシンプルなデー 合することができ、メチル化サイト タ管理ツールがあります。 (β値)と遺伝子発現差(p値)の相 関を解析することができます。 強力な統合解析をサポートし、最小 限のデータ調整により作成したプロ ジェクト内で様々なアッセイタイプ FIGURE 4: ジェノタイピングモジュ ールGENOPLOT GenomeStudioジェノタイピングモジュー ルで表示するGenoPlotです。データはジ ェノタイピングコールに基づき、色づけさ れています(赤はAA、緑はAB、青はBB)。 あるSNPにおけるジェノタイプは、標準ク ラスターの位置と相対的して、シグナル強度 (Norm R, Y軸)あるいはアリル頻度(Norm Theta、X軸)を元にサンプル(データポイン ト) ごとにコールされます。 ILLUMINA® SYSTEMS AND SOFTWARE ムを使います。ジェノタイプコー FIGURE 5: 遺伝子発現モジュール ヒートマップ ル、CNV同定、シーケンスリード のアライメント、エクソンおよび スプライスジャンクションのカウ ント、SNPコールなどのツールは GenCall、GenTrain、cnvPartition、 ELAND、CASAVAといったアルゴリ ズムを用いて解析します。 GenCall BeadCh ipからの2色シグナル強度 から得られるマーカーのジェノタ イプコールは、標準的なジェノタ イプクラスターを比較することで 行われます。Infinium BeadChipアッ セイからの数十万におよぶコール は、GenomeStudioソフトウェア上 でGenCallアルゴリズムを用いて迅速 遺伝子発現モジュールのヒートマップを使うことで大きなデータセットの視覚化および解 析を簡易化します。このヒートマップ樹状図はターゲットIDと発現差値から構成されてい ます。 から得られたデータをまとめること 洗練されたアルゴリズム ができます。例えば、メチル化およ GenomeStudioソフトウェアは、 び遺伝子発現アッセイのデータは イルミナのアッセイ全てを解析す GenomeStudio遺伝子発現モジュー る分子生物学インフォマティクス ルプロジェクトの表でまとめて統計 プラットフォームです。一次解析は 処理を表示させ、統合したグラフを GenomeStudioソフトウェアあるい 作成できます。 は上流のGenome Analyzer Pipeline ソフトウェアの複数のアルゴリズ かつ再現性よく視覚化されます。必 要であれば、クラスターの位置同定 もGenTrainアルゴリズムを用いて行 うことができます。 cnvPartition cnvPartitionはイルミナBeadChip ジェノタイピングアレイデータ(シ グナル強度およびジェノタイプコー ル)からコピー数の変化領域を同定 し、信頼値とともにコピー数を計算 します。CNV領域におけるコピー数 TABLE 2: GenomeStudioシステム最低仕様 パラメーター CPU速度 プロセッサー メモリー シーケンスデータ マイクロアレイデータ マイクロアレイ およびシーケンスデータ Intel Pentium 2.0 GHz 以上 Intel Celeron Duo 以上 Intel Celeron Duo 以上 32-bit or 64-bit 64-bit* 64-bit 2 GB 以上 4 GB 以上 4 GB 以上 ハードドライブ 250 GB 以上 100 GB 以上 250 GB 以上 モニター表示 1,280 × 1,024 1,280 × 1,024 1,280 × 1,024 オペレーティング システム Windows XP SP2 あるいは Vista Windows XP SP2 あるいは Vista Windows XP SP2 あるいは Vista Specific OS Requirements Microsoft .NET Framework 3.5 Microsoft .NET Framework 3.5 Microsoft .NET Framework 3.5 1 GbE 以上 1 GbE 以上 1 GbE 以上 ネットワーク *GX および Mのデータ解析は32-bitシステムで解析可能です。 ILLUMINA® SYSTEMS AND SOFTWARE の値はGenomeStudioソフトウェア まとめ REFERENCES 内でブックマークとして記録され、 GenomeStudioソフトウェアはイル (1) http://www.illumina.com/illuminaconnect (2) http://www.illumina.com/productguide 全ゲノムにわたる染色体変異領域を ミナアッセイのデータ解析のために 視覚化することができます。 ELAND and CASAVA Genome Analyzer Pipelineソフトウェ アからの出力データはGenomeStudio モジュールで視覚化できます。シ ン グルあるいはペアエンド法による シーケンスリードのゲノムへのアライ メントはELANDを使って行います。 CASAVAソフトウェアはリードをゲノ ムにアライメントした後に、SNPアリ ルコール、エクソン、遺伝子、スプラ イスジャンクションのカウントなどの 解析を行うために使います。 オープンアーキテクチャー GenomeStudioソフトウェアは柔軟 なオープンアーキテクチャーを提 供しており、下流解析に使うその 他のデータ解析ツールへのシンプ ルな統合を可能にしています。API (Application Programming Interface) により、GenomeStudioソフトウェア が解析ワークフローのコアとなるよう に設計されています。GenomeStudio ソフトウェアは各モジュールのAPI を提供しており、研究者がプラグ インを使ってGenomeStudioソフ トウェアからデータをエクスポー トし、下流解析ツールにつなげる ことが可能となっています。ま た、illumina・Connectというその他 のデータ解析ツールとのパートナー シッププログラムでは、このオープ ンアーキテクチャーを最大限に生か せるよう、ソフトウェア関連会社と オープンソースコミュニティと協力 しています。このプログラムにより 様々なillumina・Connectパートナー と複数のカスタムリポートおよびプ ラグインが生まれています。1. 開発され、多様性および統合性に富 むプラットフォームを提供していま す。シーケンス、ジェノタイピン グ、遺伝子発現などの実験を行って いる研究者のみなさまは、この強力 なソフトウェアをお使いいただけま す。アッセイに対応したモジュール から得られる一次解析データの視覚 化は、全ゲノム多型の詳細かつ高レ ベルな表示を可能にしました。ま た、統合解析は異なるモジュールか ら得られるデータをひとつのプロジ ェクトとして取りまとめることがで きます。 ILLUMINA® SYSTEMS AND SOFTWARE 製品情報 各システムには、アプリケーション に対応したGenomeStudioモジュー ルが付属しています。追加ライセン スは別途ご購入いただくことが可能 です。2. 製品名 GenomeStudio シーケンスセット (DS, RS, CS モジュール) ライセンス数 カタログ番号 1 SW-820-1001 5 SW-820-5001 エンタープライズ SW-820-2001 1 SW-600-1001 5 SW-600-5001 1 SW-500-1001 5 SW-500-5001 1 SW-700-1001 5 SW-700-5001 1 SW-810-1001 5 SW-810-5001 エンタープライズ SW-810-2001 1 SW-100-1001 5 SW-100-5001 1 SW-200-1001 5 SW-200-5001 1 SW-300-1001 5 SW-300-5001 5 SW-400-6001 1 SW-810-1001 5 SW-810-5001 エンタープライズ SW-810-2001 GenomeStudio DNAシーケンスモジュール GenomeStudio ChIPシーケンスモジュール GenomeStudio RNAシーケンスモジュール GenomeStudio マイクロアレイセット (GT, GX, M モジュール含む) GenomeStudio ジェノタイピングモジュール GenomeStudio 遺伝子発現モジュール GenomeStudio メチル化モジュール GenomeStudio タンパク解析モジュール GenomeStudio Software 統合システムセット(全てのモジュール) ILLUMINA® SYSTEMS AND SOFTWARE イルミナ株式会社 103-0025 〒108-0014 東京都港区芝 5-36-7 三田ベルジュビル 22階 5F 東京都中央区日本橋茅場町 2-13-13 共同ビル 代理店 Tel (03) 4578-2800 Fax Tel (03)4578-2800 Fax (03)4578-2810 (03)4578-2810 www.illuminakk.co.jp www.illuminakk.co.jp 本製品の使用目的は研究に限定されます。 © 2009 Illumina, Inc. All rights reserved. Illumina、Solexa、Making Sense Out of Life、Oligator、Sentrix、GoldenGate、DASL、BeadArray、Array of Arrays、Infinium、BeadXpress、VeraCode、IntelliHyb、iSelect、CSPro、 iScan、GenomeStudio は Illumina の登録商標または商標です。本書に記載されたその他の商標および名称の所有権はそれぞれの所有者に帰属します。 Pub. No. 970-2008-J022 08MAY09