...

MiSeqを使用した実験計画: サンプル調製とワークフロー

by user

on
Category: Documents
25

views

Report

Comments

Transcript

MiSeqを使用した実験計画: サンプル調製とワークフロー
MiSeqを使用した実験計画:
サンプル調製とワークフロー
酒井 名朋子
Illumina Technical Support
© 2012 Illumina, Inc. All rights reserved.
Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium,
iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of
Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
本日のOutline
2
1.
IEMからサンプル調製、MSRまでの流れ
2.
主要なWork flowのご紹介
3.
そのほかのWork flowについて
MiSeqのWorkFlow:サンプルからData解析まで
Input DNAと
サンプル調製
3
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
Input DNAとサンプル調製
• 論文等を参照し、DNA/RNA
を準備する
• Illumina.comサイトの“kit
selector” を参照し、使用す
るサンプル調整キットを選
択
http://www.illumina.com/Media/products/product-selector.html?iframe
Input DNAと
サンプル調製
4
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
サンプルシートの作成
Illumina Experiment
Manager を使用し、サ
ンプルシートを作成する
Input DNAと
サンプル調製
5
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
サンプルシートの作成
MiSeqを選択
Input DNAと
サンプル調製
6
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
サンプルシートの作成
Categoryの選択
Input DNAと
サンプル調製
7
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
サンプルシートの作成
Workflowの選択
Input DNAと
サンプル調製
8
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
サンプルシートの作成
サンプル情報とRunのサ
イクル数、Index情報を
入力する
Input DNAと
サンプル調製
9
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
Sample Sheetの作成
10
MiSeqでRunを行う
研究Design に沿って、
Coverageを決定し、Output
を考慮してサイクル数を決
定する
Input DNAと
サンプル調製
サンプルシー
トの作成
MiSeqでRun
を行う
**v3Upgrade後に可能
11
Data 解析
Data 解析
• 標準Workflowの場合は
MiSeq Reporterもしくは
Basespace を使用
• CASAVAやほかのソフト
ウェアを使用の場合は
“FASTQ only” でFASTQの
み出力させる
Input DNAと
サンプル調製
12
サンプルシー
トの作成
MiSeqでRun
を行う
Data 解析
本日のOutline
1.
IEMからサンプル調製、MSRまでの流れ
2.
主要なWork flowのご紹介
3.
そのほかのWork flowについて
13
IEMで選択できる、MiSeqでのアプリケーション
DNA
RNA
14
IEMで選択できる、MiSeqでのアプリケーション
DNA
RNA
15
FASTQ Only ワークフロー
Demultiplexing を行った後、 FASTQ file を出力する
二次解析は行わない
@:73:FCA010H_smallRNA:1:1:18251:5160 1:N:0:0
TGAGGGGAAGTGAGGGAAGGAAAGAAGGGAAAGGGGG
+
11+4++)))222,22+1+++1**1*)*18)))0)))'
@:73:FCA010H_smallRNA:1:1:19482:5161 1:N:0:0
GGAAGGGGGGAGAAGAGGGAGAAAGGGAGGAAAGGAA
+
1+++42)0)/&&)(+(+()&)&((((+()&+((((((
@:73:FCA010H_smallRNA:1:1:15601:5161 1:N:0:0
AGAAAGAAAAGGAGGAAAGGAGGGGAAAAGGAGGGGG
+
+11++2+++++++2)+++33+22))))))*000)(-'
16
想定される
アプリケーション
• 3rd partyソフトウェアでの解
析
FASTQ Only
MiSeq Run結果から何が得られるか?
Demultiplex サマリー
• それぞれのIndexにアサインされた割合
FASTQ files
•
シーケンスとQuality情報
採用する前の注意事項
• 生Dataのみの出力
• MSRで読み越したAdapter のTrimming が可能
• FASTQファイルからほかの解析に進むことができる
17
IEMで選択できる、MiSeqでのアプリケーション
DNA
RNA
18
Resequencing – Small Genome Sequencing
Reference配列が存在する場合のSmall Genome全長の解析
想定されるアプリケーション
SNP 探索
de novo 結果のValidation
Indelや組み換えの探索
≤ 250 MbのSmall Genomeに最適
Drosophila melanogaster (~120 Mb)
Arabidopsis thaliana (~115 Mb)
Caenorhabditis elegans (~100 Mb)
Fungi (~ 30 Mb)
Yeast (~12 Mb)
Bacteria (0.5-10 Mb)
Viruses (3kb-1.3 Mb)
19
Resequencing – Small Genome Sequencing
MiSeq ReporterからのOutput fileは?
vcf files
•
variant call format –indel/SNP variants の情報
bam files
•
binary alignment map – 圧縮されたアライメント情報
どのサンプル調製キットを使用?
20
どのKitを使用するか?
Input DNA量
TruSeq DNA sample prep
1 µg gDNA
TruSeq DNA nano
100-200ng gDNA
TruSeq DNA PCR Free
1-2 ug gDNA
Nextera DNA sample prep
50 ng gDNA
Nextera XT sample prep kit
1 ng gDNA
MSR での
Workflow
Resequencing
Resequencing – Small Genome Sequencing
採用する前の注意事項
 Reference Genomeがあるか?
 Genomeサイズは?
 どの程度のCoverageが必要か?
 2x250で8Gbまでのyield
 265Mb のゲノムの場合はx30まで
 ヒトゲノムの場合は2.4x まで
http://www.illumina.com/documents/products/technotes/technote_coverage_calculation.pdf
21
IEMで選択できる、MiSeqでのアプリケーション
DNA
RNA
22
Targeted Resequencing –
TruSeq Amplicon
48-1536か所までのターゲット配列の解析
TruSeq Custom Amplicon (TSCA):
DesignStudioで650kbまでのカスタム領
域をデザイン
TruSeq Amplicon Cancer Panel
(TSACP)ではPrefixのがんを標的とした
48遺伝子のアンプリコンを解析
想定されるアプリケーション
Variant 探索
バリデーションとスクリーニング
絞ったターゲットの解析
23
Targeted Resequencing –
TruSeq Amplicon
MiSeq ReporterからのOutput fileは?
vcf files
•
variant call format –indel/SNP variants の情報
bam files
•
binary alignment map – 圧縮されたアライメント情報
どのサンプル調製キットを使用するか?
どのKitを使用するか?
TruSeq Custom Amplicon (TSCA)
TruSeq Amplicon Cancer Panel
(TSACP)
24
Input DNA量
MSR での
Workflow
1サンプルあた
り250 ng
Custom Amplicon
Targeted Resequencing –
TruSeq Amplicon
採用する前の注意事項
• Enrichmentよりサンプル数は多い
• 現在はヒト、ラット、マウス、牛にのみ対応
• Ampliconのサイズは150bp, 175bp, 250bp, 425bpの4種類
• カスタムデザインの設計はDesign Studioのみ対応
多ターゲット/少サンプル数
TruSeq/Nextera Enrichment
25
少ターゲット/多サンプル数
TruSeq Amplicon
Nextera XT
Targeted Resequencing –
TruSeq Amplicon
採用する前の注意事項
• Enrichmentよりサンプル数は多い
• 現在はヒト、ラット、マウス、牛にのみ対応
• Ampliconのサイズは150bp, 175bp, 250bp, 425bpの4種類
• カスタムデザインの設計はDesign Studioのみ対応
http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf
26
本日のOutline
1.
IEMからサンプル調製、MSRまでの流れ
2.
主要なWork flowのご紹介
3.
そのほかのWork flowについて
27
Workflows
DNA
RNA
28
Workflows
DNA
RNA
29
Workflows
DNA
RNA
30
Small Genome Sequencing – Assembly
Reference配列がない場合のSmall Genomeの全長解析
想定されるアプリケーション
微生物・ウイルスゲノムのアセンブル
非標準生物
BAC/TAV スクリーニング
組み換え状況の確認
31
MiSeq ReporterからのOutput File?
FASTA files
•
•
Complete配列
Contigs
Small Genome Sequencing – Assembly
Reference配列がない場合のSmall Genomeの全長解析
採用する前の注意事項
• ゲノムサイズが小さいほど良い(bacteria and viruses ≤ 10Mb)
•
10Mbを超えるとCoverageと解析で問題が生じる
• Reference Genomeは不要
使用するのはMiSeqRun結果のみ
 3rdParty ソフトウェアの前のスクリーニングに最適
 MSR では1 Runの結果のみ解析可能
•
• 組み換えの検出にはReference配列が必要
32
Small Genome Sequencing – Assembly
どのサンプル調製キットを使用するか?
•
33
どのKitを使用するか?*
Input DNA量
TruSeq DNA sample prep
1 µg gDNA
TruSeq DNA Nano
100-200ng gDNA
TruSeq DNA PCR-Free
1-2ug gDNA
Nextera DNA sample prep
50 ng gDNA
Nextera XT sample prep
1 ng DNA
Nextera Mate Pairを使用する場合はMSRでは対応不可
MSR でのWorkflow
Assembly
Workflows
DNA
RNA
34
Workflows
DNA
RNA
35
Targeted Resequencing – Enrichment
ヒトゲノムのターゲット配列の解析
想定されるアプリケーション
• 変異の探索
• Validation とスクリーニング
MiSeq ReporterからのOutput Fileは?
vcf files
•
variant call format –indel/SNP variants の情報
bam files
•
36
binary alignment map – 圧縮されたアライメント
情報
Targeted Resequencing – Enrichment
ヒトゲノムのターゲット配列の解析
Nextera Rapid Capture Exome/Expanded Exome
• Illuminaでデザインされたコンテンツ
• 37 or 63 Mb exome ターゲット
• MiSeq v3 で対応
Nextera Rapid Capture Custom Enrichment
• Design Studio で設計するカスタムデザイン
• 領域0.5-15 Mb のカスタムコンテンツ
• ターゲットサイズによってはMiSeq v2 でも対応可能
TruSight Enrichment
• イルミナでデザインされたコンテンツ:cancer, autism, cardiomyopathy,
inherited disease, exome content
• Rapid captureのワークフロー
37
Targeted Resequencing – Enrichment
採用する前の注意事項
• MiSeq v2 で可能か?
• MiSeq v3 以降を推奨
• ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する
• Reference Genomeが必要
• Design studio にてprobeをデザイン
• Humanのみに対応
http://www.illumina.com/documents/products/technotes/technote_optimizing_coverage_for_target
ed_resequencing.pdf
38
Targeted Resequencing – Enrichment
採用する前の注意事項
• MiSeq v2 で可能か?
• MiSeq v3 以降を推奨
• ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する
• Reference Genomeが必要
• Design studio にてprobeをデザイン
• Humanのみに対応
http://support.illumina.com/downloads/sequencing_coverage_calculator.ilmn
39
Targeted Resequencing – Enrichment
採用する前の注意事項
• MiSeq v2 で可能か?
• MiSeq v3 以降を推奨
• ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する
• Reference Genomeが必要
• Design studio にてprobeをデザイン
• Humanのみに対応
どのサンプル調製キットを使用するか?
どのKitを使用するか?*
Input DNA量
MSR でのWorkflow
Nextera Rapid Capture
Exome / Expanded Exome /
Custom
50 ng gDNA per sample
Enrichment
TruSight Enrichment
40
50 ng gDNA per sample
Enrichment
Workflows
DNA
RNA
41
Targeted Resequencing – PCR Amplicon
Reference配列のあるカスタムDesignのPCR Amplicon、
Small GenomeやPlasmid、クローンのシーケンス
想定されるアプリケーション
•
•
•
•
•
非モデル生物の遺伝学
血清中のウイルスの検出
ノックアウト・薬剤のスクリーニング
FFPE や凍結サンプルのTumor/Normalの解析
多検体のGenotyping
MiSeq ReporterからのOutput Fileは?
vcf files
•
variant call format –indel/SNP variants の情報
bam files
•
42
binary alignment map – 圧縮されたアライメント情報
Targeted Resequencing – PCR Amplicon
採用する前の注意事項
• ターゲット領域をMapするためにはManifestファイルを事前に準備する必要が
ある
•
•
カスタムデザインのPrimerが必要(サポート外)
Nextera XTの採用を推奨
• 長いPCR amplicons(>300bp)を準備、nexteraXTでLibrary調製
• >2000 bpを推奨
https://icom.illumina.com/MyIllumina/Bulletin/kTtc2xXyKk6ju9Z4jcB2Rw/how-to-use-nextera-xt-withpcr-amplicons
43
Targeted Resequencing – PCR Amplicon
採用する前の注意事項
• ターゲット領域をMapするためにはManifestファイルを事前に準備する必要が
ある
•
•
カスタムデザインのPrimerが必要(サポート外)
Nextera XTの採用を推奨
• 長いPCR amplicons(>300bp)を準備、nexteraXTでLibrary調製
• >2000 bpを推奨
どのサンプル調製キットを使用するか?
どのKitを使用するか?
Nextera XT
44
Input DNA量
MSR でのWorkflow
1 ng
PCR Amplicon
Plasmind(FQ)
Workflows
DNA
RNA
45
Targeted Resequencing – Metagenomics 16S rRNA
16S rRNA 遺伝子を使用して存在する微生物の
PopulationのProfileを解析
想定されるアプリ
ケーション
•
環境サンプル
• 腸内細菌
MSRからのOutput
File?
•
46
Kingdom からGenusまでの分類
結果
Targeted Resequencing – Metagenomics 16S rRNA
採用する前の注意事項
• Low diversity サンプル:MCS2.2以上にUpgrade
• 参照文献は以下の2報だが、Optimizaionが必要
•
Caporaso JG et al. (2011) Global patterns of 16S rRNA diversity at a depth
of millions of sequences per sample. PNAS 108:4516–4522.
•
Caporaso JG et al. (2012) Ultra-high-throughput microbial community
analysis on the Illumina HiSeq and MiSeq platforms. The ISME Journal 14.
http://res.illumina.com/docu
ments/products/appnotes/a
ppnote_miseq_16s.pdf
47
Workflows
DNA
RNA
48
Targeted Resequencing – Amplicon DS
TruSight Tumor のためのワークフロー
想定されるアプリケーション
•
49
• Tumor samples のSNP解析
75 アンプリコン/21kb のターゲット配列
Targeted Resequencing – Amplicon DS
TruSight Tumor Sample Preparations
想定されるアプリケーション
•
• Tumor samples のSNP解析
75 アンプリコン/21kb のターゲット配列
MSRからのOutput Fileは?
• vcf files: indel/SNP variants の情報
• bam files: 圧縮されたアライメント情報
• gVCF files: それぞれのポジションのSNP情報
• AmpliconCoverage.tsv – アンプリコンごとのCoverage情報
50
Targeted Resequencing – Amplicon DS
採用する前の注意事項
• FFPEサンプルはFFPE QC プロセスののちサンプル調製に進む:
http://res.illumina.com/documents/products/whitepapers/whitepaper_trusight_tumor_ffpe_sample_prep.pdf
• MAF<5% のminor は Amplicon DS Somatic Variant Callerを使用する
• 2x121 bp に最適化されている
どのサンプル調製キットを使用するか?
51
どのKitを使用する
か?
Input DNA量
MSR でのWorkflow
TruSight Tumor
Sample Prep
DNAのQualityにより異なる
(数百ng)
Amplicon - DS
Workflows
DNA
RNA
52
Workflows
DNA
RNA
53
Other - Library Quality Control (QC)
Large ScaleのSequencingの前のQCチェック
想定されるアプリ
ケーション
•
HiSeq/ScanSQ に進む前のPre
Screening
• Cluster Densityの確認
MSRからのOutput Fileは?
•
•
•
•
•
•
•
% Alignment
% Mismatch
PCR duplicate counting
Diversity
Insert Size
Demultiplexされたサンプルの割合
それぞれのIndexの割合
どのサンプル調製キットを使用するか?
どのKitを使用するか?
どれでもOK
54
Input DNA量
MSR でのWorkflow
Library Control (QC)
Workflows
DNA
RNA
55
Workflows
DNA
RNA
56
RNA Sequencing – small RNA
Dicer/Drosha 後のmiRNAの解析
想定されるアプリ
ケーション
• Small RNA 探索
• Gene Regulation
• 薬剤の効果測定
57
MSRからのOutput Fileは?
•
•
•
•
FASTQ files
既知のhuman miRNAへのMapping結果
存在比率
small RNA 、 mRNA、 genomic sequence、
mitochondrial sequenceの存在比率
RNA Sequencing – small RNA
採用する前の注意事項
• Human以外の生物や、miRbaseに存在しないmiRNAの場合はほかの解
析ツールが必要
 TruSeq small RNA kitはほかの生物にも対応
 サンプルのPlex数は必要なData量から算出
どのサンプル調製キットを使用するか?
58
どのKitを使用するか?
Input DNA量
MSR でのWorkflow
TruSeq Small RNA
10-50 ng のsmall RNA
1 µg total RNA
Small RNA
Workflows
DNA
RNA
59
RNA sequencing – RNA-seq
mRNAの発現量と配列の解析
想定されるアプリ
ケーション
•
•
•
遺伝子発現量の解析
スプライシングJunctionの
解析
トランスクリプトーム解析
MSRからのOutput File?
•
•
FASTQ files
3rd party tool (BowTie)にて解析
http://www.illumina.com/documents/products/datasheets/datasheet_rnaseq_analysis.pdf
60
RNA sequencing – RNA-seq
採用する前の注意事項
• FASTQファイルから3rd partyソフトウェアを使用する
• 研究目的に合わせて、MiSeqからのData量で十分か考える必要がある
• MiSeqからのDataでは微量な変化や低頻度のTranscriptを検出するのは難
しい場合がある。
• どのようなRNAを検出したいか?
どのサンプル調製キットを使用するか?
61
どのKitを使用するか?
Input DNA量
TruSeq RNA sample prep
0.1 - 4 µg of total RNA
TruSeq Stranded mRNA
0.1 – 4 µg of total RNA
TruSeq Total RNA
0.1 – 1 µg total RNA
(degradation compatible)
MSR での
Workflow
RNA-Seq
Resources
Must Have Documents:
• MiSeq Reporter User Guide:
http://support.illumina.com/documents/documentation/Software_Documentation/MiSeqReporter/MiSeqReporter_UserGuid
e_15028784_J.pdf
• MiSeq Reporter Quick Reference Cards:
http://support.illumina.com/downloads/miseq_workflow_quick_reference_cards.ilmn
• iEM User Guide:
http://support.illumina.com/documents/documentation/Software_Documentation/IEM/Illumina_Experiment_Manager_Guide
_15031335_E.pdf
Online Support
•MyIllumina Bulletins: https://icom.illumina.com/Home/Index
•Support/Training page:
http://www.illumina.com/support/training.ilmn
•Support/Training/Webinars: https://my.illumina.com/Webinar/Index
(also found under MyIllumina/Support Webinars)
62
Resources
Useful Technotes and Bulletins
•Calculating Coverage:
•http://www.illumina.com/documents/products/technotes/technote_coverage_calculation.pdf
•http://www.illumina.com/documents//products/technotes/technote_optimizing_coverage_for_targeted_resequencing.pdf
•Nextera XT for PCR Amplicons
•https://icom.illumina.com/MyIllumina/Bulletin/kTtc2xXyKk6ju9Z4jcB2Rw/how-to-use-nextera-xt-with-pcr-amplicons
•PCR Amplicon Bulletin
•https://icom.illumina.com/MyIllumina/Bulletin/cC6za4-hLEmpi09-IUBi_w/how-can-i-improve-the-data-quality-of-my-pcrampli
63
Fly UP