Comments
Description
Transcript
MiSeqを使用した実験計画: サンプル調製とワークフロー
MiSeqを使用した実験計画: サンプル調製とワークフロー 酒井 名朋子 Illumina Technical Support © 2012 Illumina, Inc. All rights reserved. Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners. 本日のOutline 2 1. IEMからサンプル調製、MSRまでの流れ 2. 主要なWork flowのご紹介 3. そのほかのWork flowについて MiSeqのWorkFlow:サンプルからData解析まで Input DNAと サンプル調製 3 サンプルシー トの作成 MiSeqでRun を行う Data 解析 Input DNAとサンプル調製 • 論文等を参照し、DNA/RNA を準備する • Illumina.comサイトの“kit selector” を参照し、使用す るサンプル調整キットを選 択 http://www.illumina.com/Media/products/product-selector.html?iframe Input DNAと サンプル調製 4 サンプルシー トの作成 MiSeqでRun を行う Data 解析 サンプルシートの作成 Illumina Experiment Manager を使用し、サ ンプルシートを作成する Input DNAと サンプル調製 5 サンプルシー トの作成 MiSeqでRun を行う Data 解析 サンプルシートの作成 MiSeqを選択 Input DNAと サンプル調製 6 サンプルシー トの作成 MiSeqでRun を行う Data 解析 サンプルシートの作成 Categoryの選択 Input DNAと サンプル調製 7 サンプルシー トの作成 MiSeqでRun を行う Data 解析 サンプルシートの作成 Workflowの選択 Input DNAと サンプル調製 8 サンプルシー トの作成 MiSeqでRun を行う Data 解析 サンプルシートの作成 サンプル情報とRunのサ イクル数、Index情報を 入力する Input DNAと サンプル調製 9 サンプルシー トの作成 MiSeqでRun を行う Data 解析 Sample Sheetの作成 10 MiSeqでRunを行う 研究Design に沿って、 Coverageを決定し、Output を考慮してサイクル数を決 定する Input DNAと サンプル調製 サンプルシー トの作成 MiSeqでRun を行う **v3Upgrade後に可能 11 Data 解析 Data 解析 • 標準Workflowの場合は MiSeq Reporterもしくは Basespace を使用 • CASAVAやほかのソフト ウェアを使用の場合は “FASTQ only” でFASTQの み出力させる Input DNAと サンプル調製 12 サンプルシー トの作成 MiSeqでRun を行う Data 解析 本日のOutline 1. IEMからサンプル調製、MSRまでの流れ 2. 主要なWork flowのご紹介 3. そのほかのWork flowについて 13 IEMで選択できる、MiSeqでのアプリケーション DNA RNA 14 IEMで選択できる、MiSeqでのアプリケーション DNA RNA 15 FASTQ Only ワークフロー Demultiplexing を行った後、 FASTQ file を出力する 二次解析は行わない @:73:FCA010H_smallRNA:1:1:18251:5160 1:N:0:0 TGAGGGGAAGTGAGGGAAGGAAAGAAGGGAAAGGGGG + 11+4++)))222,22+1+++1**1*)*18)))0)))' @:73:FCA010H_smallRNA:1:1:19482:5161 1:N:0:0 GGAAGGGGGGAGAAGAGGGAGAAAGGGAGGAAAGGAA + 1+++42)0)/&&)(+(+()&)&((((+()&+(((((( @:73:FCA010H_smallRNA:1:1:15601:5161 1:N:0:0 AGAAAGAAAAGGAGGAAAGGAGGGGAAAAGGAGGGGG + +11++2+++++++2)+++33+22))))))*000)(-' 16 想定される アプリケーション • 3rd partyソフトウェアでの解 析 FASTQ Only MiSeq Run結果から何が得られるか? Demultiplex サマリー • それぞれのIndexにアサインされた割合 FASTQ files • シーケンスとQuality情報 採用する前の注意事項 • 生Dataのみの出力 • MSRで読み越したAdapter のTrimming が可能 • FASTQファイルからほかの解析に進むことができる 17 IEMで選択できる、MiSeqでのアプリケーション DNA RNA 18 Resequencing – Small Genome Sequencing Reference配列が存在する場合のSmall Genome全長の解析 想定されるアプリケーション SNP 探索 de novo 結果のValidation Indelや組み換えの探索 ≤ 250 MbのSmall Genomeに最適 Drosophila melanogaster (~120 Mb) Arabidopsis thaliana (~115 Mb) Caenorhabditis elegans (~100 Mb) Fungi (~ 30 Mb) Yeast (~12 Mb) Bacteria (0.5-10 Mb) Viruses (3kb-1.3 Mb) 19 Resequencing – Small Genome Sequencing MiSeq ReporterからのOutput fileは? vcf files • variant call format –indel/SNP variants の情報 bam files • binary alignment map – 圧縮されたアライメント情報 どのサンプル調製キットを使用? 20 どのKitを使用するか? Input DNA量 TruSeq DNA sample prep 1 µg gDNA TruSeq DNA nano 100-200ng gDNA TruSeq DNA PCR Free 1-2 ug gDNA Nextera DNA sample prep 50 ng gDNA Nextera XT sample prep kit 1 ng gDNA MSR での Workflow Resequencing Resequencing – Small Genome Sequencing 採用する前の注意事項 Reference Genomeがあるか? Genomeサイズは? どの程度のCoverageが必要か? 2x250で8Gbまでのyield 265Mb のゲノムの場合はx30まで ヒトゲノムの場合は2.4x まで http://www.illumina.com/documents/products/technotes/technote_coverage_calculation.pdf 21 IEMで選択できる、MiSeqでのアプリケーション DNA RNA 22 Targeted Resequencing – TruSeq Amplicon 48-1536か所までのターゲット配列の解析 TruSeq Custom Amplicon (TSCA): DesignStudioで650kbまでのカスタム領 域をデザイン TruSeq Amplicon Cancer Panel (TSACP)ではPrefixのがんを標的とした 48遺伝子のアンプリコンを解析 想定されるアプリケーション Variant 探索 バリデーションとスクリーニング 絞ったターゲットの解析 23 Targeted Resequencing – TruSeq Amplicon MiSeq ReporterからのOutput fileは? vcf files • variant call format –indel/SNP variants の情報 bam files • binary alignment map – 圧縮されたアライメント情報 どのサンプル調製キットを使用するか? どのKitを使用するか? TruSeq Custom Amplicon (TSCA) TruSeq Amplicon Cancer Panel (TSACP) 24 Input DNA量 MSR での Workflow 1サンプルあた り250 ng Custom Amplicon Targeted Resequencing – TruSeq Amplicon 採用する前の注意事項 • Enrichmentよりサンプル数は多い • 現在はヒト、ラット、マウス、牛にのみ対応 • Ampliconのサイズは150bp, 175bp, 250bp, 425bpの4種類 • カスタムデザインの設計はDesign Studioのみ対応 多ターゲット/少サンプル数 TruSeq/Nextera Enrichment 25 少ターゲット/多サンプル数 TruSeq Amplicon Nextera XT Targeted Resequencing – TruSeq Amplicon 採用する前の注意事項 • Enrichmentよりサンプル数は多い • 現在はヒト、ラット、マウス、牛にのみ対応 • Ampliconのサイズは150bp, 175bp, 250bp, 425bpの4種類 • カスタムデザインの設計はDesign Studioのみ対応 http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf 26 本日のOutline 1. IEMからサンプル調製、MSRまでの流れ 2. 主要なWork flowのご紹介 3. そのほかのWork flowについて 27 Workflows DNA RNA 28 Workflows DNA RNA 29 Workflows DNA RNA 30 Small Genome Sequencing – Assembly Reference配列がない場合のSmall Genomeの全長解析 想定されるアプリケーション 微生物・ウイルスゲノムのアセンブル 非標準生物 BAC/TAV スクリーニング 組み換え状況の確認 31 MiSeq ReporterからのOutput File? FASTA files • • Complete配列 Contigs Small Genome Sequencing – Assembly Reference配列がない場合のSmall Genomeの全長解析 採用する前の注意事項 • ゲノムサイズが小さいほど良い(bacteria and viruses ≤ 10Mb) • 10Mbを超えるとCoverageと解析で問題が生じる • Reference Genomeは不要 使用するのはMiSeqRun結果のみ 3rdParty ソフトウェアの前のスクリーニングに最適 MSR では1 Runの結果のみ解析可能 • • 組み換えの検出にはReference配列が必要 32 Small Genome Sequencing – Assembly どのサンプル調製キットを使用するか? • 33 どのKitを使用するか?* Input DNA量 TruSeq DNA sample prep 1 µg gDNA TruSeq DNA Nano 100-200ng gDNA TruSeq DNA PCR-Free 1-2ug gDNA Nextera DNA sample prep 50 ng gDNA Nextera XT sample prep 1 ng DNA Nextera Mate Pairを使用する場合はMSRでは対応不可 MSR でのWorkflow Assembly Workflows DNA RNA 34 Workflows DNA RNA 35 Targeted Resequencing – Enrichment ヒトゲノムのターゲット配列の解析 想定されるアプリケーション • 変異の探索 • Validation とスクリーニング MiSeq ReporterからのOutput Fileは? vcf files • variant call format –indel/SNP variants の情報 bam files • 36 binary alignment map – 圧縮されたアライメント 情報 Targeted Resequencing – Enrichment ヒトゲノムのターゲット配列の解析 Nextera Rapid Capture Exome/Expanded Exome • Illuminaでデザインされたコンテンツ • 37 or 63 Mb exome ターゲット • MiSeq v3 で対応 Nextera Rapid Capture Custom Enrichment • Design Studio で設計するカスタムデザイン • 領域0.5-15 Mb のカスタムコンテンツ • ターゲットサイズによってはMiSeq v2 でも対応可能 TruSight Enrichment • イルミナでデザインされたコンテンツ:cancer, autism, cardiomyopathy, inherited disease, exome content • Rapid captureのワークフロー 37 Targeted Resequencing – Enrichment 採用する前の注意事項 • MiSeq v2 で可能か? • MiSeq v3 以降を推奨 • ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する • Reference Genomeが必要 • Design studio にてprobeをデザイン • Humanのみに対応 http://www.illumina.com/documents/products/technotes/technote_optimizing_coverage_for_target ed_resequencing.pdf 38 Targeted Resequencing – Enrichment 採用する前の注意事項 • MiSeq v2 で可能か? • MiSeq v3 以降を推奨 • ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する • Reference Genomeが必要 • Design studio にてprobeをデザイン • Humanのみに対応 http://support.illumina.com/downloads/sequencing_coverage_calculator.ilmn 39 Targeted Resequencing – Enrichment 採用する前の注意事項 • MiSeq v2 で可能か? • MiSeq v3 以降を推奨 • ターゲット領域とMiSeqのYieldを考慮し、Coverageで判断する • Reference Genomeが必要 • Design studio にてprobeをデザイン • Humanのみに対応 どのサンプル調製キットを使用するか? どのKitを使用するか?* Input DNA量 MSR でのWorkflow Nextera Rapid Capture Exome / Expanded Exome / Custom 50 ng gDNA per sample Enrichment TruSight Enrichment 40 50 ng gDNA per sample Enrichment Workflows DNA RNA 41 Targeted Resequencing – PCR Amplicon Reference配列のあるカスタムDesignのPCR Amplicon、 Small GenomeやPlasmid、クローンのシーケンス 想定されるアプリケーション • • • • • 非モデル生物の遺伝学 血清中のウイルスの検出 ノックアウト・薬剤のスクリーニング FFPE や凍結サンプルのTumor/Normalの解析 多検体のGenotyping MiSeq ReporterからのOutput Fileは? vcf files • variant call format –indel/SNP variants の情報 bam files • 42 binary alignment map – 圧縮されたアライメント情報 Targeted Resequencing – PCR Amplicon 採用する前の注意事項 • ターゲット領域をMapするためにはManifestファイルを事前に準備する必要が ある • • カスタムデザインのPrimerが必要(サポート外) Nextera XTの採用を推奨 • 長いPCR amplicons(>300bp)を準備、nexteraXTでLibrary調製 • >2000 bpを推奨 https://icom.illumina.com/MyIllumina/Bulletin/kTtc2xXyKk6ju9Z4jcB2Rw/how-to-use-nextera-xt-withpcr-amplicons 43 Targeted Resequencing – PCR Amplicon 採用する前の注意事項 • ターゲット領域をMapするためにはManifestファイルを事前に準備する必要が ある • • カスタムデザインのPrimerが必要(サポート外) Nextera XTの採用を推奨 • 長いPCR amplicons(>300bp)を準備、nexteraXTでLibrary調製 • >2000 bpを推奨 どのサンプル調製キットを使用するか? どのKitを使用するか? Nextera XT 44 Input DNA量 MSR でのWorkflow 1 ng PCR Amplicon Plasmind(FQ) Workflows DNA RNA 45 Targeted Resequencing – Metagenomics 16S rRNA 16S rRNA 遺伝子を使用して存在する微生物の PopulationのProfileを解析 想定されるアプリ ケーション • 環境サンプル • 腸内細菌 MSRからのOutput File? • 46 Kingdom からGenusまでの分類 結果 Targeted Resequencing – Metagenomics 16S rRNA 採用する前の注意事項 • Low diversity サンプル:MCS2.2以上にUpgrade • 参照文献は以下の2報だが、Optimizaionが必要 • Caporaso JG et al. (2011) Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample. PNAS 108:4516–4522. • Caporaso JG et al. (2012) Ultra-high-throughput microbial community analysis on the Illumina HiSeq and MiSeq platforms. The ISME Journal 14. http://res.illumina.com/docu ments/products/appnotes/a ppnote_miseq_16s.pdf 47 Workflows DNA RNA 48 Targeted Resequencing – Amplicon DS TruSight Tumor のためのワークフロー 想定されるアプリケーション • 49 • Tumor samples のSNP解析 75 アンプリコン/21kb のターゲット配列 Targeted Resequencing – Amplicon DS TruSight Tumor Sample Preparations 想定されるアプリケーション • • Tumor samples のSNP解析 75 アンプリコン/21kb のターゲット配列 MSRからのOutput Fileは? • vcf files: indel/SNP variants の情報 • bam files: 圧縮されたアライメント情報 • gVCF files: それぞれのポジションのSNP情報 • AmpliconCoverage.tsv – アンプリコンごとのCoverage情報 50 Targeted Resequencing – Amplicon DS 採用する前の注意事項 • FFPEサンプルはFFPE QC プロセスののちサンプル調製に進む: http://res.illumina.com/documents/products/whitepapers/whitepaper_trusight_tumor_ffpe_sample_prep.pdf • MAF<5% のminor は Amplicon DS Somatic Variant Callerを使用する • 2x121 bp に最適化されている どのサンプル調製キットを使用するか? 51 どのKitを使用する か? Input DNA量 MSR でのWorkflow TruSight Tumor Sample Prep DNAのQualityにより異なる (数百ng) Amplicon - DS Workflows DNA RNA 52 Workflows DNA RNA 53 Other - Library Quality Control (QC) Large ScaleのSequencingの前のQCチェック 想定されるアプリ ケーション • HiSeq/ScanSQ に進む前のPre Screening • Cluster Densityの確認 MSRからのOutput Fileは? • • • • • • • % Alignment % Mismatch PCR duplicate counting Diversity Insert Size Demultiplexされたサンプルの割合 それぞれのIndexの割合 どのサンプル調製キットを使用するか? どのKitを使用するか? どれでもOK 54 Input DNA量 MSR でのWorkflow Library Control (QC) Workflows DNA RNA 55 Workflows DNA RNA 56 RNA Sequencing – small RNA Dicer/Drosha 後のmiRNAの解析 想定されるアプリ ケーション • Small RNA 探索 • Gene Regulation • 薬剤の効果測定 57 MSRからのOutput Fileは? • • • • FASTQ files 既知のhuman miRNAへのMapping結果 存在比率 small RNA 、 mRNA、 genomic sequence、 mitochondrial sequenceの存在比率 RNA Sequencing – small RNA 採用する前の注意事項 • Human以外の生物や、miRbaseに存在しないmiRNAの場合はほかの解 析ツールが必要 TruSeq small RNA kitはほかの生物にも対応 サンプルのPlex数は必要なData量から算出 どのサンプル調製キットを使用するか? 58 どのKitを使用するか? Input DNA量 MSR でのWorkflow TruSeq Small RNA 10-50 ng のsmall RNA 1 µg total RNA Small RNA Workflows DNA RNA 59 RNA sequencing – RNA-seq mRNAの発現量と配列の解析 想定されるアプリ ケーション • • • 遺伝子発現量の解析 スプライシングJunctionの 解析 トランスクリプトーム解析 MSRからのOutput File? • • FASTQ files 3rd party tool (BowTie)にて解析 http://www.illumina.com/documents/products/datasheets/datasheet_rnaseq_analysis.pdf 60 RNA sequencing – RNA-seq 採用する前の注意事項 • FASTQファイルから3rd partyソフトウェアを使用する • 研究目的に合わせて、MiSeqからのData量で十分か考える必要がある • MiSeqからのDataでは微量な変化や低頻度のTranscriptを検出するのは難 しい場合がある。 • どのようなRNAを検出したいか? どのサンプル調製キットを使用するか? 61 どのKitを使用するか? Input DNA量 TruSeq RNA sample prep 0.1 - 4 µg of total RNA TruSeq Stranded mRNA 0.1 – 4 µg of total RNA TruSeq Total RNA 0.1 – 1 µg total RNA (degradation compatible) MSR での Workflow RNA-Seq Resources Must Have Documents: • MiSeq Reporter User Guide: http://support.illumina.com/documents/documentation/Software_Documentation/MiSeqReporter/MiSeqReporter_UserGuid e_15028784_J.pdf • MiSeq Reporter Quick Reference Cards: http://support.illumina.com/downloads/miseq_workflow_quick_reference_cards.ilmn • iEM User Guide: http://support.illumina.com/documents/documentation/Software_Documentation/IEM/Illumina_Experiment_Manager_Guide _15031335_E.pdf Online Support •MyIllumina Bulletins: https://icom.illumina.com/Home/Index •Support/Training page: http://www.illumina.com/support/training.ilmn •Support/Training/Webinars: https://my.illumina.com/Webinar/Index (also found under MyIllumina/Support Webinars) 62 Resources Useful Technotes and Bulletins •Calculating Coverage: •http://www.illumina.com/documents/products/technotes/technote_coverage_calculation.pdf •http://www.illumina.com/documents//products/technotes/technote_optimizing_coverage_for_targeted_resequencing.pdf •Nextera XT for PCR Amplicons •https://icom.illumina.com/MyIllumina/Bulletin/kTtc2xXyKk6ju9Z4jcB2Rw/how-to-use-nextera-xt-with-pcr-amplicons •PCR Amplicon Bulletin •https://icom.illumina.com/MyIllumina/Bulletin/cC6za4-hLEmpi09-IUBi_w/how-can-i-improve-the-data-quality-of-my-pcrampli 63