Comments
Description
Transcript
シーケンスのための Design Studioでのトラブルシュート
シーケンスのための Design Studioでのトラブルシュート -TSCAについて シニアテクニカルアプリケーションサイエンティスト 酒井名朋子 © 2012 Illumina, Inc. All rights reserved. Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners. 本日のOutline Design の過程 Design Studioでの言葉の定義 • Score • Coverage Coverageを改善する • • • • 2 SNPs Specificity GC content/ homopolymers Cross binding 本日のOutline Design の過程 Design Studioでの言葉の定義 • Score • Coverage Coverageを改善する • • • • 3 SNPs Specificity GC content/ homopolymers Cross binding TSCA Design の過程について アンプリコンのサイズを選択する(150, 175, 250, 425bp) – ターゲット領域におけるProbeの間隔を決定するパラメターとなります ターゲット領域を入力する – 位置情報(Coordinate)や遺伝子名を入力 – それぞれのターゲットサイズ: 1bp- 24kb – 各ターゲットの累積最大値: 650kb 隣り合うターゲット Probe design される領域 250bp 250bp ターゲット配列 ex: アンプリコン250bpの場合 – 近すぎるターゲットに対するWarining: 2つのターゲット領域が指定したアンプリコ ンサイズより小さい場合にはMergeされる – Probeの設計領域 : coordinates +1アンプリコン 分の長さまで設計領域と定義 – ターゲット領域をMergeすることでプローブ数を抑え、Designを改善させる ProjectがDSにSubmitされると・・ – ターゲット領域において既知の変異やGC含量、リピート配列等がチェックされ – ターゲット領域にProbeを充てる cross binding、 overlap 、特異性についてProbe QCを行う – DesignStudio はGapを埋めるために数度再設計を行う – 最終Probeセットが計算され、結果として表示される 4 Design Studioでの言葉の定義 ターゲット名 ターゲット位置情報(Coordinate) 5 SNPs を避けるかどうかのOption ターゲットをカバー アンプリコンによりカバーされ る領域の割合% するために必要なア ンプリコン数 ProbeによりカバーされるSNPs Design 結果のスコア Design Studioでの言葉の定義 Scoreとは – Design Score: AmpliconがWorkするかどうかを示すin silicoでの成功率 Probeと領域に存在するSNP、 GC 含量、 特異性を元に算出 DesignStudio からはDesign StudioのProbe QCを通ったプローブのみを結果として表示 設計が難しい領域はScoreが下がる Coverage とは – ターゲット領域がアンプリコンによりカバーされる割合 – Probeが設計できないとCoverageが低くなる SNPs 特異性 GC 含量/ホモポリマー ProbeのCross binding 6 本日のOutline Design の過程 Design Studioでの言葉の定義 • Score • Coverage Coverageを改善する • • • • 7 SNPs Specificity GC content/ homopolymers Cross binding SNPsが原因でCoverageが低くなる SNPが存在するとアルゴリズムがProbeをデザインしづらくなる – 特にAvoid SNPのOptinをONにした場合 * * * * SNPの位置はdbSNP131 で定義されたもの 8 *** * * * SNPsが原因でCoverageが低くなる SNPが存在するとアルゴリズムがProbeをデザインしづらくなる – 特にAvoid SNPのOptinをONにした場合 X X X X X Avoid SNPs を“Yes”にすると: ターゲット領域の一部のみしかカバーされないことがある 9 X X X SNPsが原因でCoverageが低くなる SNPが存在するとアルゴリズムがProbeをデザインしづらくなる – 特にAvoid SNPのOptinをONにした場合 Avoid SNPs を“OFF”にすると: SNP にかかわらずProbeが設計されるのでカバーされる領域が増える 10 SNPsが原因でCoverageが低くなる 11 SNPsが原因でCoverageが低くなる 12 SNPsが原因でCoverageが低くなる ✔ 13 SNPsが原因でCoverageが低くなる “Avoid SNP” を “No”にすると: • Gapが減る • カバーされる領域が増える • カバーされるターゲット数が増える 14 SNPがProbeの設計に及ぼす影響 Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない 15 SNPがProbeの設計に及ぼす影響 Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない – Coverage Uniformityに関するスペック: アンプリコン でカバーされている ターゲット領域の割合 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある Mean Coverageの0.2x Mean Coverageの 0.2x以下でカバーさ れている領域 Mean Coverage Mean Coverageの 0.2x以上でカバー されている領域 Coverage 16 SNPがProbeの設計に及ぼす影響 Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない – Coverage Uniformityに関するスペック: 80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある “Avoid SNPS”をNoにすることでProbe設計の自由度が増す – しかしProbes はDesign Studioで持っている QCをパスする必要がある SNPはProbeのハイブリ効率に影響がない場合もある – 参照元のdbSNP 131が正しくAnnotateしていない、出現頻度が低いSNPまで登録さ れている – プローブ長は22-30ntと比較的短い SNPに影響されるターゲットはシーケンス深度(Depth)を増やして読むことが 望ましい 17 特異性が低くCoverage が上がらない場合 特異性が低い: ターゲット外の配列をたくさん含んでいる – 最終的にターゲットサイトから外れます ターゲット領域を移動、拡張する – Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある 18 特異性が低くCoverage が上がらない場合 特異性が低い: ターゲット外の配列をたくさん含んでいる – 最終的にターゲットサイトからは外れる ターゲット領域を移動、拡張する – Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある 19 特異性が低くCoverage が上がらない場合 特異性が低い: ターゲット外の配列をたくさん含んでいる – 最終的にターゲットサイトから外れる ターゲット領域を移動、拡張する – Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある 20 特異性が低くCoverage が上がらない場合 特異性が低い: ターゲット外の配列をたくさん含んでいる – 最終的にターゲットサイトから外れる ターゲット領域を移動、拡張する – Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある ✔ 21 特異性が低くCoverage が上がらない場合 22 特異性が低くCoverage が上がらない場合 領域を拡張してみる 23 特異性が低くCoverage が上がらない場合 領域を拡張することでDesign Studioが特異性の 高いProbeをデザインでき、ターゲット領域の Coverageをあげることができる 24 GC 含量、ホモポリマーが原因でCoverageが低い場合 GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する 場合はProbeが設計できない 特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割 して再入力 …GGCCCGCCCGG 25 AAAAAAAAAAAAA GC 含量、ホモポリマーが原因でCoverageが低い場合 GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する 場合はProbeが設計できない 特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割 して再入力 …GGCCCGCCCGG AAAAAAAAAAAAA どのようにGC含量ホモポリマーが問題と特定するか? DesignStudioからUCSC Genome Browserにジャンプ 26 GC 含量、ホモポリマーが原因でCoverageが低い場合 27 GC 含量、ホモポリマーが原因でCoverageが低い場合 28 Probe のCross Bindingが原因でCoverage が低い場合 Cross bindingとは: Oligo pool中で2つ以上のProbeがお互いにアニールしてしま う – Probe-Probeが相互にハイブリ Cross Bindingを起こしているProbeの一つがDesign中に削除される ターゲット領域をカバーするためのProbeの数が減る 29 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか *By removing other probes, we can narrow in on the cause of low coverage Isolate the target of interest into its own project Coverageが低い 原因はProbe か?ターゲット 領域か? Still low coverage? Difficulty due to target itself 30 Improved coverage? Try expanding region coordinates Try targeting in a separate project Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか *ほかのターゲット領域 を除く Projectを当該 ターゲット領域 だけにしてみる Coverageが低 い原因はProbe か?ターゲット 領域か? Still low coverage? Difficulty due to target itself 31 Improved coverage? Try expanding region coordinates Try targeting in a separate project Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか *ほかのターゲット領域 を除く Projectを当該 ターゲット領域 だけにしてみる Coverageが低 い原因はProbe か?ターゲット 領域か? まだCoverage が低い場合 ターゲット領域 の問題 32 Improved coverage? Try expanding region coordinates Try targeting in a separate project Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか Projectを当該 ターゲット領域 だけにしてみる Coverageが低 い原因はProbe か?ターゲット 領域か? まだCoverage が低い場合 ターゲット領域 の問題 33 *ほかのターゲット領域 を除く Coverageが改 善した場合 ターゲット領域 を拡大する ターゲットを別 Projectで入力 してみる Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか 34 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか 35 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか 36 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか 37 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか DesignStudio にてDesignを始めるためには最小16アンプリコン必要 Projectサイズが小さい方が結果が早く帰って来る 38 Probe のCross Bindingが原因でCoverage が低い場合 どのようにCross Bindingが問題と特定するか 例で使用したターゲットでは54% から 73%に改善 Probeが少ない方が当該ターゲットはCoverageが良い Original Projectでターゲット領域を拡張してみる 39 まとめ Design の過程 • amplicon sizeを選択する • 領域をに入力する • DS でプローブを作りデザインプールを結果として返す Design Studioでの言葉の定義 • Score: design score, AmpliconがWorkするかどうかのin silicoでの評価 • Coverage: アンプリコンがカバーするターゲット領域の割合 Coverageを改善する • • • • 40 SNPs: “avoid SNPs” を “no”にする Specificity: ターゲット領域を拡張、移動する GC 含量/ ホモポリマー: ターゲット領域を拡張、移動、分割する Cross binding: 1ターゲットのみを取り出しProbeとターゲットの原因を切り分ける 参考資料 Technical Bulletin: How DesignStudio works for TSCA – https://icom.illumina.com/MyIllumina/Bulletin/rEc70eUsskSDF31s-qdCQQ/howdesign-studio-works-for-tsca FAQ and troubleshooting tech note – http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf TSCA support page – http://support.illumina.com/sequencing/sequencing_kits/truseq_custom_amplicon.ilm n TSCA data sheet – http://www.illumina.com/documents/products/datasheets/datasheet_truseq_custom_a mplicon.pdf Technical Support Webinars – http://support.illumina.com/training/sequencing.ilmn 41