...

シーケンスのための Design Studioでのトラブルシュート

by user

on
Category: Documents
10

views

Report

Comments

Transcript

シーケンスのための Design Studioでのトラブルシュート
シーケンスのための
Design Studioでのトラブルシュート
-TSCAについて
シニアテクニカルアプリケーションサイエンティスト
酒井名朋子
© 2012 Illumina, Inc. All rights reserved.
Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium,
iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of
Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score
• Coverage
Coverageを改善する
•
•
•
•
2
SNPs
Specificity
GC content/ homopolymers
Cross binding
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score
• Coverage
Coverageを改善する
•
•
•
•
3
SNPs
Specificity
GC content/ homopolymers
Cross binding
TSCA Design の過程について
アンプリコンのサイズを選択する(150, 175, 250, 425bp)
– ターゲット領域におけるProbeの間隔を決定するパラメターとなります
ターゲット領域を入力する
– 位置情報(Coordinate)や遺伝子名を入力
– それぞれのターゲットサイズ: 1bp- 24kb
– 各ターゲットの累積最大値: 650kb
隣り合うターゲット
Probe design される領域
250bp
250bp
ターゲット配列
ex: アンプリコン250bpの場合
– 近すぎるターゲットに対するWarining: 2つのターゲット領域が指定したアンプリコ
ンサイズより小さい場合にはMergeされる
– Probeの設計領域 : coordinates +1アンプリコン 分の長さまで設計領域と定義
– ターゲット領域をMergeすることでプローブ数を抑え、Designを改善させる
ProjectがDSにSubmitされると・・
– ターゲット領域において既知の変異やGC含量、リピート配列等がチェックされ
– ターゲット領域にProbeを充てる

cross binding、 overlap 、特異性についてProbe QCを行う
– DesignStudio はGapを埋めるために数度再設計を行う
– 最終Probeセットが計算され、結果として表示される
4
Design Studioでの言葉の定義
ターゲット名
ターゲット位置情報(Coordinate)
5
SNPs を避けるかどうかのOption
ターゲットをカバー
アンプリコンによりカバーされ
る領域の割合%
するために必要なア
ンプリコン数
ProbeによりカバーされるSNPs
Design 結果のスコア
Design Studioでの言葉の定義
Scoreとは
– Design Score: AmpliconがWorkするかどうかを示すin silicoでの成功率
Probeと領域に存在するSNP、 GC 含量、 特異性を元に算出
 DesignStudio からはDesign StudioのProbe QCを通ったプローブのみを結果として表示
 設計が難しい領域はScoreが下がる

Coverage とは
– ターゲット領域がアンプリコンによりカバーされる割合
– Probeが設計できないとCoverageが低くなる

SNPs
 特異性
 GC 含量/ホモポリマー
 ProbeのCross binding
6
本日のOutline
Design の過程
Design Studioでの言葉の定義
• Score
• Coverage
Coverageを改善する
•
•
•
•
7
SNPs
Specificity
GC content/ homopolymers
Cross binding
SNPsが原因でCoverageが低くなる
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
*
*
*
*
SNPの位置はdbSNP131 で定義されたもの
8
*** * *
*
SNPsが原因でCoverageが低くなる
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
X
X
X X X
Avoid SNPs を“Yes”にすると:
ターゲット領域の一部のみしかカバーされないことがある
9
X X
X
SNPsが原因でCoverageが低くなる
SNPが存在するとアルゴリズムがProbeをデザインしづらくなる
– 特にAvoid SNPのOptinをONにした場合
Avoid SNPs を“OFF”にすると:
SNP にかかわらずProbeが設計されるのでカバーされる領域が増える
10
SNPsが原因でCoverageが低くなる
11
SNPsが原因でCoverageが低くなる
12
SNPsが原因でCoverageが低くなる
✔
13
SNPsが原因でCoverageが低くなる
“Avoid SNP” を “No”にすると:
• Gapが減る
• カバーされる領域が増える
• カバーされるターゲット数が増える
14
SNPがProbeの設計に及ぼす影響
Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない
15
SNPがProbeの設計に及ぼす影響
Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない
– Coverage Uniformityに関するスペック:
アンプリコン でカバーされている
ターゲット領域の割合

80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある
Mean
Coverageの0.2x
Mean Coverageの
0.2x以下でカバーさ
れている領域
Mean
Coverage
Mean Coverageの
0.2x以上でカバー
されている領域
Coverage
16
SNPがProbeの設計に及ぼす影響
Oligo Poolに含まれるProbeは一定のスペックを満たさなければならない
– Coverage Uniformityに関するスペック:

80% 以上のターゲット領域がMean Coverageのx0.2以上でカバーされる必要がある
“Avoid SNPS”をNoにすることでProbe設計の自由度が増す
– しかしProbes はDesign Studioで持っている QCをパスする必要がある
SNPはProbeのハイブリ効率に影響がない場合もある
– 参照元のdbSNP 131が正しくAnnotateしていない、出現頻度が低いSNPまで登録さ
れている
– プローブ長は22-30ntと比較的短い
SNPに影響されるターゲットはシーケンス深度(Depth)を増やして読むことが
望ましい
17
特異性が低くCoverage が上がらない場合
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れます
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
18
特異性が低くCoverage が上がらない場合
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトからは外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
19
特異性が低くCoverage が上がらない場合
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
20
特異性が低くCoverage が上がらない場合
特異性が低い: ターゲット外の配列をたくさん含んでいる
– 最終的にターゲットサイトから外れる
ターゲット領域を移動、拡張する
– Coordinateを変えることでProbeの組み合わせが変わり、特異性が上がる場合がある
✔
21
特異性が低くCoverage が上がらない場合
22
特異性が低くCoverage が上がらない場合
領域を拡張してみる
23
特異性が低くCoverage が上がらない場合
領域を拡張することでDesign Studioが特異性の
高いProbeをデザインでき、ターゲット領域の
Coverageをあげることができる
24
GC 含量、ホモポリマーが原因でCoverageが低い場合
GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する
場合はProbeが設計できない
特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割
して再入力
…GGCCCGCCCGG
25
AAAAAAAAAAAAA
GC 含量、ホモポリマーが原因でCoverageが低い場合
GC含量が高い場合、もしくはホモポリマー(特定塩基の繰り返し)が存在する
場合はProbeが設計できない
特異性を上げるための改善と同様、ターゲット領域の拡張、移動、領域を分割
して再入力
…GGCCCGCCCGG
AAAAAAAAAAAAA
どのようにGC含量ホモポリマーが問題と特定するか?
DesignStudioからUCSC Genome Browserにジャンプ
26
GC 含量、ホモポリマーが原因でCoverageが低い場合
27
GC 含量、ホモポリマーが原因でCoverageが低い場合
28
Probe のCross Bindingが原因でCoverage が低い場合
Cross bindingとは: Oligo pool中で2つ以上のProbeがお互いにアニールしてしま
う
– Probe-Probeが相互にハイブリ
Cross Bindingを起こしているProbeの一つがDesign中に削除される
ターゲット領域をカバーするためのProbeの数が減る
29
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
*By removing other
probes, we can narrow
in on the cause of low
coverage
Isolate the target
of interest into
its own project
Coverageが低い
原因はProbe
か?ターゲット
領域か?
Still low
coverage?
Difficulty due to
target itself
30
Improved
coverage?
Try expanding
region
coordinates
Try targeting in a
separate project
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
*ほかのターゲット領域
を除く
Projectを当該
ターゲット領域
だけにしてみる
Coverageが低
い原因はProbe
か?ターゲット
領域か?
Still low
coverage?
Difficulty due to
target itself
31
Improved
coverage?
Try expanding
region
coordinates
Try targeting in
a separate
project
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
*ほかのターゲット領域
を除く
Projectを当該
ターゲット領域
だけにしてみる
Coverageが低
い原因はProbe
か?ターゲット
領域か?
まだCoverage
が低い場合
ターゲット領域
の問題
32
Improved
coverage?
Try expanding
region
coordinates
Try targeting in
a separate
project
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
Projectを当該
ターゲット領域
だけにしてみる
Coverageが低
い原因はProbe
か?ターゲット
領域か?
まだCoverage
が低い場合
ターゲット領域
の問題
33
*ほかのターゲット領域
を除く
Coverageが改
善した場合
ターゲット領域
を拡大する
ターゲットを別
Projectで入力
してみる
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
34
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
35
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
36
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
37
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
DesignStudio にてDesignを始めるためには最小16アンプリコン必要
Projectサイズが小さい方が結果が早く帰って来る
38
Probe のCross Bindingが原因でCoverage が低い場合
どのようにCross Bindingが問題と特定するか
例で使用したターゲットでは54% から 73%に改善
Probeが少ない方が当該ターゲットはCoverageが良い
Original Projectでターゲット領域を拡張してみる
39
まとめ
Design の過程
• amplicon sizeを選択する
• 領域をに入力する
• DS でプローブを作りデザインプールを結果として返す
Design Studioでの言葉の定義
• Score: design score, AmpliconがWorkするかどうかのin silicoでの評価
• Coverage: アンプリコンがカバーするターゲット領域の割合
Coverageを改善する
•
•
•
•
40
SNPs: “avoid SNPs” を “no”にする
Specificity: ターゲット領域を拡張、移動する
GC 含量/ ホモポリマー: ターゲット領域を拡張、移動、分割する
Cross binding: 1ターゲットのみを取り出しProbeとターゲットの原因を切り分ける
参考資料
Technical Bulletin: How DesignStudio works for TSCA
– https://icom.illumina.com/MyIllumina/Bulletin/rEc70eUsskSDF31s-qdCQQ/howdesign-studio-works-for-tsca
FAQ and troubleshooting tech note
– http://www.illumina.com/documents/products/other/faq_tsca_designstudio.pdf
TSCA support page
– http://support.illumina.com/sequencing/sequencing_kits/truseq_custom_amplicon.ilm
n
TSCA data sheet
– http://www.illumina.com/documents/products/datasheets/datasheet_truseq_custom_a
mplicon.pdf
Technical Support Webinars
– http://support.illumina.com/training/sequencing.ilmn
41
Fly UP