...

Partek Flow (0.3MB

by user

on
Category: Documents
19

views

Report

Comments

Transcript

Partek Flow (0.3MB
次世代シーケンサーデータ解析ソフトウェア
Partek Flow
アラインメントから生物学的解釈まで全てサポート
コマンド入力なしでNGSのデータ解析を実行可能
• コマンド入力なしで様々なオープンソースのマッピングツールを実行して次世代シーケ
ンサーのリード配列を参照ゲノム配列にマッピング
• マッピング前後のQA/QCレポートやERCCレポートなど多様なレポートを出力
• クオリティスコアやアダプター配列でリード配列をトリムしてマッピングの精度を向上
• マッピング済みのリード配列を最適な確率分布で遺伝子発現解析、Partek Genomics
Suiteと同じANOVAによる遺伝子発現解析にも対応
• 発現変動遺伝子リストの階層型クラスタリングやGOエンリッチメント解析
• マッピング済みのリード配列を変異解析(一塩基変異, 挿入欠失, 融合遺伝子)
• プロジェクト単位で解析を実行したりデータを閲覧したりするユーザーを指定
• パイプライン機能による解析内容の再利用やパラメーター設定の調整
• 無償アップデートで最新のプログラムやアノテーション情報を常に利用可能
• ゲノム解析ソフトウェア Partek Genomics Suite、パスウェイ解析ソフトウェア
Partek Pathwayと強固な連携
• WebアプリケーションなのでクライアントはWindows, Mac OS X, Linuxのいずれも
利用可能(サーバーはLinuxで動作)
• クラスターマシンに対応しているので複数のマシンに解析を分散、クラウドサービスに
対応しているのでデータ量に応じて解析能力を調節
マッピングツールの設定
アラインメント結果
階層型クラスタリング
遺伝子発現解析
変異解析
次世代シーケンサーデータ解析ソフトウェア
Partek社が提供する次世代シーケンサーデータ解析ソリューション
- Partek社は次世代シーケンサーのデータ解析を行うソフトウェア群を提供しています。マッピン
グから統計解析と結果の表示、そして生物学的解釈まで全てサポートします。マイクロアレイの解
析結果と統合解析もできます。
次世代シーケンサーデータ解析ソリューション
データの収集
クオリティチェック・
統計解析・可視化
アラインメント・
マッピング
®
Partek
®
Flow
統合解析・
生物学的解釈
論文発表・
学会発表
®
Partek
Genomics
Suite™
®
Partek
Pathway™
(注) Partek FlowとPartek Genomics Suiteの入力ファイルの違い
Flow: FASTQ/FASTA/SFF/CSFASTQ/CSFASTA/QUAL/BAM/SAM/SRA
Genomics Suite: BAM/SAM/ELAND
次世代シーケンサーの対応状況
Partek Flowは多数のメーカーの次世代シーケンサーに対応しています。
- 次世代シーケンサー
Life Technologies Ion S5, Ion Proton, Ion PGM, SOLiD
Illumina HiSeq, NextSeq, MiSeq, MiniSeq
Roche GS FLX+, GS Junior
(注) 以下の形式の入力ファイルに対応(GZファイルは圧縮ファイルのまま読込み可能)
アラインメント前:FASTQ/FASTA/SFF/CSFASTQ/CSFASTA/SRA
アラインメント後:BAM/SAM
Partek Flow
Partek Flowの特長
- マッピング機能
様々なオープンソースのマッピングツールによって次世代シーケンサーのリード配列を参照ゲノム配列に
マッピングします。マッピングする時に煩雑なコマンド入力は必要ありません。Webブラウザー上でリ
ファレンスやパラメーターを選ぶだけでマッピングを実行できます。各マッピングツールのパラメーター
はあらかじめ適切なプリセットが用意されています。
- マッピング前後のQA/QCレポート
マッピング前後のリード配列のQA/QCレポートを出力します。マッピング前のクオリティチェックによ
りマッピングの精度を上げるための前処理が必要か判断できます。マッピング後のクオリティチェックに
よりマッピングが成功したか否か判断できます。
-遺伝子発現解析
GSAとANOVAの2種類の方法で遺伝子発現解析ができます。GSAでは遺伝子ごとに最適な確率分布
(正規分布、対数正規分布、負の二項分布、ポアソン分布)を自動的に選択して群間の遺伝子発現を比較し
ます。ANOVAではPartek Genomics Suiteと同様に多次元混合モデル分散分析が可能なので解析対象
の因子を自由に設定できます。標準化手法や多重検定補正はPartek Genomics Suiteより多くの選択肢
が用意されています。
-変異解析
Samtools, Freebayes, LoFreqにより一塩基変異(SNV)や挿入欠失(indel)を検出します。また、融合遺
伝子(fusion gene)もTopHat、STARあるいはPartek社のアルゴリズムで検出できます。検出した変異
はアノテーション、フィルタリング、リキャリブレーションが可能です。
- ゲノムビューアー
サンプルや解析結果、参照ゲノム配列やアノテーションを表示するゲノムビューアーを搭載しています。
遺伝子発現解析や変異解析の解析結果から1クリックで該当する遺伝子やSNVをゲノムビューアーに表
示できます。ゲノムビューアーに表示しているゲノム領域はブックマークとして保存できます。
- プロジェクト管理機能
サンプルや解析結果はプロジェクト単位でサーバーに保存されます。プロジェクトを作成したユーザー
は、プロジェクトごとに解析可能なユーザーや閲覧可能なユーザーを設定できるため適切なアクセス制御
が可能です。サーバーにデータが保存されるためデータを個々のクライアントマシンに重複して持つ必要
はありません。
- 解析パイプライン機能
データノードと解析ノードを組み合わせて解析内容を自由にデザインできます。データノードを選択する
と自動的に利用可能な解析ノードが表示されるため初心者でも簡単にデザインできます。解析ノードはパ
ラメーターを変えて何回でも実行できます。デザインした解析内容はパイプラインとして保存できるた
め、別のサンプルに再利用することもできますし、他のユーザーが同じ解析を行うこともできます。
- どこからでもアクセス可能
Webブラウザーを介してPartek Flowがインストールされたサーバーにアクセスするため、クライアン
トはWindows / Mac OS X / LinuxいずれのOSでも利用可能です。スマートフォンやタブレットの
Webブラウザーからも閲覧できます。
- Partek Genomics Suite、Partek Pathwayとのシームレスな連携
Partek Flowでマッピングしたリード配列や様々な解析結果はプロジェクト単位でPartek Genomics
Suiteに読み込むことができます。各サンプルの属性などは自動的に引き継がれます。3製品を連携して
使用することで、マイクロアレイデータとの統合解析やパスウェイ解析を行うことができます。
次世代シーケンサーデータ解析ソフトウェア
Partek Flowの機能
- マッピング機能
利用可能なアラインメントプログラム
Bowtie
STAR
Bowtie 2
TMAP
BWA
TopHat
GSNAP
TopHat 2
SHRiMP 2
Isaac 2
- マッピング前のQA/QC
プロジェクト単位のレポート
塩基位置ごとの平均クオリティスコア
平均クオリティスコアごとのリード配列の割合
サンプル単位のレポート
塩基位置ごとのA/T/G/C/Nの割合
塩基位置ごとの平均クオリティスコア
平均クオリティスコアごとのリード配列の割合
リード長ごとのリード配列の数
ERCCレポート(Bowtie)
濃度とアラインメント数の回帰直線(プロジェクト単位)
濃度とアラインメント数のプロット(サンプル単位)
- マッピング前の処理
塩基の除去(クオリティスコア、指定した塩基長(5’末端から、3’末端から、両末端から))
塩基を除去した結果のレポート
アダプター配列の除去
リード配列の部分抽出
- マッピング後のQA/QC
プロジェクト単位のレポート
アラインメントされたリード配列の割合と総リード数
カバレッジとカバレッジの平均深度
塩基位置ごとの平均クオリティスコア
平均クオリティスコアごとのリード配列の割合
リード配列当たりの平均アラインメント数
サンプル単位のレポート
リード配列当たりのアラインメント数
アラインメントされたリード配列の割合
塩基位置ごとのA/T/G/C/Nの割合
塩基位置ごとの平均クオリティスコア
平均クオリティスコアごとのリード配列の割合
平均マッピングクオリティスコアごとのアラインメント数
リード長ごとのリード配列の数
カバレッジレポート
プロジェクト単位のレポート(ゲノムのカバレッジ)
サンプル単位のレポート(遺伝子ごとのカバレッジ)
Partek Flow
- マッピング後の処理
BAMファイルのフィルタリング
重複するマッピング、シングルトン、アラインメントされなかったリード
最小マッピングクオリティスコア
リード配列当たりの最大ミスマッチ塩基
マッピング前のFASTQファイルに変換
複数のアラインメントプログラムでマッピングしたリード配列の統合
- 遺伝子発現解析
トランスクリプトームデータベースへのマッピング(Partek E/Mアルゴリズム、Cufflinks)
サンプルの主成分分析
遺伝子ごと/転写産物ごとのリード数の正規化
GSAによる発現解析(遺伝子レベル、転写産物レベル)
ANOVAによる発現解析(遺伝子レベル、転写産物レベル)
GSAでのモデルの自動選択(正規分布、対数正規分布、ポアソン分布、負の二項分布)
統計値による絞込み(総リード数、p値、FDR、Ratio、Fold Change、平均リード数、最少リード数)
ボルケノプロット
階層型クラスタリング
- 生物学的解釈
GOエンリッチメント解析
- SNV検出
参照ゲノム配列と異なるSNVの検出(Samtools, Freebayes, LoFreq)
サンプル間で異なるSNVの検出(Samtools)
検出したSNVのQAQCレポート
検出したSNVのフィルタリング、結合、リキャリブレーション
検出したSNVのアノテーション(遺伝子との位置関係、既知のSNP)
検出したSNVのSnpEffによるアノテーション
コホートでの変異の集計
- 挿入欠失の検出
挿入欠失の検出(Samtools, Freebayes, LoFreq)
- 融合遺伝子の検出
融合遺伝子の検出(Partekアルゴリズム、TopHat、STAR)
遺伝子の定量
遺伝子発現解析
変異解析
次世代シーケンサーデータ解析ソフトウェア
- 入力機能
アラインメント前のリード配列(FASTQ、
FASTA、SFF、QUAL、CSFASTQ、
CSFASTA、SRA)
アラインメント後のリード配列(BAM、
SAM)
タブ区切りテキストファイル
圧縮ファイルの自動解凍
- プログラム/アノテーション関連機能
ライブラリ管理(参照ゲノム配列、サイト
バンド、アノテーションデータベース、マ
ッピングツールのインデックス、変異デー
タベース、遺伝子セット)
ライブラリファイルの自動ダウンロード
マッピングツールのインデックス作成
解析プログラムのバージョン選択
アプリケーションの自動更新
- 解析関連機能
サンプルの属性管理(システム共通、プロ
ジェクト別)
解析パイプライン(パイプラインの作成、
閲覧、実行、インポート、ダウンロード)
タスク管理(解析タスクのキューイング)
システムリソース管理
タスク終了時のメール通知
パラメーター設定管理
フィルター設定管理
- 出力機能
- プロジェクト/ユーザー関連機能
プロジェクト管理
コラボレーション機能(解析可、閲覧)
プロジェクトの優先度指定
ユーザー管理(管理者、一般ユーザー)
ユーザープロフィール
グループ管理
ディレクトリアクセス制御
- インストール関連機能
アラインメントされなかったリード配列
(FASTQファイル)
アラインメント済みのリード配列(BAMフ
ァイル、BAIファイル)
アノテーションデータベースに定量したデ
ータ(プロジェクトファイル)
遺伝子発現解析結果(プロジェクトファイ
ル、タブ区切りテキスト)
変異解析結果(BCFファイル、VCFファイ
ル、タグ区切りテキストファイル)
グラフ(SVGファイル)
シングルサーバー/クラスターサーバー/
クラウドシステムに対応
パッケージインストール
- セキュリティ関連機能
セキュリティ設定(自動ログアウト、
HTTPSの利用)
LDAPの利用
プロキシーサーバー設定
動作環境
<サーバー>
OS:
Red Hat, CentOS, Fedora, Ubuntu (64bit)
CPU:
2GHz以上、4コア以上(注1、2)
メモリ:
16GB以上(注1、2)
ディスク:
1TB以上の空き領域(注1) (インストールのみ100GB)
その他(推奨):
インターネット接続環境
※ クラスターマシンへのインストールにも対応
※ クラウドサービス上の仮想マシンへのインストールにも対応
<クライアント>
Webブラウザー:
その他(推奨):
Google Chrome(注3)
サーバーとの高速なネットワーク接続、1280×1024pixel以上のモニタ
(注1) 解析対象のゲノムサイズやサンプルのリード数に応じて必要なスペックは異なります
(注2) STARを使用する場合は、16コア以上および38GB以上を推奨
(注3) Windows / Mac OS X / LinuxいずれのOSでも利用可能です
Partek Flow
ライセンス(年間ライセンス)
- 指名ユーザーライセンス
ライセンス期間は1年/2年/3年等から選択できます
ご購入時にご登録いただいたサーバー(注1) (注2)でのみ利用できます
接続するクライアントに制限はありません
接続するクライアントはサーバーと同一敷地の同一ネットワーク内のマシンとなります
登録するユーザー1人につき1ライセンス必要です
- 同時使用ユーザーライセンス
ライセンス期間は1年/2年/3年等から選択できます
ご購入時にご登録いただいたサーバー(注1) (注2)でのみ利用できます
接続するクライアントに制限はありません
接続するクライアントはサーバーと同一敷地の同一ネットワーク内のマシンとなります
同時に使用するユーザー1人につき1ライセンス必要です
登録するユーザー数に制限はありません
(注1) ライセンス期間中にサーバーの変更は可能です
(注2) 使用できるサーバーは1台です
ご評価
- デモンストレーション
技術者が訪問、またはWebでソフトウェアの機能紹介とデモンストレーションを行ないます
- トライアル
無償にて4週間テスト使用することができます
ユーザー情報とマシン情報の登録およびトライアル契約書へのご署名が必要です
製品紹介セミナー
製品の概要を紹介するセミナーを随時開催しています
開催日程やセミナー内容は菱化システムWebサイトをご覧ください
デモンストレーション、トライアル、製品紹介セミナーは菱化システム
Webサイト(http://www.rsi.co.jp/kagaku/)よりお申込みください
株式会社菱化システム 科学技術システム事業部
〒131-0045 東京都墨田区押上一丁目1番2号
東京スカイツリーイーストタワー
TEL 03-6830-9724 FAX 03-5610-1161
URL http://www.rsi.co.jp/ E-mail [email protected]
記載の商品名は各社の商標または登録商標です。本カタログの記載内容は予告なく変更される場合があります。(2016.09)
Fly UP