...

STN on the Web 配列検索ガイド 2015 年 2 月

by user

on
Category: Documents
12

views

Report

Comments

Transcript

STN on the Web 配列検索ガイド 2015 年 2 月
配列検索ガイド
2015 年 2 月
当資料は ST N on t he Web の配 列検索関 連機 能のみを
ご紹介してい ます .各デ ータベー スの概要 ,レコ ード構成 ,
検索の流れ などは 含まれており ません .
ST N o n th e We b で配 列検索 される方 は,当資 料の他に
以下の資料も ご覧く ださい.
・
「REG IS TRY 核酸 ・ タン パク質配列検 索」
「DGE NE 核 酸・ タンパ ク 質配列検索 」
ht tp: // ww w. jaici .or . jp / stn /st n_d oc .h tml# 09
目 次
STN o n the Web の配列検索 ································ ········· 1
STN の配列データベース ································ ················ 2
利用条件 ································································ ·········· 4
配列検索の流れ ································ ······························· 6
配列質問式ファイ ルの作成方法 ································ ······· 7
REGI STR Y ファ イルの完全配列 (ファ ミリ ー) 検索・
部分配列 (ファ ミリ ー) 検索 ································ ········· 10
REGI STR Y ファ イルの BLAST ホモ ロジ ー検索 ·············· 12
REGI STR Y BL AST ホ モロジ ー検索のパラメータ設定····· 26
REGI STR Y BL AST ホモロジ ー検索のア ラート ··············· 32
DGENE/P CTG EN/USGENE ファ イルの配列検索 ··········· 36
DGENE/P CTG EN/USGENE ファ イルにおける
BLAST ホモ ロジ ー検索のパラメータ設定 ···················· 43
DGENE/P CTG EN/USGENE のバッ チ検索 ····················· 45
DGENE/P CTG EN/USGENE の
ホモロジ ー検索のア ラート ································ ············ 47
STN on the Web の配列検索
■ STN では以下のタイプの配列検索を行うことができます.
完全配列検索
部分配列検索
RN
SQL
SEQ
RN
SQL
SEQ
1089262-89-4 REGISTRY
22
1 EQKDREPLTS LKSLFGSDPL SQ
=== ========== ==
HITS AT:
8-22
1089263-64-8 REGISTRY
15
1 LTSLKSLFGS DPLSQ
========== =====
HITS AT: 1-15
完全配列ファミリー検索
配列質問式
RN
SQL
SEQ
1089262-65-6 REGISTRY
15
1 LTSLRSLFGS DPLSQ
========== =====
HITS AT: 1-15
LTSLKSLFGSDPLSQ
* R は K の等価としてヒット
ホモロジー検索
RN
924687-20-7 REGISTRY
Length = 49
Score = 30.4
Expect = 0.55
Identities = 14/15 (93%)
Positives = 14/15 (93%)
Query:
1 LTSLKSLFGSDPLSQ 15
| |||||||||||||
Subject: 35 LASLKSLFGSDPLSQ 49
部分配列ファミリー検索
RN
SQL
SEQ
1089261-64-2 REGISTRY
28
1 TPAPKKEPKD REPLTSLRSL FGSDPLSQ
======= ========
HITS AT:
14-28
* R は K の等価としてヒット
検索タイプ
検索機能
質問式
*1
完全配列検索
配列質問式に完全に一致した配列を検索
完全配列ファミリー検索
等価なアミノ酸も含めて配列質問式に一致した配列を検索
部分配列検索
配列質問式を一部に含む配列を検索
部分配列ファミリー検索
等価なアミノ酸も含めて配列質問式を一部に含む配列を検索
P
塩基配列の質問式に類似した塩基配列を検索
N
BLASTn
tBLASTn
BLAST
ホモロジー tBLASTx
検索
BLASTp
BLASTx
/SQN
GETSIM
ホモロジー /TSQN
検索 *3
/SQP
*2
N,P
P
N,P
データベース中の塩基配列をアミノ酸配列に翻訳した配列
の中から,アミノ酸配列の質問式に類似した配列を検索
質問式とデータベース中の塩基配列をアミノ酸配列に翻訳
し,類似した配列を検索
P
塩基配列の質問式をアミノ酸配列に翻訳してデータベース
中の類似したアミノ酸配列を検索
P
N
塩基配列の質問式に類似した塩基配列を検索
アミノ酸配列の質問式に類似したアミノ酸配列を検索
*2 REGISTRY のみ利用可能
1
P
N
データベース中の塩基配列をアミノ酸配列に翻訳した配列
の中からアミノ酸配列の質問式に類似した塩基配列を検索
*1 N : 塩基配列,P : アミノ酸配列
N
N
アミノ酸配列の質問式に類似したアミノ酸配列を検索
*2
回答
P
N
P
*3 REGISTRY では利用不可
*1
STN の配列データベース
(2015 年 2 月)
ファイル名
REGISTRY
DGENE
製作者
CAS
Thomson Reuters
・ WPI ファイルのベーシック特許
収録源
・ CAplus/CA ファイルに収録されて
いるベーシック特許および雑誌論文
・ GenBank 由来の配列データ (2005
年以降は出典のあるもののみ)
・ 特許だけでなく,雑誌からも配列情
報も収録している.
(DGENE フ ァ イ ル は 雑 誌 由 来 の 配
列情報は無い)
・ 特許中の核酸,タンパク質の配
列情報および特許情報を収録
した配列専門のファイル
・ GenBank 由 来 の 配 列 情 報 も 収 録
している.
特 長
・ 配列レコードを,CAplus/CA ファイ
ルにクロスオーバー検索すると,そ
の配列に関する文献 (特許・非特
許) 情報が簡単に得られる.
・ 配列に関する規制情報,安全性情
報,供給業者などの情報が,
REGISTRY ファイルから他のファイ
ルへクロスオーバー検索することで
簡単に得られる.
収録年
レコード構成
収録件数
CAS RN 付与率
・ DGENE ファ イ ル は , 配 列 独 自
の抄録を作成しているので,配
列に関する説明情報が豊富で
ある.
・ ホモロジー検索のタイプに
BLAST と GETSIM が あ る .
BLAST ホモロジー検索で回答
が 得 ら れ な い 場 合 で も ,
GETSIM ホ モ ロ ジ ー 検 索 で 回
答が得られることがある.
・ WPI フ ァ イ ル と 連 動 し て お り ,
特許ファミリー情報を表示でき
る.
1957 年~ (一部 1957 年以前の
文献由来の配列もある)
1981 年~
物質単位 (配列単位)
配列単位
核酸 :
タンパク質 :
合計 :
58,583,700 件
9,389,800 件
67,973,500 件
核酸 :
タンパク質 :
合計 :
29,147,400 件
9,127,200 件
38,274,600 件
0 %
更新頻度
毎日
隔週
タイムラグ
27 日以内 (主要国特許)
約 2 ヶ月以内
完全配列
完全配列ファミリー
部分配列
部分配列ファミリー
○
○
BLAST ホモロジー
○
○
GETSIM ホモロジー
×
○
アラート (自動 SDI 検索)
○
○
配列検索機能
100 %
2
(2015 年 2 月)
ファイル名
製作者
PCTGEN
USGENE
WIPO,FIZ Karlsruhe
SequenceBase Corporation
・ PCT 出願特許
・
・
・
・
・ PCT 出願特許のうち,WIPO に
電子的に提出された核酸,タンパク
質の配列と PCT 出願の書誌情報
を収録した配列専門のファイル
・ 米国の公開特許,登録特許の
核酸,タンパク質の配列と米国
特許の特許情報を収録した配列
専門のファイル
・ 一部明細書本文から OCR 処理で
抽出した配列も含む.
・ 速報性に優れている.
収録源
INSCD (核酸)
NCBI/EMBL-EBI (タンパク質)
USPTO PSIPS 配列情報
米国特許の Sequence Listing
・ 速報性に優れている.
特 長
収録年
2001 年 8 月~
1981 年~
配列単位
配列単位
レコード構成
収録件数
核酸 :
タンパク質 :
合計 :
7,479,500 件
1,601,800 件
9,081,300 件
核酸 :
タンパク質 :
合計 :
20,682,800 件
7,270,800 件
27,953,600 件
0 %
0 %
更新頻度
毎週
毎週
タイムラグ
通常 1 日
通常は 3 日以内
完全配列
完全配列ファミリー
部分配列
部分配列ファミリー
○
○
BLAST ホモロジー
○
○
GETSIM ホモロジー
○
○
アラート (自動 SDI 検索)
○
○
配列検索機能
CAS RN 付与率
3
利用条件
■ S T N o n th e W e b の 利 用 条 件
・ S T N I D : 一 般 の S T N I D で S T N o n th e W e b も ご 利 用 い た だ け ま す . S T N E a sy 専 用
の ロ グ イ ン I D で は S T N o n th e W e b は ご 利 用 い た だ け ま せ ん .
・ 使用環境
- ブラウザ環境 : OS によって使用可能なブラウザが異なります.詳しくは以下のページ
でご確認ください (Java Script を有効にする必要があります).
h t t p s :/ / s t n we b - ja p a n .c a s. o r g /
- 解像度
: 800 × 600 以上
■ R E G I S T R Y フ ァ イ ル の B LA S T ホ モ ロ ジ ー 検 索 の 利 用 条 件
・ 使用環境
- Windows 版ブラウザ
- プロセッサ
- メモ リ ( R A M )
- 必要な接続タイプ
: ST N o n t h e w e b の 利 用 条 件 と 同 じ .
J a v a Sc ri p t を 有 効 に す る 必 要 が あ り ま す .
: 200 MHz 以上
: 128 MB 以上 (256 MB 以上を推奨)
: sc i fi n d e r. c a s . o r g に 接 続 で き る こ と .
ポート 443 および HTTPS プロトコルが必要です.
・ 初 回 と バ ージ ョ ン ア ッ プ 時 に S e q u e n c e P l u g- i n ( R E G I S T R Y フ ァ イ ル B L A S T ホ モ ロ ジ ー
検 索 用 ) を イ ン ス ト ー ル し て くだ さ い .
Se q u e n c e Pl u g- i n の イ ン スト ー ル 方 法
① ト ッ プ ペ ー ジ の 「 G e t Se q u e n c e Pl u g- i n 」 を ク リ ッ ク し , 更 に 「 B L A S T P l u g - i n
i n s t a l l e r … 」 を ク リ ッ クし て プ ロ グ ラ ム を ダ ウ ン ロ ー ドし ま す .
1
② ブラウザを閉じてからダウンロードし
た実行ファイルをダブルクリックして
手 順 に 従 い P l u g- i n を イ ン スト ー ル
し ます .
2
4
・
R E G I S T R Y フ ァ イ ル の B L A S T ホ モ ロ ジ ー 検 索 を 実 行 す る 際 , 以 下 の エ ラ ー メッ セ ー ジ が 表 示
さ れ まし た ら , プ ロ キシ サ ー バ 用 の 設 定 を 行 っ て く だ さ い .
プ ロ キシ サ ー バ 用 の 設 定 方 法
① エ ラ ー メ ッ セ ー ジ 画 面 ( 上 図 ) 左 下 の 「 P r e fe re n c e s」 ボ タ ン を ク リ ッ クし ま す
② Fi re w a l l を 選 択 し , ご 利 用 の L A N 環 境 に 従 い 「 H TT P 」 か 「 SO C K S」 を 選 ん で
チェックしてください.
③ ご 利 用 の L A N 環 境 に 従 い H T T P か S O C K S の 設 定 を し て くだ さ い . 「 A p p l y 」 ボ タ ン →
「 O K 」 ボ タ ン を クリ ッ ク し て くだ さ い .
5
配列検索の流れ
1.Sequence Plug-in のインストール
・ REGISTRY ファイルで BLAST ホモロジー検索を実行する場合は,最新版の
Se q u e n c e Pl u g- i n が イ ン スト ー ル 済 み で あ る こ と を 確 認 し て くだ さ い .
・ イ ン スト ー ル 方 法 は P . 4 を ご 覧 く だ さ い .
2.配列質問式ファイルの作成
・ 配 列 質 問 式 は 入 力 ボ ッ ク ス か ら 直 接 入 力 す る こと も で き ま す が , 事 前 に 配 列
質 問 式 の テ キ ス トフ ァ イ ル を 作 成 し てア ッ プ ロ ー ド す る 方 が 簡 単・ 確 実 で す .
・ 配列質問式ファイルの作成方法は P.7-9 をご覧ください.
3.STN on the Web にログイン
*
4.配列質問式ファイルのアップロード - 配列検索 - 回答表示
・ 使用ファイル (データベース) と配列検索の検索タイプによって,以下の検索
補助機能を使い分けます.
- Se q u e n c e Se a r c h
- U p l oa d C m d . F i l e
・ 具 体 的 な 操 作 方 法 は P .1 0 以 降 を ご 覧 く だ さ い .
5.セッション終了
*
6.セッション経過のダウンロード
*
* 具 体 的 な 操 作 方 法 は , 別 冊 の 「 S T N o n th e W e b 検 索 ガ イ ド 」 を ご 覧 く だ さ い .
h t t p: / / w ww . j a i c i . o r . j p/ s t n _w e b/ w e bu s e r . p d f
6
配列質問式ファイルの作成方法
■ S T N on t h e W e b で は , 使 用 フ ァ イ ル ( デ ー タ ベ ー ス ) と 配 列 検 索 の 検 索 タ イ プ に よ っ て , 利 用
する検索補助機能が異なります.これに伴い配列質問式ファイルの作成方法も異なります.
・ 方 法 A : U p l o a d C m d . F i l e で 配 列 質 問 式 を ア ッ プ ロ ード し て コ マン ド で 検 索 し ます .
・ 方 法 B : Se q u e n c e S e a rc h で 検 索し ま す .
検索タイプ
REGISTRY
DGENE/PCTGEN/USGENE
完全配列検索
完全配列ファミリー検索
方法 A
部分配列検索
方法 B
部分配列ファミリー検索
GETSIM ホモロジー検索
-
BLAST ホモロジー検索
方法 B
■ 方法 A : Upload Cmd. File 用配列質問式ファイルの作成方法
・ REGISTRY ファイルで 完全配列 (ファミリー) 検索,部分配列 (ファミリー) 検索を実行する
場 合 は , 検 索 補 助 機 能 の U p l oa d C m d . F i l e を 利 用 し ます ( 上 表 参 照 ) .
・ 検索タイプによって,検索可能な配列質問式の長さは異なります.制限値以下の配列
質 問 式 を 作 成 し て くだ さ い .
REGISTRY ファイルの制限値
検索タイプ
完全配列検索
完全配列ファミリー検索
部分配列検索
部分配列ファミリー検索
核酸
タンパク質
1,000 コード
1,000 コード
*
2,400 コード
*
―
1,000 コード
―
* タンパク質配列では,1 文字コードを用いた場合の制限値
・ 以 下 の ル ー ル に 従 い , テ キ ス トフ ァ イ ル ( . t x t ) を 作 成 し ま す .
- オンラインで実行するコマンドをそのまま一行ずつ入力します.配列質問式の入力形式
に つ い て は , h t t p : / / w ww . j a i c i . o r . j p/ s t n / s t n _ d o c . h tm l # 0 9 の 「 R E G I S T R Y 核 酸・ タ
ン パ ク 質 配 列 検 索」 「 D G E N E 核 酸 ・ タ ン パ ク 質 配 列 検 索 」 を ご 参 照 く だ さ い .
- コマンドやスペースも含めて,一行 256 文字以内で入力します.
(ただし,配列コード中にはスペースを含めないでください.)
7
- 一行 256 文字を超える長い配列質問式は,QUERY コマンドを用いて配列コードを分割
し て 作 成し ま す . 分 割 後 , 配 列 質 問 式 の L 番 号 を & 記 号 で つ な ぐ こ と で , 長 い 配 列 を
表 現 す る こと が で き ま す .
■ 方 法 B : Se q u e n c e S e a rc h 用 配 列 質 問 式 フ ァ イ ル の 作 成 方 法
・ 使用ファイルと検索タイプによって,検索可能な配列質問式の長さは異なります.制限値
以 下 の 配 列 質 問 式 を 作 成 し てく だ さ い .
REGISTRY ファイルの制限値
検索タイプ
核酸
タンパク質
50,000 コード*
BLAST ホモロジー検索
* タンパク質配列では,1 文字コードを用いた場合の制限値.
DGENE/PCTGEN/USGENE ファイルの制限値
検索タイプ
核酸
完全配列検索
部分配列検索
完全配列ファミリー検索
部分配列ファミリー検索
BLAST ホモロジー検索
(バッチ検索・アラートを含む)
GETSIM ホモロジー検索
タンパク質
2,000 コード
-
2,000 コード
10,000 コード
500 コード
GETSIM ホモロジーバッチ検索
GETSIM ホモロジーアラート
750 コード
2,000 コード
8
・ 以 下 の ル ー ル に 従 い , テ キ ス トフ ァ イ ル ( . t x t ) を 作 成 し ま す .
- 配 列 の コ ー ド の み を 入 力 し ます ( コ マ ン ド や 検 索 フ ィ ー ル ド は 入 力 し ま せん ) .
- 核酸塩基の曖昧コードは利用できますが,ギャップ記号・特殊記号は利用できません.
- REGISTRY BLAST ホモロジー検索では,アミノ酸の 3 文字コードは利用できません.
- 一 行 3 0 0 文 字 以 内 に 分 割 し て 改 行し て く だ さ い .
- スペースは利用可能です.ただし,スペースを含めて一行 300 文字以内にします.
- REGISTRY BLAST ホモロジー検索用の質問式ファイルでは,REGISTRY/DGENE/
U S G E N E / G e n B a n k フ ァ イ ル の レ コ ー ド か ら コ ピ ー し た 配 列 デ ー タ をそ の ま ま 貼 り 付 け て
作 成 す る こと も で き ま す .
- R E G I S T R Y B LA S T ホ モ ロ ジ ー 検 索 用 の 質 問 式 フ ァ イ ル で は , テ キ ス ト フ ァ イ ル ( . t x t )
の ほ か に G C G 形 式 や F A S T A 形 式 の フ ァ イ ル を 使 用 す る こと も で き ま す .
詳しくは以下のページをご覧ください.
h t t p: / / w ww . c a s . o r g/ h e l p / B L A S T / t o pi c s/ i n p u t _ f o .h t m
9
REGISTRY ファイルでの完全配列 (ファミリー)検索,
部分配列 (ファミリー) 検索
■ REGISTRY ファイルで 完全配列 (ファミリー) 検索,部分配列 (ファミリー) 検索を実行する
場 合 は , 検 索 補 助 機 能 の U p l oa d C m d . F i l e を 利 用 し ます .
・ 配 列 質 問 式 フ ァ イ ル は 方 法 A ( P .7 ) で 作 成 し た フ ァ イ ル を 利 用 し ま す .
■ U p l oa d C m d . F i l e に よ る 配 列 質 問 式 フ ァ イ ル の ア ッ プ ロ ー ド 方 法
① S T N o n t h e W e b に ロ グ イ ン し て か ら , ツ ー ル バ ー の 「 A s s i s t a n t s 」 を ク リ ッ クし , さ ら に
「 U pl o a d C m d . F i l e 」 を ク リ ッ クし ま す .
② 画 面 下 に あ る コ マ ン ド ウ イ ン ド ウ の 表 示 が 変 わ った ら , 「 参 照」 ボ タ ン を ク リ ッ クし ま す .
③ 用 意 し て お い た フ ァ イ ル 名 を 選 択 し て 「 開 く 」 ボ タ ン を ク リ ッ クし ま す .
10
④ 「 O p e n F i l e 」 ボタ ン を ク リ ッ クし ま す .
⑤ コ マ ン ド ウ イ ン ド ウ に フ ァ イ ル が 読 み 込 ま れ ま す . こ こ で 「 Su b mi t A l l L i n e s 」 ボ タ ン を ク リ ッ ク
すると,すべてのコマンド行が実行されます.
⑥ コ マ ン ド の 送 信と 実 行 が 終 了 す る と , コ マ ン ド ウ ィ ン ド ウ は 自 動 的 に 元 の 状 態 に 戻 り ま す .
引 き 続 き コ マ ン ド で 検 索 を 続 行 し て くだ さ い .
・
検索の流れ
=> FILE REGISTRY
← L4 までは自動的に入力・実行されます
=> QUE MVKGRWRKYVAYFSIFLLFAQLFSFSAIVRANESVQSPVVNGNDVTFRYV/SQSP
L1
QUE MVKGRWRKYVAYFSIFLLFAQLFSFSAIVRANESVQSPVVNGNDVTFRYV/SQSP
=> QUE GTGEEQSVLLAGSFNDWQTDGEKKIELTKESDHIWSVTKTLPDGTYMYKF/SQSP
L2
QUE GTGEEQSVLLAGSFNDWQTDGEKKIELTKESDHIWSVTKTLPDGTYMYKF/SQSP
=> QUE VVDGNWMTDPLNNNKADDGYGGKNSVVVVGQPAQQQERVVTLVGNLQNEL/SQSP
L3
QUE VVDGNWMTDPLNNNKADDGYGGKNSVVVVGQPAQQQERVVTLVGNLQNEL/SQSP
← 部分配列検索が実行されました
=> S L1&L2&L3
L4
2 (MVKGRWRKYVAYFSIFLLFAQLFSFSAIVRANESVQSPVVNGNDVTFRYV)(GTGEEQSVLLA
GSFNDWQTDGEKKIELTKESDHIWSVTKTLPDGTYMYKF)(VVDGNWMTDPLNNNKADDGYGG
KNSVVVVGQPAQQQERVVTLVGNLQNEL)/SQSP
=>
11
REGISTRY ファイルの BLAST ホモロジー検索
■ R E G I S T R Y フ ァ イ ル の B LA S T ホ モ ロ ジ ー 検 索 を 実 行 す る 場 合 は , 検 索 補 助 機 能 の
Se q u e n c e Se a r c h A s si s t a n t を 利 用 し ま す .
・ 配列質問式ファイルは方法 B (P.8) で作成したファイルを利用します.
■ R E G I S T R Y フ ァ イ ル の B LA S T ホ モ ロ ジ ー 検 索 は , S T N o n th e W e b と は 独 立 し た
ソ フト ウ エ ア で 実 行 さ れ ま す . こ の た め , 以 下 の 点 が 通 常 の 操 作 方 法 と 異 な り ま す .
・ S T N o n th e W e b の 機 能 で セ ッシ ョ ン を ダ ウ ン ロ ー ド 処 理し て も , B LA S T 検 索 の デ ータ は
ダ ウン ロ ー ド さ れ ま せ ん . 回 答 セ ッ ト の 保 存・ 印 刷 な ど は , ブ ラ ウ ザ の 機 能 で 行 い ま す .
・ 検 索 し た 配 列 に つ い て , S T N で さ ら に 検 索 し て い く た め に は , 「 T ra n s f e r R N s 」 機 能 で
CAS 登録番号を抽出・検索する必要があります.
・ REGISTRY BLAST に接続するには,初めに STN にログインする必要があります.
REGISTRY BLAST に接続した際,STN の接続に関しては以下のオプションを
選択できます.
- Se s s i o n w i l l t i me o u t i n 4 0 mi n u t e s ( デ フ ォ ー ル ト )
- L o g o f f h ol d ( 1 2 0 分 以 内 な ら ば 再 接 続 で き ま す )
- Logoff
■ 検索例 : 下記の遺伝子組み替えコラーゲンのアミノ酸配列に類似した配列を検索する.
MRAWIFFLLCLAGRALAAPLADYKDDDDKPGYLGGFLLVLHSQTDQEPTCPLGMPRLWTGYSLL
YLEGQEKAHNQDLGLAGSCLPVFSTLHQVCHYAQRNDRSYWLASAAPLPRAWIFFMMPLSEEAI
RPYVSRCAVCEAPAQAVAVHSQDQSIPPCPQTWRSLWIGYSFLMHTGAGDQGGGQALMSPRAAP
FLECQGRQGTLADYCHFFANKYSFWLTTVKADLQFSSAPAPDTLKESQAISRCQVCVKYS
①
W i n d o w s 版 の 推 奨 ブ ラ ウ ザ か ら S T N o n t h e W e b の ト ッ プ ぺ ー ジ へア ク セ ス し ます .
S T N o n th e W e b の U R L
https://stnweb-japan.cas.org/
Macintosh の使 用環 境で は
REGISTRY ファイルの
BLAST ホモロジー検索は
利用できません.
② S T N の I D と パ ス ワ ー ド を 入 力 し て S T N o n th e W e b に ロ グ イ ン し ま す .
12
③
画 面 左 の ツ ー ル バ ー か ら 「 A s s i s ta n t s」 を ク リ ッ ク し , 更 に 「 S e qu e n c e S e a rc h . 」 を
ク リ ッ クし ま す .
1
2
④
画 面 右 に S e qu e n c e S e a rc h A s s i s t a n t 画 面 が 表 示 さ れ ま す .
ホモロジー検索
実行中の STN on
the Web の接続状
況を選択します *.
- 40 分後に切断
(デフォールト)
2
- LOG H で終了
1
- LOG Y で終了
次 に 「 La u n c h
C A S Re gi s t r y
B LA S T 」 ボ タ ン を
ク リ ッ クし ま す .
* REGISTRY ファイルの BLAST ホモロジー検索は STN on the Web とは独立したソフト
ウェアで実行されます.このため特に指示しなければ,検索開始後 40 分を経過すると,
S T N o n th e W e b は 自 動 的 に 切 断 し ま す .
13
⑤
Re s u l t Se t M a n a g e r 画 面 が 表 示 さ れ ま す . こ こ で 「 N e w S e a rc h 」 ボ タ ン を ク リ ッ クし , さ ら に
「 S i mi l a r Se q u e n c e s 」 ボ タ ン を ク リ ッ クし ま す .
⑥
Se a rc h b y S e qu e n c e ダ イ ア ロ
グボックスが表示されます.
ま ず R e su l t N a me : に 検 索 の
名称を入力します *.
1
次 に Sequence to be searched:
に配列質問式を入力します.
2
「Read from File」 ボタンを
ク リ ッ クし て , 作 成 し た 配 列
質問式ファイルを呼び出します.
配列質問式ファイルの作成
方法は P.8 (方法 B) をご参照
ください.
なお,直接入力,あるいは
配 列 デ ータ ベ ー ス か ら コ ピ ー
し た デ ータ も 貼 り 付 け ら れ ま す
- 質 問 式 は 5 万 コ ード ま で
* 名 称 はア ル フ ァ ベ ッ ト ま た は 数 字 で 入 力 し ます ( 1 0 0 文 字 ま で ) . ス ペ ー ス や 句 読 点 を 挿 入
す る こと も で き ま す . 名 称 を 入 力 し な い 場 合 は , 自 動 的 に 識 別 番 号 が 付 与 さ れ ま す .
ま た , 名 称 は あ と で M a i n W i n d o w ダ イ ア ロ グ ボ ッ ク ス か ら 変 更 す る こと も で き ま す .
14
⑦
図のように検索名称と
配列質問式を入力したら
「 O K 」 ボ タ ン を ク リ ック
し ます .
1
2
⑧
P r o g ra m S e l e c ti o n ダ イ ア ロ グ ボ ッ ク ス が 表 示 さ れ ま す . こ こ で 検 索 タ イ プ を 選 択 し ま す .
今 回 は 「 BL A S T p」 ボ タ ン を クリ ッ ク し ま す .
塩基配列の
質問式を用いる
検索タイプ
アミノ酸配列の
質問式を用いる
検索タイプ
⑨
検索対象となるデータベースのサブセットを選択します.ここで表示されるダイアログボックス
は , 検 索 タ イ プ に よ っ て 以 下 の よ う に 異 な り ます . 今 回 は 「 A l l R e fe re n c e d Se q u e n c e s」 を
選 択 し ,「 O K 」 ボ タ ン をク リ ッ クし ま す .
・ タンパク質ホモロジー検索を実行した場合
< B LA S T p > < B LA S T x >
- A l l R e fe re n c e d Se q u e n c e s :
文献に記載されているすべての配列
- Re f e re n c e d i n a t l e a s t o n e P a te n t … :
CAplus ファイルに収録された特許に記載
1
されている配列
- Re f e re n c e d i n a n on - p a t e n t … :
CAplus ファイルに収録された特許以外の
文献に記載されている配列
- On l y re t ri e v e s e qu e n c e s wi t h 5 0 … :
配列長 50 以下の配列
15
2
・ 核酸ホモロジー検索を実行した場合
< B LA S T n >
-
⑩
< tB L A S T x > < tB L A ST n >
A l l S e qu e n c e s : R E G I S T R Y フ ァ イ ル 中 の 全 配 列
A l l G e n B a n k S e q u e n c e s : G e n B a n k フ ァ イ ル か ら 収 録 さ れた 配 列
E S T : mR N A ( c D NA ) 由 来 の 発 現 配 列 タ グ
STS : ゲノム配列中の配列標識部位
G S S : ゲ ノ ム 調 査 関 連 の 配 列 ( シ ン グ ル パ ス で 読 ん だ コ ス ミ ド , BA C , Y A C な ど )
H T G S : Hi g h Th r ou g h p u t G e n o mi c Se q u e n c e s
All other GenBank Sequences : GenBank ファイルから収録され,EST,STS,
GSS,HTGS 以外の配列
B LA S T p Se t t i n g s ダ イ ア ロ グ ボ ッ ク ス で 検 索 パ ラ メ ータ が 表 示 さ れ ま す . こ こ で は , 「 L o w
C o m p l e xi t y F i l t e r i n g 」 の チ ェ ッ ク を は ず し , 回 答 件 数 の 最 大 値 を 1 , 0 0 0 に 変 更 し て 「 OK 」
ボ タ ン を ク リ ッ ク し ます .
「Low Complexity Filtering」
のデフォールトは ON で,
低複雑度領域のマスクフィル
タリングが行われ,生物学的
に無意味なアライメントは取り
除かれます.
特許性調査の場合はチェック
をはずした方がよいと言われ
ています.
16
⑪
検 索 が 開 始 さ れ , Re s u l t Se t M a n a g e r 画 面 の リ ス ト に 検 索 状 況 が 表 示 さ れ ま す . 検 索 実 行 中
は S t a tu s の カ ラ ム に R u n n i n g と 表 示さ れ , 検 索 が 完 了 す る と C o m p l e t e が 表 示 さ れ ま す .
↑
検索の名称
↑
検索タイプ
↑
実行日
↑
状況
↑
回答件数
↑
既読チェック
* 検 索 結 果 は 1 0 0 セ ッ ト ま で 保 存 さ れ 何 度 で も 呼 び 出 す こ と が で き ます . 1 0 1 個 目 の 回 答
セ ッ ト が 作 成さ れ る 場 合 は , 最 も 古 い 回 答 セ ッ ト が 削 除 さ れ ま す .
⑫
検 索 が 完 了 し た ら , 表 示 す る 検 索 結 果 を ハ イ ラ イ ト し 「 V i e w R e su l t s」 ボ タ ン を クリ ッ ク し ま す .
17
⑬
B LA S T Re p o r t 画 面 が 表 示 さ れ ま す . 情 報 は 四 つ の 部 分 で 構 成 さ れ て お り , 配 列 質 問 式 と の
類似性を比較することができます.
- 件数情報
- 類似度分布
- アライメントの概略
- アライメントの詳細
件数情報
類似度分布
ア ラ イメ ン ト
の概略
表示幅を調節
できます
ア ラ イメ ン ト
の詳細
表示幅を調節できます
・ 件数情報
- U n i qu e Se q u e n c e s : ユ ニ ー ク な 配 列
- Re d u n d a n t
: 重複する配列
- Se l e c te d R e su l t s
: 選 択し た 配 列
18
・ 類似度分布
類 似 度 ( A l i gn m e n t S c o r e s ) を 大 き く 五 つ の 範 囲 に 分 け , 各 範 囲 の 配 列 件 数 が 確 認 で き る
ようになっています.各範囲のボタンをクリックすると,その範囲の配列が選択され,
Se l e c te d R e su l t s に 件 数 が 表 示 さ れ ま す . 例 え ば > = 2 0 0 の ボ タ ン を ク リ ッ ク する と ,
類 似 度 2 0 0 以 上 の 配 列 が 3 5 5 件 で あ る こと が わ か り ま す .
また,各範囲に配列が存在する場合はボタンに色がつき,類似度の分布状態を把握
しやすいようになっています.
・ アライメントの概略
質問式
回答
一番上の配列質問式に対して,回答の全配列が類似性の高い順にアライメント表示され,
各配列は類似度に応じて範囲ボタンと同じ色 (黒,青,黄緑,ピンク,赤) で表示されます.
また ,各配列の上 にポ イン タ を置くと ,下のバーに 配 列の名称が 表示さ れます .
な お , 上 図 の よ う に 回 答 配 列 中 に 斜 線 部 分 が 表 示 さ れる 場 合 が あ り ま す . こ れ は , 配 列
質 問 式 と マ ッチ さ せ る た め に 本 来 の 配 列 を 切 断 し て い る こ と を 表 し て い ま す . つ ま り , 斜 線
部分は存在せず,両端の実線部分をつなげた配列が実際の回答配列となります.
19
・ アライメントの詳細
回答の全配列が類似性の高い順に表示されています.
ス コ ア デー タ 期 待 値
*
CAS 登録番号
配列の名称
* 期 待 値 の「 1e -10 8」 は , 1 × 1 0 - 1 0 8 を 表 し ます .
各配列の左端にある
表示されます.
ボ タ ン を ク リ ッ ク する と
ボ タ ン に な り , 詳し い ア ラ イ メ ン ト 情 報 が
H と Y は等価のアミノ酸
なお,アミノ酸配列を用いて BLAST ホモロジー検索する場合は,上図のように + 記号が
表 示 さ れ る 場 合 が あ り ま す . こ れ は 等 価 の ア ミ ノ 酸 で あ る こ と を 表し て い ま す .
20
ボ タ ン を ク リ ッ ク する と , 重 複 す る 配 列 が 表 示 さ れ ま す .
重複した配列
⑭
REGISTRY ファイルの BLAST ホモロジー検索の回答は,STN on the Web のダウンロード
デ ータ に は 含 ま れ ま せ ん . 必 要 な 場 合 は 回 答 を 保 存 ・ 印 刷し ま す .
- 保 存 す る 場 合 は , B LA S T Re p o r t 画 面 の 「 F i l e 」
メニ ュ ー か ら 「 S a v e A s 」 を 選 択 し ま す . H TM L 形 式
または TXT 形式で任意の場所に保存することができます.
- 印 刷 す る 場 合 は , B LA S T Re p o r t 画 面 の 「 F i l e 」
メニ ュ ー か ら 「 P ri n t f r o m B r o w se r」 を 選 択 し ま す .
⑮
ホモロジー検索で得られた配列について STN on the Web で引き続き検索するためには,
目的の配列の CAS 登録番号を抽出し,STN on the web (REGISTRY ファイル) で検索する
必 要 が あ り ま す . 抽 出 ・ 検 索 す る 配 列 を 選 択 する 方 法 は 3 通 り あ り ま す .
- す べ て の 配 列 を 選 択 す る 場 合 は , B LA S T R e p o r t 画 面 の
「 E d i t」 メ ニ ュ ー か ら 「 S e l e c t A l l 」 を 選 択 し ます .
- 類似度で選択する場合は,類似度の範囲ボタンをクリック
し ます . 今 回 は 類 似 度 2 0 0 以 上 の 配 列 を 選 択 し ま す の で ,
赤 色 の バ ー を ク リ ッ クし ま す .
- 特 定 の 配 列 を 選 択 す る 場 合 は , ア ラ イ メ ン ト の 詳 細 ( A l i g n me n t De t a i l s ) に あ る チ ェ ッ ク
ボ ッ ク ス を ク リ ック し ま す .
21
⑯
B LA S T Re p o r t 画 面 の 下 に あ る 「 Tr a n s f e r R N s」 ボ タ ン を ク リ ッ ク し ます . C A S 登 録 番 号 の
抽 出 が 完 了 す る と , 下 の バ ー に メ ッ セー ジ が 表 示 さ れ ま す .
⑰
「 Ca n c e l 」 ボ タ ン をク リ ッ クし て
B LA S T Re p o r t 画 面 を 閉 じ ます .
さらに Result Set Manager 画面の
「 E x i t」 ア イ コ ン と 「 は い 」 ボ タ ン を
ク リ ッ クし て 検 索 を 終 了 し ま す .
引き続き別のホモロジー検索を実行する場合は,
Result Set Manager 画面の 「New Search」
アイコンや 「Sequence」 アイコンをクリックします.
前回の検索条件 (検索タイプやパラメータ) で検索
する場合は,「Fast BLAST」 アイコンをクリックします.
ま た , 「 Sequence ID 」 ア イ コ ン を ク リ ッ ク す れ ば ,
CAS 登録番号や GenBank 番号から配列質問式を
呼び出して検索することができます.
⑱
S T N on th e W e b の S e qu e n c e S e a rc h A s s i s t a n t 画 面 に あ る 「 Re t r i e v e R N s f r o m
B LA S T」 ボ タ ン を ク リ ック し ます .
手 順 ② か ら 4 0 分 を 経 過 し て い た り , 事 前 に L O G H や LO G Y を 指 示 し て い る と , S T N on
t h e W e b は 終 了 し て い ま す . こ の 場 合 は 再 度 S T N o n th e W e b に ロ グ イ ン し , 手 順 ③ の
要 領 で S e qu e n c e Se a rc h A s s i s t a n t 画 面 を 表 示 し て から , 手 順 ⑱ を 行 い ま す .
⑲
自 動 的 に STN on the Web の オ ン ラ イ ン セ ッ シ ョ ン に 戻 り , R E G I S T R Y フ ァ イ ル に 入 っ て 抽 出
さ れた C A S 登 録 番 号 を O R 演 算し た 質 問 式 が 作 成 さ れ ま す .
22
⑳
最 後 に 作 成 さ れ た 質 問 式 の L 番 号 を 検 索 し て R E G I S T R Y フ ァ イ ル で 回 答 セ ッ ト を 作 成し ま す .
この回答セットの L 番号を利用して検索を続行します.
< S T N o n t h e W e b の オ ン ラ イ ン セ ッシ ョ ン の 流 れ >
=> FILE REGISTRY
← 自動的に REGISTRY ファイルに入り L20 まで作成されます
=> QUE (1201979-17-0 OR 300426-61-3 OR 273191-20-1 OR 452984-85-9 OR 246038-64-2
OR 791139-98-5 OR 480647-33-4 OR 459495-63-7 OR 159348-50-2 OR 791151-70-7
OR 739082-88-3 OR 497220-81-2 OR 481139-84-8 OR 152208-00-9 OR 352498-84-1
OR 161785-27-9 OR 960434-40-6 OR 1000232-38-1)/RN
L1
QUE (1201979-17-0 OR 300426-61-3 OR 273191-20-1 OR 452984-85-9 OR 246038-6
4-2 OR 791139-98-5 OR 480647-33-4 OR 459495-63-7 OR 159348-50-2 OR 791
151-70-7 OR 739082-88-3 OR 497220-81-2 OR 481139-84-8 OR 152208-00-9O
R 352498-84-1 OR 161785-27-9 OR 960434-40-6 OR 1000232-38-1)/RN
=> QUE L1 OR (148769-30-6 OR 143973-43-7 OR 875810-53-0 OR 872480-80-3 OR
487637-40-1 OR 158969-11-0 OR 253275-80-8 OR 823572-64-1 OR 177934-83-7 OR
1201979-15-8 OR 452984-87-1 OR 300426-59-9 OR 273191-19-8 OR 1201979-19-2
OR 452984-83-7 OR 246038-68-6 OR 273191-18-7 OR 246038-59-5)/RN
L2
QUE L1 OR (148769-30-6 OR 143973-43-7 OR 875810-53-0 OR 872480-80-3 OR 487
637-40-1 OR 158969-11-0 OR 253275-80-8 OR 823572-64-1 OR 177934-83-7O
R 1201979-15-8 OR 452984-87-1 OR 300426-59-9 OR 273191-19-8 OR 1201979
-19-2 OR 452984-83-7 OR 246038-68-6 OR 273191-18-7 OR 246038-59-5)/RN
: 省略
=> QUE L19 OR (960428-67-5 OR 875810-51-8 OR 564490-72-8 OR 564490-67-1 OR
1201979-20-5 OR 481197-20-0 OR 144132-16-1 OR 887814-42-8 OR 481173-95-9
OR 1191183-13-7 OR 1191183-14-8 OR 481456-47-7 OR 480569-51-5)/RN
L20
QUE L19 OR (960428-67-5 OR 875810-51-8 OR 564490-72-8 OR 564490-67-1 OR 12
01979-20-5 OR 481197-20-0 OR 144132-16-1 OR 887814-42-8 OR 481173-95-9
OR 1191183-13-7 OR 1191183-14-8 OR 481456-47-7 OR 480569-51-5)/RN
The RNs in this query were transferred from the following BLAST report:
'Recombinant Human Collagen'
← 最後に作成された L 番号を検索します
=> S L20
: 省略
L21
・
355 L19 OR (960428-67-5 OR 875810-51-8 OR 564490-72-8 OR 564490-67-1
OR 1201979-20-5 OR 481197-20-0 OR 144132-16-1 OR 887814-42-8 OR
481173-95-9 OR 1191183-13-7 OR 1191183-14-8 OR 481456-47-7 OR 4
80569-51-5)/RN
回答集合は CAS 登録番号の大きい (登録の新しい) 配列順に並んでいます.当ファイルでは
B LA S T ホ モ ロ ジ ー 検 索 し た 回 答 セ ット を 類 似 性 の 高 い 順 な ど で 並 び 替 え る こ と は で き ま せ ん .
23
← SCAN 表示形式では配列情報は表示されません
=> D SCAN
L21
IN
SQL
MF
CI
355 ANSWERS
REGISTRY COPYRIGHT 2011 ACS on STN
Protein (Mus musculus strain C57BL/6J clone M5C1019H14 1669-amino acid)
(9CI)
1669
Unspecified
MAN
**RELATED SEQUENCES AVAILABLE WITH SEQLINK**
STRUCTURE DIAGRAM IS NOT AVAILABLE
USE 'SQD' OR 'SQIDE' FORMATS TO DISPLAY SEQUENCE
HOW MANY MORE ANSWERS DO YOU WISH TO SCAN? (1):END
← 配列情報は SQIDE 表示形式で表示します
=> D SQIDE
L21
RN
CN
FS
SQL
ANSWER 1 OF 355 REGISTRY COPYRIGHT 2011 ACS on STN
1280754-14-4 REGISTRY
228: PN: WO2011034421 SEQID: 229 unclaimed protein (CA INDEX NAME)
PROTEIN SEQUENCE
1712
L21 の回答レコードは,類似性の高い
PATENT ANNOTATIONS (PNTE):
順ではなく,新しく登録された CAS
Sequence |Patent
登録番号順に並んでいます.
Source
|Reference
=========+============
Not Given|WO2011034421
|unclaimed
|SEQID 229
SEQ
1
51
101
151
201
251
MGRDQRAVAG
CQCYPEKGGR
PKGDVGARGV
GSEGFTGPPG
PGHVGQMGPV
NGIPSDTLHP
PALRRWLLLG
GQPGPVGPQG
SGFPGADGIP
PQGPKGQKGE
GAPGRPGPPG
IIAPTGVTFH
TVTVGFLAQS
YNGPPGLQGF
GHPGQGGPRG
PYALPKEERD
PPGPKGQQGN
PDQYKGEKGS
:
NDKSYWLSTT APLPMMPVAE
HCPAGWRSLW IGYSFLMHTA
GRGTCHYYAN KYSFWLTTIP
NL
VLAGVKKFDV
PGLQGRKGDK
RPGYDGCNGT
RYRGEPGEPG
RGLGFYGVKG
EGEPGIRGIS
PCGGRDCSGG
GERGAPGVTG
QGDSGPQGPP
LVGFQGPPGR
EKGDVGQPGP
LKGEEGIMGF
1551 PGDVCYYASR
DEIKPYISRC SVCEAPAIAI
1601 AVHSQDVSIP
AGDEGGGQSL VSPGSCLEDF
1651 RATPFIECNG
EQSFQGSPSA DTLKAGLIRT
1701 HISRCQVCMK
MF
Unspecified
CI
MAN
SR
CA
LC
STN Files:
CA, CAPLUS, TOXCENTER
DT.CA CAplus document type: Patent
RL.P
Roles from patents: PRP (Properties)
1 REFERENCES IN FILE CA (1907 TO DATE)
1 REFERENCES IN FILE CAPLUS (1907 TO DATE)
=> FILE CAPLUS
← CAplus ファイルに入ります
=> S L21
L22
← クロスオーバー検索
166 L21
=> S L22 AND P/DT
: 省略
L23
103 L22 AND P/DT
← 特許に限定します
24
← SCAN 表示形式で回答を表示
=> D SCAN TI HITRN
L23
TI
IT
103 ANSWERS
CAPLUS COPYRIGHT 2011 ACS on STN
cDNA sequences of human genes with altered expression in hepatic fibrosis
and use for diagnosis and drug screening
600800-69-9, Protein (human)
RL: ARU (Analytical role, unclassified); BSU (Biological study,
unclassified); DGN (Diagnostic use); PRP (Properties); ANST (Analytical
study); BIOL (Biological study); USES (Uses)
(amino acid sequence; cDNA sequences of human genes with altered
expression in hepatic fibrosis and use for diagnosis and drug screening)
HOW MANY MORE ANSWERS DO YOU WISH TO SCAN? (1): END
← FHITSEQ 表示形式で最初にヒットした CAS 登録番号
の配列を表示することができます
=> D BIB ABS FHITSEQ
L23
ANSWER 1 OF 103
← SCAN 表示を終了
CAPLUS
COPYRIGHT 2011 ACS on STN
* ヒットした全ての CAS 登録番号の配列
2011:372841 CAPLUS
154:407006
を 表 示 す る 場 合 は HI T S E Q 表 示 形 式
Genes regulated by transcription factor FRA-1 as targets for the
inhibition of metastasis in cancer therapy
TIJP がん治療における, 転移の阻害のための標的として転写因子FRA-1によって調整された遺伝子
[機械翻訳]
IN
Peeper, Daniel Simon; Desmet, Christophe Jean Claude; Reyal, Fabien
PA
Stichting Het Nederlands Kanker Instituut, Neth.
SO
PCT Int. Appl., 122pp.
CODEN: PIXXD2
DT
Patent
LA
English
FAN.CNT 1
PATENT NO.
KIND
DATE
APPLICATION NO.
DATE
--------------------------------------------------PI
WO 2011034421
A1
20110324
WO 2010-NL50594
20100915
W: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ,
CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG,
:
PRAI US 2009-242935P
P
20090916
EP 2009-170573
A
20090917
AB
Transcription factor FRA-1 is shown to be essential for the metastasis of
some cancers and the FRA-1 gene and genes regulated by the FRA-1
transcription factor are identified for use as targets in the diagnosis,
:
IT
1280754-14-4
← CAS 登録番号
RL: PRP (Properties)
(unclaimed protein sequence; genes regulated by transcription factor
FRA-1 as targets for the inhibition of metastasis in cancer therapy)
← CAS 登録番号
RN
1280754-14-4 CAPLUS
CN
228: PN: WO2011034421 SEQID: 229 unclaimed protein (CA INDEX NAME) ← CA 索引名
← 配列データ
SEQ
1 MGRDQRAVAG PALRRWLLLG TVTVGFLAQS VLAGVKKFDV PCGGRDCSGG
51 CQCYPEKGGR GQPGPVGPQG YNGPPGLQGF PGLQGRKGDK GERGAPGVTG
101 PKGDVGARGV SGFPGADGIP GHPGQGGPRG RPGYDGCNGT QGDSGPQGPP
151 GSEGFTGPPG PQGPKGQKGE PYALPKEERD RYRGEPGEPG LVGFQGPPGR
201 PGHVGQMGPV GAPGRPGPPG PPGPKGQQGN RGLGFYGVKG EKGDVGQPGP
:
1651 RATPFIECNG GRGTCHYYAN KYSFWLTTIP EQSFQGSPSA DTLKAGLIRT
1701 HISRCQVCMK NL
AN
DN
TI
RE.CNT
9
THERE ARE 9 CITED REFERENCES AVAILABLE FOR THIS RECORD
ALL CITATIONS AVAILABLE IN THE RE FORMAT
25
REGISTRY BLAST ホモロジー検索のパラメータ設定
■ 最適なパラメータは検索タイプによって異なりますが,デフォールト値で予め設定されていま
す.
検索タイプ
検索機能
BLASTn
塩基配列の質問式に類似した塩基配列を検索
tBLASTn
データベース中の塩基配列をアミノ酸配列に翻訳した配列
の中から,アミノ酸配列の質問式に類似した配列を検索
tBLASTx
質問式とデータベース中の塩基配列をアミノ酸配列に翻訳
し,類似した配列を検索
BLASTp
アミノ酸配列の質問式に類似したアミノ酸配列を検索
BLASTx
塩基配列の質問式をアミノ酸配列に翻訳して,データベース
中の類似したアミノ酸配列を検索
■ パ ラ メ ータ 設 定 は , B L A S T Se t t i n g s ダ イ ア ロ グ ボ ッ ク ス で 行 い ま す .
・ 「 S h o w A d d i ti o n a l O p t i o n s」
にチェックをつけると,詳細な
パ ラ メ ータ 設 定 を 行 う こ と が
できます.
26
質問式
回答
塩基配列
アミノ酸
配列
塩基配列
塩基配列
アミノ酸配列
塩基配列
アミノ酸
配列
■ 各 パ ラ メ ータ の 概 要
パラメータ
概要,指定できる数値・項目
期 待 値 ( E x p e c t a t i o n Va l u e ) を 指 定 す る こ と で 検 索 の 精 度 を 変 更 す る .
スライダを右に移動すれば回答件数が多くなり,左に移動すれば少なくなる.
高い類似性を持つ配列だけを検索する場合は左に移動する.
デフォールトは 10.
Se a rc h
Se n si t i v i ty
↑
期待値 1e -4
↑
↑
↑
↑
↑
↑
0.01 1
10
50
100
1000
デフォールトではチェックされており,配列質問式に対して低複雑度領域の
マスクフィルタリングを行なう.マスクを行うことで,統計的に有意であっても
生物学的には無意味なアラインメント(例:共通の酸性,塩基性アミノ酸の
リピートやプロリン過剰な領域など)を取り除くことができる.
チェックをつけておくと,具体的には配列質問式中複雑でない配列部分
(低複雑度配列,反復配列) がマスクされ検索に使用されなくなる.この際
BLASTn では DUST プログラム,その他の検索タイプでは SEG
L o w C o m pl e xi t y
Fi l t e ri n g
プログラムを用いて低複雑度配列が決定されている.配列質問式中
マスクされるコードは以下のコードに置き換えられ検索される.
・ 塩基配列の場合 : N
・ アミノ酸配列の場合 : X
以下の場合はフィルタリングを行わない方がよいためチェックをはずす.
・ 特許性調査の場合
・ 短い配列質問式で検索する場合
・ 低複雑度領域を多く持つ配列質問式で検索する場合
BLASTx ま た は tBLASTx で の み 指 定 す る . Mold Mitochondrial に は
Mold,Protozoan,Coelenterate Mitochondrial and Mycoplasma/
Spiroplasma が含まれている.
<項目>
Query Genetic
Code
・ Standard (デフォールト)
・ Ve r t e b r a t e M i t o c h o n d r i a l
・ Yeast Mitochondrial
・ Mold Mitochondrial
・ Invertebrate Mitochondrial
・ Ciliate Macronuclear
・ Echinoderm Mitochondrial
・ Euplotid Nuclear
・ Bacterial
・ Alternative Yeast Nuclear
・ Ascidian Mitochondrial
・ Flatworm Mitochondrial
・ Blespharisma Macronuclear
27
■ 各 パ ラ メ ータ の 概 要 ( つ づ き )
パラメータ
概要,指定できる数値・項目
Max No. of
A n s we r s
回答件数の上限値.デフォールトは 25 件で 1 から 1,000 までの数値を指定
することができる.特許調査の場合は 1,000 に設定する.
Sh o w
A d di ti o n a l
O p ti o n s
チェックを入れると,詳細なパラメータを設定するための画面が表示される.
デフォールトはチェックなし.
期待値 (Expectation Value) とはデータベース中の配列に対してマッチする
際の統計的有意性の閾値のこと.デフォールト値は 10 で,同程度の大きさの
データベースの検索を行った場合,10 回のマッチが偶然でも起こりうることを
示している.得られた統計的有意性が与えられた閾値よりも低い場合は
Expectation
Value
ホモロジー検索の回答に含まれるが,高い場合は回答に含まれない.
期待値が 0 に近づくほど類似性が高くなり回答件数は少なくなる.0 より
大きい数値を入力する.
短い配列質問式で検索する場合は,期待値を大きくする.
通常はデフォールト値を変更する必要はない.ただし,短い配列を検索する
場合は値を小さくする.また,非常に長い配列質問式を用いたため検索が完了
しない場合は値を大きくする.
Word Size
<数値>
・ BLASTn では 7-23 (デフォールトは 11)
・ BLASTn 以外の検索タイプでは 2-3 (デフォールトは 3)
BLASTn 以外の検索タイ プ で 類似性ス コ アを計算する 置換行列を指定する .
置 換 行 列 に は P AM ( P o i n t Ac c e p t e d M u t a t i o n ) と B L O S U M ( B L O c k s
Substitutuin Matrix) の二つのタイプがある.
<項目>
Weight Matrix
・ PAM30
・ P AM 7 0
・ BLOSUM80
・ BLOSUM62 (デフォールト)
・ BLOSUM45
*
配列質問式の配列長による置換行列と Gap Cost の組み合わせ例
配列長
Gap Cost*
置換行列
Gap Cost
<35
PAM-30
(9,1)
35 - 50
PAM-70
(10,1)
50 - 85
BLOSUM-80
(10,1)
>85
BLOSUM-62
(11,1)
tBLASTn,BLASTx または BLASTp で指定する Open Gap Cost と Extend Gap
Cost の数値の組み合わせ*.
28
■ 各 パ ラ メ ータ の 概 要 ( つ づ き )
パラメータ
概要,指定できる数値・項目
BLASTn でのみ指定する.Open Gap Cost と Extend Gap Cost の
Open Gap Cost
Extend Gap Cost
数値は組み合わせが決まっておらず,自由に指定できる.
0 より大きい数値を指定する.デフォールトは 5,2.
Penalty for Mismatch
BLASTn でのみ指定する.0 より小さい数値を指定する.
BLASTn で の み 指 定 す る . 類 似 性 ス コ ア を 決 め る た め Weight
Reward for Match
Matrix の代わりに指定する.デフォールトは 1 で,1 から 8 までの
数値を指定することができる.
* 指定した置換行列の種類によって,Open Gap Cost と Extend Gap Cost の数値の組み合わせ
が決まっている.下線部分がデフォールト
置換行列
(Open Gap Cost と Extend Gap Cost) の組み合わせ
BLOSUM62
(11,2) (10,2) (9,2) (8,2) (7,2) (6,2) (13,1) (12,1) (11,1) (10, 1) (9,1)
BLOSUM80
(25,2) (13,2) (9,2) (8,2) (7,2) (6,2) (11,1) (10,1) (9,1)
BLOSUM45
(13,3) (12,3) (11,3) (10,3) (16,2) (15,2) (14,2) (13,2) (12,2) (19,1) (18,1)
(17,1) (16,1)
PAM30
(7,2) (6,2) (5,2) (10,1) (9,1) (8,1)
PAM70
(8,2) (7 2) (6 2) (11,1) (10 1) (9,1)
■ 配 列 長 3 0 以 下 の 配 列 質 問 式 を B L A S T ホ モ ロ ジ ー 検 索 す る 場 合 の パ ラ メ ータ 設 定
検索配列
設定値
・ フィルタリングを行わない
核酸
・ 期待値
: 1000
・ word size : 7
・ フィルタリングを行わない
タンパク質
・ 期待値
: 20000
・ word size : 2
・ 置換行列
: PAM30
29
■ デフォールトの設定
< B LA S T n >
< B LA S T p > < t B L A S T n >
30
■ デフォールトの設定 (つづき)
< B LA S T x >
< tB L A S T x >
31
REGISTRY BLAST ホモロジー検索のアラート
■ REGISTRY ファイルの BLAST ホモロジー検索では,アラート (自動 SDI 検索) を設定する
ことができます.
・ 実行頻度 : 毎週,または隔週
・ ア ラ ート は 一 つ の ロ グ イ ン I D あ た り 最 大 1 0 0 件 ま で 登 録 で き ま す .
・ 回 答 セ ッ ト はア ラ ー ト ご と に 最 大 2 0 件 ま で 保 存 さ れ る . ( デ フ ォ ー ル ト は 1 0 件 )
・ Re s u l t S e t M a n a g e r 画 面 の 「 T o ol s 」 メニ ュ ー か ら 「 P r e fe r e n c e s」 を ク リ ッ ク する と
アラート設定画面が表示されます.ここにメールアドレスを入力しておくと,アラートが実行
さ れる 度 に 通 知 さ れ ま す .
■ ア ラ ート の 登 録 方 法
① B LA S T ホ モ ロ ジ ー 検 索 の 回 答
( B LA S T Re p o r t 画 面 ) を 表 示
し ます .
② 画面右下にある
アイコンを
ク リ ッ クす る と C re a te P r o f i l e
ダイアログボックスが表示され
ます.ここでアラートを登録する
ことができます.
* また は , 「 T o ol s 」 メ ニ ュ ー か ら
「Set Up Alert」 をクリック
し ても 登 録 で き ま す .
32
③ ア ラ ー ト の 登 録 名 を P r o fi l e
N a me ボ ッ ク ス に 入 力 し て ,
実 行 頻 度 と ア ラ ート 終 了 月 を
選択します.
- 実行頻度 : 毎週,隔週
- ア ラ ート 終 了 月 :
最長一年間登録しておく
ことができます.
予め BLAST 設定画面で
メ ー ルア ド レ ス を 登 録し て
おけば,毎回の検索結果
(件数など) と終了月の
お知らせがメールで通知
されます.
必要ならば,終了月までに
ア ラ ート 登 録 を 更 新 し ま す .
「 O K 」 ボ タ ン を クリ ッ ク す る と
ア ラ ート が 登 録 さ れ ま す .
④ 登 録 し た 内 容 を 削 除 ま た は 更 新 する 場 合 は , R e su l t S e t M a n a g e r 画 面 の 「 A l e r t s
P r o f i l e s 」 ア イ コ ン を ク リ ッ クし , A l e r t s P r o f i l e s 画 面 を 表 示 し ま す . こ こ で 更 新 ・ 削 除 する
ア ラ ート 登 録 を ハ イ ラ イ ト し て 画 面 下 の 「 U p d a te P r o fi l e 」 ま た は 「 D e l e te P r o f i l e 」 ボ タ ン を
ク リ ッ クし ま す . な お , 削 除 し た 場 合 は , 今 ま で 得 ら れ た ア ラ ー ト の 回 答 セ ッ ト も 同 時 に 削 除
されます.
33
■ ア ラ ート の 回 答 を 呼 び 出 す 方 法
・ ア ラ ート 検 索 の 回 答 セ ッ ト は 「 Re s u l t S e t M a n a ge r 」 画 面 の 「 A l e r t s R e p o r t s」 の リ ス ト
に 表 示 さ れ ま す . 表 示 す る 場 合 は ハ イ ラ イ ト さ せ て 画 面 下 の 「 V i e w Re s u l t s 」 ボタ ン を
ク リ ッ クし ま す .
34
・ ア ラ ー ト 検 索 の 回 答 セ ッ ト は 定 期 的 に 増 え て い く た め , 時 間 が 経 過 す る と 「 Alerts
Re p o r t s 」 の リ ス ト か ら 自 動 的 に 削 除 さ れ ま す . 大 切 な 回 答 セ ッ ト は 「 A l e r t s Re p o r t s 」
リ ス ト か ら 「 Re p o r t s 」 リ ス ト に 移 し て く だ さ い .
「 R e p o r t s」 リ ス ト に 移 す 場 合 は , 回 答 セ ッ ト に ポ イ ン タ を 合 わ せ て 右 ボ タ ン ク リ ッ クし ,
「 S a v e P e r m a n e n tl y 」 を ク リ ッ クし ま す .
35
DGENE/PCTGEN/USGENE ファイルの配列検索
■ DGENE/PCTGEN/USGENE ファイルの配列検索では,検索補助機能の Sequence Search
A s si s t a n t を 利 用 し ま す .
・ 配列質問式ファイルは方法 B (P.8) で作成したファイルを利用します.
■ 検 索 例 : あ る 塩 基 配 列 に 類 似 し た 核 酸 を D G E N E フ ァ イ ル で B LA S T ホ モ ロ ジ ー 検 索 す る .
① 推 奨 ブ ラ ウ ザ か ら S T N o n th e W e b の ト ッ プ ぺ ー ジ へア ク セ ス し ます .
② S T N の I D と パ ス ワ ー ド を 入 力 し て S T N o n th e W e b に ロ グ イ ン し ま す .
③ 画 面 左 の ツ ー ル バ ー か ら 「 A s s i s ta n t s」 を ク リ ッ ク し , 更 に 「 Se q u e n c e S e a rc h 」 を クリ ッ
ク する と , Se q u e n c e Se a r c h A s si s t a n t 画 面 が 表 示 さ れ ま す . D G E N E / P C T G E N /
USGENE ファイルで配列検索を行う場合は画面下部を利用します.
④ Se q u e n c e Se a r c h A s si s t a n t 画 面 下 部 で 使 用 フ ァ イ ル と 検 索 内 容 を 指 定 し ま す .
1
2
3
4
36
1. 検索の種類から BLAST を選択します.
- B L A ST : B LA S T ホ モ ロ ジ ー 検 索
- GETSIM : GETSIM ホモロジー検索
- G E T S EQ : ホ モ ロ ジ ー 検 索 以 外
*
* GETSIM ホモロジー検索は検索に時間がかかります.このため,GETSIM を選択する
場 合 は バ ッ チ 検 索 ( P . 4 5 ) を 実 行 す る こ と を お 勧 め し ます .
2. 使用ファイルを DGENE ファイルに指定します.
3 . 配 列 質 問 式 の 種 類 か ら N u c l e o ti d e Se a r c h を 選 択 し ます .
- Nu c l e o t i de S e a r c h : 塩 基 配 列 の 質 問 式 で
検索
- P r o te i n Se a rc h : ア ミ ノ 酸 配 列 の 質 問 式 で
検索
4 . 次 に 「 C on t i n u e 」 ボタ ン を ク リ ッ クし ま す .
⑤ D G E N E B L A S T Se a r c h 画 面 が 表 示 さ れ ま す . こ こ で 配 列 質 問 式 を 以 下 の 1 ~3 い ず れ か の
方法で入力します.
- 1.の入力ボックスに直接入力して
「 C on ti n u e 」 ボ タ ン を クリ ッ クし ま す .
- 2 .R e a d f r o m F i l e の 「 参 照 」 ボタ ン よ り
予め作成した配列質問式ファイルを呼び
出 し ,「 U p l oa d F i l e 」 ボ タ ン を クリ ッ ク
し ます .
配列質問式ファイルの作成方法は 方法
B ( P .8 ) を ご 参 照 く だ さ い .
- 3 . の 「 R e c a l l S e qu e n c e 」 ボ タ ン を
ク リ ッ クし て , 直 前 に ア ッ プ ロ ード し た
質問式を呼び出します.
37
⑥ 配 列 質 問 式 が ア ッ プ ロ ード さ れ , L 番 号 が 付 与 さ れ ま す . こ こ で , 検 索 オ プ シ ョ ン と 検 索 モ ー ド
を 以 下 の よ う に 指 定 し て 「 Se a rc h 」 ボ タ ン を ク リ ッ ク し ます .
・ Se l e c t t h e s e a r c h o p ti o n : で
「 b o th s t r a n d s 」 を 選 択 し ま す .
- b o th s t r a n d s :
入力した配列とその相補鎖を検索
- si n gl e s t r a n d :
入力した配列のみを検索
- c o m pl . s t r a n d :
入力した配列の相補鎖のみを検索
・ Se l e c t th e se a rc h m o de : で on l i n e を 選 択 し ま す .
- online : オンラインで検索
- Alert (SDI) : アラートを登録
- offline : バッチ検索を注文
・ A dv a n c e d p a ra me t e r s を ク リ ッ クす る と , 検 索 パ ラ メ ータ の 設 定 画 面 が 表 示 さ れ ま す . こ こ
で は Se l e c t t h e F i l t e r : を 「 N o n e 」 に 変 更 し て 「 Sa v e O p t i o n s」 ボ タ ン を ク リ ッ クし ま す .
- Dust : Dust フィルタを使用
- C oi l e d- C o i l e d :
C o i l e d - C oi l e d フ ィ ル タ を 使 用
- N on e : フ ィ ル タ リ ン グ し な い
38
⑦ 「 Se a r c h 」 ボ タ ン を ク リ ッ ク する と 検 索 が 開 始 さ れ ま す .
検索が終了すると,結果がグラフ形式で表示されます.このグラフは X 軸で類似配列の件数,
Y 軸で類似性の高さを示しています.グラフから,どの程度類似しているものが何件位あるか
を把握して,類似性の高い上位何件の配列を入手したいかを決めます.
類 似 性 の高 さ
スコア値 % とは,QUERY SELF
SCORE に対する比率.
最低スコア値 % を 80 と入力
した場合,480 以上のスコ アを
持つ回答に限定されます
(Y)
回答数 (X)
・ 画面右下の入力ボックスに回答
件数を入力します.全件を指定する
場 合 は 「 A L L」 と 入 力 し ま す .
類似性の高い回答に限定する場合,
質問式に対する最低スコア値 % で
指 定 す る こと も で き ま す .
・ 最 後 に 「 Cr e a t e A n s w e r S e t」
ボ タ ン を ク リ ッ ク し ます .
⑧ 回答セットが作成され L 番号が付与されます.この回答レコードはレコード番号の降順に
並んでおり,類似性の順ではありません.ここで回答レコードを類似性の高い順に並びかえる
た め , 「 R e su l t s A s si s t a n t 」 ボタ ン を ク リ ッ クし ま す .
- 「 Re s u l t s A s s i s t a n t」 ボ タ ン :
回 答 セ ッ ト を 処 理 し ます .
レコードの並べ替え
重複文献の処理
オンライン表示
郵送による入手
電子メール入手
- 「 C o m m a n d Li n e 」 ボ タ ン :
通常のオンラインセッションに戻り,
コマンド検索を行います.
- 「 Re s t a r t Se q . A s si s t . 」 ボタ ン :
Se q u e n c e Se a r c h A s si s t a n t の
最初の画面に戻ります.
39
⑨ Re s u l t s A s s i s t a n t 画 面 が 表 示 さ れ ま す . こ こ で は 「 S or t 」 ボ タ ン を ク リ ッ クし ま す .
- 1 . Se l e c t a n a n s w e r s e t:
最新の回答セットが表示されています.
別の回答セットを使用する場合は
「 Ch o o s e a D i f fe r e n t L - N u m be r」 を
ク リ ッ クし ま す .
- 2 . Se l e c t t h e d e s i r e d p r oc e s s :
回 答 レ コ ー ド を 並 び 替 える 場 合 は 「 S o r t」
を ク リ ッ クし ま す .
重 複 文 献 を 処 理 す る 場 合 は 「 D u pl i c a te
De t e c t i on 」 を ク リ ッ ク し ま す .
- 3 S e l e c t th e d e si re d o u t pu t o p t i on :
回答レコードをオンライン表示する場合
は 「 D i s pl a y 」 を ク リ ック し ま す .
回答レコードの印刷物を郵送する場合は
「 Pr i n t O f f l i n e 」 を ク リ ッ クし ま す .
回 答 レ コ ー ド を 電 子メ ー ル で 入 手 す る
場 合 は 「 P ri n t E ma i l 」 を ク リ ッ クし ま す .
⑩ S o r t O p ti o n s 画 面 が 表 示 さ れ ま す . こ こ で 「 S o r t b y F i e l d C o de 」 ボ タ ン を クリ ッ ク し ま す .
- 「Rank by Relevance」 :
回答レコードを関連性の高い順に並び替えます.
- 「Sort by Hit Occurrence」 :
回答レコードをヒットタームの出現頻度順で並び替えます.
- 「Sort by Field Code」 :
回答レコードを指定したフィールドを基に並び替えます.
- 「Sort by Patent Family」 :
回答レコードを同一特許のグループに並び替えます.
- 「Previous」 :
前の画面に戻ります.
- 「Cancel」 :
通常のオンラインセッションに戻ります.
⑪ 回 答 レ コ ー ド を 類 似 性 の 高 い 順 に 並 び か え る た め , 回 答 セ ッ ト L 2 の 全 件 に 対 し て , S C OR E
( 類 似 度 ) と I D E N T ( 同 一 性 ) の 高 い 順 ( 降 順 : D E S C E N D I N G ) を 指 定 し て , 「 C on ti n u e 」
ボ タ ン を ク リ ッ ク し ます .
- 1 . En t e r t h e a n s w e r s:
処理するレコードの回答番号を指定します.
予め 1- と入力されており,全件が指定
されています.
- 2 . Se l e c t t h e r e qu i r e d s o r t f i e l d s :
並 び 替 え の 指 標 と なる フ ィ ー ル ド を 選 択し
並び順の降順 (DESCENDING),
昇順 (ASCENDING) を選択します.
40
⑫ 並 び 替 え が 終 了 す る と , 新た な 回 答 セ ッ ト が 作 成 さ れ ま す ( L3 ) . こ の 回 答 を オ ン ラ イ ン で 表 示
す る た め , 「 Di s p l a y 」 ボ タ ン を クリ ッ ク し ま す .
⑬ Di s p l a y o p t i on s 画 面 が 表 示 さ れ ま す . こ こ で 回 答 番 号 と 表 示 形 式 を 入 力 し ま す .
- 1 . En t e r a n s w e r s f o r Di s p l a y : 表 示 す る レ コ ー ド の 回 答 番 号 を 入 力 し ま す .
回答は個別にも (例:1,5,10),範囲としても (例:1-10),またはその組み合せでも指定できます.
- 2 . Ch o o s e t h e d e si re d Di s p l a y f o r ma t ( s ) : 表 示 形 式 を 選 択 し ま す .
左のボックスの表示形式をハイライトさせると右のボックスに入力されます.
取り消す場合はハイライトさせてから 「Clear」 ボタンをクリックします.
41
⑭ 「 D i s pl a y 」 ボ タ ン を ク リ ッ ク する と , 指 定 し た 回 答 が 表 示 さ れ ま す .
: 省略
: 省略
: 省略
42
DGENE/PCTGEN/USGENE ファイルにおける
BLAST ホモロジー検索のパラメータ設定
■ 検索タイプ
検索タイプ
検索機能
質問式
回答
BLASTn
塩基配列の質問式に類似した塩基配列を検索
塩基配列
tBLASTn
データベース中の塩基配列をアミノ酸配列に翻訳した配列の ア ミ ノ 酸
塩基配列
中から,アミノ酸配列の質問式に類似した配列を検索
配列
BLASTp
アミノ酸配列の質問式に類似したアミノ酸配列を検索
アミノ酸配列
■ パ ラ メ ータ * 1
パラメータ
指定できる数値・項目
配列データのフィルタリング方法を指定する
Filter
(フィルタ)
<項目>
・ T : タンパク質検索では SEG,核酸検索では DUST が実行
される (デフォールト)
・ F : フィルタリングを行わない
・ C : Coiled Coiled フィルタ
・ L : 低複雑度領域
・ M : lookup table のみをマスキング
・ D : 核酸の低複雑度領域 (DUST)
・ S : タンパク質の低複雑度領域 (SEG)
Expectation
(期待値)
データベース中の配列に対してマッチする際の統計的有意性の
閾値のこと.0 より大きい数値を入力する.期待値が 0 に近づく
ほど類似性が高くなり回答件数は少なくなる.デフォールトは 10.
短い配列質問式で検索する場合は,期待値を大きくする.
Word Size
<数値>
・ 塩基酸配列の質問式使用時は 7-23 (デフォルトは 11)
・ アミノ酸配列の質問式使用時は 2-3 (デフォールトは 3)
Matrix*2
(置換行列)
アミノ酸配列の質問式を使用時,類似性スコアを計算する置換
行列を指定する
Gap Cost*2
Gap Existence と Gap Extension の数値の組み合わせ
Gap Penalty*2
・ タンパク質検索のデフォールトは 11
・ 核酸検索のデフォールトは 5
Gap Extension*2
・ タンパク質検索のデフォールトは 1
・ 核酸検索のデフォールトは 2
Penalty for Nucleotide mismatch
デフォールトは -3
Reward for nucleotide match
デフォールトは 1
*1 パラメータの詳細は,オンラインヘルプ (=>HELP 1OPTIONS) で確認できる.
*2 指定した置換行列の種類によって,Gap Cost と Gap Extension の数値の組み合わせが決まっ
ている.P.44 上表の下線部分がデフォールト.
43
■ G a p E x i s te n c e と G a p E x t e n s i on の 数 値 の 組 み 合 わ せ
置換行列*
Existence と Extension の組み合わせ
BLOSUM62
(9,2) (8,2) (7,2) (12,1) (11,1) (10, 1)
BLOSUM80
(8,2) (7,2) (6,2) (11,1) (10,1) (9,1)
BLOSUM45
PAM30
(11,3) (12,3) (10,3) (16,2) (15,2) (14,2) (13,2) (12,2) (19,1) (18,1) (17,1)
(16 1)
(7,2) (6,2) (5,2) (10,1) (8,1) (9,1)
PAM70
(8,2) (7 2) (6 2) (11,1) (10 1)
* BLOSUM50, BLOSUM90, PAM250 の組み合わせについては,オンラインヘルプ (=>HELP 2OPTIONS) を
参照
■ デフォールトの設定
< B LA S T n >
< B LA S T p > < t B L A S T n >
44
DGENE/PCTGEN/USGENE のバッチ検索
■ DGENE/PCTGEN/USGENE ファイルの配列検索では,バッチ検索を実行することができます.
・ バッチ検索とは,配列質問式をシステムに登録することで,コンピュータの利用の少ない時
に検索を実行させるものです.
・ 特に GETSIM ホモロジー検索は検索に時間がかかるため,バッチ検索をお勧めします.
■ バッチ検索の登録方法
① S e qu e n c e S e a rc h A s s i s ta n t 画 面 で , 登 録 す る ファ イ ル 名 を チ ェ ッ ク し , 使 用 す る 検 索 の
種 類 を 選 択 し 「 C on t i n u e 」 ボタ ン を ク リ ッ クし ま す .
② 2.Read from File から予め
作成しておいた配列質問式
ファイルを呼び出し 「Upload
Fi l e 」 ボ タ ン を ク リッ ク し ま す .
③ S e l e c t s e a rc h m o de : で
「 o f fl i n e 」 を 選 択 し , En te r a n
i d e n t i fi e r : で 注 文 名 を 入 力 し
て 「 Se a r c h 」 ボ タ ン をク リ ッ ク
し ます .
メールアドレスを入力すると,
BATCH 検索終了時に配信
されます
45
■ バッチ検索の回答を呼び出す方法
① S e qu e n c e Se a r c h A s s i s ta n t の 最 初 の 画 面 で 「 S h o w B a tc h S ta t u s 」 ボ タ ン を ク リ ッ ク
し てフ ァ イ ル 名 ( D G E N E か P C T G E N か U S G E N E ) の ボ タ ン を ク リ ック し ま す .
② バ ッ チ 検 索 の 回 答 リ ス ト が 表 示 さ れ ま す . こ こ で 「 S h o w Re s u l t s 」 ボ タ ン を ク リ ッ クす る と
回答が表示されます.
46
DGENE/PCTGEN/USGENE のホモロジー検索のアラート
■ DGENE/PCTGEN/USGENE ファイルのホモロジー検索は,アラート (自動 SDI 検索) を設定
す る こと が で き ま す .
・ 実行頻度 : 毎週 (PCTGEN/USGENE ファイル),隔週 (DGENE ファイル)
・ ア ラ ート は , 一 つ の ロ グ イ ン I D あ た り 最 大 1 6 件 ま で 登 録 で き ま す .
■ ア ラ ート の 登 録 方 法
① S e qu e n c e S e a rc h A s s i s ta n t 画 面 下 部 で フ ァ イ ル 名 を チ ェ ッ ク し , 検 索 の 種 類 を 選 択 し
「 C on ti n u e 」 ボ タ ン を クリ ッ クし ま す .
② 2.Read from File から予め
作成しておいた配列質問式
ファイルを呼び出し 「Upload
Fi l e 」 ボ タ ン を ク リッ ク
し ます .
③ S e l e c t s e a rc h m o de : で
「Alert (SDI)」 を選択して,
En t e r a n i d e n t i fi e r : で
ア ラ ート 登 録 名 ,
En t e r a t i tl e : で タ イ ト ル を
入 力 し て 「 S e a rc h 」 ボ タ ン
を ク リ ッ クし ま す .
47
■ DGENE/PCTGEN/USGENE ファイルのアラートの回答について
・ 回答を呼び出した場合,削除しない限りその回答は次の更新まで自動的に保存されます.
更 に 保 存 し て お き た い 場 合 は , S A V E コ マ ン ド で 保 存 し て くだ さ い .
・ 回 答 を 呼 び 出 さ な か った 場 合 は , 3 ヶ 月 後 に シ ス テ ム よ り 自 動 的 に 削 除 さ れ ま す .
・ 回 答 は 9 6 セ ッ ト ま で 保 存 す る こと が で き ま す .
■ ア ラ ート の 回 答 を 呼 び 出 す 方 法
① S e qu e n c e Se a r c h A s s i s ta n t の 最 初 の 画 面 で 「 Sh o w A l e r t S t a tu s 」 ボ タ ン を ク リ ッ ク
し て ,フ ァ イ ル 名 ( D G E N E / P C T G E N / U S G E N E ) の ボ タ ン を ク リ ッ ク し ます .
② Alert (SDI) Status: 画面にアラートの回答リストが表示されます.ここで 「Show
Re s u l t s 」 ボ タ ン を ク リ ッ ク す る と 回 答 が 表 示 さ れ ま す .
48
■ ア ラ ート の 回 答 結 果 の 削 除
・ 得 ら れ た 回 答 セ ット を 削 除 す る 場 合 は ,A l e r t ( S D I ) S t a tu s : 画 面 の リ ス ト 右 の チ ェ ッ ク
ボ ッ ク ス に チ ェ ッ ク を し て , 「 D e l e t e Re s u l t s 」 ボ タ ン を ク リ ッ クし ま す .
49
■ ア ラ ート の 削 除 方 法
・ 登 録 し た ア ラ ー ト を 削 除 す る 場 合 は , A l e r t ( S D I ) S t a tu s : 画 面 右 下 の 「 Q u e ri e s」 ボ タ ン を
ク リ ッ クし ま す .
・ A l e r t ( S D I ) Q u e ri e s : 画 面 右 の チ ェ ッ ク ボ ッ ク ス に チ ェ ッ ク を し て , 「 De l e te Qu e r i e s 」
ボ タ ン を ク リ ッ ク し ます .
・ ま た は ,「 S h ow Q u e ry 」 ボ タ ン を ク リ ッ ク 後 , A l e r t Qu e r y 画 面 右 下 の 「 De l e te Qu e r y 」
ボタンをクリックしても削除できます.
50

STN on the Web の URL : https://stnweb-japan.cas.org
 サービス時間 :
◇ 連続サービス (日曜日の 3 時間だけ停止)
◇ 停止時間
- 日 曜 日 1 2 ~1 5 時 ( 米 国 の 夏 時 間 : 1 1 ~ 1 4 時 )
- 毎月第 1 日曜日 (1 日の場合は 8 日) は,7~15 時
(米国の夏時間 : 6~14 時)
Fly UP