Comments
Description
Transcript
配列ファイルのロードと保存 - in silico biology, inc.
IMC_34.ja in silico biology 配列ファイルのロードと保存 1 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology 塩基配列ファイルの読込みと書出し保存 ここでは、 塩基配列ファイルのメインフィーチャーマップおよび「反応チューブ」への読込(Load)と書出し(Save/ Write)機能について説明します。 また、参照ゲノムフィーチャーマップへの読込方法については、「参照ゲノムマップ」を参照ください。 アミノ酸配列の読込みと書出しについては、「アミノ酸配列の読み込みと書出し」を参照ください。 塩基配列ファイルはメインフィーチャーマップへの読み込み以外の機能でも使用されますが、それらについてはそ れぞれの機能説明を参照ください。 • プライマー塩基配列の設計 IMC への塩基配列ファイルの読込み(Load) 読込める塩基配列の種類 IMC のメインフィーチャーマップに読み込める塩基配列の種類は大きく分類すると 2 種類に分けることができま す。1つは「注釈なし塩基配列ファイル」で、もう1つは「注釈付き塩基配列ファイル」です。 「注釈なし塩基配列ファイル」を IMC に読み込んでメインフィーチャーマップに表示しても、最初は塩基配列ファ イル以外は何も表示されません。IMC を使用してこの何もないマップ上に様々な注釈(Feature)を描いていくこと ができます。また、いろいろなソフトウェアが予測した結果をこの「注釈なし塩基配列」上に読み込んで、一括して 多数の注釈を付けることも可能です。さらに、IMC の自動注釈機能を利用して、自動的にアノテーションを実行し、 注釈を付加していくことができます。 「注釈付き塩基ファイル」を IMC に読み込むと、ただちにその注釈がメインフィーチャーマップ上にグラフィカル に表示されます。このフィーチャーマップを操作して、目的の注釈を探したり、さらに編集を加えたりすることがで きます。 複数配列の同時読込 IMC は同時に複数の「塩基配列ファイル」を読み込むことができます。 単一の「塩基配列ファイル」を IMC に読み込むと、そのアイコンが反応チューブに、 その配列が「メインフィーチャー マップ」に表示されます。 複数の「塩基配列ファイル」あるいはマルチプル形式の「塩基配列ファイル」を同時に IMC に読み込むことがで きます。この場合には、すべての配列のアイコンが「反応チューブ」に生成され、かつ配列情報がメモリーに展開さ れます。また、最初の塩基配列が「メインフィーチャーマップ」に表示されます。 追加読込 すでに 1 個以上のファイルが IMC に読み込まれていても、さらに塩基配列ファイルを追加読込みすることが可能 です。メモリー容量の範囲で読み込むことができます。 塩基配列の直接入力およびペーストによる読込 IMC_34.ja in silico biology 「配列直接読み込み」ボタンあるいは「File」→「Sequece Direct Read」メニューを使用すると、塩基配列をキー ボートから直接入力したり、エディターなどからコピーアンドペーストして読み込ませることができます。 クリップボードにコピーされた配列あるいは注釈付き配列の読込 IMC の Copy Sequence and Features 機能を用いてクリップボードに配列や注釈付き配列がコピーされている場合 は、その配列や注釈をそのままペーストすることができます。フィーチャーマップ上に何も表示されていない状態に して、ペースト機能を使用します。 圧縮されたファイルの読込 GenBank や EMBL などの国際塩基配列データベースからダウンロードできる配列の多くは gz 形式で圧縮されてい ます。IMC ではこれらの圧縮マルチプル形式の塩基配列ファイルをそのまま読み込むことができます。 IMC からの塩基配列ファイルの書出し(Write/Save) 一旦、メインフィーチャーマップ上に読み込まれた(Load)された塩基配列ファイルはすべて GenBank あるいは EMBL 形式ファイルとして保存されます。 3 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology 「注釈なし」塩基配列の読み込み IMC で読み込める「注釈なし」塩基配列形式 IMC では、 「注釈なし」塩基配列ファイルとして以下の形式のファイルを読むことができます。 • 塩基配列のみからなるテキストファイル • 塩基配列中に数字や空白文字が混在するテキストファイル • FastA 形式のファイル • マルチ FastA 形式ファイル • 圧縮マルチ FastA 形式ファイル • ABI(SCF)形式のシーケンスファイル IMC では、メインフィーチャーマップ上の塩基配列を、上記の形式でファイル出力することはできません。 • FastA 形式では別の方法を使って出力可能です。 準備と確認 • 配列形式認識切換ボタンが、N.A. あるいは AUTO となっていることを確認します。 • 配列形式認識切換ボタンが、A.A. となっている場合は、N.A. か AUTO に切換えます。このボタンを何 度かクリックすることにより、以下の順序で設定が切換わります。 • N.A. --> A.A. --> AUTO --> N.A. 読込方法 1.「Read Sequence File…」ボタンをクリックします。 • Res.「Read Sequence File(s) into Feature Map」ファイル選択ダイアログが表示されます。 • Res. ファイルの種類(拡張子)を選択することができます。 2. ファイルを選択し、「 開く 」 をクリックします。 • Res. 左側のリストに今読み込んだ塩基配列ファイルを示すアイコンが表示され、フィーチャーマップにはその塩基 配列が表示されます。 IMC_34.ja in silico biology • Check フィーチャーは何も表示されません。 • Check 一度ファイルとして保存しないと、 「GenBank/EMBL Viewer」では表示することができない場合があり ます。 別名での保存方法 IMC では、 「注釈なし」のファイルを読込みますが、これらのファイルは通常「注釈付き」の形式で保存されます。 1. 「Save as…」ボタンをクリックします。 • Res.「Save Sequence File」ダイアログが表示されます。 • Check: このダイアログ上の「Screen Qualifier(s)」については、スクリーニング機能を参照ください。 2. 任意のファイル名を指定して、GenBank 形式ファイルあるいは EMBL 形式ファイルとして保存します。 • Res. ファイルの拡張子を「.gb」あるいは「.gbk」とするとファイルは GenBank 形式で保存され、 「.embl」と するとファイルは EMBL 形式で保存されます。 配列を Remove あるいは IMC を終了する場合 IMC に一旦読み込んだ「注釈なし」塩基配列ファイルは、これらに対し何も編集を加えなくとも、それらを Remove したり、IMC を終了しようとしたりすると、保存確認ダイアログが表示されます。 5 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology IMC_34.ja in silico biology 「注釈付き」塩基配列の読み込み IMC で読み込める「注釈付き」塩基配列形式 IMC では、「注釈付き」塩基配列ファイルとして以下の形式のファイルを読むことができます。 • GenBank 形式ファイル • Multiple GenBank 形式ファイル • 圧縮 Multiple GenBank 形式ファイル • DDBJ 形式ファイル • Multiple DDBJ 形式ファイル • 圧縮 Multiple DDBJ 形式ファイル • EMBL 形式ファイル • Multiple EMBL 形式ファイル • 圧縮 Multiple EMBL 形式ファイル • TIGR 形式ファイル IMC では、これらの形式でファイル出力できます。 • TIGR 形式では出力できません。 • DDBJ 形式の出力は特別な機能を使用します。 準備と確認 • 配列形式認識切換ボタンが、N.A. あるいは AUTO となっていることを確認します。 • 配列形式認識切換ボタンが、A.A. となっている場合は、N.A. か AUTO に切換えます。このボタンを何 度かクリックすることにより、以下の順序で設定が切換わります。 • N.A. --> A.A. --> AUTO --> N.A. 読込方法 1.「Read Sequence File…」ボタンをクリックします。 • Res.「Read Sequence File(s) into Feature Map」ファイル選択ダイアログが表示されます。 2. ファイルを選択し、「 開く 」 をクリックします。 • Res. 左側のリストに今読み込んだ塩基配列ファイルを示すアイコンが表示され、フィーチャーマップにはその塩基 配列とフィーチャーが表示されます。 • Res. フィーチャーレイアウトスタイルの設定によっては、フィーチャーが表示されない場合があります。この場合 は、フィーチャーレイアウトスタイルを変更します。 7 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology 上書き保存方法 1.「Save」ボタンをクリックします。 • すると読み込んだファイルが、編集された内容で上書きされます。 • メインフィーチャーマップで、編集された塩基配列を保存しないで IMC を終了しようとすると、保存するかどう かを聞くダイアログが配列毎に表示されます。保存するか否かを個別に指定します。また、すべての編集済ファイ ルを IMC 終了時に自動的に上書き保存するように設定可能です。 • 設 定 方 法 :「Option Setting」 → 「Setup」 タ ブ ペ イ ン → 「File Save」 欄 で、 「Modifyed files are automatically saved when exiting IMC」にチェックします。 別名での保存方法 1. 「Save as…」ボタンをクリックします。 • Res.「Save Sequence File」ダイアログが表示されます。 • Check: このダイアログ上の「Screen Qualifier(s)」については、スクリーニング機能を参照ください。 2. 任意のファイル名を指定して、GenBank 形式ファイルあるいは EMBL 形式ファイルとして保存します。 • Res. ファイルの拡張子を「.gb」あるいは「.gbk」とするとファイルは GenBank 形式で保存され、 「.embl」とす IMC_34.ja in silico biology るとファイルは EMBL 形式で保存されます。 • Check: デフォールトの GenBank 出力ファイル拡張子を変更できます。 「Option Setting」 → 「Setup」 タブペイン → 「File Save」欄で、GenBank file suffix を指定します。 配列を Remove あるいは IMC を終了する場合 IMC に一旦読み込んだ「注釈なし」塩基配列ファイルは、これらに対し何も編集を加えなくとも、それらを Remove したり、IMC を終了しようとしたりすると、保存確認ダイアログが表示されます。 9 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology アミノ酸配列の読込みと保存 IMC では注釈付きあるいは注釈なしアミノ酸配列を読込み、そのフィーチャーをマップに表示することができま す。読み込まれたアミノ酸配列は、対応する核酸配列が生成され、核酸配列を基準としたフィーチャーマップ上に同 様に描画することができます。 読み込めるアミノ酸ファイル形式 IMC に読み込むことができるアミノ酸ファイル形式は以下の通りです。 • FastA 形式 • GPFF 形式 • Multiple FastA 形式 • Multiple GPFF 形式 • 圧縮 FastA 形式 • 圧縮 GPFF 形式 読込方法 1. メニューから Read Sequence File... を選択、あるいは Read Sequence File ボタン をクリックします。 • ファイルが読み込まれ、その配列に対応するアイコンが反応チューブに表示され、アミノ酸配列は逆翻訳さ れた塩基配列上に表示されます。また、アミノ酸フィーチャーもフィーチャーマップ上に表示されます。 • 配列タイプは自動的に判定されます。 • まれに、核酸配列コードだけからなるアミノ酸配列を指定した場合は、核酸配列として読み込まれてしまう場合が あります。この場合には、Sequence Type Check メニューあるいは Sequence Type Check ボタンの A.A. に 設定します。 • マルチプル形式のアミノ酸配列ファイルを読み込んだ場合には、すべてのエントリーに対応するアイコンが反応 チューブ上に表示され、最初のアイコンがハイライトされ、その配列とフィーチャーがメインフィーチャーマップ 上に表示されます。 • gz 圧縮形式のアミノ酸配列ファイルはそのまま読み込むことができます。 読込時の逆翻訳 IMC では、アミノ酸配列を読み込むと、対応するコドン表に基づき「逆翻訳」を実行し、対応する核酸配列を生 成します。こうして、内部的には、注釈付きの核酸配列として保存され、ファイル書出しも注釈付き核酸配列として 書き出しが行われます。 • 使用されるコドン表は、オプション設定で変更することができます。 IMC_34.ja in silico biology ファイル保存 現在 IMC では、アミノ酸配列ファイルを読み込んだ場合には、そのままアミノ酸配列ファイルとして保存するこ とはできません。ファイル保存を実行すると、逆翻訳された注釈付き核酸配列ファイルとして保存されます。 11 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology 逆翻訳用のコドン表を変更する アミノ酸配列を読み込んだ場合に実行される逆翻訳に使用されるコドン表を変更することができます。 変更方法 1. メニューから Option を選択するか、あるいはツールボックスからオプションボタンをクリックします。 • Option ウィンドウが表示されます。 2. Option ウィンドウの Genomic Analysis ペインをクリックします。 • Genome Analysis Tab ペインが表示されます。 3. Translation フィールドの trans_table プルダウンメニューから変更したいコード選択し、Apply ボタンをク リックします。 • 以降の逆翻訳は、上で指定されたコドン表を用います。 コドンコード IMC_34.ja in silico biology コドンコードについては、IMC_0645「遺伝暗号表の選択」を参照ください。 13 IMC_34.ja 2012/02/10 19:57 IMC_34.ja in silico biology 参照フィーチャーマップへの配列ファイル読込み 参照フィーチャーマップへの配列読込は、メインフィーチャーマップへの読み込みとは別のメニュー・ボタンを使 用します。 読込方法 1.「Read Sequence File(s) into Reference Map..」メニューを選択、あるいはボタン をクリックします。 • 「Read Sequence File(s) into Reference Map」ダイアログが表示されます。 2. 複数の配列を同時に選択可能です。配列ファイルを選択して、「開く」ボタンをクリックします。 • 参照フィーチャーマップが表示され、読み込んだ全配列のアイコンとフィーチャーマップが表示されます。 IMC_34.ja in silico biology 配列読込時の配列タイプ自動判別機能 IMC では、塩基配列およびアミノ酸配列を読込、配列およびフィーチャーマップを表示することができます。読 込時は、明示的に配列タイプを指定する方法と、自動的に配列タイプを判定して読み込む方法があります。 配列の自動判別方法切換機能 • 配列判別ボタンを AUTO にすると、配列読込時に自動的に配列タイプが判定されて読み込まれます。 • まれに、短いアミノ酸配列で使用されているアミノ酸が核酸コードにも存在するものだけで構成されている 場合は、核酸として読み込まれる場合があります。 • このような場合には、配列判別ボタンを A.A. に切換えてから、再度そのアミノ酸配列を読み込みます。 配列判別ボタンの切換 • 配列判別ボタンは、AUTO --> N.A. --> A.A. --> のようにクリックする度に表示が切り換わります。 • AUTO の場合は、読込時に自動判別が行われます。 • N.A. の場合には、核酸配列として読み込まれます。 • A.A. の場合には、アミノ酸配列として読み込まれます。 • 配列読込みボタン 15 IMC_34.ja は、核酸およびアミノ酸で共通です。 2012/02/10 19:57