Comments
Description
Transcript
myPrestoマニュアル(日本語) - 一般社団法人バイオ産業情報化
myPresto 4.204 USER MANUAL Version 1.0 Copyright (C) 2006-2011 National Institute of Advanced Industrial Science and Technology (AIST) Copyright (C) 2006-2011 Japan Biological Informatics Consortium (JBIC) ii コピーライトについて 本ソフトウェアには、以下の「プログラム使用同意書」とともに配布されているソフト ウェアが含まれています。 著作権表示、及び、コピーライトは下記のとおりです。 myPresto version 4 : 独立行政法人産業技術総合研究所 Copyright (C) 2006-2011 National Institute of Advanced Industrial Science and Technology (AIST) 社団法人バイオ産業情報化コンソーシアム Copyright (C) 2006-2011 Japan Biological Informatics Consortium (JBIC) 富士通株式会社 Copyright (C) 2006-2011 FUJITSU LIMITED 株式会社日立製作所 Copyright (C) 2006-2011 myPresto 4.2 Hitachi, Ltd. iii プログラム使用許諾条件 別紙参照のこと。 プログラム myPresto version 4 の概要 ○ tplgene : 蛋白質に対して AMBER/CHARMm の力場を割り当てる。 ○ tplgeneL :化合物に対して general AMBER force field (GAFF)を割り当てる。 ○ cosgene : 分子動力学シミュレーションを行う。NVE/NVT/NPT アンサンブル、 SHAKE, 剛体モデル、マルチカノニカルMD,各種アンブレラサンプリング、GBSA を 行える。SRPG 法による自由エネルギー計算が可能。 ○ sievgene : 蛋白質―化合物ドッキングソフト ○ Matrix : in silico screening (Multiple Target Screening method, Docking Score Index method):MTS 法、DSI 法での薬物スクリーニング ○ LigandBox : 化合物データベース生成ツール ○ Hgene : ○ VCOL : コンビナトリアルな分子の生成ツール ○ confgene/ confgeneC : 分子の配座生成ツール ○ MVO : Maximum Volume Overlap 法によるドッキング構造の精密化 ○ MD-MVO : MD-MVO 法による類似化合物探索(ligand-base drug screening) ○ substructure-search : 分子骨格による類似化合物探索(ligand-base drug 化合物への H 原子付加、原子電荷計算など。 screening) ○ TGS : TGS 法による類似化合物探索(ligand-base drug screening) ○ sptool: 分子記述子などによる溶解度推算及びアグリゲーターの予測 ○ MolSite : 化合物ドッキングによる蛋白質ポケット及び活性の予測 ○ UAP : Universal Active Probe 法による薬物スクリーニング結果の選択 ○ BindMol : 化合物同士を連結、側鎖を導入するなど、ランダム・総当たりで分子 myPresto 4.2 iv を生成するツール myPresto 4.2 v ソフトウェアの著者 ◆ myPresto version 4 中村 福西 金森 窪田 尾曲 福田 和田 真下 三友 坂本 春木(Nakamura, Haruki) 快文(Fukunishi, Yoshifumi) 英司 (Eiji, Kanamori) 聡(Kubota, Satoru) 克己(Omagari, Katsumi) 育夫 (Fukuda, Ikuo) 光人 (Wada, Mitsuhito) 忠彰 (Mashimo, Tadaaki) 大輔 (Mitomo, Daisuke) 晋子 (Sakamoto, Kuniko) ◆ myPresto version 3 中村 福西 金 渡辺 三上 窪田 尾曲 巽 堀江 福田 春木(Nakamura, Haruki) 快文(Fukunishi, Yoshifumi) 在 吉(Jae Gil Kim) 幸久 (Watanabe, YS) 義明 (Mikami, Yoshiaki) 聡(Kubota, Satoru) 克己(Omagari, Katsumi) 理 恵(Tatsumi, Rie) 将 (Horie, Masaru) 育夫 (Fukuda, Ikuo) ◆ myPresto version 2 中村 福西 金 三上 渡辺 伊奈 堀江 高橋 福田 春木(Nakamura, Haruki) 快文(Fukunishi, Yoshifumi) 在 吉(Jae Gil Kim) 義明 (Mikami, Yoshiaki) 幸久 (Watanabe, YS) 康夫 (Ina, Yasuo) 将 (Horie, Masaru) 誠 (Takahashi, Makoto) 育夫 (Fukuda, Ikuo) ◆ myPresto version 1 cosgene version 1: 中村 春木 (Nakamura, Haruki) 福西 快文 (Fukunishi, Yoshifumi) 橋 祐 一 (Hashi, Yuichi) myPresto 4.2 vi 三上 義明 (Mikami, Yoshiaki) 木寺 詔紀 (Kidera, Akinori) 寺田 透 (Terada, Toru) tplgene version 1: 中村 福西 黒田 福田 myPresto 4.2 春木 快文 正孝 育夫 (Nakamura, Haruki) (Fukunishi, Yoshifumi) (Kuroda, Masataka) (Fukuda, Ikuo) vii 引用文献について 本ソフトウェアの使用時には、以下の文献を引用してください。 myPresto 全体及び Filling potential/SRPG 法について 1) "The filling potential method: A method for estimating the free energy surface for protein-ligand docking", Yoshifumi Fukunishi, Yoshiaki Mikami, and Haruki Nakamura, J. Phys. Chem. B. (2003) 107, 13201-13210. 2) “Protein-ligand binding free energy calculation by the smooth reaction path generation (SRPG) method”, Yoshifumi Fukunishi, Daisuke Mitomo, and Haruki Nakamura, J. Chem. Inf. Model., 2009, 49, 1944-1951. cosgene :Multicanonical MD について 1) "Determination of multicanonical weight based on a stochastic model of sampling dynamics", Jae Gill Kim, Yoshifumi Fukunishi, Akinori Kidera and Haruki Nakamura, Physical Review E (2003) 68, 021110. 2) "Multicanonical molecular dynamics algorithm employing adaptive force-biased iteration scheme", Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, Phys. Rev. E 70, 057103 (2004). Particle Mesh Ewald(PME)について 1) U.Essmann, L.Perera, M.L.Berkowitz, T.Darden, H.Lee and L.G.Pedersen. A smooth particle meth Ewald method. J. Chem. Phys. 103, 8577-8593(1995) Accessible surface area (ASA)について 1) Kinjo, A. R., Kidera, A., Nakamura, H. & Nishikawa, K. Physicochemical evaluation of protein folds predicted by threading. Eur Biophys J 30, 1-10. (2001). Fast Multipole Method (FMM)について 1) J. A. Board, Z. S. Hakura, W. D. Elliott, and W. T. Rankin. “Scalable variants of multipole-accelerated algorithms for molecular dynamics applications”In Proceedings of the Seventh SIAM Conference on Parallel Processing for Scientific Computing, February 1995. 2) W. T. Rankin,“Efficient Parallel Implementations of Multipole Based N-Body Algorithms.“PhD thesis, Duke University, Department of Electrical and Computer Engineering, P.O.Box 90291, Durham, NC 27708-0291, April 1999. 3) W. T. Rankin, DPMTA ?Distributed Parallel Multipole Tree Algorithm, Duke University, Durham, NC (2002). myPresto 4.2 viii sievgene について 1) "Similarity among receptor pockets and among compounds: Analysis and application to in silico ligand screening", Y. Fukunishi, Y. Mikami, and H. Nakamura, The Journal of Molecular Graphics and Modelling 24 (2005) 34-45. Multiple Target Screening (MTS)法について 1) "Multiple target screening method for robust and accurate in silico screening", Y. Fukunishi, Y. Mikami, S. Kubota, H. Nakamura, Journal of Molecular Graphics and Modelling,25, 61-70 (2005). 2) "Noise reduction method for molecular interaction energy: application to in silico drug screening and in silico target protein screening", Y. Fukunishi, S. Kubota, H. Nakamura, Journal of Chemical Information and Modeling, 46, 2071-2084 (2006). 3) "Improvement of protein-compound docking scores by using amino-acid sequence similarities of proteins", Y. Fukunishi, H. Nakamura, Journal of chemical information and modeling, 48, 148-156 (2008) Docking Score Index (DSI)法について 1) "Classification of chemical compounds by protein-compound docking for use in designing a focused library", Y. Fukunishi, Y. Mikami, K. Takedomi, M. Yamanouchi, H. Shima, H. Nakamura, Journal of Medicinal Chemistry, 49, 523-533 (2006). 2) "An efficient in silico screening method based on the protein-compound affinity matrix and its application to the design of a focused library for cytochrome P450 (CYP) ligands", Y. Fukunishi, S. Hojo, H.Nakamura, Journal of chemical information and modeling, 46, 2610-22 (2006). Maximum Volume Overlap (MVO)法について 1) "Prediction of protein-ligand complex by docking software guided by other complex structures", Y. Fukunishi, H. Nakamura, Journal of Molecular Graphics and Modelling, 26 (2008) 1030-1033. Molecular-dynamics Maximum Volume Overlap (MD-MVO)法について 1)” A new method for in-silico drug screening and similarity search using molecular-dynamics maximum-volume overlap (MD-MVO) method”, Y. Fukunishi, H. Nakamura, Journal of Molecular Graphics and Modelling, 2009, 27, 628-636. TGS 法について myPresto 4.2 ix 1) “A similarity search using molecular topological graphs”, Y. Fukunishi, H. Nakamura,Journal of Biomedicine and Biotechnology, Volume 2009 (2009), Article ID 231780 LiganBox について 1)“Advanced in-silico drug screeing to achieve high hit ratio-development of 3D-compound database”, Yoshifumi Fukunishi, Yuusuke Sugihara, Yoshiaki Mikami, Kohta Sakai, Hiroshi Kusudo, Haruki Nakamura, Synthesiology, 2009, 2, 60-68. Sptool 溶解度(LogS)及び aggregator (frequent hitter)の予測 について Tadaaki Mashimo, Yoshifumi Fukunishi, Masaya Orita, Naoko Katayama, Shigeo Fujita, Haruki Nakamura, Quantitative analysis of aggregation-solubility relationship by in-silico solubility prediction, International Journal of High Throughput Screening, 2010:1, 99-107. MolSite(蛋白質リガンドポケット予測)について Yoshifumi Fukunishi, Haruki Nakamura. “Prediction of ligand-binding sites of proteins by molecular docking calculation for a random ligand library”, Protein Science (accepted). Universal active probe (UAP) について Fukunishi, Yoshifumi; Ono, Kazuki; Orita, Masaya; Nakamura, Haruki, Selection of in-silico drug screening result by using universal active probes (UAPs), Journal of Chemical Information and Modeling, 2010, 50, 1233-1240. BindMol について Yoshifumi Fukunishi. Prediction of positions of active compounds makes it possible to increase activity in fragment-based drug development. Pharmaceuticals. 2011, 4, 758-769. その他の参考文献については巻末を参照 myPresto 4.2 x 謝辞 本ソフトウェアの研究開発は、新エネルギー・産業技術総合開発機構(NEDO)、及び、 経済産業省(METI)の援助によって行われました。ここに感謝の意を記します。 本ソフトウェアは、故・京極好正博士の推進する研究プロジェクトで開発されました。 Particle Mesh Ewald (PME) のサブルーチンは、Tom Darden 博士の御厚意により提供さ れたコードを参考に作成されました。ここに感謝の意を記します。 The Particle Mesh Ewald (PME) routines were originally developed by Dr. Tom Darden [28]. National Institute of Environmental Health Sciences, Research Triangle Park, North Carolina 27709 US. Accessible Surface Area(ASA)のサブルーチンは、金城玲博士の御厚意により提供さ れたコードを参考に作成されました。ここに感謝の意を記します。 The Accessible Surface Area (ASA) routines were originally developed by Dr. Akira Kinjo [40]. Center for Information Biology and DNA Data Bank of Japan, National Institute of Genetics, Mishima, Shizuoka, 411-8540, Japan. Fast Multipole Method (FMM) のサブルーチンは、William T. Rankin 博士の御厚意によ り提供されたコードを参考に作成されました。ここに感謝の意を記します。 The Fast Multipole Method (FMM) routines were originally developed by Dr. William T. Rankin. Center for Computational Science and Engineering Duke University Dept. of Electrical and Computer Engineering Box 90291 Durham, NC 27708-0291 US. myPresto 4.2 xi 目次 1 2 3 4 概要 ........................................................................ 1 1.1 分子シミュレーションシステム:myPresto ................................. 1 1.2 トポロジージェネレータ:tplgene......................................... 2 1.3 低分子トポロジージェネレータ:tplgeneL ................................. 2 1.4 構造探索エンジン:cosgene............................................... 2 1.5 インストール............................................................ 3 1.6 化合物データベース:LigandBOX........................................... 4 tplgene..................................................................... 7 2.1 実行方法 ................................................................ 7 2.2 入力データの作成....................................................... 10 2.2.1 PDB 形式ファイル ................................................... 10 2.2.2 DIHED 形式ファイル ................................................. 11 2.3 力場データベースファイル............................................... 13 2.4 環境変数 ............................................................... 15 tplgeneL................................................................... 17 3.1 実行方法 ............................................................... 17 3.2 入力データの作成....................................................... 20 3.2.1 tplgeneL オリジナル形式ファイル .................................... 20 3.2.2 Sybyl mol2 形式ファイル ............................................ 22 3.3 原子タイプ定義ファイル................................................. 28 3.4 力場パラメータデータベースファイル..................................... 28 3.5 フラグメントデータベースファイル....................................... 30 3.6 環境変数 ............................................................... 31 cosgene.................................................................... 33 4.1 実行方法 ............................................................... 33 4.2 入力データの作成....................................................... 33 4.2.1 コントロールファイル............................................... 33 4.2.1.1 EXE> INPUT グループ............................................ 35 4.2.1.2 EXE> MINimize グループ ........................................ 42 myPresto 4.0 xii 4.2.1.3 EXE> MD グループ................................................ 59 4.2.1.4 EXE> OUTPUT グループ............................................ 82 4.2.1.5 EXE> END グループ............................................... 83 5 計算例 ..................................................................... 85 5.1 Sample-1:真空中のペプチド −Vassopressin の計算− .................... 85 5.2 Sample-2:真空中の蛋白 5.3 Sample-3:水中の蛋白 5.4 Sample-4:拡張アンサンブル(Force-biased McMD)−Alanine ペプチドの計算− −Lysozyme の計算− ............................ 88 −Lysozyme の計算− .............................. 94 ........................................................................... 102 5.5 Sample-5:拡張アンサンブル(Simulated Tempering McMD)−Alanine ペプチドの計算− ........................................................................... 106 5.6 Sample-6:拡張アンサンブル(Generalized ST McMD)−Alanine ペプチドの計算− . 110 5.7 Sample-7:拡張アンサンブル−構造の抽出とクラスタリング− ............. 115 5.8 Sample-8:低分子トポロジーの生成 5.9 Sample-9:自由エネルギー計算(Filling Potential 法)−水中のメタンの計算− −Methanol の計算− ................. 119 ........................................................................... 123 5.10 Sample-10:RESPA 法 .................................................. 130 5.11 Sample-11:RATTLE −水中のインドメサシンの計算− ................... 132 5.12 Sample-12:Rigid −水中のインドメサシンの計算− .................... 135 5.13 Sample-13:NPT と PME を用いた周期系の計算 5.14 Sample-14:Fast Multipole Method 5.15 Sample-15:GB/SA −Vassopressin の計算− ............................ 147 5.16 Sample-16:SRPG −Streptavidin の結合自由エネルギー計算− ........... 150 5.17 Sample-17:溶解度予測−アグリゲータ解析− ........................... 161 5.18 Sample-18:CAP 水を用いた生理食塩水中での蛋白質と化合物の複合体の系の計算 −水中のメタンの計算− .... 137 −カウンターイオンを用いた MD 計算− 141 ........................................................................... 168 5.19 A Sample-19:周期系を用いた生理食塩水中での蛋白質の系の NPT 計算 ....... 173 入出力ファイル............................................................ 179 A.1 構造探索エンジンの入出力ファイル....................................... 179 A.1.1 フェーズの説明..................................................... 179 A.2 入力ファイル........................................................... 180 A.2.1 制御ファイル....................................................... 181 A.2.2 トポロジーファイル................................................. 199 A.2.3 座標ファイル....................................................... 210 A.2.4 SHAKE ファイル ..................................................... 211 myPresto 4.2 xiii A.2.5 固定原子・自由原子指定ファイル..................................... 213 A.2.6 CAP 指定ファイル ................................................... 215 A.2.7 拡張 CAP 指定ファイル............................................... 217 A.2.9 距離拘束ファイル................................................... 221 A.2.10 二面角拘束ファイル................................................ 223 A.2.11 モニター指定ファイル.............................................. 225 A.2.12 系の重心合わせ指定用ファイル...................................... 227 A.2.13 系の GB/SA 及び ASA 用パラメータ指定ファイル ....................... 229 A.2.14 Umbrella 拘束ファイル ............................................. 231 A.2.15 リスタートファイル................................................ 234 A.2.16 剛体モデルファイル................................................ 237 A.3 出力ファイル........................................................... 239 A.3.1 MIN エネルギートラジェクトリ ....................................... 240 A.3.2 MD エネルギートラジェクトリ ........................................ 242 A.3.3 モニター指定トラジェクトリ......................................... 244 A.3.4 総エネルギーデータ................................................. 246 A.3.5 座標トラジェクトリ................................................. 247 A.3.6 速度トラジェクトリ................................................. 249 B ユーティリティ............................................................ 251 B.1 setwater.............................................................. 251 B.2 mergetpl.............................................................. 253 B.3 SHAKEinp.............................................................. 255 B.4 RIGIDinp.............................................................. 256 B.5 GBSAinp............................................................... 258 B.6 自由エネルギー計算(Filling potential 法 + WHAM 法)解析 .............. 259 B.6.1 Generate_NextFP................................................... 259 B.6.2 Extract_Atom...................................................... 261 B.6.3 Wham_Analysis..................................................... 262 B.7 拡張アンサンブル向け解析ツール........................................ 264 B.7.1 reweightFB......................................................... 265 B.7.2 reweightST......................................................... 266 B.7.3 reweightGST........................................................ 267 B.7.4 selection.......................................................... 268 B.7.5 clustering......................................................... 270 B.8 存在確率(Potential Mean Force)解析ツール ........................... 274 B.8.1 pmf................................................................ 274 myPresto 4.2 xiv B.8.2 contour............................................................ 276 B.9 pca ................................................................... 277 B.10 Gamess2tplinp........................................................ 279 B.11 Gauss2tplinp......................................................... 280 B.12 tpl2mol2............................................................. 281 B.13 add_ion.............................................................. 282 B.14 confgene............................................................. 285 B.15 confgeneC............................................................ 287 B.16 自由エネルギー摂動法(開発中)....................................... 289 B.16.1 計算方式.......................................................... 289 B.16.2 vdw パラメータおよび電荷のスケーリング機能(cosgene) ............. 291 B.16.3 analyze........................................................... 292 B.16.4 FEP............................................................... 293 B.17 Hgene................................................................ 294 B.18 MVO .................................................................. 296 B.19 sptool............................................................... 298 B.19.1 Descriptor........................................................ 298 B.19.2 Solubility........................................................ 300 B.19.3 FreqMaker......................................................... 301 B.19.4 wln............................................................... 301 B.19.5 pls............................................................... 302 B.19.6 mlr............................................................... 302 B.19.7 bys............................................................... 303 B.19.8 trans_code........................................................ 304 参考文献 ..................................................................... 307 myPresto 4.2 1 1 概要 1.1 分子シミュレーションシステム:myPresto myPresto(マイ・プレスト)は、高効率の構造探索アルゴリズムを採用した構造探索エ ンジンを備え、生体分子を対象とした分子シミュレーションシステムです。myPresto は、 生体分子の動的な立体構造のシミュレーションと自由エネルギー計算を目的とした、汎用 的でかつ高効率なシステムを目指して開発されました。主たる応用範囲は、蛋白質のモデ リング、蛋白質−薬物低分子のモデリング、薬物ドッキング、膜蛋白質の計算などです。 myPresto version 4.0 では、以下のサブシステム群から構成されています。利用手順と して、分子の初期座標・トポロジーファイルの準備段階(tplgene/tplgeneL)、エネルギー 最小化・MD 計算の段階(cosgene)、解析ツールによる結果解析の段階に分けられます。 ① トポロジージェネレータ:tplgene ② 低分子トポロジージェネレータ:tplgeneL ③ 構造探索エンジン:cosgene ④ 各種ツール群 ⑤ 化合物データベース:LigandBOX 分子の初期座標・トポロジーファイルの準備段階 (tplgene/tplgeneL) エネルギー最小化・MD 計算の段階 (cosgene) 解析ツールによる結果解析の段階 myPresto の構成 myPresto 4.0 2 1.2 トポロジージェネレータ:tplgene myPresto を用いてエネルギー最小化・MD 計算を行う時は、まず始めにその分子系のトポ ロジーファイルを作成する必要があります。このファイルは tplgene サブシステムを使用 することにより、簡単に作成できます。 tplgene を用いると、標準入力において、水素原子など、一部の情報が含まれていない不 完全なカーテシアン座標を用いても、コンフォメーションエネルギー計算を行うための初 期構造として、完全なカーテシアン座標を得ることができます。 対応する力場は AMBER および CHARMm です。 1.3 低分子トポロジージェネレータ:tplgeneL 低分子トポロジージェネレータ tplgeneL は、tplgene では対応していないリガンド等の 低分子について、トポロジーファイルを作成することができます。 対応する力場は AMBER parm99 と AMBER General Amber Force Field(GAFF)です。 tplgene、及び、tplgeneL サブシステムで作成したトポロジーファイルを結合し、1つの ファイルにすることにより、高分子−低分子複合体の MD の計算を行う事ができます。 1.4 構造探索エンジン:cosgene tplgene によって準備した分子の初期座標・トポロジーファイルを入力とし、エネルギー 最小化・MD の計算を行います。主に以下のような機能を備えています。 (現バージョンでは、Fast Multipole Method は使用できません。) cosgene の主な機能 機能分類 内容 エネルギー最小化 Steepest decent method, Steepest decent method with SHAKE, Conjugate gradient method MD 計算 Micro-Canonical, Canonical, Force-biased Multi-Canonical Tsallis Dynamics 積分器 Leap-frog (Verlet), Velocity Verlet, RESPA Thermostat Hoover-Evans Gaussian constraint, Nose-Hoover Barostat Andersen, Parrinello-Rahman 長距離相互作用 Direct summation, Direct summation & Cutoff, Ewald, Particle Mesh Ewald, Fast Multipole Method 拘束法 SHAKE, RATTLE, Rigid-body, Position restraint, Distance restraint 境界条件 myPresto 4.2 球・楕円体、周期境界条件 3 1.5 インストール (1)インストールに必要な環境 ・UNIX(Linux)環境 :myPresto の実行環境です。 ・C コンパイラ :tplgene および tplgeneL の構築に使用します。 ・Fortran90 コンパイラ :cosgene の構築に使用します。 (2)インストール方法 myPresto 以下のディレクトリをインストール先のディレクトリにコピーします。 myPresto のディレクトリ構成は以下のようになっています。 ・tplgene :tplgene 本体 ・tplgeneL :tplgeneL 本体 ・cosgene :cosgene 本体 ・tools :ツール群 ・doc :ドキュメント群 ・sample :サンプルデータ(本マニュアルの「5 計算例」の章に対応) myPresto tplgene bin DB src tplgeneL cosgene bin DB src bin src tools doc sample sample1 sample2 ... sampleN tplgene, tplgeneL, cosgene の "src" ディレクトリで make コマンドを使用します。 tools 下のツールは、適宜コンパイルしてください。 【注意】実際のコンパイル環境に合わせて Makefile の修正が必要な場合があります。 cosgene では PME 法で使用する FFT ライブラリを、Makefile の FFT_DEF と FFT_LIB で指 定することができます。 myPresto 4.2 4 1.6 化合物データベース:LigandBOX (1)化合物データベース LigandBOX ナミキ商事株式会社が配布する 2 次元電子カタログより、myPresto によって水素原子付 加、分子総電荷見積もりを行い、分子を 3 次元化した、mol2 ファイル書式のデータセット です。 ディレクトリ構成は以下のようになっています。 ・MOLDB :化合物データベース作成ツール ・doc :ドキュメント ・mol2_2004 :2004 年度 2 次元電子カタログを基に作成した 3 次元化合物データ ・mol2_2005 :2005 年度 2 次元電子カタログを基に作成した 3 次元化合物データ LigandBOX MOLDB doc mol2_2004 mol2_2005 (2)蛋白質−化合物相互作用行列 LigandBOX の 2004 年度 2 次元電子カタログを基に作成した 3 次元化合物データを元に作 成した蛋白質−化合物相互作用行列です。 ディレクトリ構成は以下のようになっています。 ・list :蛋白質および化合物のリスト ・Matrix :蛋白質−化合物相互作用行列 ・tools :蛋白質−化合物相互作用行列解析ツール Matrix list myPresto 4.2 Matrix tools 5 ◆実施例 myPresto 4.2 7 2 tplgene 2.1 実行方法 tplgene は、対象分子の構造に関するデータ(PDB 形式ファイル、DIHED 形式ファイル) を入力として、分子の初期座標・トポロジーファイルの作成を行います。 計算の際に参照するディレクトリ(入力ファイル用、出力ファイル用、力場 DB 用)を環 境変数に設定することができます。環境変数を設定していない場合は、カレントディレク トリを参照するので、入力ファイル、力場 DB ファイルを、予め実行するディレクトリにコ ピーしておきます。 tplgene の実行の際は、以下の項目を指定します。これらは、画面からの対話入力、又は、 コマンドライン・オプションで指定することができます。 ■入力項目 ・トポロジーファイルのタイトル ・分子名 ・分子の種類(1:ペプチド鎖、2:DNA、RNA 鎖) ・入力ファイルの書式(1:PDB 形式、2:DIHED 形式) ・力場 DB ファイル名 ・入力ファイル名 ・出力 PDB ファイル名 ・出力 TPL ファイル名 以下は必要時のみ ・水モデルの選択(1:tip3p モデル、2:tip4p モデル) ・低分子 TPL ファイル名(カレントに配置、PDB 中の残基名は LGx:x=A-Z) % tplgene または、 % tplgene (オプション) コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップさ れます。オプション指定しなかったものだけを対話的に入力することになります。 myPresto 4.0 8 -title <title_name> タイトルを<title_name>に指定します -molname <molcular_name> 分子名を<molcular_name>に指定します -i <input_coord> 入力座標ファイル名を<input_coord>に指定します -db <db_file> 力場 DB ファイル名を<db_file>に指定します -chain [ pep │ nuc ] 計算する分子の種類を指定します ペプチド ⇒ pep ヌクレオチド ⇒ nuc -filetype [ pdb │ dihed ] 入力ファイルの種類を指定します PDB ファイルフォーマット ⇒ pdb DIHED ファイルフォーマット ⇒ dihed -outcrd <output_coord> 出力座標ファイル名を<output_coord>に指定します -outtpl <output_tpl> 出力トポロジーファイル名を<output_tpl>に指定します -water [tip3p │ tip4p] 入力ファイル内に水情報を含む場合、水モデルの力場を指定します tip3p 水モデル ⇒ tip3p(デフォルト) tip4p 水モデル ⇒ tip4p ■オプション指定例(下線部が入力部分) % tplgene -i vas.dih -chain pep -filetype dihed -db C96_aa.tpl また、オプション"-h"または、"-help"の指定により、tplgene の使用法を見ることがで きます。 % tplgene -h または % tplgene myPresto 4.2 -help 9 なお、予め対話入力する項目(作業指示)をファイル(作業指示ファイル:control_file) に保存しておくことによって、tplgene を実行する度に対話入力をする手間を省略すること ができます。 % tplgene < control_file ■作業指示ファイル例 ALA-ALA :タイトル行、10 行以内で自由に書くことができる。 END :タイトル行の最後には END と記述する。 ALA-ALA :分子名、自由に書くことができる。 GLY-GLY :複数分子の計算は複数行に各々の分子名を記述する。 END :分子名の最後の行は END と記述する。 1 :ペプチド鎖は 1、DNA、RNA 鎖は 2 と記述する。 1 :PDB 入力は 1、DIHED 入力は 2 と記述する。 C96_aa.tpl :力場 DB ファイル名を記述する。 ALA-ALA-input.pdb :入力ファイル名を記述する。 ALA-ALA_out.pdb :出力 PDB ファイル名を記述する。 ALA-ALA-out.tpl :出力 TPL ファイル名を記述する。 以下は必要時のみ追記 1 :水モデルを記述する(1:tip3p 2:tip4p、必要時のみ)。 Lig.tpl :リガンド tpl ファイル名を記述する(必要時のみ)。 tplgene の結果出力より得られる情報は、分子系の全原子を考慮したトポロジーおよび座 標情報です。これらの2つの情報を用いて、多くのコンフォメーションエネルギー計算が 実行されます。 対象分子の構造に関するデータ、使用する力場、出力ファイルのディレクトリをそれぞ れ分けたい場合は、それらのパスを環境変数で指定することができます。環境変数が設定 されていない場合は、実行時のカレントディレクトリを参照します(「2.2.4 環境変数」参 照)。 myPresto 4.2 10 2.2 入力データの作成 2.2.1 PDB 形式ファイル 標準的な PDB 形式ファイルを使用します。必要な情報を以下に示します。 (1) アミノ酸残基名、及び、残基並び情報 (2) アミノ酸残基の各原子名、及び、カーテシアン座標情報 (3) ジスルフィド結合情報 (4) 環状分子情報 上記1及び2は入力が必須です。3及び4は必要な場合にのみ指定することができます。 ジスルフィド結合は通常の PDB 形式に従って定義します。環状分子を計算する場合には、 ATOM 行よりも前の行に、CIRCLE のキーワードを指定します(下図参照)。 PDB ファイル中に複数分子(複数鎖)の情報が含まれている場合には、それらすべての分 子について計算を行います(これらは“TER”で区切られているものとします)。 また、金属イオン、ハロゲンイオン 、水分子情報を含む場合には、”ATOM”の代わり に”HETATM”で指定し、それらの分子についての計算を行います。 なお、Alternate location indicator(17 カラム目)に tplgene は対応していません。 重複している原子と Alternate location indicator を削除してから計算して下さい。 ■PDB 形式ファイルの例 SSBOND 1 CYS A 6 CYS A 11 CIRCLE ATOM 20 N GLU A 4 33.037 -5.952 10.469 ATOM 21 CA GLU A 4 33.629 -7.247 10.859 ATOM 22 C GLU A 4 32.721 -7.845 11.909 ATOM 23 O GLU A 4 32.470 -9.061 11.856 ATOM 24 CB GLU A 4 35.029 -7.100 11.439 ATOM 25 CG GLU A 4 36.081 -6.452 10.545 ATOM 26 CD GLU A 4 35.906 -5.028 10.096 ATOM 27 OE1 GLU A 4 35.591 -4.102 10.842 ATOM 28 OE2 GLU A 4 36.158 -4.867 8.851 HETATM 29 Zn ZN 1 29.157 3.021 20.624 1.00 41.80 Zn HETATM 30 Zn ZN 2 20.538 16.287 4.630 1.00 43.88 Zn HETATM 32 O HOH 1 29.669 21.569 37.480 1.00 49.12 O HETATM 33 O HOH 2 20.132 6.585 18.359 1.00 60.57 O HETATM 34 O HOH 3 23.610 26.063 37.625 1.00 62.85 O … TER myPresto 4.2 11 2.2.2 DIHED 形式ファイル 1分子のカーテシアン座標を生成したいときは、DIHED フォーマットファイルが有効です。 このフォーマットではアミノ酸残基とジスルフィド結合情報、環状分子情報を記述するだ けで使用できます。必要な情報を以下に示します。 (1) アミノ酸残基名、及び、残基並び情報 (2) 環状分子情報 (3) ジスルフィド結合情報 (4) 二面角情報 上記、1は必須な情報です。2∼4は必要ならば指定することができます。 二面角情報を記述しない場合は、伸びた鎖構造を生成します。二面角情報を記述した場 合は、それらの値に従った鎖構造を生成します。 ■DIHED 形式ファイルの例 DODECA-PEPTIDE の DIHED FILE は以下のように記述します。このペプチド鎖は 12 残基か らなり、3、9 残基目の CYS-CYS 間でジスルフィド結合しています。 PRE>SEQUENCE ASP :1 LYS :2 CYS :3 -----+ CYS :4 │ HIS :5 │ HIS :6 LEU :7 │ TRP :8 │ CYS :9 -----+ GLN :10 GLU :11 GLU :12 S-S BRIDGE PRE>SSBONDS 3 9 PDB 中アミノ酸残基は以下のキーワードを入力します。入力は、"PRE>" で始まるいくつ かのグループからなります。 myPresto 4.2 12 (1)アミノ酸シーケンス(PRE>SEQUENCE) アミノ酸残基情報を記述します。キーワード "PRE>SEQUENCE" の次の行から N 末端側から 順次、アミノ酸名を入力していきます。1行に1つのアミノ酸名を記述します。 C96、C99 データベース共通に利用可能なアミノ酸は、以下の様になっています。 ACE (N 端アセチル基)/ ALA / ARG / ASN / ASP / ASH (ASP neutral) / CYS / CYSS / GLN / GLU / GLH (GLU neutral) /GLY / HIS / HISE / HIS / ILE / LEU / LYS / MET / PHE / PRO / SER / THR / TRP / TYR / VAL / NMEC (C 端メチル基) / NHEC (C 端アミノ基) / ABA (2-aminobutanoic acid) / NLE (2-aminohexanoic acid) / SEP (SER リン酸化物) / TYP (TYR リン酸化物) / THP (THR リン酸化物) / LYN (LYS neutral) / CYM (S- 解離型 CYS) 一方、C99 データベースのみ、以下のメチル化された残基が利用可能です。 MML (メチル LYS) / DML (ジメチル LYS) / TML (トリメチル LYS) MMA (メチル ARG) / ADA (非対称ジメチル ARG) / SDA (対称ジメチル ARG) 同様に、C99 データベースのみ、以下のメチル化されたヌクレオチドが利用可能です。 DMC (メチル C) なお、残基では N 末端・中央・C 末端、ヌクレオチドでは中央のデータが用意してあります。 (2)環状分子の場合の指定(PRE>CIRCULAR) この分子が環状分子であることを示します。 (3)S-S 結合の指定(PRE>SSBOND) ジスルフィド結合を有する場合には以下のように記述します。 myPresto 4.2 13 PRE>SSBOND 3 :1 行目、この分子が SS 結合を持つことを示す。 9 :3 番と 9 番の残基が SS 結合している。 (4)二面角の指定(PRE>DIHEDRAL-ANGLES) 二面角情報を記述します。N 末端から C 末端までのφ、ψ、ω、χを記述します。1行ごと に 10 個以内の角度値を記述します。角の定義は ECEPP に従います。 プログラムの内部では、次の様な処理を行っています。 ‘+’;プロトン化された LYS、ARG、HIS の場合に残基名の後ろに付加する。 ‘-' ;非プロトン化された ASP、GLU の場合に付加する。 ‘E’;HIS の中で、AN HD 水素のかわりに、AN HE 水素を持つものの場合に付加する。 ‘S’;CYS の中で、ジスルフィド結合をつくるものの場合付加する。 N および C 末端には、以下の処理を行います。 ‘N+’;プロトン化された、 N 末端の場合 ‘N ' ;ニュートラルな、 N 末端の場合 ‘C-’;非プロトン化された、C 末端の場合 ‘C ’;ニュートラルな、 C 末端の場合 現バージョンでは、以下の処理を自動的に行います。 N 末端の場合は、'N+'を自動的に付加する。 C 末端の場合は、'C-'を自動的に付加する。 LYS、ARG の場合は、'+'を自動的に付加する。 ASP、GLU の場合は、'-'を自動的に付加する。 ジスルフィド結合している CYS に対しては、'S'を自動的に付加します。 2.3 力場データベースファイル 現在、アミノ酸の力場データベースとして 4 種類、ヌクレオチドの力場データベースと して 2 種類、水分子、金属イオンの力場データベースとして 1 種類用意しています。 アミノ酸の力場データベース C96_aa.tpl AMBER96 力場に対して、全アミノ酸モノマーのトポロジー情報を 持つ myPresto 4.2 14 C99_aa.tpl AMBER99 力場に対して、全アミノ酸モノマーのトポロジー情報を 持つ(メチル基を修飾した ARG、LYS が利用可能) charmm19_aa_all.tpl CHARMm19 力場に対して、全アミノ酸モノマーのトポロジー情報を 持つ charmm22_aa_all.tpl CHARMm22 力場に対して、全アミノ酸モノマーのトポロジー情報を 持つ ヌクレオチドの力場データベース C96_na.tpl AMBER96 力場に対して、全ヌクレオチドのトポロジー情報を持つ C99_na.tpl AMBER99 力場に対して、全ヌクレオチドのトポロジー情報を持つ (メチル基を修飾した C が利用可能) 水分子、金属イオンの力場データベース metals.tpl myPresto 4.2 水分子、イオン関連のトポロジー情報を持つ 15 2.4 環境変数 対象分子の構造に関するデータ、使用する力場、出力ファイルを保存するディレクトリ をそれぞれ分けたい場合には、それらのパスを環境変数で指定することができます。 環境変数は以下の 3 種類を設定することができます。環境変数を設定しない場合には、 実行時のカレントディレクトリを参照します。 ■環境変数について 環境変数名 説明 TPL_INPUT_PATH :tplgene 入力ファイル用ディレクトリ(パスを含めて記述する) TPL_OUTPUT_PATH :tplgene 出力ファイル用ディレクトリ(同上) TPL_DB_PATH :tplgene 力場 DB 用ディレクトリ(同上) (設定例) tplgene 力場 DB 用ディレクトリを"/home/user01/myPresto/tplgene/DB"とする場合。 環境変数の設定は、使用しているシェルの設定方法に従います。 (下線部が入力部分です) (1)bash の場合 % export TPL_DB_PATH=/home/user01/myPresto/tplgene/DB (2)csh の場合 % setenv TPL_DB_PATH /home/user01/myPresto/tplgene/DB ※環境変数で設定するディレクトリへのパスが固定される場合は、ログインスクリプト (.bashrc, .cshrc)や専用スクリプトに書き込んでおくと便利です。 なお、現在使用しているシェルは以下のコマンドで確認できます。 % ps myPresto 4.2 17 3 tplgeneL 3.1 実行方法 tplgeneL は、対象分子の構造に関するデータ(tplgeneL オリジナル形式ファイル、又は、 mol2 形式ファイル)を入力として、分子の初期座標・トポロジーファイルの作成を行いま す。 計算を行う際に参照するディレクトリ(入力ファイル用、出力ファイル用、力場 DB 用) は、環境変数に設定することができます。環境変数を設定していない場合は、カレントデ ィレクトリを参照しますので、入力ファイル、原子タイプ定義ファイル、力場パラメータ DB ファイルを、予め実行するディレクトリにコピーしておきます。 tplgeneL の実行の際は、以下の項目を指定します。これらは、画面からの対話入力、又 は、コマンドライン・オプションで指定することにより計算を行います。 ■入力項目 ・入力ファイルの書式(1:tplgeneL オリジナル形式、2:Sybyl mol2 形式) ・入力ファイル名 ・不足パラメータが存在する場合の処理方法 (1:デフォルトパラメータを使用する、2:動的にパラメータの計算を行う 3:デフォルトパラメータの使用するが、パラメータのないものは動的にパラ メータの計算を行う) ・パラメータ DB ファイル名 ・フラグメント DB を使用するか(yes:使用する、no:使用しない) % tplgeneL または、 % tplgeneL (オプション) コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップさ れます。オプションで指定しなかったものだけを対話的に入力することになります。 myPresto 4.0 18 -ft [ 1 │ 2 ] 入力ファイル形式を指定します -i tplgeneL オリジナル入力ファイル : 1 Sybyl mol2 入力ファイル : 2 <file> 入力ファイル名を<file>に指定します -d <db_file> パラメータ DB ファイル名を<db_file>に指定します -r <resname> 出力するトポロジーファイルに記述する残基名を <resname>に指定します(4 文字以内) -f [ yes │ no ] フラグメント DB を使用するか否かを指定します -p 使用する ⇒ yes あるいは y 使用しない ⇒ no あるいは n [ 1 │ 2 ] 不足パラメータの補填方法を選択します デフォルトパラメータ : 1 動的補填 : 2 デフォルトパラメータ+動的補填 : 3 ■オプション指定例(下線部が入力部分) % tplgeneL -i methanol -d prm_gaff.db -f no また、オプション"-h"または、"-help"の指定により、tplgeneL の使用法を見ることがで きます。 % tplgeneL -h または、 % tplgeneL myPresto 4.2 -help 19 なお、予め対話入力する項目(作業指示)をファイル(作業指示ファイル:control_file) に保存しておくことによって、tplgeneL を実行する度に対話入力をする手間を省略するこ とができます。 % tplgeneL < control_file ■作業指示ファイル例 1 :入力ファイルフォーマットを記述(1:original、2:mol2)。 methanol :ファイル名を記述する(拡張子は除く)。 1 :不足パラメータの補填方法を記述(1:default、2:動的補填)。 prm_gaff.db :パラメータ DB ファイル名を記述する。 no :フラグメント DB を使用するかを記述する(yes/no)。 tplgene で得られた高分子のトポロジーファイルと tplgeneL で得られたトポロジーファ イルを結合することにより、cosgene にて、高分子−低分子複合体の MD シミュレーション を行う事ができます。 対象分子の構造に関するデータ、使用する力場、出力ファイルのディレクトリをそれぞ れ分けたい場合は、それらのパスを環境変数で指定することができます。環境変数が設定 されていない場合は、実行時のカレントディレクトリを参照します(「3.2.6 環境変数」参 照)。 myPresto 4.2 20 3.2 入力データの作成 tplgeneL で使用する分子の情報に関する入力ファイルは、tplgeneL オリジナル形式ファ イル(bond ファイル、charge ファイル、zmat ファイル)と Sybyl mol2 形式ファイル(mol2 ファイル)の 2 種類に対応しています。 3.2.1 tplgeneL オリジナル形式ファイル tplgeneL オリジナル入力ファイルを使用する場合には、以下の 3 種類のファイルを使用 します。 (1)電荷情報ファイル(XXX.charge ファイル(ここでXXX はファイル名(拡張子を除く)を示す) 原子名(項目 1)、元素記号(同 2)、Mulliken 電荷情報(同 3)、Resp 電荷情報(同 4)が記述さ れています。 (2)結合情報ファイル(XXX.bond ファイル) 結合している原子の番号の組(項目 1、2)、結合長(同 3)、結合次数(同 4)が記述されていま す。 (3)座標情報ファイル(XXX.zmat ファイル) 入力分子の Z-matrix 情報が記述されています。 上記1、2のファイルは必須です。3のファイルは存在する場合には、その情報がトポロ ジーファイルに反映されます。 ■電荷情報ファイルの例 C1 C -0.1320 -0.1320 O2 O -0.7323 -0.7323 H3 H 0.1340 0.1340 H4 H 0.1653 0.1653 H5 H 0.1644 0.1644 H6 H 0.4006 0.4006 ■結合情報ファイルの例 1 2 1.4130 0.7600 1 3 1.1160 0.9530 1 4 1.1200 0.9480 1 5 1.1200 0.9480 2 6 0.9630 0.7970 myPresto 4.2 21 ■座標情報ファイルの例 C O 1 1.4132350 H 1 1.1159340 2 112.6746 H 1 1.1195330 2 107.3658 3 121.0117 0 H 1 1.1196880 2 107.4483 3 -121.0171 0 H 2 .9627370 1 107.7002 5 -120.0241 0 myPresto 4.2 22 3.2.2 Sybyl mol2 形式ファイル tplgeneL では tplgeneL オリジナル形式ファイル以外にも、Sybyl mol2 形式ファイルも 使用することができます。 Sybyl mol2 ファイルには、分子情報(@<TRIPOS>MOLECULE 情報)、原子情報(@<TRIPOS>ATOM 情報)、結合情報(@<TRIPOS>BOND 情報)等が存在しますが、tplgeneL ではその内の原子情報、 結合情報を使用します。原子情報、結合情報には以下の情報が含まれています。 (1)原子情報(@<TRIPOS>ATOM 情報) ・原子 ID :1からの通し番号。 ・原子名 :原子名。1、2文字目は元素記号です。 ・座標 :カーテシアン座標での座標。 ・原子タイプ :Sybyl の原子タイプ。 ・サブ構造 ID :その原子を含むサブ構造の ID。 <tplgeneL では使用しません。> ・サブ構造名 :その原子を含むサブ構造名。 <tplgeneL では使用しません。> ・電荷 :各原子の電荷情報。 ・status bit :Sybyl 固有のステータス情報。 <tplgeneL では使用しません。> (2)結合情報(@<TRIPOS>BOND 情報) ・結合 ID :1からの通し番号。 ・原子 ID1 :結合している原子1の番号(上記の原子情報の原子 ID と一致)。 ・原子 ID2 :結合している原子2の番号(上記の原子情報の原子 ID と一致)。 ・結合タイプ :結合のタイプ(1、2、3、am、ar、du、un、nc)。 ・status bit :Sybyl 固有のステータス情報。 <tplgeneL では使用しません。> 【参照】Sybyl mol2 形式ファイルの書式については、以下を参照。 Tripos Online Mol2 File Format URL http://www.tripos.com/custResources/mol2Files/index.html myPresto 4.2 23 ■Sybyl mol2 ファイルの例 @<TRIPOS>MOLECULE methanol.mol2 6 5 0 0 0 SMALL NO_CHARGES @<TRIPOS>ATOM 1 C 0.7253 0.0134 0.0001 C.3 1 <1> -0.1320 2 O -0.6859 -0.0645 -0.0000 O.3 1 <1> -0.7323 3 H 1.0981 1.0651 0.0186 H 1 <1> 0.1340 4 H 1.0901 -0.5342 0.9059 H 1 <1> 0.1653 5 H 1.0900 -0.5012 -0.9251 H 1 <1> 0.1644 6 H -1.0287 0.8351 0.0005 H 1 <1> 0.4006 @<TRIPOS>BOND 1 1 2 1 2 1 3 1 3 1 4 1 4 1 5 1 5 2 6 1 myPresto 4.2 24 【補足】tplgeneL における mol2 形式ファイル読み込み処理について ・tplgeneL が参照する mol2 形式ファイルの情報 tplgeneL では、@<TRIPOS>MOLECULE 情報は参照しません。 指定された mol2 形式ファイルから、 @<TRIPOS>ATOM : @<TRIPOS>BOND : に記述された ATOM、BOND 情報のみを取得して処理を行います。したがって、 ・ATOM、BOND 部分の記述において、書式にエラーがある場合、tplgeneL はエラーメッセー ジを表示して終了します。 ・ATOM、BOND 以外の@<TRIPOS>で書式にエラーがあっても、処理は継続されます。 ・ATOM、BOND 項の status bit の扱いについて MOL2 ファイル中の status bit は SYBYL 内部で指定されるものです。 有効なステータスビットは以下の様になっていますが、この項目はユーザが設定するもの ではありませんので、tplgeneL ではこの項目のエラーチェックは行っていません。 (参考)ATOM 有効ステータスビット DSPMOD、TYPECOL、CAP、BACKBONE、DICT、ESSENTIAL、WATER、DIRECT (参考)BOND 有効ステータスビット TYPECOL、GROUP、CAP、BACKBONE、DICT、INTERRES ・結合のタイプの扱いについて MOL2 ファイルで定義されている結合のタイプは以下に示すものがあります。 1 = single 2 = double 3 = triple am = amide ar = aromatic du = dummy un = unknown nc = not connected myPresto 4.2 25 tplgeneL では、結合のタイプ"am"が指定されている場合には、内部的にはその結合を単 結合として処理を行います。同様に、タイプ"ar"が指定されている場合には、内部的に芳 香族結合として処理を行います。 タイプ"du"、"un"、"nc"が指定されている場合には、tplgeneL では処理を行うことがで きません。エラーメッセージを出力し、プログラムを終了します。 myPresto 4.2 26 【エラーメッセージとその原因】 項番 1. 2. 3. エラーメッセージ エラー原因 ERROR> ltgReadMOParmMol2 継続記号の次行1文字目に”@”,”#”が存在する。 Contents Error : filename.mol2 Start of next line must not begin with "@" or "#", if line is continued with a back slash "¥". Please check following information. (エラー付近のデータ) ERROR> ltgReadMOParmMol2 行の1文字目以外に、"@", "#" が存在する。 Contents Error : filename.mol2 It is necessary to describe sign "@" and "#" in column 1 of the line. Please check following information. (エラー付近のデータ) ATOM 項について、 継続記号のあとにデータが続いている。 ERROR> ltgReadMOParmMol2 1 項目め(原子ID)が数字以外の文字含む Contents Error : filename.mol 2 項目め(原子名)の1 文字目が数字 Atom format is wrong. 3 項目め(x 座標)が数字、"-"、"."以外の文字含む Please check following information. 4 項目め(y 座標)が数字、"-"、"."以外の文字含む (エラー付近のデータ) 5 項目め(z 座標)が数字、"-"、"."以外の文字含む 6 項目め(原子タイプ)の1 文字目が数字 7 項目め(サブ構造ID)に数字以外の文字含む 9 項目め(原子タイプ)が数字以外の文字含む または、 項目数が、6 個より少ない、または、10 個より多 く記述されている。 BOND 項について、 継続記号のあとにデータが続いている。 1 項目め(結合ID)が文字列を含む 2 項目め(原子ID)が文字列を含む 3 項目め(原子ID)が文字列を含む 項目数が、4 個より少ない、または、5個より多く 記述されている。 ERROR> ltgReadMOParmMol2 BOND 項の4 項目め(結合のタイプ)が、MOL2 ファイル Contents Error! フォーマットで定義されていない文字列が指定され The Bondtype ("結合のタイプ ") that Mol2 Format does ている。 not support is found. Please check following information. (エラー付近のデータ) ERROR> ltgReadMOParmMol2 BOND 項の4 項目め(結合のタイプ)が、MOL2 ファイル Contents Error! フォーマットで定義されているが、tplgeneL でサポ The Bondtype ("結合のタイプ") that tplgeneL does not ートしていない結合のタイプ(du、un、nc)が指定さ support is found. れている。 Please check and modify following information. (エラー付近のデータ) ERROR> ltgReadMOParmMol2 ATOM 行または BOND 行がない File Format Error : *.mol2 File Format is not correct. ERROR> ltgReadMOParmMol2 Contents Error : filename.mol Bond format is wrong. Please check following information. (エラー付近のデータ) 4. 5. 6. myPresto 4.2 27 項番 7. 8. 9. エラーメッセージ ERROR> ltgDefineBond Contents Error! Isolated Atom ("原子名") that it has not any Bond is detected in Input File. Please check Input Files. : *.bond or *.mol2. ERROR> ltgReadMOParmMol2 Contents Error! Bond information does not match to Atom information. Please check mol2 file "filename.mol2 ". ERROR> ltgDefineBond Contents Error! The Bond Information is overlapped. : (重複してい る原子の組) Please confirm Input Files. : *.bond or *.mol2. エラー原因 ATOM 項とBOND 項の整合性が取れていない ATOM 項が多い ATOM 項とBOND 項の整合性が取れていない BOND 項が多い BOND 項に同じ原子の組が複数回記述されている。 myPresto 4.2 28 3.3 原子タイプ定義ファイル tplgeneL では、まず始めに計算したい分子の各々の原子の原子タイプを割り当て、次に 各原子タイプの組に対応する力場のパラメータを割り当てます。 原子タイプ定義ファイルには、各原子の環境(元素記号、その原子の結合の数、結合次数、 環内原子か否か、芳香族原子か否か)毎に対応する原子タイプ情報が記述されています。 tplgeneL には以下の 2 種類の力場の原子タイプ定義ファイルを用意しています。 原子タイプ定義ファイル atomtype_gaff.db AMBER GAFF 力場用原子タイプ割り当て規則 DB ファイル atomtype_amber99.db AMBER parm99 力場用原子タイプ割り当て規則 DB ファイル 3.4 力場パラメータデータベースファイル tplgeneL では、「3.2.3 原子タイプ定義ファイル」で割り当てた原子タイプに基づいて、 力場パラメータを割り当てます。 力場パラメータデータベースは、原子タイプ毎の結合パラメータ、結合角パラメータ、 二面角パラメータ、インプロパー二面角パラメータ情報が記述されている"prm_XXXX.db"フ ァイル、及び、ファンクションパラメータ、ノンボンドパラメータが 記述されている "nonbond_XXXX.db"ファイルで構成されています。 現在、力場パラメータデータベースファイルとして AMBER parm99 用のものと、AMBER GAFF 用のものを用意しています。 力場パラメータデータベースファイル prm_gaff.db AMBER GAFF 力場用パラメータ DB ファイル prm_amber99.db AMBER parm99 力場用パラメータ DB ファイル nonbond_gaff.db AMBER GAFF 力場用ノンボンドパラメータ DB ファイル nonbond_amber99.db AMBER parm99 力場用ノンボンドパラメータ DB ファイル 【補足】AMBER GAFF パラメータについて tplgeneL では AMBER ver.7 GAFF(GAFF7)と AMBER ver.8 GAFF(GAFF8)パラメータで計算を 行う事ができます。GAFF7 ではほとんどの低分子で計算が可能となっています。GAFF8 は myPresto 4.2 29 GAFF7 よりも計算できる分子は少ないが、正確な構造が計算できる事があります。 現在の仕様では GAFF7 と GAFF8 を同時に使用する事ができません。力場パラメータ DB デ ィレクトリ内の必要なファイルをコピーして使用して下さい。 なお、初期設定では GAFF7 の計算を行う事ができます。 GAFF8 関連ファイル atomtype_gaff8.db、 prm_gaff8.db、 nonbond_gaff8.db GAFF7 関連ファイル atomtype_gaff7.db、 prm_gaff7.db、 nonbond_gaff7.db 例)ファイルのコピーについて 以下のコマンドで、必要な各ファイルのコピーを行ってください。 GAFF8 パラメータを使用する場合 cp prm_gaff8.db prm_gaff.db cp atom_type_gaff8.db atom_type_gaff.db cp nonbond_gaff8.db nonbond_gaff.db GAFF7 パラメータを使用する場合 cp prm_gaff7.db prm_gaff.db cp atom_type_gaff7.db atom_type_gaff.db cp nonbond_gaff7.db nonbond_gaff.db myPresto 4.2 30 3.5 フラグメントデータベースファイル tplgeneL では、 「3.2.4 力場データベースファイル」で説明した AMBER 由来のパラメータ を割り当てる他に、分子の一部分をフラグメントと見なし、そのフラグメント部分にユー ザ独自のパラメータを割り振ることができます。 フラグメントデータベースファイルには、登録されているフラグメント(フラグメント ブロック)毎に、以下の情報が書かれています。 (1) フラグメント部分の原子パラメータ情報 (2) フラグメント部分の結合パラメータ情報 (3) フラグメント部分の結合角パラメータ情報 (4) フラグメント部分の二面角パラメータ情報 (5) フラグメント部分のインプロパー二面角パラメータ情報 フラグメントデータベースファイルを使用する場合には、上記の項目のうち、1、2は 必須となっています。3∼5は登録されている場合にはそのパラメータを使用します。 tplgeneL には以下の 2 種類の力場のフラグメントデータベースファイルを用意していま す。 フラグメントデータベースファイル frg_gaff.db AMBER GAFF 力場用フラグメントデータベースファイル frg_amber99.db AMBER parm99 力場用フラグメントデータベースファイル myPresto 4.2 31 3.6 環境変数 対象分子の構造に関するデータ、使用する力場、出力ファイルを保存するディレクトリ をそれぞれ分けたい場合には、それらのパスを環境変数で指定することができます。 環境変数は以下の 3 種類を設定することができます。環境変数を設定しない場合には、 実行時のカレントディレクトリを参照します。 ■環境変数について 環境変数名 TPLL_INPUT_PATH 説明 :tplgeneL 入力ファイル用ディレクトリ(パスを含めて記述する) TPLL_OUTPUT_PATH :tplgeneL 出力ファイル用ディレクトリ(同上) TPLL_DB_PATH :tplgeneL 力場パラメータ DB 用ディレクトリ(同上) (設定例) tplgeneL 力場パラメータ DB 用ディレクトリを"/home/user01/myPresto/tplgeneL/DB"と する場合。 環境変数の設定は、使用しているシェルの設定方法に従います。 (下線部が入力部分です) (1)bash の場合 % export TPLL_DB_PATH=/home/user01/myPresto/tplgeneL/DB (2)csh の場合 % setenv TPLL_DB_PATH /home/user01/myPresto/tplgeneL/DB ※環境変数で設定するディレクトリへのパスが固定される場合は、ログインスクリプト (.bashrc, .cshrc)や専用スクリプトに書き込んでおくと便利です。 なお、現在使用しているシェルは以下のコマンドで確認できます。 % ps myPresto 4.2 32 (余白) myPresto 4.2 33 4 cosgene 4.1 実行方法 cosgene は、tplgene や tplgeneL によって準備した分子の初期座標やトポロジーファイ ルなど、計算対象の系の分子情報を入力として、系のエネルギー最小化や MD 計算を行いま す。計算結果は、解析ツールを使用して解析することができます。 初期座標やトポロジーファイル、計算条件などの分子情報は、コントロールファイルで 指定します。cosgene はコントロールファイルを標準入力より読み込んで動作します。 % cosgene 4.2 < control_file > output 4.2.1 入力データの作成 コントロールファイル コントロールファイルは、以下のグループからなり、各グループは "QUIT" で終了します。 ・EXE> INPUT グループ :主な入力ファイル名を指定します。 ・EXE> MINI グループ :エネルギー最小化のオプションを指定します。 ・EXE> MD グループ :MD を行うためのオプションを指定します。 ・EXE> OUTPUT グループ :最終結果の出力を指定します。 ・EXE> END :コントロールファイルの終わりを示します。 EXE> INPUT TOPOLOGY= FORM COORDINA= PDB NAMETO= thrp.tpl ;トポロジーファイル NAMECO= thrp.pdb ;初期座標 QUIT EXE> MINI METHOD= CONJ LOOPLI= CUTMET= 40 RESA UPDATE= 20 CUTLEN= 8.0D0 ;共役勾配法でエネルギー最小化を行う ;40 回計算し、20 回ごとに相互作用テーブルを更新する。 ;相互作用 CUTOFF 長を 8A とする。 DIEFUN= DIST DIEVAL= 2.0D0 ;距離依存誘電率を使用する。 QUIT EXE> OUTPUT COORDINATE= PDB NAMECO= thrp_mini.pdb ;PDB 書式の最終構造 QUIT EXE> END エネルギー最小化の場合のコントロールファイルの例 myPresto 4.2 34 EXE> INPUT TOPOLOGY= COORDINA= FORM NAMETO= serp.tpl ;トポロジーファイル PDB NAMECO= serp.pdb ;初期座標 QUIT EXE> MD LOOPLI= 20000 ;MD のステップ回数 UPDATE= TIMEST= 20 0.5D0 ;相互作用テーブルの更新頻度 ;時間積分のタイムステップ METHOD= CANONICAL ;NVT カノニカル MD SETTEM= INITIA= 300.0D0 ;設定温度 SET STARTT= 300.0D0 RANDOM= 654321 CUTMET= DIEFUN= RESA CONS CUTLEN= DIEVAL= PDB NAMECO= 10.0D0 1.0D0 ;初期温度の設定 ;エネルギーCUTOFF の指定 ;誘電率 QUIT EXE> OUTPUT COORDINATE= serp_md_1p.pdb ;PDB 書式の最終構造 QUIT EXE> END MD の場合のコントロールファイルの例 コントロールファイルの各コマンド説明 myPresto 4.2 必須 ◎ 省略可 △ 特定機能をユーザ指定するとき必須 ○ 35 4.2.1.1 EXE> INPUT グループ INPUT グループでは、トポロジーファイル、初期座標、各種拘束・モニター対象の原子の 指定などのために、それらの外部ファイルの指定を行います(各外部ファイルの書式は、 巻末「A ファイル書式」を参照)。これら INPUT グループの入力は "EXE> MIN"、"EXE> MD" に共通で使用されます。 INPUT グループでの指定事項: (1)系のトポロジーの指定 (2)系の座標の指定 (3)SHAKE 対象原子と拘束距離の指定 (4)固定原子(fix atom)・自由原子の指定 (5)CAP ポテンシャルの指定 (6)拡張 CAP ポテンシャルの指定 (7)RMSD を計算するときの指定(MIN、MD 使用時) (8)位置拘束の指定 (9)原子間距離拘束の指定 (10)二面角拘束の指定 (11)モニター対象の指定 (12)系の GB/SA 及び ASA 用パラメータの指定 (13)Umbrella 拘束の指定 (14)系の重心あわせの指定 (15)QUIT (1)系のトポロジーの指定 TOPOLOgy:トポロジーファイルの書式(◎) =NOREad ;トポロジーファイル入力なし(デフォルト) =FORMAtted ;書式つきアスキーファイル =BINAry ;バイナリーファイル UNITTOpology:トポロジーファイルの IO unit(△) =10 ;(デフォルト) NAMETOpology=(トポロジーファイル名、133 文字以内 。TOPOLOgy=[FORM│BINA]のとき) (2)系の座標の指定 COORDInate:PDB 書式3次元座標ファイルの書式(◎) =NOREad ;座標入力なし(デフォルト) =PDB ;PDB ファイルフォーマット myPresto 4.2 36 =BINAry ;バイナリーファイル UNITCOordiante:座標ファイルの IO unit(△) =11 ;(デフォルト) NAMECOordinate=(座標ファイル名、133 文字以内。COORD=[PDB│BINA]のとき) (3)SHAKE/RATTLE 対象原子と拘束距離の指定 SHAKE/RATTLE を使用する場合は、対象原子の原子番号と拘束距離をファイルで指定する方 法と、それらの情報を自動的に作成する方法があります。ファイルには通常の2原子間の 距離の拘束のほかに、3原子による三角形(CH2 , H 2 O)および4原子による四面体(CH3 , NH3 ) のトポロジーでの距離の拘束を特別に指定することができます。SHAKE/RATTLE の自動作成 は以下の方法で行われます。 (a)水分子以外場合(分子名が"WAT"でない場合) 水素でない原子に対し 1∼3 つの水素原子が共有結合している場合に、これらの原子 間距離を計算し、それぞれ 2∼4 原子の SHAKE/RATTLE 情報として設定します。 (b)水分子の場合(分子名が"WAT"の場合) プログラム内部に保持している水の結合距離を基に 3 原子の SHAKE/RATTLE 情報とし て設定します。 (3−1)SHAKE/RATTLE 情報入力指定 SETSHAke:SHAKE/RATTLE を適用する原子を指定するファイルを読む(○) =NOREad ;SHAKE/RATTLE を使用しない(デフォルト) =READ ;SHAKE/RATTLE を使用する =AUTO ;SHAKE/RATTLE 情報を自動作成する UNITSHake:SHAKE 指定ファイルの IO Unit(△) =12 ;(デフォルト) NAMESHake=(SHAKE ファイル名、133 文字以内(△)) 【注意】SHAKE/RATTLE を使用する場合には、ほかに EXE> MD ないし EXE> MIN グループに "SHAKEMethod= [HBON │ ALLB]"を指定します。 【注意】SHAKE/RATTLE は、適用範囲に制限があります。 SHAKE/RATTLE の適用範囲 SHAKE RATTLE エネルギー最小化 最急降下法 (METHOD=STEEP) ○ × (EXE> MIN) 共役勾配法 (METHOD=CONJ) × × MD 計算 Leap Frog Verlet(INTEGR=LEAP) ○ × (EXE> MD) Velocity-Verlet (INTEGR=VELO) × ○ Multi Time Step (INTEGR=MTS) × myPresto 4.2 × 37 (3−2)SHAKE/RATTLE 自動作成情報出力指定 SHAKE/RATTLE 情報を自動作成した場合、作成された情報をファイル出力することができ ます。出力されるファイルの書式は入力ファイルと同じです。 DBGSHA:SHAKE/RATTLE 自動作成情報出力指定(△) =NOWRite :ファイル出力しない(デフォルト) =ASCIi :ファイル出力する UNITDS:SHAKE/RATTLE 自動作成情報ファイルの IO unit(△) =84 :(デフォルト) NAMEDS =( SHAKE/RATTLE 自動作成情報ファイル名、133 文字以内。) (4)固定原子(fix atom)・自由原子の指定 固定原子指定は、指定した原子を MIN/MD 計算の対象から外し力場を与える点として扱いま す。自由原子は通常の MIN/MD 計算の対象となる原子です。固定すべき原子番号を指定する か、または特定の中心と半径 R1,R2 を指定し、中心からの距離 R が R1 < R < R2 内となる 原子を指定することができます。そのための指定ファイルが必要です。同様に自由原子の 指定が行われます。この指定がなければ、系の原子はすべて自由原子として扱われます。 SETVARiables=:固定原子・自由原子指定ファイルの書式(△) =NOREad ;固定原子指定なし(デフォルト) =READ ;固定原子指定あり UNITVAribles:固定原子指定ファイルの IO unit(△) =13 ;(デフォルト) NAMEVAriables =(固定原子指定ファイル名、133 文字以内。) (5)CAP ポテンシャルの指定 CAP ポテンシャルを適用する原子と CAP の中心の座標、半径・力の定数を指定します。CAP 指定ファイルに原子を指定、中心座標などは CAP 指定ファイルでもコントロールファイル でも指定できますが、コントロールファイルの入力が優先されます。 SETBOUndary:CAP ポテンシャルを適用する原子と CAP の半径・力の定数を指定(○) =NOREad ;CAP を使用しない(デフォルト) =READ ;CAP を使用する UNITBOundary:CAP 指定ファイルの IO Unit(△) =14 ;(デフォルト) myPresto 4.2 38 NAMEBOundary=(CAP 指定ファイルの名前、133 文字以内(○)) 【注意】EXE> MD に "CALCAP=CALC" を加え、更に CAP パラメーターの指定を加えること。 また、"STOPCE=[TRAN│BOTH]" を指定し、系の第1チェイン(先頭分子)を空間に固定する ことで CAP ポテンシャルが第1チェインから外れないようにするのが望ましい。 (6)拡張 CAP ポテンシャルの指定 拡張 CAP ポテンシャルを適用する原子と拘束範囲、力の定数を指定します。拘束範囲は 球体および楕円体を指定できます。 SETEXtendCap:拡張 CAP ポテンシャルを適用する原子と拘束範囲、力の係数を指定(○) =NOREad ;拡張 CAP を使用しない(デフォルト) =READ ;拡張 CAP を使用する UNITExtendCap:拡張 CAP 指定ファイルの IO Unit(△) =23 ;(デフォルト) NAMEExtendCap=(拡張 CAP 指定ファイルの名前、133 文字以内(○)) 【注意】EXE> MD に "EXTCAP=CALC" を加えること。また、"STOPCE=[TRAN│BOTH]" を指定し、 系の第1チェイン(先頭分子)を空間に固定することで CAP ポテンシャルが第1チェイン から外れないようにするのが望ましい。 (7)RMSD を計算するときの指定(MIN、MD 使用時) REFCOOrdinate:参照ファイル。基準となる PDB 書式の座標ファイル(○) =NOREad ;使用しない(デフォルト) =PDB ;使用する UNITREfcoordi:参照ファイルの IO Unit(△) =15 ;(デフォルト) NAMEREFcoordi=(参照ファイルのファイル名、133 文字以内) 【注意】RMSD 計算時には、EXE>MD ないし EXE>MIN に”BESTFIt=YES”を加える。 (8)位置拘束の指定 位置拘束を使用するには、次の2つのファイルの準備が必要です。 ・拘束の対象原子の指定と力の定数に関する情報を記載した拘束指定ファイル ・拘束する座標を記載した PDB 形式の参照ファイル myPresto 4.2 39 REFCOOrdinate:参照ファイル、RMSD の時と同じ(○) =NOREad ;使用しない(デフォルト) =PDB ;使用する UNITREfcoordi:参照ファイルの IO Unit(△) =15 ;(デフォルト) NAMEREFcoordi=(参照ファイルのファイル名、133 文字以内(○)) POSITIonrestrain:対象原子、力の定数などの指定(○) =NOREad ;使用しない(デフォルト) =READ ;使用する UNITPOsition:拘束対象指定ファイルの IO Unit =16 ;(デフォルト)(△) NAMEPOsition=(拘束指定ファイルの名前、133 文字以内(○)) 【注意】更に、EXE> MIN ないし EXE> MD に”CALPSR=CALC”と位置拘束用パラメーターの指 定が必要です。 (9)原子間距離拘束の指定 原子間距離拘束指定ファイルを用意します。 DISTANcerestrain:原子間距離拘束を用いる =NOREad ;適用しない(デフォルト) =READ ;適用する UNITDIstance:距離指定ファイルの IO Unit =17 ;(デフォルト)(△) NAMEDIstance=(原子間距離拘束指定ファイルの名前、133 文字以内) 【注意】更に EXE> MIN ないし EXE> MD に”CALDSR= CALC”と拘束ポテンシャルの重みパラ メーターが必要です。 (10)二面角拘束の指定 二面角拘束指定ファイルを用意します。 DIHEDRalrestrain:2面角拘束を用いる =NOREad ;適用しない(デフォルト) =READ ;適用する myPresto 4.2 40 UNITDH:2面角拘束指定ファイルの IO Unit =18 ;(デフォルト)(△) NAMEDH=(2面角拘束指定ファイルの名前、133 文字以内) 【注意】更に EXE> MIN ないし EXE> MD に”CALDHR= CALC”と拘束ポテンシャルの重みパラ メーターが必要です。 (11)モニター対象の指定 特定原子の座標、原子間距離、角度、二面角などを MD の実行中にリアルタイムでモニター し、ファイルに出力する。対象とする原子、原子の対を指定するファイルを準備する。 OUTMONitoritems:モニター情報指定ファイル =NOREad ;適用しない(デフォルト) =READ ;適用する。 UNITMO:モニター指定ファイルの IO Unit =19 ;(デフォルト)(△) NAMEMO=(モニター指定ファイルの名前、133 文字以内(○)) 【注意】EXE> MD に、下記事項を設定する。 OUTTRJ= n :出力をnステップ毎に行う NAMETR= (モニター情報出力ファイル) MNTRTR= [ASCI │ BINAry] :出力形式 (12)系の GB/SA 及び ASA 用パラメータの指定 ASAREA:GB/SA 及び ASA 用パラメータ指定ファイル(○) =NOREad ;ファイル入力なし(デフォルト) =READ ;ファイル入力 UNITSA:GB/SA 及び ASA 用パラメータファイルの I/O unit(△) =77 ;(デフォルト)(△) NAMESA=(GB/SA 及び ASA 用パラメータ指定ファイルの名前、133 文字以内(○)) 【注意】GB/SA 及び ASA 用パラメータファイルは、専用ツールによって生成できます。ファ イルには各原子の半径や、atomic solvation parameter などを指定します(指定方法は、 myPresto 4.2 41 巻末「A ファイル書式」を参照)。 (13)Umbrella 拘束の指定 UMBREL:Umbrella 拘束ファイル(○) =NOREad ;適用しない(デフォルト) =READ ;適用する UNITUI:Umbrella 拘束ファイルの I/O unit(△) =22 ;(デフォルト)(△) NAMEUI=(Umbrella 拘束ファイルの名前、133 文字以内(○)) 【注意】Umbrella 拘束ファイルは、Filling Potential 法を適用した場合に使用します。 (指定方法は、巻末「A ファイル書式」を参照)。 (14)系の重心あわせの指定 SETORIgin:系の重心を座標の原点に置く。 =NO ;適用しない(デフォルト) =YES ;適用する (15)QUIT EXE>グループの入力の終わりを示す。 myPresto 4.2 42 4.2.1.2 EXE> MINimize グループ ここでは、エネルギー最小化に必要な、方法、収束条件、計算結果の出力、計算に用い るエネルギー項の指定、境界条件・拘束条件の指定を行います。 エネルギー計算に関する指定のほとんどは、EXE> MD グループと共通です。 MIN/MD 入力事項表 MIN MD 1 エネルギー最小化制御パラメーター(STEEP/CONJ 共通) ○ 1−1 最急降下法(STEEP)での制御パラメーター ○ 1−2 共役勾配法(CONJ)での制御パラメーター ○ 1−3 計算結果の出力指定(STEEP/CONJ 共通) ○ 1 MD 制御パラメーター ○ 1−1 計算上限の設定 ○ 1−2 MD のタイムステップとループ回数の指定 ○ 1−3 MD 計算の種類 ○ 1−4 拡張アンサンブル ○ 1−5 温度設定 ○ 1−6 MD 計算条件 ○ 1−7 ジョブのリスタート設定 ○ 1−8 計算結果の出力指定 ○ 2 解析用データ出力(エネルギー変化) 2 解析用データ出力(トラジェクトリー、パラメーター) 3 エネルギー計算に関する制御パラメーター ○ ○ 3−1 相互作用 CUTOFF の方法 ○ ○ 3−2 相互作用計算のスイッチ ○ ○ 3−3 Filling Potential 法 4 拘束条件の指定 ○ ○ 4−1 SHAKE/RATTLE の指定 ○ ○ 4−2 剛体モデルの指定 5 PME, Ewald, FMM の指定 ○ ○ 6 溶媒効果 ○ ○ 7 境界条件 ○ ○ 8 LIST ○ ○ 9 QUIT ○ ○ myPresto 4.2 ○ ○ ○ ○ 43 (1)エネルギー最小化制御パラメーター(STEEP/CONJ 共通) METHODofmini:エネルギー最小化の方法(◎) =STEEpest ;最急降下法(デフォルト) =CONJugate ;共役勾配法 CPUTIMelimit:CPU =60.0 time の上限(秒)(○) ;(デフォルト) LOOPLImit:エネルギー最小化サイクル数。 0 のときは初期座標のエネルギー計算のみ行う。(○) =0 ;(デフォルト) UPDATEinterval:座標情報の更新サイクル。(△) 1-5 相互作用エネルギーに CUTOFF が用いられている場合、相互作用テーブルの更新サイク ルを指定する。周期境界条件の場合は、ユニットセルから飛び出した原子の座標をユニッ トセル内に補正する計算の更新サイクルを指定する。 =20 ;(デフォルト) CONVGRadient:収束判定条件。(△) root mean square summation of force (R.M.S.F.) が指定の値より小さい場合、収束した と判定し計算を終了する。単位(kcal/mol/A)。 =0.1 ;(デフォルト) ISTEPLength:最初のステップでの原子の移動距離(初期座標との R.M.S.D.(A)) =0.01 ;(デフォルト)(△) (1−1)最急降下法(STEEP)での制御パラメーター 最急降下法でのステップ長のパラメーターを設定します。 UPRATE:前のステップでよりエネルギーの低い構造を得ることができていれば、ステ ップ長に UPRATE をかけて移動距離を伸ばす。 =1.2 ;(デフォルト) DOWNRAte:前のステップでエネルギーが高くなっているなら、ステップ長に DOWNRATE をかけて移動距離を短くする。 =0.6: ;(デフォルト) (1−2)共役勾配法(CONJ)での制御パラメーター myPresto 4.2 44 共役勾配法での探索パラメーターを設定します。 LINESEarchlimit:Line search のループ回数。あまり小さくしないこと。 =10 ;(デフォルト) CONVLInesearch:Line search の収束判定の閾値。 ( DIRGRD / DIRGRS ) ≦ CONVL に達すると収束したとみなす。 =0.1 DIRGRD : Current Directional Derivative. DIRGRS : Initial Directional Derivative. ;(デフォルト) (1−3)計算結果の出力指定(STEEP/CONJ 共通) MONITOrinterval:標準出力の出力サイクル エネルギー、RMSD などの出力を行うサイクルを指定する。(△) =10 ;(デフォルト) LOGFORmat:標準出力の書式(△) =SHORt ;1行 80 文字以内の簡易出力(デフォルト) =DETAil ;1行 80 文字以内の詳細出力。各エネルギーを追加。 BESTFItmini:エネルギー最小化での、参照構造に対する系の第1チェインの RMSD の 変化を標準出力する。参照構造は、EXE> INPUT フェーズにて "REFCOORD", "NAMERE" を指定する必要がある。(△) =NO ;計算しない(デフォルト) =YES ;計算する。 (2)解析用データ出力(エネルギー変化) エネルギー最小化のステップ毎に、各エネルギーをファイルに出力します。 MIN エネルギートラジェクトリ NAMEAN=(MIN エネルギートラジェクトリのファイルの名前) UNITAN:MIN エネルギートラジェクトリのファイルの IO Unit =30 ;(デフォルト) 【注意】MIN エネルギートラジェクトリは、各ステップごとに出力されます。 (3)エネルギー計算に関する制御パラメーター(STEEP/CONJ 共通) myPresto 4.2 45 (3−1)相互作用 CUTOFF の方法 CUTMEThod:相互作用 CUTOFF の方法 =RESC ;residue base cutoff(デフォルト) 残基の重心間の距離が、CUTOFF 長以下なら残基に含まれる全原子間の相互作用を計算する。 =ATOM ;atom base cutoff 原子重心間の距離が、CUTOFF 長以下なら原子間の相互作用を計算する。 =RESA ;residue base cutoff 残基に含まれる2原子間の最短の距離が、CUTOFF 長以下なら残基に含まれる全原子間の相 互作用を計算する。 【注意】通常(周期境界条件でない場合)は RESA が推奨される。周期境界条件では RESC が推奨される。 CUTLENgth =8.0 :cutoff 長(A) ;(デフォルト) DIEFUNction:空間の比誘電率の形式 =CONS ;誘電率は定数 (デフォルト) =DIST ;誘電率εは距離に比例する。ε=DIEVAL * 距離(A) DIEVALue:空間の比誘電率 =1.0 ;(デフォルト) 【注意】"DIEFUN=CONS"の場合は、通常"DIEVAL=1.0"を用いる。真空中で"DIEFUN=DIST"を 指定の場合、DIEVAL は 1.0∼4.0 程度の値とする。 USESPL ;スプライン補間の適用 =NO ;適用しない(デフォルト) =YES ;適用する CUT-ON =6.0 ;スプライン補間開始距離 ;(デフォルト) 【注意】入力トポロジーが CHARMM ポテンシャルの場合、CHARMM によるスプライン補間を適 用する。 (3−2)相互作用計算のスイッチ 特定の相互作用を計算する(しない)場合に、以下のスイッチを用います。 myPresto 4.2 46 【注意】特に重要 ・1-5 相互作用のスイッチでは、相互作用テーブルを用いる(CUTOFF を用いる)場合と相 互作用テーブルを用いない場合で、van der Waals/静電相互作用/水素結合のエネルギー計 算のスイッチを切り替える必要があります。 ・拘束(CAP, position restraint など)を用いる場合、対応するエネルギー計算のスイッ チを入れる必要があります。 (3−2−1)1-2、1-3、1-4 相互作用のスイッチ 通常の MIN/MD 計算では、すべてデフォルト値を用います。極めてまれですが、特定の相互 作用を計算したくない場合にのみ用います。 CALBONd:1-2 相互作用の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALANGle:1-3 相互作用の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALTORsion:torsion 相互作用の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALIMProper:improper torsion の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALV14:1-4 van der Waals の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALE14:1-4 静電相互作用の計算 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない (3−2−2)1-5 相互作用計算のスイッチ CUTOFF を用いる計算(相互作用テーブルを用いる計算)をする場合と、CUTOFF を用いない で全ての 1-5 相互作用を全原子対に対し計算(直接計算)する場合で、スイッチの指定を 切り替えます。デフォルトでは、CUTOFF を用いる場合に設定されています。通常,1-5 van der Waals, 1 -5 静電相互作用、水素結合はすべて計算します(デフォルト)。極めてまれですが、 特定の相互作用を計算したくないときにスイッチを切り替えてください。水素結合(12-10 myPresto 4.2 47 ポテンシャル)を含まない力場を用いる場合は、スイッチ CALHYD の値に関わらず水素結合 は計算されません。PME 法および Ewald 法の使用時には、相互作用テーブルを使用してくだ さい。 相互作用テーブルを使用する(CUTOFF を用いる)場合 以下の CALV15, CLAE15, CALHYD を=CALC に設定、 CALV5N, CALE5N, CALH5N を=NOCALC に設 定する。(デフォルト) CALV15:1-5 van der Waals =CALC ;計算する(デフォルト) =NOCAlc ;計算しない CALE15:1-5 静電相互作用 =CALC ;計算する(デフォルト) ※PME/FMM のとき必須 =NOCAlc ;計算しない CALHYD:水素結合 =CALC ;計算する(デフォルト) =NOCAlc ;計算しない 相互作用テーブルを使用しない場合 以上の CALV15, CLAE15, CALHYD を=NOCALC に設定、 CALV5N, CALE5N, CALH5N を=CALC に設 定する。 【注意】この指定では、PME 法および Ewald 法、ソフトコアを用いた計算はできません。 CALV5N:1-5 van der Waals =NOCAlc ;1-5 van der Waals を直接計算しない(デフォルト) =CALC ;計算する CALE5N:1-5 静電相互作用 =NOCAlc ;1-5 静電相互作用を直接計算しない(デフォルト) =CALC ;計算する CALH5N:水素結合 =NOCAlc ;水素結合を直接計算しない(デフォルト) =CALC ;計算する (3−2−3)拘束ポテンシャル 拘束用ポテンシャルはデフォルトでは全て NOCALC(計算しない)にセットされています。 myPresto 4.2 48 CAP 拘束、position restraint, distance/angle/torsion restraint、van der Waals 反発 項のソフトコア(soft repulsion)などを用いる場合、それぞれのエネルギー計算項を CALC に設定してください。さらに,通常これらのポテンシャルは対象原子の指定(EXE>INPUT の 章を参照)と、力の定数などのパラメーターを必要とするため各々のパラメーターも入力 してください。 これらの拘束ポテンシャルはすべて、系全体のポテンシャルエネルギー項に加算されます。 CALPSR:position restraint =NOCAlc ;計算しない(デフォルト) =CALC ;計算する EXE>INPUT フェーズにて、以下を指定する。 POSITION=READ NAMEPO=(position restraint 指定ファイル) REFCOORD=PDB NAMERE=(参照座標ファイル) CALDSR:distance-restraint =NOCAlc ;計算しない(デフォルト) =CALC ;計算する EXE>INPUT フェーズにて、以下を指定する。 DISTANcerestrain =READ NAMEDIstance=(distance restraint 指定ファイル) CALDHR:dihedral-restraint =NOCAlc ;計算しない(デフォルト) =CALC ;計算する EXE>INPUT フェーズにて、以下を指定する。 DIHEDRalrestrain =READ NAMEDH=(dihedral restraint 指定ファイル) CALREP:simple repulsion =NOCAlc ;計算しない(デフォルト) =CALC ;計算する CALCAP:CAP 拘束 =NOCAlc ;計算しない(デフォルト) =CALC ;計算する EXE>INPUT フェーズにて、以下を指定する。 SETBOUndary =READ NAMEBOundary =(CAP boundary 指定ファイル) myPresto 4.2 49 EXTCAP:拡張 CAP 拘束 =NOCAlc ;計算しない(デフォルト) =CALC ;計算する EXE>INPUT フェーズにて、以下を指定する。 SETEXC =READ NAMEEC =(拡張 CAP 指定ファイル) 拘束ポテンシャルに必要なパラメーター 重み因子:Position, Distance, Repulsion, Dihedral 拘束では、その拘束ポテンシャル の堅さは、温度、重みなどによって決められます。これらパラメーターは系を拘束すれば 良い適当な堅さであれば十分なので、値に厳密にこだわる必要は通常はありません。 TEMPERature:拘束に用いる温度(K)(Position, Distance, Repulsion, Dihedral). =300.0 ;(デフォルト)(△) WETDSR:distance restraint の重み =1.0 ;(デフォルト) WETPSR:position restraint の重み =5.0 ;(デフォルト) WETDHR:dihedral restraint の重み =10.0 ;(デフォルト) Simple repulsion のパラメーター WETREP:simple repulsion の重み =1.0 ;(デフォルト) REPSCAle:van der Waals 半径のスケール因子 =1.0 ;(デフォルト) REPDELta:許容誤差 =1.0 ;(デフォルト) CAP 拘束のパラメーター CAP 拘束では、CAP 拘束対象原子の指定ファイル(EXE>INPUT の章参照)、"CALCAP=CALC"の 指定以外に、CAP の中心、半径、壁を形成する反発ポテンシャルの型と力の係数についての パラメーターが必要になります。デフォルト値はありますが、力の定数(FORCAP)以外の パラメーターはユーザが指定するのが普通です。 myPresto 4.2 50 RADCAP:CAP 拘束の半径(A)。 (この半径の内側では拘束力は 0、外側ではポテンシャルで拘束されます) =20.0 :(デフォルト) FORCAP:CAP の壁を作る反発ポテンシャルの力の定数 =150.0 :(デフォルト) FUNCAP:CAP の壁の反発ポテンシャルの形 =HARMonic :2次関数パラボラポテンシャル(デフォルト) F = 0.5 * FORCAP * ( R - RADCAP ) **2 ここで、R = ( チェインの重心 ) - ( CAP の中心 )。 =BIQUadratic :4次関数型ポテンシャル F = 0.25 * FORCAP * ( R**2 - RADCAP**2 ) **2 ここで、R = ( チェインの重心 ) - ( CAP の中心 )。 SETCEN:CAP の中心を系の第一チェインの重心にセットする。 =NO :セットしない。中心は CENTRX/CENTRY/CENTRZ で指定する(デフォルト) =YES :セットする。CAP の中心をデカルト座標(A)で設定する。 CENTRX= 0.0 :(デフォルト) CENTRY= 0.0 :(デフォルト) CENTRZ= 0.0 :(デフォルト) 【注意】これらのパラメーターは、CAP 指定ファイルとコントロールファイルに重複して指 定が行われる場合、コントロールファイルの指定が優先します。 【注意】CAP ポテンシャルは、分子・残基の重心に適用されます。従って分子・残基が大き い場合、重心が CAP 半径内にあっても、分子・残基に含まれる原子が CAP 半径の外に出て いる場合があります。 拡張 CAP 拘束のパラメーター 拡張 CAP 拘束では、対象原子、対象範囲および力の係数の指定を全て拡張 CAP 指定ファイ ルにより行 います 。制御ファイルからは拡張指定ファイル (EXE>INPUT の章参照)、 "EXTCAP=CALC"以外の指定は行いません。 (4)拘束条件の指定 (4−1)SHAKE/RATTLE の指定 SHAKE/RATTLE を使用する場合は、EXE>INPUT グループで対象原子の原子番号と拘束距離を 指定した SHAKE ファイルを指定します。さらに、EXE> MIN グループで、計算方法と収束条 件などを指定します。 myPresto 4.2 51 SHAKEMethod:SHAKE の方法の指定 =NOSHake ;SHAKE を行わない(デフォルト) =HBON ;他の拘束と重ならない、独立した拘束として計算する。 =ALLB ;互いに関連しあう拘束すべてを反復法を用いて計算する。 COVSHK:SHAKE の収束判定条件の閾値。 ( CBL - IBL ) / IBL がこの値以下であるとき SHAKE は収束したとする。 CBL:計算し修正した結合長、IBL:入力で指定した結合長 = 1.0D-6 ;(デフォルト)(△) LIMSHK:SHAKE の反復解法の反復回数の上限値 =1000 ;(デフォルト)(△) 【注意】他の拘束との重なりがある、互いに関連しあう拘束条件を SHAKE ファイルに指定 した場合は、"SHAKEMethod= ALLB"を使用しなければなりません。 【注意】3原子による三角形および4原子による四面体のトポロジーでの特別な拘束は、 "SHAKEMethod= [HBON │ ALLB]"の指定に関わらず、反復法で計算します。 【注意】極度に歪みの大きい系では、SHAKE が収束せずに計算を中断する場合があります。 【注意】SHAKE/RATTLE は、適用範囲に制限があります。 SHAKE/RATTLE の適用範囲 SHAKE RATTLE エネルギー最小化 最急降下法 (METHOD=STEEP) ○ × (EXE> MIN) 共役勾配法 (METHOD=CONJ) × × MD 計算 Leap Frog Verlet(INTEGR=LEAP) ○ × (EXE> MD) Velocity-Verlet (INTEGR=VELO) × ○ Multi Time Step (INTEGR=MTS) × × (5)PME, Ewald, FMM の指定 (5−1)Particle Mesh Ewald 法, Ewald 法の指定 周期境界条件においては、1-5 静電相互作用の計算に PME(Particle Mesh Ewald)法、ま たは、Ewald 法を用いることができます。使用できるのはどちらか一方だけです。 CALPME:PME 法を適用する。 =NOCALC:適用しない(デフォルト) =CALC :適用する PMESPD:PME 法での計算間隔の調整。 myPresto 4.2 52 =NORM :毎回計算する(デフォルト) =HIGH :座標情報の更新サイクル"UPDATE"と同期する PMEUPD:PMESPD= HIGH の場合の計算方法。 =CUT :カットオフ計算を使用する(デフォルト) 近距離相互作用のみを毎ステップ計算更新し、遠距離からの相互作用の計算は、座標情報 の更新サイクル"UPDATE"と同期する。 =RECI :逆空間項計算を使用する 実空間の相互作用のみを毎ステップ計算更新し、波数空間からの相互作用の計算は、座標 情報の更新サイクル"UPDATE"と同期する。 【注意】PMEUPD オプションの推奨値は PMEUPD= CUT です。この方法には便宜的ですが保存 量の保存性は高い計算方法です。 【注意】PMEUPD= RECI による計算は、PMEUPD= CUT による計算に比べて保存量の保存性が 低下します。 CALEWA:Ewald 法を適用する。 =NOCALC:適用しない(デフォルト) =CALC :適用する 【注意】PME および Ewald 法では、以下の指定が必要です。 CALE15= CALC ; 近接原子は相互作用テーブルを用いた CUTOFF 法で計算します。 BOUNDA= PERI ; PME, Ewald は周期境界条件でないと使用できません。 DIEFUN= CONS ; PME, Ewald ではクーロン力の空間誘電率は定数でないといけません。 PME, Ewald の制御パラメーター EWAPRM:PME, Ewald 法での Ewald パラメーター 実空間と逆空間の収束パラメータで、大きくすると実空間の収束が速くなり、小さく すると逆空間の収束が速くなる。0.0∼1.0 で指定する。 = 0.35 ;(デフォルト) REATOL:Ewald 法の実空間でのカットオフに対する許容誤差(ε) (erfc(βRcut) / Rcut < ε) = 1.0d-19 ;(デフォルト) PME でのメッシュ数の指定 myPresto 4.2 53 MESHLX= 16 :X 軸方向(デフォルト) MESHLY= 16 :Y 軸方向(デフォルト) MESHLZ= 16 :Z 軸方向(デフォルト) PMEORD:電荷分布をメッシュ点で代表するときのスプライン関数フィットの次数 =5 : EWAPRM = 0.35 のときの推奨値(デフォルト) 【注意】メッシュ数は、1Å程度でメッシュが切れるように指定するのが良い。 (5−2)Fast Multiple Method の指定 USEFMM:Fast Multipole 法の適用の有無 クーロン力をカットオフしない方法として Fast Multipole 法(FMM)を適用するか、し ないかを指定する。周期境界条件でない場合に適用できる。 =NO ;FMM を適用しない(デフォルト) =YES ;FMM を適用する。 FMMSPD:FMM 法での 1-5 静電相互作用の計算間隔の調整。 =NORM :毎回計算する(デフォルト) =HIGH :座標情報の更新サイクル"UPDATE"と同期する FMTREE:Fast Multipole 法の Tree の深さ Fast Multipole 法の Tree の深さ。最小セルの個数は 8**FMTREE 個であり、最小セルに 原子が数個∼数十個含まれるように設定する。オーバーフローで停止する場合は、FMTREE の値を大きくする。 = 3 ;(デフォルト) FMPOLE:Fast Multipole 法の多極子展開の次数 Fast Multipole 法の多極子展開の次数。FMPOLE が大きいと精度が上がるが速度は遅く なる。しかし、速度に及ぼす影響は少ない。 = 8 ;(デフォルト) FMNUMA:Fast Multipole 法の最小セルに含まれる最大原子数 = 1000 ;(デフォルト) 【注意】Fast Multipole 法の最小セル内に含まれる原子数が FMNUMA オプションで指定した 値を超えた場合はエラーとし、cosgene の実行を停止します。この場合は、FMTREE オプシ ョンの値を増やすか、FMNUMA オプションの値を増やしてください。必ず DIEFUN=CONS を指 定してください。 (6)溶媒効果 myPresto 4.2 54 (6−1)Accessible Surface Area 法の指定 CALASA:ASA 法及び GB/SA 法での SA 法の適用 implicit water モデルで Accessible surface area 法を溶媒和の計算に適用する。 = NOCALC = CALC ;適用しない(デフォルト) ;適用する ASAPRO:プローブ半径 (Å) ASA 法において溶媒水をプローブとする半径の設定。 通常水分子の半径として 1.4∼1.6 Å程度にとる。 = 1.4 ;(デフォルト) ASAWEI:ASA 重み ASA 法において ASA 項のエネルギー項への寄与のスケール因子。 = 1.0 ;(デフォルト) ASACUT:ASA 用 cut off 長 (Å) ASA 法において、ASA の重なりを判定するための原子間距離。 (原子半径+プローブ半径)×2より長くとるが、長くしすぎると計算速度が低 下する。 = 4.5 ;(デフォルト) 【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。 (6−2)Generalized Born / Surface Area 法の指定 Generalized Born 法と Accessible surface area 法の両方の計算を同時に指定する(GB 法の計算"CAL-GB= CALC"と、ASA 法の計算"CALASA= CALC"の両方を指定する)ことによって、 GB/SA 法の計算を行います。 CAL-GB:Generalized Born 法の適用 implicit water モデルで Generalized Born 法を静電場の計算に適用する。 = NOCALC = CALC ;適用しない(デフォルト) ;適用する CALASA:GB/SA 法での SA 法の適用 implicit water モデルで Surface area 法を溶媒和の計算に適用する。 = NOCALC = CALC ;適用しない(デフォルト) ;適用する GBWELE:水の誘電率 myPresto 4.2 55 GB 法において溶媒水領域の比誘電率の設定。 温度によって変化するが 298K付近の誘電率をデフォルトに採用している。 = 78.3 ;(デフォルト) GBMELE:蛋白質の誘電率 GB 法において蛋白質領域の比誘電率の設定。 温度、蛋白質の種類によって変化するが通常 1∼4 程度にとる。 = 1.0 ;(デフォルト) GBDELT:Born 半径の補正値 (Å) GB 法において Born 半径の補正値(Onufriev の論文で導入された"δ"に相当)。 計算に使用する Born 半径 = Born 半径 - GBDELT。 = 0.0 ;(デフォルト) GBOFFS:van der Waals 半径補正値 (Å) GB 法において van der Waals 半径補正値。 計算に使用する van der Waals 半径 = van der Waals 半径 - GBOFFS。 = 0.09 ;(デフォルト) 【注意】「Born 半径の補正値 "GBDELT"」は、Onufriev の論文で導入された"δ"に相当しま す。Still,Hawkins の論文由来では"GBDELT=0.00"、Onufriev の論文由来では"GBDELT=0.15" になります(論文については、巻末「参考文献)を参照)。 【注意】「van der Waals 半径補正値 "GBOFFS"」のデフォルト値は、Still WC の論文由来 です(論文については、巻末「参考文献)を参照)。 【注意】ASA 法と GB/SA 法の計算で用いている Atomic Solvation Parameter は、自動的に 切り替わります。 【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。 myPresto 4.2 56 (7)境界条件 myPresto で使用できる境界条件は、球・楕円体、周期境界条件(直方体6面体セル)です。 球・楕円体では、弾性衝突を実現する剛体壁が用いられます。中心の指定など一部変数は 共通の名前が使用されます。周期境界条件使用時は、ユニットセルへの座標引き戻しのサ イクル(UPDATE)を忘れずに指定してください。CAP 拘束と異なり対象原子指定ファイルは 不要です。 BOUNDAry:境界条件の種類 =NO ;境界なし(デフォルト) =PERI ;周期境界条件。 =ELLIPSoid ;楕円体境界 =SPHERE ;球境界 【注意】周期境界条件において、NO CUTOFF (CAL15N=CALC)は指定しないこと。また、CUTMET の推奨値は RESC です。PME 法または Ewald 法は周期系で使用できますが、CUTOFF の指定が 必要です。 【注意】周期境界条件では、以下の場合に計算を中断することがあります。 ・必要な相互作用計算のスイッチが OFF である。 ・不自然に大きな力が発生した。 (初期座標の歪み、UPDATE の間隔が長い、time step が大きい、などが原因) ・残基の大きさと CUTOFF 距離の和が、セルサイズの半分より大きい。 (7−1)境界条件の中心の設定 周期系では、直方体ユニットセルの重心、球・楕円体ではそれらの重心を境界条件の中心 とします。 SETCEN:系の第一チェインの重心を境界条件の中心にする =NO :適用しない(デフォルト)。CENTRX/CENTRY/CENTRZ で指定する。 =YES :適用する SETCEN=NO の場合、境界条件の中心をデカルト座標(A)で指定する。 CENTRX= 0.0 ;(デフォルト) CENTRY= 0.0 ;(デフォルト) CENTRZ= 0.0 ;(デフォルト) myPresto 4.2 57 (7−2)境界条件のサイズの設定 周期境界条件の場合: ユニットセルの X 軸・Y 軸・Z 軸の長さ(A)を指定します。 LXCELL= 40.0 ;(デフォルト) LYCELL= 40.0 ;(デフォルト) LZCELL= 40.0 ;(デフォルト) 楕円体の場合: 楕円は、長軸・短軸が、XYZ 座標方向に揃っているものとし、X 軸 Y 軸 Z 軸方向の半径(A) を指定します。 ELLIPA= 30.0 ;(デフォルト) ELLIPB= 30.0 ;(デフォルト) ELLIPC= 30.0 ;(デフォルト) 球の場合: 球の半径を指定します。 RADIUS= 30.0 ;(デフォルト) 【注意】初期座標の原子のうち、1原子でも原子核の座標が境界の外にでればエラーとな ります。分子・残基の重心ではないので注意。計算開始後、原子が境界の外に出る場合の み、座標を修正し、境界の内部へ引き戻す処理をします。 (7−3)ユニットセルへの座標引き戻し方法の指定 周期系でのユニットセルへの座標引き戻しを、原子単位、残基単位、チェイン単位のい ずれの方法で行うかを指定します。 REPLAC:座標引き戻し方法 =ATOM :原子単位(デフォルト) =RESI :残基単位 =CHAI :チェイン単位 【注意】REPLAC オプションは、BOUNDA= PERI または HEXA のときのみ有効です。 【注意】残基ベースカットオフ(CUTMET= RESA または RESC)を使用し、REPLAC= ATOM と指 定した場合は、残基単位での座標引き戻しを行います。 myPresto 4.2 58 (8)LIST 「LIST」を書き加えれば、現在のパラメーター設定が表示されます。引数なし。 (9)QUIT EXE>グループ入力の終了を示します。引数なし。 myPresto 4.2 59 4.2.1.3 EXE> MD グループ MIN/MD 入力事項表 MIN MD 1 エネルギー最小化制御パラメーター(STEEP/CONJ 共通) ○ 1−1 最急降下法(STEEP)での制御パラメーター ○ 1−2 共役勾配法(CONJ)での制御パラメーター ○ 1−3 計算結果の出力指定(STEEP/CONJ 共通) ○ 1 MD 制御パラメーター ○ 1−1 計算上限の設定 ○ 1−2 MD のタイムステップとループ回数の指定 ○ 1−3 MD 計算の種類 ○ 1−4 拡張アンサンブル ○ 1−5 温度設定 ○ 1−6 MD 計算条件 ○ 1−7 ジョブのリスタート設定 ○ 1−8 計算結果の出力指定 ○ 2 解析用データ出力(エネルギー変化) 2 解析用データ出力(トラジェクトリー、パラメーター) 3 エネルギー計算に関する制御パラメーター ○ ○ 3−1 相互作用 CUTOFF の方法 ○ ○ 3−2 相互作用計算のスイッチ ○ ○ 3−3 Filling Potential 法 4 拘束の指定 ○ ○ 4−1 SHAKE/RATTLE の指定 ○ ○ 4−2 剛体モデルの指定 5 PME, Ewald, FMM の指定 ○ ○ 6 溶媒効果 ○ ○ 7 境界条件 ○ ○ 8 LIST ○ ○ 9 QUIT ○ ○ ○ ○ ○ ○ myPresto 4.2 60 (1)MD の制御パラメーター (1−1)計算上限の設定 SETTIMelimit:シミュレーション時間の設定(ps)。 後述の「ループ回数(LOOPLI)×タイムステップ(TIMEST)」で得られる時間(ps)の値が 大きい場合、この時間で計算を打ち切る。(◎) =5.0 ;(デフォルト) CPUTIMelimit:CPU 時間での上限(秒)(◎) =60.0 ;(デフォルト) (1−2)MD のタイムステップとループ回数の指定 LOOPLImit:MD シミュレーションのループ回数(◎) =0 ;(デフォルト) TIMESTep:タイムステップ(fs)。 通常は 0.5-1.0fs、系の全ての H に対し SHAKEまたは剛体モデルを使用する時には 1.0-2.0fs に設定する。(◎) =1.0 ;(デフォルト) (1−3)MD 計算の種類 (1−3−1)計算法:積分器 時間積分の方法を指定します。Multi time step(RESPA 法)を使用する場合は、さらに、 タイムステップの変化の方法を指定します。 INTEGR:時間積分の仕方 =LEAPfrog ;Leap-frog Verlet method(デフォルト) =VELOcity ;Velocity-Verlet method =MTS ;Multi Time Step (RESPA) =PRCO ;Predictor-Corrector =RK4O ;4 次 Runge-Kutta 法 =GEAR ;GEAR 法 =EXVP ;EXtended phase space Volume Preserving integrator 【注意】本バージョンでは、Predictor-Corrector, 4 次 Runge-Kutta 法, GEAR 法, EXtended phase space Volume Preserving integrator は実行ファイルのみの提供とし、ソースプロ グラムは提供しません。このため、ソースプログラムをコンパイルして得られた実行ファ イルでは、それらの機能は使用できません。 myPresto 4.2 61 Multi time step を使用する場合は、力 f を周期の長い運動による力 fa、中間の力 fb、 周期の短い運動による力 fc の3種類に分け、それぞれに対応するタイムステップ⊿ta, ⊿tb, ⊿tc を制御します。これらのタイムステップは、計算頻度 K, L を使い、 ⊿tb = K⊿tc, ⊿ta = L⊿tb = LK⊿tc (K, L は自然数) という関係で指定します。 FREQMEdium:計算頻度(間隔−中)の指定 =1 (上式の K に相当:⊿tb = K⊿tc) ;(デフォルト) FREQLOng =1 :計算頻度(間隔−長)の指定 (上式の L に相当:⊿ta = LK⊿tc) ;(デフォルト) さらに、各相互作用計算がどのタイムステップに支配されて計算するかを指定します。 次の計算に同じように指定します。 CALBON:1-2 相互作用の計算 =NOCAlc ;計算しない =CALC ;計算する。タイムステップ⊿tc に支配される(デフォルト) =MEDIum ;計算する。タイムステップ⊿tb に支配される =LONG ;計算する。タイムステップ⊿ta に支配される CALANG:1-3 相互作用の計算 CALTOR:torsion 相互作用の計算 CALIMP:improper torsion の計算 CALV14:1-4 van der Waals の計算 CALE14:1-4 静電相互作用の計算 CALV15(または CALV5N):1-5 van der Waals CALE15(または CALE5N):1-5 静電相互作用 CALHYD(または CALH5N):水素結合 CALPSR:position restraint CALDSR:distance-restraint CALDHR:dihedral-restraint CALREP:simple repulsion CALCAP:CAP 拘束 EXTCAP:拡張 CAP 拘束 CALUMB:UMBRELLA ポテンシャル計算 CALFLW:FLOW ポテンシャル計算 CAL-GB:GB 計算 myPresto 4.2 62 CALASA:ASA 計算 【注意】Multi time step 指定("INTEGR=MTS")以外で、相互作用計算のスイッチに"MEDI" または"LONG"指定した場合はエラーとし、プログラムの実行を停止する。 【注意】周期の長い運動 fa のタイムステップ⊿ta( "TIMEST"×"FREQME"×"FREQLO" )が 4.0fs を超えないように指定することが望ましい。 【注意】RATTLE を NVT アンサンブルの MD 計算に適用する場合、Nose-Hoover 法による温度 制御("THERMO= NOSE")を指定する必要があります。 【注意】SHAKE/RATTLE は、適用範囲に制限があります。 SHAKE/RATTLE の適用範囲 SHAKE RATTLE エネルギー最小化 最急降下法 (METHOD=STEEP) ○ × (EXE> MIN) 共役勾配法 (METHOD=CONJ) × × MD 計算 Leap Frog Verlet(INTEGR=LEAP) ○ × (EXE> MD) Velocity-Verlet (INTEGR=VELO) × ○ Multi Time Step (INTEGR=MTS) × × (1−3−2)計算方法:アンサンブルの発生方法 METHOD:アンサンブルの種類を指定する。 =MICRocanonical ;Micro-canonical(NVE) (デフォルト) =CANOnical =NPT ;Canonical(NVT) ;NPT =EXPAnded ;拡張アンサンブル =TSAL ;Tsallis Dynamics 【注意】NPT アンサンブル"METHOD=NPT" は周期境界条件下でのみ指定可能です。 【注意】Tsalli Dynamics "METHOD=TSAL" は、4 次 Runge-Kutta 法使用時のみ有効です。 (1−3−3)計算法:温度・圧力制御方法 THERMOstat:温度制御方法。 "METHOD=CANO" の場合に適用される。適用範囲に注意してください。 =CONStant ;Hoover-Evans Gaussian constraint 法 myPresto 4.2 (デフォルト) 63 =NOSE ;Nose-Hoover 法 COUPLIngtime:Nose-Hoover 法でのカップリング時間(τ:単位 fs)。 "THERMO=NOSE" の場合に適用される。 =100.0 ;(デフォルト) BAROSTat:圧力制御方法。 "METHOD=NPT" の場合に適用される。適用範囲に注意してください。 =ANDErsen ;Andersen 法 (デフォルト) =PARA ;Parrinello Rahmann 法 =BERE ;Berendsen 法 SETPRE: NPT での目標の圧力(単位 atm)。 = 1.0 COUPHB: ;(デフォルト) NPT での温度制御のカップリング時間(単位 fs)。 = 1000.0 COUPPI: ;(デフォルト) NPT での圧力制御のカップリング時間(単位 fs)。 = 1000.0 ;(デフォルト) MODIFIcation: NPT でのセル形状。(ANDERSEN では無効) = FLEX ;自由度6、斜方セル(デフォルト) = MONOclinic ;自由度4。3方向にそれぞれ伸縮および、基本セルの 角γ(a軸とb軸のなす角度)が変化 = ORTHorhombic ;自由度3。3方向にそれぞれ伸縮 = ISOTropic ;自由度1。等方的な変形 = SINGle_direction ;自由度1。z軸方向のみ変形 圧力制御方法と指定可能なセル形状の対応表 Parrinello Rahmann 法 Berendsen 法 FLEX ○ MONO ○ ORTH ○ ○ ISOT ○ ○ SING ○ myPresto 4.2 64 (1−4)拡張アンサンブル法 EXPAND:拡張アンサンブル法の手法の指定 = FORC : Force-Biased McMD = SIMU : Simulated Tempering = GST : Generalized Simulated Tempering = EFFE : Effective Temperature (1−4−1)Force-biased Multicanonical MD 法 RESETC:ヒストグラム作成のステップサイクル F.B.McMD はヒストグラムを用いた反復解法であり、エネルギーのヒストグラムを "RESETC"のステップごとに作成しなおす。短すぎると系が空間を十分に探索しないためヒ ストグラムに偏りが生じ、長すぎると計算に時間がかかる。系が大きくなるにつれ、 "RESETC"は長く取るのが良い。真空中では数残基のペプチド程度に対し 200000∼400000 ス テップ程度。 = 300000 ;(デフォルト) DUMMYL:F.B.McMD を始める前に捨てるダミーループのステップ数。 平衡状態から F.B.McMD を始める場合は、"1"に設定する。 = 1 ;(デフォルト) TEMMAX:F.B.McMD が探索する温度範囲の上限値(K)。 = 700 ;(デフォルト) TEMMIN:F.B.McMD が探索する温度範囲の下限値(K)。 = 250 ;(デフォルト) ENEMAX:F.B.McMD が作成するヒストグラムの上限値(kcal/mol)。 "TEMMAX"でのエネルギー分布を被覆する必要があるため"TEMMAX"での平均エネルギーより 十分高めにとる必要がある。あらかじめ、温度"TEMMAX"でのカノニカルの計算を行い平均 エネルギーを求め、それより高い値に設定するようにする。 = 10000 ;(デフォルト) ENEMIN:F.B.McMD が作成するヒストグラムの下限値(kcal/mol)。 "TEMMIN"でのエネルギー分布を被覆する必要があるため "TEMMIN"での平均エネルギーよ り十分低めにとる必要がある。あらかじめ、温度"TEMMIN"でのカノニカルの計算を行い平 均エネルギーを求め、それより低い値に設定するようにする。 = -10000 ;(デフォルト) BINSIZ:F.B.McMD でヒストグラムを作成するときの bin サイズ(kcal/mol)。 細かくとるとヒストグラムが滑らかでなくなりヒストグラムの微分が計算できず、粗くと myPresto 4.2 65 るとヒストグラムの形を表現できない。"ENEMAX"-"ENEMIN"を 100∼200 程度で割った値に 設定するのが良い。 = 5.0 ;(デフォルト) LIMITS:ヒストグラムで使用する範囲を決める閾値 F.B.McMD でエネルギーをサンプリングする範囲のヒストグラムの下限値であって LIMITS= LIMITC にとるのが良い。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) LIMITC:ヒストグラムをアップデートする閾値 反復解法において、"LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラム のアップデートを行う。ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に 計算できないものとみなす。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) FBRSTO:分布データリスタートファイル出力形式 F.B.McMD の分布データ(スケール因子、ヒストグラム)をファイル出力する際の 形式をアスキー形式、バイナリ形式のいずれかで指定する。 = NOWR ;出力しない(デフォルト) = ASCI ;アスキー形式 = DOUB ;倍精度バイナリ形式 NAMEFO=(分布データ出力ファイル名、133 文字以内) FBRSTI:分布データリスタートファイル入力形式 F.B.McMD の分布データ(スケール因子、ヒストグラム)をリスタート入力する際 の形式をアスキー形式、バイナリ形式のいずれかで指定する。 NAMEFI=(分布データ入力ファイル名、133 文字以内) UNITFR:分布データリスタートファイルの IO unit = 85 ;(デフォルト) (アスキー形式でのファイル例) myPresto 4.2 66 # PREVIUS POTENTIAL, LOCAL LOOP, TOTAL LOOP, CURRENT STEP 19.6646786598415 1 # LOCAL HISTGRAM 1 1 351 2.00000000000000 0.000000000000000E+000 : 2.00000000000000 0.000000000000000E+000 # TOTAL HISTGRAM 351 2.00000000000000 1.00000000000000 5.00000000000000 : 4.00000000000000 # PREVIOUS SCALING FACTOR 0.750000000000000 0.750000000000000 1.16322986359255 0.991723974379762 : 0.750000000000000 # BIN-LOWER, BIN-UPPER, PREVIOUS-LOWER, PREVIOUS-UPPER 117 155 112 158 【注意】F.B.McMD の参照温度として、"SETTEM"を設定する。運動エネルギーはこの温度に 固定される。一般に"TEMMIN"より高く、"TEMMAX"より低く設定する。 (1−4−2)Simulated Tempering Multicanonical MD 法 RESETC:ヒストグラム作成のステップサイクル S.T.McMD は温度遷移の判定に使用する関数を"RESETC"のステップごとに作成しなおす。 短すぎると系が温度空間を十分に探索しないためヒストグラムに偏りが生じ、長すぎると 計算に時間がかかる。系が大きくなるにつれ、"RESETC"は長く取るのが良い。真空中では 数残基のペプチド程度に対し 200000∼400000 ステップ程度。 = 300000 ;(デフォルト) DUMMYL:S.T.McMD を始める前に捨てるダミーループのステップ数。 myPresto 4.2 67 平衡状態から S.T.McMD を始める場合は、"1"に設定する。 = 1 ;(デフォルト) TEMMAX:S.T.McMD が探索する温度範囲の上限値(K)。 = 700 ;(デフォルト) TEMMIN:S.T.McMD が探索する温度範囲の下限値(K)。 = 250 ;(デフォルト) ENEMAX:S.T.McMD が作成するエネルギーヒストグラムの上限値(kcal/mol)。 "TEMMAX"でのエネルギー分布を被覆する必要があるため"TEMMAX"での平均エネルギーより 十分高めにとる必要がある。あらかじめ、温度"TEMMAX"でのカノニカルの計算を行い平均 エネルギーを求め、それより高い値に設定するようにする。 = 10000 ;(デフォルト) ENEMIN:S.T.McMD が作成するエネルギーヒストグラムの下限値(kcal/mol)。 "TEMMIN"でのエネルギー分布を被覆する必要があるため "TEMMIN"での平均エネルギーよ り十分低めにとる必要がある。あらかじめ、温度"TEMMIN"でのカノニカルの計算を行い平 均エネルギーを求め、それより低い値に設定するようにする。 = -10000 ;(デフォルト) BINSIZ:S.T.McMDでエネルギーヒストグラムを作成するときのエネルギーbin サイズ(kcal/mol) 。 = 5.0 ;(デフォルト) LIMITS:温度ヒストグラムの使用する範囲を決める閾値 S.T.McMD がサンプリングした温度範囲を決定する際の下限値であって LIMITS= LIMITC にとるのが良い。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) LIMITC:温度ヒストグラムをアップデートする閾値 "LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラムの項γを利用する。 ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に計算できないものとみな す。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) STTNUM:温度分割数 TEMMIN からTEMMAX までの温度範囲をSTTNUM 個に分割してS.T.McMD を実行する。STTNUM が大きい ほど自然な温度遷移が実現するが収束のために必要なサンプリング時間も増大する。 = 100 ;(デフォルト) STEBAS:ベースエネルギー 系のとりうるエネルギーの最低値を設定する。温度"TEMMIN"でのカノニカルの計算に よりあらかじめ見積もっておく。 = 0.0 ;(デフォルト) myPresto 4.2 68 【注意】S.T.McMD の参照温度として、"SETTEM"を設定する。運動エネルギーはこの温度に 固定される。一般に"TEMMIN"より高く、"TEMMAX"より低く設定する。 (1−4−3)Generalized Simulated Tempering 法 一般的なエネルギー分布P(E)は、様々な温度βi (=1/kB Ti )での Canonical 分布を重み Fi で重ね合わせたもので表現できる。Simulated Tempering 法では、βで決まるサブアン サンブルQが重みF(β)で重ね合わされたアンサンブルΞを考えてきた 。Generalized Simulated Tempering では、パラメータλを導入し、λで決まる一般のサブアンサンブルの 重ね合わせで表す。 GSTMIN:パラメータλの下限 = 0.001d0 ;(デフォルト) GSTMAX:パラメータλの上限 = 0.006d0 ;(デフォルト) GSTNUM:パラメータλの個数 = 20 ;(デフォルト) GSTUPD:パラメータラムダの更新間隔 = 100 ;(デフォルト) GSTCON:パラメータλの収束 MD 回数 = 10000000 ;(デフォルト) GSTSAM:パラメータλのスケーリング前のサンプリング回数 = 50000 ;(デフォルト) GSTBAS:ベースエネルギー 系のとりうるエネルギーの最低値を設定する。 = 25.5 ;(デフォルト) GSTETA: = 0.5 ;(デフォルト) (1−4−4)Effective Temperature 法 RESETC:ヒストグラム作成のステップサイクル 短すぎると系が温度空間を十分に探索しないためヒストグラムに偏りが生じ、長すぎ ると計算に時間がかかる。系が大きくなるにつれ、"RESETC"は長く取るのが良い。真空中 では数残基のペプチド程度に対し 200000∼400000 ステップ程度。 = 300000 ;(デフォルト) ENEMAX:Effective Temperature 法が作成するエネルギーヒストグラムの上限値(kcal/mol)。 myPresto 4.2 69 = 10000 ;(デフォルト) ENEMIN Effective Temperature 法が作成するエネルギーヒストグラムの下限値(kcal/mol)。 = -10000 ;(デフォルト) BINSIZ:Effective Temperature 法でエネルギーヒストグラムを作成するときのエネルギーbin サ イズ(kcal/mol) 。 = 5.0 ;(デフォルト) LIMITS:温度ヒストグラムの使用する範囲を決める閾値 Effective Temperature 法がサンプリングした温度範囲を決定する際の下限値であって LIMITS= LIMITC にとるのが良い。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) LIMITC:温度ヒストグラムをアップデートする閾値 "LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラムの項γを利用する。 ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に計算できないものとみな す。通常、0.0005∼0.001 の範囲にとる。 = 0.001 ;(デフォルト) (1−4−5)拡張アンサンブルデータファイル出力 拡張アンサンブル(Effective Temp, Force Bias, Simulated Tempering, Generalized Simulated Tempering)使用時の確率、スケール因子、エネルギーデータを出力するファイ ル名を指定する。 NAMEEP:確率データファイル名(133 文字以内) = expand.prob ;(デフォルト) UNITEP:確率データファイルの IO unit = 78 ;(デフォルト) NAMEES:スケール因子データファイル名(133 文字以内) = expand.scale ;(デフォルト) UNITES:スケール因子データファイルの IO unit = 77 ;(デフォルト) NAMEEE:エネルギーデータファイル名(133 文字以内) = expand.energy ;(デフォルト) UNITEE:エネルギーデータファイルの IO unit = 79 ;(デフォルト) (1−5)Tsallis Dynamics myPresto 4.2 70 【注意】本バージョンでは、Tsallis Dynamics は実行ファイルのみの提供とし、ソースプ ログラムは提供しません。このため、ソースプログラムをコンパイルして得られた実行フ ァイルでは、Tsallis Dynamics は使用できません。 (1−5−1)分布密度関数パラメータ設定 ポテンシャルエネルギーの範囲に応じて、Tsallis Dynamics の分布密度関数を変更する ことが可能である。 ELOWER:低エネルギー側閾値 = 0.0 ;(デフォルト) EUPPER:高エネルギー側閾値 = 0.0 ;(デフォルト) ROF1DR:ρ1のパラメタdの条件 = 0.5 ;(デフォルト) ROF2XI:ρ2のパラメタξの値 = 10 ;(デフォルト) ROF2VX:ρ2のパラメタδの条件 = 1000 ;(デフォルト) ROF2VY:ロー2のパラメタγの条件 = 0.5 ;(デフォルト) (1−5−2)ファイル出力オプション MNTRZT:zeta 値モニタファイルの出力形式 =NO ;出力しない(デフォルト) =ASCI ;アスキーファイル =SING ;単精度バイナリーファイル =DOUB ;倍精度バイナリーファイル UNITZT:zeta 値モニタファイルの IO unit = 80 ;(デフォルト) NAMEZT=(zeta 値モニタファイル名、133 文字以内。) OUTZET:zeta 値モニタファイル出力間隔 = 1 ;(デフォルト) MNTRCK:Tsallis 積分チェック値モニタファイルの出力形式 =NO ;出力しない(デフォルト) =ASCI ;アスキーファイル =SING ;単精度バイナリーファイル myPresto 4.2 71 =DOUB ;倍精度バイナリーファイル UNITCK:Tsallis 積分チェック値モニタファイルの IO unit = 75 ;(デフォルト) NAMECK=(Tsallis 積分チェック値モニタファイル名、133 文字以内。) OUTCHK:Tsallis 積分チェック値モニタファイル出力間隔 = 1 ;(デフォルト) MNTRPK:エネルギーモニタファイルの出力形式 =NO ;出力しない(デフォルト) =ASCI ;アスキーファイル =SING ;単精度バイナリーファイル =DOUB ;倍精度バイナリーファイル UNITPK:エネルギーモニタファイルの IO unit = 81 ;(デフォルト) NAMEPK=(エネルギーモニタファイル名、133 文字以内。) OUTZPK:エネルギーモニタファイル出力間隔 = 0 ;(デフォルト) FLGPKT=(エネルギーモニタファイル出力項目。potential, kinetic, total を 3 文字 で表す。"+" が出力対象となり、"-" は対象外となる。) MNTRQU:物理量モニタファイルの出力形式 =NO ;出力しない(デフォルト) =ASCI ;アスキーファイル =SING ;単精度バイナリーファイル =DOUB ;倍精度バイナリーファイル UNITQU:物理量モニタファイルの IO unit = 82 ;(デフォルト) NAMEQU=(物理量モニタファイル名、133 文字以内。) OUTQUA:物理量モニタファイル出力間隔 = 1 ;(デフォルト) MNTRDO:Tsallis 分布密度関数モニタファイルの出力形式 =NO ;出力しない(デフォルト) =ASCI ;アスキーファイル =SING ;単精度バイナリーファイル =DOUB ;倍精度バイナリーファイル myPresto 4.2 72 UNITDO:Tsallis 分布密度関数モニタファイルの IO unit = 82 ;(デフォルト) NAMEDO=(Tsallis 分布密度関数モニタファイル名、133 文字以内。) OUTDOF:Tsallis 分布密度関数モニタファイル出力間隔 = 1 ;(デフォルト) (1−6)温度設定 (1−6−1)目標温度設定 SETTEMperature:系の目標温度(K)。 温度一定のアンサンブル Canonical(NVT), NPT での目標温度。F.B.McMD では参照温度とな る。Micro-canonical(NVE)では使用しない。 =300.0 ;(デフォルト) TEMPCOntrol2:系の温度制御の仕方。 系全体の温度(運動エネルギー)をコントロールする場合(TEMPCO=NO)と、分子毎に温度を コントロールする場合(TEMPCO=YES)の2種類がある。TEMPCO=NO の場合、水中の蛋白では蛋 白と水の温度が異なる場合がある。TEMCO=YES の場合、蛋白と水、リガンド分子などそれぞ れの分子の温度が同じになりやすい。ただし、単原子イオンの温度も一定に保たれるなど 不自然な場合もある。 =NO ;(デフォルト) =YES (1−6−2)初期温度設定 INITIAlvelocity:初期速度の設定の仕方。 =ZERO ;初期速度=0、初期温度=0(デフォルト) =SET ;以下の RANDOM により定義される乱数を用い、各原子の初期速度が 平均値が "STARTT" であるようなガウス関数型の分布となるように 設定する。 =RESEt ;リスタートジョブの初期条件変更((1−7)を参照) STARTTempearture:初期温度の平均値(K) =300.0 ;(デフォルト) RANDOMseed:速度分布を得るための random seed number(整数値 < 2**31 - 1) =584287 ;(デフォルト) HEATLOop:Hoover-Evans Gaussian constraint 法での昇温のための MD ループ回数。 myPresto 4.2 73 =0 ;(デフォルト) (1−7)MD 計算条件 UPDATEinterval:座標情報の更新サイクル。(△) 1-5 相互作用エネルギーに CUTOFF が用いられている場合、相互作用テーブルの更新サイク ルを指定する。周期境界条件の場合は、ユニットセルから飛び出した原子の座標をユニッ トセル内に補正する計算の更新サイクルを指定する =20 ;(デフォルト) STOPCEnterofmass:MD 計算中の重心の固定方法。 CAP 拘束または周期境界条件を適用するときは、並進運動または回転運動をゼロにする重心 の固定を行うようにする。 =NO ;重心を固定しない(デフォルト) =TRAN ;系の第一チェインの並進の運動量をゼロにする =ROTA ;系の第一チェインの回転の運動量をゼロにする =BOTH ;系の第一チェインの並進と回転の運動量をゼロにする BESTFIt:MD での、参照構造に対する系の第1チェインの RMSD の変化を標準出力する。参 照構造は、EXE> INPUT フェーズにて "REFCOORD", "NAMERE" を指定する必要がある。(△) =NO ;計算しない(デフォルト) =YES ;計算する。 (1−8)ジョブのリスタート設定 MD 計算を任意のステップで打ち切り、再度リスタートをかけて計算を継続する場合は、ジ ョブ終了時に出力されたリスタートファイルを使用します。リスタートするジョブには、 リスタートファイルを読み込んで計算を再開するための指定が必要です。 なお、リスタートするジョブの初期速度および初期座標を変更することが可能です。 (1−8−1)リスタートファイルのファイル名を指定:リスタート前の MD 計算 NAMERO:リスタートファイルのファイル名。書式はバイナリ-形式です。 UNITRO:リスタートファイルの IO Unit =41 ;(デフォルト) 【注意】リスタートファイルは、MD 計算の終了時に必ず出力されます。ファイル名を指定 しなかった場合は、システムデフォルトのファイル名になります。 myPresto 4.2 74 (1−8−2)リスタート用ファイルを読み込む指定:リスタートするときに行う RESTARt:リスタートする。 =NO ;リスタートしない。初期速度設定(*上述)が適用される(デフォルト) =YES ;リスタートする NAMERI=既に準備したリスタートファイルの名前。 UNITRI:リスタートファイルの IO Unit =40 ;(デフォルト) (1−8−3)チェックポイントの設定:自動リスタートファイルの出力間隔を指定する OUTReSTartfile:自動リスタートファイル出力 CPU 時間間隔 =0 ; 自動リスタートファイルを出力しない(デフォルト) OUTReStartfileLoop:自動リスタートファイル出力ループ間隔 =0 【注意】 ; 自動リスタートファイルを出力しない(デフォルト) 自動リスタートファイルの出力は、OUTRST 指定時は自動リスタートファイル 出力 CPU 時間間隔ごとに、OUTRSL 指定時は自動リスタートファイル出力ループ間隔 ごとに随時行われる。 【注意】ファイル名は“name.num”(name は NAMERI オプションで指定したリスタート ファイル名、num はシーケンス番号)となり、リスタートファイルの上書きは行わない。 (1−8−4)初期条件の変更:リスタート時の初期速度および初期座標を変更する リスタートジョブの初期速度および初期座標を設定します。 INITIAlvelocity:初期速度の設定の仕方。 =ZERO ;初期速度=0、初期温度=0(デフォルト) =SET ;以下の RANDOM により定義される乱数を用い、各原子の初期速度が 平均値が "STARTT" であるようなガウス関数型の分布となるように 設定する。 =RESEt ;リスタートジョブの初期条件変更 RANDOMseed:速度分布を得るための random seed number(整数値 < 2**31 - 1) =584287 ;(デフォルト) NAMETrajectryIn=入力トラジェクトリファイル名 NUMberTRJ:座標トラジェクトリの位置 =0 ;(デフォルト) myPresto 4.2 75 (1−9)結果の出力指定 MD の途中結果のうち、各エネルギー項・RMSD・温度・圧力・CPU 時間などが標準出力され ます。モニター出力・トラジェクトリは、別の指定項目により、それぞれ別のファイルに 出力されます。 OUTLOG:途中結果出力をする MD ステップの回数。 =1 ;1ステップごとに結果を出力する(デフォルト) LOGFORmat:出力形式 =SHORt ;1行 80 文字以内の簡易出力(デフォルト) =DETAil ;1行 80 文字以内の詳細出力。各エネルギーを追加。 (2)解析用データ入出力(トラジェクトリー、パラメーター) 以下の各種トラジェクトリは、すべてファイルに出力されます。 ・MD エネルギートラジェクトリ:MD 計算の一定ステップ毎に、各エネルギーをファイルに 出力する。入力指定ファイルなし。 ・モニター指定トラジェクトリ:MD 計算の一定ステップ毎に、特定原子の座標、原子間距 離、原子間角度、原子間2面角をファイルに出力する。入力指定はファイル入力で行い、 "EXE> INPUT" で "OUTMON", "NAMEMO"を指定する。コントロールファイルには、原子の名 前を指定する。 ・座標トラジェクトリ:MD 計算の一定ステップ毎に、系に含まれる(固定原子以外の)す べての原子の座標のみをファイル出力する。入力指定ファイルなし。 ・速度トラジェクトリ:MD 計算の一定ステップ毎に、系に含まれる(固定原子以外の)す べての原子の速度のみをファイル出力する。入力指定ファイルなし。 ・総エネルギーデータ:MD 計算のステップ毎に、系の総エネルギー(total potential energy) をファイルに出力する。入力指定ファイルなし。 MD エネルギートラジェクトリ MNTRENergy:MD エネルギートラジェクトリーファイルの形式 =NO ;ファイルを出力しない(デフォルト) =ASCIi ;アスキー形式で出力 =SINGle ;単精度・バイナリ-で出力 myPresto 4.2 76 =DOUBle ;倍精度・バイナリ-で出力 OUTENEergy:出力のタイミング =0 ;0 ステップ毎(デフォルト) UNITENergy:MD エネルギートラジェクトリーファイルの IO Unit =44 ;(デフォルト) NAMEENergy = MD エネルギートラジェクトリのファイル名 モニター指定トラジェクトリ MNTRTRajectory:モニター指定トラジェクトリファイルの形式 =NO ;ファイルを出力しない(デフォルト) =ASCIi ;アスキー形式で出力 =SINGle ;単精度・バイナリ-で出力 =DOUBle ;倍精度・バイナリ-で出力 OUTTRJ:出力のタイミング =0 ;0 ステップ毎(デフォルト) UNITTR:モニター指定トラジェクトリファイルの IO Unit =50 ;(デフォルト) NAMETR =モニター指定トラジェクトリのファイル名 座標トラジェクトリ MNTRCOordinate:座標トラジェクトリファイルの形式 =NO ;ファイルを出力しない(デフォルト) =ASCIi ;アスキー形式で出力 =SINGle ;単精度・バイナリ-で出力 =DOUBle ;倍精度・バイナリ-で出力 OUTCOO:出力のタイミング =0 ;0 ステップ毎(デフォルト) UNITCO:座標トラジェクトリファイルの IO Unit =42 ;(デフォルト) NAMECO =座標トラジェクトリのファイル名 速度トラジェクトリ myPresto 4.2 77 MNTRVElocity:速度トラジェクトリファイルの形式 =NO:ファイルを出力しない(デフォルト) =ASCIi ;アスキー形式で出力 =SINGle ;単精度・バイナリ-で出力 =DOUBle ;倍精度・バイナリ-で出力 OUTVEL:出力のタイミング =0 ;0 ステップ毎(デフォルト) UNITVE:速度トラジェクトリファイルの IO Unit =43 ;(デフォルト) NAMEVE =速度トラジェクトリのファイル名 総エネルギーデータ MNTRTOtalenergy:総エネルギーデータファイルの形式 =NO ;ファイルを出力しない(デフォルト) =ASCIi ;アスキー形式で出力 =SINGle ;単精度・バイナリ-で出力 =DOUBle ;倍精度・バイナリ-で出力 UNITTOtalenergy:総エネルギーデータファイルの IO Unit =59 ;(デフォルト) NAMETOtalenergy =総エネルギーデータのファイル名 【注意】総エネルギーデータ(total potential energy)は、MD 計算のステップごとに出 力されます。 (3)エネルギー計算に関する制御パラメーター(MIN/MD 共通) (3−1)相互作用 CUTOFF の方法(MIN/MD 共通) 「EXE> MINimize グループ」の本項を参照。 (3−2)相互作用計算のスイッチ myPresto 4.2 78 「EXE> MINimize グループ」の本項を参照。 (3−3)Filling Potential 法 CALUMB:Filling Potential 法を適用するかどうか アンブレラポテンシャル法の一種である Filling Potential 法を適用するかどうか。 Filling Potential 法を使用する場合、アンブレラポテンシャルを指定する制御ファイル、 結果の解析ツール、が必要になる。 = NOCALC ;適用しない(デフォルト) = CALC ;適用する (4)拘束条件の指定 (4−1)SHAKE/RATTLE の指定 SHAKE/RATTLE を使用する場合は、EXE>INPUT グループで対象原子の原子番号と拘束距離を 指定した SHAKE ファイルを指定します。さらに、EXE> MD グループで、計算方法と収束条件 などを指定します。 「EXE> MINimize グループ」の本項を参照。 (4−2)剛体モデルの指定 剛体モデルでは、分子の任意の原子を剛体化し、内部自由度を固定することができます。 TIP4P モデルを使用するときは必須の機能です。剛体モデルを使用する場合、どの分子の、 どの部分を剛体化するかを剛体モデルファイルに指定する方法と、プログラムで自動的に 剛体化を行う方法があります。 プログラムで自動的に剛体化を行う場合、以下の方法で行います。 (a)水分子以外場合(分子名が"WAT"でない場合) 水素でない原子に対し 1∼3 つの水素原子が共有結合している場合に、それぞれ 2∼4 原子を剛体として設定します。 (b)水分子の場合(分子名が"WAT"の場合) 水を構成する全原子を剛体として設定します。原子の相対位置はプログラム内部に 保持している相対位置を使用します。所属原子数が 3 の場合は TIP3P として、4 の場合は TIP4P として扱います。 myPresto 4.2 79 RIGIDModel : 剛体モデル用の適用指定(△) =NO ;剛体モデルを適用しない(デフォルト) =YES ;剛体モデルを適用する =AUTO ;剛体モデルを自動作成する UNITRM:剛体モデルの指定ファイルの IO unit(△) =58 ;(デフォルト) NAMERM =(剛体モデルファイル名、133 文字以内。) 剛体モデルを自動作成した場合(RIGIDM= AUTO)、作成された情報をファイル出力するこ とができます。出力されるファイルの書式は、入力ファイルと同じです。 DBGRIG:剛体モデル自動作成情報出力指定(△) =NOWR ;ファイル出力しない(デフォルト) =ASCI ;ファイル出力する UNITDR:剛体モデル自動作成情報ファイルの IO unit(△) =84 :(デフォルト) NAMEDR =(剛体モデル自動作成情報ファイル名、133 文字以内。) 【注意】剛体モデルファイルは、専用ツールによる作成もできます。ファイルには剛体化 する原子の組や、固定する3次元座標などを指定します(指定方法は、巻末「A ファイル 書式」を参照)。 (5)PME, Ewald, FMM の指定 (5−1)Particle Mesh Ewald 法, Ewald 法の指定 周期境界条件においては、1-5 静電相互作用の計算に PME(Particle Mesh Ewald)法、ま たは、Ewald 法を用いることができます。使用できるのはどちらか一方だけです。 「EXE> MINimize グループ」の本項を参照。 【注意】PME および Ewald 法では、以下の指定が必要です。 CALE15= CALC ; 近接原子は相互作用テーブルを用いた CUTOFF 法で計算します。 BOUNDA= PERI ; PME, Ewald は周期境界条件でないと使用できません。 DIEFUN= CONS ; PME, Ewald ではクーロン力の空間誘電率は定数でないといけません。 myPresto 4.2 80 (5−2)Fast Multiple Method の指定 「EXE> MINimize グループ」の本項を参照。 (6)溶媒効果(MIN/MD 共通) (6−1)Accessible Surface Area 法の指定(MIN/MD 共通) 「EXE> MINimize グループ」の本項を参照。 【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。 (6−2)Generalized Born / Surface Area 法の指定(MIN/MD 共通) 「EXE> MINimize グループ」の本項を参照。 【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。 (7)境界条件(MIN/MD 共通) (7−1)境界条件の中心の設定(MIN/MD 共通) 「EXE> MINimize グループ」の本項を参照。 (7−2)境界条件のサイズの設定(MIN/MD 共通) 「EXE> MINimize グループ」の本項を参照。 (8)LIST "LIST" を書き加えれば、現在のパラメーター設定が表示されます。引数なし。 (9)QUIT myPresto 4.2 81 EXE>グループ入力の終了を示します。 myPresto 4.2 82 4.2.1.4 EXE> OUTPUT グループ OUTPUT グループでは、トポロジーファイル、最終座標の出力のために、それらの外部ファ イルの指定を行います。これら OUTPUT グループの入力は "EXE> MIN", "EXE> /MD" に共通 で使用されます。 【注意】各外部ファイルの書式は、巻末「A ファイル書式」を参照。 OUTPUT グループでの指定事項: (1)系のトポロジーの指定 (2)系の座標の指定 (1)系のトポロジーの指定 TOPOLOgy:トポロジーファイルの書式(○) =NOWRite ;トポロジーファイル出力なし(デフォルト) =FORMAtted ;書式つきアスキーファイル =BINAry ;バイナリーファイル UNITTOpology:トポロジーファイルの IO unit(△) =90 ;(デフォルト) NAMETOpology=(トポロジーファイル名。TOPOLOgy=[FORM│BINA]のとき) (2)系の座標の指定 ここで出力する座標ファイルは、MD ステップが N 回のとき、N+1 回目のステップの座標を 出力します。 COORDInate:PDB 書式3次元座標ファイルの書式(○) =NOWRite =PDB ;座標入力なし(デフォルト) ;PDB ファイルフォーマット =BINAry ;バイナリーファイル UNITCOordiante:座標ファイルの IO unit(△) =91 ;(デフォルト) NAMECOordinate=(座標ファイル名。COORD=[PDB│BINA]のとき) (3)QUIT EXE>グループの入力の終わりを示す。 myPresto 4.2 83 4.2.1.5 EXE> END グループ END は、cosgene のコントロールファイルの終了を示します。 入力は、「EXE> END」の1行のみです。 myPresto 4.2 84 (余白) myPresto 4.2 85 5 計算例 5.1 Sample-1:真空中のペプチド −Vassopressin の計算− (1)初期座標とトポロジーファイルの準備 MD/エネルギー最小化の必須の入力として PDB 書式の初期座標とトポロジーファイルが必要 です。これらは tplgene を用いて準備できますが、準備の方法には大きくわけて2通りあ ります。 方法1:アミノ酸・DNA 配列のシーケンスとそれらの構造を二面角系で tplgene に指示する ことで PDB 書式の初期座標とトポロジーファイルを発生させる方法 方法2:PDB などからダウンロードした PDB 書式の座標を用いて、tplgene で自動的に不足 原子を補いながら PDB 書式の初期座標とトポロジーファイルを発生させる方法 Sample-1 では方法1を説明し、Sample-2 で方法2を説明します。 (2)二面角系での初期座標とトポロジーファイルの発生 二面角系入力ファイルを "vas.dih" として作成します。 ① アミノ酸シーケンス(PRE>SEQUENCE) "PRE>SEQUENCE" 以下の行にアミノ酸シーケンスを3文字記号で記載してください。N 端の アセチル化、及び C 端のメチル化は、ACE/NME と記載、C 端が NH2 であれば "NHE" と記載 してください。 ② S-S 結合の指定(PRE>SSBOND) もし n 番目の残基と m 番目の残基が S-S 結合で結合しているものであれば "PRE>SSBOND"以 下に S-S 結合のかかる場所を「n m」と記載してください。複数の S-S 結合があれば次の行 に続けて入力してください。 ③ 二面角の指定(PRE>DIHEDRAL-ANGLES) 二面角は "PRE>DIHEDRAL-ANGLES" 以下に記載します。これは ECEPP の定義に従い、φ―ψ ―ω―χ1―χ2- の順番になります。一般のアミノ酸ではω角は 180 度ですので注意して ください。二面角が良くわからない時、以下の図のように適当な角を代入しても、多くの 場合後のエネルギー最小化でもっともらしい構造を得ることができます。 myPresto 4.0 86 ■二面角系入力ファイルの例(vas.dih) PRE>SEQUENCE CYS TYR PHE GLN ASN CYS PRO ARG GLY NMECPRE>SSBOND 1 6 PRE>DIHEDRAL-ANGLES 180 180 180 0 0 0 0 0 0 0 180 180 180 0 0 0 0 0 0 0 180 180 180 180 180 180 0 0 0 0 0 0 0 0 0 0 0 0 0 0 180 180 180 0 0 0 0 0 0 0 180 180 180 180 180 180 0 0 0 0 0 0 0 0 0 0 0 0 0 0 180 180 180 0 0 0 0 0 0 0 180 180 180 180 180 180 0 0 0 0 0 0 0 0 0 0 0 0 0 0 下の例では、"vas.dih" は "VAS" という分子名で "vas-dih.pdb" と "vas-dih.tpl" と いう名前の初期座標とトポロジーを生成します。ここでは、入力ファイル、データベース ファイルを実行時のディレクトリに置く方法について説明します。 (環境変数を使って任意のディレクトリを指定する例は後述の Sample-2 で示します) ■実行方法(入力ファイル、データベースファイルを実行時のディレクトリに置く場合) ① 入力ファイル(ここでは "vas.dih"とします)、使用するデータベースファイルを実行 ディレクトリにコピーします。 ② 実行ディレクトリで tplgene を実行します。引数なしで "tplgene" とタイプすれば処 理は会話的に始まります。 ③ 順次、タイトル(任意)、分子名(任意)、蛋白か核酸か、入力形式、使用するデータベ ース、入力ファイル名、出力ファイル名を入力します。 myPresto 4.2 87 ■実行例 %% Input Title for this molecules %% If end, type end and (cr). %% Input Title less than 79 char. %% Vassopressin test end %% Input Molecular Name less than 39 char. %% If end, type end and (cr). VAS end %% Select Chain Species by the next number. %% 1 : peptide chain 2 : nucleotide chain 1 %% Select Input File by the next number. %% 1 : pdb file 2 : dihed file 2 %% Which Force Field Files do you use ? %% Please choose from the following files . and write the File Name . ./ C96_aa.tpl C96_na.tpl charmm19_aa_all.tpl charmm22_aa_all.tpl vas.dih C96_aa.tpl %% Input File Name of Atom Coord. or Dihed. %% ./ vas.dih %% Input File Name of Output Coord. %% ./ vas-dih.pdb %% Input File Name of Output Topology %% ./ vas-dih.tpl : (省略) : %% Program is done. %% %% This program ended normally. %% myPresto 4.2 88 5.2 Sample-2:真空中の蛋白 −Lysozyme の計算− (1)初期座標とトポロジーファイルの準備:PDB 座標ファイルを用いる場合 蛋白の初期座標は PDB 形式で準備してください。水素(H)は欠損していても自動的に付加 されます。ここでは "1LZA.pdb" を PDB よりダウンロードしたとします。"tplgene" で MD で使用する PDB ファイルと力場パラメーターの割り振られたトポロジーファイルを作成し ます。 【注意】分子は "TER" で区切られていることを確認してください。蛋白鎖・分子間に"TER" がない場合は、自分で PDB ファイル中に "TER" を書き込んでください。 【注意】複数鎖からなる分子の場合、PDB 書式でチェイン名を残基番号の前に記入しておい てください。チェイン名がない場合もトポロジーファイルは生成しますが、化学結合のな い複数分子が1種の分子として扱われることになります。 【注意】ATOM 行の原子のみが処理の対象となります。HETATM 行は処理されません。また標 準的でない原子名が指定されている場合、プログラムは処理を停止する場合があります。 特に変則的な名前が水素(H)原子に対して用いられた場合、与えられた座標を無視して、 新たにプログラムの内蔵する座標で H を作り直す場合があります。 【注意】tplgene で処理できるアミノ酸の種類は、データベースに登録済みのものに限られ ます。これ以外のアミノ酸はデータベースを自分で拡張しない限り処理されません。 下の例では、"1LZA.pdb" から HETATM 行を除いたものを "lys_0.pdb" として扱っています。 結果として、"LYZ" という分子名で "lys_1.pdb" と "lys_1.tpl" という名前の初期座標 とトポロジーが生成されています。ここでは、入力ファイル、データベースファイルを任 意のディレクトリに置いて取り扱う方法について説明します。 (実行時のディレクトリに置く方法の例は前述の Sample-1 で示しています) ■実行方法(入力ファイル、データベースファイルを任意のディレクトリに置く場合) ① 任意のディレクトリ内に入力ファイル、データベースファイルを用意してください。続 いて、その入力ファイル用ディレクトリ、データベースファイル用ディレクトリのパスを 環境変数で設定して下さい(設定方法は「2.2.5 環境変数」参照)。tplgene 実行時に環境 変数が設定されていない場合は、設定されていない変数に対するディレクトリ(入力、出 力、力場 DB ディレクトリ)はカレントディレクトリになります。 ② tplgene を実行します。引数なしで "tplgene" とタイプすれば処理は会話的に始まり ます。 ③ 順次、タイトル(任意)、分子名(任意)、蛋白か核酸か、入力形式、使用するデータベ ース、入力ファイル名、出力ファイル名を入力します。 myPresto 4.2 89 ■実行例 ※この例は環境変数を以下のように設定しているものとして計算を行っています。 入力ファイル用ディレクトリ :/home/user01/myPresto/sample/sample2 データベースファイル用ディレクトリ:/home/user01/myPresto/tplgene/DB %% Input Title for this molecules %% If end, type end and (cr). %% Input Title less than 79 char. %% LYSOZYME test end %% Input Molecular Name less than 39 char. %% If end, type end and (cr). LYZ end %% Select Chain Species by the next number. %% 1 : peptide chain 2 : nucleotide chain 1 %% Select Input File by the next number. %% 1 : pdb file 2 : dihed file 1 %% Which Force Field Files do you use ? %% Please choose from the following files . and write the File Name . /home/user01/myPresto/tplgene/DB/ C96_aa.tpl C96_aa.tpl C96_na.tpl charmm19_aa_all.tpl charmm22_aa_all.tpl %% Input File Name of Atom Coord. or Dihed. %% /home/user01/myPresto/sample/sample2/ 1LZA.pdb lys_0.pdb lys_0.pdb %% Input File Name of Output Coord. %% ./ lys_1.pdb %% Input File Name of Output Topology %% ./ lys_1.tpl (次ページにつづく) myPresto 4.2 90 (前ページから) INFORMATION> tgReadAminoSequence Molecule Number :1 Total number of residues :129 INFORMATION> tgReadAminoSequence Amino acid Sequence of the protein Molecule number :1 LYS+N+ VAL PHE GLY ARG+ CYSS GLU- LEU ALA ALA ALA ARG+ MET GLY LYS+ TYR ARG+ SER HIS LEU GLY GLY LEU ASN ASPTRP ASN VAL TYR CYSS ALA ALA LYS+ PHE GLU- SER ASN PHE ASN THR GLN THR ALA ASP- THR TYR ASN GLY ARG+ ILE ASN LEU THR GLN ASPILE GLY ASN SER SER ARG+ TRP TRP CYSS ASN ASP- GLY ARG+ THR PRO GLY SER SER ALA ARG+ LEU ASN LEU LEU SER CYSS SER ASN ASP- ILE ILE PRO THR CYSS ALA SER VAL ASN CYSS ALA LYS+ LYS+ ILE VAL SER ASPTRP GLY ARG+ ASN ASN GLY ARG+ MET CYSS ASN LYS+ ALA GLY TRP THR VAL ASP- ALA VAL GLN ALA TRP ILE ARG+ GLY CYSS ARG+ LEUC- INFORMATION> tgReadInputTopology Amber Type Topology Database File is read INFORMATION> tgOutputTopology Write formatted Topology File INFORMATION> tgSetCoordinate All the atom positions are now set. INFORMATION> tgOutputCoordinate Output pdb-formatted coordinates CALC. TIME = 0.490000 sec. %% Program is done. %% %% This program ended normally. %% これで蛋白の PDB とトポロジーファイルの準備はできました。 myPresto 4.2 91 【注意】S-S 結合を含まない蛋白では、PDB の ATOM 行があれば十分ですが、S-S 結合を含む 分子では、PDB の S-S 結合を指定する行を tplgene が読み込み、S-S 結合の有無の判定 をします。 上の例では、S-S 結合指定行があるので、"CYS" が "CYSS" に変換されています。S-S 指 定行を削除すると、下の例のように、"CYS" のままで残り S-S 結合は形成されず、"S-H" の ように "H" が付加されます。正しく変換されているか確認してください。 ■S-S 結合を指定しなかった場合の結果(一部) Molecule number :1 LYS+N+ VAL PHE GLY ARG+ CYS GLU- LEU ALA ALA ALA MET LYS+ ARG+ HIS GLY LEU ASP- ASN TYR ARG+ ALA GLY ALA TYR LYS+ SER PHE LEU GLU- GLY SER ASN ASN TRP PHE VAL ASN CYS THR GLN ALA THR ASN ARG+ ASN THR ASP- GLY SER THR ARG+ ASPTRP TYR TRP GLY CYS ILE ASN LEU ASP- GLN GLY ILE ARG+ ASN THR SER PRO GLY SER ARG+ ASN LEU CYS ASN ILE PRO CYS SER SER ALA VAL LEU ASN LEU CYS SER ALA SER LYS+ ASPLYS+ ILE ILE THR VAL ALA SER ASP- GLY ASN GLY MET ASN ALA TRP VAL ALA TRP GLN ARG+ ALA ASN TRP ARG+ ILE CYS ARG+ LYS+ GLY GLY CYS THR ARG+ ASPLEUC- VAL (2)エネルギー最小化と MD 計算 エネルギー最小化には、最急降下法と共役勾配法の2種類が用意されています。ただし、 共役勾配法では SHAKE を併用できないので注意してください。 これまでに作成したトポロジーファイルと初期座標を用いて、真空中でのエネルギー最小 化を行います。相互作用は 8Å cutoff、距離依存の誘電率を用い、相互作用テーブルの更 新は 20 ステップごととした例を示します。エネルギー最小化に伴う初期座標からの座標の 変位を観察するため、"REFCOORD=PDB NAMERE=lys_1.pdb" と "BESTFI=YES" を指定してい ます。共役勾配法では SHAKE の指定はできないので "SETSHAKE" の欄はコメントアウト指 定のセミコロン(;)を付けてあります。 共役勾配法で収束が悪い場合(大きな系やひずみの大きい系など)は、最初に最急降下 法(METHOD= STEEP)を数十ステップ適用した後、共役勾配法を適用すると良い場合が多い です。 myPresto 4.2 92 ■制御ファイル(min_vac.inp) EXE> INPUT TOPOLOGY= NAMETO= lys_1.tpl PDB NAMECO= lys_1.pdb REFCOORD= SETSHAKE= PDB READ NAMERE= NAMESH= lys_1.pdb lys.shk ; FORM COORDINA= QUIT EXE> MINI METHOD= CONJ CPUTIM= 360000.0 LOOPLI= 4000 UPDATE= 20 MONITO= CUTMET= 5 RESA CONVGR= CUTLEN= 0.1D0 8.0D0 DIEFUN= DIST DIEVAL= 2.0D0 BESTFI= QUIT YES EXE> OUTPUT COORDINATE= QUIT PDB NAMECO= lys_1_min.pdb EXE> END (3)MD 計算 エネルギー最小化した座標をもとに MD を行い、系の平衡状態を実現します。トポロジーフ ァイルは初期座標と共通のものを用います。初期構造からのずれを計測するため、制御フ ァイルに "REFCOORD=PDB NAMERE=lys_1.pdb" と "BESTFI=YES" を指定します。 また、蛋白質のアミノ酸残基間の距離を計測してみます。モニター指定ファイルを作成 し、原子 A と原子 B の間の距離をモニターします。それらは以下のように指定します。 ・A を含む Chain 番号 A を含む分子内での残基番号 A の原子名、 ・B を含む Chain 番号 B を含む分子内での残基番号 B の原子名 ■モニター指定ファイル(lys.mntinp) MONITOR> DISTANCE 1 46 ND2 1 109 CB 1 73 CZ 1 101 CG END 上では、46 番目の残基の ND2 と 109 番目残基の CB の距離と、73 残基の CZ と 101 残基の CG myPresto 4.2 93 の間の距離を指定しています。これを 100 step 毎に、"lys_vac.mnt" にアスキー形式で出 力させる場合は、"OUTTRJ=100"、"NAMETR= lys_vac.mnt"、"MNTRTR=ASCI" と指定します。 上記の計算条件に加え、300K での NVT 計算、相互作用 cutoff 10Å、蛋白の並進と回転運 動を重心周りに固定し、初期速度をランダムに発生させる場合の入力を以下に示します。 タイムステップの設定は、通常 0.5fs、全ての水素に SHAKE をかけるとき 1.5fs 程度ですが、 事前に同じ系で NVE の計算を行い、全エネルギーが保存される程度のタイムステップに設 定すると良いでしょう。 ■制御ファイル(md_vac.inp) EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTTRJ= OUTLOG= LOGFOR= METHOD= SETTEM= INITIA= STARTT= RANDOM= FORM PDB READ PDB 2000 500.0D0 20 0.5D0 100 100 DETA NAMETO= NAMECO= NAMEMO= NAMERE= lys_1.tpl lys_1_min.pdb lys.mntinp lys_1.pdb CPUTIM= 3600000.0D0 STOPCE= BOTH CANONICAL 300.0D0 SET 300.0D0 654321 NAMETR= lys_vac.mnt BESTFI= YES CUTMET= RESA DIEFUN= DIST CALV15= CALC CALE15= CALC CALHYD= NOCALC CALV5N= NOCALC CALE5N= NOCALC CALH5N= NOCALC QUIT EXE> OUTPUT COORDINATE= PDB QUIT EXE> END MNTRTR= ASCI CUTLEN= DIEVAL= 10.0D0 2.0D0 NAMECO= lys_1_md.pdb myPresto 4.2 94 5.3 Sample-3:水中の蛋白 −Lysozyme の計算− (1)初期座標とトポロジーファイルの準備 真空中の場合と同様の手続きで、蛋白のデータを準備してください。 この例では、"lys_1.pdb" と "lys_1.tpl" とします。 (2)境界条件の設定 溶媒水を用意するのに先立って境界条件を決めます。利用可能な境界条件は、次の3つで す。 ・剛体反発壁をもつ球・楕円体 ・CAP water ・周期境界条件(立方体セル) 剛体反発壁をもつ球・楕円体の場合、中心と球の半径ないし楕円体の長短軸を以下のよう に制御ファイルに指定してください(以下の例は球の場合)。楕円体は球形から形の外れた 扁平・長い蛋白の水中での計算に向いています。 BOUNDARY= RADIUS= SPHERE 30.0 CENTRX= 3.500 CENTRY= CENTRZ= 27.800 34.000 CAP water では、CAP の中心、CAP 拘束の半径など、CAP 拘束のパラメーターを以下のよう に制御ファイルに指定します。また、CAP 計算対象として蛋白と水の分子を CAP 指定ファイ ルに指定します。CAP の中心は、座標で明示する場合と分子の重心を指定する場合がありま す。反発ポテンシャルは、2次関数と4次関数の2種類がありますが、この例では2次関 数を用いています。この方法は、蛋白−リガンドドッキング計算などに向いています。 CALCAP= CENTRX= CALC 3.500 CENTRY= 27.800 CENTRZ= RADCAP= 34.000 10.0 FORCAP= 20.0 FUNCAP= SETCEN= HARMonic NO myPresto 4.2 95 ■CAP 指定ファイル(lys_w.capbc) BOUND> INCLUDE LYZ 1 WAT 1 1 YES 4592 YES 周期境界条件では、以下のように制御ファイルに指定してください。セルの中心の指定に 加え、セルの辺の長さを指定してください。 BOUNDARY= PERI CENTRX= 3.500 CENTRY= 27.800 CENTRZ= LXCELL= 34.000 20.00 LYCELL= 20.00 LZCELL= 20.00 【注意】相 互 作 用の cutoff の 仕方は "CUTMET= RESC" を指定 してください。また、 "CUTMET=RESA" では分子サイズがセルサイズに近い場合、相互作用が一意に計算できなく なることがあります。この場合、プログラムは警告を出します。 myPresto 4.2 96 (3)水の発生 ① プログラムツール "setwater" を使用し、水分子を発生させます。 (使用法は「B ユーティリティ」、setwater の節を参照してください) この例では、setwater を使用し、蛋白 "lys_1.pdb" の重心から半径 34Åの間に球形の TIP3P の水分子 "wat.pdb" を発生させます。 【注意】水の付加では、蛋白の空間に占める形状により、水分子の密度は実際の密度より やや小さくなる傾向にあります。NVT 実行後、水和の系に隙間が生じるようであれば、水の 数を調整してください。CAP water の付加では、系により CAP 半径よりやや大きめ(0.5∼2 Å)に水分子を配置してください。その他の場合では、vdW 半径のダンピングファクターを 小さく設定したり、密度を高めに調整したりする必要がある場合もあります。 ② 蛋白の PDB データに作成した水分子の PDB データを追加し、水中の PDB ファイルを作成 します。(PDB は、対象となる系の PDB の末尾に追加します) % cp lys_1.pdb lys_w.pdb % cat wat.pdb >> lys_w.pdb ③ プログラムツール "mergetpl" を使用し、蛋白のトポロジーファイルの情報と水分子の トポロジーファイルの情報を1つのトポロジーファイルに統合します。統合後のファイル にエディタを使って水分子の数を記入します。 (使用法は「B ユーティリティ」、mergetpl の節を参照してください) この例では、蛋白 "lys_1.tpl" と水 "tip3p.tpl" を合わせて新しいトポロジーファイル "lys_w.tpl" を生成し、"lys_w.tpl"の"MOLECULES"項に水分子の数を記入します。 ■トポロジーファイル "lys_w.tpl" への水分子の数の記入 TPL> TITLE LYSOZYME test TPL> MOLECULES LYZ WAT : (省略) myPresto 4.2 1 4592 ;水分子の数 97 (4)SHAKE の使い方 SHAKE を実行するためには、myPresto に SHAKE の条件を記述した SHAKE ファイルを与える 必要があります。SHAKE ファイルには、拘束をかける原子とそれらの間の拘束距離を指定し ます。それらは以下のように指定します。 (詳細は「A 入出力ファイル」、SHAKE ファイルの節を参照してください) ・分子名 ・SHAKE 対象原子数、SHAKE 対象原子の分子内相対原子番号、原子間距離 ■SHAKE ファイル(lys_w.shk) SHAKE> SHAKE LYZ 4 1 ;分子名 2 3 1.01000 1.64962 2 5 -> 6 4 -> 1.01000 ;SHAKE 対象原子数、SHAKE 対象原子番号 1.01000 1.64962 8 1.0905 : ;原子間距離 ;SHAKE 対象原子数、SHAKE 対象原子番号 1.0901 3 1.64962 ;原子間距離 7 9 -> 1.0917 ;SHAKE 対象原子数、SHAKE 対象原子番号 1.7691 ;原子間距離 (省略) : SHAKE> SHAKE WAT 3 1 0.95720 2 3 1.51360 -> 0.95720 ;分子名 ;SHAKE 対象原子数、SHAKE 対象原子番号 ;原子間距離 上の1つ目の指定は、4 原子での SHAKE を指定しています。これは 4 面体を構成するので 6 個の原子間距離を指定します。原子間距離の指定順は、1-2、2-3、3-1(ここまでは3原子 と同じ)、1-4、2-4、3-4 となります。この SHAKE ファイルで指定した SHAKE を実行するた めには、制御ファイルに、"SETSHAKE=READ NAMESH=lys_w.shk"、"SHAKEM=HBON" を指定し ます。 【注意】 ・行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。 ・SHAKE を構成する原子の数は 2,3,4 のいずれかとする。 ・複数の分子間にまたがる SHAKE は記述できない。 myPresto 4.2 98 (5)エネルギー最小化 CAP water を使用した場合の例を以下に示します。 ■制御ファイル(min_wat.inp) EXE> INPUT TOPOLOGY= FORM NAMETO= lys_w.tpl COORDINA= PDB NAMECO= lys_w.pdb REFCOORD= SETBOU= PDB READ NAMERE= NAMEBO= lys_w.pdb lys_w.capbc SETSHAKE= READ NAMESH= lys_w.shk QUIT EXE> MINI ; ; ; ; ; METHOD= STEEP CPUTIM= 360000.0 LOOPLI= MONITO= 4000 5 UPDATE= CONVGR= 20 0.2D0 CUTMET= RESA CUTLEN= 8.0D0 DIEFUN= BESTFI= CONS YES DIEVAL= 1.0D0 in case of SPHERE boundary BOUNDARY= SPHERE RADIUS= 35.0 SETCEN= YES in case of CAP boundary CALCAP= CALC FUNCAP= HARMonic RADCAP= SETCEN= 34.0 YES FORCAP= 100.0 SHAKEM= HBON QUIT EXE> OUTPUT COORDINATE= PDB NAMECO= lys_w_min.pdb QUIT EXE> END 【注意】球体・楕円体("SPHERE", "ELLIPSOID")の境界条件では、入力 PDB に含まれる原 子座標より小さい球領域を指定できません。原子が境界条件より外にある場合、警告を 出してプログラムは停止します。 myPresto 4.2 99 (6)水中での MD 計算 CAP constraint、SHAKE による拘束条件下での、Gaussian constraint 法を用いた NVT 計算 の入力を示します。MD の最初のステップは平衡に達していないため、コントロールファイ ルに "NAMERO= lys_w_md.res" を指定し、リスタートファイルを出力して終了します。 ■制御ファイル(md_wat.inp) EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= SETBOU= SETSHAKE= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTTRJ= OUTLOG= LOGFOR= ; ; ; ; FORM PDB READ PDB READ READ 2000 500.0D0 20 2.0D0 100 10 DETA NAMETO= NAMECO= NAMEMO= NAMERE= NAMEBO= NAMESH= lys_w.tpl lys_w_min.pdb lys.mntinp lys_w.pdb lys_w.capbc lys_w.shk CPUTIM= 3600000.0D0 STOPCE= BOTH METHOD= CANONICAL THERMO= SETTEM= 300.0D0 INITIA= SET STARTT= 300.0D0 RANDOM= 654321 NAMERO= lys_w_md.res in case of SPHERE boundary BOUNDARY= SPHERE RADIUS= 35.0 SETCEN= in case of CAP boundary CALCAP= CALC FUNCAP= RADCAP= 34.0 FORCAP= SETCEN= YES NAMETR= lys_wat.mnt BESTFI= YES CUTMET= RESA DIEFUN= CONS SHAKEM= HBON CALV15= CALC CALE15= CALC CALHYD= NOCALC QUIT EXE> OUTPUT COORDINATE= PDB QUIT EXE> END CONS YES HARMonic 100.0 MNTRTR= ASCI CUTLEN= DIEVAL= 10.0D0 1.0D0 CALV5N= CALE5N= CALH5N= NAMECO= NOCALC NOCALC NOCALC lys_w_md_1.pdb myPresto 4.2 100 (7)リスタートの仕方 サンプリングを行うための MD は、事前の MD 結果からのリスタートで行うのが普通です。 以下では、リスタートに用いる座標と速度を "RESTARt=YES"、"NAMERI=lys_w_md.res" で 指定しています。リスタートファイルには原子名が書かれていないため INPUT フェーズで 原子名の一致する座標を "COORDINA=PDB NAMECO=lys_w_min.pdb" と指定します。 ■制御ファイル(md_wat2.inp) EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= SETBOU= SETSHAKE= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTTRJ= OUTLOG= LOGFOR= ; FORM PDB READ PDB READ READ 100 500.0D0 20 2.0D0 100 10 DETA NAMETO= NAMECO= NAMEMO= NAMERE= NAMEBO= NAMESH= lys_w.tpl lys_w_min.pdb lys.mntinp lys_w.pdb lys_w.capbc lys_w.shk CPUTIM= 3600000.0D0 STOPCE= BOTH RESTARt= YES NAMERI= lys_w_md.res METHOD= CANONICAL THERMO= CONS SETTEM= 300.0D0 INITIA= SET STARTT= 300.0D0 RANDOM= 654321 NAMERO= lys_w_md_2.res in case of CAP boundary CALCAP= CALC FUNCAP= HARMonic RADCAP= 34.0 FORCAP= 100.0 SETCEN= YES NAMETR= lys_wat2.mnt MNTRTR= ASCI BESTFI= YES CUTMET= RESA CUTLEN= 10.0D0 DIEFUN= CONS DIEVAL= 1.0D0 SHAKEM= HBON CALV15= CALC CALV5N= NOCALC CALE15= CALC CALE5N= NOCALC CALHYD= NOCALC CALH5N= NOCALC QUIT EXE> OUTPUT COORDINATE= PDB NAMECO= lys_w_md_2.pdb QUIT EXE> END myPresto 4.2 101 (8)ログ出力 計算ログの出力例を以下に示します。 ■ログ出力 ******************************************************************************* MD LOOP NUMBER : LAP CPU TIME : (SEC) TEMPERATURE (K) TOTAL KINETIC 20 TIME (PSEC) : 0.01000 : 0.0000000E+00 (KCAL/MOL) : -0.4029400E+05 299.9925948 SCALING FACTOR (KCAL/MOL) : (KCAL/MOL) : HAMILTONIAN(NOSE) : 39.5810551 : -0.2936448E+05 POTENTIAL 0.1092952E+05 -0.2936448E+05 TOTAL : -0.4029400E+05 BOND : TORS. : 0.7281127E+03 IMPRO. : -(1) 0.2342204E+03 ANGLE : 0.5763917E+02 VDW14 : 0.5456552E+03 0.4271405E+03 ELE14 : 0.3779113E+04 VDW15 : 0.3002577E+04 ELE15 : -0.4906846E+05 DHR. : 0.0000000E+00 REP. : 0.0000000E+00 CAP. : 0.0000000E+00 R.M.S.F. (KCAL/MOL*A) : NAME OF MOLECULE 0.1761278E+02 RMSD (ANGSTROMS) : 0.2545461E+00 MAX FORCE TEMPERATURE CAP ENERGY LYZ 0.6555757E+02 0.1755462E+03 0.0000000E+00 WAT 0.7155075E+02 0.3165385E+03 0.0000000E+00 INFO>CUTOFF: 1-5 VDW & 1-5 HYD.BOND : 4877928 & ERROR -(2) -(3) 0 ******************************************************************************* (1)能勢−HOOVER の方法での保存量である仮想ハミルトニアンの値。 (ただし、"THERMO= NOSE" 指定時にだけ出力される) (2)RMSD は、1番目の鎖(chain)の原子に対して計算されます。 この例では lysozyme の RMSD です。 (3)分子種ごとに力の最大値と温度、CAP ポテンシャルの値が表示されます。 【注意】力場による "CALHYD= NOCALC" の指定に注意してください。Amber91 力場など水素 結合の LJ12-10 型ポテンシャルをあらわに含む力場では、"CALHYD=CALC" にします。 Amber94/96/99 力場では水素結合はクーロン力に含まれるため、"CALHYD=NOCALC" にし ます。 myPresto 4.2 102 5.4 Sample-4:拡張アンサンブル(Force-biased McMD)−Alanine ペプチドの計算− (1)Force-Biased Multicanonical MD 計算 cosgene では、Force-Biased Multicanonical MD(F.B.McMD)の計算ができます。蛋白質の 座 標 と ト ポ ロ ジ ー フ ァ イ ル は 、 い つ も ど お り に 準 備し て く だ さ い 。 こ の 例で は 、 Ace-Ala-Ala-Nme を例に、初期入力は、2面角入力 ala_ala.dih として準備されています。 最初に、tplgene を用いて、初期座標 ala_ala.pdb と、トポロジーファイル ala_ala.tpl を準備してください。F.B.McMD は MD 手法なので、エネルギー最小化には適用できません。 通常の手法でエネルギー最小化を行ってください。 F.B.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、F.B.McMD を指定してくださ い(EXPAND= FORC)。次に、実現したいマルチカノニカル分布の温度範囲を設定します。例 では、TEMMIN= 250 K ∼ TEMMAX= 700 K の範囲を指定しています。F.B.McMD では、スケー リングのための重み関数をエネルギーのヒストグラムから作成します。エネルギーのヒス トグラムを作成する範囲(ENEMIN∼ENEMAX)は、TEMMIN でのカノニカル分布のエネルギー 分布と TEMMAX でのカノニカル分布のエネルギー範囲を十分に被覆する必要がありますので、 あらかじめ TEMMIN と TEMMAX での NVT 計算を行っておいて、ENEMIN と ENEMAX の概算値を出 しておく必要があります。例では、T=250K でのエネルギー分布は 20∼30 kcal/mol、T=700 K でのエネルギー分布は 50∼70 kcal/mol 程度なので、ENEMIN=-100 kcal/mol、ENEMAX=400 kcal/mol と余裕をとって指定しています。ヒストグラム作成時の bin サイズ(BINSIZ)を指 定してください。例では 2 kcal/mol としています。MD シミュレーションを行う温度(T0= SETTEM)は、運動方程式を解く時の温度で、TEMMIN < SETTEM < TEMMAX にとります。後は F.B.McMD の反復1回あたりのループ回数(RESETC)と、データを捨てるダミーループの回数 (DUMMYL)を指示、全体のループ回数(LOOPLI)を指定します。LOOPLI は、RESETC の整数倍に とってください。 ■制御ファイル ;fbmcmd_vac.inp EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= (つづく) myPresto 4.2 FORM PDB READ PDB 30000000 50000.0D0 20 0.5D0 NAMETO= NAMECO= NAMEMO= NAMERE= ala_ala.tpl ala_min.pdb ala.mntinp ala_min.pdb CPUTIM= 3600000.0D0 103 (つづき) OUTTRJ= OUTCOO= OUTLOG= LOGFOR= 1000 1000 2000 DETA METHOD= RESETC= TEMMAX= ENEMIN= BINSIZ= SETTEM= LIMITS= EXPA 300000 700.0 -100.0 2.0 600.0 0.001 STOPCE= BOTH EXPAND= DUMMYL= TEMMIN= ENEMAX= LIMITC= FORC 1000 250.0 400.0 0.001 INITIA= STARTT= RANDOM= SET 600.0D0 654321 NAMETR= NAMERO= NAMECO= NAMETO= BESTFI= ala_vac.mnt ala_vac.rst ala_vac.cor ala_vac.eto YES MNTRTR= ASCI MNTRCO= MNTRTO= SING ASCI CUTMET= DIEFUN= RESA DIST CUTLEN= DIEVAL= 99.0D0 4.0D0 CALV15= CALE15= CALHYD= CALV5N= CALE5N= CALH5N= QUIT EXE> OUTPUT COORDINATE= QUIT CALC CALC NOCALC NOCALC NOCALC NOCALC PDB NAMECO= ala_md.pdb EXE> END F.B.McMD が終了 すると、 座標の トラジェクトリファイルの他 に、expand.energy、 expand.prob、expand.scale の3つのファイルが出力されます(デフォルト時。パラメータ NAMEEE,NAMEEP,NAMEES を用いて任意のファイル名を指定することもできます。)。カノニカ ル分布を再現するための Reweighting による解析は、ツール reweightFB(詳細は巻末「B ユ ーティリティ」を参照)と出力ファイル expand.scale により行われます。 myPresto 4.2 104 (2)カノニカル分布の再構成 解析ツール reweightFB を準備します。以下のようにコンパイルしてください。解析は短 時間で終了しますので、最適化オプションは通常不要です。 % f90 reweightFB.f90 ?o reweightFB.x 入力ファイル inp_MUCA を次のように準備します。 カノニカル分布の再現には、このうち ttt3 ファイルが最も重要です。 expand.scale ttt1 ttt2 ttt3 ttt4 2.0 251 10 100 600 260 700 20 1.d-05 1行目:入力ファイル名(デフォルト時 expand.scale) 2行目:出力ファイル名 1カラムめ:分配関数 2カラムめ:エネルギー、density of state の指数、全確率 3カラムめ:エネルギー、reweight されたカノニカル分布の確率 4カラムめ:温度、平均エネルギー、平均エネルギーの二乗、比熱 3行目:1カラムめ:F.B.McMD で指定した bin サイズ (=BINSIZ) 2カラムめ:ヒストグラムのデータ数 (=(ENEMAX-ENEMIN)/BINSIZ + 1) 3カラムめ:reweight を開始したい反復回数の番号 4カラムめ:reweight を終了したい反復回数の番号。 通常、最終の反復まで用いる(= LOOPLI/RESETC) 4行目:1カラムめ:MD シミュレーションに用いた T0(SETTEM) 2カラムめ:生成したいカノニカル分布の温度の下限( > TEMMIN) 3カラムめ:生成したいカノニカル分布の温度の上限( > TEMMAM) 4カラムめ:温度きざみ。温度の上限―温度の下限を割り切れる数字にする。 5カラムめ:WHAM 解析の閾値。10-5 以下にとること。 準備した解析ツールと入力ファイルを使い、 % reweightFB.x で実行します。 myPresto 4.2 < inp_MUCA 105 出力ファイル ttt3 は、以下のようになります。例では、260 K でのカノニカル分布を再 現するのには、エネルギー21 kcal/mol∼61 kcal/mol の範囲において、2カラムめの確率 でトラジェクトリに出力された構造をサンプルすればカノニカル分布が再現されることを 示しています。 0.260000E+03 0.210000E+02 0.230000E+02 0.250000E+02 0.270000E+02 0.290000E+02 0.310000E+02 0.330000E+02 0.350000E+02 0.370000E+02 0.390000E+02 0.410000E+02 0.430000E+02 0.450000E+02 0.470000E+02 0.490000E+02 0.510000E+02 0.530000E+02 0.550000E+02 0.570000E+02 0.590000E+02 0.610000E+02 0.480194E-04 0.122335E-02 0.917415E-02 0.322814E-01 0.732955E-01 0.126560E+00 0.173496E+00 0.193453E+00 0.173022E+00 0.116629E+00 0.614765E-01 0.263826E-01 0.928163E-02 0.277370E-02 0.708900E-03 0.158080E-03 0.312139E-04 0.549539E-05 0.875144E-06 0.126766E-06 0.167411E-07 Sample6 では座標トラジェクトリからこの確率分布に従って、構造を抽出し代表構造を出力 する方法を説明します。 出力ファイル ttt3 のなかから再現したい温度の部分のみを切り出し、以下のようにエネル ギーと確率分布の2列のファイルにしておきます(pdf260_fb)。 0.210000E+02 0.230000E+02 0.250000E+02 (中略) 0.510000E+02 0.530000E+02 0.550000E+02 0.570000E+02 0.590000E+02 0.480194E-04 0.122335E-02 0.917415E-02 0.158080E-03 0.312139E-04 0.549539E-05 0.875144E-06 0.126766E-06 0.610000E+02 0.167411E-07 myPresto 4.2 106 5.5 Sample-5:拡張アンサンブル(Simulated Tempering McMD)−Alanine ペプチドの計算− (1)Simulated Tempering Multicanonical MD 計算 cosgene では、Simulated Tempering Multicanonical MD(S.T.McMD)の計算ができます。 ここでは sample4 と同じ系を用いて説明します。sample4 の手順に従ってエネルギー最小化 までの計算を行ってください。 S.T.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、S.T.McMD を指定してくださ い(EXPAND= SIMU)。次に、実現したいマルチカノニカル分布の温度範囲を設定します。例 では、TEMMIN= 250 K ∼ TEMMAX= 700 K の範囲を指定しています。エネルギーのヒストグ ラムのためのパラメータ ENEMIN、ENEMAX および BINSIZ は F.B.McMD の場合と同様にあらか じめ TEMMIN と TEMMAX での NVT 計算を行って決定します。 温度遷移幅ΔT は TEMMAX(最大温度)-TEMMIN(最低温度)を温度分割数(STTNUM)で割った 値となります。温度分割数(STTNUM)を大きくしてΔT を小さくすると自然な温度遷移が実 現しますが、すべての温度をサンプリングするために必要となる計算回数も増大します。 cosgene に実装した S.T.McMD では、温度遷移確率の計算にガイド関数(E-E0 )/kB T2 を利用 しています。ENEMIN と同様の方法で最低エネルギーE0 の概算値を求めパラメータ STEBAS に 設定します。MD シミュレーションを行う温度(T0= SETTEM)は、運動方程式を解く時の温 度で、TEMMIN < SETTEM < TEMMAX にとります。後は S.T.McMD の反復1回あたりのループ回 数(RESETC)と、データを 捨てるダミーループの回数(DUMMYL)を指示、全体のループ回数 (LOOPLI)を指定します。LOOPLI は、RESETC の整数倍にとってください。 ■制御ファイル ;stmcmd_vac.inp EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= (つづく) myPresto 4.2 FORM PDB READ PDB 30000000 50000.0D0 20 0.5D0 NAMETO= NAMECO= NAMEMO= NAMERE= ala_ala.tpl ala_min.pdb ala.mntinp ala_min.pdb CPUTIM= 3600000.0D0 107 (つづき) OUTTRJ= OUTCOO= OUTLOG= LOGFOR= 1000 1000 2000 DETA METHOD= RESETC= TEMMAX= ENEMIN= BINSIZ= SETTEM= LIMITS= STTNUM= STEBAS= EXPA 300000 700.0 -100.0 2.0 600.0 0.001 100 -100.0 INITIA= STARTT= RANDOM= NAMETR= NAMERO= NAMECO= NAMETO= BESTFI= STOPCE= BOTH EXPAND= DUMMYL= TEMMIN= ENEMAX= LIMITC= SIMU 1000 250.0 400.0 0.001 SET 600.0D0 654321 ala_st.mnt ala_st.rst ala_st.cor ala_st.eto YES CUTMET= DIEFUN= CALV15= CALE15= CALHYD= CALV5N= CALE5N= CALH5N= QUIT EXE> OUTPUT COORDINATE= QUIT RESA DIST MNTRTR= ASCI MNTRCO= MNTRTO= SING ASCI CUTLEN= DIEVAL= 99.0D0 4.0D0 CALC CALC NOCALC NOCALC NOCALC NOCALC PDB NAMECO= ala_st.pdb EXE> END S.T.McMD が 終 了 す る と 、 座 標 ト ラ ジ ェ ク ト リ フ ァ イ ル の他 に 、 expand.energy 、 expand.prob、expand.scale の3つのファイルが出力されます(デフォルト時)。通常のロ グファイルには参照温度が出力されますので、温度遷移の状態は、expand.energy を参照し ます(1カラム目:エネルギー、2カラム目:温度)。カノニカル分布を再現するための Reweighting による解析は、ツール reweightST(詳細は巻末「B ユーティリティ」を参照) と出力ファイル expand.energy により行われます。 myPresto 4.2 108 (2)カノニカル分布の再構成 解析ツール reweightST を準備します。以下のようにコンパイルしてください。解析は短 時間で終了しますので、最適化オプションは通常不要です。 % f90 reweightST.f90 ?o reweightST.x 入力ファイル inp_ST を次のように準備します。 カノニカル分布の再現には、このうち canonical ファイルが最も重要です。 expand.energy average canonical 2.0 250.0 700.0 9.0 1 29999000 600.0 1行目:入力ファイル名(デフォルト時 expand.energy) 2行目:出力ファイル名 1カラム目:平均エネルギー 2カラム目:reweight されたカノニカル分布の確率 3行目:1カラム目:S.T.McMD で指定した bin サイズ (=BINSIZ) 2カラム目:分布を出力する温度の下限( > TEMMIN) 3カラム目:分布を出力する温度の上限( < TEMMAX) 4カラム目:温度分割数。上限−下限をこの数に分割して計算・出力します。 4行目:1カラム目:サンプリング区間先頭(ダミーループ後からカウント) 2カラム目:サンプリング区間最後(ダミーループ後からカウント) 5行目:1カラムめ:参照温度、S.T.McMD で指定した SETTEM 準備した解析ツールと入力ファイルを使い、 % reweightST.x < inp_ST で実行します。 出力ファイル canonical は、以下のようになります。これは 362.5K(334.4 K-390.6K)で サンプリングされたエネルギーヒストグラムから作成したものであり 、エネルギー17 kcal/mol∼73 kcal/mol の範囲において、2カラムめの確率でトラジェクトリに出力された 構造をサンプルすれば分布が再現されることを示しています。 myPresto 4.2 109 (前略) 362.5000 0.170000E+02 0.190000E+02 0.210000E+02 0.230000E+02 0.250000E+02 0.270000E+02 (中略) 0.550000E+02 0.570000E+02 0.590000E+02 0.610000E+02 0.630000E+02 0.650000E+02 0.670000E+02 0.690000E+02 0.710000E+02 0.730000E+02 (後略) 0.482616E-06 0.144785E-05 0.231656E-04 0.209455E-03 0.121378E-02 0.491255E-02 0.655827E-02 0.320747E-02 0.141262E-02 0.610027E-03 0.256269E-03 0.112932E-03 0.448833E-04 0.164089E-04 0.337831E-05 0.144785E-05 Sample4 の F.B.McMD の時と同様この確率分布ファイルから再現したい温度の部分だけを切 り出しておき、Sample6 の構造の抽出とクラスタリングで利用します(pdf363_st)。 myPresto 4.2 110 5.6 Sample-6:拡張アンサンブル(Generalized ST McMD)−Alanine ペプチドの計算− (1)Generalized Simulated Tempering Multicanonical MD 計算 cosgene では、Generalized Simulated Tempering Multicanonical MD(G.S.T.McMD)の計 算ができます。この機能を用いると、Tsallis 分布に従ったサブアンサンブル間を自動的に 最適に推移することにより、広範なエネルギー分布の構造探索を実現することができます。 ここでは sample4 と同じ系を用いて説明します。sample4 の手順に従ってエネルギー最小化 までの計算を行ってください。 G.S.T.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、G.S.T.McMD を指定してく ださい(EXPAND= GST)。 G.S.T.McMD で特に重要なパラメータは、GSTBAS、GSTETA、GSTMIN、GSTMAX、GSTNUM です。 これらの設定により、サンプリングされるエネルギー範囲、用いるサブアンサンブルの数 が決まることとなるため後に再構成したい温度範囲を考慮して決定する必要があります。 まず、再構成したい温度範囲を含むようにやや 余裕を持って上限温度 (Tmax)、下限温度 (Tmin)を決め、予めこれらの上限、下限温度における NVT 計算により平均ポテンシャルエ ネルギーを求めておきます。 複数のサブアンサンブルのインデックスとなるλは GSTMIN∼GSTMAX を GSTNUM 個に分割 した離散値をとります。E0 :GSTBAS は計算中 E-E0 >0 を保障するためのものであるため Tmin でおこなった NVT 計算におけるポテンシャルエネルギーの最小値を参考に決定します。 T:実効温度、T0 :SETTEMP で指定する温度(参照温度)、η:GSTETA、E0:GSTBAS、E:ポテ ンシャルエネルギーとしたとき、 T/T0 =η+λ(E-E0 ) の関係がありますので、これが Tmin/T0 から Tmax/T0 までの値をとるようにパラメーターを 設定します。ηを Tmin/T0 程度の値に設定し、λが上限 GSTMAX をとったときに η+λ (Emax-E0 )が Tmax/T0 を上回るように GSTMAX 設定すればよいことになります(Emax は Tmax における NVT 計算時の平均ポテンシャルエネルギーを参考にする)。GSTNUM はサブアンサン ブル間の遷移が円滑に生じるよう系に合わせて設定します。 ENEMIN、ENEMAX および BINSIZ はポテンシャルエネルギーのヒストグラム作成のためのも のであり F.B.McMD の場合と同様に計算中に ENEMIN∼ENEMAX の範囲を超えないように Tmin と Tmax での NVT 計算の結果を参考に決定します。 インデックスλを最適に遷移させるため、RESETC ごとにλの重みの再計算が行われます。 系に合わせて十分な大きさの RESETC を設定する必要があります。GSTUPD はサブアンサンブ ル間の遷移を試すステップ間隔となります。 myPresto 4.2 111 ■制御ファイル ;gstmcmd_vac.inp EXE> INPUT TOPOLOGY= FORM NAMETO= ala_ala.tpl COORDINA= PDB NAMECO= ala_min.pdb OUTMONIT= READ NAMEMO= ala.mntinp REFCOORD= PDB NAMERE= ala_min.pdb QUIT EXE> MD LOOPLI= 20000000 SETTIM= 50000.0D0 CPUTIM=3600000.0D0 UPDATE= 20 TIMEST= 0.5D0 OUTTRJ= 1000 OUTCOO= 1000 OUTLOG= 2000 LOGFOR= DETA STOPCE= BOTH METHOD= EXPA EXPAND= GST SETTEM= 600.0 RESETC=100000 GSTCON=10000000 GSTBAS=0.0d0 GSTETA=0.3d0 GSTSAM=50000 MNTRXE=ASCI ENEMIN=0.0 ENEMAX=500.0 BINSIZ=0.5 GSTUPD=100 GSTMIN=0.001d0 GSTMAX=0.015d0 GSTNUM=40 INITIA= SET STARTT= 600.0D0 RANDOM= 654321 NAMETR= NAMERO= NAMECO= NAMETO= BESTFI= ala_gst.mnt MNTRTR= ASCI ala_gst.rst ala_gst.cor MNTRCO= SING ala_gst.eto MNTRTO= ASCI YES CUTMET= RESA DIEFUN= DIST CUTLEN= 99.0D0 DIEVAL= 4.0D0 (つづく) myPresto 4.2 112 (つづき) CALV15= CALC CALE15= CALC CALHYD= NOCALC CALV5N= NOCALC CALE5N= NOCALC CALH5N= NOCALC QUIT EXE>OUTPUT COORDINATE=PDB NAMECO=ala_gst.pdb QUIT EXE>END G.S.T.McMD が終了 すると 、座 標トラジェクトリファイル の他に 、expand.energy、 expand.scale ファイルが 出力されます 。ポテンシャルエネルギーの変 化については expand.energy の第1カラム、λの遷移の状態は第3カラムで確認できます。カノニカル分 布を再現するための Reweighting による解析は、ツール reweightGST(詳細は巻末「B ユー ティリティ」を参照)と出力ファイル expand.energy により行われます。 myPresto 4.2 113 (2)カノニカル分布の再構成 解析ツール reweightGST を準備します。以下のようにコンパイルしてください。解析は 短時間で終了しますので、最適化オプションは通常不要です。 % f90 reweightGST.f90 ?o reweightGST.x 入力ファイル inp_GST を次のように準備します。 カノニカル分布の再現には、このうち ttt3 ファイルが最も重要です。 expand.energy lambda-pdf lambda-ene-pdf ttt1 ttt2 ttt3 ttt4 0.5 0.001d0 0.015d0 40 0.0d0 0.3d0 1 18000000 250.0 700.0 50.0 600 1行目:入力ファイル名(デフォルト時 expand.energy) 2行目:出力ファイル名 1カラム目:λの分布 2カラム目:λごとのエネルギー分布 3行目:出力ファイル名 1カラム目:分配関数 2カラム目:エネルギー、density of state の指数、全確率 3カラム目:エネルギー、reweight されたカノニカル分布の確率 4カラム目:温度、平均エネルギー、平均エネルギーの二乗、比熱 4行目:1カラム目:G.S.T.McMD で指定した bin サイズ (=BINSIZ) 2カラム目:λの下限(=GSTMIN) 3カラム目:λの上限(=GSTMAX) 4カラム目:λの分割数(=GSTNUM) 5カラム目:ベースエネルギー(=GSTBAS) 6カラム目:η(=GSTETA) 5行目:1カラム目:サンプリング区間先頭 2カラム目:サンプリング区間最後(<LOOPLI-GSTNUM*GSTSAM) はじめに GSTNUM*GSTSAM ステップ分の予備的サンプリングを行うため。 6行目:1カラム目:生成したいカノニカル分布の温度の下限 2カラム目:生成したいカノニカル分布の温度の上限 3カラム目:温度きざみ。 4カラム目:MD シミュレーションに用いた T0(SETTEM) myPresto 4.2 114 準備した解析ツールと入力ファイルを使い、 % reweightGST.x < inp_GST で実行します。 出力ファイル(この例での ttt3)は、以下のようになります。構造トラジェクトリから、 第一カラムに示されるエネルギーの構造を2カラム目の確率でサンプルすれば 300K のカノ ニカル分布が再現されることを示しています。 (前略) 0.300000E+03 0.137500E+02 0.142500E+02 (中略) 0.577500E+02 0.582500E+02 0.587500E+02 0.592500E+02 (後略) 0.234968E-07 0.836684E-07 0.658355E-07 0.430977E-07 0.279324E-07 0.181532E-07 Sample4 の F.B.McMD の時と同様この確率分布ファイルから再現したい温度の部分だけを切 り出し Sample7 の構造の抽出とクラスタリングで利用できます。 myPresto 4.2 115 5.7 Sample-7:拡張アンサンブル−構造の抽出とクラスタリング− (1)再構成したカノニカル分布を用いた構造の抽出 Sample-4(F.B.McMD), Sample-5(S.T.McMD) お よ び Sample-6(G.S.T.McMD) に お い て reweight により任意の温度でのエネルギー分布を計算しました。ここではそのエネルギー 分布を満たすように、トラジェクトリファイルから座標を抽出します。 構造の抽出には解析ツール selection を用います(詳細は巻末「B ユーティリティ」を 参照)。次の入力ファイルを用意します(select.inp)。 pdf363_st ala_st.cor S 1000 30000000 0.5 ala_st_363.cor 32 第1行目に、Sample-4, Sample-5 あるいは Sample-6 の最後で作成したエネルギー確率分 布ファイルを指定します。 第2行目は MD 実行時に出力されたトラジェクトリファイルを指定します。 第3行目はトラジェクトリファイルの型(Single │ Double)です。MD 実行時の指定と一致 させます。 第4、5行目でサンプリング区間を指定します。 第6行目で抽出する構造の割合(%)を指定します。サンプリング区間の構造のうちこ こで指定した割合の構造が出力されます。 第7行目で出力トラジェクトリファイル名を指定します。 第8行目で原子数を指定します。 % selection < select.inp で実行します。 myPresto 4.2 116 (2)構造のクラスタリング 次に、(1)でカノニカル分布を構成するように抽出した多数の構造からクラスタ解析に より代表構造を取り出す方法を説明します。構造間の RMSD を用いてクラスタリングを行い ます。 クラスタ解析には解析ツール clustering を使用します(詳細は巻末「B ユーティリティ」 を参照)。 まず、以下のような制御ファイル(clustering.inp)を用意します。 ala_ala.tpl y ala_ala.fit y ala_ala.rmsd 400 10 1 500 ala_st_363.cor S average ala_st_363.cls ala_st_363.tree 第1行目にトポロジーファイルを指定します。 第 2 行目には RMSD 計算時の bestfit 適用の有無を指定します(y │ n)。 bestfit の実行を指定したときは次行に bestfit に使用する原子を指定するファイルの名 前を記述します。 ここでは ala_ala.fit として下記の内容のファイルを用意します。この例ではチェイン 1 の残基1−4の水素を bestfit に使用しないよう設定しています。この記述形式は cosgene の系の重心合わせ指定用ファイルと同じです。詳細は A.2.11 をご参照ください。 SETBST> LIST FIX 1 1 1 4 H* YES; myPresto 4.2 117 第4行目には RMSD の計算に使用する原子の指定の有無を記述します(y │ n)。指定する 場合に は次 行に RMSD の計 算に 用い る原 子の 指定フ ァ イ ル名 を記 述し ま す。 今回は ala_ala.fit と同内容のものを ala_ala.rmsd として用います。bestfit、RMSD に使用され た原子は実行時のログで確認できます。 第6行目にはクラスタリングに使用する構造数を指定します。系にもよりますが 1000 個 以内程度で指定します。第7行目には最終的なクラスタの数を指定します。 第8、9行目で使用する座標トラジェクトリの範囲の開始・終了位置を指定します。 このトラジェクトリの範囲は第6行目に指定した構造数を確保できるように指定します。 また、先ほど select ツールにより取り出した構造数の範囲内で指定します。 第10行目に座標トラジェクトリのファイル名を指定します。今回は select ツールによ りカノニカル分布を再現したトラジェクトリファイルを使用します。 第11行目にはトラジェクトリファイルの形式を指定します。(S │ D) 第12 行目に は ク ラ ス タ リ ン グ の方 法を 記述 します (”nearest”│ “furthest”│ “median” │ “centroid”│ “average”│ “flexible”│ “ward”)。 ここで flexible を指定した場合は次行にβ値を設定します。 第13行目には出力 PDB ファイルの先頭名を指定します。 第14行目には出力デンドログラムのファイル名を指定します。 % clustering < clustering.inp で実行します。ログ出力のうちクラスタごとに出力された構造数、平均構造との RMSD がク ラスタの特徴をよく表します。 (前略) CLUSTER ID STRUCTURE COUNT LOOP NUMBER RMSD OF AVERAGE OUTPUT PDB FILE : 1 : 32 : 16969000 : 1.44551613437161 :ala_st_363.cls.16969000 CLUSTER ID STRUCTURE COUNT LOOP NUMBER RMSD OF AVERAGE OUTPUT PDB FILE : 2 : 32 : 8055000 : 1.87505849035797 :ala_st_363.cls.8055000 (後略) 指定したクラスタ個数の構造(PDB 形式)のほか、デンドログラムファイル(PHYLIP 形式) が出力され汎用的なツールを用いて表示することができます。デンドログラムは二つの構 造(またはクラスター)とその間の RMSD からなる3分木で表示されます。 myPresto 4.2 118 23.2573910252864 7.66306178006837 3.26001926531007 79000 44.7507362365723 LOOP 79000, E=44.75 5346000 41.2941055297852 LOOP 5346000, E=41.29 1.88731415528864 RMSD 8076000 47.0816841125488 22555000 49.8077392578125 1.21994863853140 17713000 43.7229232788086 myPresto 4.2 119 5.8 Sample-8:低分子トポロジーの生成 −Methanol の計算− (1)計算入力ファイルの準備 蛋白質、ヌクレオチドのトポロジーファイルの作成は tplgene で行います。これに対し、 低分子化合物のトポロジーファイルを作成する場合は tplgeneL を使用します。 低分子のトポロジーファイルを作成するには、大きく分けて、2 種類の方法があります。 方法1:量子化学計算で得られた電荷情報、結合次数情報、座標情報を基にして"tplgeneL オリジナル形式ファイル"を作成し、そのファイル群を用いて計算する方法 方法2:"Sybyl mol2"ファイルを準備し、そのファイル内の電荷情報の項目に値を入力し、 その結果のファイルを用いて計算を行う方法 以下の説明では、tplgeneL の環境変数が次のように設定されているものとします(設定方 法は「3.2.6 環境変数」参照)。 TPLL_INPUT_PATH ⇒ ./ カレントディレクトリ TPLL_OUTPUT_PATH ⇒ ./ カレントディレクトリ TPLL_DB_PATH ⇒ /home/user01/myPresto/tplgeneL/DB tplgeneL 力場パラメータ DB 用ディレクトリ 【注意】tplgeneL オリジナル形式ファイルの作成ツールとして、GAMESS の出力用と、 Gaussian の出力用の 2 種類があります。 (詳細は「B.8 Gamess2tplinp」および「B.9 Gauss2tplinp」を参照) (2)tplgeneL オリジナル形式ファイルからトポロジーファイルを生成させる場合 ここでは、量子化学計算プログラム GAMESS による計算結果を基にトポロジーファイルを 作成する方法を説明します。 ■実行方法 ① まず始めに methanol 分子の量子化学計算を行います。GAMESS で methanol 分子の計算を 行い、計算結果の出力ファイルを"methanol.log"とします。 ② ツール Gamess2tplinp を使用して、①で得られた"methanol.log"ファイルから tplgeneL オリジナル形式ファイルを作成します。 実行ディレクトリで、"Gamess2tplinp methanol.log"とタイプします。今回の場合には、 "methanol.charge"、"methanol.bond"、"methanol.zmat"の 3 種類のファイルが作成されま myPresto 4.2 120 す。 %Gamess2tplinp methanol.log ③ ②で得られたファイルを入力ファイル用ディレクトリにコピーします。 ④ tplgeneL を実行します。引数なしで "tplgeneL" とタイプして対話型で起動します。 %tplgeneL ⑤ 順次、ファイル形式、入力ファイル名、不足パラメータの補填方法、力場パラメータ DB 名、フラグメント DB を使用するか否か、を入力します。 ■実行例 Please select Input File Format by the next number! 1 : tplgeneL original (*.bond,*.charge,*.zmat) 2 : Sybyl mol2 (*.mol2) 1 Please select Input File Name! ./ ala.bond ala.zmat methanol.mol2 phenylalanine.charge ala.charge methanol.bond methanol.zmat phenylalanine.zmat ala.mol2 methanol.charge phenylalanine.bond xylitol.bond methanol xylitol.charge xylitol.zmat What processing do you do if there is a missing parameter? Please select 1 or 2! (default : 1) 1 : use default parameters. 2 : calculate parameters. 3 : use default parameters, when default parameters exist. use calculated parameters, when default parameters don't exist. 1 Please select Input DB Name(prm_gaff.db/prm_amber99.db)! (default : prm_gaff.db) /home/user01/myPresto/tplgeneL/DB angle.prm bond.prm nonbond_amber99.db prm_gaff.db atomtype_amber99.db frg_amber99.db nonbond_gaff.db atomtype_gaff.db frg_gaff.db prm_amber99.db prm_gaff.db Do you want to use FragmentDB ? (yes(y)/no(n) default : no) no %% Program is done. %% %% This program ended normally. %% (3)Sybyl mol2 形式ファイルからトポロジーファイルを生成させる場合 ここでは、トポロジーファイルを作成したい低分子化合物の Sybyl mol2 形式ファイルか myPresto 4.2 121 らトポロジーファイルを作成する方法を説明します。 ■実行方法 ① トポロジーファイルを作成したい低分子化合物の Sybyl mol2 形式ファイルを準備しま す。ここでは methanol に関する mol2 形式ファイル"methanol.mol2"とします。環境変数で 設定した入力ファイルディレクトリに、"methanol.mol2"を置きます。 ② tplgeneL を実行します。引数なしで "tplgeneL" とタイプして対話型で起動します。 %tplgeneL ③ 順次、ファイル形式、入力ファイル名、不足パラメータの補填方法、力場パラメータ DB 名、フラグメント DB を使用するか否か、を入力します。 【注意】tplgeneL には水素原子の欠損している場合の付加機能はありませんので、水素原 子情報を含む mol2 形式ファイルを準備する必要があります。 myPresto 4.2 122 ■実行例 Please select Input File Format by the next number! 1 : tplgeneL original (*.bond,*.charge,*.zmat) 2 : Sybyl mol2 (*.mol2) 2 Please select Input File Name! ./ ala.bond ala.zmat methanol.mol2 phenylalanine.charge ala.charge methanol.bond methanol.zmat phenylalanine.zmat ala.mol2 methanol.charge phenylalanine.bond xylitol.bond methanol What processing do you do if there is a missing parameter? Please select 1 or 2! (default : 1) 1 : use default parameters. 2 : calculate parameters. 3 : use default parameters, when default parameters exist. use calculated parameters, when default parameters don't exist. xylitol.charge xylitol.zmat 1 Please select Input DB Name(prm_gaff.db/prm_amber99.db)! (default : prm_gaff.db) /home/user01/myPresto/tplgeneL/DB angle.prm bond.prm nonbond_amber99.db prm_gaff.db atomtype_amber99.db frg_amber99.db nonbond_gaff.db atomtype_gaff.db frg_gaff.db prm_amber99.db prm_gaff.db Do you want to use FragmentDB ? (yes(y)/no(n) default : no) no %% Program is done. %% %% This program ended normally. %% myPresto 4.2 123 5.9 Sample-9:自由エネルギー計算(Filling Potential 法)−水中のメタンの計算− (1)Filling Potential 法による自由エネルギー計算手順 Filling Potential の計算では、対象の 2 分子が結合した安定な状態を初期構造にします。 この結合状態にある分子のうち片側に、アンブレラポテンシャルを発生させ、分子運動を させます。この運動の際に、ランドマークとする原子の軌跡を記憶しておき、次の計算時 には前の軌跡の周辺に反発型のポテンシャルをとります。これにより、次の計算では過去 の軌跡ではない新しい軌跡をとることができるため、ポテンシャル障壁を乗り越えるよう な計算を行うことができます。 この操作を繰り返し行っていき、分子が完全に解離状態になった時点で、今まで辿ってき た軌跡を WHAM 解析することで、自由エネルギー差を求めることができます。 ① アンブレラポテンシャルを加えた MD 計算を行う。 ② 軌跡の周辺に、次回の MD 計算のアンブレラポテンシャルを発生させる。 ③ ランドマーク原子の軌跡を抽出し、保存する。 ④ ①∼③の操作を解離状態になるまで繰り返す。 ⑤ これまでの軌跡に対して、WHAM 解析を行う。 md_w.inp 解離状態になるまで 繰り返して計算を行う。 MD 計算 Generate_nextFP.inp アンブレラポテンシャルの発生 Extract_atom.inp ランドマーク原子の軌跡を抽出 ganzine.sh(スクリプト) WHAM_analysis.inp WHAM 解析 図.Filling Potential 法による自由エネルギー計算手順 myPresto 4.2 124 (2)サンプル入力ファイル解説 ・初期座標構造(ch42w.pdb) :使用する系の初期構造を PDB 形式で用意します。 ・MD 計算入力(md_w.inp) :Filling Potential による MD 計算用の入力です。 ・アンブレラポテンシャル更新プログラム入力:アンブレラポテンシャルの更新を行う (Generate_nextFP.inp) プログラムの入力ファイル。 ・ランドマーク原子の軌跡抽出プログラム入力:ランドマークにしている原子の軌跡を、 (Extract_atom.inp) 全体の軌跡ファイルから抽出する プログラムの入力ファイル。 ・アンブレラポテンシャルファイル:アンブレラポテンシャルの位置情報ファイル。 (newopt_fp、newopt_fp_ini) 計算が進むにつれて更新される。 ・計算全体を実行するスクリプト :Filling Potential の3種類のプログラムを連続 (ganzene.sh) に実行するためのスクリプト。 ・WHAM 解析プログラム入力雛形 (WHAM_analysis.head) :スクリプトにより計算された軌跡ファイルを WHAM 法により解析するプログラムの入力ファイル雛形。 【注意】別な系を計算する場合に最低限修正すべき箇所を、以下の入力ファイル例では、 太字で表示しています。 (3)アンブレラポテンシャルを加えた MD 計算(cosgene) cosgene 制御ファイルの EXE> MD グループに"CALUMB=CALC"と"NAMEUM=newopt_fp"を指定 し、アンブレラポテンシャルを加えた MD 計算を行います。 (4)アンブレラポテンシャルの発生(Generate_nextFP ツール) 最初のアンブレラポテンシャルの中心座標は、"newopt_fp_ini"記述します。計算過程中の アンブレラポテンシャルの座標と、その時点でのディメンションは、"newopt_fp"に記載し ています。"newopt_fp"ファイルは次回の MD の計算の入力にもなっています。 ■アンブレラポテンシャルファイル FILL>GAUS 1 1 6 0.000 0.0300 ATOM 6 CA myPresto 4.2 ; アンブレラポテンシャルの形状指定(GAUSのみ) ; アンブレラポテンシャルのネスト数と対象原子数 ; ランドマーク原子の原子番号 ; ガウス型ポテンシャルの高さ ; ガウス型ポテンシャルの幅 ACE 2 0.000 0.000 −2.000 ; ポテンシャルの中心座標 125 【注意】ポテンシャルの中心座標の後には、何も記載しないようにしてください。 計算エラーが発生します。 次回の MD 計算のためのアンブレラポテンシャルファイルは、直前の MD 計算結果の軌跡フ ァイルから、Generate_nextFP ツールを使用して発生させることができます。このツールは 前の軌跡の座標点には移動しないように、次のアンブレラポテンシャルを発生させるツー ルです。さらに、最終的なアンブレラポテンシャルの座標も同時に設定します。 ■Generate_nextFP ツールの入力(Generate_nextFP.inp) newopt_fp newopt_fp2 initial.pdb xx_traject.cor -1000 2000 s n HAR1 300.0 0.3 0.0 0.0 3.000 5.0 0.20 ATOM 4131 O ; ; ; ; ; ; ; ; ; ; ; ; ; ; アンブレラポテンシャルファイル 次のアンブレラポテンシャルファイル 初期座標 トラジェクトリファイル名 トラジェクトリ読み飛ばし回数 トラジェクトリの読み込み回数 座標トラジェクトリファイルの形式( “s”ingle or “d”oubule ) PDB ファイルの画面表示 求心関数の形状 対象の温度 ガウス型反発関数の高さ RMSD による移動距離の調整パラメータ ガウス型反発関数の幅 求心関数の高さ ; 求心関数の幅 WAT 839 0.000 0.000 -6.000 16.00 -0.83 ; アンブレラポテンシャルの中心の目標座標(PDB 形式) Target Molecule A Umbrella Potential 2nd Potential Target Umbrella Potential 1st 一度経験した座標には、アンブレ CH4 CH4 CH4 X ラポテンシャルが 発生し て そ の 座標には戻れなくなる。 Target Molecule B dissociation myPresto 4.2 126 (5)ランドマーク原子の軌跡の抽出(Extract_Atom ツール) Extract_Atom ツールを使用して、MD 計算中に出力される軌跡ファイルとアンブレラポテ ンシャルの記述ファイルから、ランドマークとなる原子の軌跡を抽出します。 ■Extract_Atom ツールの入力(Extract_Atom.inp) newopt_fp 1033 ; 全原子数(初期構造ファイルを tail コマンドなどで確認) 1 ; 読み込むトラジェクトリーの数 xx_traject.cor xx_cont.cor ; 読み込むトラジェクトリ名_出力トラジェクトリ名 0 ; 座標の読み飛ばし回数 2000 ; 座標の読み込み回数 s ; 座標トラジェクトリファイルの形式( “s”ingle or “d”oubule ) 【注意】座標の読み込み回数値は、あまり大きな値を使用すると、エラーが発生します。 エラーが発生した場合には、この値を変化させてみてください。この値は MD 計算の設定フ ァイルの記述に依存します。 (6)計算全体を実行するスクリプト(ganzene.sh) Filling Potential の3種類のプログラム(MD 計算、アンブレラポテンシャルの発生、ラ ンドマーク原子の抽出)を繰り返し行います。他の入力とファイル名の整合性を確認して ください。 ■スクリプト(ganzene.sh) #!/bin/csh # program directory set cosgene=/user1/myPresto/cosgene/bin/cosgene ; この部分は御使用の環境にあわせて、変更して使用してください。 cp ch42w.pdb initial.pdb ; 初期構造の設定 : rm xx_traject.cor @ cycle1 = 60 ; 計算のサイクル数 @ counter = 1 ; カウンターの初期化 cp newopt_fp_ini newopt_fp ; 初期のアンブレラ ファイルを設定 (つづく) myPresto 4.2 127 (つづき) ; # program directory set cosgene=/user1/myPresto/cosgene/bin/cosgene この部分は御使用の環境にあわせて、変更して使用してください。 while ($counter < $cycle1) $cosgene < md_w.inp > ; ループ 設定 output ; MD計算の実行コマンド while (! -e final.pdb) sleep 10 end sleep 30 ; ループによりMD計算が終了するまで、 ; 次のステップにすすまないように設定 ; ; cp final.pdb mv output ; 最終構造のコピー ; MD計算の出力のコピー $GeneFPx < w_$counter.pdb w_$counter.output $GeneFPinp > GeneFP.out ; アンブレラポテンシャルの 更新 while (! -e newopt_fp2) sleep 2 end mv newopt_fp2 newopt_fp $Extractx < $Extractinp ; 出力を次のアンブレラポテンシャルの ; 初期座標ファイルとしてコピーする。 > Extract.out ; ランドマーク 原子の抽出 while (! -e xx_cont.cor) sleep 3 end sleep 2 mv xx_cont.cor w_$counter.cor mv final.pdb initial.pdb ; 抽出したトラジェクトリの保存 ; 最終構造を次の計算の初期構造と ; してコピーする myPresto 4.2 128 (7)WHAM 解析(WHAM_analysis ツール) 抽出したランドマーク原子の軌跡ファイルを解析して、WHAM 法により自由エネルギーの計 算を行います。軌跡ファイルの重なりが不十分な場合には、出力の数値がされない場合が ありますので、注意してください。また、エネルギーを平均する半径も、系の大きさなど に合わせて、調整をおこなってください。 ■WHAM_analysis ツールの入力(WHAM_analysis.inp) w_60.option ; 最終世代のアンブレラポテンシャルファイル 0 ; ファイルの読み飛ばし回数 2000 ; サンプリングする回数(MD 計算と、Extract の数に依存) s ; 読み込みファイルの精度( “s”ingle or “d”oubule ) 1.0 ; エネルギーを平均する半径 1000 ; WHAM の反復解法の回数 300.0 ; 計算温度 m ; メモリ優先か、速度優先かの選択 60 ; トラジェクトリファイルの個数 w_1.cor w_1.option ; 各世代のトラジェクトリとアンブレラポテンシャル記述ファイル w_2.cor w_2.option ; 全ファイル名を 1 行ずつ記入する。 : w_60.cor w_60.option 自由エネルギーの計算は、入力ファイルの下から 2 個目の設定値であるエネルギーを平均 化する半径内のデータ点を計算します。目的の範囲に併せて設定値の調整を行ってくださ い。解析された結果は、OUT ファイルの最後の部分に出力されます。 ■出力ファイル例 INFORMATION> WHAM ANALYSIS RESULT EXP-ID R.M.S.D(A) AVERAGE FREE-ENERGY 1 0.000000 0.000009425 0.712812629E+01 2 0.500101 0.000002134 0.804317891E+01 3 0.410962 0.000006086 0.739754038E+01 4 0.859058 0.000002663 0.790654353E+01 : : : : : : (構造のずれ値) (存在確率分布(P(ξ)) (自由エネルギー値) 最終的に出力された自由エネルギーの値をプロットして、PMF を表記します。自由エネルギ ーの計算は以下の式に基づいて計算されています。 F(ξ) = −kTlnP(ξ) myPresto 4.2 129 ここでkと T は計算の設定に依存する定数です。各サイクルの計算において変動するのは P(ξ)の値になります。存在確率が十分でない場合には、自由エネルギーの計算はおこなわ ずに、’-----------------------‘のようにエラー表示になります。この場合には、エネ ルギーを計算する領域を広げるなどして、十分な重なりを得られるように全体を計算しな おす必要があります。 【注意】WHAM 解析プログラムにはメモリを大量に使用します。一部の計算機環境において は、StackSize などの制限が行われていると思われますので、できるだけ大きめの StackSize を設定して計算を実行してください。 【注意】Sample9 の WHAM 解析は、Wham_Analysis.f90 の代わりに、Wham_AnalysisSample.f90 を用いて実行します。これは反応座標を初期座標からの RMSD ではなく分子間距離にするた めです。 myPresto 4.2 130 5.10 Sample-10:RESPA 法 マルチタイムステップ(RESPA)を用いた MD シミュレーションを説明します。まず、積 分方法を multi-time step(INTEGR= MTS)に設定してください。タイムステップ(= TIMEST) は通常 0.5 fsec 程度にとってください。これが最も内側の短いタイムステップになります。 マルチタイムステップは3重になっており、最内側のループはタイムステップ TIMEST、2 番目のループはタイムステップ TIMEST×FREQME、一番外側のループはタイムステップ TIMEST×FREQME×FREQLO で積分されます。相互作用は CALC で指定される項が最内側のルー プで、MEDI で指定される項が2番目のループで、LONG で指定される項が一番外側のループ で更新されます。通常、 結合・角部分を短いステップで(CALBON= CALC、CALANG= CALC)、 二面角の項を中間のステップで(CALTOR= MEDI, CALIMP= MEDI)、静電・van der Waals 相互 作用を遅いステップで (CALV14= LONG, CALE14= LONG, CALV15= LONG, CALE15= LONG)積分 するのが効果的です。 【注意】RESPA は、運動方程式をマルチステップで解く方法なので、エネルギー最小化に用 いることはできません。また、SHAKE や剛体モデルとともに用いることはできません。 ■制御ファイル EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= QUIT EXE> MD LOOPLI= INTEGR= TIMEST= FREQME= FREQLO= FORM PDB READ PDB 2000 MTS 0.5D0 2 2 NAMETO= NAMECO= NAMEMO= NAMERE= SETTIM= UPDATE= OUTTRJ= OUTLOG= LOGFOR= 500.0D0 20 100 200 DETA METHOD= SETTEM= INITIA= STARTT= RANDOM= CANONICAL 300.0D0 SET 300.0D0 654321 (つづく) myPresto 4.2 ; ; ; ; vas-dih.tpl vas_min.pdb vas.mntinp vas_min.pdb RESPA 法を指定 最内側のタイムステップ 最内側×2 最内側×2×2 CPUTIM= 3600000.0D0 STOPCE= BOTH 131 (つづき) NAMETR= vas_vac.mnt BESTFI= YES CUTMET= RESA DIEFUN= DIST CALBON= CALANG= CALTOR= CALIMP= CALV14= CALE14= CALV15= CALE15= CALC CALC MEDI MEDI LONG LONG LONG LONG CALHYD= CALV5N= CALE5N= CALH5N= QUIT NOCALC NOCALC NOCALC NOCALC EXE> OUTPUT COORDINATE= QUIT PDB MNTRTR= ASCI CUTLEN= DIEVAL= 99.0D0 4.0D0 ; ; ; ; ; ; ; ; 短い 短い 中間 中間 長い 長い 長い 長い NAMECO= vas_md.pdb EXE> END myPresto 4.2 132 5.11 Sample-11:RATTLE −水中のインドメサシンの計算− myPresto では、Velocity-Verlet 法と SHAKE 法を同時に指定することで RATTLE 法が実行 され、位置座標および速度の両方に拘束をかけることができます。 ここでは水中のインドメサシンの系について、水分子とインドメサシンに RATTLE 法を適 用した Velocity-Velret 法による MD 計算を行います。 (1)分子の準備 インドメサシンの構造は、他の分子構築ソフトによって作成してください。サンプルでは、 indo.pdb として、インドメサシンの立体構造を PDB ファイル形式で既に準備してあります。 また、インドメサシンの Gaussian98 による計算結果を indo_g98.out に用意してあります。 まず、Gauss2tplinp により indo.charge/indo.bond を準備し、RESP 指定ファイル resp.in によって RESP 電 荷を計 算し ま す。RESP 電荷計算ツールは 、AMBER のホームページ (http://amber.scripps.edu/)より取得できます。RESP 電荷を計算し、indo.charge の電 荷の値を修正するか、mol2 ファイルの電荷の項に RESP 電荷を代入した後、tplgeneL によ ってトポロジーファイルを作成してください。これらにより作成したインドメサシンの座 標、トポロジーファイル、mol2 ファイルを indo.pdb, indo.tpl, INDO.mol2 とします。 次に、水付加ツール setwater により、インドメサシンの重心を中心に半径 12Åで TIP3P を CAPwater として付加し、その PDB ファイルを indo_w.pdb とします。TIP3P のトポロジーフ ァイルは、tip3p.tpl なので、indo.tpl に添付ツール mergetpl でトポロジーファイルを統 合し、インドメサシン+TIP3P 水系のトポロジーファイル indo_w.tpl を作成します。 なお、水中での計算を行なうにあたり、境界条件を設定するファイル indo_w.capbc を準備 し、CAP 拘束の条件をコントロールファイルに記載してください。 myPresto 4.2 133 (2)拘束対象の指定 RATTLE 法の拘束対象指定は SHAKE 法と同様に、SHAKE ファイルを用いて行います。添付ツ ール SHAKEinp によって、indo_w.pdb, indo_w.tpl から SHAKE 拘束ファイル indo_w.shk を 作成します。 (SHAKE ファイルの詳細は「A 入出力ファイル」、SHAKE ファイルの節を参照してください) ■SHAKE ファイル(indo_w.shk) SHAKE> SHAKE indo 4 2 1.1126 1.8434 3 4 5 ->; C LGD H LGD 1.1126 1.1135 1.8025 1.8038 2 1.1034 7 8 ->; C LGD H LGD 2 1.0998 9 10 ->; C LGD H LGD 2 1.1015 16 17 ->; C LGD H LGD 2 1.1023 18 19 ->; C LGD H LGD 2 1.1026 22 23 ->; C LGD H LGD 2 1.1020 24 25 ->; C LGD H LGD 4 1.1123 27 28 29 30 ->; C LGD H LGD 1.7800 1.1127 1.1123 1.8098 1.8049 2 1.0977 33 3 1.1123 35 36 37 ->; 1.7944 1.1137 34 ->; C SHAKE> SHAKE WAT 3 1 2 3 0.95720 1.51360 0.95720 LGD H C -> H LGD H LGD H LGD H LGD LGD LGD ; O H LGD H1 H LGD H2 WAT myPresto 4.2 134 (3)制御ファイル RATTLE 法を使用する際には、Velocity-Verlet 法と SHAKE 法を同時に指定します。全て の H 原子に RATTLE が適用される場合、タイムステップ(TIMEST)は、0.5∼2.0fsec にとれ ます。 ■制御ファイル(rattle.inp) EXE> INPUT TOPOLOGY= COORDINA= SETBOU= SETSHAKE= NAMESH= QUIT EXE> MD INTEGR= SHAKEM= LOOPLI= SETTIM= CPUTIM= UPDATE= TIMEST= OUTCOO= OUTTRJ= OUTLOG= LOGFOR= STOPCE= METHOD= THERMO= SETTEM= INITIA= STARTT= RANDOM= CALCAP= RADCAP= FORCAP= FUNCAP= SETCEN= CUTMET= DIEFUN= CALV15= CALHYD= CALE5N= QUIT EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 FORM NAMETO= indo_w.tpl PDB NAMECO= indo_w.pdb READ NAMEBO= indo_w.capbc READ ; SHAKE ファイル読み込み指定 indo_w.shk ; SHAKE ファイル名指定 VELO ; Velocity-Verlet 法の指定 ALLB ; SHAKE 方法の指定 10000 5000.0D0 3600000.0D0 20 2.0D0 1000 1000 1000 DETA TRAN CANONICAL NOSE 300.0D0 SET 300.0D0 654321 CALC 10.0 50.0 HARMonic YES RESA CONS CALC NOCALC NOCALC CUTLEN= DIEVAL= CALE15= CALV5N= CALH5N= 12.0D0 1.0D0 CALC NOCALC NOCALC PDB NAMECO= indo_wmd.pdb 135 5.12 Sample-12:Rigid −水中のインドメサシンの計算− ここでは水中のインドメサシンの系について、インドメサシンの水素原子および水分子 に剛体モデルを適用した MD 計算を行います。なお、水分子の剛体モデルは、現在 TIP3P model と TIP4P model を計算することができます。TIP4P model では、電荷の点の質量がゼロであ るため、剛体モデル以外では扱うことができません。 【注意】剛体モデルは、Velocity-Verlet 法による計算時のみ有効です。 (1) ファイルの準備 入力ファイルは、前述の Sample-11 と同様に行ってください。TIP4P water の発生も、水 分子付加ツール setwater で行うことができます。トポロジーファイルには、水分子のトポ ロジーファイル tip4p.tpl を mergetpl にて挿入してください。TIP4P には分子内の力場パ ラメーターが記載されていますが、剛体モデルでは使用されません。 (2)剛体モデルの指定 剛体モデルの拘束対象指定は剛体モデルファイルを用いて行います。 添付ツール RIGIDinp によって、indo_w.tpl, tip4_rig.model から剛体モデルファイル indo_w4.rig を作成します。 (剛体モデルファイルの詳細は「A 入出力ファイル」、剛体モデルファイルの節を参照し てください) ■剛体モデルファイル(indo_w4.rig) RIGID> indo 4 2 2 2 2 2 2 4 2 3 NUMBER 2 7 9 16 18 22 24 27 33 35 3 8 10 17 19 23 25 28 34 36 RIGID> COOR WAT 4 -> 1 0.000 2 0.757 3 -0.757 4 0.000 4 5 29 30 37 0.000 0.586 0.586 0.150 0.000 -> 0.000 -> 0.000 -> 0.000 myPresto 4.2 136 (3)制御ファイル 剛体モデルを使用する際には、制御ファイルの MD フェーズで剛体モデルの使用および剛 体モデルファイル名を指定する必要があります。 (剛体化されていない H 原子が系内に残っている場合は、タイムステップ (TIMEST)を 0.5fsec 程度にとってください。) ■制御ファイル(rigid.inp) EXE> INPUT TOPOLOGY= COORDINA= SETBOU= QUIT EXE> MD RIGIDM= NAMERM= INTEGR= LOOPLI= SETTIM= CPUTIM= UPDATE= TIMEST= OUTCOO= OUTTRJ= OUTLOG= LOGFOR= METHOD= SETTEM= INITIA= STARTT= RANDOM= CALCAP= RADCAP= FORCAP= FUNCAP= SETCEN= CUTMET= DIEFUN= CALV15= CALHYD= CALE5N= QUIT EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 FORM PDB READ NAMETO= NAMECO= NAMEBO= YES indo_w4.rig VELO 10000 5000.0D0 3600000.0D0 20 2.0D0 1000 1000 1000 DETA CANONICAL 300.0D0 SET 300.0D0 654321 CALC 10.0 50.0 HARMonic YES RESA CUTLEN= CONS DIEVAL= CALC CALE15= NOCALC CALV5N= NOCALC CALH5N= PDB NAMECO= indo_w4.tpl indo_w4.pdb indo_w4.capbc ; 剛体モデル使用指定 ; 剛体モデルファイル名指定 ; Velocity-Verlet 法の指定 12.0D0 1.0D0 CALC NOCALC NOCALC indo_w4md.pdb 137 5.13 Sample-13:NPT と PME を用いた周期系の計算 −水中のメタンの計算− 【Andersen の方法】 水で満たされたユニットセルにメタン分子が2個入った周期境界条件の系を、NPT アンサ ンブル、Andersen の方法で計算します。 系は、2 個のメタンの周囲にツール set_water で水分子を発生させます。立方体ユニット セルのサイズは各辺 18.64775Åとします。 NPT の計算では、原理的に SHAKE を用いることができません。ここでは、All Atom での 計算を行ないます。"METHOD=NPT"を指定し、積分器は Velocity-Verlet 法 "INTEGR=VELO" を指定します。Andersen の方法を用いるので、"BAROST=ANDE"を指定します。Andersen の 方法では、等方的なセルの変形しかしません。セルの形状を指定するオプションは、必ず 自由度1の等方的なセルの変形を意味するように、"MODIFI=ISOT"と設定します。周期系の 境界条件下で計算するので境界条件の設定は、"BOUNDA=PERI"に指定してください。 目標の圧力 "SETPRE"は、サンプルでは1気圧を目標にしています。 緩和時間の設定は、系に依存しますが、温度制御の緩和時間"COUPHB"は 100∼500 fsec 程度、圧力制御の緩和時間"COUPPI"は、温度制御の緩和時間より数倍長く、1000∼5000fsec 程度にとるのが良いようです。 1-5 静電相互作用は、Particle-Mesh-Ewald (PME)法で計算することにします。PME の設定 は、まず"CALPME=CALC"を指定、あらわに電場を計算するための"CUTLEN"を指定しますが、 ユニットセルの辺の長さの半分以下であって、通常 6∼8Å程度にとります。メッシュの数 は、X, Y, Z 軸について"MESHLX"、"MESHLY"、"MESHLZ"で指定します。メッシュの幅は 1∼ 3Å程度が妥当で、幅が狭いと精度が上がりますが計算時間がかかります 。今は、1辺 18.64775Åを 1Å程度のメッシュに切るとして、"MESHLX=18"("MESHLY"、"MESHLZ"も同じ 指定)に設定します。Ewald パラメータ"EWAPRM"は、系によって精度に影響しますが、だい たい 0.35 程度に設定します。グリッドポテンシャルからの内挿多項式の次数"PMEORD"は、 低いほど計算が速く精度が落ち、高いほど計算精度が高く速度が落ちますが、3∼6 程度に 設定します。PME は No-cutoff の方法ですが、原子の相互作用テーブルを作らずに計算する のではなく、近接の静電相互作用は原子の相互作用テーブルを作成して計算するので、 "CALE15=CALC", "CALE5N=NOCALC", "CALV15=CALC", "CALV5N=NOCALC", "CALH5N=NOCALC"を 指定します。 ■制御ファイル myPresto 4.2 138 EXE> INPUT TOPOLOGY= COORDINA= REFCOORD= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTLOG= STOPCE= FORM PDB PDB 2000000 5000.0D0 10 0.5D0 1000 NO METHOD= INTEGR= BAROST= MODIFI= SETPRE= COUPHB= COUPPI= NPT VELO ANDErsen ISOT 1.0 100.0 2000.0 SETTEM= INITIA= STARTT= CUTMET= DIEFUN= 300.0D0 SET 300.0D0 RESC CONS BOUNDA= LXCELL= SETCEN= CENTRX= PERI 18.64775 NO 0.0 NAMETO= NAMECO= NAMERE= initial.tpl initial.pdb initial.pdb ;1000 psec CPUTIM= LOGFOR= 3600000.0D0 DETA ; NPT ; Velocity-Verlet ; Andersen RANDOM= 654321 CUTLEN= DIEVAL= 8.0D0 1.0D0 LYCELL= 18.64775 LZCELL= 18.64775 CENTRY= 0.0 CENTRZ= 0.0 MESHLZ= 18 ; for PME CALPME= EWAPRM= MESHLX= PMEORD= CALC 0.35 18 6 PMESPD= HIGH MESHLY= 18 CALV15= CALE15= CALHYD= QUIT CALC CALC NOCALC CALV5N= CALE5N= CALH5N= NOCALC NOCALC NOCALC EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 PDB NAMECO= final.pdb 139 【Parrinello-Rahmann の方法】 水で満たされたユニットセルにメタン分子が2個入った周期境界条件の系を、NPT アンサ ンブル、Parrinello-Rahmann の方法で計算します。 系は、2 個のメタンの周囲にツール set_water で水分子を発生させます。立方体ユニット セルのサイズは各辺 18.64775Åとします。 NPT の計算では、原理的に SHAKE を用いることができません。ここでは、All Atom での 計算を行ないます。"METHOD=NPT"を指定し、積分器は Velocity-Verlet 法 "INTEGR=VELO" を指定します。Parrinello-Rahmann の方法を用いるので、" BAROST= PARA " を指定します。 Parrinello-Rahmann の方法では、異方的なセルの変形が許容されますので、等方的なセル の変形しかしません。セルの形状を指定するオプション"MODIFI"は、以下の5つが可能で す。 MODIFI = FLEX = MONOckinic ;自由度6、斜方セル(デフォルト) ;自由度4。3方向にそれぞれ伸縮および、基本セルの 角γ(a軸とb軸のなす角度)が変化 = ORTHorhombic ;自由度3。3方向にそれぞれ伸縮 = ISOTropic ;自由度1。等方的な変形。Andersen の方法と類似。 = SINGle_direction ;自由度1。z軸方向のみ変形 更に、境界条件の設定"BOUNDA"は、Parrinello-Rahmann の方法の場合は、"MODIFI"の指 定に関わらず、"BOUNDA=HEXA"に指定してください。 【注意】周期境界条件"BOUNDA=PERI"ではなく、"BOUNDA=HEXA"に指定してください。 目標の圧力 "SETPRE"は、サンプルでは1気圧を目標にしています。 緩和時間の設定は、系に依存しますが、Andersen の方法と同様に、温度制御の緩和時間 "COUPHB"は 100∼500 fsec 程度、圧力制御の緩和時間"COUPPI"は、温度制御の緩和時間よ り数倍長く、1000∼5000fsec 程度にとるのが良いようです。 PME の指定方法は前節 Andersen の方法と同じです。NPT においてはセル形状が変化する ため、特に"MODIFI=FLEX"および"MODIFI=MONO"を指定する場合、シミュレーションの進行 に伴い相互作用のカットオフ長"CUTLEN"が、セルの辺の長さの半分より長くなる場合があ ります。カットオフ長は、セル形状は六方最密格子まで歪む可能性を考え、初期のセルの 辺の長さの半分より十分短くとるか、十分な大きさのセルを準備することが必要です。 myPresto 4.2 140 ■制御ファイル EXE> INPUT TOPOLOGY= COORDINA= REFCOORD= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTLOG= STOPCE= FORM PDB PDB 2000000 5000.0D0 10 0.5D0 1000 NO METHOD= INTEGR= BAROST= MODIFI= SETPRE= COUPHB= COUPPI= NPT VELO PARA ISOT 1.0 100.0 2000.0 SETTEM= INITIA= STARTT= CUTMET= DIEFUN= 300.0D0 SET 300.0D0 RESC CONS BOUNDA= LXCELL= SETCEN= CENTRX= HEXA 18.64775 NO 0.0 NAMETO= NAMECO= NAMERE= initial.tpl initial.pdb initial.pdb ;1000 psec CPUTIM= LOGFOR= 3600000.0D0 DETA ; NPT ; Velocity-Verlet ; Parrinello-Rahmann RANDOM= 654321 CUTLEN= DIEVAL= 8.0D0 1.0D0 ; Parrinello-Rahmann LYCELL= 18.64775 LZCELL= 18.64775 CENTRY= 0.0 CENTRZ= 0.0 MESHLZ= 18 ; for PME CALPME= EWAPRM= MESHLX= PMEORD= CALC 0.35 18 6 PMESPD= HIGH MESHLY= 18 CALV15= CALE15= CALHYD= QUIT CALC CALC NOCALC CALV5N= CALE5N= CALH5N= NOCALC NOCALC NOCALC EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 PDB NAMECO= final.pdb 141 5.14 Sample-14:Fast Multipole Method −カウンターイオンを用いた MD 計算− Zinc finger 蛋白質(PDB コード:1A1H)を例にとり、Fast Multipole Method(FMM)と カウンターイオンを用いた MD 計算について説明します。 (1)蛋白質と DNA の複合体のPDBファイルとトポロジーファイルの作成 まず、1A1H のファイルから蛋白質部分と DNA 部分を別々のファイルに分割し、それぞれ 別にトポロジーファイルを生成します。これは、tplgene でトポロジーファイルを生成する ときのデータベースがペプチド鎖と核酸では異なり、同時に処理できないためです。例で は、水素付加を終えた蛋白質部分を"zif.pdb"とします。亜鉛に結合するシステインは、ほ とんどのタンパク質でシステインマイナス S-となっています。myPresto では CYM がシステ インマイナス S-に相当します。zif.pdb の CYS5,CYS10,CYS35,CYS38,CYS63,CYS66 の6残基 の CYS を CYM に書き直したあと、tplegene で zif.pdb のトポロジーファイルを作成します。 このトポロジーファイルを"zif.tpl"とします。また、水素付加を終えたDNA部分を "dna.pdb"とし、そのトポロジーファイルを"dna.tpl"とします。 (2) 溶媒水の付加 2つの PDB ファイル"zif.pdb"と"dna.pdb"をマージして、Zinc finger 蛋白質・DNA複合 体の PDB ファイル"zif_DNA.pdb"を作成します。この複合体に、ツール setwater で溶媒水 を付加します。sample-3 の入力ファイル"setwater.inp"にあるように半径 40Åで、複合体 の周囲に溶媒水を生成します。生成した溶媒水の座標ファイルと複合体の PDB ファイル zif_DNA.pdb をマージしたファイルを"zifcmp.pdb"とします。 (3)カウンターイオンの付加 カウンターイオンの付加では、系に付加した溶媒水分子を Na+ 、Cl− イオンに置換すること で行います。 準備した PDB ファイル zifcmp.pdb の電荷を計算すると-8 なので、正電荷8を足さないと 系が中性になりません。溶媒水分子が 8186 個ある場合は 1%程度を NaCl に置換するとして、 Na+ イオン 80 個、Cl- イオン 72 個をカウンターイオンとして加えることにします。カウンタ ーイオンの付加はツール“add_ion.f”によって行います。add_ion は、溶質(溶媒水分子 以外の分子)の作り出す電場を、各溶媒水分子の座標について距離依存誘電率(ε∝r) で計算し、もっとも電位の高いところ、ないし低いところにある水分子をカウンターイオ ンで置換します。カウンターイオンで置換後、同様の計算を繰り返し、指定した数のカウ ンターイオンを全て配置するまで作業を繰り返します。この時、次のカウンターイオンは、 前回までに配置したカウンターイオンより一定距離以上離れた場所に配置します。 myPresto 4.2 142 add_ion.f のコンパイルの仕方: % f90 add_ion.f ?o add_ion 使い方: add_ion とタイプする。標準入力から入力します。入力例は、ion.input としています。 % add_ion < ion.input 入力例: zifcmp.pdb protein.pdb ion.pdb wat.pdb 1 80 72 6.0 1行目:入力ファイル名:溶媒水分子の付加された全系の座標ファイル名。 2行目:出力ファイル名:全系の座標ファイル名。 3行目:出力ファイル名:カウンターイオンの座標ファイル名。 4行目:出力ファイル名:カウンターイオンに置換された溶媒水分子の座標ファイル名。 6行目:Na+ イオンの数 7行目:Cl- イオンの数 8行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加したカ ウンターイオンより一定距離内に配置しない。その半径(Å)。 こうして生成したカウンターイオンの座標を全系に加えます。 % cp protein.pdb zifcmx.pdb % cat ion.pdb │ grep NA+ >> zifcmx.pdb % cat ion.pdb │ grep CL- >> zifcmx.pdb (4) トポロジーファイルの合成 蛋白質、DNA、溶媒水、カウンターイオンの並びは、トポロジーファイルの MOLECULES 欄 と PDB 上で同じ順番でなければなりません。ここでは、zif.tpl, dna.tpl, tip3p.tpl, na.tpl, cl.tpl の順にトポロジーファイルをマージします。合成したトポロジーファイル myPresto 4.2 143 を”zifcmx.tpl”とします。 トポロジーファイル”zifcmx.tpl” の MOLECULES 欄の、WAT,NA,CL を sample-3 に習って編 集します。 (5) エネルギー最小化 add_ion によって付加されたカウンターイオンの配置は、エネルギー的に安定ではありませ ん。従って、全系の MD 計算に移る前に、蛋白質・DNA の座標を固定した状態で、溶媒水と カウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡状態に近づけ ておきます。 蛋白質とDNAの座標の固定は、M_all.res で指示します。 <M_all.res> GROUP> LIST 1 1 2 3 END 1 1 85 11 * * * * 1.0 1.0 MASS MASS YES YES GROUP> STOP <min_wat.inp> EXE> INPUT TOPOLOGY= COORDINA= REFCOORD= POSITION= ; FORM PDB PDB READ NAMETO= NAMECO= NAMERE= NAMEPO= zifcmx.tpl zifcmx.pdb zifcmx.pdb M_all.res SETBOU= READ QUIT EXE> MINI METHOD= STEEP LOOPLI= 6000 MONITO= 100 CUTMET= RESA DIEFUN= CONS BESTFI= YES NAMEBO= zifcmx.capbc in case of CAP boundary CALCAP= CALC RADCAP= 40.0 SETCEN= YES CALPSR= CALC WETPSR= 10.00 QUIT EXE> OUTPUT COORDINATE= PDB QUIT EXE> END CPUTIM= UPDATE= CONVGR= CUTLEN= DIEVAL= 360000.0 10 0.2D0 8.0D0 1.0D0 FUNCAP= FORCAP= HARMonic 100.0 NAMECO= zifcmx_min.pdb myPresto 4.2 144 (6)溶媒水とカウンターイオンの MD 計算 溶媒水とカウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡状態 に近づけます。 <md_wat.inp> myPresto 4.2 145 ; ; md input for Zinc ; EXE> INPUT TOPOLOGY= COORDINA= REFCOORD= SETBOU= POSITION= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTTRJ= OUTLOG= LOGFOR= METHOD= SETTEM= INITIA= STARTT= RANDOM= Finger/DNA FORM PDB PDB READ READ NAMETO= NAMECO= NAMERE= NAMEBO= NAMEPO= 100000 500.0D0 40 0.5D0 1000 1000 DETA zifcmx.tpl zifcmx_min.pdb zifcmx.pdb zifcmx.capbc M_all.res CPUTIM= 3600000.0D0 STOPCE= BOTH CANONICAL 310.0D0 SET 310.0D0 654321 ; in case of CAP boundary CALCAP= CALC RADCAP= 40.0 SETCEN= YES BESTFI= YES ; position restraint CALPSR= CALC WETPSR= 10.00 ; FMM USEFMM= YES FMTREE= 4 FMPOLE= 6 CUTMET= DIEFUN= CALV15= CALE15= CALHYD= CALE5N= QUIT EXE> OUTPUT COORDINATE= QUIT EXE> END RESA CONS CALC CALC NOCALC NOCALC PDB FUNCAP= FORCAP= HARMonic 100.0 FMMSPD= HIGH CUTLEN= 8.0D0 DIEVAL= 1.0D0 CALV5N= CALH5N= NAMECO= NOCALC NOCALC zifcmx_md.pdb (7)全系の MD 計算 溶媒部分が十分平衡状態に近づいたら、蛋白質・DNA を含む全系の MD 計算を行います。 myPresto 4.2 146 FMM がオーバーフローするときは FMTREE の値を大きくとるようにします。 <md_wat2.inp> ; ; md input for Zinc Finger/DNA ; EXE> INPUT TOPOLOGY= FORM NAMETO= zifcmx.tpl COORDINA= PDB NAMECO= zifcmx_md.pdb REFCOORD= PDB NAMERE= zifcmx.pdb SETBOU= READ NAMEBO= zifcmx.capbc QUIT EXE> MD LOOPLI= 100000 SETTIM= 500.0D0 CPUTIM= 3600000.0D0 UPDATE= 20 TIMEST= 1.5D0 OUTTRJ= 1000 OUTLOG= 1000 LOGFOR= DETA STOPCE= BOTH METHOD= SETTEM= INITIA= STARTT= RANDOM= CANONICAL 310.0D0 SET 310.0D0 654321 ; in case of CAP boundary CALCAP= CALC RADCAP= 40.0 SETCEN= YES BESTFI= YES ; FMM USEFMM= YES FMTREE= 4 FMPOLE= 8 CUTMET= DIEFUN= CALV15= CALE15= CALHYD= CALE5N= QUIT EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 RESA CONS CALC CALC NOCALC NOCALC PDB FUNCAP= FORCAP= HARMonic 100.0 FMMSPD= HIGH CUTLEN= 8.0D0 DIEVAL= 1.0D0 CALV5N= CALH5N= NAMECO= NOCALC NOCALC zifcmx_res.pdb 147 5.15 Sample-15:GB/SA −Vassopressin の計算− (1)GB/SA 計算用パラメータファイルの準備 cosgene では、Generalized Born/Surface Area(GB/SA)モデル及び Accessible Surface Area (ASA)モデルの計算ができます。蛋白質の座標とトポロジーファイルは、いつも通り に準備してください。ここでは、Vassopressin を例に、初期入力は、2面角入力 vas.dih として準備されています。最初に tplgene を用いて、初期座標 vas-dih.pdb とトポロジー ファイル vas-dih.tpl を準備してください。 GB/SA モデルでは、GB/SA 用のパラメータファイルを計算する分子に対して準備する必要 があります。蛋白質に対しては、パラメータファイル作成ツール mkGBSAin.pl と GB/SA パ ラメータデータベース gb_sa.db を用います。 ASA モデルでも、GB/SA 用のパラメータファイルを計算する分子に対して準備する必要が あります。パラメータファイルは GB/SA と共通です。 ■実行方法 ① mkGBSAin.pl を実行するディレクトリに初期座標ファイル(vas-dih.pdb)、トポロジーフ ァイル(vas-dih.tpl)、gd_sa.db を準備します。 ② mkGBSAin.pl を実行します。"mkGBSAin.pl"とタイプします。以下、プログラムの指示に 従い、トポロジーファイル名、パラメータファイル名を指定します。 ■実行例 % mkGBSAin.pl %% INPUT DB FILE NAME. %% gb_sa.db %% SELECT INPUT FILE BY THE NEXT NUMBER. %% 1 : PDB FILE 2 : TPL FILE 2 %% INPUT FILE NAME. %% vas-dih.tpl %% INPUT OUTPUT FILE NAME. %% vas-dih.sol myPresto 4.2 148 (2)エネルギー最小化 GB/SA モデルでは、エネルギー最小化が可能です。作成した GB/SA パラメータファイル vas-dih.sol を指定します。 cosgene では、GB/SA モデルと、ASA モデルでの計算が可能です。指定方法により、 ・CAL-GB= CALC, CALASA= CALC のとき: ・CAL-GB= NOCALC, CALASA= CALC のとき: GB/SA モデル、 ASA モデル、 の計算となります。 ■制御ファイル(min_vac.inp) EXE> INPUT TOPOLOGY= FORM NAMETO= vas-dih.tpl COORDINA= PDB NAMECO= vas-dih.pdb REFCOORD= ASAREA= PDB READ NAMERE= NAMESA= vas-dih.pdb vas-dih.sol QUIT EXE> MINI METHOD= CONJ CPUTIM= 360000.0 LOOPLI= MONITO= 1000 5 UPDATE= CONVGR= 20 0.1D0 CAL-GB= CALASA= CUTMET= DIEFUN= CALC CALC RESA CONS ;GB の指定 ;SA の指定 CUTLEN= DIEVAL= 30.0D0 1.0D0 QUIT EXE> OUTPUT COORDINATE= QUIT EXE> END myPresto 4.2 PDB NAMECO= vas_min.pdb ;GB/SA パラメータファイル 149 (3)MD シミュレーション MD シミュレーションでも GB/SA 及び ASA モデルを用いることができます。オプションは エネルギー最小化時と同じです。GB/SA モデルでは、エネルギーのカットオフ長(CUTLEN) を長くとらないとエネルギーの保存が良くありません。エネルギーのカットオフ長は、20 Å以上、できれば 30Å以上にとってください。 ■制御ファイル(md_vac.inp) EXE> INPUT TOPOLOGY= COORDINA= OUTMONIT= REFCOORD= ASAREA= QUIT EXE> MD LOOPLI= SETTIM= UPDATE= TIMEST= OUTTRJ= OUTLOG= LOGFOR= FORM PDB READ PDB READ NAMETO= NAMECO= NAMEMO= NAMERE= NAMESA= 2000 500.0D0 20 0.5D0 100 200 DETA METHOD= SETTEM= INITIA= STARTT= NAMETR= BESTFI= CANO 300.0D0 SET 300.0D0 vas_vac.mnt YES CAL-GB= CALASA= GBDELT= GBOFFS= CALC CALC 0.0 0.09 CUTMET= DIEFUN= RESA CONS vas-dih.tpl vas_min.pdb vas.mntinp vas_min.pdb vas-dih.sol ;GB/SA パラメータファイル CPUTIM= 3600000.0D0 STOPCE= BOTH INTEGR= VELO RANDOM= MNTRTR= 654321 ASCI CALV15= CALC CALE15= CALC CALHYD= NOCALC QUIT EXE> OUTPUT COORDINATE= PDB QUIT ;GB の指定 ;SA の指定 ;Born 半径の補正値 ;vdW 半径の補正値 CUTLEN= DIEVAL= 99.0D0 1.0D0 CALV5N= CALE5N= CALH5N= NAMECO= NOCALC NOCALC NOCALC vas_md.pdb EXE> END myPresto 4.2 150 5.16 Sample-16:SRPG −Streptavidin の結合自由エネルギー計算− (1)Smooth reaction path generation (SRPG) 法による結合自由エネルギーの計算手順 SRPG 法は、滑らかな解離経路を用意して、それに沿った各点で自由エネルギー計算を行う 事で、タンパク質とリガンドの結合自由エネルギー(ΔG)を計算する方法です。 解離経路の生成には FP 法(sample9)を使用し、経路そのものはリガンドのランドマーク 原子(例えばリガンドの重心に近い重原子)の平均座標で表現します。その際、ルジャン ドル多項式を使って経路を滑らかにしておきます。 解離過程の PMF は、経路に沿った各点で最近接の構造を選び、それらに対応する計算系を 用意した後、経路に沿ってアンブレラ・サンプリング法で計算します。各計算系は、選択 した構造に水分子とイオンを加える事により生成します。 補正項は、初期座標周辺でリガンド配置を微小量ずらす事により複数構造を生成し、これ らを使って計算した PMF から計算します。 最後に経路の PMF と補正項から結合自由エネルギーを求めます。 したがって、計算ステップは以下の様になります。 FP 法を使ってタンパク質からリガンドを解離させる ランドマーク原子の軌跡に沿って滑らかな経路を計算する リガンドとタンパク質に水分子とイオンを加えて系を作成する ① アンブレラ・ポテンシャルを加えた MD 計算を行い、ランドマーク原子に働く平均力を 計算する ② 平均力を経路に沿って積分し、PMF を計算する ③ 結合状態周辺の自由エネルギー地形を調べる ④ 結合状態と解離状態の存在確率を計算し、結合自由エネルギーを計算する (2)平均力、平均座標の計算準備 FP 法においてリガンドのランドマーク原子に働く平均力および平均座標を計算するには、 cosgene の入力ファイルの EXE> MD 以下に次のオプションを指定する必要があります。 FILPOT= YES FPNAME= pmf_r 通常 FPNAME で指定したファイルには経路上の座標と半径を指定します。指定した座標を中 心に、同じく指定した半径内に存在するリガンドのランドマーク原子に働く力、座標から その平均力、平均座標を計算します。ランドマーク原子は NAMEUM で指定したアンブレラポ テンシャルファイルの中で指定します(sample9 参照)。 今回の計算では、実行スクリプト ganzene.sh が pmf_r を自動生成・更新します(後述(3))。 myPresto 4.2 151 ■記述例(pmf_r) FILPOT> FILPOT ATOM 0.3 10.924 1.228 -10.179 ←中心座標 ←半径 EXE>OUTPUT に次のオプションを加えることで平均力、平均座標を出力することができます。 各平均値は NAMEFP で指定したファイルに出力されます。 FPAVER= FORM UNITFP= 94 NAMEFP= FP.avg ■出力例(FP.avg) -4.9246739 -9.3160922 -23.4467904 1.9398118 -0.0362050 2.8454671 左から順に x、y、z の平均座標、そして各軸方向の平均力になります。 (3)FP 法によるリガンドの解離計算 FP 法を使用してタンパク質からリガンドを解離させます。リガンドを短時間で解離させる ために、高温、真空で計算を行い、さらにリガンドの原子の電荷の値を 0 にしてタンパク 質との間に働く引力相互作用を減らします。 作業は、SRPG_sample/Streptavidin/Make_path/Dissociation 以下で行います。 実行ファイル: ・ 実行スクリプト(ganzene.sh) 入力ファイル: ・ 初期構造とトポロジー(cmx.pdf, cmx.tpl) トポロジーファイルにおいて、リガンドの全電荷の値を 0 にする。 ・ MD 計算入力(md.inp) ・ FP 法入力(GenerateNextFP.inp、Extract_atom.inp、newopt_fp_ini)* sample9 を参照(ランドマーク原子はビオチンの重心に最も近い重原子とする)。 ・ 平均力および平均座標計算の入力(pmf_r)** ganzene.sh 内で自動作成され、FP 法の繰り返し毎に更新される。 出力ファイル: ・ MD 計算の繰り返し毎に出力される構造、トラジェクトリ、平均力等(w_*.pdb, w_*.cor, w_*.option, w_*.output, w_*.FP)。 ・ 各計算で出力された平均力、平均座標を纏めたファイル(all_avg)。 myPresto 4.2 152 * :FP 法を使用して計算を行ってもリガンドはタンパク質の表面からなかなか解離しない場合があり ます。したがって、FP 法による計算の繰り返しが一定回数を超えたら、目標座標に向かって直線上ア ンブレラポテンシャルを発生させて引っ張るようにリガンドを解離させます。回数の指定について は”Generate_NextFP.inp”の最後の行に以下のように入力して行います。 newopt_fp newopt_fp2 initial.pdb xx_traject.cor -1000 100 s n HAR1 1000.0 0.5 6.00 8.00 0.300 1.0 0.30 ATOM 2085 O WAT 226 -4.789 -9.083 -23.469 16.00 -0.83 51 100 ←FP 法による繰り返しで 51 回目から 100 回目にかけて直上の行で 指定した座標に直線的に向かうようにアンブレラポテンシャルを 発生させる。 リガンドの解離の軌跡(後半は直線状に解離) **:半径の値が小さいと各種平均値が得られないことがあります。ここではリガンドを解離させるだ けなので、半径は大きめにします(ganzene.sh 内に指定)。 ■実行例 % ./ganzene.sh myPresto 4.2 153 (4)滑らかな経路の計算 (3)で計算したランドマーク原子の平均座標による軌跡に沿って、滑らかな経路を計算 します。経路の計算にはルジャンドル多項式を使用し、モンテカルロ法を併用して結合状 態と解離状態の 2 点間を結ぶ複数の経路を計算した後、その中から元の軌跡に近い経路を 選びます。 作業は、SRPG_sample/Streptavidin/Make_path/Smooth 以下で行います。 実行ファイル: ・ 経路計算プログラム(path.f) ルジャンドル多項式を使って経路を計算する。プログラム中の変数 dr の値を換えるこ とで、出力する経路を構成する座標の間隔を決めることができる。PMF を正確に計算す る為には間隔は短い方が良い為、ここでは 0.2Åにしてある。 ・ 実行スクリプト(RUN.sh)* 入力ファイル: ・ ランドマーク原子の軌跡(log) 平均力と平均座標をまとめたファイル((3)で出力された all_avg の名前を変えてコ ピーしたもの)** 。 ・ ルジャンドル多項式のパラメータ(input_x_yy) RUN.sh 内で自動生成され、項数 x と探索範囲の広さ yy を指定する。 x、yy の値が大き い程、広い範囲で様々な経路を作成することができる。 出力ファイル: ・ 計算結果(x_yy.out)*** 滑らかな経路を構成する座標、入力平均座標との RMSD 等が出力される。 * :RUN.sh の例(以下は LSF 環境下で経路計算プログラム path を実行する場合を想定) echo “3 0.5”> input_3_05 ←最初の値が項数、次が探索範囲の広さ bsub?q qall?iinput_3_05 ?o 3_05.out ./path.exe … **:入力ファイル(log)の例 左3列が平均座標、右が平均力を表します。 10.5905897 1.2787241 -10.4333034 0.7910588 -0.5060095 0.6768240 10.5601682 1.1843599 -10.3228453 -0.0145502 -0.1970323 0.1232972 10.5234182 1.0966913 -10.1436536 -0.7193757 -0.5401182 -0.2495513 10.4569258 0.8150650 -10.1663318 -0.3373891 0.5938054 -0.7854677 … myPresto 4.2 154 ***:出力ファイル(x_yy.out)の例 最後の dr 間隔で出力した経路の座標を別ファイル(path.dat)に保存します。 @ n_use= 3 region= 0 10.591 1.279 -10.433 1 10.577 1.271 -10.447 2 10.563 1.263 -10.460 3 10.549 1.255 -10.473 0.5000000 ←指定した項数と範囲 ←初期座標 経路の座標 … 998 -4.894 -9.295 -23.426 999 -4.909 -9.306 -23.436 1000 -4.925 -9.316 -23.447 1 10.591 1.279 -10.433 2 10.560 1.184 -10.323 3 10.523 1.097 -10.144 ←最終座標 入力平均座標(軌跡) … 92 -4.190 -8.728 -22.926 93 -4.925 -9.316 -23.447 r_sum_min= 1.790653 ←経路の座標と入力座標との RMSD qpath= 0 10.591 1.279 -10.433 qpath= 0 10.591 1.279 -10.433 囲内に存在する経路上 … qpath= 950 -4.152 -8.789 -22.904 qpath=1000 -4.925 -9.316 -23.447 dr= 0.2000000 10.591 1.279 -10.433 1 10.466 1.208 -10.553 2 10.342 1.136 -10.672 … -4.555 -9.065 -23.189 98 -4.694 -9.160 -23.286 99 -4.832 -9.254 -23.383 myPresto 4.2 dr 間隔で出力した経路 上の座標(path.dat) 97 % ./RUN.sh の座標 ←経路上の座標をこの間隔で出力 0 ■実行例 軌跡の座標から一定範 155 【参考】経路の選択について 作成した複数の候補から適切な経路を選択する方法としては、平均座標の軌跡との RMSD を 参考にするのも良いが、経路と軌跡をグラフで重ね合わせてみて、その上で適切と思われ る経路を使用する事を推奨します。 (5)系の作成および MD の実行 先ず、作成する系の数(経路を作る座標の数)だけディレクトリを用意して、経路上の各 座標との距離が一番短い平均座標を(3)で計算した中から選び出し、それぞれの平均座 標に対応した出力構造に水分子、イオンを加えて新たな系を作成します。作成した系の PDB ファイルとトポロジーファイルを各ディレクトリに保存します。 次に、作成した系に対してエネルギー最小化、平衡化を行います。サンプリングでは経路 上の座標を中心としたアンブレラ・ポテンシャルを発生させて、ランドマーク原子に働く 平均力を計算します。 作業は、SRPG_sample/Streptavidin/Explicit 以下で行います。 (5-1)系の作成 実行ファイル: ・ 実行スクリプト(set_system.sh) 入力ファイル: ・ 系の座標(path.dat) (4)で選択した経路の出力ファイルから作成、コピーしておく。 ・ ランドマーク原子の軌跡(log) 平均力、平均座標を纏めたファイル((3)で出力された all_avg の名前を変えてコピ ーしたもの)。 ・ 水分子付加プログラム用入力(setwat.inp) CAP 水の半径、中心座標を記述する(内部で setwater を使用)。 ・ イオン不可プログラム用入力(addion.inp) 生理食塩水濃度(0.00275 mol(NaCl)/mol(H2 O))を使用する(内部で add_ion が使用)。 ・ タンパク質およびリガンドのトポロジー(cmx.tpl) 水分子とイオン(Na+, Cl-)のトポロジーデータを予め追加しておく。分子数は系生成 スクリプトが調整する為、任意で良い。 ・ CAP ポテンシャル用入力(cap_25.capbc) CAP ポテンシャルの中心座標、半径を入力する。水分子、イオン数は任意で良い。 ・ アンブレラ・ポテンシャル用入力(newopt_fp_base) ポテンシャルの中心座標を除く全項目について入力する。ポテンシャルの中心座標は系 生成スクリプトが追加する。 myPresto 4.2 156 出力ファイル: ・ 計算系リスト(conf.dat)* 経路上の座標番号、最近接の平均座標番号、およびそれらの間の距離を出力する。 ** ・ 計算系 各座標に対応する計算系ディレクトリが作成され、エネルギー最小化、平衡化用の入力 ファイルが配置される。 * :conf.dat の例 左から順に経路上の座標番号、(3)の平均座標の出力番号、それら座標間の距離となります。 2 列目の番号は、経路上の各座標から一番近い距離にある平均座標が選択されます。 1 1 0.003 2 3 0.106 3 6 0.248 4 6 0.198 5 10 0.246 … **:計算系の例 スクリプトを実行した結果、以下の様なディレクトリが作成されます。 1 10 100 11 12 13 14 15 16 17 18 19 2 20 21 22 23 24 25 26 27 28 29 3 30 31 32 33 34 35 36 37 38 39 4 40 41 42 43 44 45 46 47 48 49 5 50 51 52 53 54 55 56 57 58 59 6 60 61 62 63 64 65 66 67 68 69 7 70 71 72 73 74 75 76 77 78 79 8 80 81 82 83 84 85 86 87 88 89 9 90 91 92 93 94 95 96 97 98 99 cmx.tpl pmf_calc Calc_pmf.sh conf.dat pmf_calc.f M_all.res dir_list_orgreplaced_wat.pdb M_min.res ion.pdb set_system.sh add_ionmd_w.inpsetwat.inp addion.inp min.inp setwater cap_25.capbc newopt_fp tip3_base.pdb cmp.pdb newopt_fp_basewat.pdb cmw.pdb path.dat この時点では各ディレクトリの中身は以下のようになるはずです。 cap_25.capbc cmx.pdb cmx.tpl newopt_fp ■実行例 % ./set_system.sh なお、以下が set_system.sh の内容になります。 myPresto 4.2 pmf_r 157 #!/bin/csh # numbre of protein-ligand systems. @ nsys = 100 ←系の数 @ i = 1 while($i<= $nsys) # Removing old directories and make new directories rm -r $i mkdir $i ←ディレクトリの作成 # Calculation of distances between coordinates on smooth reaction path and average coordinates of ligand landmark atom, and selection of ligands from dissociation trajectory, which make minimum distances. set cod = (`awk '{if(NR=='$i') print $2,$3,$4}' path.dat`) ←経路の座標の読み込み awk'BEGIN{m=0;rmin=999999.0} {m=m+1;if(NR==m) r=(('$cod[1]'-$1)**2+('$cod[2]'-$2)**2+('$cod[3]'-$3)**2)**0.5;if(r<=rmin) {nmin=m; rmin=r}}END{printf("%5d%5d%8.3f¥n",'$i',nmin,rmin)}' log >conf.dat ←軌跡の座標との最短距離の計算 set k = `awk '{if(NR=='$i') print $2;}' conf.dat` cp ../Make_path/Dissociation/w_$k.pdbcmp.pdb ←最短距離を作るリガンドを持った系をコピーする。 # set water molecules and ions in each system. ←水とイオンの付加 ./setwater<setwat.inp cat cmp.pdbwat.pdb>cmw.pdb ./add_ion<addion.inp cat ion.pdb>>cmx.pdb # set topology file. ←トポロジーファイルの水分子、イオンの数の調整 set jwat = `awk 'BEGIN{total=0} {if($4=="WAT") total=total+1} END{print total/3}' cmx.pdb` set jcl = `awk 'BEGIN{total=0} {if($3=="CL") total=total+1} END{print total}' cmx.pdb` set jna = `awk 'BEGIN{total=0} {if($3=="NA") total=total+1} END{print total}' cmx.pdb` awk '{if($1=="WAT" && NF>1) printf("WAT%49d¥n",'$jwat');¥ else if($1=="CL" && NF>1) printf("'CL'%50d¥n",'$jcl');¥ else if($1=="NA" && NF>1) printf("'NA'%50d¥n",'$jna');¥ else print}' cmx.tpl> $i/cmx.tpl myPresto 4.2 158 # set CAP potential file. ←CAPポテンシャル入力ファイルの水分子、イオンの数の調整 awk '{if($1=="WAT") printf("'WAT'%9d%6d%9s¥n",$2,'$jwat',"YES");¥ else if($1=="CL") printf("'CL'%10d%6d%9s¥n",$2,'$jcl',"YES");¥ else if($1=="NA") printf("'NA'%10d%6d%9s¥n",$2,'$jna',"YES");¥ else print}' cap_25.capbc > $i/cap_25.capbc mvcmx.pdb $i/ # set input file for unbrella potential. ←アンブレラポテンシャルファイルの作成 cat newopt_fp_base>newopt_fp awk '{if(NR == '$i') printf("'ATOM'%26s%8.3f%8.3f%8.3f¥n","",$2,$3,$4)}' path.dat>>newopt_fp cp newopt_fp $i/ # set input file for average force and coordinate. ←平均力、平均座標計算用の入力ファイルの作成 echo "FILPOT> FILPOT" > $i/pmf_r tail -1 newopt_fp>> $i/pmf_r echo "0.3" >> $i/pmf_r @ i = $i + 1 end (5-2)エネルギー最小化、平衡化およびサンプリング 各計算系ディレクトリのエネルギー最小化、平衡化、サンプリングを実施します。 実行ファイル: ・ 実行スクリプト(run) 入力ファイル: ・ エネルギー最小化用入力(min.inp) ・ 位置拘束指定(M_min.res) エネルギー最小化の際に使用する。対象はタンパク質とリガンド。 ・ 平衡化、サンプリング用入力(md_w.inp) ・ 位置拘束指定(M_all.res) 平衡化、サンプリングの際に使用する。対象はタンパク質のみ。 出力ファイル: ・ エネルギー最小化結果(min.out) ・ 平衡化、サンプリング結果(md.out, FP.avg) ※ 各計算系のディレクトリ以下に出力される。 myPresto 4.2 159 ■実行例 % ./run (6)PMF の計算 (5)で計算した経路上の各座標におけるランドマーク原子に働く平均力から PMF を計算 します。作業は、SRPG_sample/Streptavidin/Explicit 以下で行います。 実行ファイル: ・ PMF 計算(pmf_calc.f) ・ 実行スクリプト(Calc_pmf.sh) pmf_calc の入力ファイルを作成し、PMF 計算を実行する。 入力ファイル: ・ (5)で計算した経路座標および平均力(path.dat) Calc_pmf.sh を実行した際に作成される。 ・ 計算系ディレクトリのリスト(dir_list_org) Calc_pmf.sh を実行する際に必要。 出力ファイル: ・ PMF 計算結果(pmf.dat) ■実行例 % ./Calc_pmf.sh (7)結合状態周辺の自由エネルギーの計算 (6)で計算した PMF の結合状態の自由エネルギー最安定点を中心に、その周辺について これまでと同様に PMF の計算を行います。先ず、(5)の計算で自由エネルギー最安定点に 対応した系の平均座標を中心として、各軸に沿って前後1Å の範囲で 0.1Å 間隔でこれま でと同様に平均力を計算し、PMF を計算します。次に、各軸の PMF が放物線を描いているか どうかをグラフで確認します。 作業は、SRPG_sample/Streptavidin/Explicit/deltaG 以下で行います。 実行ファイル: ・ 入力準備(set_fp) 計算系ディレクトリ作成、アンブレラ・ポテンシャル入力の作成、および平均力と平均 座標計算用入力(pmf_r)の作成を行う。 ・ 実行スクリプト(run) 入力ファイル: myPresto 4.2 160 ・ 自由エネルギー最安定点の構造およびトポロジー(initial.pdb, initial.tpl) ・ 自由エネルギー再安定点の系の平均座標(ave_cod.inp) ・ CAP ポテンシャル用入力(cap_25.capbc) ・ MD 計算入力(md_w.inp) ・ 位置拘束指定(M_all.res) ・ 計算系ディレクトリのリスト(dir_list_org) 出力ファイル: ・ MD 計算、サンプリング結果(output, FP.avg) ※ 各計算系のディレクトリ以下に出力される。 ・ PMF 計算結果(pmf.dat) ■実行例 % ./set_fp % ./run % ./Calc_pmf.sh (8)自由エネルギーの計算 (7)で計算した各軸の PMF を基にして、結合状態の存在確率を計算し、解離状態の存在 確率との比からΔG を計算します。 作業は、SRPG_sample/Streptavidin/Explicit/deltaG 以下で行います。 実行ファイル: ・ ΔG 計算(dg_calc.f) (6)で計算した PMF のグラフは r > 8Åでフラットになる。非結合状態を r∞ = 15Å とすると、pmf.dat における非結合状態の PMF 値は 21.9kcal/mol である。 したがって、非結合状態の PMF 値を 0kcal/mol にシフトさせると結合状態 r0 = 0 Åの PMF 値は-21.9kcal/mol となるので、この値を dg_calc.f の変数 g0 として設定する。 入力ファイル: ・ 各軸の PMF(x/pmf.dat, y/pmf.dat, z/pmf.dat) 出力ファイル: ・ 標準出力 ■実行例 % ./dg.exe myPresto 4.2 161 5.17 Sample-17:溶解度予測−アグリゲータ解析− 溶解度予測は、分子記述子に基づくある種の回帰(MLR, PLS, NN ...)で行う事が一般的 です。本サンプルでもその方法を踏襲していますが、GB/SA・ASA といった物理記述子の追 加および重み付き学習法の利用により計算精度の向上を図っています。 本サンプルでは、データベースに付属の約 1300 分子のデータセット、回帰計算に PLS 回帰 を使用して溶解度予測を行います。更に、アグリゲータ分子の溶解度予測結果に対してベ イジアン分析を行う事により、アグリゲータ予測を実施します。 ※ サンプル実行の前に溶解度ツールのインストールを実施してください(B.19 参照)。 (1)記述子計算(sample17/dsc/) 先ず、記述子の計算を溶解度予測の準備として実施します。記述子の計算は、溶解度既知 のデータベースおよび溶解度未知の入力分子について行います。ここで計算する記述子は、 薬物候補低分子用の拡張 Joback 記述子(構造記述子)および GB/SA・ASA といった物理記 述子です(全 60 記述子−下表)。 ID Name 1MW 2Ar 3DelO_H 4AddN_H 5Ra 6dASA_o 7dG_o 8dASA_wd 9dG_wd 10dASA_w 11dG_w 12ddG_o 13ddG_wd 14ddG_w 15 -CH3, CH4 60>N-GinR Description Mass weight of molecule Number of aroamtic atoms Number of dissociated H atoms, which bind O Number of additional H atoms, which bind N Number of atoms in ring Accessible surface area par unit volume (in octanol) Solvation free energy evaluated by the GBSA method (in octanol) Accessible surface area par unit volume (in water, ion form) Solvation free energy evaluated by the GBSA method (in water, ion form) Accessible surface area par unit volume (in water) Solvation free energy evaluated by the GBSA method (in water) dG_o / Accessible surface area (in octanol) dG_wd / Accessible surface area (in water, ion form) dG_w / Accessible surface area (in water) Number of -CH3 fragments or CH 4s ... Joback-like sub-structure descriptors (15 - 60 ) ... >N- group in ring which binds the atom with πelectron. 物理記述子の計算は、水中およびオクタノール中での GB/SA・ASA 等の値を cosgene により 計算します。その際、水中では Hgene で発生させた分子の解離型・非解離型について計算 します。各条件・型の計算では、それぞれ confgene で発生させた複数配座について計算し、 それらを平均したものを採用します。 一方、構造記述子の計算は、trans_code を使用して拡張 Joback 記述子の官能基の存在数を カウントします。記述子計算の実行手順は以下の通りです。 ① 分子の準備(sample17/dsc/) データベースまたは入力分子は、格納ディレクトリ内に single-mol2 ファイルとして用 意され、カレントディレクトリにその分子リストが用意されている必要があります(下 図)。 myPresto 4.2 162 tch0.mol2 tch1.mol2 ... tchs/ tsts/ tch_inp.lst tst_inp.lst tst0.mol2 tst1.mol2 ... 分子が multi-mol2 ファイルで用意されている場合、split_mols 等のツールを使用して、 single-mol2 ファイルに分割します(split_mols は tools に含まれています)。 $ mkdir tchs $ split_mols -i tchs.mol2 -o tchs -p tch ※ データベース $ mkdir tsts $ split_mols -i tsts .mol2 -o tsts -p tst ※ 入力分子 分子リストは以下の内容のものを用意します。ID、ファイル名、logS 値を記述しますが、 logS 値が無い場合は ID、ファイル名のみとします(なお、各 mol2 ファイルの@<TRIPOS> COMMENT 内に logS 値は記述可能で、その場合も ID、ファイル名のみとします)。 $ less tch_inp.lst 0 tch0.mol2 1 tch1.mol2 ※ logS 値が分かっているが、各 tch<n>.mol2 に記載済み または、logS 値が分かっていない場合 … $ less tst_inp.lst 0 tst0.mol2 -2.675 1 tst1.mol2 -1.972 ※ logS 値が分かっており、各 tst<n>.mol2 には未記載で 分子リストで指定する場合 … ② 計算条件の設定(sptool/Descriptor/) 指定可能な物理記述子の計算条件はそれぞれ指定個所が異なります。デフォルト値につ いては各設定値を参照してください。 計算条件 指定個所 tplgeneL のパラメータ定義ファイル Descriptor.rb 内の TPLLDBF GBSAinp のパラメータ定義ファイル Descriptor.rb 内の GBSADB cosgene での最小化条件 min_template.erb cosgene での GB/SA・ASA 計算条件 min_template_o.erb(オクタノール中) min_template_w.erb(水中) confgene での発生配座数 Descriptor.rb 内の CNF_NUM confgene での発生配座角度(360/<n>) Descriptor.rb 内の CNF_ANG myPresto 4.2 163 指定可能な構造記述子の計算条件についても同様です。 計算条件 trans_code の記述子定義ファイル 指定個所 Descriptor.rb 内の TRNSDB ③ 計算の実行(sample17/dsc/) 現ディレクトリにおいて以下のコマンドで実行します(Descriptor/にパスが通っていない 場合は 2 番目のコマンドとなります)。 1 $ Descriptor.rb -i tchs -l tch_inp.lst -o tch_out.dsc > tch_out.err 2>&1 $ Descriptor.rb -i tsts -l tst_inp.lst -o tst_out.dsc > tst_out.err 2>&1 2 $ ruby -I <path: Descriptor/> <path: Descriptor.rb> -i tchs -l tch_inp.lst -o tch_out.dsc > tch_out.err 2>&1 $ ruby -I <path: Descriptor/> <path: Descriptor.rb> -i tsts -l tst_inp.lst -o tst_out.dsc > tst_out.err 2>&1 ※ スイッチ: "-i" = mol2 格納ディレクトリ, "-l" = mol2 リストファイル, "-o" = 記述子ファイル ※ 実行時には次のディレクトリをカレント以下に作成するので注意してください。 分子リストと同名ディレクトリ: テンポラリ、エラー詳細ファイルを格納 出力記述子ファイルと同名ディレクトリ: 物理記述子設定済み mol2 ファイルを格納 (2)溶解度推算(sample17/sol/) 次に(1)で計算した記述子について回帰計算を行います。回帰計算には PLS 回帰を利用しま す。重み付き学習法を適用して入力分子に対する学習済みデータベースを作成し、入力分 子と学習済みデータベースのセットに対して PLS による回帰計算及び入力分子の溶解度推 算を行います。その際、各回帰計算および推算結果全体について推算精度(決定係数)が 計算されます(推算結果全体は入力分子にも logS 値が指定されている場合)。 溶解度計算の実行手順は以下の通りです。 ① 記述子の準備(sample17/sol/) (1)のデータベースおよび入力分子の記述子をコピーします。入力分子の記述子に logS 値 が指定されていれば推算精度が計算されます。なお、記述子ファイルの右端列に logS 値 を設定する事も可能です(未設定の場合、logS 値列(右端)は 0.000000e+00)。 $ cp ../dsc/tch_out.dsc . $ cp ../dsc/tst_out.dsc . ② 計算条件の設定(sptool/Solubility/) 指定可能な物理記述子の計算条件は Solubility.rb 内の当該個所で指定します。 計算条件 指定個所 記述子のサイズ設定 Solubility.rb 内の DSCS 重み付き学習法の bin 数 Solubility.rb 内の BINS 重み付き学習法の decoy 数 Solubility.rb 内の DCYS 補正計算の on/off Solubility.rb 内の SWT_CRR myPresto 4.2 164 ③ 計算の実行(sample17/sol/) 現ディレクトリにおいて以下のコマンドで実行します(インストール場所にパスが通っ ていない場合は 2 番目のコマンドとなります)。 1 $ Solubility.rb -i tst_out.dsc -d tch_out.dsc -o tst_sol.out -m w p > tst_sol .err 2>&1 2 $ ruby -I <path: Solubility/> <path: Solubility.rb> -i tst_out.dsc -d tch_out.dsc -o tst_sol.out -m w p > tst_sol.err 2>&1 ※ スイッチ: "-i" = 入力記述子ファイル, "-d" = DB 記述子ファイル, "-o" = 溶解度推算結果, "-m" = 重み付き学習法 {w(ln)/n(o)} 及び回帰関数 {p(ls)/m(lr)} 切り替え ※ 実行時には次のディレクトリをカレント以下に作成するので注意してください。 入力記述子ファイルと同名ディレクトリ: テンポラリ、エラー詳細ファイルを格納 ④ 計算結果の内容(sample17/sol/) 得られた計算結果ファイル(tst_sol.out)には以下の様な項目が有ります。入力分子の 記述子に logS 値が指定されていれば推算精度も計算されます。 推算結果: 項目 内容 ID 入力分子 ID tchC1 データベースの回帰直線の係数 C1: y = C1 * x + C2 tchC2 データベースの回帰直線の係数 C2: y = C1 * x + C2 tchR2 データベースの決定係数 tchAveErr データベースの平均エラー tchMaxErr データベースの最大エラー(絶対値が最大) tchWL 重み付き学習時の追加デコイ数 tstExp 入力分子の logS(実験値) tstPre 入力分子の logS(推算値) tstErr 入力分子の推算エラー(絶対値) 推算精度: 項目 内容 tstC1 全入力分子の回帰直線の係数 C1: y = C1 * x + C2 tstC2 全入力分子の回帰直線の係数 C2: y = C1 * x + C2 tstR2 全入力分子の決定係数 tchAveErr 全入力分子の平均エラー tchMaxErr 全入力分子の最大エラー(絶対値が最大) (3)アグリゲータ予測(sample17/agg/, sample17/agg_trgt/) 最後に、アグリゲータ予測の計算は以下の手順で行います。データベースの logS 頻度分布 からベイジアン解析によって logS 依存のアグリゲータ存在確率を求め、これをシグモイド myPresto 4.2 165 関数でフィッティングします。その後、得られたシグモイド関数を使って入力分子のアグ リゲータ予測を行います。 アグリゲータ予測の手順は以下の通りです。 ① 溶解度の推算(sample17/agg/dsc/, sample17/agg/sol/) (1)の通りに記述子の計算を行い、(2)の通りに溶解度推算を行います。 ※ 溶解度推算には(1)で計算したデータベースを利用します。 $ cp ../dsc/tch_out.dsc sol/ ※ (1)で計算したデータベースを利用 $ cd dsc $ Descriptor.rb ?i aggs ?l agg_inp.lst ?o agg_out.dsc > agg_out.err 2>&1 $ Descriptor.rb ?i nons ?l non_inp.lst ?o non_out.dsc > non_out.err 2>&1 $ cp *_out.dsc ../sol $ cd ../sol $ Solubility.rb ?i agg_out.dsc ?d tch_out.dsc ?o agg_sol.out ?m w p > agg_sol.err 2>&1 $ Solubility.rb ?i non_out.dsc ?d tch_out.dsc ?o non_sol.out ?m w p > non_sol.err 2>&1 ② logS 頻度分布の作成(sample17/agg/sol/) 溶解度の推算結果より、アグリゲータ及び非アグリゲータの logS 頻度分布を別個に作成 します。計算は現ディレクトリにおいて以下のコマンドで実行します(インストール場 所にパスが通っていない場合は 2 番目のコマンドとなります)。 1 $ FreqMaker.rb -i agg_sol.out -w 0.5 -o agg.frq $ FreqMaker.rb -i non_sol.out -w 0.5 -o non.frq 2 $ ruby -I <path: Aggregator/> <path: FreqMaker.rb> -i agg_sol .out -w 0.5 -o agg.frq $ ruby -I <path: Aggregator/> <path: FreqMaker.rb> -i non_sol .out -w 0.5 -o non.frq ※ スイッチ: "-i" = 溶解度推算ファイル, "-w" = ヒストグラム幅, "-o" = ヒストグラムファイル その後、アグリゲータ及び非アグリゲータの頻度分布をエディタ等で一つに纏めます(こ れは手作業で行います)。纏めた logS 頻度分布は、以下の書式に従う様にします。 $ less agg_non.frq -4.5 5 9 ※ <logS> <アグリゲータ度数> <非アグリゲータ度数> -4.0 5 11 … ③ ベイジアン解析及びフィッティングの実行(sample17/agg/sol/) logS 頻度分布からベイジアン解析によりアグリゲータの存在確率を計算します。なお、 入力に必要なシグモイド関数の係数初期値は、グラフ等を作成して適宜探索する必要が あります。計算は現ディレクトリにおいて以下のコマンドで実行します(インストール 場所にパスが通っていない場合は 2 番目のコマンドとなります)。 myPresto 4.2 166 1 2 $ bys -d agg_non.frq ※ グラフ用データを作成(fitting しない) $ bys -d agg_non.frq -i 1.35 -4.7 ※ 係数初期値はグラフを見て決定 $ <path: bys> -d agg_non.frq $ <path: bys> -d agg_non.frq -i 1.35 -4.7 ※ スイッチ: "-d" = データベースファイル, "-i" = シグモイド関数の係数初期値 c1 = a, c2 = b 係数値は入力ファイル名と同名の係数ファイル(agg_non.cff)に出力されます。 なお、フィッティングするシグモイド関数の定義は以下の通りです。 Pagg (log S ) = 1 1+ e 1.0E+00 14 9.0E-01 12 8.0E-01 10 8 6 agg 4 non 7.0E-01 6.0E-01 Probability Frequency 16 a (log S −b ) 5.0E-01 2 4.0E-01 prb 3.0E-01 2.0E-01 sig 1.0E-01 0 0.0E+00 -1.5E+01 -1.0E+01 logS(Calc.) -5.0E+00 0.0E+00 5.0E+00 logS(Calc.) ④ アグリゲータの予測(sample17/agg_trgt/dsc/, sample17/agg_trgt/sol/) アグリゲータの予測は、フィッティングで得られたシグモイド関数を使って行います。 予測対象の logS 実験値が存在しない場合、前述に倣って(1)記述子計算、(2)溶解度推算 を行います。ここでは LigandBox から抽出した下記条件(分子量および N 原子、O 原子の 含有率)の組み合わせ、全 9 セットについて計算を行います。 MW(Da) % of N,O 200 <= * < 300 0 <= * < 15 300 <= * < 400 15 <= * < 30 400 <= * < 500 30 <= * <= 100 まず、全 9 セットについて(1)の通りに記述子の計算を行い、(2)の通りに溶解度推算を 行います。以下は MW={200<=*< 300}かつ%ofN,O={ 0<=*< 15}の例です。 $ cp ../dsc/tch_out.dsc dsc/ ※ (1)で計算したデータベースを利用 $ cd dsc $ Descriptor.rb ?i pcts200-300_0-15 ?l pcts200-300_0-15.lst ?o pcts200-300_0-15_out.dsc > pcts200-300_0-15_out.err 2>&1 ※ 他の pcts<mw>_<no%>についても同様 $ cp pcts200-300_0-15_out.dsc ../sol $ cd ../sol $ Solubility.rb ?i pcts200-300_0-15_out.dsc ?d tch_out.dsc ?o pcts200-300_0-15_sol.out ?m w p > pcts200-300_0-15_sol.err 2>&1 ※ 他の pcts<mw>_<no%>についても同様 他の条件セットについても同様に計算します。 myPresto 4.2 167 アグリゲータ予測は、③で得られたシグモイド関数の係数値を利用するので、当該ファ イルを現ディレクトリ(sample17/agg_trgt/sol/)にコピーします。 $ cp ../../agg/agg_non.cff . ※ ③で計算した係数値を利用 計算は現ディレクトリにおいて以下のコマンドで実行します(インストール場所にパス が通っていない場合は 2 番目のコマンドとなります)。 以下は MW={200<=*< 300}かつ%ofN,O={ 0<=*< 15}の例です。 1 $ bys -c agg_non.cff -t pcts200-300_0-15_sol.out -n 10 9 2 $ <path: bys> -c agg_non.cff -t pcts200-300_0-15_sol.out -n 10 9 ※ スイッチ: "-c" = 係数ファイル, "-t" = 入力ファイル, "-n" = 入力ファイル列数, logS 列番号 ※ logS 列番号は 1 からカウント 予測結果は入力ファイル名と同名の結果ファイル(例:pcts200-300_0-15_sol.est)に出 力されます。他の条件セットについても同様に計算します。 ⑤ 予測結果の内容(sample17/agg_trgt/sol/) 得られた計算結果(例:pcts200-300_0-15_sol.est)では以下の様な項目が出力されます。 推算情報: 項目 内容 (c1, c2, err) シグモイド関数の係数及びエラー total_no 全入力分子数 avg_est(%) 平均アグリゲータ確率 avg_mkr 平均 logS 値 推算結果: 項目 内容 id 入力分子 ID maker 入力分子 logS 値 estimation 入力分子アグリゲータ確率 myPresto 4.2 168 5.18 Sample-18:CAP 水を用いた生理食塩水中での蛋白質と化合物の複合体の系の計算 蛋白質2量体である HIV プロテアーゼに、化合物が結合した複合体を、生理食塩水中で CAP 水(孤立系)で、NVT 計算をします。 tplgene は、蛋白質―化合物―イオン―水の入った系を一度に処理することができるので、 この機能を活用すると、トポロジーファイルのマージ操作なしに簡便に系を組み立てる手 法を紹介します。 蛋白質は PDB などからダウンロードすることが多いですが、化合物は、化合物データベ ースから抜き出した mol2 ファイルか、手作業で作成した mol2 ファイル、ないし PDB のリ ガンドそのもの、などいろいろな場合が考えられます。 使用するスクリプトは以下の通りです。 0_1_make.sh 0_2_capbc.sh 0_3_shake.sh 上記スクリプト中のプログラムのディレクトリーは、環境に応じて書き変えてください。 なお、蛋白質がジスルフィド結合を含む場合(PDB ファイルに SSBOND 行がある)、tplgene で生成される PDB ファイルに SSBOND 行が記載されないため、作業手順は、より複雑になり ます。 ステップ1: まず、PDB から、1htf.pdb をダウンロードします。必要なファイルは、1htf_complex_org にあります。下記のコマンドを実行し、ディレクトリごとコピーしてください。 % cp ?R 1htf_complex_org work 以下の操作は、work (cd work)で行ってください。ディレクトリに入っているファイル は、以下の 3 つです。 1htf.crd :修正したタンパク質のみの PDB 1htf.pdb :PDB からダウンロードしたファイルそのもの。例では使用しない。 Lig.mol2 :リガンドの mol2 ファイル。 リガンドの mol2 ファイルの作成については、詳細は省略します。PDB 座標(Lig.pdb)から の作成であれば、原子電荷が Gasteiger 法になりますが、下記のコマンドを実行すること で簡易に作成することができます。 % Hgene ?ipdb Lig.pdb ?p ?omol2 Lig.mol2 myPresto 4.2 169 1htf.pdb が、PDB の元のファイルです。ここから、蛋白質部分のみを切り出し、1htf.crd とします。HIV プロテアーゼは2量体で、25番の ASP2つが、ダイマー界面で向かい合い、 片方の ASP は、H 化されています。そこで、1htf.crd の A 鎖の25番の残基名 ASP を、ASH と書き変えます。 tplgene で、1htf.crd から、Pro.pdb/Pro.tpl を生成してください。tplgene の入力は以 下のようにします。 pro end pro end 1 1 C99_aa.tpl 1htf.crd Pro.pdb Pro.tpl pro1 pro2 ステップ2: もっとも簡単には、下記のコマンドを実行することにより、Pro.pdb, Pro.tpl, Lig.mol2 から、数分で、複合体の系 Pro_1.pdb, Pro_1.tpl, 位置拘束ファイル M_all.res を生成 します。 % ../0_1_make.sh 0_1_make.sh の代わりに手作業で行う時の手順を説明します。Tplgene は、蛋白質―化合 物―イオン―水の入った系を一度に処理することができますが、化合物に関しては、 tplgeneL で処理された情報をマージするようになっています。ですので、あらかじめ、低 分子を tplgeneL で処理する必要があります。低分子は、Lig.mol2 とし、tplgeneL への入 力は以下のようにします。 2 Lig.mol2 1 myPresto 4.2 170 こうして、Lig.tpl Lig_tplL.pdb を用意します。 全原子の蛋白質の座標 Pro.pdb に、化合物の座標 Lig_tplL.pdb をマージして、Pro_0.pdb を作ります。 Pro_0.pdb を setwater にかけて、水を発生します。setwater への入力は以下のようにし ます。 Pro_0.pdb N :結晶水は使わない wat.pdb S :球状に水を付けます -10.0 :蛋白質―化合物の系から、球の表面までの最短距離を 10Åに設定します。 C :蛋白質―化合物の系の重心を、系の中心にします。 1.0 1.0 3 こうして発生した水を系に加え、新たに座標 Pro.pdb を作ります。この系に対し、生理 食塩水濃度で塩を add_ion で加えます。add_ion への入力は以下のようにします。 Pro.pdb :蛋白質―化合物―水の系 Pro_0.pdb :イオンで置換される水を除いた蛋白質―化合物―水の系 ion.pdb replace.pdb 3 :濃度を指定します。 0.00277 :生理食塩水濃度を指定 6.0 :標準的な、付加するイオン間の最短距離。 Pro_0.pdb と、ion.pdb をマージすることで、:蛋白質―化合物―イオン―水の系を作り ます。後は 、この 系を tplgene で 処理す れ ば、蛋白質―化合物― イオン― 水の系の PDB(Pro_1.pdb)とトポロジーファイル(Pro_1.tpl)が生成されます。 もし蛋白質にジスルフィド結合があり、PDB に SSBOND 行の記載が必要な場合、Pro_x.pdb に含まれる蛋白質の PDB 座標は、SSBOND 行を含む元の PDB ファイルに差し替えてください。 その際、tplgene への入力ファイルは以下のようにします。 myPresto 4.2 171 pro end pro end 1 1 C99_aa.tpl Pro_x.pdb Pro_1.pdb Pro_1.tpl 1 Lig.tpl pro1 pro2 最後に、蛋白質の鎖の数(1:単量体、2:2量体)に合わせて、位置拘束ファイルを 選んで M_all.res にコピーします。 ステップ3: Cap 拘束ファイルを作ります。下記のコマンドを実行することで capbc が作成されます。 % ../0_2_capbc.sh ただし、このスクリプトは、参考までに作られたものなので、出来上がった capbc は、 適当に手で修正してください。蛋白質の鎖が2本の場合のみに、まともな capbc が作成さ れ、それ以外の場合は手作業での修正が必要です。 ステップ4: 位置拘束ファイルを用いながら、下記のコマンドを実行してエネルギー最小化をしてく ださい。 % cosgene < ../min.inp ステップ5: エネルギー最小化が済めば、必要に応じて、SHAKE 入力ファイルを作成します。下記のコ マンドを実行して下さい。 myPresto 4.2 172 % ../0_3_shake.inp SHAKE の入力ファイルは、エネルギー最小化された安定な構造を元に作成しないと、SHAKE アルゴリズムの収束が悪く、MD 計算が途中で破綻する原因となります。 ステップ6: SHAKE を用いた MD を行います。下記のコマンドを実行して下さい。 % cosgene < ../md_w.inp 以上で終了です。個別の系では、蛋白質の鎖の数、化合物の数(補因子とリガンドなど) が異なるため、少し手順を変える必要はありますが、基本はほぼ同じです。 【注意】tplgene では、蛋白質の鎖(チェイン)は、TER 行のみで認識されます。TER がな いと、どんなに離れたアミノ酸残基同士でも、アミノ酸残基番号が連続でなくても、アミ ド結合で1本のペプチド鎖として連結します。add_ion や cosgene を通すと、TER 行が失わ れ,tplgene に再度通すと正しく処理できません。手で後から TER 行を追加するか、TER 行 の記載されたファイルを使う必要があります。また、tplgene, cosgene, add_ion などのツ ールでは、SSBOND 行も失われます。SSBOND を含む蛋白質では、SSBOND 行が失われたファイ ルを用いて tplgene でファイルを再作成すると、正しいファイルが生成されません。 【注意】化合物、水、イオンは、HETATM 行で認識されます。ATOM 行で、これらを記述する と、tplgene では処理できません。 myPresto 4.2 173 5.19 Sample-19:周期系を用いた生理食塩水中での蛋白質の系の NPT 計算 蛋白質2量体である HIV プロテアーゼを、結晶水を利用して生理食塩水中で NPT 計算を します。 tplgene は、蛋白質―イオン―水の入った系を一度に処理することができるので、この機 能を活用すると、トポロジーファイルのマージ操作なしに簡便に系を組み立てる手法を紹 介します。 使用するスクリプトは以下の通りです。 0_1_make.sh :系の作成 0_CTRL :エネルギー最小化 1_CTRL :より丁寧なエネルギー最小化 2_CTRL :蛋白質を固定した NVT 3_CTRL_npt MD 計算 :NPT 計算 上記スクリプト中のプログラムのディレクトリーは、環境に応じて書き変えてください。 なお、蛋白質がジスルフィド結合を含む場合(PDB ファイルに SSBOND 行がある)、tplgene で生成される PDB ファイルに SSBOND 行が記載されないため、作業手順は、より複雑になり ます。 ステップ1: まず、PDB から、1htf.pdb をダウンロードします。必要なファイルは、1htf_complex_org にあります。下記のコマンドを実行し、ディレクトリごとコピーしてください。 % cp ?R 1htf_complex_org work 以下の操作は、work (cd work)で行ってください。ディレクトリに入っているファイル は、以下の 2 つです。 1htf.crd :修正したタンパク質のみの PDB 1htf.pdb :PDB からダウンロードしたファイルそのもの。例では使用しない。 系(1htf.pdb)には、リガンドと結晶水が含まれますが、リガンドは無視して、アポ体構 造の計算をすることにします。 1htf.pdb が、PDB の元のファイルです。ここから、蛋白質部分のみを切り出し、1htf.crd とします。HIV プロテアーゼは2量体で、25番の ASP2つが、ダイマー界面で向かい合い、 片方の ASP は、H 化されています。そこで、1htf.crd の A 鎖の25番の残基名 ASP を、ASH と書き変えます。 myPresto 4.2 174 ステップ2: もっとも簡単には、下記のコマンドを実行することにより、Pro.pdb, Pro.tpl, Lig.mol2 から、数分で、複合体の系 Pro_1.pdb, Pro_1.tpl, 位置拘束ファイル M_all.res を生成 します。 % ../0_1_make.sh 0_1_make.sh の代わりに手作業で行う時の手順を説明します。tplgene で、1htf.crd から、 Pro.pdb/Pro.tpl を生成してください。tplgene の入力は以下のようにします。 pro end pro end 1 1 C99_aa.tpl 1htf.crd Pro.pdb Pro.tpl 1 :TIP3P 水の選択 pro1 pro2 Pro_0.pdb を setwater にかけて、水を発生します。Setwater への入力は以下のようにし ます。 Pro_0.pdb Y :結晶水は使わない Pro_0.pdb : Pro_0.pdb に含まれる結晶水を利用します。 wat.pdb C :直方体セルの形状で水を付けます -10.0 -10.0 -10.0:蛋白質―化合物の系から、セルの X,Y,Z 表面までの最短距離を 10Å に設定します。 C :蛋白質―化合物の系の重心を、系の中心にします。 1.0 1.0 3 myPresto 4.2 175 こうして発生した水を系に加え、新たに座標 Pro.pdb を作ります。この系に対し、生理 食塩水濃度で塩を add_ion で加えます。add_ion への入力は以下のようにします。 Pro.pdb :蛋白質―化合物―水の系 Pro_0.pdb :イオンで置換される水を除いた蛋白質―化合物―水の系 ion.pdb replace.pdb 3 :濃度を指定します。 0.00277 :生理食塩水濃度を指定 6.0 :標準的な、付加するイオン間の最短距離。 Pro_0.pdb と、ion.pdb をマージすることで、:蛋白質―水―イオンの系を作ります。後 は、この系を tplgene で処理すれば、蛋白質―水−イオンの系の PDB(Pro_1.pdb)とトポロ ジーファイル(Pro_1.tpl)が生成されます。 もし蛋白質にジスルフィド結合があり、PDB に SSBOND 行の記載が必要な場合、Pro_x.pdb に含まれる蛋白質の PDB 座標は、SSBOND 行を含む元の PDB ファイルに差し替えてください。 その際の tplgene の入力ファイルは以下のようにします。 pro end pro end 1 1 C99_aa.tpl Pro_x.pdb Pro_1.pdb Pro_1.tpl 1 Lig.tpl pro1 pro2 最後に、蛋白質の鎖の数(1:単量体、2:2量体)に合わせて、位置拘束ファイルを 選んで M_all.res にコピーします。 myPresto 4.2 176 ステップ3: wat.pdb の末尾に記載されるセルの中心座標、セルの辺の長さを cosgene 用制御ファイル に書き込みます。 ■wat.pdb の末尾の例 REMARK SETWATER(v2.0) RESULTS REMARK TARGET MOLECULE -> Pro_0.pdb REMARK CRYSTAL WATER -> Pro_0.pdb REMARK CELL -> C 60.137000 66.351000 76.464000 REMARK CENTER -> C 23.581327 -0.029227 -0.004452 REMARK DENSITY -> 1.000000 REMARK DAMP F. -> 1.000000 REMARK NUMBER OF CRYSTAL WATER : 0 REMARK NUMBER OF WATER MOLECULE : 8785 REMARK NUMBER OF WATER ATOM : 26355 (PROBE R. = 1.400000A) セルの辺の長さは、CELL、重心は CENTER に出力されるので、cosgene 用制御ファイル (0_CTRL, 1_CTRL, 2_CTRL, 3_CTRL_npt)に以下のように記載します。 ■制御ファイルへの記載例 CENTRX = 23.581327 ; X CENTRY = -0.029227 ; Y CENTRZ = -0.004452 ; Z LXCELL = 60.137000 ; X LYCELL = 66.351000 ; Y LZCELL = 76.464000 ; Z ステップ4: セルサイズを固定したまま、以下のコマンドでエネルギー最小化をしてください。 % cosgene < ../0_CTRL 最初のエネルギー最小化が済めば、以下のコマンドで2回目のより丁寧なエネルギー最 小化をしてください。 % cosgene < ../1_CTRL myPresto 4.2 177 NPT 計算は、わずかな原子間衝突のエネルギーなどで、系が壊れますので、孤立系に比べて 丁寧な系の準備が必要です。 ステップ5: エネルギー最小化が済めば、蛋白質を固定した MD 計算で、溶媒の平衡化を行います。下 記のコマンドを実行して下さい。 % cosgene < ../2_CTRL ステップ6: Berendsen の方法を用いた NPT MD を行い、セルサイズを決定します。以下のコマンドを 実行して下さい。 % cosgene < ../3_CTRL 【注意】Berendsen の方法では、カノニカルアンサンブルは実現されません。 以上で終了です。セルサイズが決まれば、NVT 計算に移行してもよいですし、更に NPT 計 算を続ける場合、厳密にカノニカルアンサンブルを実現できるパリネロ・ラーマンの方法 やアンデルセンの方法に移行しても良いです。最初から厳密な手法を適用すると、系が壊 れやすいです。個別の系では、蛋白質の鎖の数、化合物の数(補因子とリガンドなど)が 異なるため、少し手順を変える必要はありますが、基本はほぼ同じです。 【注意】tplgene では、蛋白質の鎖(チェイン)は、TER 行のみで認識されます。TER がな いと、どんなに離れたアミノ酸残基同士でも、アミノ酸残基番号が連続でなくても、アミ ド結合で1本のペプチド鎖として連結します。add_ion や cosgene を通すと、TER 行が失わ れ,tplgene に再度通すと正しく処理できません。手で後から TER 行を追加するか、TER 行 の記載されたファイルを使う必要があります。また、tplgene, cosgene, add_ion などのツ ールでは、SSBOND 行も失われます。SSBOND を含む蛋白質では、SSBOND 行が失われたファイ ルを用いて tplgene でファイルを再作成すると、正しいファイルが生成されません。 【注意】化合物、水、イオンは、HETATM 行で認識されます。ATOM 行で、これらを記述する と、tplgene では処理できません。 myPresto 4.2 178 (余白) myPresto 4.2 179 A 入出力ファイル A.1 構造探索エンジンの入出力ファイル 構造探索エンジンは、以下の目的でファイルの入出力を行う。 (1)シミュレーション条件の指定 (2)シミュレーション状態の保存 (3)シミュレーション結果の出力 これらのファイルを総称して入出力ファイルと呼ぶ。 A.1.1 フェーズの説明 構造探索エンジンは、以下のフェーズでファイルの入出力を行う。 (1)INPUT フェーズ 系のトポロジー、座標、シミュレーション条件などのファイルの入力 。 (2)OUTPUT フェーズ シミュレーション後の系のトポロジー、座標のファイル出力。 (3)MINimize フェーズ 系のポテンシャルエネルギーの最小化。 (4)MD フェーズ 系の分子動力学シミュレーション。 myPresto 4.0 180 A.2 入力ファイル 構造探索エンジンの入力ファイルを以下に示す。 項番 ファイル名称 対 象 - 用 途 #1 制御ファイル 構造探索エンジンの制御 #2 トポロジーファイル 全フェーズ シミュレートする系のトポロジー指定 #3 座標ファイル 全フェーズ シミュレートする系の原子座標指定 #4 SHAKE ファイル MIN, MD SHAKE 対象原子と拘束距離の指定 #5 固定原子・自由原子指定 MIN, MD 自由/固定原子の指定 ファイル #6 CAP 指定ファイル 全フェーズ セル形状、CAP 拘束の指定 #7 拡張 CAP 指定ファイル 全フェーズ 拡張 CAP 拘束の指定 #8 位置拘束ファイル 全フェーズ 位置拘束の指定 #9 距離拘束ファイル 全フェーズ 距離拘束の指定 #10 二面角拘束ファイル 全フェーズ 二面角拘束の指定 #11 モニター指定ファイル MD モニター対象の指定 #12 系 の重 心 合 わ せ指 定 用 MIN, MD 重心合わせ対象原子の指定 MIN, MD GB/SA 及び ASA 用パラメータの指定 ファイル #13 系の GB/SA 及び ASA 用パ ラメータ指定ファイル #14 リスタートファイル MD リスタート情報の指定 #15 剛体モデルファイル MD 剛体モデル対象原子の指定 myPresto 4.2 181 A.2.1 制御ファイル 対象フェーズ:全フェーズ 用途:構造探索エンジンの実行フェーズ制御とフェーズに指定するパラメータを指定する。 特記事項: 実数の指数を示す文字は”D”でなければならない。 実数指数の指定例) CPUTIM = 60.0D0 書式: [実行フェーズ指定行 [フェーズ内パラメータ指定行 ]... パラメータ終了行 ]... 実行フェーズ指定行:実行するフェーズを以下の文字列で指定する。 INPUT フェーズ = OUTPUT フェーズ MINimize フェーズ “EXE> INPUT” = “EXE> OUTPUT” = “EXE> MIN” MD フェーズ = “EXE> MD” 実行終了行 = “EXE> END” パラメータ終了行:フェーズ内パラメータ指定行の終了を以下の形式で指定する。 “QUIT” フェーズ内パラメータ指定:各フェーズのパラメータを以下の形式で指定する。 キーワード “=” 値 ※キーワードは英字6文字で構成され、値はキーワードに対応し、選択型、実数型、整数 型、文字型の4種類である。 myPresto 4.2 182 キーワード指定例) UNITAN = 30 ; 整数型パラメータ NAMEAN = aa.ana ; 文字型パラメータ BINCLO = NO ; 選択型パラメータ CPUTIM = 60.0D0 ; 実数型パラメータ 以下、各フェーズのキーワードと値を示す。英字の大文字が有効となる。 また、「内容」列の括弧内は、「値」列の形式に従い、次の項目を記述する。 ・選択型 :大文字は指定文字、アンダーライン付はデフォルト値 ・整数型、実数型、文字型 :デフォルト値 A.2.1.1 INPUT フェーズ 項番 #1 項 目 入力トポロジー キーワード TOPOLOgy 値 内 容 選択型 ファイルの読み込みと形式 (NOREad │ FORMatted │ BINAry) #2 UNITTOpology 整数型 装置番号(10) #3 NAMETOpology 文字型 ファイル名("") COORDInate 選択型 ファイルの読み込みと形式 #4 入力原子座標 (NOREad │ PDB │ BINAry) #5 UNITCOordinate 整数型 装置番号(11) #6 NAMECOordinate 文字型 ファイル名("") SETSHAke 選択型 ファイルの読み込み #7 入力 SHAKE 情報 (NOREad │ READ │ AUTO) #8 UNITSHake 整数型 装置番号(12) #9 NAMESHake 文字型 ファイル名("") DBGSHA 選択型 ファイルの書き込み #10 出力 SHAKE 自動 作成情報 (NOWRite │ ASCIi) #11 UNITDS 整数型 装置番号(84) #12 NAMERS 文字型 ファイル名("") SETVARiables 選択型 ファイルの読み込み #13 入力固定原子 情報 (NOREad │ READ) #14 UNITVAribles 整数型 装置番号(13) #15 NAMEVAriables 文字型 ファイル名("") myPresto 4.2 183 #16 入力境界条件 SETBOUndary 選択型 ファイルの読み込み (NOREad │ READ) #17 UNITBOundary 整数型 装置番号(14) #18 NAMEBOundary 文字型 ファイル名("") SETEXC 選択型 ファイルの読み込み #19 入力拡張 CAP 情報 (NOREad │ READ) #20 UNITEC 整数型 装置番号(23) #21 NAMEEC 文字型 ファイル名("") REFCOOrdinate 選択型 ファイルの読み込みと形式 #22 入力位置拘束 座標 (NOREad │ PDB) #23 UNITREfcoordinate 整数型 装置番号(15) #24 NAMEREFcoordinate 文字型 ファイル名 POSITIonrestrain 選択型 ファイルの読み込み #25 入力位置拘束 情報 (NOREad │ READ) #26 UNITPOsition 整数型 装置番号(16) #27 NAMEPOsition 文字型 ファイル名("") DISTANcerestrain 選択型 ファイルの読み込み #28 入力距離拘束 情報 (NOREad │ READ) #29 UNITDIstance 整数型 装置番号(17) #30 NAMEDIstance 文字型 ファイル名("") DIHEDRalrestrain 選択型 ファイルの読み込み #31 入力二面角拘束 情報 (NOREad │ READ) #32 UNITDH 整数型 装置番号(18) #33 NAMEDH 文字型 ファイル名("") OUTMONitoritems 選択型 ファイルの読み込み #34 入力モニター 対象構造情報 (NOREad │ READ) #35 UNITMOnitoritems 整数型 装置番号(19) #36 NAMEMOnitoritems 文字型 ファイル名("") ASAREA 選択型 ファイルの読み込み #37 入力 GB/SA 及び ASA 用パラメー #38 タ情報 #39 #40 入力 UMBRELLA (NOREad │ READ) UNITSA 整数型 装置番号(77) NAMESA 文字型 ファイル名("") UMBREL 選択型 ファイルの読み込み 拘束情報 #41 (NOREad │ READ) UNITUI 整数型 装置番号(22) myPresto 4.2 184 #42 #43 系の重心の NAMEUI 文字型 ファイル名("") SETORIgin 選択型 センタリングの指定 センタリング (NO │ YES) A.2.1.2 OUTPUT フェーズ 項番 #1 項 目 出力トポロジー キーワード TOPOLOgy 値 内 容 選択型 ファイルの書き込みと形式 (NOWRite │ FORMatted │ BINAry) #2 UNITTOpology 整数型 装置番号(90) #3 NAMETOpology 文字型 ファイル名("") COORDInate 選択型 ファイルの書き込みと形式 #4 出力原子座標 (NOWRite │ PDB │ BINAry) #5 UNITCOordiante 整数型 装置番号(91) #6 NAMECOordinate 文字型 ファイル名("") #7 RMSDCOordinate 選択型 ファイルの書き込みと形式 (NOWRite │ PDB │ BINAry ) myPresto 4.2 185 A.2.1.3 MINimize フェーズ 項番 項 目 キーワード 値 内 容 #1 MIN エネルギー UNITAN 整数型 装置番号(30) #2 データ NAMEAN 文字型 ファイル名("") #3 ジョブ制御 CPUTIMelimit 実数型 CPU 時間上限(60.0) #4 MONITOrinterval 整数型 ログ出力間隔(10) #5 LOGFORmat 選択型 ログ出力形式 (SHORt │ DETAil) BESTFItmini #6 選択型 (least square fitting)値の表示 (NO │ YES) RMSDFIirst #7 整数型 RMSD 計算対象先頭チェイン番号 (1) RMSDLAst #8 整数型 RMSD 計算対象最終チェイン番号 (1) #9 エネルギー METHODofmini 選択型 最小化 計算方法 (STEEpest │ CONJugate) #10 LOOPLImit 整数型 MINIMIZE ループ回数(0) #11 CONVGRadient 実数型 収束 RMSF 値(0.1) #12 ISTEPLength 実数型 初期ステップ長(0.01) #13 UPRATE 実数型 STEEP 法ステップ長上方倍率 (1.2) DOWNRAte #14 実数型 STEEP 法ステップ長下方倍率 (0.6) #15 LINESEarchlimit 整数型 CONJUGATE 法ループ回数(10) #16 CONVLInesearch 実数型 CONJUGATE 法収束条件(0.1) CALBONd 選択型 bond 力の計算 #17 相互作用計算 (CALC │ NOCAlc) #18 CALANGle 選択型 angle 力の計算 (CALC │ NOCAlc) #19 CALTORsion 選択型 torsion 力の計算 (CALC │ NOCAlc) #20 CALIMProper 選択型 improper 力の計算 (CALC │ NOCAlc) #21 CALV14 選択型 1-4 van der Waals 力の計算 (CALC │ NOCAlc) myPresto 4.2 186 CALE14 #22 選択型 1-4 静電力の計算 (CALC │ NOCAlc) CUTMEThod #23 選択型 カットオフ方法 (RESC │ ATOM │ RESA) #24 CUTLENgth 実数型 カットオフ長(8.0) #25 USESPL 選択型 スプライン補間の適用 (NO │ YES) #26 CUT-ON 実数型 スプライン開始距離(6.0) #27 UPDATEinterval 整数型 相互作用テーブル更新間隔(20) #28 CALV15 選択型 カットオフあり 1-5vdW 力計算 #29 CALE15 #30 CALHYD (CALC │ NOCAlc) 選択型 カットオフあり 1-5 静電力計算 (CALC │ NOCAlc) 選択型 カットオフあり 1-5 水素力計算 (CALC │ NOCAlc) CALV5N #31 選択型 カットオフなし 1-5vdW 力計算 (CALC │ NOCAlc) CALE5N #32 選択型 カットオフなし 1-5 静電力計算 (CALC │ NOCAlc) CALH5N #33 選択型 カットオフなし 1-5 水素力計算 (CALC │ NOCAlc) DIEFUNction #34 選択型 静電の距離依存 (CONS │ DIST) #35 #36 PME 法, DIEVALue 実数型 静電の係数(1.0) CALPME 選択型 PME 法の実行 Ewald 法 #37 (NO │ YES) CALEWAld 選択型 Ewald 法の実行 (NO │ YES) #38 PMESPD 選択型 PME 法での計算間隔の調整 (NORM │ HIGH) #39 PMEUPD 選択型 PMESPD= HIGH の場合の計算方法 (CUT │ RECI) #40 REATOL 実数型 Ewald 法での許容誤差(1.0d-19) #41 EWAPAR 実数 PME 法、Ewald 法での逆空間計算 係数(0.35) myPresto 4.2 187 #42 PMEORDer 整数型 PME 法多重極展開数(5) #43 MESHLX 整数型 PME 法 x 軸メッシュ数(16) #44 MESHLY 整数型 PME 法 y 軸メッシュ数(16) #45 MESHLZ 整数型 PME 法 z 軸メッシュ数(16) USEFMM 選択型 FMM 法の実行(NO │ YES) FMMSPD 選択型 FMM 法での計算間隔の調整 #46 FMM 法 #47 (NORM │ HIGH) #48 FMTREE 整数型 FMM 法 Tree サイズ (3) #49 FMPOLE 整数型 FMM 法多重極展開数(8) #50 FMNUMA 整数型 FMM 法セル内最大原子数(1000) CALPSR 選択型 位置拘束計算 #51 拘束力計算 (CALC │ NOCAlc) #52 WETPSR 実数型 位置拘束重み(5.0) #53 CALDSR 選択型 距離拘束力計算 (CALC │ NOCAlc) #54 WETDSR 実数型 距離拘束重み(1.0) #55 CALDHR 選択型 二面角拘束力計算 (CALC │ NOCAlc) #56 WETDHR 実数型 二面角拘束重み(10.0) #57 CALREPulsion 選択型 repulsion 力計算 (CALC │ NOCAlc) #58 WETREPulsion 実数型 repulsion 重み(1.0) #59 REPSCAle 実数型 repulsion ス ケ ー ル フ ァ ク タ (1.0) #60 REPDELta 実数型 repulsion 許容誤差(1.0) #61 CALCAP 選択型 cap 拘束力計算 (CALC │ NOCAlc) #62 EXTCAP 選択型 拡張 cap 拘束力計算 (CALC │ NOCAlc) #63 RADCAP 実数型 cap 半径(20.0) #64 FORCAP 実数型 cap係数(150.0) #65 FUNCAP 選択型 cap 種別 (HARMonic │ BIQUadratic) #66 TEMPERature 実数型 拘束温度(300.0) myPresto 4.2 188 SHAKEMethod #67 選択型 shake 種別 (NOSHake │ HBONd │ ALLBond) #68 COVSHK 実数型 shake 収束値(1.0D-6) #69 LIMSHK 整数型 shake ループ上限(1000) CAL-GB 選択型 GB 計算(CALC │ NOCAlc) #71 GBWELE 実数型 水の誘電率(78.3) #72 GBMELE 実数型 蛋白の誘電率 (1.0) #73 GBDELT 実数型 Born 半径の補正値 (0.0) #74 GBLAMB 実数型 容積補正値(1.0) #75 GBOFFS 実数型 van der Waals 半径補正値(0.09) CALASA 選択型 ASA 計算(CALC │ NOCAlc) #77 ASAPRO 実数型 PROBE 半径(1.4) #78 ASAWEI 実数型 ASA 重み(1.0) #79 ASACUT 実数型 ASA 用カットオフ長(4.5) BOUNDAry 選択型 基本セルの形状 #70 #76 #80 GB 計算 ASA 計算 境界条件 (NO │ PERI │ ELLIPSoid │ SPHERE) #81 SETCENter 選択型 先頭分子の重心をセルの中心に 設定 (NO │ YES) #82 CENTRX 実数型 セルの中心 x 座標(0) #83 CENTRY 実数型 セルの中心 y 座標(0) #84 CENTRZ 実数型 セルの中心 z 座標(0) #85 LXCELL 実数型 立方体セルの x 軸サイズ(40) #86 LYCELL 実数型 立方体セルのy軸サイズ(40) #87 LZCELL 実数型 立方体セルの z 軸サイズ(40) #88 ELLIPA 実数型 楕円体セルの半径(30) #89 ELLIPB 実数型 楕円体セルの半径(30) #90 ELLIPC 実数型 楕円体セルの半径(30) #91 RADIUS 実数型 SPHERE セルの半径(30) #92 REPLAC 選択型 座標引き戻し方法 (ATOM │ RESI │ CHAI) myPresto 4.2 189 A.2.1.4 MD フェーズ 項番 項 目 キーワード 値 内 #1 リスタート UNITRI 整数型 装置番号(40) #2 ファイル入力 NAMERI 文字型 ファイル名("") #3 リスタート UNITRO 整数型 装置番号(41) #4 ファイル出力 NAMERO 文字型 ファイル名("") #5 原子速度出力 MNTRVElocity 選択型 形式 容 (NO │ ASCIi │ SINGle │ DOUBle) #6 UNITVElocity 整数型 装置番号(43) #7 NAMEVElocity 文字型 ファイル名("") #8 OUTVELocity 整数型 出力間隔(0) MNTRENergy 選択型 形式 #9 エネルギー 情報出力 (NO │ ASCIi │ SINGle │ DOUBle) #10 UNITENergy 整数型 装置番号(44) #11 NAMEENergy 文字型 ファイル名("") #12 OUTENErgy 整数型 出力間隔(0) MNTRCOordinate 選択型 形式 #13 原子位置出力 (NO │ ASCIi │ SINGle │ DOUBle) #14 UNITCOordinate 整数型 装置番号(42) #15 NAMECOordinate 文字型 ファイル名("") #16 OUTCOOrdinate 整数型 出力間隔(0) MNTRTRajectory 選択型 形式 #17 トラジェクトリ ー出力 (NO │ ASCIi │ SINGle │ DOUBle) #18 UNITTRajectory 整数型 装置番号(50) #19 NAMETRajectory 文字型 ファイル名("") #20 OUTTRJ 整数型 出力間隔(0) MNTRTOtalenergy 選択型 形式 #21 総エネルギー (total (NO │ ASCIi │ SINGle │ DOUBle) #22 potential UNITTOtalenergy 整数型 装置番号(59) #23 energy) 出力 NAMETOtalenergy 文字型 ファイル名("") #24 ジョブ制御 CONTINuousjob 選択型 同一ジョブ内の MD 計算間で結果 の物理量を引き継ぐ (NO │ YES) #25 RESTARt 選択型 トラジェクトリ O │ YES) myPresto 4.2 190 OUTRST #26 実数型 自動リスタートファイル出力 秒間隔(0.0): 0 以下は出力しな い #27 OUTRSL 整数型 自動リスタートファイル出力 ループ間隔(0) :0 以下は出力しない #28 NAMETI 文字型 入力座標トラジェクトリ ファイル名("") #29 NUMTRJ 整数型 座標トラジェクトリの位置(0) #30 CPUTIMelimit 実数型 CPU 時間上限(60.0) #31 OUTLOG 整数型 ログ出力間隔(1) #32 LOGFORmat 選択型 ログ出力形式 (SHORt │ DETAil) #33 BESTFIt 選択型 ベストフィットの実行 (NO │ YES) #34 RMSDFIirst 整数型 RMSD 計算対象先頭チェイン 番号 (1) #35 RMSDLAst 整数型 RMSD 計算対象最終チェイン 番号 (1) #36 MD 方法 LOOPLImit 整数型 MD ループ回数(0) #37 TIMESTep 実数型 MD 時間増分(1.0) #38 SETTIMelimit 実数型 シミュレーション時間(5.0) #39 HEATLOop 整数型 昇温ループ回数(0) #40 STARTTempearture 実数型 初期温度(300.0) #41 INITIAlvelocity 選択型 初期速度指定 (ZERO │ SET │ RESEt) #42 RANDOMseed 整数型 初 期 速 度 設 定 用 の乱 数 種 (584287) #43 SETTEMperature 実数型 シミュレーション温度(300.0) #44 TEMPCOntrol2 選択型 温度制御種別 (NO │ YES) #45 STOPCEnterofmass 選択型 系全体の回転、移動を停止 (NO │ TRANslate │ ROTAtion │ BOTH) myPresto 4.2 191 #46 METHOD 選択型 アンサンブル種別 (MICRocanonical│ CANOnical │ NPT │ EXPAnded) #47 THERMOstat 選択型 Canonical アンサンブルの温度制 御種別 (CONStant│ NOSE-hoover) #48 SCLUPD 整数型 GAUSS の束縛法での速度スケーリ ング間隔(0) #49 COUPLIngtime 実数型 Nose-Hoover 法でのカップリング 時間(100.0) #50 BAROSTat 選択型 NPT アンサンブルの圧力制御種 別 (ANDEersen │ PARA │ BEREndsen) #51 MODIFI 選択型 Parrinello Rahman 法でのセル 変形条件 (FLEX │ MONO │ ORTH │ SING │ ISOT ) #52 SETPRE 実数型 設定圧力(1.0) #53 COUPHB 実数型 温度制御用カップリング タイムスケール(1000.0) #54 COUPPI 実数型 圧力制御用カップリング タイムスケール(1000.0) #55 INTEGRation 選択型 積分器の種別 (LEAP-flog │ VELOcity) #56 FREQME 整数型 計算頻度(中)(1) #57 FREQLO 整数型 計算頻度(長)(1) EXPAND-ensemble 選択型 拡張アンサンブル種別 #58 拡張アンサンブ ル (FORCe-bias │ SIMUlated tempering │ GST │ EFFE ) #59 DUMMYLoop 整数型 ダミーループ回数(1) #60 RESETC 整数型 ヒストグラム更新間隔初期値 (300000) #61 BINSIZe 実数型 ヒストグラムのビンサイズ (5.0) #62 ENEMIN 実数型 最小エネルギー(-10000.0) #63 ENEMAX 実数型 最大エネルギー(10000.0) myPresto 4.2 192 #64 TEMMIN 実数型 最小温度(250.0) #65 TEMMAX 実数型 最大温度(700.0) #66 LIMITS 実数型 最小検索閾値 (0.001) #67 LIMITC 実数型 確率密度関数計算閾値(0.001) #68 STTNUM 整数型 温度分割数(100) #69 STEBAS 実数型 最小エネルギー(ベースエネルギー)(0.0) #70 GSTMIN 実数型 パラメータλの下限(0.001d0) #71 GSTMAX 実数型 パラメータλの上限(0.006d0) #72 GSTNUM 整数型 パラメータλの個数(20) #73 GSTUPD 整数型 パラメータλの更新間隔(100) #74 GSTCON 整数型 パラメータλの収束 MD 回数 #75 GSTSAM (10000000) 整数型 パラメータλのすケーリング前 のサンプリング回数(50000) #76 GSTBAS 実数型 最小エネルギー(ベースエネルギー)(25.5) #77 GSTETA 実数型 (0.5) #78 FBRSTO 選択型 FB 分布データファイル出力形式 (NOWR │ ASCI │ DOUB) #79 NAMEFO 文字型 出 力 FB 分布データファイル名 ("") #80 FBRSTI 選択型 FB 分布データファイル入力形式 (NORE │ ASCI │ DOUB) #81 NAMEFI 文字型 入 力 FB 分布データファイル名 ("") #82 UNITFR 整数型 FB 分布データファイル装置番号 (85) #83 UNITEP 整数型 確率データファイルの 装置番号 (78) #84 NAMEEP 文字型 確 率 デ ー タ フ ァ イ ル 名 ("expand.prob") #85 UNITES 整数型 スケール因子データファイルの 装置番号(77) #86 NAMEES 文字型 スケール因子データファイル名 ("expand.scale") myPresto 4.2 193 #87 UNITEE 整数型 エネルギーデータファイルの 装置番号(79) #88 NAMEEE 文字型 エネルギーデータファイル名 ("expand.energy") #89 Tsallis ELOWER 実数型 低エネルギー側閾値(0.0d0) #90 Dynamics EUPPER 実数型 高エネルギー側閾値(0.0d0) #91 ROF1DR 実数型 ρ1 のパラメタ d の条件 #92 ROF2XI 実数型 ρ2 のパラメタξの値 #93 ROF2VX 実数型 ρ2 のパラメタδの条件 #94 ROF2VY 実数型 ρ2 のパラメタγの条件 #95 UNITZT 整数型 zeta 値モニタファイル装置番 号 (80) NAMEZT #96 文字型 zeta 値モニタファイル名 ("zeta_TD.dat") OUTZET #97 整数型 zeta 値モニタファイル出力間 隔 (1) MNTRZT #98 選択型 zeta 値モニタファイル出力形 式 (NO │ ASCI │ SING │ DOUB) UNITCK #99 整数型 Tsallis 積分チェック値モニタ ファイル装置番号(75) NAMECK #100 文字型 Tsallis 積分チェック値モニタ ファイル名("check_TD.dat") OUTCHK #101 整数型 Tsallis 積分チェック値モニタ ファイル出力間隔(1) MNTRCK #102 選択型 Tsallis 積分チェック値モニタ ファイル出力形式 (NO │ ASCI │ SING │ DOUB) #103 #104 分布密度関数 のモニタ出力 UNITDD 整数型 Tsallis 分布密度関数モニタフ ァイル装置番号(83) NAMEDD 文字型 Tsallis 分布密度関数モニタフ ァイル名("") myPresto 4.2 194 OUTDDF #105 整数型 Tsallis 分布密度関数モニタフ ァイル出力間隔(1) MNTRDD #106 選択型 Tsallis 分布密度関数モニタフ ァイル出力形式 (NO │ ASCI │ SING │ DOUB) #107 エネルギーの UNITPK 整数型 装置番号(81) #108 モニタ出力 NAMEPK 文字型 ファイル名("") #109 OUTPKT 整数型 出力間隔(0) #110 MNTRPK 選択型 出力形式(NO │ ASCI │ SING │ DOUB) FLGPKT #111 選択型 出力項目(---, --+, -+-, -++, +--, +-+, ++-, +++) potential, kinetic, total を 3 文字で表し、"+"が出力対象 #112 全体の物理量 UNITQU 整数型 装置番号(82) #113 モニタ出力 NAMEQU 文字型 ファイル名("") #114 (重心、全運動 OUTQUA 整数型 出力間隔(1) #115 量、全角運動 MNTRQU 選択型 出力形式 量、全力、全ト (NO │ ASCI │ SING │ DOUB) ルク、rmsd) #116 相互作用計算 CALBONd 選択型 bond 力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) #117 CALANGle 選択型 angle 力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) #118 CALTORsion #119 CALIMProper 選択型 torsion 力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) 選択型 improper 力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) #120 CALV14 選択型 1-4 van der Waals 力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) #121 CALE14 選択型 1-4 静電力の計算 (CALC │ NOCAlc │ MEDIum │ LONG) #122 CUTMEThod 選択型 カットオフ方法 (RESC │ ATOM │ RESA) #123 CUTLENgth 実数型 カットオフ長(8.0) #124 UPDATEinterval 整数型 相互作用テーブル更新間隔(20) myPresto 4.2 195 USESPL #125 選択型 スプライン補間の適用 (NO │ YES) #126 CUT-ON 実数型 スプライン開始距離(6.0) #127 CALV15 選択型 カットオフあり 1-5vdW 力計算 (CALC │ NOCAlc │ MEDIum │ LONG) CALE15 #128 選択型 カットオフあり 1-5 静電力計算 (CALC │ NOCAlc │ MEDIum │ LONG) CALHYD #129 選択型 カットオフあり 1-5 水素力計算 (CALC │ NOCAlc │ MEDIum │ LONG) CALV5N #130 選択型 カットオフなし 1-5vdW 力計算 (CALC │ NOCAlc │ MEDIum │ LONG) #131 CALE5N #132 CALH5N #133 DIEFUNction 選択型 カットオフなし 1-5 静電力計算 (CALC │ NOCAlc │ MEDIum │ LONG) 選択型 カットオフなし 1-5 水素力計算 (CALC │ NOCAlc │ MEDIum │ LONG) 選択型 静電の距離依存 (CONS │ DIST) #134 #135 PME 法, DIEVALue 実数型 静電の係数(1.0) CALPME 選択型 PME 法の実行 Ewald 法 (NO │ YES) CALEWAld #136 選択型 Ewald 法の実行 (NO │ YES) PMESPD #137 選択型 PME 法での計算間隔の調整 (NORM │ HIGH) PMEUPD #138 選択型 PMESPD= HIGH の場合の計算方法 (CUT │ RECI) #139 REATOL 実数型 Ewald 法での許容誤差(1.0d-19) #140 EWAPAR 実数 PME 法、Ewald 法での逆空間計算 係数(0.35) #141 PMEORDer 整数型 PME 法多重極展開数(5) #142 MESHLX 整数型 PME 法 x 軸メッシュ数(16) #143 MESHLY 整数型 PME 法 y 軸メッシュ数(16) #145 MESHLZ 整数型 PME 法 z 軸メッシュ数(16) USEFMM 選択型 FMM 法の実行(NO │ YES) #146 FMM 法 myPresto 4.2 196 FMMSPD #147 選択型 FMM 法での計算間隔の調整 (NORM │ HIGH) #148 FMTREE 整数型 FMM 法 Tree サイズ (3) #149 FMPOLE 整数型 FMM 法多重極展開数(8) #150 FMNUMA 整数型 FMM セル内最大原子数(1000) CALPSR 選択型 位置拘束計算 #151 拘束力計算 (CALC │ NOCAlc │ MEDIum │ LONG) #152 WETPSR 実数型 位置拘束重み(5.0) #153 CALDSR 選択型 距離拘束力計算 (CALC │ NOCAlc │ MEDIum │ LONG) #154 WETDSR 実数型 距離拘束重み(1.0) #155 CALDHR 選択型 二面角拘束力計算 (CALC │ NOCAlc │ MEDIum │ LONG) #156 WETDHR 実数型 二面角拘束重み(10.0) #157 CALREPulsion 選択型 repulsion 力計算 #158 WETREPulsion 実数型 repulsion 重み(1.0) #159 REPSCAle 実数型 repulsion scale factor (1.0) #160 REPDELta 実数型 repulsion 許容誤差(1.0) #161 CALCAP 選択型 cap 拘束力計算 (CALC │ NOCAlc │ MEDIum │ LONG) (CALC │ NOCAlc │ MEDIum │ LONG) #162 RADCAP 実数型 cap 半径(20.0) #163 FORCAP 実数型 cap係数(150.0) #164 FUNCAP 選択型 cap 種別 (HARMonic │ BIQUadratic) EXTCAP #165 選択型 拡張 cap 拘束力計算 (CALC │ NOCAlc) #166 TEMPERature 実数型 拘束温度(300.0) #167 SHAKEMethod 選択型 shake 種別 (NOSHake │ HBONd │ ALLBond) #168 COVSHK 実数型 shake 収束値(1.0D-6) #169 LIMSHK 整数型 shake ループ上限(1000) RIGIDModel 選択型 剛体モデル指定(NO │ YES │ AUTO) #171 UNITRM 整数型 装置番号(56) #172 NAMERM 文字型 ファイル名("") #170 剛体モデル myPresto 4.2 197 DBGRIG #173 選択型 剛体モデル自動生成情報出力指 定 (NOWR │ ASCI) #174 UNITDR 整数型 装置番号(84) #175 NAMEDR 文字型 ファイル名("") CAL-GB 選択型 GB 計算 #176 GB 計算 (CALC │ NOCAlc│ MEDIum │ LONG) #177 GBWELE 実数型 水の誘電率(78.3) #178 GBMELE 実数型 蛋白の誘電率 (1.0) #179 GBDELT 実数型 Born 半径の補正値 (0.0) #180 GBLAMB 実数型 容積補正値(1.0) #181 GBOFFS 実数型 van der Waals 半径補正値(0.09) CALASA 選択型 ASA 計算 #182 ASA 計算 (CALC │ NOCAlc│ MEDIum │ LONG) #183 ASAPRO 実数型 PROBE 半径(1.4) #184 ASAWEI 実数型 ASA 重み(1.0) #185 ASACUT 実数型 ASA 用カットオフ長(4.5) CALUMB 選択型 UMBRELLA ポテンシャル計算 #186 UMBRELLA 拘束計算 #187 境界条件 (NOCAlc │ CALC │ MEDIum │ LONG) BOUNDAry 選択型 基本セルの形状 (NO │ PERI │ ELLIPSoid │ SPHERE) #188 SETCENter 選択型 先頭分子重心をセルの 中心に設 定 (NO │ YES) #189 CENTRX 実数型 セルの中心 x 座標(0.0) #190 CENTRY 実数型 セルの中心 y 座標(0.0) #191 CENTRZ 実数型 セルの中心 z 座標(0.0) #192 LXCELL 実数型 立方体セルの x 軸サイズ(40.0) #193 LYCELL 実数型 立方体セルのy軸サイズ(40.0) #194 LZCELL 実数型 立方体セルの z 軸サイズ(40.0) #195 ANGLBC 実数型 LYCELL と LZCELL の角度(90.0) #196 ANGLCA 実数型 LZCELL と LXCELL の角度(90.0) #197 ANGLAB 実数型 LXCELL と LYCELL の角度(90.0) #198 ELLIPA 実数型 楕円体セルの半径(30.0) #199 ELLIPB 実数型 楕円体セルの半径(30.0) myPresto 4.2 198 #200 ELLIPC 実数型 楕円体セルの半径(30.0) #201 RADIUS 実数型 SPHERE セルの半径(30.0) #202 REPLAC 選択型 座標引き戻し方法 (ATOM │ RESI │ CHAI) myPresto 4.2 199 A.2.2 トポロジーファイル 対象フェーズ:全フェーズ 用途:シミュレートする系のトポロジーを指定する。 特記事項: 指定により、アスキー、バイナリ(8 バイト実数形式指定)にすることができる。 書式:出力指定により以下の2種類に分かれる。 (1) ASCII 形式指定(TOPOLO= FORM) 特記事項: 行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。 各指定部分は分子指定部分で記述された順序どおりに記述しなければならない。 キーワードは、"TPL> " に続く4文字を認識する。 書式: トポロジーファイルは以下の部分で構成される。 タイトル記述 分子指定記述 [TORSION 指定記述] 原子指定記述 [IMPROPER 指定記述] [BOND 指定記述] [ANGLE 指定記述] ポテンシャル関数指定記述 非結合相互作用指定記述 (1-1)タイトル記述 当該トポロジーのタイトルを記述する。10 行を越えてはならない。 "TPL> TITL"行 [タイトル行 ...] 例) TPL> TITLE ALA-DIMER (AMBER UNITED ATOM) myPresto 4.2 200 (1-2)分子指定記述 当該トポロジーの分子を記述する。 "TPL> MOLE"行 [分子名行 ...] 分子名行は以下の部分で構成される。 分子名称 分子数 分子名称:40 文字以内の英字名を記述する。 分子数 :当該分子の個数を記述する。 例) TPL> MOLECULE ALA-DIMER-1 1 WATER(TIP3P-MODEL)-2 449 (1-3)原子指定記述 分子指定記述の順に、その分子を構成する原子の情報を記述する。 "TPL> ATOM"行 分子名称行 [原子記述行 ...] 原子記述行は以下の部分で構成される。 原子名 電荷 原子タイプ 1-2 結合原子数 [1-2 結合原子相手 ..] 相互作用タイプ 残基名 1-3 結合原子数 残基番号 質量 vanderWaals 半径 1-4 結合原子数 [1-3 結合原子相手..] [1-4 結合原子相手 ..] [内部座標記述(z-matrix)] 原子名 :8 文字以下で原子名を記述する。 原子タイプ :4 文字以下で原子タイプを記述する。 相互作用タイプ :整数で相互作用タイプを記述する。 残基名 :8 文字以下で残基名を記述する。 残基番号 :分子内の残基の相対番号を記述する。 質量 :1mol あたりの原子の質量を g 単位で記述する。 vanderWaals 半径:van der Waals 半径をÅ単位で記述する。 myPresto 4.2 201 1-2 結合原子数:1-2 の結合をしている原子で、当該原子より後にある原子の数を記述する。 1-3 結合原子数:1-3 の結合をしている原子で、当該原子より後にある原子の数を記述する。 1-4 結合原子数:1-4 の結合をしている原子で、当該原子より後にある原子の数を記述する。 1-2 結合原子相手:1-2 の結合をしている原子の相対位置を 1-2 結合原子数分だけ記述する。 1-3 結合原子相手:1-3 の結合をしている原子の相対位置を 1-3 結合原子数分だけ記述する。 1-4 結合原子相手:1-4 の結合をしている原子の相対位置を 1-4 結合原子数分だけ記述する。 内部座標記述(z-matrix):以下の通り。 ・1-2 結合原子相手:1-2 の結合をしている原子の相対位置。 ・1-3 結合原子相手:1-3 の結合をしている原子の相対位置。 ・1-4 結合原子相手:1-4 の結合をしている原子の相対位置。 ・位相基準原子:位相の基準となる原子の相対位置。 ・平衡距離:平衡距離をÅ単位で記述する。 ・平衡角:平衡角を度数(degree)単位で記述する。 ・位相:初期位相を度数(degree)単位で記述する。 例) TPL> ATOM ALA-DIMER-1 N N3 14 ALA 1 14.010 1.850 -0.263 ; 分子名行 -> ; 原子名 原子タイプ -> ; 残基名 残基番号 -> ; 質量 -> ; 1-2 結合原子数 -> ; 1-2 結合相手原子 vanderWaals 半径 4 2 2 1 2 3 5 6 -> ; 1-3 結合相手原子 7 8 -> ; 1-4 結合相手原子 0 0 0 0 4 0.0000 0.0000 0.0000 相互作用タイプ 電荷 1-3 結合原子数 1-4 結合原子数 -> ;内部座標(z-matrix) (1-4)BOND 指定記述 分子指定記述の順に、その分子内に存在する BOND の情報を記述する。 "TPL> BOND"行 分子名称行 [BOND 記述行 ...] BOND 記述行は以下の部分で構成される。 BOND 構成原子 1 BOND 構成原子 2 係数 平衡距離 myPresto 4.2 202 BOND 構成原子 1,2 :整数で BOND を構成する原子を記述する。 係数 :BOND の力の係数を KCAL/(MOL*Å2 )単位で記述する。 平衡距離 :平衡距離をÅ単位で記述する。 例) TPL> BOND ALA-DIMER-1 1 2 434.00 1.010 ; 分子名行 ; 構成原子 1 構成原子 2 係数 平衡距離 (1-5)ANGLE 指定記述 分子指定記述の順に、その分子内に存在する ANGLE の情報を記述する。 "TPL> ANGL"行 分子名称行 [ANGLE 記述行 ...] ANGLE 記述行は以下の部分で構成される。 ANGLE 構成原子 1 ANGLE 構成原子 2 ANGLE 構成原子 3 係数 平衡角 ANGLE 構成原子 1,2,3 :ANGLE を構成する原子を整数で記述する。2 が ANGLE の中心。 係数 :ANGLE の力の係数を KCAL/(MOL*θ2 )単位で記述する。 平衡角 :平衡角を度数(degree)単位で記述する。 例) TPL> ANGLE ALA-DIMER-1 2 1 3 35.000 109.50 ; 分子名行 ; 構成原子 1 構成原子 2 係数 平衡角 (1-6)TORSION 指定記述 分子指定記述の順に、その分子内に存在する TORSION の情報を記述する。 "TPL> TORS"行 分子名称行 [TORSION 記述行 ...] TORSION 記述行は以下の部分で構成される。 myPresto 4.2 203 TORSION 構成原子 1 TORSION 構成原子 2 TORSION 構成原子 4 係数 TORSION 構成原子 3 重複 torsion 数 対象性 初期位相 1-4 相互作用計算フラグ TORSION 構成原子 1,2,3,4:TORSION を構成する原子を整数で記述する。 原子 1,2,3 と原子 2,3,4 の組が平面を構成する。 係数:TORSION の力の係数を KCAL/MOL 単位で記述する。 重複 TORSION 数 :当該 TORSION と重なりのある TORSION の数を記述する。 対象性 :当該 TORSION の対象性(周期の逆数)を記述する。 位相 :当該 TORSION の初期位相を度数(degree)単位で記述する。 1-4 相互作用計算フラグ:当該 TORSION の 1 と 4 の原子間の静電・van der Waals 力を計算 する場合は 1 を、そうでない場合 0 を記述する。 例) TPL> TORSION ALA-DIMER-1 ; 分子名行 2 1 5 6 -> ; 構成原子 1 構成原子 2 構成原子 3 1.4 6 3 0.0 -> ; 係数 ; 1-4 相互作用計算フラグ 1 重複 TORSION 数 対象性 構成原子 4 初期位相 (1-7)IMPROPER-TORSION 指定記述 分子指定記述の順に、その分子内に存在する IMPROPER-TORSION の情報を記述する。 "TPL> IMPR"行 分子名称行 [IMPROPER 記述行 ...] IMPROPER 記述行は以下の部分で構成される。 IMPROPER 構成原子 1 IMPROPER 構成原子 2 IMPROPER 構成原子 4 係数 IMPROPER 構成原子 3 重複 IMPROPER 数 対象性 初期位相 1-4 相互作用計算フラグ IMPROPER 構成原子 1,2,3,4:IMPROPER を構成する原子を整数で記述する。 原子 1,2,3 と原子 2,3,4 の組が平面を構成する。 係数 :IMPROPER の力の係数を KCAL/MOL 単位で記述する。 重複 IMPROPER 数 :当該 IMPROPER と重なりのある IMPROPER の数を記述する。 myPresto 4.2 204 対象性 :当該 IMPROPER の対象性(周期の逆数)を記述する。 位相 :当該 IMPROPER の初期位相を度数(degree)単位で記述する。 1-4 相互作用計算フラグ:当該 IMPROPER の 1 と 4 の原子間の静電・van der Waals 力を計 算する場合は 1 を、そうでない場合 0 を記述する。 例) TPL> IMPROPER ALA-DIMER-1 ; 分子名行 6 5 1 7 -> ; 構成原子 1 構成原子 2 構成原子 3 14.0 1 3 180.0 -> ; 係数 ; 1-4 相互作用計算フラグ 0 重複 IMPROPER 数 対象性 構成原子 4 初期位相 (1-8)ポテンシャル関数指定記述 系のポテンシャル関数の情報を記述する。 "TPL> FUNC"行 [ポテンシャル関数記述行 ...] ポテンシャル関数記述行は以下の部分で構成される。 番号 係数の個数 ポテンシャル関数名称 番号 :複数行記述する場合に 1 から昇順に整数値で記述する。 係数の個数 :ポテンシャル関数の係数の個数を記述する。 ポテンシャル関数名称:ポテンシャル関数の名称を記述する。 (AMBER │ OPLS │ ECEPP │ CHARM) 例) TPL> FUNCTION 1 4 AMBER ; 番号 係数の個数 (1-9)非結合相互作用指定記述 系の非結合相互作用情報を記述する。 "TPL> NONB"行 myPresto 4.2 [非結合相互作用記述行 ...] ポテンシャル関数名称 205 ポテンシャル関数によって、非結合相互作用記述行の書式が異なる((A), (B))。 (A)van der Waals の場合 非結合相互作用記述行に以下を記述する。 相互作用タイプ 1 相互作用タイプ 2 関数タイプ vanderWaals 深さ 1-4vanderWaals 係数 vanderWaals 半径 1-4 静電係数 相互作用タイプ 1 :原子の相互作用タイプを記述する。 相互作用タイプ 2 :"0"を記述する。 関数タイプ :"1"を記述する。 vanderWaals 半径 :当該原子の van der Waals 半径をÅ単位で記述する。 vanderWaals 深さ :van der Waals のエネルギーの深さを KCAL/MOL 単位で記述する。 1-4vanderWaals 係数 :1-4 の van der Waal エネルギー計算で使用する係数を記述す る。 1-4 静電係数 :1-4 の静電エネルギー計算で使用する係数を記述する。 (B)水素結合の場合 相互作用タイプ 1 相互作用タイプ 2 関数タイプ 12 乗項係数 10 乗項係数 相互作用タイプ 1 :原子の相互作用タイプを記述する。 相互作用タイプ 2 :原子の相互作用タイプを記述する。 関数タイプ :"2"を記述する。 12 乗項係数 :当該原子間の 12 乗項の係数を KCAL/(MOL*Å12 )単位で記述する。 10 乗項係数 :当該原子間の 10 乗項の係数を KCAL/(MOL*Å10 )単位で記述する。 例) myPresto 4.2 206 TPL> NONBOND ; van der Waals の場合 1 0 1 -> ; 原子タイプ 1 原子タイプ 2("0") 関数タイプ("1") 1.9080 0.0860 -> ; vanderWaals 半径 0.8333 0.5 ; 1-4vanderWaals 係数 vanderWaals 深さ 1-4 静電係数 ; 水素結合の場合 14 14 1.8000 2 -> 0.2420 ; 原子タイプ 1 原子タイプ 2 ; 12 乗項係数 関数タイプ ("2") 10 乗項係数 (2) 実数形式指定(TOPOLO= BINA) タイトル 分子 原子 残基 Improper ポテンシャル関数数 チェイン 伸縮 原子種別 タイトル: 行数 INTEGER×1 タイトル文 CHARACTER(80)×行数 分子: 分子数 INTEGER×1 分子名 CHARACTER(40)×分子数 所属チェイン数 INTEGER×分子数 原子: myPresto 4.2 変角 二面角 207 原子数 INTEGER×1 所属分子 INTEGER×原子数 所属チェイン INTEGER×原子数 所属残基 INTEGER×原子数 非連結相互作用の種別 INTEGER×原子数 1-2 相互作用数 INTEGER×原子数 1-3 相互作用数 INTEGER×原子数 1-4 相互作用数 INTEGER×原子数 静電荷 REAL*8×原子数 質量 REAL*8×原子数 VanDerWaals 半径 REAL*8×原子数 原子名 CHARACTER(8)×原子数 型名 CHARACTER(4)×原子数 所属残基名 CHARACTER(8)×原子数 1-2 相互作用テーブル No INTEGER×原子数×1-2 相互作用数 1-3 相互作用テーブル No INTEGER×原子数×1-3 相互作用数 1-4 相互作用テーブル No INTEGER×原子数×1-4 相互作用数 残基: 残基数 INTEGER×1 先頭原子番号 INTEGER×残基数 最終原子番号 INTEGER×残基数 チェイン: チェイン数 INTEGER×1 最終原子番号 INTEGER×チェイン数 伸縮: 伸縮数 INTEGER×1 構成原子 INTEGER×伸縮数×2 係数 REAL*8×伸縮数 最小エネルギー距離 REAL*8×伸縮数 myPresto 4.2 208 変角: 変角数 INTEGER×1 構成原子 INTEGER×変角数×3 係数 REAL*8×変角数 最小エネルギー角 REAL*8×変角数 二面角: 二面角数 INTEGER×1 構成原子 INTEGER×二面角数×4 とりうる角度の数 INTEGER×二面角数 係数 REAL*8×二面角数 対称性 REAL*8×二面角数 位相 REAL*8×二面角数 1-4VanDerWaals 係数 REAL*8×二面角数 1-4 静電係数 REAL*8×二面角数 Improper: Improper 数 INTEGER×1 構成原子 INTEGER×Improper 数×4 とりうる角度の数 INTEGER×Improper 数 係数 REAL*8×Improper 数 対称性 REAL*8×Improper 数 位相 REAL*8×Improper 数 1-4VanDerWaals 係数 REAL*8×Improper 数 1-4 静電係数 REAL*8×Improper 数 ポテンシャル関数数: ポテンシャル関数数 INTEGER×1 関数種別 INTEGER×ポテンシャル関数数 関数名 CHARACTER(40)×ポテンシャル関数数 myPresto 4.2 209 原子種別: 原子種別数 INTEGER×1 ポテンシャル関数種別(FUNC_VDW, FUNC_HYD) INTEGER×原子種別数×原子種別数 1/距離**6 の VanDerWaals REAL*8×原子種別数×原子種別数 1/距離**12 の VanDerWaals REAL*8×原子種別数×原子種別数 1/距離**10 の水素結合 REAL*8×原子種別数×原子種別数 1/距離**12 の水素結合 REAL*8×原子種別数×原子種別数 vdW 最小半径 REAL*8×原子種別数×原子種別数 井戸型ポテンシャルの深さ REAL*8×原子種別数×原子種別数 1-4vdW スケールファクタ REAL*8×原子種別数×原子種別数 1-4 静電スケールファクタ REAL*8×原子種別数×原子種別数 myPresto 4.2 210 A.2.3 座標ファイル 対象フェーズ:全フェーズ 用途:シミュレートする系の原子座標を指定する。 特記事項: 指定により、アスキー,バイナリ(8 バイト実数形式指定)にすることができる。 書式:出力指定により以下の2種類に分かれる。 (1) ASCII 形式指定(COORDI= PDB) PDB フォーマットの仕様に従う。 (2) 実数形式指定(COORDI= BINA) 日付 CHARACTER(80)×1 ユーザ名 CHARACTER(80)×1 原子数 INTEGER×1 x座標 REAL*8×原子数 y座標 REAL*8×原子数 z座標 REAL*8×原子数 myPresto 4.2 211 A.2.4 SHAKE ファイル 対象フェーズ: MIN,MD フェーズ 用途: SHAKE 対象原子と拘束距離を指定する。 特記事項: 行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。 SHAKE を構成する原子の数は 2,3,4 のいずれかとする。 複数の分子間にまたがる SHAKE は記述できない。 書式: SHAKE 指定は以下の行で構成される。 [ SHAKE 情報先頭行 分子指定行 SHAKE 拘束情報行... ]... SHAKE 情報先頭行:先頭の文字列が“SHAKE> SHAKE”である行 分子指定行: 分子名を記述した行 SHAKE 拘束情報行:SHAKE 対象原子数、SHAKE 対象原子の分子内相対原子番号、SHAKE 拘束 距離を記述した行。SHAKE を構成する原子数にしたがって以下のように記述する。 2 原子 SHAKE の場合: “2” 原子 1 の番号 原子 2 の番号 原子 1-原子 2 間の距離 原子 2 の番号 原子 3 の番号 3 原子 SHAKE の場合: “3” 原子1の番号 原子 1-原子 2 間の距離 原子 2-原子 3 間の距離 原子 3-原子 1 間の距離 4 原子 SHAKE の場合: “4” 原子1の番号 原子 2 の番号 原子 3 の番号 原子 4 の番号 原子 1-原子 2 間の距離 原子 2-原子 3 間の距離 原子 3-原子 1 間の距離 原子 1-原子 4 間の距離 原子 3-原子 4 間の距離 原子 2-原子 4 間の距離 myPresto 4.2 212 例) SHAKE> SHAKE ALA-DIMER-1 4 1 2 3 4 1.01000 1.64962 2 9 10 1.01000 -> -> 1.01000 -> -> SHAKE> SHAKE WATER(TIP3P-MODEL)-2 3 -> 1 2 3 -> 0.95720 myPresto 4.2 1.51360 0.95720 1.01000 1.64962 1.64962 ; ; ; ; ; ; ; ; SHAKE 情報先頭 分子名 SHAKE 原子数=4 SHAKE 対象原子の番号 原子間距離 SHAKE 原子数=2 SHAKE 対象原子の番号 原子間距離 ; ; ; ; SHAKE 情報先頭 分子名 SHAKE 原子数=3 SHAKE 対象原子の番号 ; 原子間距離 213 A.2.5 固定原子・自由原子指定ファイル 対象フェーズ: MIN,MD フェーズ 用途: 固定原子、自由原子を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:自由/固定原子の指定は以下の行で構成される。 [ 自由/固定原子情報先頭行 自由/固定原子情報行... ]... 自由/固定原子情報先頭行: 以下の文字列で指定する。 (1)原子リスト指定 = “SETVAR> LIST” (2)原子範囲指定 = “SETVAR> RADIUS” 自由/固定原子情報:先頭行にしたがって以下のように記述する。 (1)“SETVAR> LIST”の場合: 形式 チェイン先頭番号 チェイン最終番号 残基先頭番号 残基最終番号 原子名指定 (リスト出力) (2)“SETVAR> RADIUS”の場合: 指定方式にしたがって以下のように記述する。 中心原子指定: 形式 "ATOM" 原子番号 半径下限 半径上限 原子名指定 (リスト出力) 中心座標指定: 形式 "COOR" x 座標 y座標 z 座標 半径下限 半径上限 原子名指定(リスト出力) myPresto 4.2 214 ※上記にある項目は以下の値で構成される。 リスト出力 ::= "YES"|"NO" (デフォルトは "NO") 形式 ::= "FREE"|"FIX" 原子名指定 ::= ワイルドカード(*)指定可能 例) SETVAR> LIST ; 原子リスト指定先頭行 FIX 1 1 1 FREE 2 10000 1 130 * 1 O* YES SETVAR> RADIUS FIX ATOM 100 10.0 20.0 C* FREE COOR 0.0 10.0 2.0 10.0 20.0 * myPresto 4.2 YES ; 原子情報 ; 原子情報 ; 原子範囲指定先頭行 ; 中心原子指定 ; 中心座標指定 215 A.2.6 CAP 指定ファイル 対象フェーズ: 全フェーズ 用途: セル形状、CAP 拘束を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:バウンダリの指定は以下の行で構成される。 [ バウンダリ情報先頭行 バウンダリ情報先頭行: バウンダリ情報行 ... ]... 以下の文字列で指定する。 (1)CAP 計算対象指定 = “BOUND> INCLUDE” (2)CAP 中心指定 = “BOUND> CENTER” (3)立方体セルサイズ指定 = “BOUND> BOX” (4)CAP 半径指定 = “BOUND> RADIUS” バウンダリ情報:先頭行にしたがって以下のように記述する。 (1)“BOUND> INCLUDE”の場合: 分子名 チェイン先頭番号 チェイン最終番号 (リスト出力) (2)“BOUND> CENTER”の場合:3種類の指定があり、それぞれ以下のように記述する。 チェイン重心指定: “CHAI” チェイン番号 原子指定: “ATOM” 中心原子の所属するチェイン番号 中心原子の所属する残基番号 原子名 myPresto 4.2 216 座標指定: “COOR” x 座標 y座標 z 座標 (3)“BOUND> BOX”の場合: x 成分 y 成分 z 成分 (4)“BOUND> RADIUS”の場合: 半径値 ※上記にある項目は以下の値で構成される。 リスト出力 ::= "YES"|"NO" (デフォルトは "NO") 例) BOUND> INCLUDE WATER 1 200 YES BOUND> CENTER ; CAP 計算対象指定先頭行 ; CAP 計算対象指定 ; CAP 中心指定先頭行 ; チェイン重心指定 CHAIN 1 ATOM 1 1 CA ; 原子指定 COORDINATEs 0.0D0 0.0D0 0.0D0 ; 座標指定 ; 立方体セルサイズ指定先頭行 ; 立方体セルサイズ指定 BOUND> RADIUS ; CAP 半径指定先頭行 30.0D0 ; CAP 半径指定 BOUND> BOX 0.0D0 0.0D0 myPresto 4.2 0.0D0 217 A.2.7 拡張 CAP 指定ファイル 対象フェーズ: 全フェーズ 用途: 拡張 CAP 拘束対象、拘束条件を指定する 特記事項: 行中の“;”以降はコメントとなる。 書式:拡張 CAP 拘束の指定は以下の行で構成される。 [“EXTCAP>CONDition”行 “EXTCAP>INCLude” 拘束条件指定行 行 拘束対象指定行... ] ... 拘束条件指定行:“EXTCAP>CONDition”行に引き続き、以下のように指定する。 球体 CAP 拘束の中心、半径、力の係数を指定; “SPHEre” 半径 中心の x 座標 力の係数 中心の y 座標 中心のz座標 [リスト出力] 楕円体 CAP 拘束の焦点、焦点からの距離の和、力の係数を指定; “GEometric ELlipsoid” 焦点 A の x 座標 焦点 A の y 座標 焦点 A の z 座標 焦点 B の x 座標 焦点 B の y 座標 焦点 B の z 座標 焦点からの距離の和/2.0d0 力の係数 [リスト出力] 楕円体 CAP 拘束の中心、x 軸方向、y 軸方向、z 軸方向の半径、力の係数を指定; “ALgebraic ELipsoid” 中心の x 座標 x 軸方向の半径 力の係数 中心の y 座標 中心の z 座標 y 軸方向の半径 z 軸方向の半径 [リスト出力] myPresto 4.2 218 拡張 CAP 拘束計算対象指定行: “EXTCAP>INCLude”に引き続き、以下のように指定する。 チェイン単位での指定; “CHAI” 分子名 先頭チェイン番号 最終チェイン番号 [リスト出力] 残基単位での指定; “RESI” 先頭チェイン番号 最終チェイン番号 先頭残基番号 最終残基番号 残基名 [リスト出力] 原子単位での指定; “ATOM” 先頭チェイン番号 最終チェイン番号 先頭残基番号 最終残基番号 原子名 残基名 [リスト出力] ※上記にある項目は以下の値で構成される。 リスト出力 ::= "YES"|"NO" (CAP 拘束を2つ指定する例) EXTCAP> COND ;SPHERE 39.0 26.0 -4.0 27.0 100.0 YES GEEL 86.0 2.0 -1.0 10.0 58.0 1.0 48.5 150.0 YES ;ALEL 0.0 0.0 0.0 12.0 12.0 12.0 150.0 YES ; ; ; ; CAP 拘束1の拘束条件を指定 (球体による指定) (楕円体による指定) (楕円体による指定) EXTCAP> INCL ;CHAI WAT 1 216 YES ;RESI 1 1 1 3 HYD YES ATOM 9 9 1 5 * * YES ; ; ; ; CAP 拘束1の拘束対象を指定 (チェイン単位での指定) (残基単位での指定) (原子単位での指定) EXTCAP> COND ;SPHERE 39.0 26.0 -4.0 27.0 100.0 YES GEEL 86.0 2.0 -1.0 10.0 58.0 1.0 49.5 150.0 YES ;ALEL 0.0 0.0 0.0 12.0 12.0 12.0 150.0 YES ; ; ; ; CAP 拘束2の拘束条件を指定 (球体による指定) (楕円体による指定) (楕円体による指定) EXTCAP> INCL ;CHAI WAT 1 216 YES ;RESI 1 1 1 3 HYD YES ATOM 10 1365 1 1 * WAT YES ; ; ; ; CAP 拘束2の拘束対象を指定 (チェイン単位での指定) (残基単位での指定) (原子単位での指定) myPresto 4.2 219 A.2.8 位置拘束ファイル 対象フェーズ: 全フェーズ 用途: 位置拘束を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:位置拘束の指定は以下の行で構成される。 [位置拘束情報先頭行 位置拘束情報行... パラメータ終了行 終了情報行]... 位置拘束情報先頭行:以下の文字列で指定する。 (1)拘束リスト指定 = “GROUP> LIST” (2)拘束範囲指定 = “GROUP> RADIUS” パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。 “END” 終了情報行:先頭の文字列が“GROUP> STOP”である行 位置拘束情報:先頭行にしたがって以下のように記述する。 (1)“GROUP> LIST”の場合: チェイン先頭番号 チェイン最終番号 残基先頭番号 残基名指定 係数 "MASS" 残基最終番号 原子名指定 (リスト出力) (2)“GROUP> RADIUS”の場合: 中心チェイン番号 係数 "MASS" 中心残基番号 中心原子名 半径下限 半径上限 原子名指定 (リスト出力) ※上記にある項目は以下の値で構成される。 リスト出力 ::= "YES"|"NO" (デフォルトは "NO") myPresto 4.2 220 拘束力を原子の質量に比例させる場合、"MASS"を指定する。 例) GROUP> LIST 1 1 5 13 CA * 1.0 MASS 1 1 1 67 N* ARG 1.0 MASS YES ; 拘束リスト指定先頭行 ; 位置拘束情報 ; 位置拘束情報 ; 拘束範囲指定先頭行 END GROUP> STOP GROUP> RADIUS 1 10 CA 0.0 5.0 C* 1.0 MASS YES ; 位置拘束情報 1 10 CA 0.0 5.0 N* 1.0 MASS YES ; 位置拘束情報 1 10 CA 0.0 5.0 O* 1.0 MASS YES ; 位置拘束情報 1 10 CA 0.0 5.0 S* 1.0 MASS YES ; 位置拘束情報 END GROUP> STOP myPresto 4.2 221 A.2.9 距離拘束ファイル 対象フェーズ: 全フェーズ 用途: 距離拘束を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:距離拘束の指定は以下の行で構成される。 [距離拘束情報先頭行 距離拘束情報行... パラメータ終了行 終了情報行]... 距離拘束情報先頭行:以下の文字列で指定する。 (1)拘束リスト指定 =“RDDSTC> LIST” パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。 “END” 終了情報行:先頭の文字列が“RDDSTC> STOP”である行 距離拘束情報:先頭行にしたがって以下のように記述する。 (1)“RDDSTC> LIST”の場合: 原子指定1 原子指定2 下界係数 上界係数 下界距離 上界距離(リスト出力) ※上記にある項目は以下の値で構成される。 原子指定 ::= 所属チェイン番号 所属残基番号 リスト出力 ::= "YES"|"NO"|"HBOND" 所属残基名 原子名 (デフォルトは "NO") myPresto 4.2 222 例) RDDSTC> LIST ; 拘束リスト指定先頭行 1 1 ILE HA 1 2 ALA HN 1.00 1.00 1.95 2.50 YES ; 距離拘束情報 1 2 ALA HA 1 65 VAL CG* 1.00 1.00 2.70 4.90 YES ; 距離拘束情報 1 8 HIS HD2 1 19 THR HG2* 1.00 1.00 2.00 5.00 ; 距離拘束情報 1 4 PRO HB* 1 5 ALA HN 1.00 1.00 1.95 3.50 ; 距離拘束情報 1 4 PRO HB* 1 6 CYS HN 1.00 1.00 1.95 3.50 ; 距離拘束情報 1 4 PRO HD* 1 66 LEU CD* 1.00 1.00 2.70 6.40 ; 距離拘束情報 1 20 ASN HB* 1 43 ALA HB* 1.00 1.00 2.00 4.50 ; 距離拘束情報 1 5 ALA HB* 1 7 VAL HN 1.00 1.00 1.95 5.00 ; 距離拘束情報 1 11 ALA HB* 1 61 VAL CG* 1.00 1.00 2.70 6.40 ; 距離拘束情報 1 29 THR HA 1 51 PHE CZ 1.00 1.00 2.70 6.40 ; 距離拘束情報 1 89 ILE HN 1 76 ARG+ O 0.50 0.50 1.70 2.30 HBOND ; END RDDSTC> STOP myPresto 4.2 距離拘束情報 223 A.2.10 二面角拘束ファイル 対象フェーズ: 全フェーズ 用途:二面角拘束を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:二面角拘束の指定は以下の行で構成される。 [二面角拘束情報先頭行 二面角拘束情報行... パラメータ終了行 終了情報行]... 二面角拘束情報先頭行: 以下の文字列で指定する。 (1)拘束リスト指定 = “CDIHE> LIST” (2)拘束番号指定 = “CDIHE> NUMBER” パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。 “END” 終了情報行:先頭の文字列が“CDIHE> STOP”である行 二面角拘束情報:先頭行にしたがって以下のように記述する。 (1)“CDIHE> LIST”の場合: 所属チェイン番号 下界係数 上界係数 原子指定 1 原子指定 2 原子指定 3 原子指定 4 下界角 上界角 (リスト出力) (2)“CDIHE> NUMBER”の場合: 原子番号 1 原子番号 2 原子番号 3 原子番号 4 下界係数 上界係数 下界角 上界角 (リスト出力) myPresto 4.2 224 ※上記にある項目は以下の値で構成される。 原子指定 ::= 所属残基番号 リスト出力 ::= "YES"|"NO" 原子名 (デフォルトは "NO") 例) CDIHE> LIST ; 拘束リスト指定先頭行 1 11 CA 11 C 12 N 12 CA 1.0 1.0 175.0 -175.0 Y ; 二面角拘束情報 1 16 CA 16 C 17 N 17 CA 1.0 1.0 175.0 -175.0 Y ; 二面角拘束情報 END CDIHE> STOP CDIHE> NUMBER 77 79 END CDIHE> STOP myPresto 4.2 81 ; 拘束リスト指定先頭行 93 2.0 2.0 -90.0 -40.0 Y ; 二面角拘束情報 225 A.2.11 モニター指定ファイル 対象フェーズ: MD 用途:モニター対象を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 キーワードは、"MONI> " に続く4文字を認識する。 書式:モニターの指定は以下の行で構成される。 [モニター指定情報先頭行 モニター指定情報行... モニター指定情報先頭行: ]... 以下の文字列で指定する。 (1)原子位置指定=“MONI> COOR” (2)距離指定 = “MONI> DIST” (3)変角指定 = “MONI> ANGL” (4)二面角指定 = “MONI> TORS” モニター指定情報行:先頭行にしたがって以下のように記述する。 (1)“MONI> COOR”の場合: 原子指定1 (リスト出力) (2)“MONI> DIST”の場合: 原子指定1 原子指定2 (リスト出力) (3)“MONI> ANGL”の場合: 原子指定1 原子指定2 原子指定3 (リスト出力) myPresto 4.2 226 (4)“MONI> TORS”の場合: 原子指定1 原子指定2 原子指定3 原子指定4 (リスト出力) ※上記にある項目は以下の値で構成される。 原子指定 ::= チェイン番号 リスト出力 ::= "YES"|"NO" 残基番号 原子名 (デフォルトは "NO") 例) MONI> COORDINATE ;原子位置指定先頭行 1 3 CA YES ;モニター指定情報 1 3 C YES ;モニター指定情報 MONI> DISTANCE 1 1 O 1 4 H ;距離指定先頭行 YES ;モニター指定情報 MONI> ANGLE 1 1 C ;変角指定先頭行 1 1 O 1 2 N YES ;モニター指定情報 MONI> TORSION ;二面角指定先頭行 1 1 C 1 2 N 1 2 CA 1 2 C YES ;モニター指定情報 1 3 N 1 3 CA 1 3 C 1 4 N YES ;モニター指定情報 myPresto 4.2 227 A.2.12 系の重心合わせ指定用ファイル 対象フェーズ: MIN, MD 用途:重心合わせ対象原子を指定する。 特記事項: 行中の“;”以降はコメントとなる。 “( )”の中の項目は省略可能である。 書式:重心合わせ対象原子の指定は以下の行で構成される。 [ BESTFIT 対象原子情報先頭行 BESTFIT 対象原子情報行... ]... 重心合わせ対象原子情報先頭行: 以下の文字列で指定する。 (1)原子リスト指定 = “SETBST> LIST” (2)原子範囲指定 = “SETBST> RADIUS” 重心合わせ対象原子情報:先頭行にしたがって以下のように記述する。 (1)“SETBST> LIST”の場合: 形式 チェイン先頭番号 チェイン最終番号 残基先頭番号 残基最終番号 原子名指定 (リスト出力) (2)“SETBST> RADIUS”の場合: 指定方式にしたがって以下のように記述する。 中心原子指定: 形式 "ATOM" 原子番号 半径下限 半径上限 原子名指定 (リスト出力) 中心座標指定: 形式 "COOR" x 座標 y座標 z 座標 半径下限 半径上限 原子名指定(リスト出力) myPresto 4.2 228 ※上記にある項目は以下の値で構成される。 リスト出力 ::= "YES"|"NO" (デフォルトは "NO") 形式 ::= "FREE"|"FIX" 原子名指定 ::= ワイルドカード(*)指定可能 例) SETBST> LIST FIX 1 FREE 2 ; 原子リスト指定先頭行 1 10000 1 130 * 1 1 O* YES SETBST> RADIUS FIX ATOM 100 10.0 20.0 C* FREE COOR 0.0 10.0 2.0 10.0 20.0 * myPresto 4.2 YES ; 原子情報 ; 原子情報 ; 原子範囲指定先頭行 ; 中心原子指定 ; 中心座標指定 229 A.2.13 系の GB/SA 及び ASA 用パラメータ指定ファイル 対象フェーズ: MIN, MD 用途:GB/SA 及び ASA 用パラメータを設定する。 特記事項: 本ファイルで全原子のデータが設定されなければ、計算結果は保証しない。 行中の“;”以降はコメントとなる。 書式:GB/SA の原子情報は以下の行で構成される。 [GB/SA 情報先頭行 GB/SA 情報行... ]... GB/SA 情報先頭行:以下の文字列で指定する。 (1)原子リスト指定=“SOL> LIST” (2)総称名指定 =“SOL> ATOM” GB/SA 情報行:先頭行にしたがって以下のように記述する。 (1)“SOL> LIST”の場合: 入力したトポロジーに対し、1対1のリストで GB/SA の情報を指定する。 [未使用 20 文字 水素フラグ ASA の vdW 半径(Å) ASA 用の atomic solvation parameter(kcal/mol/Å2) GB/SA 用の atomic solvation parameter(cal/mol/Å 2) [GB の vdW 半径(Å) GB のスケール因子]]... (2)“SOL> ATOM”の場合: 指定した原子に対して、GB/SA の情報を設定する。原子、残基名にワイルドカード使用可。 [原子名 残基名 水素フラグ ASA の vdW 半径(Å) ASA 用の atomic solvation parameter(kcal/mol/Å2) GB/SA 用の atomic solvation parameter(cal/mol/Å 2) [GB の vdW 半径(Å) GB のスケール因子]]... myPresto 4.2 230 例) SOL>LIST SOL 1 N LYS1 SOL 2 H1 LYS0 1.550000 -0.132000 5.400000 1.625000 0.790000 0.000000 5.400000 1.150000 0.850000 0.000000 SOL>ATOM H* LYS0 myPresto 4.2 0.000000 0.000000 5.400000 1.150000 0.850000 231 A.2.14 Umbrella 拘束ファイル 対象フェーズ: MD 用途:Umbrella Potential の条件を指定する。 特記事項: 行中の“;”以降はコメントとなる。 書式:Umbrella Potential の指定は以下の行で構成される。 [UmbrellaPotential 情報先頭行 UmbrellaPotential 情報行...] Umbrella 情報先頭行:Potential 種別を以下の文字列で指定する。 (1) FillingPotential-Potential(ガウス関数型) "FILL> GAUS" (2) FillingPotential-Potential(単一中心調和振動子型) "FILL> HAR1" (3) FillingPotential-Potential(単一中心線形) "FILL> LIN1" (4) FillingPotential-Potential(2中心調和振動子型) "FILL> HAR2" (5) FillingPotential-Potential(2中心線形) "FILL> LIN2" UmbrellaPotential 情報行: 関数個数と適用原子数の指定行 原子指定行... 各構造 のトラジェクトリ指定行 ... (1)関数個数と適用原子数の指定行: 関数(中心の構造)の数 (2)原子指定行: 関数個数および適用原子数を指定する。 適用原子数 PDB 上の原子 ID を昇順に記述する。 原子 ID (3)各構造のトラジェクトリ指定行: 各構造のトラジェクトリ指定行は、以下の行で構成される。 [ポテンシャル高さ行 [ポテンシャル広がり行].. [構造1行 [構造2行]]..].. myPresto 4.2 232 (3-1)ポテンシャル高さ行: 当該構造を中心とするポテンシャルの力の定数または高さを指定する。 力の定数(umb%coef)または Gauss 関数の高さ(umb%weight) (3-2)ポテンシャル広がり行: 当該構造を中心とするポテンシャルの広がりを記述する。 CAP 半径(ε:epsilon)または Gauss 関数の幅(EllipCoef) (3-3a)構造座標行:構造1行 当該構造での原子座標を PDB フォーマットで記述する。 (x 座標=31∼38 カラム、y 座標=39∼46 カラム、z 座標=47∼54 カラム) ... x 座標 y 座標 z 座標 ... (3-3b)構造座標行:構造2行 (HAR2/LIN2 の場合) 当該構造での原子座標を PDB フォーマットで記述する。 (x 座標=31∼38 カラム、y 座標=39∼46 カラム、z 座標=47∼54 カラム) ... x 座標 myPresto 4.2 y 座標 z 座標 ... 233 例) FILL> GAUS ; 関数形指定 3 ; 関数の数と使用する原子数 ; 原子指定行 4.00000000000000 ; 構造1を中心とする高さ 0.0300000 ; 幅 2 86 102 0.0300000 ATOM 86 N VAL A 22 -6.505 3.453 0.990 16.00 -0.38 ATOM 102 N VAL A 22 -7.661 3.818 -1.008 16.00 -0.65 ;構造1の座標 5.00000000000000 ; 構造2を中心とする高さ 0.0300000 ; 幅 0.0300000 ATOM 86 N VAL A 22 -6.405 3.443 ATOM 102 N VAL A 22 -7.561 3.828 0.980 16.00 -0.38 ;構造2の座標 -1.018 16.00 -0.65 5.00000000000000 ; 構造3を中心とする高さ 0.0300000 ; 幅 0.0300000 ATOM 86 N VAL A 22 -6.405 3.443 0.980 16.00 -0.38 ATOM 102 N VAL A 22 -7.561 3.828 -1.018 16.00 -0.65 ;構造3の座標 FILL> HAR1 ; 関数形指定 2 ; 関数の数と適用する原子数 86 ; 原子指定行 50.0 ; 構造1を中心とする力の定数 0.5 ; 構造1の CAP 半径 1 ATOM 86 N VAL A 22 -6.505 3.453 0.990 16.00 -0.38 ;構造1の座標 20.0 ; 構造2を中心とする力の定数 1.0 ; 構造2の CAP 半径 ATOM 86 N VAL A 22 -6.405 3.443 0.980 16.00 -0.38 FILL> HAR2 ; 関数形指定 1 1 ;構造2の座標 ; 関数の数と適用する原子数 86 ; 原子指定行 50.0 ; 構造1,2 を中心とする力の定数 0.5 ; 構造1,2 を中心とする CAP 半径 ATOM 86 N VAL A 22 -6.505 3.453 0.990 16.00 -0.38 ;構造1の座標 ATOM 86 N VAL A 22 -6.405 3.443 0.980 16.00 -0.38 ;構造2の座標 myPresto 4.2 234 A.2.15 リスタートファイル 対象フェーズ: MD 用途: リスタート情報を指定する。自動リスタートファイルはリスタートファイルと同じ フォーマットで、指定された時間ごとに出力され、障害発生時のロールバックと して用いる。 特記事項: リスタートファイルはバイナリファイルである。 リスタートファイルは以下の行で構成され、総データ量は計算条件により異なる。 書式: タイトル行(各計算条件共通) 原子数行(各計算条件共通) エネルギー情報行(各計算条件共通) 原子情報行(各計算条件共通) [原子の力情報行(Velocity Verlet 法または RESPA 法使用時のみ)] [Nose-Hoover 法情報行(Nose-Hoover 法使用時のみ)] [剛体モデル情報行(剛体モデル使用時のみ)] [NPT アンサンブル情報行(NPT アンサンブル使用時のみ)] [マルチカノニカルアンサンブル情報行(マルチカノニカルアンサンブル使用時のみ)] タイトル行:各計算条件共通 タイトル :character*80×1 原子数行:各計算条件共通 原子数 :integer*4×1 自由原子数 :integer*4×1 エネルギー情報行:各計算条件共通 ループ回数 :integer*4×1 シミュレート時間 :real*8×1 総エネルギー :real*8×1 運動エネルギー :real*8×1 ポテンシャルエネルギー :real*8×1 myPresto 4.2 235 原子情報行:各計算条件共通 原子座標 :real*8×3×原子数 自由原子速度 :real*8×3×自由原子数 原子の力情報行:Velocity Verlet 法 または RESPA 法使用時のみ Velocity Verlet 法使用時: Gradient :real*8×3×原子数 RESPA 法使用時: Gradient(Short) :real*8×3×原子数 Gradient(Medium) :real*8×3×原子数 Gradient(Long) :real*8×3×原子数 Nose-Hoover 法情報行:Nose-Hoover 法使用時のみ 仮想系の座標 :real*8×3×分子種別数 仮想系の運動量 :real*8×3×分子種別数 仮想系の速度 :real*8×3×分子種別数 剛体モデル情報行:剛体モデル使用時のみ 剛体の速度 :real*8×3×剛体数 剛体の座標 :real*8×3×剛体数 剛体の四元数 :real*8×3×剛体数 剛体の角運動量 :real*8×3×剛体数 剛体の並進力 :real*8×3×剛体数 剛体のトルク :real*8×3×剛体数 剛体の並進力(Short) :real*8×3×剛体数 ※ 剛体の並進力(Medium) :real*8×3×剛体数 ※ 剛体の並進力(Long) :real*8×3×剛体数 ※ 剛体のトルク(Short) :real*8×3×剛体数 ※ 剛体のトルク(Medium) :real*8×3×剛体数 ※ 剛体のトルク(Long) :real*8×3×剛体数 ※ ※印は、RESPA 法使用時のみ myPresto 4.2 236 NPT アンサンブル情報行:Andersen 法 または Parrinello-Rahman 法使用時のみ Andersen 法使用時: セルサイズ :real*8×1 ピストン情報 :real*8×4 熱浴情報1 :real*8×4 熱浴情報2 :real*8×4 Parrinello-Rahman 法使用時: セル行列 :real*8×1 セル行列の逆行列 :real*8×1 セル行列の行列式 :real*8×1 ピストン情報 :real*8×20 熱浴情報1 :real*8×4 熱浴情報2 :real*8×4 Andersen 法 または Parrinello-Rahman 法使用時: ビリアル行列 :real*8×3×3×エネルギー種別数 ビリアル行列(Short) :real*8×3×3×エネルギー種別数 ※ ビリアル行列(Medium) :real*8×3×3×エネルギー種別数 ※ ビリアル行列(Long) :real*8×3×3×エネルギー種別数 ※ ※印は、RESPA 法使用時のみ マルチカノニカルアンサンブル情報行:マルチカノニカルアンサンブル使用時のみ 当該ステップのエネルギー :real*8×1 サンプリング区間内のループ数 :integer*4×1 総ループ数 :integer*4×1 サンプリング区間のエネルギーヒストグラム :real*8×サンプル数 全体のエネルギーヒストグラム :real*8×サンプル数 スケーリングファクター :real*8×サンプル数 当該ステップ後のエネルギー範囲の下限 :integer*4×1 当該ステップ後のエネルギー範囲の上限 :integer*4×1 当該ステップのエネルギー範囲の下限 :integer*4×1 当該ステップのエネルギー範囲の上限 :integer*4×1 myPresto 4.2 237 A.2.16 剛体モデルファイル 対象フェーズ: MD 用途: 剛体モデルの分子と原子を指定する。 特記事項: 行中の“;”以降はコメントとなる。 剛体モデルは Velocity-Verlet 指定時("INTEGR=VELO")のみ有効である。 SHAKE/RATTLE で指定した構造は、剛体モデルとして指定できない。 複数の剛体モデルに同じ原子を指定することはできない。 剛体モデルは MD フェーズで有効である(Minimize では扱えない)。 書式:剛体モデル対象原子の指定は、以下の行で構成される。 [剛体モデル先頭行 剛体モデル先頭行: [剛体分子指定行 剛体原子情報行]... ]... 以下の文字列で指定する。 (1)剛体原子リスト指定 = "RIGID> NUM" (2)剛体原子リスト+モデル座標指定 = "RIGID> COO" 剛体分子指定行: 分子名を指定する。 剛体原子情報行:先頭行にしたがって以下のように記述する。 (1) "RIGID> NUM"の場合: 原子数 [相対原子 ID... ] (2) "RIGID> COO"の場合: 原子数 [相対原子 ID x 座標 y 座標 z 座標]... myPresto 4.2 238 例) RIGID> NUM ; 剛体原子リスト指定 WAT ; 剛体分子名行 ; 剛体原子情報行 RIGID> COO ; 剛体原子リスト +座標指定 WAT ; 剛体分子名行 ; 剛体原子情報行 3 3 1 2 3 1 0.0 0.1 0.0 -> 2 -0.8 0.4 0.0 -> 3 myPresto 4.2 0.8 0.4 0.0 239 A.3 出力ファイル 構造探索エンジンの出力ファイルを以下に示す。 項番 #1 ファイル名称 MIN エネルギートラジェク 出力フェーズ MIN トリ #2 MD エネルギートラジェク モニター 指定トラジェク 途 エネルギー最小化での エネルギートラジェクトリ MD トリ #3 用 MD 計算での エネルギートラジェクトリ MD トリ モニター指定ファイルの内容に対する トラジェクトリ #4 総エネルギーデータ MD 総エネルギー(total potential energy) #5 座標トラジェクトリ MD 原子座標のトラジェクトリ #6 速度トラジェクトリ MD 原子速度のトラジェクトリ myPresto 4.2 240 A.3.1 MIN エネルギートラジェクトリ 出力フェーズ: MIN 内容: エネルギー最小化でのエネルギートラジェクトリ 。 特記事項: MIN エネルギーデータファイルは 8 バイトのバイナリファイルである。 書式: [ MIN 情報 MIN エネルギー情報 ]×出力回数 MIN 情報: 当該ループ回数 :integer*4×1 WORK1 :real*8×1 CPU 時間 :real*8×1 MIN エネルギー情報: ステップ長 :real*8×1 root mean square change :real*8×1 WORK2 :real*8×1 エネルギー詳細情報※ :real*8×29(29:エネルギー種別数) root-mean square force :real*8×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*8×1 ※「WORK1」「WORK2」フィールドは、現在未使用。0.0d0 が設定される。 ※「エネルギー詳細情報」の各フィールドの内容は、次ページの通り。 myPresto 4.2 241 エネルギー詳細情報の内訳: (1)ポテンシャルエネルギー (2)Bond (3)Angle (4)Torsion (5)Improper torsion (6)1-4 van der Waals (7)1-4 静電 (8)1-5 van der Waals (9)1-5 静電 (10)1-5 水素結合 (11)1-5 van der Waals (カットオフなし) (12)1-5 静電 (カットオフなし) (13)1-5 水素結合 (カットオフなし) (14)位置拘束 (15)距離拘束 (16)二面角拘束 (17)Repulsion (18)CAP 拘束 (19)未使用1 (20)未使用2 (21)未使用3 (22)未使用4 (23)Generalized Born (24)Accessible Surface Area (25)未使用5 (26)未使用6 (27)未使用7 (28)未使用8 (29)未使用9 myPresto 4.2 242 A.3.2 MD エネルギートラジェクトリ 出力フェーズ: MD 内容: MD 計算でのエネルギートラジェクトリ。 特記事項: 指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に することができる。 書式:出力指定により以下の3種類に分かれる。 (1) ASCII 形式指定(MNTREN= ASCII) [ MD 情報行 MD エネルギー情報行]×出力回数 MD 情報行: 当該ループ回数 シミュレート時間 CPU 時間 MD エネルギー情報行: 総エネルギー 運動エネルギー 温度 “root-mean square force” エネルギー詳細情報※ “1-5 van der Waals 数” “1-5 水素結合数” “root-mean square deviation” ※「エネルギー詳細情報」の各フィールドの内容は、前ページの通り。 (2) 4 バイト実数形式指定(MNTREN= SINGLE) [ MD 情報 myPresto 4.2 MD エネルギー情報 ]×出力回数 243 MD 情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*4×1 CPU 時間 :real*4×1 MD エネルギー情報: 総エネルギー :real*4×1 運動エネルギー :real*4×1 温度 :real*4×1 エネルギー詳細情報 :real*4×29(29:エネルギー種別数) root-mean square force :real*4×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*4×1 (3) 8 バイト実数形式指定(MNTREN= DOUBLE) [ MD 情報 MD エネルギー情報 ]×出力回数 MD 情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*8×1 CPU 時間 :real*8×1 MD エネルギー情報: 総エネルギー :real*8×1 運動エネルギー :real*8×1 温度 :real*8×1 エネルギー詳細情報 :real*8×29(29:エネルギー種別数) root-mean square force :real*8×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*8×1 myPresto 4.2 244 A.3.3 モニター指定トラジェクトリ 出力フェーズ:MD 内容: モニター指定ファイルの内容に対するトラジェクトリ。 特記事項: 指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に することができる。 書式:出力指定により以下の3種類に分かれる。 (1) ASCII 形式指定(MNTRTR= ASCII) [ トラジェクトリー情報行 データ行]×出力回数 トラジェクトリ情報行: 当該ループ回数 ※ 原子位置数 二原子間距離数 変角数 二面角数 当該データの個数 当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数 データ行: 実数値×当該データの個数 (2) 4 バイト実数形式指定(MNTRTR= SINGLE) [ トラジェクトリー情報 myPresto 4.2 データ ]×出力回数 245 トラジェクトリ情報: 当該ループ回数 :integer*4×1 原子位置数 :integer*4×1 二原子間距離数 :integer*4×1 変角数 :integer*4×1 二面角数 :integer*4×1 当該データの個数 :integer*4×1 データ: データ ※ :real*4×(当該データの個数) 当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数 (3) 8 バイト実数形式指定(MNTRTR= DOUBLE) [ トラジェクトリー情報 データ ]×出力回数 トラジェクトリ情報: 当該ループ回数 :integer*4×1 原子位置数 :integer*4×1 二原子間距離数 :integer*4×1 変角数 :integer*4×1 二面角数 :integer*4×1 当該データの個数 :integer*4×1 データ: データ ※ :real*8×(当該データの個数) 当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数 myPresto 4.2 246 A.3.4 総エネルギーデータ 出力フェーズ:MD 内容: 総エネルギーデータ (total potential energy) 特記事項: 指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に することができる。 書式:出力指定により以下の3種類に分かれる。 (1) ASCII 形式指定(MNTRTO= ASCII) [ 総エネルギーデータ情報行]×出力回数 総エネルギー情報行: 総エネルギーデータ (2) 4 バイト実数形式指定(MNTRTO= SINGLE) [ 総エネルギー情報 ]×出力回数 総エネルギー情報: 総エネルギー :real*4×1 (3) 8 バイト実数形式指定(MNTRCO= DOUBLE) [ 総エネルギー情報 ]×出力回数 総エネルギー情報: 総エネルギー myPresto 4.2 :real*8×1 247 A.3.5 座標トラジェクトリ 出力フェーズ:MD 内容: 原子座標のトラジェクトリ。 特記事項: 指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に することができる。 書式:出力指定により以下の3種類に分かれる。 (1) ASCII 形式指定(MNTRCO= ASCII) [ エネルギー情報行 原子座標情報行]×出力回数 エネルギー情報行: 当該ループ回数 シミュレート時間 CPU 時間 総エネルギー ポテンシャルエネルギー “root-mean square force” “1-5 水素結合数” 運動エネルギー 温度 “1-5 van der Waals 数” “root-mean square deviation” 原子座標情報行: [x 座標 y 座標 z 座標]×自由原子数 (2) 4 バイト実数形式指定(MNTRCO= SINGLE) [ エネルギー情報 原子座標情報 ]×出力回数 myPresto 4.2 248 エネルギー情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*4×1 CPU 時間 :real*4×1 総エネルギー :real*4×1 運動エネルギー :real*4×1 温度 :real*4×1 ポテンシャルエネルギー :real*4×1 root-mean square force :real*4×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*4×1 原子座標情報: 原子座標 :real*4×3×自由原子数 (3) 8 バイト実数形式指定(MNTRCO= DOUBLE) [ エネルギー情報 原子座標情報 ]×出力回数 エネルギー情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*8×1 CPU 時間 :real*8×1 総エネルギー :real*8×1 運動エネルギー :real*8×1 温度 :real*8×1 ポテンシャルエネルギー :real*8×1 root-mean square force :real*8×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*8×1 原子座標情報: 原子座標 myPresto 4.2 :real*8×3×自由原子数 249 A.3.6 速度トラジェクトリ 出力フェーズ: MD 内容: 原子速度のトラジェクトリ 。 特記事項: 指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に することができる。 書式:出力指定により以下の3種類に分かれる。 (1) ASCII 形式指定(MNTRVE= ASCII) [ エネルギー情報行 原子速度情報行]×出力回数 エネルギー情報行: 当該ループ回数 シミュレート時間 CPU 時間 総エネルギー ポテンシャルエネルギー “root-mean square force” “1-5 水素結合数” 運動エネルギー 温度 “1-5 van der Waals 数” “root-mean square deviation” 原子速度情報行: [x 成分 y 成分 z 成分]×自由原子数 (2) 4 バイト実数形式指定(MNTRVE= SINGLE) [ エネルギー情報 原子速度情報 ]×出力回数 myPresto 4.2 250 エネルギー情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*4×1 CPU 時間 :real*4×1 総エネルギー :real*4×1 運動エネルギー :real*4×1 温度 :real*4×1 ポテンシャルエネルギー :real*4×1 root-mean square force :real*4×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*4×1 原子速度情報: 原子速度 :real*4×3×自由原子数 (3) 8 バイト実数形式指定(MNTRVE= DOUBLE) [ エネルギー情報 原子速度情報 ]×出力回数 エネルギー情報: 当該ループ回数 :integer*4×1 シミュレート時間 :real*8×1 CPU 時間 :real*8×1 総エネルギー :real*8×1 運動エネルギー :real*8×1 温度 :real*8×1 ポテンシャルエネルギー :real*8×1 root-mean square force :real*8×1 1-5 van der Waals 数 :integer*4×1 1-5 水素結合数 :integer*4×1 root-mean square deviation :real*8×1 原子速度情報: 原子速度 myPresto 4.2 :real*8×3×自由原子数 251 B ユーティリティ B.1 setwater 蛋白質などの系に水を付加します。作成できる水分子のモデルは、TIP3P または TIP4P で す。使用前に、水分子の座標データ(システム添付:tools/setwater/tip3_base.pdb およ び tip4_base.pdb)を作業ディレクトリにコピーしておきます。 また、結晶水も付加することができます。結晶水を付加する場合は、結晶水だけを抜き 出した PDB 形式の座標を準備してください。この場合の書式は、レコード名"HETATM"、残 基名"HOH"としてください。 結晶水の例 HETATM HETATM HETATM 1 2 3 O O O HOH HOH HOH 1 2 3 -7.948 -7.948 -7.948 -7.948 -7.948 -7.948 -7.948 -4.844 -1.741 【注意】setwater は、事前に周期境界条件、温度 300K、密度 1g/cm3 で平衡化した水の座 標をもとに、溶媒水の座標を発生させます。使用前に、水分子の座標データ(システム 添付:tools/setwater/tip3_base.pdb および tip4_base.pdb)を作業ディレクトリにコ ピーしておきます。 【注意】結晶水は PDB などの水素の省略された形(酸素だけ)を想定しています。また、 結晶水の付加では、酸素に水素を付加するとき、水素は一定方向にのみ配向します。 入力データ (1)蛋白質など水を付加する系の PDB ファイル名 (2)結晶水の PDB ファイルの使用の有無 (3)結晶水の PDB ファイル名(結晶水の PDB ファイルを使用する場合) (4)結果の出力の PDB ファイル名 (5)水を入れるセルの形状 (6)水を入れるセルの半径、セルの辺の長さ myPresto 4.0 252 (7)水を入れるセルの中心の種別(系の中心で指定、任意の座標で指定) (8)水を入れるセルの中心の座標(セルの中心を座標で指定する場合) (9)付加する水分子の密度の係数(通常は 1.0) (10)van der Waals 半径のダンピングファクター(通常は 1.0) (11)水分子のモデル(TIP3P または TIP4P) ■使用例 % setwater --- setwater --Input file name (PDB of target molecule) ? protein.pdb (1) -> none.pdb Do you use crystal water file (Y or N) ? Y (2) Input file name (PDB of crystal water) ? crystal_water.pdb (3) -> box.pdb Input file name (output) ? new_water.pdb (4) -> res Input cell type (sphere="S", ellipsoid="E", cube="C", parallelepiped="P") ? E (5) Input length (A,B,C) ? 10.0 20.0 30.0 (6) -> ellipsoid : 10.0000000000 20.0000000000 30.0000000000 Input center of water (mass center="C", 3D-coordinate="D") ? D (7) Input coordinate (X,Y,Z) ? 10.0 0.0 0.0 (8) -> coodinate : 10.0000000000 0.0000000000 0.0000000000 Input density of water (usually 1.0) ? 1.0 (9) -> 1.0000000000 Input vdW damping factor (usually 1.0) ? 1.0 (10) -> 1.0000000000 Input water model (TIP3P="3", TIP4P="4") ? 3 (11) -> TIP3P % myPresto 4.2 253 B.2 mergetpl 複数のトポロジーファイルを1つのトポロジーファイルにマージします。 入力データ (1)マージ対象のトポロジーファイル名(1 個目) (2)マージ対象のトポロジーファイル名(2 個目) (3)マージ対象のトポロジーファイル名(3∼10 個目) (4)結果の出力のトポロジーファイル名 【注意】ポテンシャル関数指定記述("TPL> FUNC"行)および非結合相互作用指定記述("TPL> NONBOND"行)の内容が異なる場合、マージした結果のトポロジーファイルは正しくあり ません。結果のトポロジーファイルには、最初に入力指定したトポロジーファイルの "TPL> FUNC"行 および "TPL> NONBOND"行 の内容が出力されます。 【注意】上記の問題は、tplgene で作成した蛋白質のトポロジーファイルと tplgeneL で作 成した低分子のトポロジーファイルをマージする場合、剛体で取り扱う TIP4P モデルの 水分子のトポロジーファイルをマージする場合、また、人手で改変したトポロジーファ イルを取り扱う場合などで発生しやすいので、特に注意が必要です。 ■使用例 % mergetpl --- mergetpl Input file aa.tpl Input file bb.tpl Input file cc.tpl Input file --name ? ( end: RETURN ) (1) name ? ( end: RETURN ) (2) name ? ( end: RETURN ) (3) name ? ( end: RETURN ) Output file name ? output.tpl --- done --% (4) myPresto 4.2 254 ◆水分子のトポロジーファイルの扱い 水分子のトポロジーファイルとして、TIP3P モデルおよび TIP4P モデルをシステムに添付 しています(tools/common/tip3p.tpl および tip4p.tpl)。これらの TIP3P と TIP4P のトポ ロジーファイルは、"OW"原子に対応する、非結合相互作用指定記述("TPL> NONBOND"行) の"相互作用タイプ"の内容が異なります。 【TIP3P】 18 0 1 1.76830 0.152000 0.833333 0.500 1.7699 0.155000 0.833333 0.500 【TIP4P】 18 0 1 よって、TIP4P のトポロジーファイルを使う場合は、マージの際に"TPL> NONBOND"行の「OW」 に相当する部分の値を TIP4P 用に修正する必要があります(TIP3P との混在はない)。 (省略) : TPL> NONBONDS ;NUMBER OF TYPE= 1 0 1 2 0 1 3 0 1 4 0 1 5 0 1 6 0 1 7 0 1 8 0 1 9 0 1 10 0 1 11 0 1 12 0 1 13 0 1 14 0 1 15 0 1 16 0 1 17 0 1 18 0 1 : (省略) myPresto 4.2 39 1.90800 1.90800 0.60000 0.00000 0.60000 1.48700 1.38700 1.28700 1.18700 1.10000 1.45900 1.40900 1.35900 0.00000 1.82400 1.66120 1.66120 1.76990 0.086000 0.109400 0.015700 0.000000 0.015700 0.015700 0.015700 0.015700 0.015700 0.015700 0.015000 0.015000 0.015000 0.000000 0.170000 0.210000 0.210000 0.155000 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.8333333 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; 0.500; c c3 h ho hs hc h1 h2 h3 hx ha h4 h5 hw n o o2 ow TIP4P 255 B.3 SHAKEinp トポロジーファイルと PDB ファイルから、対象原子の原子番号と拘束距離を指定した SHAKE ファイルを作成します。このツールで水分子 TIP3P モデルを指定するためには、TIP3P モデルの SHAKE ファイル(システム添付:tools/SHAKEinp/tip3_shk.model)が必要です。 使用前に、このファイルを作業ディレクトリにコピーしておきます。SHAKE ファイルが作業 ディレクトリの存在しない場合にはシステム内のデータを用いて TIP3P 情報を出力します。 入力データ (1)SHAKE ファイルを作成する系のトポロジーファイルファイル名 (2)SHAKE ファイルを作成する系の PDB 名 (3)出力 SHAKE ファイル名 (4)水分子 TIP3P モデルを使用するか否か(水分子が含まれる場合のみ) オプション -itpl -ipdb -oshk -h <tpl_file> <pdb_file> <shk_file> トポロジーファイル名を <tpl_file> に指定します。 PDB ファイル名を <pdb_file> に指定します。 SHAKE ファイル名を <shk_file> に指定します。 SHAKEinp の使用法を表示します。 コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップされ ます。オプションで指定しなかったものだけを対話的に入力することになります。 ■使用例 % SHAKEinp Please input TPL filename. indo_tip3p.tpl Please input PDB filename. indo_tip3p.pdb Please input SHAKE filename. indo_tip3p.shk INFORMATION> H2O was detected. Do you want to use TIP3P model?[yes/no] yes (1) (2) (3) (4) INFORMATION> toolWriteTip3p The file "tip3_shk.model" is found. Information given by this file is used for the Tip3p model. %% Program is done. %% %% This program is normal end. %% myPresto 4.2 256 B.4 RIGIDinp トポロジーファイルから剛体モデル指定ファイルを作成します。このプログラムではト ポロジーファイルから、水素と結合している原子の情報を取得し、その結合原子グループ を剛体とみなし、拘束を行います。 水分子の TIP3P、TIP4P モデルを剛体に指定する場合には、TIP3P、TIP4P モデルの剛体指 定ファイル(システム添付:tools/RIGIDinp/tip3_rig.model、tip4_rig.model)が必要と なります。プログラム実行前に、これらのファイルを作業ディレクトリにコピーしておき ます。また、任意のフラグメントの拘束を行う場合には、フラグメント DB ファイル(シス テム添付:tools/RIGIDinp/fragment.db)にフラグメント情報を記述する必要があります。 プログラム実行前に、このファイルを作業ディレクトリに置いて下さい。 入力データ (1)剛体モデル指定ファイルを作成する系のトポロジーファイル名 (2)剛体モデルの指定レベル (i) 水素原子との結合のみを剛体として指定 (ii)(i)に加え、任意のフラグメントを剛体として指定 オプション -i <tpl_file> トポロジーファイル名を<tpl_file>に指定します -l [ allH │ fr ] 剛体モデルの指定レベルを指定します (i) 水素原子との結合のみを拘束 ⇒ allH (ii)(i)+ フラグメントを拘束 ⇒ fr ※オプション”-l”を指定しない場合には、水素原子との結合のみを拘束します。 【注意】出力する剛体モデルファイル名は XXX.rig となります。 (XXX はトポロジーファイル名から拡張子を除いたもの) myPresto 4.2 257 ■使用例 % RIGIDinp ?i indo.tpl また、オプション"-h"または、"-help"の指定により、RIGIDinp の使用法を見ることがで きます。 % RIGIDinp -h または、 % RIGIDinp -help myPresto 4.2 258 B.5 GBSAinp トポロジーファイルから、GB/SA 用パラメータ指定ファイルを作成します。mkGBSAin.pl で GB/SA 用パラメータ指定ファイルを作成するためには、GB/SA 用のパラメータ DB ファイ ル(システム添付:tools/GBSAinp/gb_sa.db)が必要です。使用前に、このファイルを作 業ディレクトリにコピーしておきます。 【注意】入力に PDB ファイルを指定した場合、内部で connectAtomPDB.x を利用します。 その為、connectAtomPDB.x を mkGBSAin.pl と同じディレクトリに配置します。 入力データ (1) GB/SA 用のパラメータ DB ファイル名(システム添付:gb_sa.db) (2) GB/SA 用パラメータファイルを作成する系のトポロジーまたは PDB ファイル名 (3) 出力 GB/SA 用パラメータ指定ファイル名 ■使用例 % mkGBSAin.pl %% INPUT DB FILE NAME. %% gb_sa.db %% SELECT INPUT FILE BY THE NEXT NUMBER. 1 : PDB FILE 2 : TPL FILE 2 %% INPUT FILE NAME. %% vas-dih.tpl %% INPUT OUTPUT FILE NAME. vas-dih.sol myPresto 4.2 %% %% 259 B.6 自由エネルギー計算(Filling potential 法 + WHAM 法)解析 Filled Potential 計算における反発ポテンシャルと求心ポテンシャルを示す Umbrella Potential ファイルを作成し、座標トラジェクトリ群と Umbrella Potential の解析結果か ら自由エネルギーのヒストグラムを解析します。 B.6.1 Generate_NextFP MD の座標トラジェクトリ、この MD での Umbrella Potential ファイル、およびユーザ 指定を読み込み、新規の Umbrella Potential ファイルを作成します。 入力データ (1)制御ファイル (1−1)前回の MD での Umbrella Potential 指定ファイル名 (1−2)出力 Umbrella Potential 指定ファイル名 (1−3)初期座標 PDB ファイル名 (1−4)前回の MD での座標トラジェクトリファイル名 (1−5)座標トラジェクトリの読み飛ばし回数 (1−6)座標トラジェクトリ読み込み回数 (1−7)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble) (1−8)PDB ファイルの画面表示オプション("y"es │ "n"o) (1−9)求心関数の種別 (1−10)温度 (1−11)ガウス型反発関数の高さ (1−12)ガウス型ポテンシャル中心座標の更新間隔を制御する範囲 (1−13)ガウス型反発関数の幅 (1−14)求心関数の高さ (1−15)求心関数の幅 (1−16)目標とする最終座標 (1−17)掃引開始回数、終了回数 (2)初期座標 PDB ファイル (3)前回の MD での座標トラジェクトリファイル (4)前回の MD 入力の Umbrella Potential 指定ファイル ■使用例 % Generate_NextFP < genefp.inp myPresto 4.2 260 ■制御ファイル例 newopt_fp newopt_fp2 initial.pdb xx_traject.cor -1000 2000 s y HAR2 300.0 0.5 2.5 6.0 3.0 5.0 1.0 ATOM 4131 O ATOM 4131 O 1 50 ; 入力 Umbrella Potential 指定ファイル ; 出力 Umbrella Potential 指定ファイル ; 初期座標 ; 前回の MD のトラジェクトリ ; トラジェクトリの読み飛ばし回数 ; トラジェクトリ読み込み回数 ; トラジェクトリファイル形式 ; PDB ファイルの原子表示 ; 求心関数種別 (HAR1 │ HAR2 │ LIN1 │ LIN2) ; 対象の温度 ; ガウス型反発関数の高さ ; ガウス型ポテンシャルの中心座標の更新間隔を制御する範囲 ; ガウス型反発関数の幅 ; 求心関数の高さ ; 求心関数の幅 WAT 839 0.000 0.000 -8.000 15.00 -0.83 ; 目標焦点座標 1 WAT 839 0.000 0.000 -8.000 17.00 -0.83 ; 目標焦点座標 2 ; 掃引開始回数、終了回数 出力データ (1) Umbrella Potential ファイル ■出力 Umbrella Potential ファイル例 FILL> GAUS 2 6 1 0.0000000 0.0300000 ; DIMENSION ; ATOM ID ; WEIGHT DIM= ; RADIUS DIM= ATOM NUMBER OF ATOMS 1 1 0.000 0.5000000 3.0000000 ; WEIGHT DIM= ; RADIUS DIM= ATOM 0.5000000 3.0000000 ATOM myPresto 4.2 1 ; DIMENSION ; ATOM ID ; WEIGHT DIM= ; RADIUS DIM= -2.000 ; CENTER-1 ATOM= 6 0.269 -2.312 ; CENTER-1 ATOM= 6 2 2 0.283 FILL> HAR1 1 6 0.000 NUMBER OF ATOMS 1 1 0.283 0.269 -2.312 ; CENTER-1 ATOM= 6 261 B.6.2 Extract_Atom MD の座標トラジェクトリ、この MD での Umbrella Potential ファイル、およびユーザ指 定を読み込み、Umbrella Potential 対象原子の座標のみ切り出したトラジェクトリファイ ルを生成します。 入力データ (1)制御ファイル (1−1)Umbrella Potential 指定ファイル名 (1−2)座標トラジェクトリファイルの原子数 (1−3)座標トラジェクトリファイル数 (1−4)入力、出力座標トラジェクトリファイル名 (1−5)座標トラジェクトリの読み飛ばし回数 (1−6)座標トラジェクトリ読み込み回数 (1−7)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble) (2)座標トラジェクトリファイル群 (3)前回の MD 入力の Umbrella Potential ファイル ■制御ファイル例 newopt_fp 1023 4 xx_trj1.cor xx_trj2.cor xx_trj3.cor xx_trj4.cor -1000 2000 s w_1.cor w_2.cor w_3.cor w_4.cor ; ; ; ; ; ; ; ; ; ; 入力 Umbrella Potential 指定ファイル トラジェクトリファイルの原子数 入力トラジェクトリファイル数 入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 トラジェクトリの読み飛ばし回数 トラジェクトリ読み込み回数 トラジェクトリファイル形式 1 2 3 4 ■使用例 % Extract_Atom < extract.inp myPresto 4.2 262 B.6.3 Wham_Analysis 複数 MD の座標トラジェクトリと、Umbrella Potential 指定 ファイルから、各トラジェ クトリでの自由エネルギーを計算します。 入力データ (1)制御ファイル (1−1)最終世代の Umbrella Potential 指定ファイル名 (1−2)座標トラジェクトリの読み飛ばし回数 (1−3)座標トラジェクトリ読み込み回数 (1−4)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble) (1−5) 自由エネルギー計算の平均値計算のサンプリング距離 (1−6)WHAM 解析の収束ループ数 (1−7)計算温度 (1−8)WHAM 解析時のメモリ指定("m"emory │ "s"peed) (1−9)座標トラジェクトリファイル数 (1−10)入力座標トラジェクトリファイルと各世代 Umbrella Potential ファイル (2)各世代の座標トラジェクトリファイル (3)各世代の Umbrella Potential ファイル ■制御ファイル例 w_4.option ; 最終世代の入力 Umbrella Potential 指定ファイル名 0 ; トラジェクトリの読み飛ばし回数 2000 ; トラジェクトリ読み込み回数 s ; トラジェクトリファイル形式 0.5 ; 自由エネルギー計算の平均値計算のサンプリング距離 1000 ; WHAM 解析収束ループ 310 ; 計算温度 m ; メモリ優先 4 ; MD の世代数 w_1.cor w_1.option ; 1 世代目のトラジェクトリファイルと Umbrella w_2.cor w_2.option ; 2 世代目のトラジェクトリファイルと Umbrella w_3.cor w_3.option ; 3 世代目のトラジェクトリファイルと Umbrella w_4.cor w_4.option ; 4 世代目のトラジェクトリファイルと Umbrella ■使用例 % Wham_Analysis myPresto 4.2 < wham.inp Potential ファイル Potential ファイル Potential ファイル Potential ファイル 263 出力データ (1) 自由エネルギー計算結果 標準出力の最後に下記のようなトラジェクトリ番号、RMSD、自由エネルギーの表を出 力します。指定された範囲に座標が存在しない場合は自由エネルギーの欄に"--------" を出力します。 ■出力ファイル例 FILL> GAUS 2 6 1 ; DIMENSION ; ATOM ID NUMBER OF ATOMS INFORMATION> WHAM ANALYSIS RESULT EXP-ID R.M.S.D(A) AVERAGE 1 4.000000 0.000000115 2 4.513558 0.000000103 3 4.090083 0.000000228 4 3.778652 0.000000000 FREE-ENERGY 0.984069810E+01 0.990723128E+01 0.942155513E+01 ----------- myPresto 4.2 264 B.7 拡張アンサンブル向け解析ツール 拡張アンサンブルでの結果を解析するためのツールです。 各種の拡張アンサンブル MD でサンプリングした構造をクラスタリングし、代表的な構造 を PDB ファイルとして出力します。 本ツールは座標抽出ツールと座標クラスタリングツールの二つで構成されています。 (1)トラジェクトリ抽出ツール reweighting ツールが出力したエネルギー確率分布を元に座標トラジェクトリ を抽出するツール (2)座標クラスタリングツール 座標トラジェクトリをクラスタリングするツール cosgene エネルギー 座標トラジェクトリ トラジェクトリ reweighting ツール 各温度の エネルギー分布 トラジェクトリ抽出ツール 座標トラジェクトリ 座標クラスタリングツール PDB ファイル myPresto 4.2 デンドログラム エネルギー分布 265 B.7.1 reweightFB Force-biased McMD のエネルギートラジェクトリファイル、およびユーザ指定を読み込み、 新規の canonical 分布を示すファイルを作成します。 入力データ (1)制御ファイル (1−1)Force-biased McMD 法での MD エネルギートラジェクトリファイル名 (1−2)出力ファイル名 (a)収束ループでのループ回数と relative partition function 値 (b)エネルギー、密度および総合確率 (c)各温度でのエネルギーの canonical 分布 (d)温度、平均エネルギー (1−3)ヒストグラムパラメータ (a)bin のサイズ(KCAL/MOL)(MD の値とあわせる) (b)bin の個数(MD の値とあわせる) (c)エネルギートラジェクトリのサンプリング範囲の下限 (d)エネルギートラジェクトリのサンプリング範囲の上限 (1−4)温度、確率密度関数のパラメータ (a)シミュレーション時の設定温度 (b)出力する canonical 分布の温度下限(K) (c)出力する canonical 分布の温度上限(K) (d)出力する canonical 分布の間隔(K) (e)canonical 分布を求める確率密度関数の下限値 (2)Force-biased McMD 法での MD エネルギートラジェクトリファイル ■制御ファイル例 F.B.scale ; Force-biased McMD のエネルギートラジェクトリファイル名 function.dat dencity.dat canonical.dat temperature.dat ; 出力ファイル名 1.0 351 1 44 ; bin サイズ bin 数 ; エネルギートラジェクトリのサンプリング 範囲の下限 ; エネルギートラジェクトリのサンプリング 範囲の上限 600 200 800 10 1.d-05 ; 温度 温度下限 温度上限 温度ステップ 確率密度関数下限 ■使用例 % reweightFB < rew.inp myPresto 4.2 266 B.7.2 reweightST Simulated-Tempering MCMD のエネルギートラジェクトリファイル、およびユーザ指定を 読み込み、新規の canonical 分布を示すファイルを作成します。 入力データ (1)制御ファイル (1−1)Simulated-Tempering 法での MD のエネルギートラジェクトリファイル名 (1−2)出力ファイル名 (a)各温度でのエネルギーの canonical 分布 (b)各温度の平均エネルギー (1−3)ヒストグラムパラメータ (a)ポテンシャルの bin のサイズ(KCAL/MOL)(実行した MD の値とあわせる) (b)温度の bin のサイズ (c)分布を出力する温度の下限 (d)分布を出力する温度の上限 (e)温度の分割数 (1−4)サンプリング区間 (a)サンプリング区間の先頭 (b)サンプリング区間の最後 (1−5)初期温度 (2) Simulated-Tempering 法での MD のエネルギートラジェクトリファイル ("S.T.energy") ■制御ファイル例 S.T.energy ; Simulated-Tempering のエネルギートラジェクトリ canonical average ; 出力ファイル名 1.0 100.0 200.0 700.0 6.0 ; ポテンシャル bin サイズ 温度 bin サイズ ; 温度下限 温度上限 0 800 ; サンプリング区間先頭 600.0 ; 初期温度 温度分割数 ■使用例 % reweightST myPresto 4.2 < rew.inp サンプリング区間最後 267 B.7.3 reweightGST Generalized Simulated-Tempering MCMD のエネルギートラジェクトリファイル、および ユーザ指定を読み込み、新規の canonical 分布を示すファイルを作成します。 入力データ (1)制御ファイル (1−1)Generalized Simulated-Tempering 法での MD のエネルギートラジェクトリ ファイル名 (1−2)出力ファイル名 (a)収束ループでのループ回数とポテンシャルの分配関数 (b)エネルギー、密度および総合確率 (c)各温度でのエネルギーの canonical 分布 (d)温度、平均エネルギー (1−3)ヒストグラムパラメータ (a)ポテンシャルの bin のサイズ(KCAL/MOL)(実行した MD の値とあわせる) (b)λの下限 (実行した MD の値とあわせる) (c)λの上限 (実行した MD の値とあわせる) (d)λの分割数 (e)G.S.T.でのエネルギー基準値 (実行した MD の値とあわせる) (f)ηの値(実行した MD の値とあわせる) (1−4)サンプリング区間 (a)サンプリング区間の先頭 (b)サンプリング区間の最後 (1−5)温度 (a)分布を出力する温度の下限 (b)分布を出力する温度の上限 (c)初期温度 (2)G.S.T.法でのエネルギートラジェクトリファイル("G.S.T.energy") ■制御ファイル例 G.S.T.energy ; Generalized Simulated Tempering のエネルギートラジェクトリ partition dencity canonical average ; 出力ファイル名 1.0 0.001 0.006 10 0.0 4.5 ; bin サイズ λ下限 λ上限 λ分割数 200 800 100 ; 温度下限 温度上限 温度分割の幅 エネルギー基準値 η値 myPresto 4.2 268 B.7.4 selection トラジェクトリ抽出ツールは、入力したポテンシャルエネルギーの確率分布に従って、 座標トラジェクトリの構造を抽出し、再構成するツールです。 入力データ トラジェクトリ抽出ツールの入力を以下に示します。 (1)座標トラジェクトリ cosgene の出力トラジェクトリ (2)エネルギー確率分布 reweighting ツールの出力ファイル (3)トラジェクトリ抽出ツールの制御ファイル (3-1)エネルギー確率分布ファイル名 (3-2)座標トラジェクトリファイル名 (3-3)トラジェクトリファイルの型(Single │ Double) (3-4)サンプリング区間先頭 (3-5)サンプリング区間最後 (3-6)確率分布にかける係数(抽出する座標数はこの係数に比例する) (3-7)出力トラジェクトリファイル名 (3-8)原子数 制御ファイル例) bestfit 対象原子指定ファイル例(水素以外の蛋白質原子のみ bestfit する) pdf.total ala8.cor_ST S 0 10000000 100.0 select.cor 32 myPresto 4.2 269 標準出力例) ***** COORDINATE TRAJCETORY SELECT TOOL FOR COSGENE (2005/08/31) ***** FUNCTION : SELECT TRAJECTORY AND OUTPUT TRAJECTORY FILE INPUT : (1) ENERGY PROBABILITY DENCTY FUNCTION FILE NAME (2) COSGENE TRAJCECTORY FILE NAME (3) TRAJECTORY FORMAT (4) START LOOP NUMBER (5) END LOOP NUMBER (6) SELECTION RATE (7) OUTPUT TRAJECTORY FILE NAME OUTPUT : (1)SELECTED TRAJECTORY *************************************************************** INPUT ENERGY PROBABILITY DENCITY FUNCTION FILE NAME INPUT TRAJECTORY FILE NAME INPUT COORDINATE TRAJECTORY FORMAT ("S"ingle │ "D"ouble) INPUT START LOOP NUMBER INPUT END LOOP NUMBER SELECTION RATE (0.0 < RATE OUTPUT NEW TRAJECTORY FILE NAME ***** SELECT TRAJECTORY RESULT ***** 1) DISTRIBUTION POTENTIAL-ENERGY PROBABILITY(%) TRAJECTORIES SAMPLES SAMPLE-RATE(%) -0.55000E+01 0.933 0 0 -----0.45000E+01 1.000 1 1 100.000 -0.35000E+01 0.987 0 0 -----0.25000E+01 0.970 0 0 -----0.15000E+01 1.007 0 0 -----0.50000E+00 1.023 4 4 100.000 0.50000E+00 1.039 2 2 100.000 0.15000E+01 1.031 4 4 100.000 0.25000E+01 1.022 10 10 100.000 0.35000E+01 0.952 13 12 92.308 0.45000E+01 0.905 10 10 100.000 0.55000E+01 0.837 12 9 75.000 0.65000E+01 0.796 15 11 73.333 0.75000E+01 0.776 13 11 84.615 P.D.F. SUM= 99.9852000000000 STRUCT SUM= 2000 SAMPLE SUM= 1056 2) INPUT FILES TRAJECTORY FILE ala8.cor_ST : 3) SELECTION TOTAL TRAJECTORY NUMBER : 2000 SAMPLING BOUND : 0 10000000 SAMPLING NUMBER : 2000 RATE : 100.000000000000 OUTPUT NUMBER : 1056 TRAJECTORY FILE : select.cor *************************************************************** myPresto 4.2 270 B.7.5 clustering 各種の拡張アンサンブル計算でサンプリングした構造をクラスタリングし、代表的な構 造を PDB ファイルとして出力します。 入力データ (1)制御ファイル (1−1)トポロジーファイル名 (1−2)ベストフィットの適用("Y" │ "N") (1−2−1)ベストフィット対象原子指定ファイル名 (1−3)RMSD 計算対象原子の指定("Y" │ "N") (1−3−1)RMSD 計算対象原子指定ファイル名 (1−4)サンプル数 (1−5)クラスタ数 (1−6)サンプリング区間先頭 (1−7)サンプリング区間最後 (1−8)入力トラジェクトリファイル名 (1−9)トラジェクトリファイルの型("S" │ "D") (1−10)クラスタリング方法("nearest " │ "furthest" │ "median " │ "centroid" │ "average " │ "flexible" │ "ward " ) (1−10−1)flexible 指定時のβ値 (1−11)出力 PDB 名先頭 (1−12)デンドログラムファイル名 (2)cosgene の入力トポロジーファイル (3)cosgene の出力トラジェクトリファイル (4)ベストフィット対象原子指定ファイル(ベストフィット対象原子指定時) ベストフィット対象原子を cosgene の「系の重心合わせ指定用ファイル」と 同じ書式で指定します。 (p.161「A.2.11 系の重心合わせ指定用ファイル」を参照) (5)RMSD 計算対象原子指定ファイル(RMSD 計算対象原子指定時) RMSD 計算対象原子を cosgene の「系の重心合わせ指定用ファイル」と同じ書式で 指定します。(p.161「A.2.11 系の重心合わせ指定用ファイル」を参照) 【注意】 メモリ使用量の観点から、サンプリングする構造は 1000 個以内が望ましいです。 myPresto 4.2 271 【注意】 サンプリングする構造を 1000 個以上に指定することは可能です。メモリ確保に失敗した ときは以下のエラーメッセージを出力し、プログラムの実行を停止します。 "CANNOT ALLOCATE MEMORY, DECREASE SAMPLING NUMBER" ■制御ファイル例 ala8.tpl n n 10 10 10 40 ala8.cor_ST S nearest ala8.cls ala8.tree ; ; ; ; ; ; ; ; ; ; ; ; トポロジーファイル名 ベストフィットの適用 RMSD 計算対象原子の指定 サンプル数 クラスタ数 サンプリング区間先頭 サンプリング区間最後 入力トラジェクトリファイル名 トラジェクトリファイルの型 クラスタリング方法 出力 PDB 名先頭 デンドログラムファイル名 ■ベストフィット対象原子指定ファイル例 (水素以外の蛋白質原子のみベストフィットする例) SETBST> LIST FIX 1 1 FIX 2 2 FIX 3 1000 1 32 H* 1 1 * 1 1 * YES YES YES ; 蛋白(チェイン 1)の 1∼32 残基の"H*"は bestfit 対象外 ; リガンド(チェイン 2)の全原子は bestfit 対象外 ; 水分子(チェイン 3∼1000)の全原子は bestfit 対象外 ■RMSD 計算対象指定ファイル (水素以外のリガンド原子のみ RMSD 計算する例) SETBST> LIST FIX 1 1 FIX 2 2 FIX 3 1000 1 32 * 1 1 H* 1 1 * YES ; 蛋白(チェイン 1)の 1∼32 残基の全原子は bestfit 対象外 YES ; リガンド(チェイン 2)の"H*"は bestfit 対象外 YES ; 水分子(チェイン 3∼1000)の全原子は bestfit 対象外 myPresto 4.2 272 出力データ (1)ログ(標準出力に出力) (1−1)ツールの使用方法 (1−2)データ入力問い合わせ (1−3)クラスタリング条件 (1−4)入力トポロジーファイル情報 (1−5)ベストフィット対象原子一覧(ベストフィット対象原子指定ファイルに 表示指定がある場合) (1−6)RMSD 計算対象原子一覧(RMSD 計算対象指定ファイルに表示指定がある場合) (1−7)クラスタリング進行状況 (1−8)出力 PDB ファイル名 (2)代表構造の PDB ファイル クラスタ番号、構造数、エネルギーおよびループ回数をコメント出力し、 原子情報を出力します。出力ファイル名は「"出力 PDB 名先頭"+"."+ループ回数」 となります。 (3)デンドログラムファイル ループ回数とポテンシャルを葉の名称としたデンドログラムを出力します。 ■代表構造の PDB ファイル例 REMARK REMARK REMARK REMARK ATOM ATOM ATOM ATOM ATOM CLUSTER STRUCTURE LOOP POTENTIAL 1 CA ACE 2 HH31 ACE 3 HH32 ACE 4 HH33 ACE 5 C ACE : 1 NUMBER: 140 : 10000 : 176.955627441406 1 2.508 1.314 1 2.771 1.634 1 2.166 0.280 1 1.718 1.947 1 3.771 1.408 ■デンドログラムファイル例 ( ( "10000 176.96 KCAL/MOL" , ( "13000 174.52 KCAL/MOL " , "16000 184.61 KCAL/MOL " ) (つづく) myPresto 4.2 -3.948 12 -4.954 1.01 -3.974 1.01 -3.546 1.01 -3.102 12.01 0.11 0.11 0.11 0.60 273 (つづき) ) , ( ( "19000 163.18 KCAL/MOL " , ( "22000 162.05 KCAL/MOL " , "28000 147.56 KCAL/MOL " ) ) , "25000 146.70 KCAL/MOL " ) ) ; myPresto 4.2 274 B.8 存在確率(Potential Mean Force)解析ツール PMF 解析ツールは、1次元あるいは2次元のデータと存在確率を入力し、各データが存在 する確率を出力します。カノニカルアンサンブルおよびマルチカノニカルアンサンブル計 算に対応しています。 2次元データの解析結果は PMF ツールの解析結果を等高線作成ツールで、excel 用の等高 線のグラフに加工することができます。 B.8.1 pmf モニター指定トラジェクトリファイル、エネルギートラジェクトリファイル、エネルギ ー確率分布ファイル(マルチカノニカルアンサンブルに対しては必須)およびユーザ指定 を入力し、各データの存在確率を出力します。 入力データ (1)制御ファイル (1−1)MD の形式("C"anonical │ "M"ulti-canonical) (1−2)データの次元数( 1 │ 2 ) (1−3)トラジェクトリデータの型("S"ingle │ "D"ouble) (1−4)モニター指定トラジェクトリファイル名 (1−5)エネルギートラジェクトリファイル名 (1−6)データの上限、加減(2 次元の場合は計 4 つ) (1−7)データの bin の数(2 次元の場合は計 2 つ) (1−8)出力ファイルのフォーマット("N" │ "S" │ "C") N:全ヒストグラムデータ S:スキャッタープロット形式 C:等高線データ (1−9)出力ファイル名 (1−10)エネルギー確率分布ファイル((1−1)が "M"の場合は必須) (1−11)スキャッタープロットのサンプル数((1−8)が "S"の場合は必須) (1−12)出力データ種別("P"robability │ "E"nergy) (1−13)エネルギー換算のための温度((1−12)が "E"の場合は必須) (2)モニター指定トラジェクトリファイル (3)エネルギートラジェクトリファイル (4)エネルギー確率分布ファイル((1−1)が "M"の場合は必須) myPresto 4.2 275 ■制御ファイル例 C ; 実行した MD の種別"C"anonical │ "M"ulti-canonical 2 ; 構造の数 (1 or 2) S ; モニター指定・エネルギートラジェクトリの型 ("S"ingle │ "D"ouble) aa.tra ; モニター指定トラジェクトリファイル名 aa.ene ; エネルギートラジェクトリファイル名 -180.0 180.0 -180.0 180.0 ; 構造 1 の上下限 構造 2 の上下限 30 30 ; 構造の分割数 C ; 出力形式 ("N"ormal │ "S"catter-plot │ "C"ontour-map) cont.data ; 出力ファイル名 P ; 確率を出力 出力データ 入力データ(1−8)の指定が "N", "S", "C"の場合、それぞれ以下のデータを出力し ます。 (1)"N"の場合 入力データに従ったヒストグラムを作成し、csv ファイル形式でヒストグラムデータを作 成します。 各行は、"構造 1 の下限, [構造 2 の下限,] 確率"で構成されます。 ■出力例 -0.1800000E+03, -0.1800000E+03, 0.2000000E-02 -0.1680000E+03, -0.1800000E+03, 0.5200000E-02 -0.1560000E+03, -0.1800000E+03, 0.1160000E-01 (2)"S"の場合 確率分布に従い、ユーザが指定した数だけ代表点を作成します。 データ形式は(1)と同じ csv ファイル形式です。 myPresto 4.2 276 (3)"C"の場合 先頭行がデータの行列数、データの下限値、データの範囲、最大値、モニター指定トラ ジェクトリ名で、次の行から確率分布を行列で表した csv ファイル形式のデータを作成し ます。 このファイルは等高線作成ツールで、等高線データに変換することができます。 ■出力例 SIZE= 8 8 LOWER= -180.0 -180.0 BOUND= 360.0 360.0 MAX = 0.312E-01 FILE=aa.tra 0.200E-02,0.520E-02,0.116E-01,0.144E-01,0.240E-02,0.160E-02,0.320E-02,0.200E-02 0.120E-02,0.120E-02,0.200E-02,0.400E-02,0.360E-02,0.800E-03,0.800E-03,0.120E-02 0.800E-03,0.400E-03,0.360E-02,0.400E-02,0.280E-02,0.800E-03,0.800E-03,0.400E-03 B.8.2 contour pmf ツールで作成した等高線データファイルを入力し、CSV ファイル形式の等高線データ を作成します。 入力データ (1)制御ファイル (1−1)入力等高線データファイル名 (1−2)等高線の数 (1−3)等高線の値 (1−4)出力等高線ファイル名 出力データ (1)等高線ファイル myPresto 4.2 277 B.9 pca 主成分分析により、指定した原子の座標のクラスタリングを行い、代表構造と主成分分 析結果を出力します。 入力データ (1)制御ファイル (1−1)トポロジーファイル名 (1−2)構造の重ね合わせの適用("Y" │ "N") (1−3)重ね合せ対象原子指定ファイル名((1−2)が "Y" の場合に必須) (1−4)RMSD 計算対象原子の特定("Y" │ "N") (1−5)RMSD 計算対象原子指定ファイル((1−4)が "Y" の場合に必須) (1−6)サンプリングする構造数 (1−7)クラスタの個数 (1−8)サンプリングの開始 (1−9)サンプリングの最後 (1−10)座標トラジェクトリファイル名 (1−11)座標トラジェクトリファイルの型("S" │ "D") (1−12)クラスタリング手法 ("nearest" │ "furthest" │ "median" │ "centroid" │ "average" │ "flexible" │ "ward") (1−13)flexible でのβ値((1−12)が "flexible" の場合に必須) (1−14)主成分のスケーリング適用("Y" │ "N") (1−15)プロットデータの 1 軸 (1−16)プロットデータの 2 軸 (1−17)kmax の値 (1−18)プロットデータのファイル名 (2)重ね合せ対象原子指定ファイル((1−2)が "Y" の場合) (3)RMSD 計算対象原子指定ファイル((1−4)が "Y" の場合) (4)座標トラジェクトリファイル 出力データ (1)プロットデータファイル (2)樹形図ファイル(ファイル名は "pca.tree" ) (3)代表構造 PDB ファイル(ファイル名は "pca.*" ) myPresto 4.2 278 ■制御ファイル例 ala_ala.tpl ; topology file name y ; use bestfit ("y" │ "n") ala_ala.bst ; bestfit file name, when use bestfit y ; restrict rmsd target ala_ala.rmsd ; rmsd target file name, when restrict rmsd target 200 ; sampling number of coordinate 4 ; delegate structure count 0 ; sampling start number 1000 ; sampling last number select.cor ; coordinate traJctory file name s ; coordinate traJctory file format ( "s" │ "d" ) average ; clustering method name pca ; result pdb file prefix n ; scale principle comnponent ("y" │ "n") 2 ; 1-axis plot data dimension 3 ; 2-axis plot data dimension 30 ; number of clustering elements pca.plot ; plot data myPresto 4.2 ("y" │ "n") 279 B.10 Gamess2tplinp 量子化学計算プログラム GAMESS の出力ファイルから tplgeneL の入力ファイルを作成し ます。 入力データ (1)GAMESS の出力ファイル名 出力データ (1)電荷情報ファイル(XXX.charge) (2)結合次数情報ファイル(XXX.bond) (3)Z-matrix 情報ファイル(XXX.zmat) 【注意】上記の XXX は GAMESS の出力ファイル名から拡張子を除いたものです。 ■使用法 % Gamess2tplinp methanol.log myPresto 4.2 280 B.11 Gauss2tplinp 量子化学計算プログラム Gaussian98 の出力ファイルから tplgeneL の入力ファイルを作 成します。 入力データ (1)Gaussian98 の出力ファイル名 出力データ (1)電荷情報ファイル(XXX.charge) (2)結合次数情報ファイル(XXX.bond) (3)Z-matrix 情報ファイル(XXX.zmat) 【注意】上記の XXX は Gaussian98 の出力ファイル名から拡張子を除いたものです。 ■使用法 % Gauss2tplinp myPresto 4.2 methanol.out 281 B.12 tpl2mol2 トポロジーファイルと PDB ファイルから、MDL mol または Sybyl mol2 形式のファイルを 作成して出力します。以下のオプションを用いて、入出力のファイル形式を指定します。 オプション -ipdb <pdbfile> PDB ファイル<pdbfile>を入力ファイルとします -itpl <tplfile> トポロジーファイル<tplfile>を入力ファイルとします -omol2 <mol2file> 出力ファイルを Sybyl mol2 ファイル<mol2file>とします -omdl <mdlfile> 出力ファイルを SD ファイル<mdlfile>とします -h, -help ヘルプメッセージを表示します 【注意】トポロジーファイルおよび PDB ファイルの指定(オプション:-ipdb, -itpl)は 必須です。 ■使用法 % tpl2mol2 -ipdb 2ala.pdb -itpl 2ala.tpl -omol2 2ala.mol2 -omdl 2ala.mol myPresto 4.2 282 B.13 add_ion 溶質(溶媒水分子以外の分子)の作り出す電場を、各溶媒水分子の座標について距離依 存誘電率(ε∝r)で計算し、もっとも電位の高いところ、ないし低いところにある水分 子をカウンターイオンで置換します。カウンターイオンで置換後、同様の計算を繰り返し、 指定した数のカウンターイオンを全て配置するまで作業を繰り返します。この時、次のカ ウンターイオンは、前回までに配置したカウンターイオンより一定距離以上離れた場所に 配置します。 入力データ 1行目:入力ファイル名:溶媒水分子の付加された全系の座標ファイル名。 2行目:出力ファイル名:全系の座標ファイル名。 3行目:出力ファイル名:カウンターイオンの座標ファイル名。 4行目:出力ファイル名:カウンターイオンに置換された溶媒水分子の座標ファイル名。 5行目:イオンの付加方法; 1:カウンターイオンの数を直接入力 2:系の電荷を中和する必要最低限の数を自動的に付加する。 3:イオンの濃度(イオン mol/水 mol)を指定し、系の電荷を中和するイオン数 を自動的に付加する。 イオン付加方法=1の場合 6行目:Na+ イオンの数 7行目:Cl- イオンの数 8行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した カウンターイオンより一定距離内に配置しない。その半径(Å)。 イオン付加方法=2の場合 6行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した カウンターイオンより一定距離内に配置しない。その半径(Å)。 イオン付加方法=3の場合 6行目:イオンの濃度(イオン mol/水 mol) 7行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した カウンターイオンより一定距離内に配置しない。その半径(Å)。 myPresto 4.2 283 ■入力例 zifcmp.pdb_vac protein.pdb ion.pdb wat.pdb 1 80 72 6.0 ■使用例 add_ion とタイプする。標準入力から入力します。入力例は、ion.input としています。 % add_ion < ion.input myPresto 4.2 284 【注意】add_ion によって付加されたカウンターイオンの配置は、エネルギー的に安定では ありません。従って、全系の MD 計算に移る前に、蛋白質・DNA の座標を固定した状態で、 溶媒水とカウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡 状態に近づけておきます。 【注意】蛋白質、DNA,溶媒水、カウンターイオンの並びは、トポロジーファイルの MOLECULES 欄と PDB 上で同じ順番でなければなりません。 myPresto 4.2 285 B.14 confgene Sybyl mol2 形式のファイルで記述された入力分子の配座を発生し、PDB 形式、Z-matrix、 RESP 入力ファイル、Gaussian 入力ファイルを作成して出力します。配座の発生は、ランダ ムサーチにより、環以外の部分についてのみ行います。電荷情報は、ユーザ自身が手入力 で指定できますが、自動計算も可能です。 【注意】電荷の自動計算は、完全ではありません。また、結合次数の情報が正確でなけれ ば、電荷の計算は正しく行われません。原子の順番は、並べ替えられます。PDB 出力、 RESP 出力、Gaussian 入力ファイルなどの出力ファイルでの原子の並びは、相互に矛盾 無く出力されます。 入力データ (1)配座を発生させたい分子の mol2 ファイル名 (2)発生させたい配座の総数。 配座数が原理的に存在しない場合やランダムサーチの一定の試行回数において原子間 衝突のない配座が得られない場合、指定した数よりも生成する配座の数が少なくなる場 合があります。 (3)回転角の指定(N) 回転可能な二面角を(360÷N)度ずつ回転させることで配座を発生させます。 (4)原子の総電荷。 自動計算の場合は「a」と入力。数値は、左詰めで、空白を数字の前に入れないこと。 (5)原子を並べ替えるときの、出発点とする原子の番号。 分子に含まれる原子数以下の任意の数字。通常1で良い。この原子を出発点に、グラフ 上で近い原子に、若い番号を割り当てるように原子の並べ替えを行ないます。 出力ファイル (以下、生成した配座の数が N 個の場合) (1)conf1.pdb ∼ confN.pdb : 発生した配座。conf1.pdb は、入力座標と同じです。メチル基など等価な原子が回転した場 合も、異なる配座と数えるため、化学的には同じ配座が含まれる場合があります。 (2)conf1.com ∼ confN.com : 発生した配座(conf1.pdb∼confN.pdb)に対応する Gaussian 入力ファイル。実行オプショ ンは AM1 での構造最適化になっていますが、コメント行には RESP 計算用の電場グリッド発 生オプションが記載されます。 myPresto 4.2 286 (3)resp.in : RESP 入力ファイル (4)qin : RESP 用初期電荷ファイル。全て電荷は 0 と設定しています。 (5)zmat.dat : 分子の初期配座での Z-matrix です。 ■使用法 % confgene Input File name (mol2 file) ligand.mol2 File =ligand.mol2 Input number of conformers 2 (1) (2) no_conf= 2 Input number of rotation phase(=6:60 deg,=3:120 deg) 3 (3) no_phase= 3 Input total charge of the molecule(a=auto calc) -2 charge (4) =-2 readmol3=ligand.mol2 numatom 41, 40 Input start atom number 1 myPresto 4.2 (5) 287 B.15 confgeneC Sybyl mol2 形式のファイルで記述された入力分子の配座を発生し、Sybyl mol2、MDL mol 形式、PDB 形式ファイルを作成して出力します。配座の発生は、4 員環以上の環構造の部分 について生成します。また、分子内にキラル中心が存在する場合には、光学異性体も同時 に生成して出力します。 入力データ 必須項目 (1)配座を発生させたい分子のファイル名 (2)入力分子のファイルフォーマット(1:Sybyl mol2、2:MDL mol、3:PDB) (3)発生させたい配座の総数 採り得る全ての配座を生成させたい場合には「a」を指定します。 配座数が原理的に存在しない場合や配座生成時に原子間衝突のない配座が得られない 場合、指定した数よりも生成する配座の数が少なくなる場合があります。また、 「a」を 指定した場合で異性体が多数ある場合には、最大 999 件のデータを出力します。 オプション(対話形式では指定できません) (4)回転角の指定(N) 回転可能な二面角を(360÷N)度ずつ回転させることで配座を発生させます。指定し ない場合には N=6 として処理を行います。 (5)原子間チェックオプション チェックオプションを指定した場合には、原子間距離が近い構造を作成した場合には、 構造が重ならない様に座標の修正を行います。 出力ファイル (以下、生成した配座の数が N 個で、出力ファイル形式で Sybyl mol2 を指定した場合) (1)confXXX.mol2:XXX は 1 から N の 3 桁の数字 発生した配座座標を出力したもの。出力ファイル形式で MDL mol、PDB を指定した場合には、 拡張子がそれぞれ mol、pdb となります。 (2)confXXXc.mol2:XXX は 1 から N の 3 桁の数字 ファイル名の数字の後ろに c の文字がある場合には、光学異性体ファイルである事を示し ます。出力ファイル形式で MDL mol、PDB を指定した場合には、拡張子がそれぞれ mol、pdb となります。 myPresto 4.2 288 ■使用法 % confgeneC Please select Input File Format by the next number! 1 : Sybyl mol2 (*.mol2) 2 : MDL mol (*.mol) 1 (1) INFORMATION> toolGetFilename Sybyl mol2 input file was selected. Please select Output File Format by the next number! 1 : Sybyl mol2 (*.mol2) 2 : MDL mol (*.mol) 3 : PDB pdb (*.pdb) 1 (2) INFORMATION> toolGetFilename Sybyl mol2 output file was selected. Please select Input File Name! sample.mol2 (3) Please input number of conformers(a=all pattern). a (4) input file = sample.mol2 number of conformers that want to be created = 999 num of rotation phase = 6 INFORMATION> toolSetChiralFlg This molecule has 3 chiral center(s). INFORMATION> toolCountCirc Circular structure(s) have found. INFORMATION> toolCreateChiralMol New coordinates are generated for chiral center "C(3)" INFORMATION> toolCreateChiralMol New coordinates are generated for chiral center "C(5)" INFORMATION> toolCreateChiralMol New coordinates are generated for chiral center "C(6)" This program creates 11 conformers. Program is done normally. myPresto 4.2 289 B.16 自由エネルギー摂動法(開発中) 以下の(1)∼(3)の機能により、自由エネルギー摂動法による自由エネルギー計算 を行います。(1)は cosgene の機能で、(2)および(3)はツールです。 (1)指定した原子の vdW パラメータおよび電荷をスケーリングし、スケーリングによっ て新たに発生する出力トポロジーデータに加える「vdW パラメータおよび電荷のスケ ーリング機能」 (2)cosgene 形式のトポロジーファイルおよび座標トラジェクトリファイルを入力し、そ れらのトポロジーデータおよび座標データを用いて各ステップごとのエネルギー計 算を行う「analyze ツール」 (3)cosgene 形式のエネルギートラジェクトリファイルを2つ入力し、それらのエネルギ ーデータから自由エネルギー計算を行う「FEP ツール」 【注意】自由エネルギー摂動法関連ツールは開発中であり、計算結果は保証しません。 B.16.1 計算方式 以下の(1)∼(4)手順で、自由エネルギー摂動法による自由エネルギー計算を行い ます。 (1)cosgene による MD 計算を行い、PDB ファイル、座標トラジェクトリファイル、エネ ルギートラジェクトリファイル、スケーリングされたトポロジーファイルを出力す る。 (2)(1)で出力されたトポロジーファイルに基づき、(1)で出力された座標トラジェ クトリファイルの座標についてエネルギー計算を行い、エネルギートラジェクトリ ファイルを出力する。 (3)(1)および(2)で得られたエネルギートラジェクトリファイルを用いて自由エネ ルギー計算を行う。 (4)(1)∼(3)を繰り返し、それぞれの自由エネルギーの総和を算出することで、自 由エネルギー摂動法による自由エネルギー計算を行う。 myPresto 4.2 290 【 自由エネルギー摂動法イメージ図 】 1.tpl 1.pdb 2.tpl 1.cor 2.tpl 2.pdb 3.tpl 2.cor cosgene analysys cosgene analysys vdW/charge を 2.tpl と 1.cor から vdW/charge を 2.tpl と 1.cor から スケーリング エネルギーを計算 スケーリング エネルギーを計算 2.tpl 1.cor 2.pdb ene1a.traj ene1b.traj 3.tpl 2.cor 3.pdb ene2a.traj FEP FEP ⊿G 1を算出 ⊿G 2 を算出 ⊿G 1+⊿G 2+・・・+⊿G 19 = ⊿G 自由エネルギー⊿Gを算出する。 myPresto 4.2 ene3b.traj 291 B.16.2 vdw パラメータおよび電荷のスケーリング機能(cosgene) cosgene に対して、スケーリング対象原子、vdW パラメータのスケーリングファクタ ーおよび電荷のスケーリングファクターをファイル入力し、指定した原子の vdW パラメー タおよび電荷のスケーリングを行います。スケーリングにより新たに発生するトポロジー データは、出力トポロジーデータに加えられます。 使用方法 制御ファイルの OUTPUT フェーズでスケーリング指定を行い、INPUT フェーズで「スケー リングファイル」の入力指定を行います。対象原子およびスケーリングファクターの指定 は「スケーリングファイル」で行います。 (1)スケーリング指定(OUTPUT フェーズ) 項番 項目 キーワード 値 #1 スケーリング指定 TPLSCL 選択型 内容 VdW パラメータおよび電荷の スケーリング(NO │ YES) (2)「スケーリングファイル」入力指定(INPUT フェーズ) 項番 項目 キーワード 値 #1 スケーリング SCALIN 選択型 内容 「スケーリングファイル」指定 (NORE │ FORM) ファイル指定 #2 UNITSC 整数型 装置番号(28) #3 NAMTSC 文字列 ファイル名(””) (3)「スケーリングファイル」書式 対象フェーズ:OUTPUT フェーズ 用途:VdW パラメータおよび電荷のスケーリング対象原子およびスケーリングファクター を指定する。 書式:スケーリングファイルは以下の行で構成される。 [ 対象原子 ID vdW 半径スケーリングファクター 電荷スケーリングファクター ]... ■使用例 1 0.95d0 0.95d0 6 0.90d0 0.90d0 myPresto 4.2 292 B.16.3 analyze トポロジーファイルおよび座標トラジェクトリファイルを入力し、各ステップのエネル ギー計算を行います。計算結果の出力は、cosgene の書式による標準出力へのログ出力およ び cosgene のエネルギートラジェクトリファイル形式でのファイル出力を行います。 入力データ (1)制御ファイル 制御ファイルは以下のグループからなり、各グループは“QUIT”で終了します。 ・EXE> INPUT グループ :入力ファイル名を記載する。 ・EXE> MD グループ :エネルギー計算条件を記載する。 ※ 制御ファイルの書式は、cosgene の制御ファイルの書式を踏襲します。 ※ cosgene の制御ファイルには EXE> MIN グループ、EXE> ANALYZE グループおよび EXE> OUTPUT グループがありますが、本ツールの制御ファイルにこれらの記述がある場合はそれ らを読み飛ばします。(エラー処理は行いません。) (2)トポロジーファイル(ASCII 形式のみ) (3)座標トラジェクトリファイル(ASCII, SINGLE, DOUBLE に対応) 座標トラジェクトリファイルの入力指定は、制御ファイルの INPUT フェーズで以下のよう に行います。 項番 項目 キーワード 値 #1 座標トラジェクトリ CRDTRJ 内容 選択型 座標トラジェクトリファイル指定 (NORE │ ASCI │ SING │ DOUB) ファイル指定 #2 UNITCT 整数型 装置番号(29) #3 NAMTCT 文字列 ファイル名(””) 出力データ (1)ログ(cosgene のログ書式で標準出力に出力) (2)エネルギートラジェクトリファイル(ASCII, SINGLE, DOUBLE に対応) ■使用法 % analyze myPresto 4.2 < analysis.inp > analysis.log 293 B.16.4 FEP 2 つのエネルギートラジェクトリファイルを入力し、それらのエネルギーデータから自由 エネルギーを計算して標準出力に出力します。 入力データ (1)制御ファイル (1−1)設定温度 [K] (1−2)温度の閾値 [K] (1−3)自由エネルギー計算ループ初期値 (1−4)トラジェクトリファイル名(文字列、80字以内) (1−5)(1−4)で指定したファイルのファイル形式 (“A”scii │ “S”ingle │ “D”ouble ) (1−6)トラジェクトリファイル名(文字列、80字以内) (1−7)(1−6)で指定したファイルのファイル形式 (“A”scii │ “S”ingle │ “D”ouble ) (2)cosgene が出力するエネルギートラジェクトリファイル (ASCII, SINGLE, DOUBLE に対応) (3)analyze が出力するエネルギートラジェクトリファイル (ASCII, SINGLE, DOUBLE に対応) 出力データ (1)自由エネルギー(標準出力に出力) ■使用法 % analyze < analysis.inp > analysis.log ■FEP ツール制御ファイル例 300.0 ; 設定温度 5.0 ; 閾値 1 ; ループ初期値 ini.trj ; トラジェクトリファイル名 D ; ini.trj のファイル形式(“A”scii │ “S”ingle │ “D”ouble ) fin.trj ; トラジェクトリファイル名 D ; fin.trj のファイル形式(“A”scii │ “S”ingle │ “D”ouble ) myPresto 4.2 294 B.17 Hgene 化合物への H 原子付加/削除、原子電荷計算(Gasteiger)などを行います。 入出力は PDB、MDL mol、Sybyl mol2 または Mopac dat(出力のみ)形式に対応しています。 用意されているオプションは以下の通りです(ヘルプ参照“-H”)。 入力ファイルオプション(*.mdl, *.mol2/*.sm2, *.pdb) -imdl, -imol2, -ipdb 出力ファイルオプション -omdl, -omol2, -opdb, -omopcrt 処理内容オプション -h(--hydrogen) H 原子(原子情報、結合情報)を付加する 入力ファイルが MDL mol、Sybyl mol2 の場合のみ対応 -d(--delete-hydrogen) H 原子(原子情報、結合情報)を削除する -ch(--charge) [value] 電荷[value]を mopac dat ファイルの一行目に設定する mopac dat ファイルを出力する場合のみ対応 -dc(--default-charge) デフォルト電荷(入力ファイルに含まれる値)を使用する MDL mol の場合は sed_charge の値 Sybyl mol2 の場合は入力値のまま 本オプションを指定しない場合は Gasteiger 電荷(デフォルト) Sybyl mol2 ファイルを出力する場合のみ対応 -p(--ph) 酸/塩基性官能基が解離状態となる様に H 原子を付加する つまり、解離型を生成する -co(--correct-bondtype) 芳香族環の結合次数”ar”を”1”又は”2”で書き換え -ct(--check-totalelec) 原子の全電荷数チェック 各原子の電子状態が閉殻になっていない場合にエラー -bo(--bondorder) 指定した原子番号の結合について指定した結合数を割り当てる 10 ヶ所まで指定可能 入力が PDB ファイルの場合のみ対応 myPresto 4.2 295 ■使用法 a) MDL mol → Sybyl mol2 変換: % Hgene -imdl sample.mol -omol2 sample.mol2 b) Sybyl mol2 → MDL mol 変換: % Hgene -imol2 sample.mol2 -omdl sample.mol c) PDB → MDL mol 変換 % Hgene -ipdb sample.pdb -omdl sample.mol d)水素付加オプション(-h): % Hgene -imdl sample.mol -omol2 sample.mol2 -h e)水素削除オプション(-d): % Hgene -imdl sample.mol -omdl sample_out.mol -d f)電荷指定オプション(-ch): % Hgene -ipdb sample.pdb -omopcrt sample.dat -ch 0 g)電荷入力値採用オプション(-dc): % Hgene -imdl sample.mol -omol2 sample.mol2 -dc h)解離型生成オプション(-p): % Hgene -imdl sample.mol -omol2 sample.mol2 -p i)結合次数指定オプション(-bo): % Hgene -ipdb sample.pdb -omdl sample.mol -p -bo 7 9 2 ※原子 7 番と 9 番の結合に二重結合を割り当てる myPresto 4.2 296 B.18 MVO MVO(Maximum Volume Overlap)法で化合物の重なり具合をスコアで評価し、最も重なりの 大きい化合物の探索を行います。 入力化合物はマルチ mol2 ファイル形式に対応します。 探索対象化合物の mol2 ファイルに sievgene のスコアが付加されている場合は、sievegne のスコアと MVO スコアから得られるスコア値での評価ができます。 入力データ (1)制御ファイル (1−1)入力する参照化合物ファイル名(mol2 ファイル) (1−2)入力する探索対象化合物ファイル名(mol2 ファイル) (1−3)出力する探索結果の1位化合物ファイル名(mol2 ファイル) (1−4)MVO 計算対象となる二原子の電荷の差分絶対値の閾値 (1−5)sievgene スコアと MVO スコアの割合 Cweight (スコア=sievgene スコア*(1-Cweight) + MVO スコア* Cweight 出力データ (1) 探索結果の1位化合物ファイル ログ 標準出力に制御ファイルの設定条件、各化合物の MVO 計算結果、探索結果が表示されま す。 myPresto 4.2 297 ************************************************ * * * selectMVO(Maximum Volume Overlap method) * * * * Japan Biological Information Research Center * * Aomi 2-41-6, Koto-ku, Tokyo 135-0064 * * JAPAN * * * * v1.0: May 26, 2010 * * * ************************************************ input input input input input reference file name [default=query.mol2] target file name [default=coordinate.mol2] best structure file name(output) [default=output.mol2] Q_THR value(threshold of atomic charge remainder)[default= MVO score weight(0.0<=x<=1.0)[default= 1.00000] 0.20000] INFORMATION> 1) REFERENCE_FILE: ../test_old/lig_ref.mol2 ATOMS BONDS MOLECULES 48 52 2 2) TARGET_FILE: ../test_old/ex.cor ATOMS BONDS MOLECULES 69 72 54 3) OUTPUT_FILE: output.mol2 4) Q_THR : 0.20000 5) MVO_WEIGHT: 0.10000 MVO> QUERY 1 1 1 TARGET 1 2 3 RMSD 29.01840 29.69470 29.18910 SIEVGENE 360.12521 351.95981 347.95001 MVO_SCORE 338.34360 341.00656 292.69943 TOTAL_SCORE 357.94702 350.86447 342.42493 2 2 53 54 30.47210 30.91340 317.28790 331.87891 0.00000 0.00000 285.55911 298.69101 MVO 140.72887 TOTAL_SCORE 364.37772 : BEST(QUERY,TARGET): @ QUERY 1 1 TARGET 15 RMSD 29.81970 15 SIEVGENE 389.22760 ■使用法 %selectMVO < mvo.inp > mvo.log myPresto 4.2 298 B.19 sptool sptool は溶解度予測を行う為のツール群です。分子の構造情報をコード化し(記述子計 算)、回帰計算により未知の分子の溶解度を推算します。また、推算した溶解度を使用して アグリゲータの予測も行います。 ツール群の機能は以下の 3 つ分かれます。 名前 機能 Descriptor 記述子を計算する Solubility 溶解度を推算する Aggregator アグリゲータを予測する また、sptool は以下のディレクトリ構成となっています(下図左)。 sptool Descriptor/ Solubility/ Aggregator/ *.rb cosgene/ confgene/ GBSAinp/ Hgene/ tplgeneL/ trans_code/ ... *.rb mlr/ pls/ wln/ *.rb bys/ $ vi .bashrc ... #sptool SPTOOL=~/sptool DSC_PTH=$SPTOOL/Descriptor SOL_PTH=$SPTOOL/Solubility AGG_PTH=$SPTOOL/Aggregator BYS_PTH=$AGG_PTH/bys RUBYLIB=$RUBYLIB:$DSC_PTH RUBYLIB=$RUBYLIB:$SOL_PTH RUBYLIB=$RUBYLIB:$AGG_PTH export RUBYLIB PATH=$PATH:$DSC_PTH PATH=$PATH:$SOL_PTH PATH=$PATH:$AGG_PTH PATH=$PATH:$BYS_PTH export PATH $ source . bashrc プログラムの構築は、各種ツールのソースディレクトリ(src/等)に移動して適宜 make を 実行して下さい。Ruby(ver1.8.5)スクリプトについては、起動ファイル(Descriptor.rb, Solubility.rb の SRC_DIR)にソースディレクトリの絶対パスを設定して下さい。また、環 境変数の設定は必要に応じて行って下さい(上図右)。 B.19.1 Descriptor 分子の構 造 情 報を読 み込ん で記述子を 計算します。 こ の ツ ー ル は各記述子の 計算に cosgene, confgene, Hgene, GBSAinp, tplgeneL, trans_code 等を利用します。インストー ル後、Descriptor.rb の SRC_DIR にソースディレクトリ(Descriptor/)を設定して下さい。 起動コマンド: 起動コマンドは以下の通りです。 Descriptor.rb -i <input_dir> -l <input_lst> -o <output_file> input_dir single-mol2 ファイルを格納したディレクトリ名 input_lst 格納された single-mol2 ファイルのリスト output_file 記述子ファイル名 myPresto 4.2 299 Mol2 ファイルリスト: 入力に必要な mol2 ファイルリストは以下の様に記述子します。 <id> <mol2_file> [<logS>] (例: 4 id mol2 ファイルの ID mol2_file mol2 ファイル名(*.mol2) logS logS 値(実験値、任意) mol4.mol2 -1.590) logS 値は実験値が分かっている場合に設定(データベースもしくは検証用) mol2 ファイル内の@<TRIPOS>COMMENT 以下に記述されている場合には必要ない 物理記述子(Mol2 ファイル): mol2 ファイルの@<TRIPOS>COMMENT 以下に物理記述子を記述する事が出来ます。 記述は以下の書式行います。 #<identifier> <value> (例:#LogS -1.590) identifier 物理記述子(LogS, DelO_H, AddN_H, …) value 設定値 記述可能な物理記述子は以下の通りです。 識別子 内容 LogS logS 値 DelO_H 解離 H 原子数(-OH) AddN_H 付加 H 原子数(-NH) dG_o オクタノール中の GB/SA 値 ddG_o オクタノール中の GB/SA 値(単位表面積当たり) dASA_o オクタノール中の 表面積(単位体積当たり) dG_w 水中の GB/SA 値 ddG_w 水中の GB/SA 値(単位表面積当たり) dASA_w 水中の 表面積(単位体積当たり) dG_wd 水中解離型の GB/SA 値 ddG_wd 水中解離型の GB/SA 値(単位表面積当たり) dASA_wd 水中解離型の 表面積(単位体積当たり) 計算条件設定: 指定可能な物理記述子の計算条件はそれぞれ指定個所が異なります。デフォルト値につい ては各設定値を参照してください。 計算条件 指定個所 tplgeneL のパラメータ定義ファイル Descriptor.rb 内の TPLLDBF GBSAinp のパラメータ定義ファイル Descriptor.rb 内の GBSADB cosgene での最小化条件 min_template.erb myPresto 4.2 300 cosgene での GB/SA・ASA 計算条件 min_template_o.erb(オクタノール中) min_template_w.erb(水中) confgene での発生配座数 Descriptor.rb 内の CNF_NUM confgene での発生配座角度(360/<n>) Descriptor.rb 内の CNF_ANG 指定可能な構造記述子の計算条件も同様です。 計算条件 trans_code の記述子定義ファイル 指定個所 Descriptor.rb 内の TRNSDB B.19.2 Solubility 重み付き 学 習 法に よ る強化学習 を伴っ た回帰計算を 実行 します 。イ ン ス ト ー ル後、 Solubility.rb の SRC_DIR にソースディレクトリ(Solubility/)を設定して下さい。 起動コマンド: 起動コマンドは以下の通りです。 Solubility.rb -i <input_file> -o <output_file> -d <db_file> -m <w/n> <p/m> input_file 入力分子記述子ファイル名(Descriptor.rb の output_file を想定) output_file 回帰計算結果ファイル名 db_file データベース記述子ファイル名(Descriptor.rb の output_file を想定) w/n 学習選択 w(eighted learning) / n(o learning) m/p 回帰選択 m(lr) / p(ls) 回帰計算結果の内、推算結果は以下の様な書式になります。 推算結果: 項目 内容 ID 入力分子 ID tchC1 データベースの回帰直線の係数 C1: y = C1 * x + C2 tchC2 データベースの回帰直線の係数 C2: y = C1 * x + C2 tchR2 データベースの決定係数 tchAveErr データベースの平均エラー tchMaxErr データベースの最大エラー(絶対値が最大) tchWL 重み付き学習時の追加デコイ数 tstExp 入力分子の logS(実験値) tstPre 入力分子の logS(推算値) tstErr 入力分子の推算エラー(絶対値) 推算精度: 項目 tstC1 myPresto 4.2 内容 全入力分子の回帰直線の係数 C1: y = C1 * x + C2 301 tstC2 全入力分子の回帰直線の係数 C2: y = C1 * x + C2 tstR2 全入力分子の決定係数 tchAveErr 全入力分子の平均エラー tchMaxErr 全入力分子の最大エラー(絶対値が最大) B.19.3 FreqMaker logS の頻度分布を作成します。 起動コマンド: 起動コマンドは以下の通りです。 FreqMaker.rb -i <input_file> -w <width> -o <output_file> input_file 入力 logS ファイル名(Solubility.rb の output_file を想定) width ヒストグラム幅 output_file ヒストグラムファイル名 ヒストグラムファイル: 出力するヒストグラムファイルは以下の様な書式になります。 <logS> <frequency> (例: -1.50 logS logS 値(<width>刻み) frequency 頻度 24) B.19.4 wln 重み付き学習を行います。入力した各分子について強化学習データベースを用意します。 ${FC} -o wln wln.f でコンパイルしてください(Fortran コンパイラ FC = ifort, g77 ...)。 起動コマンド: 起動コマンドは以下の通りです。 wln -t <input_file> -d <db_file> -b <bin> -c <decoy> -n <dsc_num> input_file 入力分子記述子ファイル名 db_file データベース記述子ファイル名 bin 類似度分布の分散の bin 数 decoy 最大強化学習回数(= decoy 数) dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) 入力分子記述子ファイル(<input_file>-<id>.dsc, <id>は入力分子の行番号) b) 強化学習データベース(<db_file>-<id>.dsc, <id>は入力分子の行番号) c) 類似度分布ファイル(*.dst) d) 強化学習分子リスト(*.lst) myPresto 4.2 302 B.19.5 pls PLS 回帰(Partial Least Squares Regression)分析を行います。${FC} -o pls pls.f で コンパイルしてください(Fortran コンパイラ FC = ifort, g77 ...)。 起動コマンド: 起動コマンドは以下の通りです(5-1 と 5-2 または 5-3 のみ)。 (5-1) 回帰計算 pls -d <db_file> -n <dsc_num> db_file データベース記述子ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) データベース回帰結果ファイル(*.rgr) b) 回帰係数ファイル(*.cff) (5-2) 入力評価 pls -t <input_file> -c <coeff_file> -n <dsc_num> input_file 入力分子記述子ファイル名 coeff_file 回帰係数ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) 評価結果ファイル(*.cal) b) PLS 分析ファイル(*.pls) (5-3) 回帰計算および入力評価 pls -t <input_file> -d <db_file> -n <dsc_num> input_file 入力分子記述子ファイル名 db_file データベース記述子ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) データベース回帰結果ファイル(*.rgr) b) 評価結果ファイル(*.cal) c) 回帰係数ファイル(*.cff) d) PLS 分析ファイル(*.pls) B.19.6 mlr 重回帰(multiple liner regression)分析を行います。${FC} -o mlr mlr.f でコンパイ ルしてください(Fortran コンパイラ FC = ifort, g77 ...)。 起動コマンド: 起動コマンドは以下の通りです(6-1 と 6-2 または 6-3 のみ)。 (6-1) 回帰計算 mlr -d <db_file> -n <dsc_num> myPresto 4.2 303 db_file データベース記述子ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) データベース回帰結果ファイル(*.rgr) b) 回帰係数ファイル(*.cff) (6-2) 入力評価 mlr -t <input_file> -c <coeff_file> -n <dsc_num> input_file 入力分子記述子ファイル名 coeff_file 回帰係数ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) 評価結果ファイル(*.cal) (6-3) 回帰計算および入力評価 mlr -t <input_file> -d <db_file> -n <dsc_num> input_file 入力分子記述子ファイル名 db_file データベース記述子ファイル名 dsc_num 記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く) OUTPUT a) データベース回帰結果ファイル(*.rgr) b) 評価結果ファイル(*.cal) c) 回帰係数ファイル(*.cff) B.19.7 bys ベイジアン解析を行います。ベイズ推定を行った後、シグモイド関数でフィッティング します。${FC} -o bys bys.f でコンパイルしてください(Fortran コンパイラ FC = ifort, g77 ...)。フィッティングするシグモイド関数の定義は以下の通りです(c1=a, c2=b)。 Pagg (log S ) = 1 1+ e a (log S −b ) 起動コマンド: 起動コマンドは以下の通りです(7-1 と 7-2 または 7-3 のみ)。 (7-1) ベイジアン解析 bys -d <db_file> -i <c1_value> <c2_value> db_file 頻度分布ファイル名(データベース) c1_value シグモイド関数の係数 C1 初期値 c2_value シグモイド関数の係数 C2 初期値 OUTPUT a) データベース解析結果ファイル(*.prb) b) シグモイド係数ファイル(*.cff) myPresto 4.2 304 (7-2) 入力評価 bys -t <input_file> -n <dsc_num> <dsc_idx> -c <coeff_file> input_file 入力ファイル名(回帰結果) dsc_num 列サイズ(回帰結果列数 = 10 列) dsc_idx 列番号 coeff_file シグモイド係数ファイル名 OUTPUT a) (logS の列番号 = 9、列番号 1∼10) 評価結果ファイル(*.est) (7-3) ベイジアン解析および入力評価 bys -t <input_file> -n <dsc_num> <dsc_idx> -d <db_file> -i <c1_value> <c2_value> input_file 入力ファイル名(回帰結果) dsc_num 列サイズ(回帰結果列数 = 10 列) dsc_idx 列番号 db_file 頻度分布ファイル名(データベース) c1_value シグモイド関数の係数 C1 初期値 c2_value シグモイド関数の係数 C2 初期値 OUTPUT a) 評価結果ファイル(*.est) b) データベース解析結果ファイル(*.prb) c) シグモイド係数ファイル(*.cff) (logS の列番号 = 9、列番号 1∼10) 頻度分布ファイル(データベース): 入力する頻度分布ファイル(データベース)は以下の様な書式になります。 <marker> <state_frq > <non_state_frq> marker logS 値 state_frq アグリゲータ度数 non_state_frq 非アグリゲータ度数 (例: -1.50 24 59) B.19.8 trans_code Ullmann の定理を利用して入力分子に含まれる官能基数をカウントします。官能基の定義は 薬物候補低分子用の拡張 Joback 記述子です(定義ファイルは DB/に配置)。コンパイルは、 ソースディレクトリ(src/)に移動した後、Makefile を適宜修正して make して下さい。 起動コマンド: 起動コマンドは以下の通りです。 (8-1) 分子構造から記述子に変換(mol2 形式 DB) trans_code -i <input_file> -o <output_file> -d <db_file> input_file 分子構造ファイル名(mol2 ファイル、multi-mol2 形式も可) output_file 記述子ファイル名 myPresto 4.2 305 db_file 官能基定義ファイル名(multi-mol2 形式、DB 用) (8-2) 分子構造から記述子に変換(binary 形式 DB) trans_code -i <input_file> -o <output_file> -d <db_file> -b input_file 分子構造ファイル名(mol2 ファイル、multi-mol2 形式も可) output_file 記述子ファイル名 db_file 官能基定義ファイル名(binary 形式、DB 用) “-b” binary 利用スイッチ (8-3) 分子構造から記述子に変換(binary 形式 DB) trans_code -i <input_file> -o <output_file> -c input_file 官能基定義ファイル(multi-mol2 形式、DB 用) output_file 官能基定義ファイル名(binary 形式、DB 用) “-c” binary 生成スイッチ 物理記述子(Mol2 ファイル): mol2 ファイルの@<TRIPOS>COMMENT に以下の記述があれば、trans_code より出力される記述 子ファイルに以下の物理記述子の項目が含まれる様になります。 記述は以下の様に行います。 #<identifier> <value> (例:#LogS -1.590) identifier 物理記述子(LogS, DelO_H, AddN_H, …) value 設定値 記述可能な物理記述子は以下の通りです。 識別子 内容 LogS logS 値 DelO_H 解離 H 原子数(-OH) AddN_H 付加 H 原子数(-NH) dG_o オクタノール中の GB/SA 値 ddG_o オクタノール中の GB/SA 値(単位表面積当たり) dASA_o オクタノール中の 表面積(単位体積当たり) dG_w 水中の GB/SA 値 ddG_w 水中の GB/SA 値(単位表面積当たり) dASA_w 水中の 表面積(単位体積当たり) dG_wd 水中解離型の GB/SA 値 ddG_wd 水中解離型の GB/SA 値(単位表面積当たり) dASA_wd 水中解離型の 表面積(単位体積当たり) myPresto 4.2 306 (余白) myPresto 4.2 307 参考文献 ◆ General [1] K. Morikami, T. Nakai, A. Kidera, M. Saito & H. Nakamura. PRESTO(PRotein Engineering SimulaTOr): A vectorized molecular mechanics program for biopolymers. Computers Chem. Vol.16, No.3, 243-248(1992). ◆ Empirical parameters of the potential energy functions a) AMBER UNITED ATOM parameter [2] S.J. Weiner, P.A. Kollman, D.A. Case, U.C. Singh, C.Ghio, G. Alagona, S. Profeta, Jr. & P. Weiner. A new force field for molecular mechanical simulation of nucleic acids and proteins. J. Am. Chem. Soc. 106, 765-784(1984). b) AMBER ALL ATOM parameter [3] S.J. Weiner, P.A. Kollman, D.T. Nguyen, & D.A. Case. for simulations of proteins and nucleic acids. An all-atom force field J. Computat. Chem. 7, 230-252(1986). c) AMBER force field (C96, Param99, GAFF) [4] W.D. Cornell, P. Cieplak, C.I. Bayly, I.R. Gould, K.M. Merz, Jr., D.M. Ferguson, D.C. Spellmeyer, T. Fox, J.W. Caldwell & P.A. Kollman. A second generation force field for the simulation of proteins, nucleic acids, and organic molecules. J. Am. Chem. Soc. 117, 5179-5197(1995). [5] P.A. Kollman, R. Dixon, W. Cornell, T. Fox, C. Chipot & A. Pohorille. The development/application of a 'minimalist' organic/biochemical molecular mechanic force field using a combination of ab initio calculations and experimental data. In Computer Simulation of Biomolecular Systems, Vol. 3, A. Wilkinson, P. Weiner & W.F. van Gunsteren, Ed. Elsevier, (1997). pp. 83-96. [6] M.D. Beachy & R.A. Friesner. J. Am. Chem. Soc. 119, 5908-5920(1997). myPresto 4.2 308 [7] J. Wang, P. Cieplak & P.A. Kollman. How well does a restrained electrostatic potential (RESP) model perform in calculating conformational energies of organic and biological molecules?. J. Comput. Chem. 21, 1049-1074(2000). [8] Junmei Wang, Romain M. Wolf, James W. Caldwell, Peter A. Kollman, David A. Case, "Development and testing of a general amber force field", J. Compt. Chem. 25, 1157-1174, (2004). d) OPLS parameter [9] W.L. Jorgensen, & J. Tirado-Rives. The OPLS potential functions for proteins. Energy minimizations for crystals of cyclic peptides and crambin. J. Am. Chem. Soc. 110, 1657-1666 (1988). e) ION in parameter files [10] J. Aqvist. Ion-water interaction potentials derived from free energy perturbation simulations. J. Phys. Chem. 94, 8021-8024(1990). [11] T. Darden, D. Pearlman & L.G. Pedersen. Ionic charging free energies: Spherical versus periodic boundary conditions. J. Chem. Phys. 109, 10921-10935(1998). f) TIP3P water [12] W.L. Jorgensen, J. Chandrasekhar, J. Madura & M.L. Klein. Comparison of Simple Potential Functions for Simulating Liquid Water. J. Chem. Phys. 79, 926-935(1983). [13] W.L. Jorgensen & J.D. Madura. Mol. Phys. 56, 1381(1985). g) CHARMM [14] B. R. Brooks, R. E. Bruccoleri, B. D. Olafson, D. J. States, S. Swaminathan, and M. Karplus. CHARMM: A Program for Macromolecular Energy, Minimization, and Dynamics Calculations. J. Comp. Chem. 4, 187-217 (1983). ◆ Energy minimization a) Conjugate gradient minimization [15] M.J.D. Powell. Restart procedures for the conjugate gradient method. Prog. 12, 241-254(1977). myPresto 4.2 Math. 309 [16] S.J. Watowich, E.S. Meyer, R. Hagstrom & R. Josephs. A stable, rapidly converging conjugate gradient method for energy minimization. J. Comp. Chem. 9, 650-661(1988). b) Minimization with SHAKE Constraints [17] W.F. Gunsteren & M. Karplus. macromolecules. A method for constrained energy minimization of J. Comp. Chem. 1, 266-274(1980). ◆ Molecular dynamics a) General documents [18] W.F. Gunsteren. engineering. The role of computer simulation techniques in protein Protein Engineering 2, 5-13(1988). [19] 岡崎進,「コンピュータ・シミュレーションの基礎」, 化学同人(2000). b) Method of differentiation (method of integration) [20] L. Verlet. Computer "Experiments" on classical fluids. I. thermodynamical properties of Lennard-Jones molecules. Phys. Rev. 159, 98-103(1967). c) SHAKE constraints [21] J.P. Ryckaert, G. Ciccotti & H.J.C. Berendsen. Numerical integration of the cartesian equations of motion of a system with constraints: Molecular dynamics of n-alkanes. J. Comp. Phys. 23, 327-341(1977). d) Distance restraint [22] W. Braun & N. Go. J. Mol. Biol. 186, 611(1985). e) Position restraint [23] R.E. Brouccoleri & M. Karplus. J. Comput. Chem. 7, 165(1986). f) Torsion restraint [24] G.M. Clore, A.T. Brunger, M. Karplus & A.M. Gronenborn. J. Mol. Biol. 191, 523(1986a). g) Soft repulsion [25] M. Nilges, A.M. Gronenborn, A.T. Brunger & G.M. Clore. Protein Eng 2, 27(1998). myPresto 4.2 310 h) Constant temperature simulation [26] H.J.C. Berendsen, J.P.M. Postma, W.F. van Gunsteren, A. DiNola & J.R. Haak. Molecular dynamics with coupling to an external bath. J. Chem. Phys. 81, 3684-3690(1984). i) BEST fit (Jacobi's diagonalization) [27] S.K. Kearsley. On the orthogonal transformation used for structural comparisons. Acta Cryst. A45, 208-210(1989) j) Particle Mesh Ewald [28] U.Essmann, L.Perera, M.L.Berkowitz, T.Darden, H.Lee and L.G.Pedersen. A smooth particle meth Ewald method. J. Chem. Phys. 103, 8577-8593(1995) k) Thermostat, Rigid-body [29] T. Terada and A. Kidera. Generalized form of the conserved quantity in constant-temperature molecular dynamics. J. Chem. Phys. 116, 33-41(2002) l) NPT Ensemble [30] Glenn J. Martyna, Mark E. Tuckerman, Douglas J.Tobias, Michael L. Klein, Explicit reversible integrators for extended systems dynamics, Molecular Physics, 1996, vol.87, No.5, 1117-1157. m) RESPA [31] M. Tuckerman, B. J. Berne, G. J. Martyna, molecular dynamics, Reversible multiple time scale J. Chem. Phys. 97 (3), 1 August 1992. n) Fast Multipole Method [32] L. Greengard, "The Rapid Evaluation of Potential Fields in Particle Systems", MIT Press, Cambridge, MA, 1988. [33] L. Greengard and V. Rokhlin, "A Fast Algorithm for Particle Simulations", Journal of Computational Physics, 73, 325-348, 1987. myPresto 4.2 311 ◆ Implicit water model a) Generalized Born / Surface Area [34] Still, W. C., Tempczyk, A., Hawley, R., C. & Hendrickson, T. Semianalytical Treatment of Solvation for Molecular Mechanics and Dynamics. J. Am. Chem. Soc. 112, 6127 (1990). [35] Hawkins, D., Gregory., Cramer, J., Christopher. & Truhlar, G., Donald. Parameterized Models of Aqueous Free Energies of Solvation Based on Pairwise Descreening of Solute Atomic Charges from a Dielectric Medium. J Phys Chem 100, 19824-39 (1996). [36] Hawkins, D., Gregory., Cramer, J., Christopher. & Truhlar, G., Donald. Pairwise solute descreening of solute charges from a dielectric medium. Chemical Physics Letters 246, 122-129 (1995). [37] Onufriev, A., Bashford, D. & Case, D. A. Modification of the Generalized Born Model Suitable for Macromolecules. J Phys Chem. B 104, 3712-3720 (2000). b) Accessible Surface Area [38] Richmond, T. J. Solvent accessible surface area and excluded volume in proteins. Analytical equations for overlapping spheres and implications for the hydrophobic effect. J Mol Biol 178, 63-89. (1984). [39] T. Ooi, M. Oobatake, G. Nemethy, H. A. Scheraga, Accessible surface areas as a measure of the thermodynamic parameters of hydration of peptides. Proc. Natl. Acad. Sci. U S A 84 (1987)3086-90. [40] Kinjo, A. R., Kidera, A., Nakamura, H. & Nishikawa, K. Physicochemical evaluation of protein folds predicted by threading. Eur Biophys J 30, 1-10. (2001). c) Atomic Solvation Parameter [41] Ponder JW, Case DA. Force fields for protein simulations. Adv Protein Chem 2003;66:27-85. myPresto 4.2 312 ◆ Multicanonical MD a) Multicanonical MD [42] N. Nakajima, H. Nakamura, and A. Kidera, "Multicanonical ensemble generated by molecular dynamics simulation for enhanced conformational sampling of peptides", J. Phys. Chem. B 101, 817-824 (1997). [43] J. Higo, N. Nakajima, H. Shirai, A. Kidera, H. Nakamura, "Two-component multicanonical Monte Carlo method for effective conformational sampling", J. Comp. Chem. 18, 2086 (1997). [44] N. Nakajima, "A selectively enhanced multicanonical molecular dynamics method for conformational sampling of peptides in realistic water molecules", Chem. Phys. Letters, 288, 319 (1998). [45] H. Shirai, N. Nakajima, J. Higo, A. Kidera and H. Nakamura, "Conformational sampling of CDR-H3 in antibodies by multicanonical molecular dynamics simulation", J. Mol. Biol., 278, 481-496 (1998). [46] S.T. Kim, H. Shirai, N. Nakajima, J. Higo, and H. Nakamura, "Enhanced conformational diversity search of CDR-H3 in antibodies: Roles of the first CDR-H3 residue", PROTEINS: Struct. Funct. and Genet., 37, 683-696 (1999). [47] H. Nakamura, S. Ono, and J. Higo, "A general ab initio approach for free energy landscapes of biological molecules around the transition states: Fusion of the classical molecular mechanics simulation and the quantum chemical calculation", Proc. Japan Acad. 75, Ser.B, 291-294 (1999). [48] N. Nakajima, J. Higo, A. Kidera, H. Nakamura, "Free energy landscape of peptides by enhanced conformational sampling", J. Mol. Biol. 296, 197 (2000). [49] S. Ono, N. Nakajima, J. Higo and H. Nakamura, "Peptide free energy profile is strongly dependent on the force field: Comparison of C96 and AMBER95", J. Comput. Chem. 9: 748-762 (2000). [50] J. G. Kim, Y. Fukunishi, H. Nakamura, Dynamical origin of uniform sampling in multicanonical ensemble, Physical Review E 67, 011105 (2003). [51] J. G. Kim, Y. Fukunishi, A. Kidera and H. Nakamura, "Determination of multicanonical weight based on a stochastic model of sampling dynamics", Physical Review E 68, 021110 (2003). [52] J. G. Kim, Y. Fukunishi, A. Kidera and H. Nakamura, "Stochastic formulation of sampling dynamics in generalized ensemble methods", (2004). myPresto 4.2 Physical Review E 69, 021101 313 [53] Yukihisa S. Watanabe, Yoshifumi Fukunishi, Haruki Nakamura, "Modelling of third cytoplasmic loop of bovine rhodopsin by multicanonical molecular dynamics", J. Mol. Graph. Model. 23, 59-68 (2004). b) Multicanonical WHAM [54] Satoshi Ono, Nobuyuki Nakajima, Junichi Higo and Haruki Nakamura, "The multicanonical weighted histogram analysis method for the free energy landscape along structural transition paths", Chem. Phys. Lett. 312, 247-254 (1999). c) Force-biased Multicanonical MD [55] Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, "Multicanonical molecular dynamics algorithm employing adaptive force-biased iteration scheme", Phys. Rev. E 70, 057103 (2004). d) Force-biased Multicanonical MD with GB/SA [56] Yukihisa S. Watanabe, Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, "Free energy landscapes of small peptides in an implicit solvent model determined by force-biased multicanonical molecular dynamics simulation", Chem. Phys. Lett. 400, 258-263 (2004). [57] Narutoshi Kamiya, Yukihisa S. Watanabe, Satoshi O no, Junichi Higo, "AMBER-based hybrid force field for conformational sampling of polypeptides", Chem. Phys. Lett. 401, 312-317 (2005). ◆ Free Energy Estimation a) WHAM [58] A. M. Ferrenberg and R. H. Swendsen, Phys. Rev. Lett. 61, 2635 (1988). b) Filling potential method [59] Y. Fukunishi, Y. Mikami, and H. Nakamura, "The filling potential method: A method for estimating the free energy surface for protein-ligand docking", J. Phys. Chem. B. 107, 13201-13210 (2003). ◆ In silico screening method myPresto 4.2 314 [60] "A virtual active compound produced from the negative image of a ligand-binding pocket, and its application to in-silico drug screening", Y. Fukunishi, S. Kubota, C. Kanai, H. Nakamura, Journal of Computer-Aided Mol Design, (2006) 20, 237-48. [61] "Finding ligands for G-protein coupled receptors based on the protein-compound affinity matrix", Y. Fukunishi, S. Kubota, H. Nakamura, Journal of Molecular Graphics and Modelling, 25, 633-43, (2007). myPresto 4.2 myPresto 4.204