...

myPrestoマニュアル(日本語) - 一般社団法人バイオ産業情報化

by user

on
Category: Documents
138

views

Report

Comments

Transcript

myPrestoマニュアル(日本語) - 一般社団法人バイオ産業情報化
myPresto 4.204
USER MANUAL
Version 1.0
Copyright (C) 2006-2011 National Institute of Advanced Industrial Science and Technology (AIST)
Copyright (C) 2006-2011
Japan Biological Informatics Consortium (JBIC)
ii
コピーライトについて
本ソフトウェアには、以下の「プログラム使用同意書」とともに配布されているソフト
ウェアが含まれています。
著作権表示、及び、コピーライトは下記のとおりです。
myPresto version 4 :
独立行政法人産業技術総合研究所
Copyright (C) 2006-2011
National Institute of Advanced Industrial Science and Technology (AIST)
社団法人バイオ産業情報化コンソーシアム
Copyright (C) 2006-2011
Japan Biological Informatics Consortium (JBIC)
富士通株式会社
Copyright (C) 2006-2011
FUJITSU LIMITED
株式会社日立製作所
Copyright (C) 2006-2011
myPresto 4.2
Hitachi, Ltd.
iii
プログラム使用許諾条件
別紙参照のこと。
プログラム myPresto version 4 の概要
○ tplgene : 蛋白質に対して AMBER/CHARMm の力場を割り当てる。
○ tplgeneL :化合物に対して general AMBER force field (GAFF)を割り当てる。
○
cosgene :
分子動力学シミュレーションを行う。NVE/NVT/NPT アンサンブル、
SHAKE, 剛体モデル、マルチカノニカルMD,各種アンブレラサンプリング、GBSA を
行える。SRPG 法による自由エネルギー計算が可能。
○
sievgene : 蛋白質―化合物ドッキングソフト
○
Matrix : in silico screening (Multiple Target Screening method, Docking
Score Index method):MTS 法、DSI 法での薬物スクリーニング
○
LigandBox : 化合物データベース生成ツール
○
Hgene :
○
VCOL : コンビナトリアルな分子の生成ツール
○
confgene/ confgeneC : 分子の配座生成ツール
○
MVO : Maximum Volume Overlap 法によるドッキング構造の精密化
○
MD-MVO : MD-MVO 法による類似化合物探索(ligand-base drug screening)
○
substructure-search : 分子骨格による類似化合物探索(ligand-base drug
化合物への H 原子付加、原子電荷計算など。
screening)
○
TGS : TGS 法による類似化合物探索(ligand-base drug screening)
○
sptool: 分子記述子などによる溶解度推算及びアグリゲーターの予測
○
MolSite : 化合物ドッキングによる蛋白質ポケット及び活性の予測
○
UAP : Universal Active Probe 法による薬物スクリーニング結果の選択
○
BindMol : 化合物同士を連結、側鎖を導入するなど、ランダム・総当たりで分子
myPresto 4.2
iv
を生成するツール
myPresto 4.2
v
ソフトウェアの著者
◆ myPresto version 4
中村
福西
金森
窪田
尾曲
福田
和田
真下
三友
坂本
春木(Nakamura, Haruki)
快文(Fukunishi, Yoshifumi)
英司 (Eiji, Kanamori)
聡(Kubota, Satoru)
克己(Omagari, Katsumi)
育夫 (Fukuda, Ikuo)
光人 (Wada, Mitsuhito)
忠彰 (Mashimo, Tadaaki)
大輔 (Mitomo, Daisuke)
晋子 (Sakamoto, Kuniko)
◆ myPresto version 3
中村
福西
金
渡辺
三上
窪田
尾曲
巽
堀江
福田
春木(Nakamura, Haruki)
快文(Fukunishi, Yoshifumi)
在 吉(Jae Gil Kim)
幸久 (Watanabe, YS)
義明 (Mikami, Yoshiaki)
聡(Kubota, Satoru)
克己(Omagari, Katsumi)
理 恵(Tatsumi, Rie)
将 (Horie, Masaru)
育夫 (Fukuda, Ikuo)
◆ myPresto version 2
中村
福西
金
三上
渡辺
伊奈
堀江
高橋
福田
春木(Nakamura, Haruki)
快文(Fukunishi, Yoshifumi)
在 吉(Jae Gil Kim)
義明 (Mikami, Yoshiaki)
幸久 (Watanabe, YS)
康夫 (Ina, Yasuo)
将 (Horie, Masaru)
誠 (Takahashi, Makoto)
育夫 (Fukuda, Ikuo)
◆ myPresto version 1
cosgene version 1:
中村 春木 (Nakamura, Haruki)
福西 快文 (Fukunishi, Yoshifumi)
橋
祐 一 (Hashi, Yuichi)
myPresto 4.2
vi
三上 義明 (Mikami, Yoshiaki)
木寺 詔紀 (Kidera, Akinori)
寺田
透 (Terada, Toru)
tplgene version 1:
中村
福西
黒田
福田
myPresto 4.2
春木
快文
正孝
育夫
(Nakamura, Haruki)
(Fukunishi, Yoshifumi)
(Kuroda, Masataka)
(Fukuda, Ikuo)
vii
引用文献について
本ソフトウェアの使用時には、以下の文献を引用してください。
myPresto 全体及び Filling potential/SRPG 法について
1) "The filling potential method: A method for estimating the free energy surface
for protein-ligand docking", Yoshifumi Fukunishi, Yoshiaki Mikami, and Haruki
Nakamura, J. Phys. Chem. B. (2003) 107, 13201-13210.
2) “Protein-ligand binding free energy calculation by the smooth reaction path
generation (SRPG) method”, Yoshifumi Fukunishi, Daisuke Mitomo, and Haruki
Nakamura, J. Chem. Inf. Model., 2009, 49, 1944-1951.
cosgene :Multicanonical MD について
1) "Determination of multicanonical weight based on a stochastic model of sampling
dynamics", Jae Gill Kim, Yoshifumi Fukunishi, Akinori Kidera and Haruki Nakamura,
Physical Review E (2003) 68, 021110.
2) "Multicanonical molecular dynamics algorithm employing adaptive force-biased
iteration scheme", Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, Phys. Rev.
E 70, 057103 (2004).
Particle Mesh Ewald(PME)について
1) U.Essmann, L.Perera, M.L.Berkowitz, T.Darden, H.Lee and L.G.Pedersen. A smooth
particle meth Ewald method.
J. Chem. Phys. 103, 8577-8593(1995)
Accessible surface area (ASA)について
1) Kinjo, A. R., Kidera, A., Nakamura, H. & Nishikawa, K. Physicochemical evaluation
of protein folds predicted by threading.
Eur Biophys J 30, 1-10. (2001).
Fast Multipole Method (FMM)について
1) J. A. Board, Z. S. Hakura, W. D. Elliott, and W. T. Rankin. “Scalable variants
of multipole-accelerated algorithms for molecular dynamics applications”In
Proceedings of the Seventh SIAM Conference on Parallel Processing for Scientific
Computing, February 1995.
2) W. T. Rankin,“Efficient Parallel Implementations of Multipole Based N-Body
Algorithms.“PhD thesis, Duke University, Department of Electrical and Computer
Engineering, P.O.Box 90291, Durham, NC 27708-0291, April 1999.
3) W. T. Rankin, DPMTA ?Distributed Parallel Multipole Tree Algorithm, Duke University,
Durham, NC (2002).
myPresto 4.2
viii
sievgene について
1) "Similarity among receptor pockets and among compounds: Analysis and application
to in silico ligand screening", Y. Fukunishi, Y. Mikami, and H. Nakamura, The Journal
of Molecular Graphics and Modelling 24 (2005) 34-45.
Multiple Target Screening (MTS)法について
1) "Multiple target screening method for robust and accurate in silico screening",
Y. Fukunishi, Y. Mikami, S. Kubota, H. Nakamura, Journal of Molecular Graphics and
Modelling,25, 61-70 (2005).
2) "Noise reduction method for molecular interaction energy: application to in silico
drug screening and in silico target protein screening", Y. Fukunishi, S. Kubota,
H. Nakamura, Journal of Chemical Information and Modeling, 46, 2071-2084 (2006).
3) "Improvement of protein-compound docking scores by using amino-acid sequence
similarities of proteins", Y. Fukunishi, H. Nakamura, Journal of chemical
information and modeling, 48, 148-156 (2008)
Docking Score Index (DSI)法について
1) "Classification of chemical compounds by protein-compound docking for use in
designing a focused library", Y. Fukunishi, Y. Mikami, K. Takedomi, M. Yamanouchi,
H. Shima, H. Nakamura, Journal of Medicinal Chemistry, 49, 523-533 (2006).
2) "An efficient in silico screening method based on the protein-compound affinity
matrix and its application to the design of a focused library for cytochrome P450
(CYP) ligands", Y. Fukunishi, S. Hojo, H.Nakamura, Journal of chemical information
and modeling, 46, 2610-22 (2006).
Maximum Volume Overlap (MVO)法について
1) "Prediction of protein-ligand complex by docking software guided by other complex
structures", Y. Fukunishi, H. Nakamura, Journal of Molecular Graphics and Modelling,
26 (2008) 1030-1033.
Molecular-dynamics Maximum Volume Overlap (MD-MVO)法について
1)” A
new
method
for
in-silico
drug
screening
and
similarity
search
using
molecular-dynamics maximum-volume overlap (MD-MVO) method”, Y. Fukunishi, H.
Nakamura, Journal of Molecular Graphics and Modelling, 2009, 27, 628-636.
TGS 法について
myPresto 4.2
ix
1) “A
similarity
search
using
molecular
topological
graphs”,
Y. Fukunishi, H.
Nakamura,Journal of Biomedicine and Biotechnology, Volume 2009 (2009), Article ID
231780
LiganBox について
1)“Advanced in-silico drug screeing to achieve high hit ratio-development of 3D-compound
database”, Yoshifumi Fukunishi, Yuusuke Sugihara, Yoshiaki Mikami, Kohta Sakai, Hiroshi
Kusudo, Haruki Nakamura, Synthesiology, 2009, 2, 60-68.
Sptool 溶解度(LogS)及び aggregator (frequent hitter)の予測 について
Tadaaki Mashimo, Yoshifumi Fukunishi, Masaya Orita, Naoko Katayama, Shigeo Fujita,
Haruki Nakamura, Quantitative analysis of aggregation-solubility relationship by
in-silico solubility prediction, International Journal of High Throughput Screening,
2010:1, 99-107.
MolSite(蛋白質リガンドポケット予測)について
Yoshifumi Fukunishi, Haruki Nakamura. “Prediction of ligand-binding sites of
proteins by molecular docking calculation for a random ligand library”, Protein
Science (accepted).
Universal active probe (UAP) について
Fukunishi, Yoshifumi; Ono, Kazuki; Orita, Masaya; Nakamura, Haruki, Selection of
in-silico drug screening result by using universal active probes (UAPs), Journal
of Chemical Information and Modeling, 2010, 50, 1233-1240.
BindMol について
Yoshifumi Fukunishi. Prediction of positions of active compounds makes it possible
to increase activity in fragment-based drug development. Pharmaceuticals. 2011, 4,
758-769.
その他の参考文献については巻末を参照
myPresto 4.2
x
謝辞
本ソフトウェアの研究開発は、新エネルギー・産業技術総合開発機構(NEDO)、及び、
経済産業省(METI)の援助によって行われました。ここに感謝の意を記します。
本ソフトウェアは、故・京極好正博士の推進する研究プロジェクトで開発されました。
Particle Mesh Ewald (PME) のサブルーチンは、Tom Darden 博士の御厚意により提供さ
れたコードを参考に作成されました。ここに感謝の意を記します。
The Particle Mesh Ewald (PME) routines were originally developed by Dr. Tom Darden [28].
National Institute of Environmental Health Sciences,
Research Triangle Park,
North Carolina 27709 US.
Accessible Surface Area(ASA)のサブルーチンは、金城玲博士の御厚意により提供さ
れたコードを参考に作成されました。ここに感謝の意を記します。
The Accessible Surface Area (ASA) routines were originally developed by Dr. Akira Kinjo [40].
Center for Information Biology and DNA Data Bank of Japan,
National Institute of Genetics,
Mishima, Shizuoka, 411-8540, Japan.
Fast Multipole Method (FMM) のサブルーチンは、William T. Rankin 博士の御厚意によ
り提供されたコードを参考に作成されました。ここに感謝の意を記します。
The Fast Multipole Method (FMM) routines were originally developed by Dr. William T. Rankin.
Center for Computational Science and Engineering
Duke University
Dept. of Electrical and Computer Engineering
Box 90291
Durham, NC 27708-0291 US.
myPresto 4.2
xi
目次
1
2
3
4
概要 ........................................................................ 1
1.1
分子シミュレーションシステム:myPresto ................................. 1
1.2
トポロジージェネレータ:tplgene......................................... 2
1.3
低分子トポロジージェネレータ:tplgeneL ................................. 2
1.4
構造探索エンジン:cosgene............................................... 2
1.5
インストール............................................................ 3
1.6
化合物データベース:LigandBOX........................................... 4
tplgene..................................................................... 7
2.1
実行方法 ................................................................ 7
2.2
入力データの作成....................................................... 10
2.2.1
PDB 形式ファイル ................................................... 10
2.2.2
DIHED 形式ファイル ................................................. 11
2.3
力場データベースファイル............................................... 13
2.4
環境変数 ............................................................... 15
tplgeneL................................................................... 17
3.1
実行方法 ............................................................... 17
3.2
入力データの作成....................................................... 20
3.2.1
tplgeneL オリジナル形式ファイル .................................... 20
3.2.2
Sybyl mol2 形式ファイル ............................................ 22
3.3
原子タイプ定義ファイル................................................. 28
3.4
力場パラメータデータベースファイル..................................... 28
3.5
フラグメントデータベースファイル....................................... 30
3.6
環境変数 ............................................................... 31
cosgene.................................................................... 33
4.1
実行方法 ............................................................... 33
4.2
入力データの作成....................................................... 33
4.2.1
コントロールファイル............................................... 33
4.2.1.1 EXE> INPUT
グループ............................................ 35
4.2.1.2 EXE> MINimize
グループ ........................................ 42
myPresto 4.0
xii
4.2.1.3 EXE> MD グループ................................................ 59
4.2.1.4 EXE> OUTPUT グループ............................................ 82
4.2.1.5 EXE> END グループ............................................... 83
5
計算例 ..................................................................... 85
5.1
Sample-1:真空中のペプチド
−Vassopressin の計算− .................... 85
5.2
Sample-2:真空中の蛋白
5.3
Sample-3:水中の蛋白
5.4
Sample-4:拡張アンサンブル(Force-biased McMD)−Alanine ペプチドの計算−
−Lysozyme の計算− ............................ 88
−Lysozyme の計算− .............................. 94
........................................................................... 102
5.5
Sample-5:拡張アンサンブル(Simulated Tempering McMD)−Alanine ペプチドの計算−
........................................................................... 106
5.6
Sample-6:拡張アンサンブル(Generalized ST McMD)−Alanine ペプチドの計算− . 110
5.7
Sample-7:拡張アンサンブル−構造の抽出とクラスタリング− ............. 115
5.8
Sample-8:低分子トポロジーの生成
5.9
Sample-9:自由エネルギー計算(Filling Potential 法)−水中のメタンの計算−
−Methanol の計算− ................. 119
........................................................................... 123
5.10
Sample-10:RESPA 法 .................................................. 130
5.11
Sample-11:RATTLE
−水中のインドメサシンの計算− ................... 132
5.12
Sample-12:Rigid
−水中のインドメサシンの計算− .................... 135
5.13
Sample-13:NPT と PME を用いた周期系の計算
5.14
Sample-14:Fast Multipole Method
5.15
Sample-15:GB/SA
−Vassopressin の計算− ............................ 147
5.16
Sample-16:SRPG
−Streptavidin の結合自由エネルギー計算− ........... 150
5.17
Sample-17:溶解度予測−アグリゲータ解析− ........................... 161
5.18
Sample-18:CAP 水を用いた生理食塩水中での蛋白質と化合物の複合体の系の計算
−水中のメタンの計算− .... 137
−カウンターイオンを用いた MD 計算− 141
........................................................................... 168
5.19
A
Sample-19:周期系を用いた生理食塩水中での蛋白質の系の NPT 計算 ....... 173
入出力ファイル............................................................ 179
A.1 構造探索エンジンの入出力ファイル....................................... 179
A.1.1 フェーズの説明..................................................... 179
A.2 入力ファイル........................................................... 180
A.2.1 制御ファイル....................................................... 181
A.2.2 トポロジーファイル................................................. 199
A.2.3 座標ファイル....................................................... 210
A.2.4 SHAKE ファイル ..................................................... 211
myPresto 4.2
xiii
A.2.5 固定原子・自由原子指定ファイル..................................... 213
A.2.6 CAP 指定ファイル ................................................... 215
A.2.7 拡張 CAP 指定ファイル............................................... 217
A.2.9 距離拘束ファイル................................................... 221
A.2.10 二面角拘束ファイル................................................ 223
A.2.11 モニター指定ファイル.............................................. 225
A.2.12 系の重心合わせ指定用ファイル...................................... 227
A.2.13 系の GB/SA 及び ASA 用パラメータ指定ファイル ....................... 229
A.2.14 Umbrella 拘束ファイル ............................................. 231
A.2.15 リスタートファイル................................................ 234
A.2.16 剛体モデルファイル................................................ 237
A.3 出力ファイル........................................................... 239
A.3.1 MIN エネルギートラジェクトリ ....................................... 240
A.3.2 MD エネルギートラジェクトリ ........................................ 242
A.3.3 モニター指定トラジェクトリ......................................... 244
A.3.4 総エネルギーデータ................................................. 246
A.3.5 座標トラジェクトリ................................................. 247
A.3.6 速度トラジェクトリ................................................. 249
B
ユーティリティ............................................................ 251
B.1
setwater.............................................................. 251
B.2
mergetpl.............................................................. 253
B.3
SHAKEinp.............................................................. 255
B.4
RIGIDinp.............................................................. 256
B.5
GBSAinp............................................................... 258
B.6
自由エネルギー計算(Filling potential 法 + WHAM 法)解析 .............. 259
B.6.1
Generate_NextFP................................................... 259
B.6.2
Extract_Atom...................................................... 261
B.6.3
Wham_Analysis..................................................... 262
B.7
拡張アンサンブル向け解析ツール........................................ 264
B.7.1 reweightFB......................................................... 265
B.7.2 reweightST......................................................... 266
B.7.3 reweightGST........................................................ 267
B.7.4 selection.......................................................... 268
B.7.5 clustering......................................................... 270
B.8
存在確率(Potential Mean Force)解析ツール ........................... 274
B.8.1 pmf................................................................ 274
myPresto 4.2
xiv
B.8.2 contour............................................................ 276
B.9
pca ................................................................... 277
B.10
Gamess2tplinp........................................................ 279
B.11
Gauss2tplinp......................................................... 280
B.12
tpl2mol2............................................................. 281
B.13
add_ion.............................................................. 282
B.14
confgene............................................................. 285
B.15
confgeneC............................................................ 287
B.16
自由エネルギー摂動法(開発中)....................................... 289
B.16.1 計算方式.......................................................... 289
B.16.2 vdw パラメータおよび電荷のスケーリング機能(cosgene) ............. 291
B.16.3 analyze........................................................... 292
B.16.4 FEP............................................................... 293
B.17
Hgene................................................................ 294
B.18
MVO .................................................................. 296
B.19
sptool............................................................... 298
B.19.1 Descriptor........................................................ 298
B.19.2 Solubility........................................................ 300
B.19.3 FreqMaker......................................................... 301
B.19.4 wln............................................................... 301
B.19.5 pls............................................................... 302
B.19.6 mlr............................................................... 302
B.19.7 bys............................................................... 303
B.19.8 trans_code........................................................ 304
参考文献 ..................................................................... 307
myPresto 4.2
1
1 概要
1.1
分子シミュレーションシステム:myPresto
myPresto(マイ・プレスト)は、高効率の構造探索アルゴリズムを採用した構造探索エ
ンジンを備え、生体分子を対象とした分子シミュレーションシステムです。myPresto は、
生体分子の動的な立体構造のシミュレーションと自由エネルギー計算を目的とした、汎用
的でかつ高効率なシステムを目指して開発されました。主たる応用範囲は、蛋白質のモデ
リング、蛋白質−薬物低分子のモデリング、薬物ドッキング、膜蛋白質の計算などです。
myPresto version 4.0 では、以下のサブシステム群から構成されています。利用手順と
して、分子の初期座標・トポロジーファイルの準備段階(tplgene/tplgeneL)、エネルギー
最小化・MD 計算の段階(cosgene)、解析ツールによる結果解析の段階に分けられます。
① トポロジージェネレータ:tplgene
② 低分子トポロジージェネレータ:tplgeneL
③ 構造探索エンジン:cosgene
④ 各種ツール群
⑤ 化合物データベース:LigandBOX
分子の初期座標・トポロジーファイルの準備段階
(tplgene/tplgeneL)
エネルギー最小化・MD 計算の段階
(cosgene)
解析ツールによる結果解析の段階
myPresto の構成
myPresto 4.0
2
1.2
トポロジージェネレータ:tplgene
myPresto を用いてエネルギー最小化・MD 計算を行う時は、まず始めにその分子系のトポ
ロジーファイルを作成する必要があります。このファイルは tplgene サブシステムを使用
することにより、簡単に作成できます。
tplgene を用いると、標準入力において、水素原子など、一部の情報が含まれていない不
完全なカーテシアン座標を用いても、コンフォメーションエネルギー計算を行うための初
期構造として、完全なカーテシアン座標を得ることができます。
対応する力場は AMBER および CHARMm です。
1.3
低分子トポロジージェネレータ:tplgeneL
低分子トポロジージェネレータ tplgeneL は、tplgene では対応していないリガンド等の
低分子について、トポロジーファイルを作成することができます。
対応する力場は AMBER parm99 と AMBER General Amber Force Field(GAFF)です。
tplgene、及び、tplgeneL サブシステムで作成したトポロジーファイルを結合し、1つの
ファイルにすることにより、高分子−低分子複合体の MD の計算を行う事ができます。
1.4
構造探索エンジン:cosgene
tplgene によって準備した分子の初期座標・トポロジーファイルを入力とし、エネルギー
最小化・MD の計算を行います。主に以下のような機能を備えています。
(現バージョンでは、Fast Multipole Method は使用できません。)
cosgene の主な機能
機能分類
内容
エネルギー最小化
Steepest decent method, Steepest decent method with SHAKE,
Conjugate gradient method
MD 計算
Micro-Canonical, Canonical, Force-biased Multi-Canonical
Tsallis Dynamics
積分器
Leap-frog (Verlet), Velocity Verlet, RESPA
Thermostat
Hoover-Evans Gaussian constraint, Nose-Hoover
Barostat
Andersen, Parrinello-Rahman
長距離相互作用
Direct summation, Direct summation & Cutoff,
Ewald, Particle Mesh Ewald, Fast Multipole Method
拘束法
SHAKE, RATTLE, Rigid-body,
Position restraint, Distance restraint
境界条件
myPresto 4.2
球・楕円体、周期境界条件
3
1.5
インストール
(1)インストールに必要な環境
・UNIX(Linux)環境
:myPresto の実行環境です。
・C コンパイラ :tplgene および tplgeneL の構築に使用します。
・Fortran90 コンパイラ :cosgene の構築に使用します。
(2)インストール方法
myPresto 以下のディレクトリをインストール先のディレクトリにコピーします。
myPresto のディレクトリ構成は以下のようになっています。
・tplgene
:tplgene 本体
・tplgeneL
:tplgeneL 本体
・cosgene
:cosgene 本体
・tools :ツール群
・doc
:ドキュメント群
・sample
:サンプルデータ(本マニュアルの「5 計算例」の章に対応)
myPresto
tplgene
bin DB src
tplgeneL
cosgene
bin DB src
bin src
tools
doc
sample
sample1
sample2 ...
sampleN
tplgene, tplgeneL, cosgene の "src" ディレクトリで make コマンドを使用します。
tools 下のツールは、適宜コンパイルしてください。
【注意】実際のコンパイル環境に合わせて Makefile の修正が必要な場合があります。
cosgene では PME 法で使用する FFT ライブラリを、Makefile の FFT_DEF と FFT_LIB で指
定することができます。
myPresto 4.2
4
1.6
化合物データベース:LigandBOX
(1)化合物データベース LigandBOX
ナミキ商事株式会社が配布する 2 次元電子カタログより、myPresto によって水素原子付
加、分子総電荷見積もりを行い、分子を 3 次元化した、mol2 ファイル書式のデータセット
です。
ディレクトリ構成は以下のようになっています。
・MOLDB
:化合物データベース作成ツール
・doc
:ドキュメント
・mol2_2004 :2004 年度 2 次元電子カタログを基に作成した 3 次元化合物データ
・mol2_2005 :2005 年度 2 次元電子カタログを基に作成した 3 次元化合物データ
LigandBOX
MOLDB
doc
mol2_2004
mol2_2005
(2)蛋白質−化合物相互作用行列
LigandBOX の 2004 年度 2 次元電子カタログを基に作成した 3 次元化合物データを元に作
成した蛋白質−化合物相互作用行列です。
ディレクトリ構成は以下のようになっています。
・list
:蛋白質および化合物のリスト
・Matrix
:蛋白質−化合物相互作用行列
・tools
:蛋白質−化合物相互作用行列解析ツール
Matrix
list
myPresto 4.2
Matrix
tools
5
◆実施例
myPresto 4.2
7
2 tplgene
2.1
実行方法
tplgene は、対象分子の構造に関するデータ(PDB 形式ファイル、DIHED 形式ファイル)
を入力として、分子の初期座標・トポロジーファイルの作成を行います。
計算の際に参照するディレクトリ(入力ファイル用、出力ファイル用、力場 DB 用)を環
境変数に設定することができます。環境変数を設定していない場合は、カレントディレク
トリを参照するので、入力ファイル、力場 DB ファイルを、予め実行するディレクトリにコ
ピーしておきます。
tplgene の実行の際は、以下の項目を指定します。これらは、画面からの対話入力、又は、
コマンドライン・オプションで指定することができます。
■入力項目
・トポロジーファイルのタイトル
・分子名
・分子の種類(1:ペプチド鎖、2:DNA、RNA 鎖)
・入力ファイルの書式(1:PDB 形式、2:DIHED 形式)
・力場 DB ファイル名
・入力ファイル名
・出力 PDB ファイル名
・出力 TPL ファイル名
以下は必要時のみ
・水モデルの選択(1:tip3p モデル、2:tip4p モデル)
・低分子 TPL ファイル名(カレントに配置、PDB 中の残基名は LGx:x=A-Z)
% tplgene
または、
% tplgene (オプション)
コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップさ
れます。オプション指定しなかったものだけを対話的に入力することになります。
myPresto 4.0
8
-title
<title_name>
タイトルを<title_name>に指定します
-molname
<molcular_name>
分子名を<molcular_name>に指定します
-i
<input_coord>
入力座標ファイル名を<input_coord>に指定します
-db
<db_file>
力場 DB ファイル名を<db_file>に指定します
-chain
[ pep │ nuc ]
計算する分子の種類を指定します
ペプチド
⇒ pep
ヌクレオチド ⇒ nuc
-filetype [ pdb │ dihed ]
入力ファイルの種類を指定します
PDB ファイルフォーマット
⇒ pdb
DIHED ファイルフォーマット ⇒ dihed
-outcrd
<output_coord>
出力座標ファイル名を<output_coord>に指定します
-outtpl
<output_tpl>
出力トポロジーファイル名を<output_tpl>に指定します
-water
[tip3p │ tip4p]
入力ファイル内に水情報を含む場合、水モデルの力場を指定します
tip3p 水モデル ⇒ tip3p(デフォルト)
tip4p 水モデル ⇒ tip4p
■オプション指定例(下線部が入力部分)
% tplgene -i vas.dih -chain pep -filetype dihed -db C96_aa.tpl
また、オプション"-h"または、"-help"の指定により、tplgene の使用法を見ることがで
きます。
% tplgene
-h
または
% tplgene
myPresto 4.2
-help
9
なお、予め対話入力する項目(作業指示)をファイル(作業指示ファイル:control_file)
に保存しておくことによって、tplgene を実行する度に対話入力をする手間を省略すること
ができます。
% tplgene
<
control_file
■作業指示ファイル例
ALA-ALA
:タイトル行、10 行以内で自由に書くことができる。
END
:タイトル行の最後には END と記述する。
ALA-ALA
:分子名、自由に書くことができる。
GLY-GLY
:複数分子の計算は複数行に各々の分子名を記述する。
END
:分子名の最後の行は END と記述する。
1
:ペプチド鎖は 1、DNA、RNA 鎖は 2 と記述する。
1
:PDB 入力は 1、DIHED 入力は 2 と記述する。
C96_aa.tpl
:力場 DB ファイル名を記述する。
ALA-ALA-input.pdb
:入力ファイル名を記述する。
ALA-ALA_out.pdb
:出力 PDB ファイル名を記述する。
ALA-ALA-out.tpl
:出力 TPL ファイル名を記述する。
以下は必要時のみ追記
1
:水モデルを記述する(1:tip3p
2:tip4p、必要時のみ)。
Lig.tpl
:リガンド tpl ファイル名を記述する(必要時のみ)。
tplgene の結果出力より得られる情報は、分子系の全原子を考慮したトポロジーおよび座
標情報です。これらの2つの情報を用いて、多くのコンフォメーションエネルギー計算が
実行されます。
対象分子の構造に関するデータ、使用する力場、出力ファイルのディレクトリをそれぞ
れ分けたい場合は、それらのパスを環境変数で指定することができます。環境変数が設定
されていない場合は、実行時のカレントディレクトリを参照します(「2.2.4 環境変数」参
照)。
myPresto 4.2
10
2.2
入力データの作成
2.2.1
PDB 形式ファイル
標準的な PDB 形式ファイルを使用します。必要な情報を以下に示します。
(1) アミノ酸残基名、及び、残基並び情報
(2) アミノ酸残基の各原子名、及び、カーテシアン座標情報
(3) ジスルフィド結合情報
(4) 環状分子情報
上記1及び2は入力が必須です。3及び4は必要な場合にのみ指定することができます。
ジスルフィド結合は通常の PDB 形式に従って定義します。環状分子を計算する場合には、
ATOM 行よりも前の行に、CIRCLE のキーワードを指定します(下図参照)。
PDB ファイル中に複数分子(複数鎖)の情報が含まれている場合には、それらすべての分
子について計算を行います(これらは“TER”で区切られているものとします)。
また、金属イオン、ハロゲンイオン 、水分子情報を含む場合には、”ATOM”の代わり
に”HETATM”で指定し、それらの分子についての計算を行います。
なお、Alternate location indicator(17 カラム目)に tplgene は対応していません。
重複している原子と Alternate location indicator を削除してから計算して下さい。
■PDB 形式ファイルの例
SSBOND
1 CYS A
6
CYS A
11
CIRCLE
ATOM
20
N
GLU A
4
33.037 -5.952
10.469
ATOM
21
CA
GLU A
4
33.629 -7.247
10.859
ATOM
22
C
GLU A
4
32.721 -7.845
11.909
ATOM
23
O
GLU A
4
32.470 -9.061
11.856
ATOM
24
CB
GLU A
4
35.029 -7.100
11.439
ATOM
25
CG
GLU A
4
36.081 -6.452
10.545
ATOM
26
CD
GLU A
4
35.906 -5.028
10.096
ATOM
27
OE1 GLU A
4
35.591 -4.102
10.842
ATOM
28
OE2 GLU A
4
36.158 -4.867
8.851
HETATM
29
Zn
ZN
1
29.157
3.021
20.624
1.00 41.80
Zn
HETATM
30
Zn
ZN
2
20.538
16.287
4.630
1.00 43.88
Zn
HETATM
32
O
HOH
1
29.669
21.569
37.480
1.00 49.12
O
HETATM
33
O
HOH
2
20.132
6.585
18.359
1.00 60.57
O
HETATM
34
O
HOH
3
23.610
26.063
37.625
1.00 62.85
O
…
TER
myPresto 4.2
11
2.2.2
DIHED 形式ファイル
1分子のカーテシアン座標を生成したいときは、DIHED フォーマットファイルが有効です。
このフォーマットではアミノ酸残基とジスルフィド結合情報、環状分子情報を記述するだ
けで使用できます。必要な情報を以下に示します。
(1) アミノ酸残基名、及び、残基並び情報
(2) 環状分子情報
(3) ジスルフィド結合情報
(4) 二面角情報
上記、1は必須な情報です。2∼4は必要ならば指定することができます。
二面角情報を記述しない場合は、伸びた鎖構造を生成します。二面角情報を記述した場
合は、それらの値に従った鎖構造を生成します。
■DIHED 形式ファイルの例
DODECA-PEPTIDE の DIHED FILE は以下のように記述します。このペプチド鎖は 12 残基か
らなり、3、9 残基目の CYS-CYS 間でジスルフィド結合しています。
PRE>SEQUENCE
ASP
:1
LYS
:2
CYS
:3 -----+
CYS
:4
│
HIS
:5
│
HIS
:6
LEU
:7
│
TRP
:8
│
CYS
:9 -----+
GLN
:10
GLU
:11
GLU
:12
S-S BRIDGE
PRE>SSBONDS
3
9
PDB 中アミノ酸残基は以下のキーワードを入力します。入力は、"PRE>" で始まるいくつ
かのグループからなります。
myPresto 4.2
12
(1)アミノ酸シーケンス(PRE>SEQUENCE)
アミノ酸残基情報を記述します。キーワード "PRE>SEQUENCE" の次の行から N 末端側から
順次、アミノ酸名を入力していきます。1行に1つのアミノ酸名を記述します。
C96、C99 データベース共通に利用可能なアミノ酸は、以下の様になっています。
ACE (N 端アセチル基)/ ALA / ARG / ASN / ASP / ASH (ASP neutral) / CYS / CYSS / GLN
/ GLU / GLH (GLU neutral) /GLY / HIS / HISE / HIS / ILE / LEU / LYS / MET / PHE /
PRO / SER / THR / TRP / TYR / VAL / NMEC (C 端メチル基) / NHEC (C 端アミノ基)
/ ABA (2-aminobutanoic acid) / NLE (2-aminohexanoic acid) / SEP (SER リン酸化物) /
TYP (TYR リン酸化物)
/ THP (THR リン酸化物) / LYN (LYS neutral) / CYM (S- 解離型 CYS)
一方、C99 データベースのみ、以下のメチル化された残基が利用可能です。
MML (メチル LYS) / DML (ジメチル LYS) / TML (トリメチル LYS)
MMA (メチル ARG) / ADA (非対称ジメチル ARG)
/ SDA (対称ジメチル ARG)
同様に、C99 データベースのみ、以下のメチル化されたヌクレオチドが利用可能です。
DMC (メチル C)
なお、残基では N 末端・中央・C 末端、ヌクレオチドでは中央のデータが用意してあります。
(2)環状分子の場合の指定(PRE>CIRCULAR)
この分子が環状分子であることを示します。
(3)S-S 結合の指定(PRE>SSBOND)
ジスルフィド結合を有する場合には以下のように記述します。
myPresto 4.2
13
PRE>SSBOND
3
:1 行目、この分子が SS 結合を持つことを示す。
9
:3 番と 9 番の残基が SS 結合している。
(4)二面角の指定(PRE>DIHEDRAL-ANGLES)
二面角情報を記述します。N 末端から C 末端までのφ、ψ、ω、χを記述します。1行ごと
に 10 個以内の角度値を記述します。角の定義は ECEPP に従います。
プログラムの内部では、次の様な処理を行っています。
‘+’;プロトン化された LYS、ARG、HIS の場合に残基名の後ろに付加する。
‘-' ;非プロトン化された ASP、GLU の場合に付加する。
‘E’;HIS の中で、AN HD 水素のかわりに、AN HE 水素を持つものの場合に付加する。
‘S’;CYS の中で、ジスルフィド結合をつくるものの場合付加する。
N および C 末端には、以下の処理を行います。
‘N+’;プロトン化された、
N 末端の場合
‘N ' ;ニュートラルな、
N 末端の場合
‘C-’;非プロトン化された、C 末端の場合
‘C ’;ニュートラルな、
C 末端の場合
現バージョンでは、以下の処理を自動的に行います。
N 末端の場合は、'N+'を自動的に付加する。
C 末端の場合は、'C-'を自動的に付加する。
LYS、ARG の場合は、'+'を自動的に付加する。
ASP、GLU の場合は、'-'を自動的に付加する。
ジスルフィド結合している CYS に対しては、'S'を自動的に付加します。
2.3
力場データベースファイル
現在、アミノ酸の力場データベースとして 4 種類、ヌクレオチドの力場データベースと
して 2 種類、水分子、金属イオンの力場データベースとして 1 種類用意しています。
アミノ酸の力場データベース
C96_aa.tpl
AMBER96 力場に対して、全アミノ酸モノマーのトポロジー情報を
持つ
myPresto 4.2
14
C99_aa.tpl
AMBER99 力場に対して、全アミノ酸モノマーのトポロジー情報を
持つ(メチル基を修飾した ARG、LYS が利用可能)
charmm19_aa_all.tpl
CHARMm19 力場に対して、全アミノ酸モノマーのトポロジー情報を
持つ
charmm22_aa_all.tpl
CHARMm22 力場に対して、全アミノ酸モノマーのトポロジー情報を
持つ
ヌクレオチドの力場データベース
C96_na.tpl
AMBER96 力場に対して、全ヌクレオチドのトポロジー情報を持つ
C99_na.tpl
AMBER99 力場に対して、全ヌクレオチドのトポロジー情報を持つ
(メチル基を修飾した C が利用可能)
水分子、金属イオンの力場データベース
metals.tpl
myPresto 4.2
水分子、イオン関連のトポロジー情報を持つ
15
2.4
環境変数
対象分子の構造に関するデータ、使用する力場、出力ファイルを保存するディレクトリ
をそれぞれ分けたい場合には、それらのパスを環境変数で指定することができます。
環境変数は以下の 3 種類を設定することができます。環境変数を設定しない場合には、
実行時のカレントディレクトリを参照します。
■環境変数について
環境変数名
説明
TPL_INPUT_PATH
:tplgene 入力ファイル用ディレクトリ(パスを含めて記述する)
TPL_OUTPUT_PATH
:tplgene 出力ファイル用ディレクトリ(同上)
TPL_DB_PATH
:tplgene 力場 DB 用ディレクトリ(同上)
(設定例)
tplgene 力場 DB 用ディレクトリを"/home/user01/myPresto/tplgene/DB"とする場合。
環境変数の設定は、使用しているシェルの設定方法に従います。
(下線部が入力部分です)
(1)bash の場合
% export TPL_DB_PATH=/home/user01/myPresto/tplgene/DB
(2)csh の場合
% setenv TPL_DB_PATH /home/user01/myPresto/tplgene/DB
※環境変数で設定するディレクトリへのパスが固定される場合は、ログインスクリプト
(.bashrc, .cshrc)や専用スクリプトに書き込んでおくと便利です。
なお、現在使用しているシェルは以下のコマンドで確認できます。
% ps
myPresto 4.2
17
3
tplgeneL
3.1
実行方法
tplgeneL は、対象分子の構造に関するデータ(tplgeneL オリジナル形式ファイル、又は、
mol2 形式ファイル)を入力として、分子の初期座標・トポロジーファイルの作成を行いま
す。
計算を行う際に参照するディレクトリ(入力ファイル用、出力ファイル用、力場 DB 用)
は、環境変数に設定することができます。環境変数を設定していない場合は、カレントデ
ィレクトリを参照しますので、入力ファイル、原子タイプ定義ファイル、力場パラメータ
DB ファイルを、予め実行するディレクトリにコピーしておきます。
tplgeneL の実行の際は、以下の項目を指定します。これらは、画面からの対話入力、又
は、コマンドライン・オプションで指定することにより計算を行います。
■入力項目
・入力ファイルの書式(1:tplgeneL オリジナル形式、2:Sybyl mol2 形式)
・入力ファイル名
・不足パラメータが存在する場合の処理方法
(1:デフォルトパラメータを使用する、2:動的にパラメータの計算を行う
3:デフォルトパラメータの使用するが、パラメータのないものは動的にパラ
メータの計算を行う)
・パラメータ DB ファイル名
・フラグメント DB を使用するか(yes:使用する、no:使用しない)
% tplgeneL
または、
% tplgeneL (オプション)
コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップさ
れます。オプションで指定しなかったものだけを対話的に入力することになります。
myPresto 4.0
18
-ft
[ 1 │ 2 ]
入力ファイル形式を指定します
-i
tplgeneL オリジナル入力ファイル
: 1
Sybyl mol2 入力ファイル
: 2
<file>
入力ファイル名を<file>に指定します
-d
<db_file>
パラメータ DB ファイル名を<db_file>に指定します
-r
<resname>
出力するトポロジーファイルに記述する残基名を
<resname>に指定します(4 文字以内)
-f
[ yes │ no ]
フラグメント DB を使用するか否かを指定します
-p
使用する
⇒
yes あるいは y
使用しない
⇒
no
あるいは n
[ 1 │ 2 ]
不足パラメータの補填方法を選択します
デフォルトパラメータ
:
1
動的補填
:
2
デフォルトパラメータ+動的補填
:
3
■オプション指定例(下線部が入力部分)
% tplgeneL -i methanol -d prm_gaff.db -f no
また、オプション"-h"または、"-help"の指定により、tplgeneL の使用法を見ることがで
きます。
% tplgeneL
-h
または、
% tplgeneL
myPresto 4.2
-help
19
なお、予め対話入力する項目(作業指示)をファイル(作業指示ファイル:control_file)
に保存しておくことによって、tplgeneL を実行する度に対話入力をする手間を省略するこ
とができます。
% tplgeneL
<
control_file
■作業指示ファイル例
1
:入力ファイルフォーマットを記述(1:original、2:mol2)。
methanol
:ファイル名を記述する(拡張子は除く)。
1
:不足パラメータの補填方法を記述(1:default、2:動的補填)。
prm_gaff.db
:パラメータ DB ファイル名を記述する。
no
:フラグメント DB を使用するかを記述する(yes/no)。
tplgene で得られた高分子のトポロジーファイルと tplgeneL で得られたトポロジーファ
イルを結合することにより、cosgene にて、高分子−低分子複合体の MD シミュレーション
を行う事ができます。
対象分子の構造に関するデータ、使用する力場、出力ファイルのディレクトリをそれぞ
れ分けたい場合は、それらのパスを環境変数で指定することができます。環境変数が設定
されていない場合は、実行時のカレントディレクトリを参照します(「3.2.6 環境変数」参
照)。
myPresto 4.2
20
3.2
入力データの作成
tplgeneL で使用する分子の情報に関する入力ファイルは、tplgeneL オリジナル形式ファ
イル(bond ファイル、charge ファイル、zmat ファイル)と Sybyl mol2 形式ファイル(mol2
ファイル)の 2 種類に対応しています。
3.2.1
tplgeneL オリジナル形式ファイル
tplgeneL オリジナル入力ファイルを使用する場合には、以下の 3 種類のファイルを使用
します。
(1)電荷情報ファイル(XXX.charge ファイル(ここでXXX はファイル名(拡張子を除く)を示す)
原子名(項目 1)、元素記号(同 2)、Mulliken 電荷情報(同 3)、Resp 電荷情報(同 4)が記述さ
れています。
(2)結合情報ファイル(XXX.bond ファイル)
結合している原子の番号の組(項目 1、2)、結合長(同 3)、結合次数(同 4)が記述されていま
す。
(3)座標情報ファイル(XXX.zmat ファイル)
入力分子の Z-matrix 情報が記述されています。
上記1、2のファイルは必須です。3のファイルは存在する場合には、その情報がトポロ
ジーファイルに反映されます。
■電荷情報ファイルの例
C1
C
-0.1320
-0.1320
O2
O
-0.7323
-0.7323
H3
H
0.1340
0.1340
H4
H
0.1653
0.1653
H5
H
0.1644
0.1644
H6
H
0.4006
0.4006
■結合情報ファイルの例
1
2
1.4130
0.7600
1
3
1.1160
0.9530
1
4
1.1200
0.9480
1
5
1.1200
0.9480
2
6
0.9630
0.7970
myPresto 4.2
21
■座標情報ファイルの例
C
O
1
1.4132350
H
1
1.1159340
2
112.6746
H
1
1.1195330
2
107.3658
3
121.0117
0
H
1
1.1196880
2
107.4483
3 -121.0171
0
H
2
.9627370
1
107.7002
5 -120.0241
0
myPresto 4.2
22
3.2.2
Sybyl mol2 形式ファイル
tplgeneL では tplgeneL オリジナル形式ファイル以外にも、Sybyl mol2 形式ファイルも
使用することができます。
Sybyl mol2 ファイルには、分子情報(@<TRIPOS>MOLECULE 情報)、原子情報(@<TRIPOS>ATOM
情報)、結合情報(@<TRIPOS>BOND 情報)等が存在しますが、tplgeneL ではその内の原子情報、
結合情報を使用します。原子情報、結合情報には以下の情報が含まれています。
(1)原子情報(@<TRIPOS>ATOM 情報)
・原子 ID
:1からの通し番号。
・原子名
:原子名。1、2文字目は元素記号です。
・座標
:カーテシアン座標での座標。
・原子タイプ
:Sybyl の原子タイプ。
・サブ構造 ID
:その原子を含むサブ構造の ID。
<tplgeneL では使用しません。>
・サブ構造名
:その原子を含むサブ構造名。
<tplgeneL では使用しません。>
・電荷
:各原子の電荷情報。
・status bit
:Sybyl 固有のステータス情報。
<tplgeneL では使用しません。>
(2)結合情報(@<TRIPOS>BOND 情報)
・結合 ID
:1からの通し番号。
・原子 ID1
:結合している原子1の番号(上記の原子情報の原子 ID と一致)。
・原子 ID2
:結合している原子2の番号(上記の原子情報の原子 ID と一致)。
・結合タイプ
:結合のタイプ(1、2、3、am、ar、du、un、nc)。
・status bit
:Sybyl 固有のステータス情報。
<tplgeneL では使用しません。>
【参照】Sybyl mol2 形式ファイルの書式については、以下を参照。
Tripos Online Mol2 File Format
URL
http://www.tripos.com/custResources/mol2Files/index.html
myPresto 4.2
23
■Sybyl mol2 ファイルの例
@<TRIPOS>MOLECULE
methanol.mol2
6 5 0 0 0
SMALL
NO_CHARGES
@<TRIPOS>ATOM
1 C
0.7253
0.0134
0.0001 C.3
1
<1>
-0.1320
2 O
-0.6859
-0.0645
-0.0000 O.3
1
<1>
-0.7323
3 H
1.0981
1.0651
0.0186 H
1
<1>
0.1340
4 H
1.0901
-0.5342
0.9059 H
1
<1>
0.1653
5 H
1.0900
-0.5012
-0.9251 H
1
<1>
0.1644
6 H
-1.0287
0.8351
0.0005 H
1
<1>
0.4006
@<TRIPOS>BOND
1
1
2
1
2
1
3
1
3
1
4
1
4
1
5
1
5
2
6
1
myPresto 4.2
24
【補足】tplgeneL における mol2 形式ファイル読み込み処理について
・tplgeneL が参照する mol2 形式ファイルの情報
tplgeneL では、@<TRIPOS>MOLECULE 情報は参照しません。
指定された mol2 形式ファイルから、
@<TRIPOS>ATOM
:
@<TRIPOS>BOND
:
に記述された ATOM、BOND 情報のみを取得して処理を行います。したがって、
・ATOM、BOND 部分の記述において、書式にエラーがある場合、tplgeneL はエラーメッセー
ジを表示して終了します。
・ATOM、BOND 以外の@<TRIPOS>で書式にエラーがあっても、処理は継続されます。
・ATOM、BOND 項の status bit の扱いについて
MOL2 ファイル中の status bit は SYBYL 内部で指定されるものです。
有効なステータスビットは以下の様になっていますが、この項目はユーザが設定するもの
ではありませんので、tplgeneL ではこの項目のエラーチェックは行っていません。
(参考)ATOM 有効ステータスビット
DSPMOD、TYPECOL、CAP、BACKBONE、DICT、ESSENTIAL、WATER、DIRECT
(参考)BOND 有効ステータスビット
TYPECOL、GROUP、CAP、BACKBONE、DICT、INTERRES
・結合のタイプの扱いについて
MOL2 ファイルで定義されている結合のタイプは以下に示すものがあります。
1
= single
2
= double
3
= triple
am = amide
ar = aromatic
du = dummy
un = unknown
nc = not connected
myPresto 4.2
25
tplgeneL では、結合のタイプ"am"が指定されている場合には、内部的にはその結合を単
結合として処理を行います。同様に、タイプ"ar"が指定されている場合には、内部的に芳
香族結合として処理を行います。
タイプ"du"、"un"、"nc"が指定されている場合には、tplgeneL では処理を行うことがで
きません。エラーメッセージを出力し、プログラムを終了します。
myPresto 4.2
26
【エラーメッセージとその原因】
項番
1.
2.
3.
エラーメッセージ
エラー原因
ERROR> ltgReadMOParmMol2
継続記号の次行1文字目に”@”,”#”が存在する。
Contents Error : filename.mol2
Start of next line must not begin with "@" or "#",
if line is continued with a back slash "¥".
Please check following information.
(エラー付近のデータ)
ERROR> ltgReadMOParmMol2
行の1文字目以外に、"@", "#" が存在する。
Contents Error : filename.mol2
It is necessary to describe sign "@" and "#" in column
1 of the line.
Please check following information.
(エラー付近のデータ)
ATOM 項について、
継続記号のあとにデータが続いている。
ERROR> ltgReadMOParmMol2
1 項目め(原子ID)が数字以外の文字含む
Contents Error : filename.mol
2 項目め(原子名)の1 文字目が数字
Atom format is wrong.
3 項目め(x 座標)が数字、"-"、"."以外の文字含む
Please check following information.
4 項目め(y 座標)が数字、"-"、"."以外の文字含む
(エラー付近のデータ)
5 項目め(z 座標)が数字、"-"、"."以外の文字含む
6 項目め(原子タイプ)の1 文字目が数字
7 項目め(サブ構造ID)に数字以外の文字含む
9 項目め(原子タイプ)が数字以外の文字含む
または、
項目数が、6 個より少ない、または、10 個より多
く記述されている。
BOND 項について、
継続記号のあとにデータが続いている。
1 項目め(結合ID)が文字列を含む
2 項目め(原子ID)が文字列を含む
3 項目め(原子ID)が文字列を含む
項目数が、4 個より少ない、または、5個より多く
記述されている。
ERROR> ltgReadMOParmMol2
BOND 項の4 項目め(結合のタイプ)が、MOL2 ファイル
Contents Error!
フォーマットで定義されていない文字列が指定され
The Bondtype ("結合のタイプ ") that Mol2 Format does ている。
not support is found.
Please check following information.
(エラー付近のデータ)
ERROR> ltgReadMOParmMol2
BOND 項の4 項目め(結合のタイプ)が、MOL2 ファイル
Contents Error!
フォーマットで定義されているが、tplgeneL でサポ
The Bondtype ("結合のタイプ") that tplgeneL does not ートしていない結合のタイプ(du、un、nc)が指定さ
support is found.
れている。
Please check and modify following information.
(エラー付近のデータ)
ERROR> ltgReadMOParmMol2
ATOM 行または BOND 行がない
File Format Error : *.mol2
File Format is not correct.
ERROR> ltgReadMOParmMol2
Contents Error : filename.mol
Bond format is wrong.
Please check following information.
(エラー付近のデータ)
4.
5.
6.
myPresto 4.2
27
項番
7.
8.
9.
エラーメッセージ
ERROR> ltgDefineBond
Contents Error!
Isolated Atom ("原子名") that it has not any Bond
is detected in Input File.
Please check Input Files. : *.bond or *.mol2.
ERROR> ltgReadMOParmMol2
Contents Error!
Bond information does not match to Atom information.
Please check mol2 file "filename.mol2 ".
ERROR> ltgDefineBond
Contents Error!
The Bond Information is overlapped. : (重複してい
る原子の組)
Please confirm Input Files. : *.bond or *.mol2.
エラー原因
ATOM 項とBOND 項の整合性が取れていない
ATOM 項が多い
ATOM 項とBOND 項の整合性が取れていない
BOND 項が多い
BOND 項に同じ原子の組が複数回記述されている。
myPresto 4.2
28
3.3
原子タイプ定義ファイル
tplgeneL では、まず始めに計算したい分子の各々の原子の原子タイプを割り当て、次に
各原子タイプの組に対応する力場のパラメータを割り当てます。
原子タイプ定義ファイルには、各原子の環境(元素記号、その原子の結合の数、結合次数、
環内原子か否か、芳香族原子か否か)毎に対応する原子タイプ情報が記述されています。
tplgeneL には以下の 2 種類の力場の原子タイプ定義ファイルを用意しています。
原子タイプ定義ファイル
atomtype_gaff.db
AMBER GAFF 力場用原子タイプ割り当て規則 DB ファイル
atomtype_amber99.db
AMBER parm99 力場用原子タイプ割り当て規則 DB ファイル
3.4
力場パラメータデータベースファイル
tplgeneL では、「3.2.3 原子タイプ定義ファイル」で割り当てた原子タイプに基づいて、
力場パラメータを割り当てます。
力場パラメータデータベースは、原子タイプ毎の結合パラメータ、結合角パラメータ、
二面角パラメータ、インプロパー二面角パラメータ情報が記述されている"prm_XXXX.db"フ
ァイル、及び、ファンクションパラメータ、ノンボンドパラメータが 記述されている
"nonbond_XXXX.db"ファイルで構成されています。
現在、力場パラメータデータベースファイルとして AMBER parm99 用のものと、AMBER GAFF
用のものを用意しています。
力場パラメータデータベースファイル
prm_gaff.db
AMBER GAFF 力場用パラメータ DB ファイル
prm_amber99.db
AMBER parm99 力場用パラメータ DB ファイル
nonbond_gaff.db
AMBER GAFF 力場用ノンボンドパラメータ DB ファイル
nonbond_amber99.db
AMBER parm99 力場用ノンボンドパラメータ DB ファイル
【補足】AMBER GAFF パラメータについて
tplgeneL では AMBER ver.7 GAFF(GAFF7)と AMBER ver.8 GAFF(GAFF8)パラメータで計算を
行う事ができます。GAFF7 ではほとんどの低分子で計算が可能となっています。GAFF8 は
myPresto 4.2
29
GAFF7 よりも計算できる分子は少ないが、正確な構造が計算できる事があります。
現在の仕様では GAFF7 と GAFF8 を同時に使用する事ができません。力場パラメータ DB デ
ィレクトリ内の必要なファイルをコピーして使用して下さい。
なお、初期設定では GAFF7 の計算を行う事ができます。
GAFF8 関連ファイル
atomtype_gaff8.db、 prm_gaff8.db、 nonbond_gaff8.db
GAFF7 関連ファイル
atomtype_gaff7.db、 prm_gaff7.db、 nonbond_gaff7.db
例)ファイルのコピーについて
以下のコマンドで、必要な各ファイルのコピーを行ってください。
GAFF8 パラメータを使用する場合
cp prm_gaff8.db prm_gaff.db
cp atom_type_gaff8.db atom_type_gaff.db
cp nonbond_gaff8.db nonbond_gaff.db
GAFF7 パラメータを使用する場合
cp prm_gaff7.db prm_gaff.db
cp atom_type_gaff7.db atom_type_gaff.db
cp nonbond_gaff7.db nonbond_gaff.db
myPresto 4.2
30
3.5
フラグメントデータベースファイル
tplgeneL では、
「3.2.4 力場データベースファイル」で説明した AMBER 由来のパラメータ
を割り当てる他に、分子の一部分をフラグメントと見なし、そのフラグメント部分にユー
ザ独自のパラメータを割り振ることができます。
フラグメントデータベースファイルには、登録されているフラグメント(フラグメント
ブロック)毎に、以下の情報が書かれています。
(1) フラグメント部分の原子パラメータ情報
(2) フラグメント部分の結合パラメータ情報
(3) フラグメント部分の結合角パラメータ情報
(4) フラグメント部分の二面角パラメータ情報
(5) フラグメント部分のインプロパー二面角パラメータ情報
フラグメントデータベースファイルを使用する場合には、上記の項目のうち、1、2は
必須となっています。3∼5は登録されている場合にはそのパラメータを使用します。
tplgeneL には以下の 2 種類の力場のフラグメントデータベースファイルを用意していま
す。
フラグメントデータベースファイル
frg_gaff.db
AMBER GAFF 力場用フラグメントデータベースファイル
frg_amber99.db
AMBER parm99 力場用フラグメントデータベースファイル
myPresto 4.2
31
3.6
環境変数
対象分子の構造に関するデータ、使用する力場、出力ファイルを保存するディレクトリ
をそれぞれ分けたい場合には、それらのパスを環境変数で指定することができます。
環境変数は以下の 3 種類を設定することができます。環境変数を設定しない場合には、
実行時のカレントディレクトリを参照します。
■環境変数について
環境変数名
TPLL_INPUT_PATH
説明
:tplgeneL 入力ファイル用ディレクトリ(パスを含めて記述する)
TPLL_OUTPUT_PATH :tplgeneL 出力ファイル用ディレクトリ(同上)
TPLL_DB_PATH
:tplgeneL 力場パラメータ DB 用ディレクトリ(同上)
(設定例)
tplgeneL 力場パラメータ DB 用ディレクトリを"/home/user01/myPresto/tplgeneL/DB"と
する場合。
環境変数の設定は、使用しているシェルの設定方法に従います。
(下線部が入力部分です)
(1)bash の場合
% export TPLL_DB_PATH=/home/user01/myPresto/tplgeneL/DB
(2)csh の場合
% setenv TPLL_DB_PATH /home/user01/myPresto/tplgeneL/DB
※環境変数で設定するディレクトリへのパスが固定される場合は、ログインスクリプト
(.bashrc, .cshrc)や専用スクリプトに書き込んでおくと便利です。
なお、現在使用しているシェルは以下のコマンドで確認できます。
% ps
myPresto 4.2
32
(余白)
myPresto 4.2
33
4 cosgene
4.1
実行方法
cosgene は、tplgene や tplgeneL によって準備した分子の初期座標やトポロジーファイ
ルなど、計算対象の系の分子情報を入力として、系のエネルギー最小化や MD 計算を行いま
す。計算結果は、解析ツールを使用して解析することができます。
初期座標やトポロジーファイル、計算条件などの分子情報は、コントロールファイルで
指定します。cosgene はコントロールファイルを標準入力より読み込んで動作します。
% cosgene
4.2
<
control_file
> output
4.2.1
入力データの作成
コントロールファイル
コントロールファイルは、以下のグループからなり、各グループは "QUIT" で終了します。
・EXE> INPUT グループ
:主な入力ファイル名を指定します。
・EXE> MINI グループ
:エネルギー最小化のオプションを指定します。
・EXE> MD グループ
:MD を行うためのオプションを指定します。
・EXE> OUTPUT グループ :最終結果の出力を指定します。
・EXE> END
:コントロールファイルの終わりを示します。
EXE> INPUT
TOPOLOGY= FORM
COORDINA= PDB
NAMETO= thrp.tpl
;トポロジーファイル
NAMECO= thrp.pdb
;初期座標
QUIT
EXE> MINI
METHOD=
CONJ
LOOPLI=
CUTMET=
40
RESA
UPDATE= 20
CUTLEN= 8.0D0
;共役勾配法でエネルギー最小化を行う
;40 回計算し、20 回ごとに相互作用テーブルを更新する。
;相互作用 CUTOFF 長を 8A とする。
DIEFUN=
DIST
DIEVAL= 2.0D0
;距離依存誘電率を使用する。
QUIT
EXE> OUTPUT
COORDINATE= PDB
NAMECO=
thrp_mini.pdb
;PDB 書式の最終構造
QUIT
EXE> END
エネルギー最小化の場合のコントロールファイルの例
myPresto 4.2
34
EXE> INPUT
TOPOLOGY=
COORDINA=
FORM
NAMETO=
serp.tpl
;トポロジーファイル
PDB
NAMECO=
serp.pdb
;初期座標
QUIT
EXE> MD
LOOPLI=
20000
;MD のステップ回数
UPDATE=
TIMEST=
20
0.5D0
;相互作用テーブルの更新頻度
;時間積分のタイムステップ
METHOD=
CANONICAL
;NVT カノニカル MD
SETTEM=
INITIA=
300.0D0
;設定温度
SET
STARTT=
300.0D0
RANDOM=
654321
CUTMET=
DIEFUN=
RESA
CONS
CUTLEN=
DIEVAL=
PDB
NAMECO=
10.0D0
1.0D0
;初期温度の設定
;エネルギーCUTOFF の指定
;誘電率
QUIT
EXE> OUTPUT
COORDINATE=
serp_md_1p.pdb
;PDB 書式の最終構造
QUIT
EXE> END
MD の場合のコントロールファイルの例
コントロールファイルの各コマンド説明
myPresto 4.2
必須
◎
省略可
△
特定機能をユーザ指定するとき必須
○
35
4.2.1.1 EXE> INPUT
グループ
INPUT グループでは、トポロジーファイル、初期座標、各種拘束・モニター対象の原子の
指定などのために、それらの外部ファイルの指定を行います(各外部ファイルの書式は、
巻末「A
ファイル書式」を参照)。これら INPUT グループの入力は "EXE> MIN"、"EXE> MD"
に共通で使用されます。
INPUT グループでの指定事項:
(1)系のトポロジーの指定
(2)系の座標の指定
(3)SHAKE 対象原子と拘束距離の指定
(4)固定原子(fix atom)・自由原子の指定
(5)CAP ポテンシャルの指定
(6)拡張 CAP ポテンシャルの指定
(7)RMSD を計算するときの指定(MIN、MD 使用時)
(8)位置拘束の指定
(9)原子間距離拘束の指定
(10)二面角拘束の指定
(11)モニター対象の指定
(12)系の GB/SA 及び ASA 用パラメータの指定
(13)Umbrella 拘束の指定
(14)系の重心あわせの指定
(15)QUIT
(1)系のトポロジーの指定
TOPOLOgy:トポロジーファイルの書式(◎)
=NOREad ;トポロジーファイル入力なし(デフォルト)
=FORMAtted
;書式つきアスキーファイル
=BINAry ;バイナリーファイル
UNITTOpology:トポロジーファイルの IO unit(△)
=10
;(デフォルト)
NAMETOpology=(トポロジーファイル名、133 文字以内 。TOPOLOgy=[FORM│BINA]のとき)
(2)系の座標の指定
COORDInate:PDB 書式3次元座標ファイルの書式(◎)
=NOREad ;座標入力なし(デフォルト)
=PDB
;PDB ファイルフォーマット
myPresto 4.2
36
=BINAry ;バイナリーファイル
UNITCOordiante:座標ファイルの IO unit(△)
=11
;(デフォルト)
NAMECOordinate=(座標ファイル名、133 文字以内。COORD=[PDB│BINA]のとき)
(3)SHAKE/RATTLE 対象原子と拘束距離の指定
SHAKE/RATTLE を使用する場合は、対象原子の原子番号と拘束距離をファイルで指定する方
法と、それらの情報を自動的に作成する方法があります。ファイルには通常の2原子間の
距離の拘束のほかに、3原子による三角形(CH2 , H 2 O)および4原子による四面体(CH3 , NH3 )
のトポロジーでの距離の拘束を特別に指定することができます。SHAKE/RATTLE の自動作成
は以下の方法で行われます。
(a)水分子以外場合(分子名が"WAT"でない場合)
水素でない原子に対し 1∼3 つの水素原子が共有結合している場合に、これらの原子
間距離を計算し、それぞれ 2∼4 原子の SHAKE/RATTLE 情報として設定します。
(b)水分子の場合(分子名が"WAT"の場合)
プログラム内部に保持している水の結合距離を基に 3 原子の SHAKE/RATTLE 情報とし
て設定します。
(3−1)SHAKE/RATTLE 情報入力指定
SETSHAke:SHAKE/RATTLE を適用する原子を指定するファイルを読む(○)
=NOREad ;SHAKE/RATTLE を使用しない(デフォルト)
=READ
;SHAKE/RATTLE を使用する
=AUTO
;SHAKE/RATTLE 情報を自動作成する
UNITSHake:SHAKE 指定ファイルの IO Unit(△)
=12
;(デフォルト)
NAMESHake=(SHAKE ファイル名、133 文字以内(△))
【注意】SHAKE/RATTLE を使用する場合には、ほかに EXE> MD ないし EXE> MIN グループに
"SHAKEMethod= [HBON │ ALLB]"を指定します。
【注意】SHAKE/RATTLE は、適用範囲に制限があります。
SHAKE/RATTLE の適用範囲
SHAKE
RATTLE
エネルギー最小化
最急降下法
(METHOD=STEEP)
○
×
(EXE> MIN)
共役勾配法
(METHOD=CONJ)
×
×
MD 計算
Leap Frog Verlet(INTEGR=LEAP) ○
×
(EXE> MD)
Velocity-Verlet (INTEGR=VELO) ×
○
Multi Time Step (INTEGR=MTS)
×
myPresto 4.2
×
37
(3−2)SHAKE/RATTLE 自動作成情報出力指定
SHAKE/RATTLE 情報を自動作成した場合、作成された情報をファイル出力することができ
ます。出力されるファイルの書式は入力ファイルと同じです。
DBGSHA:SHAKE/RATTLE 自動作成情報出力指定(△)
=NOWRite :ファイル出力しない(デフォルト)
=ASCIi
:ファイル出力する
UNITDS:SHAKE/RATTLE 自動作成情報ファイルの IO unit(△)
=84
:(デフォルト)
NAMEDS =( SHAKE/RATTLE 自動作成情報ファイル名、133 文字以内。)
(4)固定原子(fix atom)・自由原子の指定
固定原子指定は、指定した原子を MIN/MD 計算の対象から外し力場を与える点として扱いま
す。自由原子は通常の MIN/MD 計算の対象となる原子です。固定すべき原子番号を指定する
か、または特定の中心と半径 R1,R2 を指定し、中心からの距離 R が R1 < R < R2 内となる
原子を指定することができます。そのための指定ファイルが必要です。同様に自由原子の
指定が行われます。この指定がなければ、系の原子はすべて自由原子として扱われます。
SETVARiables=:固定原子・自由原子指定ファイルの書式(△)
=NOREad ;固定原子指定なし(デフォルト)
=READ
;固定原子指定あり
UNITVAribles:固定原子指定ファイルの IO unit(△)
=13
;(デフォルト)
NAMEVAriables =(固定原子指定ファイル名、133 文字以内。)
(5)CAP ポテンシャルの指定
CAP ポテンシャルを適用する原子と CAP の中心の座標、半径・力の定数を指定します。CAP
指定ファイルに原子を指定、中心座標などは CAP 指定ファイルでもコントロールファイル
でも指定できますが、コントロールファイルの入力が優先されます。
SETBOUndary:CAP ポテンシャルを適用する原子と CAP の半径・力の定数を指定(○)
=NOREad ;CAP を使用しない(デフォルト)
=READ
;CAP を使用する
UNITBOundary:CAP 指定ファイルの IO Unit(△)
=14
;(デフォルト)
myPresto 4.2
38
NAMEBOundary=(CAP 指定ファイルの名前、133 文字以内(○))
【注意】EXE> MD に "CALCAP=CALC" を加え、更に CAP パラメーターの指定を加えること。
また、"STOPCE=[TRAN│BOTH]" を指定し、系の第1チェイン(先頭分子)を空間に固定する
ことで CAP ポテンシャルが第1チェインから外れないようにするのが望ましい。
(6)拡張 CAP ポテンシャルの指定
拡張 CAP ポテンシャルを適用する原子と拘束範囲、力の定数を指定します。拘束範囲は
球体および楕円体を指定できます。
SETEXtendCap:拡張 CAP ポテンシャルを適用する原子と拘束範囲、力の係数を指定(○)
=NOREad
;拡張 CAP を使用しない(デフォルト)
=READ
;拡張 CAP を使用する
UNITExtendCap:拡張 CAP 指定ファイルの IO Unit(△)
=23
;(デフォルト)
NAMEExtendCap=(拡張 CAP 指定ファイルの名前、133 文字以内(○))
【注意】EXE> MD に "EXTCAP=CALC" を加えること。また、"STOPCE=[TRAN│BOTH]" を指定し、
系の第1チェイン(先頭分子)を空間に固定することで CAP ポテンシャルが第1チェイン
から外れないようにするのが望ましい。
(7)RMSD を計算するときの指定(MIN、MD 使用時)
REFCOOrdinate:参照ファイル。基準となる PDB 書式の座標ファイル(○)
=NOREad
;使用しない(デフォルト)
=PDB
;使用する
UNITREfcoordi:参照ファイルの IO Unit(△)
=15
;(デフォルト)
NAMEREFcoordi=(参照ファイルのファイル名、133 文字以内)
【注意】RMSD 計算時には、EXE>MD ないし EXE>MIN に”BESTFIt=YES”を加える。
(8)位置拘束の指定
位置拘束を使用するには、次の2つのファイルの準備が必要です。
・拘束の対象原子の指定と力の定数に関する情報を記載した拘束指定ファイル
・拘束する座標を記載した PDB 形式の参照ファイル
myPresto 4.2
39
REFCOOrdinate:参照ファイル、RMSD の時と同じ(○)
=NOREad ;使用しない(デフォルト)
=PDB
;使用する
UNITREfcoordi:参照ファイルの IO Unit(△)
=15
;(デフォルト)
NAMEREFcoordi=(参照ファイルのファイル名、133 文字以内(○))
POSITIonrestrain:対象原子、力の定数などの指定(○)
=NOREad ;使用しない(デフォルト)
=READ
;使用する
UNITPOsition:拘束対象指定ファイルの IO Unit
=16
;(デフォルト)(△)
NAMEPOsition=(拘束指定ファイルの名前、133 文字以内(○))
【注意】更に、EXE> MIN ないし EXE> MD に”CALPSR=CALC”と位置拘束用パラメーターの指
定が必要です。
(9)原子間距離拘束の指定
原子間距離拘束指定ファイルを用意します。
DISTANcerestrain:原子間距離拘束を用いる
=NOREad ;適用しない(デフォルト)
=READ
;適用する
UNITDIstance:距離指定ファイルの IO Unit
=17
;(デフォルト)(△)
NAMEDIstance=(原子間距離拘束指定ファイルの名前、133 文字以内)
【注意】更に EXE> MIN ないし EXE> MD に”CALDSR= CALC”と拘束ポテンシャルの重みパラ
メーターが必要です。
(10)二面角拘束の指定
二面角拘束指定ファイルを用意します。
DIHEDRalrestrain:2面角拘束を用いる
=NOREad ;適用しない(デフォルト)
=READ
;適用する
myPresto 4.2
40
UNITDH:2面角拘束指定ファイルの IO Unit
=18
;(デフォルト)(△)
NAMEDH=(2面角拘束指定ファイルの名前、133 文字以内)
【注意】更に EXE> MIN ないし EXE> MD に”CALDHR= CALC”と拘束ポテンシャルの重みパラ
メーターが必要です。
(11)モニター対象の指定
特定原子の座標、原子間距離、角度、二面角などを MD の実行中にリアルタイムでモニター
し、ファイルに出力する。対象とする原子、原子の対を指定するファイルを準備する。
OUTMONitoritems:モニター情報指定ファイル
=NOREad ;適用しない(デフォルト)
=READ
;適用する。
UNITMO:モニター指定ファイルの IO Unit
=19
;(デフォルト)(△)
NAMEMO=(モニター指定ファイルの名前、133 文字以内(○))
【注意】EXE> MD に、下記事項を設定する。
OUTTRJ= n
:出力をnステップ毎に行う
NAMETR= (モニター情報出力ファイル)
MNTRTR= [ASCI │ BINAry]
:出力形式
(12)系の GB/SA 及び ASA 用パラメータの指定
ASAREA:GB/SA 及び ASA 用パラメータ指定ファイル(○)
=NOREad ;ファイル入力なし(デフォルト)
=READ
;ファイル入力
UNITSA:GB/SA 及び ASA 用パラメータファイルの I/O unit(△)
=77
;(デフォルト)(△)
NAMESA=(GB/SA 及び ASA 用パラメータ指定ファイルの名前、133 文字以内(○))
【注意】GB/SA 及び ASA 用パラメータファイルは、専用ツールによって生成できます。ファ
イルには各原子の半径や、atomic solvation parameter などを指定します(指定方法は、
myPresto 4.2
41
巻末「A ファイル書式」を参照)。
(13)Umbrella 拘束の指定
UMBREL:Umbrella 拘束ファイル(○)
=NOREad ;適用しない(デフォルト)
=READ
;適用する
UNITUI:Umbrella 拘束ファイルの I/O unit(△)
=22
;(デフォルト)(△)
NAMEUI=(Umbrella 拘束ファイルの名前、133 文字以内(○))
【注意】Umbrella 拘束ファイルは、Filling Potential 法を適用した場合に使用します。
(指定方法は、巻末「A ファイル書式」を参照)。
(14)系の重心あわせの指定
SETORIgin:系の重心を座標の原点に置く。
=NO
;適用しない(デフォルト)
=YES
;適用する
(15)QUIT
EXE>グループの入力の終わりを示す。
myPresto 4.2
42
4.2.1.2 EXE> MINimize
グループ
ここでは、エネルギー最小化に必要な、方法、収束条件、計算結果の出力、計算に用い
るエネルギー項の指定、境界条件・拘束条件の指定を行います。
エネルギー計算に関する指定のほとんどは、EXE> MD グループと共通です。
MIN/MD 入力事項表
MIN
MD
1
エネルギー最小化制御パラメーター(STEEP/CONJ 共通)
○
1−1
最急降下法(STEEP)での制御パラメーター
○
1−2
共役勾配法(CONJ)での制御パラメーター
○
1−3
計算結果の出力指定(STEEP/CONJ 共通)
○
1
MD 制御パラメーター
○
1−1
計算上限の設定
○
1−2
MD のタイムステップとループ回数の指定
○
1−3
MD 計算の種類
○
1−4
拡張アンサンブル
○
1−5
温度設定
○
1−6
MD 計算条件
○
1−7
ジョブのリスタート設定
○
1−8
計算結果の出力指定
○
2
解析用データ出力(エネルギー変化)
2
解析用データ出力(トラジェクトリー、パラメーター)
3
エネルギー計算に関する制御パラメーター
○
○
3−1
相互作用 CUTOFF の方法
○
○
3−2
相互作用計算のスイッチ
○
○
3−3
Filling Potential 法
4
拘束条件の指定
○
○
4−1
SHAKE/RATTLE の指定
○
○
4−2
剛体モデルの指定
5
PME, Ewald, FMM の指定
○
○
6
溶媒効果
○
○
7
境界条件
○
○
8
LIST
○
○
9
QUIT
○
○
myPresto 4.2
○
○
○
○
43
(1)エネルギー最小化制御パラメーター(STEEP/CONJ 共通)
METHODofmini:エネルギー最小化の方法(◎)
=STEEpest
;最急降下法(デフォルト)
=CONJugate
;共役勾配法
CPUTIMelimit:CPU
=60.0
time の上限(秒)(○)
;(デフォルト)
LOOPLImit:エネルギー最小化サイクル数。
0 のときは初期座標のエネルギー計算のみ行う。(○)
=0
;(デフォルト)
UPDATEinterval:座標情報の更新サイクル。(△)
1-5 相互作用エネルギーに CUTOFF が用いられている場合、相互作用テーブルの更新サイク
ルを指定する。周期境界条件の場合は、ユニットセルから飛び出した原子の座標をユニッ
トセル内に補正する計算の更新サイクルを指定する。
=20
;(デフォルト)
CONVGRadient:収束判定条件。(△)
root mean square summation of force (R.M.S.F.) が指定の値より小さい場合、収束した
と判定し計算を終了する。単位(kcal/mol/A)。
=0.1
;(デフォルト)
ISTEPLength:最初のステップでの原子の移動距離(初期座標との R.M.S.D.(A))
=0.01
;(デフォルト)(△)
(1−1)最急降下法(STEEP)での制御パラメーター
最急降下法でのステップ長のパラメーターを設定します。
UPRATE:前のステップでよりエネルギーの低い構造を得ることができていれば、ステ
ップ長に UPRATE をかけて移動距離を伸ばす。
=1.2
;(デフォルト)
DOWNRAte:前のステップでエネルギーが高くなっているなら、ステップ長に DOWNRATE
をかけて移動距離を短くする。
=0.6:
;(デフォルト)
(1−2)共役勾配法(CONJ)での制御パラメーター
myPresto 4.2
44
共役勾配法での探索パラメーターを設定します。
LINESEarchlimit:Line search のループ回数。あまり小さくしないこと。
=10
;(デフォルト)
CONVLInesearch:Line search の収束判定の閾値。
( DIRGRD / DIRGRS ) ≦ CONVL に達すると収束したとみなす。
=0.1
DIRGRD
:
Current Directional Derivative.
DIRGRS
:
Initial Directional Derivative.
;(デフォルト)
(1−3)計算結果の出力指定(STEEP/CONJ 共通)
MONITOrinterval:標準出力の出力サイクル
エネルギー、RMSD などの出力を行うサイクルを指定する。(△)
=10
;(デフォルト)
LOGFORmat:標準出力の書式(△)
=SHORt
;1行 80 文字以内の簡易出力(デフォルト)
=DETAil ;1行 80 文字以内の詳細出力。各エネルギーを追加。
BESTFItmini:エネルギー最小化での、参照構造に対する系の第1チェインの RMSD の
変化を標準出力する。参照構造は、EXE> INPUT フェーズにて "REFCOORD",
"NAMERE" を指定する必要がある。(△)
=NO
;計算しない(デフォルト)
=YES
;計算する。
(2)解析用データ出力(エネルギー変化)
エネルギー最小化のステップ毎に、各エネルギーをファイルに出力します。
MIN エネルギートラジェクトリ
NAMEAN=(MIN エネルギートラジェクトリのファイルの名前)
UNITAN:MIN エネルギートラジェクトリのファイルの IO Unit
=30
;(デフォルト)
【注意】MIN エネルギートラジェクトリは、各ステップごとに出力されます。
(3)エネルギー計算に関する制御パラメーター(STEEP/CONJ 共通)
myPresto 4.2
45
(3−1)相互作用 CUTOFF の方法
CUTMEThod:相互作用 CUTOFF の方法
=RESC
;residue base cutoff(デフォルト)
残基の重心間の距離が、CUTOFF 長以下なら残基に含まれる全原子間の相互作用を計算する。
=ATOM
;atom base cutoff
原子重心間の距離が、CUTOFF 長以下なら原子間の相互作用を計算する。
=RESA
;residue base cutoff
残基に含まれる2原子間の最短の距離が、CUTOFF 長以下なら残基に含まれる全原子間の相
互作用を計算する。
【注意】通常(周期境界条件でない場合)は RESA が推奨される。周期境界条件では RESC
が推奨される。
CUTLENgth
=8.0
:cutoff 長(A)
;(デフォルト)
DIEFUNction:空間の比誘電率の形式
=CONS
;誘電率は定数 (デフォルト)
=DIST
;誘電率εは距離に比例する。ε=DIEVAL * 距離(A)
DIEVALue:空間の比誘電率
=1.0
;(デフォルト)
【注意】"DIEFUN=CONS"の場合は、通常"DIEVAL=1.0"を用いる。真空中で"DIEFUN=DIST"を
指定の場合、DIEVAL は 1.0∼4.0 程度の値とする。
USESPL
;スプライン補間の適用
=NO
;適用しない(デフォルト)
=YES
;適用する
CUT-ON
=6.0
;スプライン補間開始距離
;(デフォルト)
【注意】入力トポロジーが CHARMM ポテンシャルの場合、CHARMM によるスプライン補間を適
用する。
(3−2)相互作用計算のスイッチ
特定の相互作用を計算する(しない)場合に、以下のスイッチを用います。
myPresto 4.2
46
【注意】特に重要
・1-5 相互作用のスイッチでは、相互作用テーブルを用いる(CUTOFF を用いる)場合と相
互作用テーブルを用いない場合で、van der Waals/静電相互作用/水素結合のエネルギー計
算のスイッチを切り替える必要があります。
・拘束(CAP, position restraint など)を用いる場合、対応するエネルギー計算のスイッ
チを入れる必要があります。
(3−2−1)1-2、1-3、1-4 相互作用のスイッチ
通常の MIN/MD 計算では、すべてデフォルト値を用います。極めてまれですが、特定の相互
作用を計算したくない場合にのみ用います。
CALBONd:1-2 相互作用の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALANGle:1-3 相互作用の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALTORsion:torsion 相互作用の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALIMProper:improper torsion の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALV14:1-4 van der Waals の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALE14:1-4 静電相互作用の計算
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
(3−2−2)1-5 相互作用計算のスイッチ
CUTOFF を用いる計算(相互作用テーブルを用いる計算)をする場合と、CUTOFF を用いない
で全ての 1-5 相互作用を全原子対に対し計算(直接計算)する場合で、スイッチの指定を
切り替えます。デフォルトでは、CUTOFF を用いる場合に設定されています。通常,1-5 van der
Waals, 1 -5 静電相互作用、水素結合はすべて計算します(デフォルト)。極めてまれですが、
特定の相互作用を計算したくないときにスイッチを切り替えてください。水素結合(12-10
myPresto 4.2
47
ポテンシャル)を含まない力場を用いる場合は、スイッチ CALHYD の値に関わらず水素結合
は計算されません。PME 法および Ewald 法の使用時には、相互作用テーブルを使用してくだ
さい。
相互作用テーブルを使用する(CUTOFF を用いる)場合
以下の CALV15, CLAE15, CALHYD を=CALC に設定、 CALV5N, CALE5N, CALH5N を=NOCALC に設
定する。(デフォルト)
CALV15:1-5 van der Waals
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
CALE15:1-5 静電相互作用
=CALC
;計算する(デフォルト)
※PME/FMM のとき必須
=NOCAlc ;計算しない
CALHYD:水素結合
=CALC
;計算する(デフォルト)
=NOCAlc ;計算しない
相互作用テーブルを使用しない場合
以上の CALV15, CLAE15, CALHYD を=NOCALC に設定、 CALV5N, CALE5N, CALH5N を=CALC に設
定する。
【注意】この指定では、PME 法および Ewald 法、ソフトコアを用いた計算はできません。
CALV5N:1-5 van der Waals
=NOCAlc ;1-5 van der Waals を直接計算しない(デフォルト)
=CALC
;計算する
CALE5N:1-5 静電相互作用
=NOCAlc ;1-5 静電相互作用を直接計算しない(デフォルト)
=CALC
;計算する
CALH5N:水素結合
=NOCAlc ;水素結合を直接計算しない(デフォルト)
=CALC
;計算する
(3−2−3)拘束ポテンシャル
拘束用ポテンシャルはデフォルトでは全て NOCALC(計算しない)にセットされています。
myPresto 4.2
48
CAP 拘束、position restraint, distance/angle/torsion restraint、van der Waals 反発
項のソフトコア(soft repulsion)などを用いる場合、それぞれのエネルギー計算項を CALC
に設定してください。さらに,通常これらのポテンシャルは対象原子の指定(EXE>INPUT の
章を参照)と、力の定数などのパラメーターを必要とするため各々のパラメーターも入力
してください。
これらの拘束ポテンシャルはすべて、系全体のポテンシャルエネルギー項に加算されます。
CALPSR:position restraint
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
EXE>INPUT フェーズにて、以下を指定する。
POSITION=READ
NAMEPO=(position restraint 指定ファイル)
REFCOORD=PDB
NAMERE=(参照座標ファイル)
CALDSR:distance-restraint
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
EXE>INPUT フェーズにて、以下を指定する。
DISTANcerestrain =READ
NAMEDIstance=(distance restraint 指定ファイル)
CALDHR:dihedral-restraint
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
EXE>INPUT フェーズにて、以下を指定する。
DIHEDRalrestrain =READ
NAMEDH=(dihedral restraint 指定ファイル)
CALREP:simple repulsion
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
CALCAP:CAP 拘束
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
EXE>INPUT フェーズにて、以下を指定する。
SETBOUndary =READ
NAMEBOundary =(CAP boundary 指定ファイル)
myPresto 4.2
49
EXTCAP:拡張 CAP 拘束
=NOCAlc ;計算しない(デフォルト)
=CALC
;計算する
EXE>INPUT フェーズにて、以下を指定する。
SETEXC =READ
NAMEEC =(拡張 CAP 指定ファイル)
拘束ポテンシャルに必要なパラメーター
重み因子:Position,
Distance, Repulsion, Dihedral 拘束では、その拘束ポテンシャル
の堅さは、温度、重みなどによって決められます。これらパラメーターは系を拘束すれば
良い適当な堅さであれば十分なので、値に厳密にこだわる必要は通常はありません。
TEMPERature:拘束に用いる温度(K)(Position, Distance, Repulsion, Dihedral).
=300.0
;(デフォルト)(△)
WETDSR:distance restraint の重み
=1.0
;(デフォルト)
WETPSR:position restraint の重み
=5.0
;(デフォルト)
WETDHR:dihedral restraint の重み
=10.0
;(デフォルト)
Simple repulsion のパラメーター
WETREP:simple repulsion の重み
=1.0
;(デフォルト)
REPSCAle:van der Waals 半径のスケール因子
=1.0
;(デフォルト)
REPDELta:許容誤差
=1.0
;(デフォルト)
CAP 拘束のパラメーター
CAP 拘束では、CAP 拘束対象原子の指定ファイル(EXE>INPUT の章参照)、"CALCAP=CALC"の
指定以外に、CAP の中心、半径、壁を形成する反発ポテンシャルの型と力の係数についての
パラメーターが必要になります。デフォルト値はありますが、力の定数(FORCAP)以外の
パラメーターはユーザが指定するのが普通です。
myPresto 4.2
50
RADCAP:CAP 拘束の半径(A)。
(この半径の内側では拘束力は 0、外側ではポテンシャルで拘束されます)
=20.0
:(デフォルト)
FORCAP:CAP の壁を作る反発ポテンシャルの力の定数
=150.0
:(デフォルト)
FUNCAP:CAP の壁の反発ポテンシャルの形
=HARMonic
:2次関数パラボラポテンシャル(デフォルト)
F = 0.5 * FORCAP * ( R - RADCAP ) **2
ここで、R = ( チェインの重心 ) - ( CAP の中心 )。
=BIQUadratic
:4次関数型ポテンシャル
F = 0.25 * FORCAP * ( R**2 - RADCAP**2 ) **2
ここで、R = ( チェインの重心 ) - ( CAP の中心 )。
SETCEN:CAP の中心を系の第一チェインの重心にセットする。
=NO
:セットしない。中心は CENTRX/CENTRY/CENTRZ で指定する(デフォルト)
=YES
:セットする。CAP の中心をデカルト座標(A)で設定する。
CENTRX= 0.0
:(デフォルト)
CENTRY= 0.0
:(デフォルト)
CENTRZ= 0.0
:(デフォルト)
【注意】これらのパラメーターは、CAP 指定ファイルとコントロールファイルに重複して指
定が行われる場合、コントロールファイルの指定が優先します。
【注意】CAP ポテンシャルは、分子・残基の重心に適用されます。従って分子・残基が大き
い場合、重心が CAP 半径内にあっても、分子・残基に含まれる原子が CAP 半径の外に出て
いる場合があります。
拡張 CAP 拘束のパラメーター
拡張 CAP 拘束では、対象原子、対象範囲および力の係数の指定を全て拡張 CAP 指定ファイ
ルにより行 います 。制御ファイルからは拡張指定ファイル (EXE>INPUT の章参照)、
"EXTCAP=CALC"以外の指定は行いません。
(4)拘束条件の指定
(4−1)SHAKE/RATTLE の指定
SHAKE/RATTLE を使用する場合は、EXE>INPUT グループで対象原子の原子番号と拘束距離を
指定した SHAKE ファイルを指定します。さらに、EXE> MIN グループで、計算方法と収束条
件などを指定します。
myPresto 4.2
51
SHAKEMethod:SHAKE の方法の指定
=NOSHake
;SHAKE を行わない(デフォルト)
=HBON
;他の拘束と重ならない、独立した拘束として計算する。
=ALLB
;互いに関連しあう拘束すべてを反復法を用いて計算する。
COVSHK:SHAKE の収束判定条件の閾値。
( CBL - IBL ) / IBL がこの値以下であるとき SHAKE は収束したとする。
CBL:計算し修正した結合長、IBL:入力で指定した結合長
= 1.0D-6
;(デフォルト)(△)
LIMSHK:SHAKE の反復解法の反復回数の上限値
=1000
;(デフォルト)(△)
【注意】他の拘束との重なりがある、互いに関連しあう拘束条件を SHAKE ファイルに指定
した場合は、"SHAKEMethod= ALLB"を使用しなければなりません。
【注意】3原子による三角形および4原子による四面体のトポロジーでの特別な拘束は、
"SHAKEMethod= [HBON │ ALLB]"の指定に関わらず、反復法で計算します。
【注意】極度に歪みの大きい系では、SHAKE が収束せずに計算を中断する場合があります。
【注意】SHAKE/RATTLE は、適用範囲に制限があります。
SHAKE/RATTLE の適用範囲
SHAKE
RATTLE
エネルギー最小化
最急降下法
(METHOD=STEEP)
○
×
(EXE> MIN)
共役勾配法
(METHOD=CONJ)
×
×
MD 計算
Leap Frog Verlet(INTEGR=LEAP) ○
×
(EXE> MD)
Velocity-Verlet (INTEGR=VELO) ×
○
Multi Time Step (INTEGR=MTS)
×
×
(5)PME, Ewald, FMM の指定
(5−1)Particle Mesh Ewald 法, Ewald 法の指定
周期境界条件においては、1-5 静電相互作用の計算に PME(Particle Mesh Ewald)法、ま
たは、Ewald 法を用いることができます。使用できるのはどちらか一方だけです。
CALPME:PME 法を適用する。
=NOCALC:適用しない(デフォルト)
=CALC
:適用する
PMESPD:PME 法での計算間隔の調整。
myPresto 4.2
52
=NORM
:毎回計算する(デフォルト)
=HIGH
:座標情報の更新サイクル"UPDATE"と同期する
PMEUPD:PMESPD= HIGH の場合の計算方法。
=CUT
:カットオフ計算を使用する(デフォルト)
近距離相互作用のみを毎ステップ計算更新し、遠距離からの相互作用の計算は、座標情報
の更新サイクル"UPDATE"と同期する。
=RECI
:逆空間項計算を使用する
実空間の相互作用のみを毎ステップ計算更新し、波数空間からの相互作用の計算は、座標
情報の更新サイクル"UPDATE"と同期する。
【注意】PMEUPD オプションの推奨値は PMEUPD= CUT です。この方法には便宜的ですが保存
量の保存性は高い計算方法です。
【注意】PMEUPD= RECI による計算は、PMEUPD= CUT による計算に比べて保存量の保存性が
低下します。
CALEWA:Ewald 法を適用する。
=NOCALC:適用しない(デフォルト)
=CALC
:適用する
【注意】PME および Ewald 法では、以下の指定が必要です。
CALE15= CALC ; 近接原子は相互作用テーブルを用いた CUTOFF 法で計算します。
BOUNDA= PERI ; PME, Ewald は周期境界条件でないと使用できません。
DIEFUN= CONS ; PME, Ewald ではクーロン力の空間誘電率は定数でないといけません。
PME, Ewald の制御パラメーター
EWAPRM:PME, Ewald 法での Ewald パラメーター
実空間と逆空間の収束パラメータで、大きくすると実空間の収束が速くなり、小さく
すると逆空間の収束が速くなる。0.0∼1.0 で指定する。
= 0.35
;(デフォルト)
REATOL:Ewald 法の実空間でのカットオフに対する許容誤差(ε)
(erfc(βRcut) / Rcut < ε)
= 1.0d-19
;(デフォルト)
PME でのメッシュ数の指定
myPresto 4.2
53
MESHLX= 16
:X 軸方向(デフォルト)
MESHLY= 16
:Y 軸方向(デフォルト)
MESHLZ= 16
:Z 軸方向(デフォルト)
PMEORD:電荷分布をメッシュ点で代表するときのスプライン関数フィットの次数
=5
: EWAPRM = 0.35 のときの推奨値(デフォルト)
【注意】メッシュ数は、1Å程度でメッシュが切れるように指定するのが良い。
(5−2)Fast Multiple Method の指定
USEFMM:Fast Multipole 法の適用の有無
クーロン力をカットオフしない方法として Fast Multipole 法(FMM)を適用するか、し
ないかを指定する。周期境界条件でない場合に適用できる。
=NO
;FMM を適用しない(デフォルト)
=YES
;FMM を適用する。
FMMSPD:FMM 法での 1-5 静電相互作用の計算間隔の調整。
=NORM
:毎回計算する(デフォルト)
=HIGH
:座標情報の更新サイクル"UPDATE"と同期する
FMTREE:Fast Multipole 法の Tree の深さ
Fast Multipole 法の Tree の深さ。最小セルの個数は 8**FMTREE 個であり、最小セルに
原子が数個∼数十個含まれるように設定する。オーバーフローで停止する場合は、FMTREE
の値を大きくする。
= 3
;(デフォルト)
FMPOLE:Fast Multipole 法の多極子展開の次数
Fast Multipole 法の多極子展開の次数。FMPOLE が大きいと精度が上がるが速度は遅く
なる。しかし、速度に及ぼす影響は少ない。
= 8
;(デフォルト)
FMNUMA:Fast Multipole 法の最小セルに含まれる最大原子数
= 1000
;(デフォルト)
【注意】Fast Multipole 法の最小セル内に含まれる原子数が FMNUMA オプションで指定した
値を超えた場合はエラーとし、cosgene の実行を停止します。この場合は、FMTREE オプシ
ョンの値を増やすか、FMNUMA オプションの値を増やしてください。必ず DIEFUN=CONS を指
定してください。
(6)溶媒効果
myPresto 4.2
54
(6−1)Accessible Surface Area 法の指定
CALASA:ASA 法及び GB/SA 法での SA 法の適用
implicit water モデルで Accessible surface area 法を溶媒和の計算に適用する。
= NOCALC
= CALC
;適用しない(デフォルト)
;適用する
ASAPRO:プローブ半径
(Å)
ASA 法において溶媒水をプローブとする半径の設定。
通常水分子の半径として 1.4∼1.6 Å程度にとる。
= 1.4
;(デフォルト)
ASAWEI:ASA 重み
ASA 法において ASA 項のエネルギー項への寄与のスケール因子。
= 1.0
;(デフォルト)
ASACUT:ASA 用 cut off 長
(Å)
ASA 法において、ASA の重なりを判定するための原子間距離。
(原子半径+プローブ半径)×2より長くとるが、長くしすぎると計算速度が低
下する。
= 4.5
;(デフォルト)
【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。
(6−2)Generalized Born / Surface Area 法の指定
Generalized Born 法と Accessible surface area 法の両方の計算を同時に指定する(GB
法の計算"CAL-GB= CALC"と、ASA 法の計算"CALASA= CALC"の両方を指定する)ことによって、
GB/SA 法の計算を行います。
CAL-GB:Generalized Born 法の適用
implicit water モデルで Generalized Born 法を静電場の計算に適用する。
= NOCALC
= CALC
;適用しない(デフォルト)
;適用する
CALASA:GB/SA 法での SA 法の適用
implicit water モデルで Surface area 法を溶媒和の計算に適用する。
= NOCALC
= CALC
;適用しない(デフォルト)
;適用する
GBWELE:水の誘電率
myPresto 4.2
55
GB 法において溶媒水領域の比誘電率の設定。
温度によって変化するが 298K付近の誘電率をデフォルトに採用している。
= 78.3
;(デフォルト)
GBMELE:蛋白質の誘電率
GB 法において蛋白質領域の比誘電率の設定。
温度、蛋白質の種類によって変化するが通常 1∼4 程度にとる。
= 1.0
;(デフォルト)
GBDELT:Born 半径の補正値
(Å)
GB 法において Born 半径の補正値(Onufriev の論文で導入された"δ"に相当)。
計算に使用する Born 半径 = Born 半径 - GBDELT。
= 0.0
;(デフォルト)
GBOFFS:van der Waals 半径補正値
(Å)
GB 法において van der Waals 半径補正値。
計算に使用する van der Waals 半径 = van der Waals 半径 - GBOFFS。
= 0.09
;(デフォルト)
【注意】「Born 半径の補正値 "GBDELT"」は、Onufriev の論文で導入された"δ"に相当しま
す。Still,Hawkins の論文由来では"GBDELT=0.00"、Onufriev の論文由来では"GBDELT=0.15"
になります(論文については、巻末「参考文献)を参照)。
【注意】「van der Waals 半径補正値 "GBOFFS"」のデフォルト値は、Still WC の論文由来
です(論文については、巻末「参考文献)を参照)。
【注意】ASA 法と GB/SA 法の計算で用いている Atomic Solvation Parameter は、自動的に
切り替わります。
【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。
myPresto 4.2
56
(7)境界条件
myPresto で使用できる境界条件は、球・楕円体、周期境界条件(直方体6面体セル)です。
球・楕円体では、弾性衝突を実現する剛体壁が用いられます。中心の指定など一部変数は
共通の名前が使用されます。周期境界条件使用時は、ユニットセルへの座標引き戻しのサ
イクル(UPDATE)を忘れずに指定してください。CAP 拘束と異なり対象原子指定ファイルは
不要です。
BOUNDAry:境界条件の種類
=NO
;境界なし(デフォルト)
=PERI
;周期境界条件。
=ELLIPSoid
;楕円体境界
=SPHERE ;球境界
【注意】周期境界条件において、NO CUTOFF (CAL15N=CALC)は指定しないこと。また、CUTMET
の推奨値は RESC です。PME 法または Ewald 法は周期系で使用できますが、CUTOFF の指定が
必要です。
【注意】周期境界条件では、以下の場合に計算を中断することがあります。
・必要な相互作用計算のスイッチが OFF である。
・不自然に大きな力が発生した。
(初期座標の歪み、UPDATE の間隔が長い、time step が大きい、などが原因)
・残基の大きさと CUTOFF 距離の和が、セルサイズの半分より大きい。
(7−1)境界条件の中心の設定
周期系では、直方体ユニットセルの重心、球・楕円体ではそれらの重心を境界条件の中心
とします。
SETCEN:系の第一チェインの重心を境界条件の中心にする
=NO
:適用しない(デフォルト)。CENTRX/CENTRY/CENTRZ で指定する。
=YES :適用する
SETCEN=NO の場合、境界条件の中心をデカルト座標(A)で指定する。
CENTRX=
0.0
;(デフォルト)
CENTRY=
0.0
;(デフォルト)
CENTRZ=
0.0
;(デフォルト)
myPresto 4.2
57
(7−2)境界条件のサイズの設定
周期境界条件の場合:
ユニットセルの X 軸・Y 軸・Z 軸の長さ(A)を指定します。
LXCELL=
40.0
;(デフォルト)
LYCELL=
40.0
;(デフォルト)
LZCELL=
40.0
;(デフォルト)
楕円体の場合:
楕円は、長軸・短軸が、XYZ 座標方向に揃っているものとし、X 軸 Y 軸 Z 軸方向の半径(A)
を指定します。
ELLIPA=
30.0
;(デフォルト)
ELLIPB=
30.0
;(デフォルト)
ELLIPC=
30.0
;(デフォルト)
球の場合:
球の半径を指定します。
RADIUS=
30.0
;(デフォルト)
【注意】初期座標の原子のうち、1原子でも原子核の座標が境界の外にでればエラーとな
ります。分子・残基の重心ではないので注意。計算開始後、原子が境界の外に出る場合の
み、座標を修正し、境界の内部へ引き戻す処理をします。
(7−3)ユニットセルへの座標引き戻し方法の指定
周期系でのユニットセルへの座標引き戻しを、原子単位、残基単位、チェイン単位のい
ずれの方法で行うかを指定します。
REPLAC:座標引き戻し方法
=ATOM :原子単位(デフォルト)
=RESI :残基単位
=CHAI :チェイン単位
【注意】REPLAC オプションは、BOUNDA= PERI または HEXA のときのみ有効です。
【注意】残基ベースカットオフ(CUTMET= RESA または RESC)を使用し、REPLAC= ATOM と指
定した場合は、残基単位での座標引き戻しを行います。
myPresto 4.2
58
(8)LIST
「LIST」を書き加えれば、現在のパラメーター設定が表示されます。引数なし。
(9)QUIT
EXE>グループ入力の終了を示します。引数なし。
myPresto 4.2
59
4.2.1.3 EXE> MD グループ
MIN/MD 入力事項表
MIN
MD
1
エネルギー最小化制御パラメーター(STEEP/CONJ 共通)
○
1−1
最急降下法(STEEP)での制御パラメーター
○
1−2
共役勾配法(CONJ)での制御パラメーター
○
1−3
計算結果の出力指定(STEEP/CONJ 共通)
○
1
MD 制御パラメーター
○
1−1
計算上限の設定
○
1−2
MD のタイムステップとループ回数の指定
○
1−3
MD 計算の種類
○
1−4
拡張アンサンブル
○
1−5
温度設定
○
1−6
MD 計算条件
○
1−7
ジョブのリスタート設定
○
1−8
計算結果の出力指定
○
2
解析用データ出力(エネルギー変化)
2
解析用データ出力(トラジェクトリー、パラメーター)
3
エネルギー計算に関する制御パラメーター
○
○
3−1
相互作用 CUTOFF の方法
○
○
3−2
相互作用計算のスイッチ
○
○
3−3
Filling Potential 法
4
拘束の指定
○
○
4−1
SHAKE/RATTLE の指定
○
○
4−2
剛体モデルの指定
5
PME, Ewald, FMM の指定
○
○
6
溶媒効果
○
○
7
境界条件
○
○
8
LIST
○
○
9
QUIT
○
○
○
○
○
○
myPresto 4.2
60
(1)MD の制御パラメーター
(1−1)計算上限の設定
SETTIMelimit:シミュレーション時間の設定(ps)。
後述の「ループ回数(LOOPLI)×タイムステップ(TIMEST)」で得られる時間(ps)の値が
大きい場合、この時間で計算を打ち切る。(◎)
=5.0
;(デフォルト)
CPUTIMelimit:CPU 時間での上限(秒)(◎)
=60.0
;(デフォルト)
(1−2)MD のタイムステップとループ回数の指定
LOOPLImit:MD シミュレーションのループ回数(◎)
=0
;(デフォルト)
TIMESTep:タイムステップ(fs)。
通常は 0.5-1.0fs、系の全ての H に対し SHAKEまたは剛体モデルを使用する時には 1.0-2.0fs
に設定する。(◎)
=1.0
;(デフォルト)
(1−3)MD 計算の種類
(1−3−1)計算法:積分器
時間積分の方法を指定します。Multi time step(RESPA 法)を使用する場合は、さらに、
タイムステップの変化の方法を指定します。
INTEGR:時間積分の仕方
=LEAPfrog
;Leap-frog Verlet method(デフォルト)
=VELOcity
;Velocity-Verlet method
=MTS
;Multi Time Step (RESPA)
=PRCO
;Predictor-Corrector
=RK4O
;4 次 Runge-Kutta 法
=GEAR
;GEAR 法
=EXVP
;EXtended phase space Volume Preserving integrator
【注意】本バージョンでは、Predictor-Corrector, 4 次 Runge-Kutta 法, GEAR 法, EXtended
phase space Volume Preserving integrator は実行ファイルのみの提供とし、ソースプロ
グラムは提供しません。このため、ソースプログラムをコンパイルして得られた実行ファ
イルでは、それらの機能は使用できません。
myPresto 4.2
61
Multi time step を使用する場合は、力 f を周期の長い運動による力 fa、中間の力 fb、
周期の短い運動による力 fc の3種類に分け、それぞれに対応するタイムステップ⊿ta,
⊿tb, ⊿tc を制御します。これらのタイムステップは、計算頻度 K, L を使い、
⊿tb = K⊿tc,
⊿ta = L⊿tb = LK⊿tc
(K, L は自然数)
という関係で指定します。
FREQMEdium:計算頻度(間隔−中)の指定
=1
(上式の K に相当:⊿tb = K⊿tc)
;(デフォルト)
FREQLOng
=1
:計算頻度(間隔−長)の指定
(上式の L に相当:⊿ta = LK⊿tc)
;(デフォルト)
さらに、各相互作用計算がどのタイムステップに支配されて計算するかを指定します。
次の計算に同じように指定します。
CALBON:1-2 相互作用の計算
=NOCAlc ;計算しない
=CALC
;計算する。タイムステップ⊿tc に支配される(デフォルト)
=MEDIum
;計算する。タイムステップ⊿tb に支配される
=LONG
;計算する。タイムステップ⊿ta に支配される
CALANG:1-3 相互作用の計算
CALTOR:torsion 相互作用の計算
CALIMP:improper torsion の計算
CALV14:1-4 van der Waals の計算
CALE14:1-4 静電相互作用の計算
CALV15(または CALV5N):1-5 van der Waals
CALE15(または CALE5N):1-5 静電相互作用
CALHYD(または CALH5N):水素結合
CALPSR:position restraint
CALDSR:distance-restraint
CALDHR:dihedral-restraint
CALREP:simple repulsion
CALCAP:CAP 拘束
EXTCAP:拡張 CAP 拘束
CALUMB:UMBRELLA ポテンシャル計算
CALFLW:FLOW ポテンシャル計算
CAL-GB:GB 計算
myPresto 4.2
62
CALASA:ASA 計算
【注意】Multi time step 指定("INTEGR=MTS")以外で、相互作用計算のスイッチに"MEDI"
または"LONG"指定した場合はエラーとし、プログラムの実行を停止する。
【注意】周期の長い運動 fa のタイムステップ⊿ta( "TIMEST"×"FREQME"×"FREQLO" )が
4.0fs を超えないように指定することが望ましい。
【注意】RATTLE を NVT アンサンブルの MD 計算に適用する場合、Nose-Hoover 法による温度
制御("THERMO= NOSE")を指定する必要があります。
【注意】SHAKE/RATTLE は、適用範囲に制限があります。
SHAKE/RATTLE の適用範囲
SHAKE
RATTLE
エネルギー最小化
最急降下法
(METHOD=STEEP)
○
×
(EXE> MIN)
共役勾配法
(METHOD=CONJ)
×
×
MD 計算
Leap Frog Verlet(INTEGR=LEAP) ○
×
(EXE> MD)
Velocity-Verlet (INTEGR=VELO) ×
○
Multi Time Step (INTEGR=MTS)
×
×
(1−3−2)計算方法:アンサンブルの発生方法
METHOD:アンサンブルの種類を指定する。
=MICRocanonical ;Micro-canonical(NVE) (デフォルト)
=CANOnical
=NPT
;Canonical(NVT)
;NPT
=EXPAnded
;拡張アンサンブル
=TSAL
;Tsallis Dynamics
【注意】NPT アンサンブル"METHOD=NPT" は周期境界条件下でのみ指定可能です。
【注意】Tsalli Dynamics "METHOD=TSAL" は、4 次 Runge-Kutta 法使用時のみ有効です。
(1−3−3)計算法:温度・圧力制御方法
THERMOstat:温度制御方法。
"METHOD=CANO" の場合に適用される。適用範囲に注意してください。
=CONStant ;Hoover-Evans Gaussian constraint 法
myPresto 4.2
(デフォルト)
63
=NOSE
;Nose-Hoover 法
COUPLIngtime:Nose-Hoover 法でのカップリング時間(τ:単位 fs)。
"THERMO=NOSE" の場合に適用される。
=100.0
;(デフォルト)
BAROSTat:圧力制御方法。
"METHOD=NPT" の場合に適用される。適用範囲に注意してください。
=ANDErsen ;Andersen 法
(デフォルト)
=PARA
;Parrinello Rahmann 法
=BERE
;Berendsen 法
SETPRE:
NPT での目標の圧力(単位 atm)。
= 1.0
COUPHB:
;(デフォルト)
NPT での温度制御のカップリング時間(単位 fs)。
= 1000.0
COUPPI:
;(デフォルト)
NPT での圧力制御のカップリング時間(単位 fs)。
= 1000.0
;(デフォルト)
MODIFIcation:
NPT でのセル形状。(ANDERSEN では無効)
= FLEX
;自由度6、斜方セル(デフォルト)
= MONOclinic
;自由度4。3方向にそれぞれ伸縮および、基本セルの
角γ(a軸とb軸のなす角度)が変化
= ORTHorhombic
;自由度3。3方向にそれぞれ伸縮
= ISOTropic
;自由度1。等方的な変形
= SINGle_direction
;自由度1。z軸方向のみ変形
圧力制御方法と指定可能なセル形状の対応表
Parrinello Rahmann 法
Berendsen 法
FLEX
○
MONO
○
ORTH
○
○
ISOT
○
○
SING
○
myPresto 4.2
64
(1−4)拡張アンサンブル法
EXPAND:拡張アンサンブル法の手法の指定
= FORC
:
Force-Biased McMD
= SIMU
:
Simulated Tempering
= GST
:
Generalized Simulated Tempering
= EFFE
:
Effective Temperature
(1−4−1)Force-biased Multicanonical MD 法
RESETC:ヒストグラム作成のステップサイクル
F.B.McMD はヒストグラムを用いた反復解法であり、エネルギーのヒストグラムを
"RESETC"のステップごとに作成しなおす。短すぎると系が空間を十分に探索しないためヒ
ストグラムに偏りが生じ、長すぎると計算に時間がかかる。系が大きくなるにつれ、
"RESETC"は長く取るのが良い。真空中では数残基のペプチド程度に対し 200000∼400000 ス
テップ程度。
= 300000
;(デフォルト)
DUMMYL:F.B.McMD を始める前に捨てるダミーループのステップ数。
平衡状態から F.B.McMD を始める場合は、"1"に設定する。
= 1
;(デフォルト)
TEMMAX:F.B.McMD が探索する温度範囲の上限値(K)。
= 700
;(デフォルト)
TEMMIN:F.B.McMD が探索する温度範囲の下限値(K)。
= 250
;(デフォルト)
ENEMAX:F.B.McMD が作成するヒストグラムの上限値(kcal/mol)。
"TEMMAX"でのエネルギー分布を被覆する必要があるため"TEMMAX"での平均エネルギーより
十分高めにとる必要がある。あらかじめ、温度"TEMMAX"でのカノニカルの計算を行い平均
エネルギーを求め、それより高い値に設定するようにする。
= 10000
;(デフォルト)
ENEMIN:F.B.McMD が作成するヒストグラムの下限値(kcal/mol)。
"TEMMIN"でのエネルギー分布を被覆する必要があるため "TEMMIN"での平均エネルギーよ
り十分低めにとる必要がある。あらかじめ、温度"TEMMIN"でのカノニカルの計算を行い平
均エネルギーを求め、それより低い値に設定するようにする。
= -10000
;(デフォルト)
BINSIZ:F.B.McMD でヒストグラムを作成するときの bin サイズ(kcal/mol)。
細かくとるとヒストグラムが滑らかでなくなりヒストグラムの微分が計算できず、粗くと
myPresto 4.2
65
るとヒストグラムの形を表現できない。"ENEMAX"-"ENEMIN"を 100∼200 程度で割った値に
設定するのが良い。
= 5.0
;(デフォルト)
LIMITS:ヒストグラムで使用する範囲を決める閾値
F.B.McMD でエネルギーをサンプリングする範囲のヒストグラムの下限値であって
LIMITS= LIMITC にとるのが良い。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
LIMITC:ヒストグラムをアップデートする閾値
反復解法において、"LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラム
のアップデートを行う。ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に
計算できないものとみなす。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
FBRSTO:分布データリスタートファイル出力形式
F.B.McMD の分布データ(スケール因子、ヒストグラム)をファイル出力する際の
形式をアスキー形式、バイナリ形式のいずれかで指定する。
=
NOWR
;出力しない(デフォルト)
=
ASCI
;アスキー形式
=
DOUB
;倍精度バイナリ形式
NAMEFO=(分布データ出力ファイル名、133 文字以内)
FBRSTI:分布データリスタートファイル入力形式
F.B.McMD の分布データ(スケール因子、ヒストグラム)をリスタート入力する際
の形式をアスキー形式、バイナリ形式のいずれかで指定する。
NAMEFI=(分布データ入力ファイル名、133 文字以内)
UNITFR:分布データリスタートファイルの IO unit
= 85
;(デフォルト)
(アスキー形式でのファイル例)
myPresto 4.2
66
# PREVIUS POTENTIAL, LOCAL LOOP, TOTAL LOOP, CURRENT STEP
19.6646786598415
1
# LOCAL HISTGRAM
1
1
351
2.00000000000000
0.000000000000000E+000
:
2.00000000000000
0.000000000000000E+000
# TOTAL HISTGRAM
351
2.00000000000000
1.00000000000000
5.00000000000000
:
4.00000000000000
# PREVIOUS SCALING FACTOR
0.750000000000000
0.750000000000000
1.16322986359255
0.991723974379762
:
0.750000000000000
# BIN-LOWER, BIN-UPPER, PREVIOUS-LOWER, PREVIOUS-UPPER
117
155
112
158
【注意】F.B.McMD の参照温度として、"SETTEM"を設定する。運動エネルギーはこの温度に
固定される。一般に"TEMMIN"より高く、"TEMMAX"より低く設定する。
(1−4−2)Simulated Tempering Multicanonical MD 法
RESETC:ヒストグラム作成のステップサイクル
S.T.McMD は温度遷移の判定に使用する関数を"RESETC"のステップごとに作成しなおす。
短すぎると系が温度空間を十分に探索しないためヒストグラムに偏りが生じ、長すぎると
計算に時間がかかる。系が大きくなるにつれ、"RESETC"は長く取るのが良い。真空中では
数残基のペプチド程度に対し 200000∼400000 ステップ程度。
= 300000
;(デフォルト)
DUMMYL:S.T.McMD を始める前に捨てるダミーループのステップ数。
myPresto 4.2
67
平衡状態から S.T.McMD を始める場合は、"1"に設定する。
= 1
;(デフォルト)
TEMMAX:S.T.McMD が探索する温度範囲の上限値(K)。
= 700
;(デフォルト)
TEMMIN:S.T.McMD が探索する温度範囲の下限値(K)。
= 250
;(デフォルト)
ENEMAX:S.T.McMD が作成するエネルギーヒストグラムの上限値(kcal/mol)。
"TEMMAX"でのエネルギー分布を被覆する必要があるため"TEMMAX"での平均エネルギーより
十分高めにとる必要がある。あらかじめ、温度"TEMMAX"でのカノニカルの計算を行い平均
エネルギーを求め、それより高い値に設定するようにする。
= 10000
;(デフォルト)
ENEMIN:S.T.McMD が作成するエネルギーヒストグラムの下限値(kcal/mol)。
"TEMMIN"でのエネルギー分布を被覆する必要があるため "TEMMIN"での平均エネルギーよ
り十分低めにとる必要がある。あらかじめ、温度"TEMMIN"でのカノニカルの計算を行い平
均エネルギーを求め、それより低い値に設定するようにする。
= -10000
;(デフォルト)
BINSIZ:S.T.McMDでエネルギーヒストグラムを作成するときのエネルギーbin サイズ(kcal/mol)
。
= 5.0
;(デフォルト)
LIMITS:温度ヒストグラムの使用する範囲を決める閾値
S.T.McMD がサンプリングした温度範囲を決定する際の下限値であって LIMITS= LIMITC
にとるのが良い。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
LIMITC:温度ヒストグラムをアップデートする閾値
"LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラムの項γを利用する。
ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に計算できないものとみな
す。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
STTNUM:温度分割数
TEMMIN からTEMMAX までの温度範囲をSTTNUM 個に分割してS.T.McMD を実行する。STTNUM が大きい
ほど自然な温度遷移が実現するが収束のために必要なサンプリング時間も増大する。
= 100
;(デフォルト)
STEBAS:ベースエネルギー
系のとりうるエネルギーの最低値を設定する。温度"TEMMIN"でのカノニカルの計算に
よりあらかじめ見積もっておく。
= 0.0
;(デフォルト)
myPresto 4.2
68
【注意】S.T.McMD の参照温度として、"SETTEM"を設定する。運動エネルギーはこの温度に
固定される。一般に"TEMMIN"より高く、"TEMMAX"より低く設定する。
(1−4−3)Generalized Simulated Tempering 法
一般的なエネルギー分布P(E)は、様々な温度βi (=1/kB Ti )での Canonical 分布を重み
Fi で重ね合わせたもので表現できる。Simulated Tempering 法では、βで決まるサブアン
サンブルQが重みF(β)で重ね合わされたアンサンブルΞを考えてきた 。Generalized
Simulated Tempering では、パラメータλを導入し、λで決まる一般のサブアンサンブルの
重ね合わせで表す。
GSTMIN:パラメータλの下限
= 0.001d0
;(デフォルト)
GSTMAX:パラメータλの上限
= 0.006d0
;(デフォルト)
GSTNUM:パラメータλの個数
= 20
;(デフォルト)
GSTUPD:パラメータラムダの更新間隔
= 100
;(デフォルト)
GSTCON:パラメータλの収束 MD 回数
= 10000000
;(デフォルト)
GSTSAM:パラメータλのスケーリング前のサンプリング回数
= 50000 ;(デフォルト)
GSTBAS:ベースエネルギー
系のとりうるエネルギーの最低値を設定する。
= 25.5
;(デフォルト)
GSTETA:
= 0.5
;(デフォルト)
(1−4−4)Effective Temperature 法
RESETC:ヒストグラム作成のステップサイクル
短すぎると系が温度空間を十分に探索しないためヒストグラムに偏りが生じ、長すぎ
ると計算に時間がかかる。系が大きくなるにつれ、"RESETC"は長く取るのが良い。真空中
では数残基のペプチド程度に対し 200000∼400000 ステップ程度。
= 300000
;(デフォルト)
ENEMAX:Effective Temperature 法が作成するエネルギーヒストグラムの上限値(kcal/mol)。
myPresto 4.2
69
= 10000
;(デフォルト)
ENEMIN Effective Temperature 法が作成するエネルギーヒストグラムの下限値(kcal/mol)。
= -10000
;(デフォルト)
BINSIZ:Effective Temperature 法でエネルギーヒストグラムを作成するときのエネルギーbin サ
イズ(kcal/mol)
。
= 5.0
;(デフォルト)
LIMITS:温度ヒストグラムの使用する範囲を決める閾値
Effective Temperature 法がサンプリングした温度範囲を決定する際の下限値であって
LIMITS= LIMITC にとるのが良い。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
LIMITC:温度ヒストグラムをアップデートする閾値
"LIMITC"よりヒストグラムの値が大きい範囲でのみヒストグラムの項γを利用する。
ヒストグラムが"LIMITC"より低い場合はノイズが多くγが正確に計算できないものとみな
す。通常、0.0005∼0.001 の範囲にとる。
= 0.001
;(デフォルト)
(1−4−5)拡張アンサンブルデータファイル出力
拡張アンサンブル(Effective Temp, Force Bias, Simulated Tempering, Generalized
Simulated Tempering)使用時の確率、スケール因子、エネルギーデータを出力するファイ
ル名を指定する。
NAMEEP:確率データファイル名(133 文字以内)
= expand.prob
;(デフォルト)
UNITEP:確率データファイルの IO unit
= 78
;(デフォルト)
NAMEES:スケール因子データファイル名(133 文字以内)
= expand.scale
;(デフォルト)
UNITES:スケール因子データファイルの IO unit
= 77
;(デフォルト)
NAMEEE:エネルギーデータファイル名(133 文字以内)
= expand.energy ;(デフォルト)
UNITEE:エネルギーデータファイルの IO unit
= 79
;(デフォルト)
(1−5)Tsallis Dynamics
myPresto 4.2
70
【注意】本バージョンでは、Tsallis Dynamics は実行ファイルのみの提供とし、ソースプ
ログラムは提供しません。このため、ソースプログラムをコンパイルして得られた実行フ
ァイルでは、Tsallis Dynamics は使用できません。
(1−5−1)分布密度関数パラメータ設定
ポテンシャルエネルギーの範囲に応じて、Tsallis Dynamics の分布密度関数を変更する
ことが可能である。
ELOWER:低エネルギー側閾値
= 0.0
;(デフォルト)
EUPPER:高エネルギー側閾値
= 0.0
;(デフォルト)
ROF1DR:ρ1のパラメタdの条件
= 0.5
;(デフォルト)
ROF2XI:ρ2のパラメタξの値
= 10
;(デフォルト)
ROF2VX:ρ2のパラメタδの条件
= 1000
;(デフォルト)
ROF2VY:ロー2のパラメタγの条件
= 0.5
;(デフォルト)
(1−5−2)ファイル出力オプション
MNTRZT:zeta 値モニタファイルの出力形式
=NO
;出力しない(デフォルト)
=ASCI
;アスキーファイル
=SING
;単精度バイナリーファイル
=DOUB
;倍精度バイナリーファイル
UNITZT:zeta 値モニタファイルの IO unit
= 80
;(デフォルト)
NAMEZT=(zeta 値モニタファイル名、133 文字以内。)
OUTZET:zeta 値モニタファイル出力間隔
= 1
;(デフォルト)
MNTRCK:Tsallis 積分チェック値モニタファイルの出力形式
=NO
;出力しない(デフォルト)
=ASCI
;アスキーファイル
=SING
;単精度バイナリーファイル
myPresto 4.2
71
=DOUB
;倍精度バイナリーファイル
UNITCK:Tsallis 積分チェック値モニタファイルの IO unit
= 75
;(デフォルト)
NAMECK=(Tsallis 積分チェック値モニタファイル名、133 文字以内。)
OUTCHK:Tsallis 積分チェック値モニタファイル出力間隔
= 1
;(デフォルト)
MNTRPK:エネルギーモニタファイルの出力形式
=NO
;出力しない(デフォルト)
=ASCI
;アスキーファイル
=SING
;単精度バイナリーファイル
=DOUB
;倍精度バイナリーファイル
UNITPK:エネルギーモニタファイルの IO unit
= 81
;(デフォルト)
NAMEPK=(エネルギーモニタファイル名、133 文字以内。)
OUTZPK:エネルギーモニタファイル出力間隔
= 0
;(デフォルト)
FLGPKT=(エネルギーモニタファイル出力項目。potential, kinetic, total を 3 文字
で表す。"+" が出力対象となり、"-" は対象外となる。)
MNTRQU:物理量モニタファイルの出力形式
=NO
;出力しない(デフォルト)
=ASCI
;アスキーファイル
=SING
;単精度バイナリーファイル
=DOUB
;倍精度バイナリーファイル
UNITQU:物理量モニタファイルの IO unit
= 82
;(デフォルト)
NAMEQU=(物理量モニタファイル名、133 文字以内。)
OUTQUA:物理量モニタファイル出力間隔
= 1
;(デフォルト)
MNTRDO:Tsallis 分布密度関数モニタファイルの出力形式
=NO
;出力しない(デフォルト)
=ASCI
;アスキーファイル
=SING
;単精度バイナリーファイル
=DOUB
;倍精度バイナリーファイル
myPresto 4.2
72
UNITDO:Tsallis 分布密度関数モニタファイルの IO unit
= 82
;(デフォルト)
NAMEDO=(Tsallis 分布密度関数モニタファイル名、133 文字以内。)
OUTDOF:Tsallis 分布密度関数モニタファイル出力間隔
= 1
;(デフォルト)
(1−6)温度設定
(1−6−1)目標温度設定
SETTEMperature:系の目標温度(K)。
温度一定のアンサンブル Canonical(NVT), NPT での目標温度。F.B.McMD では参照温度とな
る。Micro-canonical(NVE)では使用しない。
=300.0
;(デフォルト)
TEMPCOntrol2:系の温度制御の仕方。
系全体の温度(運動エネルギー)をコントロールする場合(TEMPCO=NO)と、分子毎に温度を
コントロールする場合(TEMPCO=YES)の2種類がある。TEMPCO=NO の場合、水中の蛋白では蛋
白と水の温度が異なる場合がある。TEMCO=YES の場合、蛋白と水、リガンド分子などそれぞ
れの分子の温度が同じになりやすい。ただし、単原子イオンの温度も一定に保たれるなど
不自然な場合もある。
=NO
;(デフォルト)
=YES
(1−6−2)初期温度設定
INITIAlvelocity:初期速度の設定の仕方。
=ZERO
;初期速度=0、初期温度=0(デフォルト)
=SET
;以下の RANDOM により定義される乱数を用い、各原子の初期速度が
平均値が "STARTT" であるようなガウス関数型の分布となるように
設定する。
=RESEt ;リスタートジョブの初期条件変更((1−7)を参照)
STARTTempearture:初期温度の平均値(K)
=300.0
;(デフォルト)
RANDOMseed:速度分布を得るための random seed number(整数値 < 2**31 - 1)
=584287
;(デフォルト)
HEATLOop:Hoover-Evans Gaussian constraint 法での昇温のための MD ループ回数。
myPresto 4.2
73
=0
;(デフォルト)
(1−7)MD 計算条件
UPDATEinterval:座標情報の更新サイクル。(△)
1-5 相互作用エネルギーに CUTOFF が用いられている場合、相互作用テーブルの更新サイク
ルを指定する。周期境界条件の場合は、ユニットセルから飛び出した原子の座標をユニッ
トセル内に補正する計算の更新サイクルを指定する
=20
;(デフォルト)
STOPCEnterofmass:MD 計算中の重心の固定方法。
CAP 拘束または周期境界条件を適用するときは、並進運動または回転運動をゼロにする重心
の固定を行うようにする。
=NO
;重心を固定しない(デフォルト)
=TRAN
;系の第一チェインの並進の運動量をゼロにする
=ROTA
;系の第一チェインの回転の運動量をゼロにする
=BOTH
;系の第一チェインの並進と回転の運動量をゼロにする
BESTFIt:MD での、参照構造に対する系の第1チェインの RMSD の変化を標準出力する。参
照構造は、EXE> INPUT フェーズにて "REFCOORD", "NAMERE" を指定する必要がある。(△)
=NO
;計算しない(デフォルト)
=YES
;計算する。
(1−8)ジョブのリスタート設定
MD 計算を任意のステップで打ち切り、再度リスタートをかけて計算を継続する場合は、ジ
ョブ終了時に出力されたリスタートファイルを使用します。リスタートするジョブには、
リスタートファイルを読み込んで計算を再開するための指定が必要です。
なお、リスタートするジョブの初期速度および初期座標を変更することが可能です。
(1−8−1)リスタートファイルのファイル名を指定:リスタート前の MD 計算
NAMERO:リスタートファイルのファイル名。書式はバイナリ-形式です。
UNITRO:リスタートファイルの IO Unit
=41
;(デフォルト)
【注意】リスタートファイルは、MD 計算の終了時に必ず出力されます。ファイル名を指定
しなかった場合は、システムデフォルトのファイル名になります。
myPresto 4.2
74
(1−8−2)リスタート用ファイルを読み込む指定:リスタートするときに行う
RESTARt:リスタートする。
=NO
;リスタートしない。初期速度設定(*上述)が適用される(デフォルト)
=YES
;リスタートする
NAMERI=既に準備したリスタートファイルの名前。
UNITRI:リスタートファイルの IO Unit
=40
;(デフォルト)
(1−8−3)チェックポイントの設定:自動リスタートファイルの出力間隔を指定する
OUTReSTartfile:自動リスタートファイル出力 CPU 時間間隔
=0
; 自動リスタートファイルを出力しない(デフォルト)
OUTReStartfileLoop:自動リスタートファイル出力ループ間隔
=0
【注意】
; 自動リスタートファイルを出力しない(デフォルト)
自動リスタートファイルの出力は、OUTRST 指定時は自動リスタートファイル
出力 CPU 時間間隔ごとに、OUTRSL 指定時は自動リスタートファイル出力ループ間隔
ごとに随時行われる。
【注意】ファイル名は“name.num”(name は NAMERI オプションで指定したリスタート
ファイル名、num はシーケンス番号)となり、リスタートファイルの上書きは行わない。
(1−8−4)初期条件の変更:リスタート時の初期速度および初期座標を変更する
リスタートジョブの初期速度および初期座標を設定します。
INITIAlvelocity:初期速度の設定の仕方。
=ZERO
;初期速度=0、初期温度=0(デフォルト)
=SET
;以下の RANDOM により定義される乱数を用い、各原子の初期速度が
平均値が "STARTT" であるようなガウス関数型の分布となるように
設定する。
=RESEt ;リスタートジョブの初期条件変更
RANDOMseed:速度分布を得るための random seed number(整数値 < 2**31 - 1)
=584287 ;(デフォルト)
NAMETrajectryIn=入力トラジェクトリファイル名
NUMberTRJ:座標トラジェクトリの位置
=0 ;(デフォルト)
myPresto 4.2
75
(1−9)結果の出力指定
MD の途中結果のうち、各エネルギー項・RMSD・温度・圧力・CPU 時間などが標準出力され
ます。モニター出力・トラジェクトリは、別の指定項目により、それぞれ別のファイルに
出力されます。
OUTLOG:途中結果出力をする MD ステップの回数。
=1
;1ステップごとに結果を出力する(デフォルト)
LOGFORmat:出力形式
=SHORt
;1行 80 文字以内の簡易出力(デフォルト)
=DETAil ;1行 80 文字以内の詳細出力。各エネルギーを追加。
(2)解析用データ入出力(トラジェクトリー、パラメーター)
以下の各種トラジェクトリは、すべてファイルに出力されます。
・MD エネルギートラジェクトリ:MD 計算の一定ステップ毎に、各エネルギーをファイルに
出力する。入力指定ファイルなし。
・モニター指定トラジェクトリ:MD 計算の一定ステップ毎に、特定原子の座標、原子間距
離、原子間角度、原子間2面角をファイルに出力する。入力指定はファイル入力で行い、
"EXE> INPUT" で "OUTMON", "NAMEMO"を指定する。コントロールファイルには、原子の名
前を指定する。
・座標トラジェクトリ:MD 計算の一定ステップ毎に、系に含まれる(固定原子以外の)す
べての原子の座標のみをファイル出力する。入力指定ファイルなし。
・速度トラジェクトリ:MD 計算の一定ステップ毎に、系に含まれる(固定原子以外の)す
べての原子の速度のみをファイル出力する。入力指定ファイルなし。
・総エネルギーデータ:MD 計算のステップ毎に、系の総エネルギー(total potential energy)
をファイルに出力する。入力指定ファイルなし。
MD エネルギートラジェクトリ
MNTRENergy:MD エネルギートラジェクトリーファイルの形式
=NO
;ファイルを出力しない(デフォルト)
=ASCIi
;アスキー形式で出力
=SINGle ;単精度・バイナリ-で出力
myPresto 4.2
76
=DOUBle ;倍精度・バイナリ-で出力
OUTENEergy:出力のタイミング
=0
;0 ステップ毎(デフォルト)
UNITENergy:MD エネルギートラジェクトリーファイルの IO Unit
=44
;(デフォルト)
NAMEENergy = MD エネルギートラジェクトリのファイル名
モニター指定トラジェクトリ
MNTRTRajectory:モニター指定トラジェクトリファイルの形式
=NO
;ファイルを出力しない(デフォルト)
=ASCIi
;アスキー形式で出力
=SINGle ;単精度・バイナリ-で出力
=DOUBle ;倍精度・バイナリ-で出力
OUTTRJ:出力のタイミング
=0
;0 ステップ毎(デフォルト)
UNITTR:モニター指定トラジェクトリファイルの IO Unit
=50
;(デフォルト)
NAMETR =モニター指定トラジェクトリのファイル名
座標トラジェクトリ
MNTRCOordinate:座標トラジェクトリファイルの形式
=NO
;ファイルを出力しない(デフォルト)
=ASCIi
;アスキー形式で出力
=SINGle ;単精度・バイナリ-で出力
=DOUBle ;倍精度・バイナリ-で出力
OUTCOO:出力のタイミング
=0
;0 ステップ毎(デフォルト)
UNITCO:座標トラジェクトリファイルの IO Unit
=42
;(デフォルト)
NAMECO =座標トラジェクトリのファイル名
速度トラジェクトリ
myPresto 4.2
77
MNTRVElocity:速度トラジェクトリファイルの形式
=NO:ファイルを出力しない(デフォルト)
=ASCIi
;アスキー形式で出力
=SINGle ;単精度・バイナリ-で出力
=DOUBle ;倍精度・バイナリ-で出力
OUTVEL:出力のタイミング
=0
;0 ステップ毎(デフォルト)
UNITVE:速度トラジェクトリファイルの IO Unit
=43
;(デフォルト)
NAMEVE =速度トラジェクトリのファイル名
総エネルギーデータ
MNTRTOtalenergy:総エネルギーデータファイルの形式
=NO
;ファイルを出力しない(デフォルト)
=ASCIi
;アスキー形式で出力
=SINGle ;単精度・バイナリ-で出力
=DOUBle ;倍精度・バイナリ-で出力
UNITTOtalenergy:総エネルギーデータファイルの IO Unit
=59
;(デフォルト)
NAMETOtalenergy =総エネルギーデータのファイル名
【注意】総エネルギーデータ(total potential energy)は、MD 計算のステップごとに出
力されます。
(3)エネルギー計算に関する制御パラメーター(MIN/MD 共通)
(3−1)相互作用 CUTOFF の方法(MIN/MD 共通)
「EXE> MINimize グループ」の本項を参照。
(3−2)相互作用計算のスイッチ
myPresto 4.2
78
「EXE> MINimize グループ」の本項を参照。
(3−3)Filling Potential 法
CALUMB:Filling Potential 法を適用するかどうか
アンブレラポテンシャル法の一種である Filling Potential 法を適用するかどうか。
Filling Potential 法を使用する場合、アンブレラポテンシャルを指定する制御ファイル、
結果の解析ツール、が必要になる。
= NOCALC
;適用しない(デフォルト)
= CALC
;適用する
(4)拘束条件の指定
(4−1)SHAKE/RATTLE の指定
SHAKE/RATTLE を使用する場合は、EXE>INPUT グループで対象原子の原子番号と拘束距離を
指定した SHAKE ファイルを指定します。さらに、EXE> MD グループで、計算方法と収束条件
などを指定します。
「EXE> MINimize グループ」の本項を参照。
(4−2)剛体モデルの指定
剛体モデルでは、分子の任意の原子を剛体化し、内部自由度を固定することができます。
TIP4P モデルを使用するときは必須の機能です。剛体モデルを使用する場合、どの分子の、
どの部分を剛体化するかを剛体モデルファイルに指定する方法と、プログラムで自動的に
剛体化を行う方法があります。
プログラムで自動的に剛体化を行う場合、以下の方法で行います。
(a)水分子以外場合(分子名が"WAT"でない場合)
水素でない原子に対し 1∼3 つの水素原子が共有結合している場合に、それぞれ 2∼4
原子を剛体として設定します。
(b)水分子の場合(分子名が"WAT"の場合)
水を構成する全原子を剛体として設定します。原子の相対位置はプログラム内部に
保持している相対位置を使用します。所属原子数が 3 の場合は TIP3P として、4 の場合は
TIP4P として扱います。
myPresto 4.2
79
RIGIDModel : 剛体モデル用の適用指定(△)
=NO
;剛体モデルを適用しない(デフォルト)
=YES
;剛体モデルを適用する
=AUTO
;剛体モデルを自動作成する
UNITRM:剛体モデルの指定ファイルの IO unit(△)
=58
;(デフォルト)
NAMERM =(剛体モデルファイル名、133 文字以内。)
剛体モデルを自動作成した場合(RIGIDM= AUTO)、作成された情報をファイル出力するこ
とができます。出力されるファイルの書式は、入力ファイルと同じです。
DBGRIG:剛体モデル自動作成情報出力指定(△)
=NOWR
;ファイル出力しない(デフォルト)
=ASCI
;ファイル出力する
UNITDR:剛体モデル自動作成情報ファイルの IO unit(△)
=84
:(デフォルト)
NAMEDR =(剛体モデル自動作成情報ファイル名、133 文字以内。)
【注意】剛体モデルファイルは、専用ツールによる作成もできます。ファイルには剛体化
する原子の組や、固定する3次元座標などを指定します(指定方法は、巻末「A ファイル
書式」を参照)。
(5)PME, Ewald, FMM の指定
(5−1)Particle Mesh Ewald 法, Ewald 法の指定
周期境界条件においては、1-5 静電相互作用の計算に PME(Particle Mesh Ewald)法、ま
たは、Ewald 法を用いることができます。使用できるのはどちらか一方だけです。
「EXE> MINimize グループ」の本項を参照。
【注意】PME および Ewald 法では、以下の指定が必要です。
CALE15= CALC ; 近接原子は相互作用テーブルを用いた CUTOFF 法で計算します。
BOUNDA= PERI ; PME, Ewald は周期境界条件でないと使用できません。
DIEFUN= CONS ; PME, Ewald ではクーロン力の空間誘電率は定数でないといけません。
myPresto 4.2
80
(5−2)Fast Multiple Method の指定
「EXE> MINimize グループ」の本項を参照。
(6)溶媒効果(MIN/MD 共通)
(6−1)Accessible Surface Area 法の指定(MIN/MD 共通)
「EXE> MINimize グループ」の本項を参照。
【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。
(6−2)Generalized Born / Surface Area 法の指定(MIN/MD 共通)
「EXE> MINimize グループ」の本項を参照。
【注意】溶媒水分子、カウンターイオンなどの溶媒は用いてはならない。
(7)境界条件(MIN/MD 共通)
(7−1)境界条件の中心の設定(MIN/MD 共通)
「EXE> MINimize グループ」の本項を参照。
(7−2)境界条件のサイズの設定(MIN/MD 共通)
「EXE> MINimize グループ」の本項を参照。
(8)LIST
"LIST" を書き加えれば、現在のパラメーター設定が表示されます。引数なし。
(9)QUIT
myPresto 4.2
81
EXE>グループ入力の終了を示します。
myPresto 4.2
82
4.2.1.4 EXE> OUTPUT グループ
OUTPUT グループでは、トポロジーファイル、最終座標の出力のために、それらの外部ファ
イルの指定を行います。これら OUTPUT グループの入力は "EXE> MIN", "EXE> /MD" に共通
で使用されます。
【注意】各外部ファイルの書式は、巻末「A ファイル書式」を参照。
OUTPUT グループでの指定事項:
(1)系のトポロジーの指定
(2)系の座標の指定
(1)系のトポロジーの指定
TOPOLOgy:トポロジーファイルの書式(○)
=NOWRite
;トポロジーファイル出力なし(デフォルト)
=FORMAtted
;書式つきアスキーファイル
=BINAry ;バイナリーファイル
UNITTOpology:トポロジーファイルの IO unit(△)
=90
;(デフォルト)
NAMETOpology=(トポロジーファイル名。TOPOLOgy=[FORM│BINA]のとき)
(2)系の座標の指定
ここで出力する座標ファイルは、MD ステップが N 回のとき、N+1 回目のステップの座標を
出力します。
COORDInate:PDB 書式3次元座標ファイルの書式(○)
=NOWRite
=PDB
;座標入力なし(デフォルト)
;PDB ファイルフォーマット
=BINAry ;バイナリーファイル
UNITCOordiante:座標ファイルの IO unit(△)
=91
;(デフォルト)
NAMECOordinate=(座標ファイル名。COORD=[PDB│BINA]のとき)
(3)QUIT
EXE>グループの入力の終わりを示す。
myPresto 4.2
83
4.2.1.5 EXE> END グループ
END は、cosgene のコントロールファイルの終了を示します。
入力は、「EXE> END」の1行のみです。
myPresto 4.2
84
(余白)
myPresto 4.2
85
5 計算例
5.1
Sample-1:真空中のペプチド
−Vassopressin の計算−
(1)初期座標とトポロジーファイルの準備
MD/エネルギー最小化の必須の入力として PDB 書式の初期座標とトポロジーファイルが必要
です。これらは tplgene を用いて準備できますが、準備の方法には大きくわけて2通りあ
ります。
方法1:アミノ酸・DNA 配列のシーケンスとそれらの構造を二面角系で tplgene に指示する
ことで PDB 書式の初期座標とトポロジーファイルを発生させる方法
方法2:PDB などからダウンロードした PDB 書式の座標を用いて、tplgene で自動的に不足
原子を補いながら PDB 書式の初期座標とトポロジーファイルを発生させる方法
Sample-1 では方法1を説明し、Sample-2 で方法2を説明します。
(2)二面角系での初期座標とトポロジーファイルの発生
二面角系入力ファイルを "vas.dih" として作成します。
① アミノ酸シーケンス(PRE>SEQUENCE)
"PRE>SEQUENCE" 以下の行にアミノ酸シーケンスを3文字記号で記載してください。N 端の
アセチル化、及び C 端のメチル化は、ACE/NME と記載、C 端が NH2 であれば "NHE" と記載
してください。
② S-S 結合の指定(PRE>SSBOND)
もし n 番目の残基と m 番目の残基が S-S 結合で結合しているものであれば "PRE>SSBOND"以
下に S-S 結合のかかる場所を「n m」と記載してください。複数の S-S 結合があれば次の行
に続けて入力してください。
③ 二面角の指定(PRE>DIHEDRAL-ANGLES)
二面角は "PRE>DIHEDRAL-ANGLES" 以下に記載します。これは ECEPP の定義に従い、φ―ψ
―ω―χ1―χ2- の順番になります。一般のアミノ酸ではω角は 180 度ですので注意して
ください。二面角が良くわからない時、以下の図のように適当な角を代入しても、多くの
場合後のエネルギー最小化でもっともらしい構造を得ることができます。
myPresto 4.0
86
■二面角系入力ファイルの例(vas.dih)
PRE>SEQUENCE
CYS
TYR
PHE
GLN
ASN
CYS
PRO
ARG
GLY
NMECPRE>SSBOND
1
6
PRE>DIHEDRAL-ANGLES
180
180
180
0
0
0
0
0
0
0
180
180
180
0
0
0
0
0
0
0
180
180
180
180
180
180
0
0
0
0
0
0
0
0
0
0
0
0
0
0
180
180
180
0
0
0
0
0
0
0
180
180
180
180
180
180
0
0
0
0
0
0
0
0
0
0
0
0
0
0
180
180
180
0
0
0
0
0
0
0
180
180
180
180
180
180
0
0
0
0
0
0
0
0
0
0
0
0
0
0
下の例では、"vas.dih" は "VAS" という分子名で "vas-dih.pdb" と "vas-dih.tpl" と
いう名前の初期座標とトポロジーを生成します。ここでは、入力ファイル、データベース
ファイルを実行時のディレクトリに置く方法について説明します。
(環境変数を使って任意のディレクトリを指定する例は後述の Sample-2 で示します)
■実行方法(入力ファイル、データベースファイルを実行時のディレクトリに置く場合)
① 入力ファイル(ここでは "vas.dih"とします)、使用するデータベースファイルを実行
ディレクトリにコピーします。
② 実行ディレクトリで tplgene を実行します。引数なしで "tplgene" とタイプすれば処
理は会話的に始まります。
③ 順次、タイトル(任意)、分子名(任意)、蛋白か核酸か、入力形式、使用するデータベ
ース、入力ファイル名、出力ファイル名を入力します。
myPresto 4.2
87
■実行例
%% Input Title for this molecules %%
If end, type end and (cr).
%% Input Title less than 79 char. %%
Vassopressin test
end
%% Input Molecular Name less than 39 char. %%
If end, type end and (cr).
VAS
end
%% Select Chain Species by the next number. %%
1 : peptide
chain
2 : nucleotide chain
1
%% Select Input File by the next number. %%
1 : pdb
file
2 : dihed file
2
%% Which Force Field Files do you use ? %%
Please choose from the following files .
and write the File Name .
./
C96_aa.tpl
C96_na.tpl
charmm19_aa_all.tpl
charmm22_aa_all.tpl
vas.dih
C96_aa.tpl
%% Input File Name of Atom Coord. or Dihed. %%
./
vas.dih
%% Input File Name of Output Coord. %%
./
vas-dih.pdb
%% Input File Name of Output Topology %%
./
vas-dih.tpl
:
(省略)
:
%% Program is done. %%
%% This program ended normally. %%
myPresto 4.2
88
5.2
Sample-2:真空中の蛋白
−Lysozyme の計算−
(1)初期座標とトポロジーファイルの準備:PDB 座標ファイルを用いる場合
蛋白の初期座標は PDB 形式で準備してください。水素(H)は欠損していても自動的に付加
されます。ここでは "1LZA.pdb" を PDB よりダウンロードしたとします。"tplgene" で MD
で使用する PDB ファイルと力場パラメーターの割り振られたトポロジーファイルを作成し
ます。
【注意】分子は "TER" で区切られていることを確認してください。蛋白鎖・分子間に"TER"
がない場合は、自分で PDB ファイル中に "TER" を書き込んでください。
【注意】複数鎖からなる分子の場合、PDB 書式でチェイン名を残基番号の前に記入しておい
てください。チェイン名がない場合もトポロジーファイルは生成しますが、化学結合のな
い複数分子が1種の分子として扱われることになります。
【注意】ATOM 行の原子のみが処理の対象となります。HETATM 行は処理されません。また標
準的でない原子名が指定されている場合、プログラムは処理を停止する場合があります。
特に変則的な名前が水素(H)原子に対して用いられた場合、与えられた座標を無視して、
新たにプログラムの内蔵する座標で H を作り直す場合があります。
【注意】tplgene で処理できるアミノ酸の種類は、データベースに登録済みのものに限られ
ます。これ以外のアミノ酸はデータベースを自分で拡張しない限り処理されません。
下の例では、"1LZA.pdb" から HETATM 行を除いたものを "lys_0.pdb" として扱っています。
結果として、"LYZ" という分子名で "lys_1.pdb" と "lys_1.tpl" という名前の初期座標
とトポロジーが生成されています。ここでは、入力ファイル、データベースファイルを任
意のディレクトリに置いて取り扱う方法について説明します。
(実行時のディレクトリに置く方法の例は前述の Sample-1 で示しています)
■実行方法(入力ファイル、データベースファイルを任意のディレクトリに置く場合)
① 任意のディレクトリ内に入力ファイル、データベースファイルを用意してください。続
いて、その入力ファイル用ディレクトリ、データベースファイル用ディレクトリのパスを
環境変数で設定して下さい(設定方法は「2.2.5 環境変数」参照)。tplgene 実行時に環境
変数が設定されていない場合は、設定されていない変数に対するディレクトリ(入力、出
力、力場 DB ディレクトリ)はカレントディレクトリになります。
② tplgene を実行します。引数なしで "tplgene" とタイプすれば処理は会話的に始まり
ます。
③ 順次、タイトル(任意)、分子名(任意)、蛋白か核酸か、入力形式、使用するデータベ
ース、入力ファイル名、出力ファイル名を入力します。
myPresto 4.2
89
■実行例
※この例は環境変数を以下のように設定しているものとして計算を行っています。
入力ファイル用ディレクトリ
:/home/user01/myPresto/sample/sample2
データベースファイル用ディレクトリ:/home/user01/myPresto/tplgene/DB
%% Input Title for this molecules %%
If end, type end and (cr).
%% Input Title less than 79 char. %%
LYSOZYME test
end
%% Input Molecular Name less than 39 char. %%
If end, type end and (cr).
LYZ
end
%% Select Chain Species by the next number. %%
1 : peptide
chain
2 : nucleotide chain
1
%% Select Input File by the next number. %%
1 : pdb
file
2 : dihed file
1
%% Which Force Field Files do you use ? %%
Please choose from the following files .
and write the File Name .
/home/user01/myPresto/tplgene/DB/
C96_aa.tpl
C96_aa.tpl
C96_na.tpl
charmm19_aa_all.tpl
charmm22_aa_all.tpl
%% Input File Name of Atom Coord. or Dihed. %%
/home/user01/myPresto/sample/sample2/
1LZA.pdb
lys_0.pdb
lys_0.pdb
%% Input File Name of Output Coord. %%
./
lys_1.pdb
%% Input File Name of Output Topology %%
./
lys_1.tpl
(次ページにつづく)
myPresto 4.2
90
(前ページから)
INFORMATION> tgReadAminoSequence
Molecule Number
:1
Total number of residues
:129
INFORMATION> tgReadAminoSequence
Amino acid Sequence of the protein
Molecule number :1
LYS+N+ VAL
PHE
GLY
ARG+
CYSS
GLU-
LEU
ALA
ALA
ALA
ARG+
MET
GLY
LYS+
TYR
ARG+
SER
HIS
LEU
GLY
GLY
LEU
ASN
ASPTRP
ASN
VAL
TYR
CYSS
ALA
ALA
LYS+
PHE
GLU-
SER
ASN
PHE
ASN
THR
GLN
THR
ALA
ASP-
THR
TYR
ASN
GLY
ARG+
ILE
ASN
LEU
THR
GLN
ASPILE
GLY
ASN
SER
SER
ARG+
TRP
TRP
CYSS
ASN
ASP-
GLY
ARG+
THR
PRO
GLY
SER
SER
ALA
ARG+
LEU
ASN
LEU
LEU
SER
CYSS
SER
ASN
ASP-
ILE
ILE
PRO
THR
CYSS
ALA
SER
VAL
ASN
CYSS
ALA
LYS+
LYS+
ILE
VAL
SER
ASPTRP
GLY
ARG+
ASN
ASN
GLY
ARG+
MET
CYSS
ASN
LYS+
ALA
GLY
TRP
THR
VAL
ASP-
ALA
VAL
GLN
ALA
TRP
ILE
ARG+
GLY
CYSS
ARG+
LEUC-
INFORMATION> tgReadInputTopology
Amber Type Topology Database File is read
INFORMATION> tgOutputTopology
Write formatted Topology File
INFORMATION> tgSetCoordinate
All the atom positions are now set.
INFORMATION> tgOutputCoordinate
Output pdb-formatted coordinates
CALC. TIME = 0.490000 sec.
%% Program is done. %%
%% This program ended normally. %%
これで蛋白の PDB とトポロジーファイルの準備はできました。
myPresto 4.2
91
【注意】S-S 結合を含まない蛋白では、PDB の ATOM 行があれば十分ですが、S-S 結合を含む
分子では、PDB の S-S 結合を指定する行を tplgene が読み込み、S-S 結合の有無の判定
をします。
上の例では、S-S 結合指定行があるので、"CYS" が "CYSS" に変換されています。S-S 指
定行を削除すると、下の例のように、"CYS" のままで残り S-S 結合は形成されず、"S-H" の
ように "H" が付加されます。正しく変換されているか確認してください。
■S-S 結合を指定しなかった場合の結果(一部)
Molecule number :1
LYS+N+ VAL
PHE
GLY
ARG+
CYS
GLU-
LEU
ALA
ALA
ALA
MET
LYS+
ARG+
HIS
GLY
LEU
ASP-
ASN
TYR
ARG+
ALA
GLY
ALA
TYR
LYS+
SER
PHE
LEU
GLU-
GLY
SER
ASN
ASN
TRP
PHE
VAL
ASN
CYS
THR
GLN
ALA
THR
ASN
ARG+
ASN
THR
ASP-
GLY
SER
THR
ARG+
ASPTRP
TYR
TRP
GLY
CYS
ILE
ASN
LEU
ASP-
GLN
GLY
ILE
ARG+
ASN
THR
SER
PRO
GLY
SER
ARG+
ASN
LEU
CYS
ASN
ILE
PRO
CYS
SER
SER
ALA
VAL
LEU
ASN
LEU
CYS
SER
ALA
SER
LYS+
ASPLYS+
ILE
ILE
THR
VAL
ALA
SER
ASP-
GLY
ASN
GLY
MET
ASN
ALA
TRP
VAL
ALA
TRP
GLN
ARG+
ALA
ASN
TRP
ARG+
ILE
CYS
ARG+
LYS+
GLY
GLY
CYS
THR
ARG+
ASPLEUC-
VAL
(2)エネルギー最小化と MD 計算
エネルギー最小化には、最急降下法と共役勾配法の2種類が用意されています。ただし、
共役勾配法では SHAKE を併用できないので注意してください。
これまでに作成したトポロジーファイルと初期座標を用いて、真空中でのエネルギー最小
化を行います。相互作用は 8Å cutoff、距離依存の誘電率を用い、相互作用テーブルの更
新は 20 ステップごととした例を示します。エネルギー最小化に伴う初期座標からの座標の
変位を観察するため、"REFCOORD=PDB
NAMERE=lys_1.pdb" と "BESTFI=YES" を指定してい
ます。共役勾配法では SHAKE の指定はできないので "SETSHAKE" の欄はコメントアウト指
定のセミコロン(;)を付けてあります。
共役勾配法で収束が悪い場合(大きな系やひずみの大きい系など)は、最初に最急降下
法(METHOD= STEEP)を数十ステップ適用した後、共役勾配法を適用すると良い場合が多い
です。
myPresto 4.2
92
■制御ファイル(min_vac.inp)
EXE> INPUT
TOPOLOGY=
NAMETO=
lys_1.tpl
PDB
NAMECO=
lys_1.pdb
REFCOORD=
SETSHAKE=
PDB
READ
NAMERE=
NAMESH=
lys_1.pdb
lys.shk
;
FORM
COORDINA=
QUIT
EXE> MINI
METHOD=
CONJ
CPUTIM=
360000.0
LOOPLI=
4000
UPDATE=
20
MONITO=
CUTMET=
5
RESA
CONVGR=
CUTLEN=
0.1D0
8.0D0
DIEFUN=
DIST
DIEVAL=
2.0D0
BESTFI=
QUIT
YES
EXE> OUTPUT
COORDINATE=
QUIT
PDB
NAMECO=
lys_1_min.pdb
EXE> END
(3)MD 計算
エネルギー最小化した座標をもとに MD を行い、系の平衡状態を実現します。トポロジーフ
ァイルは初期座標と共通のものを用います。初期構造からのずれを計測するため、制御フ
ァイルに "REFCOORD=PDB
NAMERE=lys_1.pdb" と "BESTFI=YES" を指定します。
また、蛋白質のアミノ酸残基間の距離を計測してみます。モニター指定ファイルを作成
し、原子 A と原子 B の間の距離をモニターします。それらは以下のように指定します。
・A を含む Chain 番号 A を含む分子内での残基番号
A の原子名、
・B を含む Chain 番号 B を含む分子内での残基番号
B の原子名
■モニター指定ファイル(lys.mntinp)
MONITOR> DISTANCE
1 46 ND2 1 109 CB
1
73
CZ
1 101 CG
END
上では、46 番目の残基の ND2 と 109 番目残基の CB の距離と、73 残基の CZ と 101 残基の CG
myPresto 4.2
93
の間の距離を指定しています。これを 100 step 毎に、"lys_vac.mnt" にアスキー形式で出
力させる場合は、"OUTTRJ=100"、"NAMETR= lys_vac.mnt"、"MNTRTR=ASCI" と指定します。
上記の計算条件に加え、300K での NVT 計算、相互作用 cutoff 10Å、蛋白の並進と回転運
動を重心周りに固定し、初期速度をランダムに発生させる場合の入力を以下に示します。
タイムステップの設定は、通常 0.5fs、全ての水素に SHAKE をかけるとき 1.5fs 程度ですが、
事前に同じ系で NVE の計算を行い、全エネルギーが保存される程度のタイムステップに設
定すると良いでしょう。
■制御ファイル(md_vac.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTTRJ=
OUTLOG=
LOGFOR=
METHOD=
SETTEM=
INITIA=
STARTT=
RANDOM=
FORM
PDB
READ
PDB
2000
500.0D0
20
0.5D0
100
100
DETA
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
lys_1.tpl
lys_1_min.pdb
lys.mntinp
lys_1.pdb
CPUTIM= 3600000.0D0
STOPCE= BOTH
CANONICAL
300.0D0
SET
300.0D0
654321
NAMETR= lys_vac.mnt
BESTFI=
YES
CUTMET=
RESA
DIEFUN=
DIST
CALV15=
CALC
CALE15=
CALC
CALHYD=
NOCALC
CALV5N=
NOCALC
CALE5N=
NOCALC
CALH5N=
NOCALC
QUIT
EXE> OUTPUT
COORDINATE= PDB
QUIT
EXE> END
MNTRTR=
ASCI
CUTLEN=
DIEVAL=
10.0D0
2.0D0
NAMECO=
lys_1_md.pdb
myPresto 4.2
94
5.3
Sample-3:水中の蛋白
−Lysozyme の計算−
(1)初期座標とトポロジーファイルの準備
真空中の場合と同様の手続きで、蛋白のデータを準備してください。
この例では、"lys_1.pdb" と "lys_1.tpl" とします。
(2)境界条件の設定
溶媒水を用意するのに先立って境界条件を決めます。利用可能な境界条件は、次の3つで
す。
・剛体反発壁をもつ球・楕円体
・CAP water
・周期境界条件(立方体セル)
剛体反発壁をもつ球・楕円体の場合、中心と球の半径ないし楕円体の長短軸を以下のよう
に制御ファイルに指定してください(以下の例は球の場合)。楕円体は球形から形の外れた
扁平・長い蛋白の水中での計算に向いています。
BOUNDARY=
RADIUS=
SPHERE
30.0
CENTRX=
3.500
CENTRY=
CENTRZ=
27.800
34.000
CAP water では、CAP の中心、CAP 拘束の半径など、CAP 拘束のパラメーターを以下のよう
に制御ファイルに指定します。また、CAP 計算対象として蛋白と水の分子を CAP 指定ファイ
ルに指定します。CAP の中心は、座標で明示する場合と分子の重心を指定する場合がありま
す。反発ポテンシャルは、2次関数と4次関数の2種類がありますが、この例では2次関
数を用いています。この方法は、蛋白−リガンドドッキング計算などに向いています。
CALCAP=
CENTRX=
CALC
3.500
CENTRY=
27.800
CENTRZ=
RADCAP=
34.000
10.0
FORCAP=
20.0
FUNCAP=
SETCEN=
HARMonic
NO
myPresto 4.2
95
■CAP 指定ファイル(lys_w.capbc)
BOUND> INCLUDE
LYZ
1
WAT
1
1
YES
4592
YES
周期境界条件では、以下のように制御ファイルに指定してください。セルの中心の指定に
加え、セルの辺の長さを指定してください。
BOUNDARY= PERI
CENTRX=
3.500
CENTRY=
27.800
CENTRZ=
LXCELL=
34.000
20.00
LYCELL=
20.00
LZCELL=
20.00
【注意】相 互 作 用の cutoff の 仕方は "CUTMET= RESC" を指定 してください。また、
"CUTMET=RESA" では分子サイズがセルサイズに近い場合、相互作用が一意に計算できなく
なることがあります。この場合、プログラムは警告を出します。
myPresto 4.2
96
(3)水の発生
① プログラムツール "setwater" を使用し、水分子を発生させます。
(使用法は「B ユーティリティ」、setwater の節を参照してください)
この例では、setwater を使用し、蛋白 "lys_1.pdb" の重心から半径 34Åの間に球形の TIP3P
の水分子 "wat.pdb" を発生させます。
【注意】水の付加では、蛋白の空間に占める形状により、水分子の密度は実際の密度より
やや小さくなる傾向にあります。NVT 実行後、水和の系に隙間が生じるようであれば、水の
数を調整してください。CAP water の付加では、系により CAP 半径よりやや大きめ(0.5∼2
Å)に水分子を配置してください。その他の場合では、vdW 半径のダンピングファクターを
小さく設定したり、密度を高めに調整したりする必要がある場合もあります。
② 蛋白の PDB データに作成した水分子の PDB データを追加し、水中の PDB ファイルを作成
します。(PDB は、対象となる系の PDB の末尾に追加します)
% cp
lys_1.pdb
lys_w.pdb
% cat wat.pdb >> lys_w.pdb
③ プログラムツール "mergetpl" を使用し、蛋白のトポロジーファイルの情報と水分子の
トポロジーファイルの情報を1つのトポロジーファイルに統合します。統合後のファイル
にエディタを使って水分子の数を記入します。
(使用法は「B ユーティリティ」、mergetpl の節を参照してください)
この例では、蛋白 "lys_1.tpl" と水 "tip3p.tpl" を合わせて新しいトポロジーファイル
"lys_w.tpl" を生成し、"lys_w.tpl"の"MOLECULES"項に水分子の数を記入します。
■トポロジーファイル "lys_w.tpl" への水分子の数の記入
TPL> TITLE
LYSOZYME test
TPL> MOLECULES
LYZ
WAT
:
(省略)
myPresto 4.2
1
4592
;水分子の数
97
(4)SHAKE の使い方
SHAKE を実行するためには、myPresto に SHAKE の条件を記述した SHAKE ファイルを与える
必要があります。SHAKE ファイルには、拘束をかける原子とそれらの間の拘束距離を指定し
ます。それらは以下のように指定します。
(詳細は「A 入出力ファイル」、SHAKE ファイルの節を参照してください)
・分子名
・SHAKE 対象原子数、SHAKE 対象原子の分子内相対原子番号、原子間距離
■SHAKE ファイル(lys_w.shk)
SHAKE> SHAKE
LYZ
4
1
;分子名
2
3
1.01000
1.64962
2
5 ->
6
4 ->
1.01000
;SHAKE 対象原子数、SHAKE 対象原子番号
1.01000
1.64962
8
1.0905
:
;原子間距離
;SHAKE 対象原子数、SHAKE 対象原子番号
1.0901
3
1.64962
;原子間距離
7
9 ->
1.0917
;SHAKE 対象原子数、SHAKE 対象原子番号
1.7691
;原子間距離
(省略)
:
SHAKE> SHAKE
WAT
3
1
0.95720
2
3
1.51360
->
0.95720
;分子名
;SHAKE 対象原子数、SHAKE 対象原子番号
;原子間距離
上の1つ目の指定は、4 原子での SHAKE を指定しています。これは 4 面体を構成するので 6
個の原子間距離を指定します。原子間距離の指定順は、1-2、2-3、3-1(ここまでは3原子
と同じ)、1-4、2-4、3-4 となります。この SHAKE ファイルで指定した SHAKE を実行するた
めには、制御ファイルに、"SETSHAKE=READ
NAMESH=lys_w.shk"、"SHAKEM=HBON" を指定し
ます。
【注意】
・行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。
・SHAKE を構成する原子の数は 2,3,4 のいずれかとする。
・複数の分子間にまたがる SHAKE は記述できない。
myPresto 4.2
98
(5)エネルギー最小化
CAP water を使用した場合の例を以下に示します。
■制御ファイル(min_wat.inp)
EXE> INPUT
TOPOLOGY=
FORM
NAMETO=
lys_w.tpl
COORDINA=
PDB
NAMECO=
lys_w.pdb
REFCOORD=
SETBOU=
PDB
READ
NAMERE=
NAMEBO=
lys_w.pdb
lys_w.capbc
SETSHAKE=
READ
NAMESH=
lys_w.shk
QUIT
EXE> MINI
;
;
;
;
;
METHOD=
STEEP
CPUTIM=
360000.0
LOOPLI=
MONITO=
4000
5
UPDATE=
CONVGR=
20
0.2D0
CUTMET=
RESA
CUTLEN=
8.0D0
DIEFUN=
BESTFI=
CONS
YES
DIEVAL=
1.0D0
in case of SPHERE boundary
BOUNDARY=
SPHERE
RADIUS=
35.0
SETCEN=
YES
in case of CAP boundary
CALCAP=
CALC
FUNCAP=
HARMonic
RADCAP=
SETCEN=
34.0
YES
FORCAP=
100.0
SHAKEM=
HBON
QUIT
EXE> OUTPUT
COORDINATE=
PDB
NAMECO=
lys_w_min.pdb
QUIT
EXE> END
【注意】球体・楕円体("SPHERE", "ELLIPSOID")の境界条件では、入力 PDB に含まれる原
子座標より小さい球領域を指定できません。原子が境界条件より外にある場合、警告を
出してプログラムは停止します。
myPresto 4.2
99
(6)水中での MD 計算
CAP constraint、SHAKE による拘束条件下での、Gaussian constraint 法を用いた NVT 計算
の入力を示します。MD の最初のステップは平衡に達していないため、コントロールファイ
ルに "NAMERO= lys_w_md.res" を指定し、リスタートファイルを出力して終了します。
■制御ファイル(md_wat.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
SETBOU=
SETSHAKE=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTTRJ=
OUTLOG=
LOGFOR=
;
;
;
;
FORM
PDB
READ
PDB
READ
READ
2000
500.0D0
20
2.0D0
100
10
DETA
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
NAMEBO=
NAMESH=
lys_w.tpl
lys_w_min.pdb
lys.mntinp
lys_w.pdb
lys_w.capbc
lys_w.shk
CPUTIM= 3600000.0D0
STOPCE= BOTH
METHOD=
CANONICAL
THERMO=
SETTEM=
300.0D0
INITIA=
SET
STARTT=
300.0D0
RANDOM=
654321
NAMERO=
lys_w_md.res
in case of SPHERE boundary
BOUNDARY=
SPHERE
RADIUS=
35.0
SETCEN=
in case of CAP boundary
CALCAP=
CALC
FUNCAP=
RADCAP=
34.0
FORCAP=
SETCEN=
YES
NAMETR= lys_wat.mnt
BESTFI=
YES
CUTMET=
RESA
DIEFUN=
CONS
SHAKEM=
HBON
CALV15=
CALC
CALE15=
CALC
CALHYD=
NOCALC
QUIT
EXE> OUTPUT
COORDINATE= PDB
QUIT
EXE> END
CONS
YES
HARMonic
100.0
MNTRTR=
ASCI
CUTLEN=
DIEVAL=
10.0D0
1.0D0
CALV5N=
CALE5N=
CALH5N=
NAMECO=
NOCALC
NOCALC
NOCALC
lys_w_md_1.pdb
myPresto 4.2
100
(7)リスタートの仕方
サンプリングを行うための MD は、事前の MD 結果からのリスタートで行うのが普通です。
以下では、リスタートに用いる座標と速度を "RESTARt=YES"、"NAMERI=lys_w_md.res" で
指定しています。リスタートファイルには原子名が書かれていないため INPUT フェーズで
原子名の一致する座標を "COORDINA=PDB NAMECO=lys_w_min.pdb" と指定します。
■制御ファイル(md_wat2.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
SETBOU=
SETSHAKE=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTTRJ=
OUTLOG=
LOGFOR=
;
FORM
PDB
READ
PDB
READ
READ
100
500.0D0
20
2.0D0
100
10
DETA
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
NAMEBO=
NAMESH=
lys_w.tpl
lys_w_min.pdb
lys.mntinp
lys_w.pdb
lys_w.capbc
lys_w.shk
CPUTIM= 3600000.0D0
STOPCE= BOTH
RESTARt=
YES
NAMERI=
lys_w_md.res
METHOD=
CANONICAL THERMO=
CONS
SETTEM=
300.0D0
INITIA=
SET
STARTT=
300.0D0
RANDOM=
654321
NAMERO=
lys_w_md_2.res
in case of CAP boundary
CALCAP=
CALC
FUNCAP= HARMonic
RADCAP=
34.0
FORCAP= 100.0
SETCEN=
YES
NAMETR=
lys_wat2.mnt MNTRTR= ASCI
BESTFI=
YES
CUTMET=
RESA
CUTLEN= 10.0D0
DIEFUN=
CONS
DIEVAL= 1.0D0
SHAKEM=
HBON
CALV15=
CALC
CALV5N=
NOCALC
CALE15=
CALC
CALE5N=
NOCALC
CALHYD=
NOCALC
CALH5N=
NOCALC
QUIT
EXE> OUTPUT
COORDINATE= PDB
NAMECO=
lys_w_md_2.pdb
QUIT
EXE> END
myPresto 4.2
101
(8)ログ出力
計算ログの出力例を以下に示します。
■ログ出力
*******************************************************************************
MD LOOP NUMBER
:
LAP CPU TIME
:
(SEC)
TEMPERATURE (K)
TOTAL
KINETIC
20 TIME (PSEC)
:
0.01000
:
0.0000000E+00
(KCAL/MOL) :
-0.4029400E+05
299.9925948 SCALING FACTOR
(KCAL/MOL) :
(KCAL/MOL) :
HAMILTONIAN(NOSE)
:
39.5810551
:
-0.2936448E+05 POTENTIAL
0.1092952E+05
-0.2936448E+05
TOTAL : -0.4029400E+05 BOND
:
TORS. :
0.7281127E+03 IMPRO. :
-(1)
0.2342204E+03 ANGLE :
0.5763917E+02 VDW14 :
0.5456552E+03
0.4271405E+03
ELE14
:
0.3779113E+04
VDW15
:
0.3002577E+04
ELE15
:
-0.4906846E+05
DHR.
:
0.0000000E+00
REP.
:
0.0000000E+00
CAP.
:
0.0000000E+00
R.M.S.F. (KCAL/MOL*A) :
NAME OF MOLECULE
0.1761278E+02 RMSD (ANGSTROMS)
:
0.2545461E+00
MAX FORCE
TEMPERATURE
CAP ENERGY
LYZ
0.6555757E+02
0.1755462E+03
0.0000000E+00
WAT
0.7155075E+02
0.3165385E+03
0.0000000E+00
INFO>CUTOFF: 1-5 VDW & 1-5 HYD.BOND :
4877928 &
ERROR
-(2)
-(3)
0
*******************************************************************************
(1)能勢−HOOVER の方法での保存量である仮想ハミルトニアンの値。
(ただし、"THERMO= NOSE" 指定時にだけ出力される)
(2)RMSD は、1番目の鎖(chain)の原子に対して計算されます。
この例では lysozyme の RMSD です。
(3)分子種ごとに力の最大値と温度、CAP ポテンシャルの値が表示されます。
【注意】力場による "CALHYD= NOCALC" の指定に注意してください。Amber91 力場など水素
結合の LJ12-10 型ポテンシャルをあらわに含む力場では、"CALHYD=CALC" にします。
Amber94/96/99 力場では水素結合はクーロン力に含まれるため、"CALHYD=NOCALC" にし
ます。
myPresto 4.2
102
5.4
Sample-4:拡張アンサンブル(Force-biased McMD)−Alanine ペプチドの計算−
(1)Force-Biased Multicanonical MD 計算
cosgene では、Force-Biased Multicanonical MD(F.B.McMD)の計算ができます。蛋白質の
座 標 と ト ポ ロ ジ ー フ ァ イ ル は 、 い つ も ど お り に 準 備し て く だ さ い 。 こ の 例で は 、
Ace-Ala-Ala-Nme を例に、初期入力は、2面角入力 ala_ala.dih として準備されています。
最初に、tplgene を用いて、初期座標
ala_ala.pdb と、トポロジーファイル ala_ala.tpl
を準備してください。F.B.McMD は MD 手法なので、エネルギー最小化には適用できません。
通常の手法でエネルギー最小化を行ってください。
F.B.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、F.B.McMD を指定してくださ
い(EXPAND= FORC)。次に、実現したいマルチカノニカル分布の温度範囲を設定します。例
では、TEMMIN= 250 K ∼ TEMMAX= 700 K の範囲を指定しています。F.B.McMD では、スケー
リングのための重み関数をエネルギーのヒストグラムから作成します。エネルギーのヒス
トグラムを作成する範囲(ENEMIN∼ENEMAX)は、TEMMIN でのカノニカル分布のエネルギー
分布と TEMMAX でのカノニカル分布のエネルギー範囲を十分に被覆する必要がありますので、
あらかじめ TEMMIN と TEMMAX での NVT 計算を行っておいて、ENEMIN と ENEMAX の概算値を出
しておく必要があります。例では、T=250K でのエネルギー分布は 20∼30 kcal/mol、T=700
K でのエネルギー分布は 50∼70 kcal/mol 程度なので、ENEMIN=-100 kcal/mol、ENEMAX=400
kcal/mol と余裕をとって指定しています。ヒストグラム作成時の bin サイズ(BINSIZ)を指
定してください。例では 2 kcal/mol としています。MD シミュレーションを行う温度(T0=
SETTEM)は、運動方程式を解く時の温度で、TEMMIN < SETTEM < TEMMAX にとります。後は
F.B.McMD の反復1回あたりのループ回数(RESETC)と、データを捨てるダミーループの回数
(DUMMYL)を指示、全体のループ回数(LOOPLI)を指定します。LOOPLI は、RESETC の整数倍に
とってください。
■制御ファイル
;fbmcmd_vac.inp
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
(つづく)
myPresto 4.2
FORM
PDB
READ
PDB
30000000
50000.0D0
20
0.5D0
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
ala_ala.tpl
ala_min.pdb
ala.mntinp
ala_min.pdb
CPUTIM= 3600000.0D0
103
(つづき)
OUTTRJ=
OUTCOO=
OUTLOG=
LOGFOR=
1000
1000
2000
DETA
METHOD=
RESETC=
TEMMAX=
ENEMIN=
BINSIZ=
SETTEM=
LIMITS=
EXPA
300000
700.0
-100.0
2.0
600.0
0.001
STOPCE= BOTH
EXPAND=
DUMMYL=
TEMMIN=
ENEMAX=
LIMITC=
FORC
1000
250.0
400.0
0.001
INITIA=
STARTT=
RANDOM=
SET
600.0D0
654321
NAMETR=
NAMERO=
NAMECO=
NAMETO=
BESTFI=
ala_vac.mnt
ala_vac.rst
ala_vac.cor
ala_vac.eto
YES
MNTRTR=
ASCI
MNTRCO=
MNTRTO=
SING
ASCI
CUTMET=
DIEFUN=
RESA
DIST
CUTLEN=
DIEVAL=
99.0D0
4.0D0
CALV15=
CALE15=
CALHYD=
CALV5N=
CALE5N=
CALH5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
CALC
CALC
NOCALC
NOCALC
NOCALC
NOCALC
PDB
NAMECO=
ala_md.pdb
EXE> END
F.B.McMD が終了 すると、 座標の トラジェクトリファイルの他 に、expand.energy、
expand.prob、expand.scale の3つのファイルが出力されます(デフォルト時。パラメータ
NAMEEE,NAMEEP,NAMEES を用いて任意のファイル名を指定することもできます。)。カノニカ
ル分布を再現するための Reweighting による解析は、ツール reweightFB(詳細は巻末「B ユ
ーティリティ」を参照)と出力ファイル expand.scale により行われます。
myPresto 4.2
104
(2)カノニカル分布の再構成
解析ツール reweightFB を準備します。以下のようにコンパイルしてください。解析は短
時間で終了しますので、最適化オプションは通常不要です。
% f90 reweightFB.f90
?o reweightFB.x
入力ファイル inp_MUCA を次のように準備します。
カノニカル分布の再現には、このうち ttt3 ファイルが最も重要です。
expand.scale
ttt1 ttt2 ttt3 ttt4
2.0 251 10 100
600 260 700 20 1.d-05
1行目:入力ファイル名(デフォルト時 expand.scale)
2行目:出力ファイル名
1カラムめ:分配関数
2カラムめ:エネルギー、density of state の指数、全確率
3カラムめ:エネルギー、reweight されたカノニカル分布の確率
4カラムめ:温度、平均エネルギー、平均エネルギーの二乗、比熱
3行目:1カラムめ:F.B.McMD で指定した bin サイズ (=BINSIZ)
2カラムめ:ヒストグラムのデータ数 (=(ENEMAX-ENEMIN)/BINSIZ + 1)
3カラムめ:reweight を開始したい反復回数の番号
4カラムめ:reweight を終了したい反復回数の番号。
通常、最終の反復まで用いる(= LOOPLI/RESETC)
4行目:1カラムめ:MD シミュレーションに用いた T0(SETTEM)
2カラムめ:生成したいカノニカル分布の温度の下限( > TEMMIN)
3カラムめ:生成したいカノニカル分布の温度の上限( > TEMMAM)
4カラムめ:温度きざみ。温度の上限―温度の下限を割り切れる数字にする。
5カラムめ:WHAM 解析の閾値。10-5 以下にとること。
準備した解析ツールと入力ファイルを使い、
% reweightFB.x
で実行します。
myPresto 4.2
< inp_MUCA
105
出力ファイル ttt3 は、以下のようになります。例では、260 K でのカノニカル分布を再
現するのには、エネルギー21 kcal/mol∼61 kcal/mol の範囲において、2カラムめの確率
でトラジェクトリに出力された構造をサンプルすればカノニカル分布が再現されることを
示しています。
0.260000E+03
0.210000E+02
0.230000E+02
0.250000E+02
0.270000E+02
0.290000E+02
0.310000E+02
0.330000E+02
0.350000E+02
0.370000E+02
0.390000E+02
0.410000E+02
0.430000E+02
0.450000E+02
0.470000E+02
0.490000E+02
0.510000E+02
0.530000E+02
0.550000E+02
0.570000E+02
0.590000E+02
0.610000E+02
0.480194E-04
0.122335E-02
0.917415E-02
0.322814E-01
0.732955E-01
0.126560E+00
0.173496E+00
0.193453E+00
0.173022E+00
0.116629E+00
0.614765E-01
0.263826E-01
0.928163E-02
0.277370E-02
0.708900E-03
0.158080E-03
0.312139E-04
0.549539E-05
0.875144E-06
0.126766E-06
0.167411E-07
Sample6 では座標トラジェクトリからこの確率分布に従って、構造を抽出し代表構造を出力
する方法を説明します。
出力ファイル ttt3 のなかから再現したい温度の部分のみを切り出し、以下のようにエネル
ギーと確率分布の2列のファイルにしておきます(pdf260_fb)。
0.210000E+02
0.230000E+02
0.250000E+02
(中略)
0.510000E+02
0.530000E+02
0.550000E+02
0.570000E+02
0.590000E+02
0.480194E-04
0.122335E-02
0.917415E-02
0.158080E-03
0.312139E-04
0.549539E-05
0.875144E-06
0.126766E-06
0.610000E+02 0.167411E-07
myPresto 4.2
106
5.5
Sample-5:拡張アンサンブル(Simulated Tempering McMD)−Alanine ペプチドの計算−
(1)Simulated Tempering Multicanonical MD 計算
cosgene では、Simulated Tempering Multicanonical MD(S.T.McMD)の計算ができます。
ここでは sample4 と同じ系を用いて説明します。sample4 の手順に従ってエネルギー最小化
までの計算を行ってください。
S.T.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、S.T.McMD を指定してくださ
い(EXPAND= SIMU)。次に、実現したいマルチカノニカル分布の温度範囲を設定します。例
では、TEMMIN= 250 K ∼ TEMMAX= 700 K の範囲を指定しています。エネルギーのヒストグ
ラムのためのパラメータ ENEMIN、ENEMAX および BINSIZ は F.B.McMD の場合と同様にあらか
じめ TEMMIN と TEMMAX での NVT 計算を行って決定します。
温度遷移幅ΔT は TEMMAX(最大温度)-TEMMIN(最低温度)を温度分割数(STTNUM)で割った
値となります。温度分割数(STTNUM)を大きくしてΔT を小さくすると自然な温度遷移が実
現しますが、すべての温度をサンプリングするために必要となる計算回数も増大します。
cosgene に実装した S.T.McMD では、温度遷移確率の計算にガイド関数(E-E0 )/kB T2 を利用
しています。ENEMIN と同様の方法で最低エネルギーE0 の概算値を求めパラメータ STEBAS に
設定します。MD シミュレーションを行う温度(T0= SETTEM)は、運動方程式を解く時の温
度で、TEMMIN < SETTEM < TEMMAX にとります。後は S.T.McMD の反復1回あたりのループ回
数(RESETC)と、データを 捨てるダミーループの回数(DUMMYL)を指示、全体のループ回数
(LOOPLI)を指定します。LOOPLI は、RESETC の整数倍にとってください。
■制御ファイル
;stmcmd_vac.inp
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
(つづく)
myPresto 4.2
FORM
PDB
READ
PDB
30000000
50000.0D0
20
0.5D0
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
ala_ala.tpl
ala_min.pdb
ala.mntinp
ala_min.pdb
CPUTIM= 3600000.0D0
107
(つづき)
OUTTRJ=
OUTCOO=
OUTLOG=
LOGFOR=
1000
1000
2000
DETA
METHOD=
RESETC=
TEMMAX=
ENEMIN=
BINSIZ=
SETTEM=
LIMITS=
STTNUM=
STEBAS=
EXPA
300000
700.0
-100.0
2.0
600.0
0.001
100
-100.0
INITIA=
STARTT=
RANDOM=
NAMETR=
NAMERO=
NAMECO=
NAMETO=
BESTFI=
STOPCE= BOTH
EXPAND=
DUMMYL=
TEMMIN=
ENEMAX=
LIMITC=
SIMU
1000
250.0
400.0
0.001
SET
600.0D0
654321
ala_st.mnt
ala_st.rst
ala_st.cor
ala_st.eto
YES
CUTMET=
DIEFUN=
CALV15=
CALE15=
CALHYD=
CALV5N=
CALE5N=
CALH5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
RESA
DIST
MNTRTR=
ASCI
MNTRCO=
MNTRTO=
SING
ASCI
CUTLEN=
DIEVAL=
99.0D0
4.0D0
CALC
CALC
NOCALC
NOCALC
NOCALC
NOCALC
PDB
NAMECO=
ala_st.pdb
EXE> END
S.T.McMD が 終 了 す る と 、 座 標 ト ラ ジ ェ ク ト リ フ ァ イ ル の他 に 、 expand.energy 、
expand.prob、expand.scale の3つのファイルが出力されます(デフォルト時)。通常のロ
グファイルには参照温度が出力されますので、温度遷移の状態は、expand.energy を参照し
ます(1カラム目:エネルギー、2カラム目:温度)。カノニカル分布を再現するための
Reweighting による解析は、ツール reweightST(詳細は巻末「B ユーティリティ」を参照)
と出力ファイル expand.energy により行われます。
myPresto 4.2
108
(2)カノニカル分布の再構成
解析ツール reweightST を準備します。以下のようにコンパイルしてください。解析は短
時間で終了しますので、最適化オプションは通常不要です。
% f90
reweightST.f90
?o reweightST.x
入力ファイル inp_ST を次のように準備します。
カノニカル分布の再現には、このうち canonical ファイルが最も重要です。
expand.energy
average canonical
2.0 250.0 700.0 9.0
1 29999000
600.0
1行目:入力ファイル名(デフォルト時 expand.energy)
2行目:出力ファイル名
1カラム目:平均エネルギー
2カラム目:reweight されたカノニカル分布の確率
3行目:1カラム目:S.T.McMD で指定した bin サイズ (=BINSIZ)
2カラム目:分布を出力する温度の下限( > TEMMIN)
3カラム目:分布を出力する温度の上限( < TEMMAX)
4カラム目:温度分割数。上限−下限をこの数に分割して計算・出力します。
4行目:1カラム目:サンプリング区間先頭(ダミーループ後からカウント)
2カラム目:サンプリング区間最後(ダミーループ後からカウント)
5行目:1カラムめ:参照温度、S.T.McMD で指定した SETTEM
準備した解析ツールと入力ファイルを使い、
% reweightST.x
< inp_ST
で実行します。
出力ファイル canonical は、以下のようになります。これは 362.5K(334.4 K-390.6K)で
サンプリングされたエネルギーヒストグラムから作成したものであり 、エネルギー17
kcal/mol∼73 kcal/mol の範囲において、2カラムめの確率でトラジェクトリに出力された
構造をサンプルすれば分布が再現されることを示しています。
myPresto 4.2
109
(前略)
362.5000
0.170000E+02
0.190000E+02
0.210000E+02
0.230000E+02
0.250000E+02
0.270000E+02
(中略)
0.550000E+02
0.570000E+02
0.590000E+02
0.610000E+02
0.630000E+02
0.650000E+02
0.670000E+02
0.690000E+02
0.710000E+02
0.730000E+02
(後略)
0.482616E-06
0.144785E-05
0.231656E-04
0.209455E-03
0.121378E-02
0.491255E-02
0.655827E-02
0.320747E-02
0.141262E-02
0.610027E-03
0.256269E-03
0.112932E-03
0.448833E-04
0.164089E-04
0.337831E-05
0.144785E-05
Sample4 の F.B.McMD の時と同様この確率分布ファイルから再現したい温度の部分だけを切
り出しておき、Sample6 の構造の抽出とクラスタリングで利用します(pdf363_st)。
myPresto 4.2
110
5.6
Sample-6:拡張アンサンブル(Generalized ST McMD)−Alanine ペプチドの計算−
(1)Generalized Simulated Tempering Multicanonical MD 計算
cosgene では、Generalized Simulated Tempering Multicanonical MD(G.S.T.McMD)の計
算ができます。この機能を用いると、Tsallis 分布に従ったサブアンサンブル間を自動的に
最適に推移することにより、広範なエネルギー分布の構造探索を実現することができます。
ここでは sample4 と同じ系を用いて説明します。sample4 の手順に従ってエネルギー最小化
までの計算を行ってください。
G.S.T.McMD では、拡張アンサンブルを指示し(METHOD= EXPA)、G.S.T.McMD を指定してく
ださい(EXPAND= GST)。
G.S.T.McMD で特に重要なパラメータは、GSTBAS、GSTETA、GSTMIN、GSTMAX、GSTNUM です。
これらの設定により、サンプリングされるエネルギー範囲、用いるサブアンサンブルの数
が決まることとなるため後に再構成したい温度範囲を考慮して決定する必要があります。
まず、再構成したい温度範囲を含むようにやや 余裕を持って上限温度 (Tmax)、下限温度
(Tmin)を決め、予めこれらの上限、下限温度における NVT 計算により平均ポテンシャルエ
ネルギーを求めておきます。
複数のサブアンサンブルのインデックスとなるλは GSTMIN∼GSTMAX を GSTNUM 個に分割
した離散値をとります。E0 :GSTBAS は計算中 E-E0 >0 を保障するためのものであるため Tmin
でおこなった NVT 計算におけるポテンシャルエネルギーの最小値を参考に決定します。
T:実効温度、T0 :SETTEMP で指定する温度(参照温度)、η:GSTETA、E0:GSTBAS、E:ポテ
ンシャルエネルギーとしたとき、
T/T0 =η+λ(E-E0 )
の関係がありますので、これが Tmin/T0 から Tmax/T0 までの値をとるようにパラメーターを
設定します。ηを Tmin/T0 程度の値に設定し、λが上限 GSTMAX をとったときに η+λ
(Emax-E0 )が Tmax/T0 を上回るように GSTMAX 設定すればよいことになります(Emax は Tmax
における NVT 計算時の平均ポテンシャルエネルギーを参考にする)。GSTNUM はサブアンサン
ブル間の遷移が円滑に生じるよう系に合わせて設定します。
ENEMIN、ENEMAX および BINSIZ はポテンシャルエネルギーのヒストグラム作成のためのも
のであり F.B.McMD の場合と同様に計算中に ENEMIN∼ENEMAX の範囲を超えないように Tmin
と Tmax での NVT 計算の結果を参考に決定します。
インデックスλを最適に遷移させるため、RESETC ごとにλの重みの再計算が行われます。
系に合わせて十分な大きさの RESETC を設定する必要があります。GSTUPD はサブアンサンブ
ル間の遷移を試すステップ間隔となります。
myPresto 4.2
111
■制御ファイル
;gstmcmd_vac.inp
EXE> INPUT
TOPOLOGY= FORM NAMETO= ala_ala.tpl
COORDINA= PDB NAMECO= ala_min.pdb
OUTMONIT= READ NAMEMO= ala.mntinp
REFCOORD= PDB NAMERE= ala_min.pdb
QUIT
EXE> MD
LOOPLI= 20000000
SETTIM= 50000.0D0 CPUTIM=3600000.0D0
UPDATE= 20
TIMEST= 0.5D0
OUTTRJ= 1000
OUTCOO= 1000
OUTLOG= 2000
LOGFOR= DETA STOPCE= BOTH
METHOD= EXPA EXPAND= GST
SETTEM= 600.0
RESETC=100000
GSTCON=10000000
GSTBAS=0.0d0
GSTETA=0.3d0
GSTSAM=50000
MNTRXE=ASCI
ENEMIN=0.0
ENEMAX=500.0
BINSIZ=0.5
GSTUPD=100
GSTMIN=0.001d0
GSTMAX=0.015d0
GSTNUM=40
INITIA= SET
STARTT= 600.0D0
RANDOM= 654321
NAMETR=
NAMERO=
NAMECO=
NAMETO=
BESTFI=
ala_gst.mnt MNTRTR= ASCI
ala_gst.rst
ala_gst.cor MNTRCO= SING
ala_gst.eto MNTRTO= ASCI
YES
CUTMET= RESA
DIEFUN= DIST
CUTLEN= 99.0D0
DIEVAL= 4.0D0
(つづく)
myPresto 4.2
112
(つづき)
CALV15= CALC
CALE15= CALC
CALHYD= NOCALC
CALV5N= NOCALC
CALE5N= NOCALC
CALH5N= NOCALC
QUIT
EXE>OUTPUT
COORDINATE=PDB NAMECO=ala_gst.pdb
QUIT
EXE>END
G.S.T.McMD が終了 すると 、座 標トラジェクトリファイル の他に 、expand.energy、
expand.scale ファイルが 出力されます 。ポテンシャルエネルギーの変 化については
expand.energy の第1カラム、λの遷移の状態は第3カラムで確認できます。カノニカル分
布を再現するための Reweighting による解析は、ツール reweightGST(詳細は巻末「B ユー
ティリティ」を参照)と出力ファイル expand.energy により行われます。
myPresto 4.2
113
(2)カノニカル分布の再構成
解析ツール reweightGST を準備します。以下のようにコンパイルしてください。解析は
短時間で終了しますので、最適化オプションは通常不要です。
% f90
reweightGST.f90
?o reweightGST.x
入力ファイル inp_GST を次のように準備します。
カノニカル分布の再現には、このうち ttt3 ファイルが最も重要です。
expand.energy
lambda-pdf lambda-ene-pdf
ttt1 ttt2 ttt3 ttt4
0.5 0.001d0 0.015d0 40 0.0d0 0.3d0
1 18000000
250.0 700.0 50.0 600
1行目:入力ファイル名(デフォルト時 expand.energy)
2行目:出力ファイル名
1カラム目:λの分布
2カラム目:λごとのエネルギー分布
3行目:出力ファイル名
1カラム目:分配関数
2カラム目:エネルギー、density of state の指数、全確率
3カラム目:エネルギー、reweight されたカノニカル分布の確率
4カラム目:温度、平均エネルギー、平均エネルギーの二乗、比熱
4行目:1カラム目:G.S.T.McMD で指定した bin サイズ (=BINSIZ)
2カラム目:λの下限(=GSTMIN)
3カラム目:λの上限(=GSTMAX)
4カラム目:λの分割数(=GSTNUM)
5カラム目:ベースエネルギー(=GSTBAS)
6カラム目:η(=GSTETA)
5行目:1カラム目:サンプリング区間先頭
2カラム目:サンプリング区間最後(<LOOPLI-GSTNUM*GSTSAM)
はじめに GSTNUM*GSTSAM ステップ分の予備的サンプリングを行うため。
6行目:1カラム目:生成したいカノニカル分布の温度の下限
2カラム目:生成したいカノニカル分布の温度の上限
3カラム目:温度きざみ。
4カラム目:MD シミュレーションに用いた T0(SETTEM)
myPresto 4.2
114
準備した解析ツールと入力ファイルを使い、
% reweightGST.x < inp_GST
で実行します。
出力ファイル(この例での ttt3)は、以下のようになります。構造トラジェクトリから、
第一カラムに示されるエネルギーの構造を2カラム目の確率でサンプルすれば 300K のカノ
ニカル分布が再現されることを示しています。
(前略)
0.300000E+03
0.137500E+02
0.142500E+02
(中略)
0.577500E+02
0.582500E+02
0.587500E+02
0.592500E+02
(後略)
0.234968E-07
0.836684E-07
0.658355E-07
0.430977E-07
0.279324E-07
0.181532E-07
Sample4 の F.B.McMD の時と同様この確率分布ファイルから再現したい温度の部分だけを切
り出し Sample7 の構造の抽出とクラスタリングで利用できます。
myPresto 4.2
115
5.7
Sample-7:拡張アンサンブル−構造の抽出とクラスタリング−
(1)再構成したカノニカル分布を用いた構造の抽出
Sample-4(F.B.McMD), Sample-5(S.T.McMD) お よ び Sample-6(G.S.T.McMD) に お い て
reweight により任意の温度でのエネルギー分布を計算しました。ここではそのエネルギー
分布を満たすように、トラジェクトリファイルから座標を抽出します。
構造の抽出には解析ツール selection を用います(詳細は巻末「B ユーティリティ」を
参照)。次の入力ファイルを用意します(select.inp)。
pdf363_st
ala_st.cor
S
1000
30000000
0.5
ala_st_363.cor
32
第1行目に、Sample-4, Sample-5 あるいは Sample-6 の最後で作成したエネルギー確率分
布ファイルを指定します。
第2行目は MD 実行時に出力されたトラジェクトリファイルを指定します。
第3行目はトラジェクトリファイルの型(Single │ Double)です。MD 実行時の指定と一致
させます。
第4、5行目でサンプリング区間を指定します。
第6行目で抽出する構造の割合(%)を指定します。サンプリング区間の構造のうちこ
こで指定した割合の構造が出力されます。
第7行目で出力トラジェクトリファイル名を指定します。
第8行目で原子数を指定します。
% selection
< select.inp
で実行します。
myPresto 4.2
116
(2)構造のクラスタリング
次に、(1)でカノニカル分布を構成するように抽出した多数の構造からクラスタ解析に
より代表構造を取り出す方法を説明します。構造間の RMSD を用いてクラスタリングを行い
ます。
クラスタ解析には解析ツール clustering を使用します(詳細は巻末「B ユーティリティ」
を参照)。
まず、以下のような制御ファイル(clustering.inp)を用意します。
ala_ala.tpl
y
ala_ala.fit
y
ala_ala.rmsd
400
10
1
500
ala_st_363.cor
S
average
ala_st_363.cls
ala_st_363.tree
第1行目にトポロジーファイルを指定します。
第 2 行目には RMSD 計算時の bestfit 適用の有無を指定します(y │ n)。
bestfit の実行を指定したときは次行に bestfit に使用する原子を指定するファイルの名
前を記述します。
ここでは ala_ala.fit として下記の内容のファイルを用意します。この例ではチェイン 1
の残基1−4の水素を bestfit に使用しないよう設定しています。この記述形式は cosgene
の系の重心合わせ指定用ファイルと同じです。詳細は A.2.11 をご参照ください。
SETBST> LIST
FIX 1 1 1 4 H* YES;
myPresto 4.2
117
第4行目には RMSD の計算に使用する原子の指定の有無を記述します(y │ n)。指定する
場合に は次 行に RMSD の計 算に 用い る原 子の 指定フ ァ イ ル名 を記 述し ま す。 今回は
ala_ala.fit と同内容のものを ala_ala.rmsd として用います。bestfit、RMSD に使用され
た原子は実行時のログで確認できます。
第6行目にはクラスタリングに使用する構造数を指定します。系にもよりますが 1000 個
以内程度で指定します。第7行目には最終的なクラスタの数を指定します。
第8、9行目で使用する座標トラジェクトリの範囲の開始・終了位置を指定します。
このトラジェクトリの範囲は第6行目に指定した構造数を確保できるように指定します。
また、先ほど select ツールにより取り出した構造数の範囲内で指定します。
第10行目に座標トラジェクトリのファイル名を指定します。今回は select ツールによ
りカノニカル分布を再現したトラジェクトリファイルを使用します。
第11行目にはトラジェクトリファイルの形式を指定します。(S │ D)
第12 行目に は ク ラ ス タ リ ン グ の方 法を 記述 します (”nearest”│ “furthest”│
“median” │ “centroid”│ “average”│ “flexible”│ “ward”)。
ここで flexible を指定した場合は次行にβ値を設定します。
第13行目には出力 PDB ファイルの先頭名を指定します。
第14行目には出力デンドログラムのファイル名を指定します。
% clustering < clustering.inp
で実行します。ログ出力のうちクラスタごとに出力された構造数、平均構造との RMSD がク
ラスタの特徴をよく表します。
(前略)
CLUSTER ID
STRUCTURE COUNT
LOOP NUMBER
RMSD OF AVERAGE
OUTPUT PDB FILE
:
1
:
32
:
16969000
:
1.44551613437161
:ala_st_363.cls.16969000
CLUSTER ID
STRUCTURE COUNT
LOOP NUMBER
RMSD OF AVERAGE
OUTPUT PDB FILE
:
2
:
32
:
8055000
:
1.87505849035797
:ala_st_363.cls.8055000
(後略)
指定したクラスタ個数の構造(PDB 形式)のほか、デンドログラムファイル(PHYLIP 形式)
が出力され汎用的なツールを用いて表示することができます。デンドログラムは二つの構
造(またはクラスター)とその間の RMSD からなる3分木で表示されます。
myPresto 4.2
118
23.2573910252864
7.66306178006837
3.26001926531007
79000 44.7507362365723
LOOP 79000, E=44.75
5346000 41.2941055297852
LOOP 5346000, E=41.29
1.88731415528864
RMSD
8076000 47.0816841125488
22555000 49.8077392578125
1.21994863853140
17713000 43.7229232788086
myPresto 4.2
119
5.8
Sample-8:低分子トポロジーの生成
−Methanol の計算−
(1)計算入力ファイルの準備
蛋白質、ヌクレオチドのトポロジーファイルの作成は tplgene で行います。これに対し、
低分子化合物のトポロジーファイルを作成する場合は tplgeneL を使用します。
低分子のトポロジーファイルを作成するには、大きく分けて、2 種類の方法があります。
方法1:量子化学計算で得られた電荷情報、結合次数情報、座標情報を基にして"tplgeneL
オリジナル形式ファイル"を作成し、そのファイル群を用いて計算する方法
方法2:"Sybyl mol2"ファイルを準備し、そのファイル内の電荷情報の項目に値を入力し、
その結果のファイルを用いて計算を行う方法
以下の説明では、tplgeneL の環境変数が次のように設定されているものとします(設定方
法は「3.2.6
環境変数」参照)。
TPLL_INPUT_PATH
⇒ ./
カレントディレクトリ
TPLL_OUTPUT_PATH
⇒ ./
カレントディレクトリ
TPLL_DB_PATH
⇒ /home/user01/myPresto/tplgeneL/DB
tplgeneL 力場パラメータ DB 用ディレクトリ
【注意】tplgeneL オリジナル形式ファイルの作成ツールとして、GAMESS の出力用と、
Gaussian の出力用の 2 種類があります。
(詳細は「B.8 Gamess2tplinp」および「B.9 Gauss2tplinp」を参照)
(2)tplgeneL オリジナル形式ファイルからトポロジーファイルを生成させる場合
ここでは、量子化学計算プログラム GAMESS による計算結果を基にトポロジーファイルを
作成する方法を説明します。
■実行方法
① まず始めに methanol 分子の量子化学計算を行います。GAMESS で methanol 分子の計算を
行い、計算結果の出力ファイルを"methanol.log"とします。
② ツール Gamess2tplinp を使用して、①で得られた"methanol.log"ファイルから tplgeneL
オリジナル形式ファイルを作成します。
実行ディレクトリで、"Gamess2tplinp
methanol.log"とタイプします。今回の場合には、
"methanol.charge"、"methanol.bond"、"methanol.zmat"の 3 種類のファイルが作成されま
myPresto 4.2
120
す。
%Gamess2tplinp
methanol.log
③ ②で得られたファイルを入力ファイル用ディレクトリにコピーします。
④ tplgeneL を実行します。引数なしで "tplgeneL" とタイプして対話型で起動します。
%tplgeneL
⑤ 順次、ファイル形式、入力ファイル名、不足パラメータの補填方法、力場パラメータ DB
名、フラグメント DB を使用するか否か、を入力します。
■実行例
Please select Input File Format by the next number!
1 : tplgeneL original (*.bond,*.charge,*.zmat)
2 : Sybyl mol2 (*.mol2)
1
Please select Input File Name!
./
ala.bond
ala.zmat
methanol.mol2
phenylalanine.charge
ala.charge methanol.bond
methanol.zmat
phenylalanine.zmat
ala.mol2
methanol.charge phenylalanine.bond xylitol.bond
methanol
xylitol.charge
xylitol.zmat
What processing do you do if there is a missing parameter?
Please select 1 or 2! (default : 1)
1 : use default parameters.
2 : calculate parameters.
3 : use default parameters, when default parameters exist.
use calculated parameters, when default parameters don't exist.
1
Please select Input DB Name(prm_gaff.db/prm_amber99.db)!
(default : prm_gaff.db)
/home/user01/myPresto/tplgeneL/DB
angle.prm
bond.prm
nonbond_amber99.db prm_gaff.db
atomtype_amber99.db frg_amber99.db nonbond_gaff.db
atomtype_gaff.db
frg_gaff.db
prm_amber99.db
prm_gaff.db
Do you want to use FragmentDB ? (yes(y)/no(n) default : no)
no
%% Program is done. %%
%% This program ended normally. %%
(3)Sybyl mol2 形式ファイルからトポロジーファイルを生成させる場合
ここでは、トポロジーファイルを作成したい低分子化合物の Sybyl mol2 形式ファイルか
myPresto 4.2
121
らトポロジーファイルを作成する方法を説明します。
■実行方法
① トポロジーファイルを作成したい低分子化合物の Sybyl mol2 形式ファイルを準備しま
す。ここでは methanol に関する mol2 形式ファイル"methanol.mol2"とします。環境変数で
設定した入力ファイルディレクトリに、"methanol.mol2"を置きます。
② tplgeneL を実行します。引数なしで "tplgeneL" とタイプして対話型で起動します。
%tplgeneL
③ 順次、ファイル形式、入力ファイル名、不足パラメータの補填方法、力場パラメータ DB
名、フラグメント DB を使用するか否か、を入力します。
【注意】tplgeneL には水素原子の欠損している場合の付加機能はありませんので、水素原
子情報を含む mol2 形式ファイルを準備する必要があります。
myPresto 4.2
122
■実行例
Please select Input File Format by the next number!
1 : tplgeneL original (*.bond,*.charge,*.zmat)
2 : Sybyl mol2 (*.mol2)
2
Please select Input File Name!
./
ala.bond
ala.zmat
methanol.mol2
phenylalanine.charge
ala.charge methanol.bond
methanol.zmat
phenylalanine.zmat
ala.mol2
methanol.charge phenylalanine.bond xylitol.bond
methanol
What processing do you do if there is a missing parameter?
Please select 1 or 2! (default : 1)
1 : use default parameters.
2 : calculate parameters.
3 : use default parameters, when default parameters exist.
use calculated parameters, when default parameters don't exist.
xylitol.charge
xylitol.zmat
1
Please select Input DB Name(prm_gaff.db/prm_amber99.db)!
(default : prm_gaff.db)
/home/user01/myPresto/tplgeneL/DB
angle.prm
bond.prm
nonbond_amber99.db prm_gaff.db
atomtype_amber99.db frg_amber99.db nonbond_gaff.db
atomtype_gaff.db
frg_gaff.db
prm_amber99.db
prm_gaff.db
Do you want to use FragmentDB ? (yes(y)/no(n) default : no)
no
%% Program is done. %%
%% This program ended normally. %%
myPresto 4.2
123
5.9
Sample-9:自由エネルギー計算(Filling Potential 法)−水中のメタンの計算−
(1)Filling Potential 法による自由エネルギー計算手順
Filling Potential の計算では、対象の 2 分子が結合した安定な状態を初期構造にします。
この結合状態にある分子のうち片側に、アンブレラポテンシャルを発生させ、分子運動を
させます。この運動の際に、ランドマークとする原子の軌跡を記憶しておき、次の計算時
には前の軌跡の周辺に反発型のポテンシャルをとります。これにより、次の計算では過去
の軌跡ではない新しい軌跡をとることができるため、ポテンシャル障壁を乗り越えるよう
な計算を行うことができます。
この操作を繰り返し行っていき、分子が完全に解離状態になった時点で、今まで辿ってき
た軌跡を WHAM 解析することで、自由エネルギー差を求めることができます。
① アンブレラポテンシャルを加えた MD 計算を行う。
② 軌跡の周辺に、次回の MD 計算のアンブレラポテンシャルを発生させる。
③ ランドマーク原子の軌跡を抽出し、保存する。
④ ①∼③の操作を解離状態になるまで繰り返す。
⑤ これまでの軌跡に対して、WHAM 解析を行う。
md_w.inp
解離状態になるまで
繰り返して計算を行う。
MD 計算
Generate_nextFP.inp
アンブレラポテンシャルの発生
Extract_atom.inp
ランドマーク原子の軌跡を抽出
ganzine.sh(スクリプト)
WHAM_analysis.inp
WHAM 解析
図.Filling Potential 法による自由エネルギー計算手順
myPresto 4.2
124
(2)サンプル入力ファイル解説
・初期座標構造(ch42w.pdb)
:使用する系の初期構造を PDB 形式で用意します。
・MD 計算入力(md_w.inp)
:Filling Potential による MD 計算用の入力です。
・アンブレラポテンシャル更新プログラム入力:アンブレラポテンシャルの更新を行う
(Generate_nextFP.inp)
プログラムの入力ファイル。
・ランドマーク原子の軌跡抽出プログラム入力:ランドマークにしている原子の軌跡を、
(Extract_atom.inp)
全体の軌跡ファイルから抽出する
プログラムの入力ファイル。
・アンブレラポテンシャルファイル:アンブレラポテンシャルの位置情報ファイル。
(newopt_fp、newopt_fp_ini)
計算が進むにつれて更新される。
・計算全体を実行するスクリプト
:Filling Potential の3種類のプログラムを連続
(ganzene.sh)
に実行するためのスクリプト。
・WHAM 解析プログラム入力雛形
(WHAM_analysis.head)
:スクリプトにより計算された軌跡ファイルを WHAM
法により解析するプログラムの入力ファイル雛形。
【注意】別な系を計算する場合に最低限修正すべき箇所を、以下の入力ファイル例では、
太字で表示しています。
(3)アンブレラポテンシャルを加えた MD 計算(cosgene)
cosgene 制御ファイルの EXE> MD グループに"CALUMB=CALC"と"NAMEUM=newopt_fp"を指定
し、アンブレラポテンシャルを加えた MD 計算を行います。
(4)アンブレラポテンシャルの発生(Generate_nextFP ツール)
最初のアンブレラポテンシャルの中心座標は、"newopt_fp_ini"記述します。計算過程中の
アンブレラポテンシャルの座標と、その時点でのディメンションは、"newopt_fp"に記載し
ています。"newopt_fp"ファイルは次回の MD の計算の入力にもなっています。
■アンブレラポテンシャルファイル
FILL>GAUS
1 1
6
0.000
0.0300
ATOM 6 CA
myPresto 4.2
; アンブレラポテンシャルの形状指定(GAUSのみ)
; アンブレラポテンシャルのネスト数と対象原子数
; ランドマーク原子の原子番号
; ガウス型ポテンシャルの高さ
; ガウス型ポテンシャルの幅
ACE 2 0.000 0.000 −2.000
; ポテンシャルの中心座標
125
【注意】ポテンシャルの中心座標の後には、何も記載しないようにしてください。
計算エラーが発生します。
次回の MD 計算のためのアンブレラポテンシャルファイルは、直前の MD 計算結果の軌跡フ
ァイルから、Generate_nextFP ツールを使用して発生させることができます。このツールは
前の軌跡の座標点には移動しないように、次のアンブレラポテンシャルを発生させるツー
ルです。さらに、最終的なアンブレラポテンシャルの座標も同時に設定します。
■Generate_nextFP ツールの入力(Generate_nextFP.inp)
newopt_fp
newopt_fp2
initial.pdb
xx_traject.cor
-1000
2000
s
n
HAR1
300.0
0.3
0.0 0.0
3.000
5.0
0.20
ATOM
4131 O
;
;
;
;
;
;
;
;
;
;
;
;
;
;
アンブレラポテンシャルファイル
次のアンブレラポテンシャルファイル
初期座標
トラジェクトリファイル名
トラジェクトリ読み飛ばし回数
トラジェクトリの読み込み回数
座標トラジェクトリファイルの形式( “s”ingle or “d”oubule )
PDB ファイルの画面表示
求心関数の形状
対象の温度
ガウス型反発関数の高さ
RMSD による移動距離の調整パラメータ
ガウス型反発関数の幅
求心関数の高さ
; 求心関数の幅
WAT
839
0.000 0.000 -6.000 16.00 -0.83
; アンブレラポテンシャルの中心の目標座標(PDB 形式)
Target Molecule A
Umbrella Potential 2nd
Potential Target
Umbrella Potential 1st
一度経験した座標には、アンブレ
CH4
CH4
CH4
X
ラポテンシャルが 発生し て そ の
座標には戻れなくなる。
Target Molecule B
dissociation
myPresto 4.2
126
(5)ランドマーク原子の軌跡の抽出(Extract_Atom ツール)
Extract_Atom ツールを使用して、MD 計算中に出力される軌跡ファイルとアンブレラポテ
ンシャルの記述ファイルから、ランドマークとなる原子の軌跡を抽出します。
■Extract_Atom ツールの入力(Extract_Atom.inp)
newopt_fp
1033
; 全原子数(初期構造ファイルを tail コマンドなどで確認)
1
; 読み込むトラジェクトリーの数
xx_traject.cor
xx_cont.cor ; 読み込むトラジェクトリ名_出力トラジェクトリ名
0
; 座標の読み飛ばし回数
2000
; 座標の読み込み回数
s
; 座標トラジェクトリファイルの形式( “s”ingle or “d”oubule )
【注意】座標の読み込み回数値は、あまり大きな値を使用すると、エラーが発生します。
エラーが発生した場合には、この値を変化させてみてください。この値は MD 計算の設定フ
ァイルの記述に依存します。
(6)計算全体を実行するスクリプト(ganzene.sh)
Filling Potential の3種類のプログラム(MD 計算、アンブレラポテンシャルの発生、ラ
ンドマーク原子の抽出)を繰り返し行います。他の入力とファイル名の整合性を確認して
ください。
■スクリプト(ganzene.sh)
#!/bin/csh
# program directory
set cosgene=/user1/myPresto/cosgene/bin/cosgene
; この部分は御使用の環境にあわせて、変更して使用してください。
cp ch42w.pdb initial.pdb
; 初期構造の設定
:
rm xx_traject.cor
@ cycle1 = 60
;
計算のサイクル数
@ counter = 1
;
カウンターの初期化
cp newopt_fp_ini newopt_fp
;
初期のアンブレラ ファイルを設定
(つづく)
myPresto 4.2
127
(つづき)
;
# program directory
set cosgene=/user1/myPresto/cosgene/bin/cosgene
この部分は御使用の環境にあわせて、変更して使用してください。
while ($counter < $cycle1)
$cosgene
<
md_w.inp
>
; ループ 設定
output
;
MD計算の実行コマンド
while (! -e final.pdb)
sleep 10
end
sleep 30
; ループによりMD計算が終了するまで、
; 次のステップにすすまないように設定
;
;
cp final.pdb
mv output
; 最終構造のコピー
; MD計算の出力のコピー
$GeneFPx
<
w_$counter.pdb
w_$counter.output
$GeneFPinp
>
GeneFP.out
; アンブレラポテンシャルの 更新
while (! -e newopt_fp2)
sleep 2
end
mv newopt_fp2 newopt_fp
$Extractx
<
$Extractinp
; 出力を次のアンブレラポテンシャルの
; 初期座標ファイルとしてコピーする。
>
Extract.out
; ランドマーク 原子の抽出
while (! -e xx_cont.cor)
sleep 3
end
sleep 2
mv xx_cont.cor
w_$counter.cor
mv final.pdb initial.pdb
; 抽出したトラジェクトリの保存
; 最終構造を次の計算の初期構造と
; してコピーする
myPresto 4.2
128
(7)WHAM 解析(WHAM_analysis ツール)
抽出したランドマーク原子の軌跡ファイルを解析して、WHAM 法により自由エネルギーの計
算を行います。軌跡ファイルの重なりが不十分な場合には、出力の数値がされない場合が
ありますので、注意してください。また、エネルギーを平均する半径も、系の大きさなど
に合わせて、調整をおこなってください。
■WHAM_analysis ツールの入力(WHAM_analysis.inp)
w_60.option ; 最終世代のアンブレラポテンシャルファイル
0
; ファイルの読み飛ばし回数
2000
; サンプリングする回数(MD 計算と、Extract の数に依存)
s
; 読み込みファイルの精度( “s”ingle or “d”oubule )
1.0
; エネルギーを平均する半径
1000
; WHAM の反復解法の回数
300.0
; 計算温度
m
; メモリ優先か、速度優先かの選択
60
; トラジェクトリファイルの個数
w_1.cor w_1.option ; 各世代のトラジェクトリとアンブレラポテンシャル記述ファイル
w_2.cor w_2.option ; 全ファイル名を 1 行ずつ記入する。
:
w_60.cor w_60.option
自由エネルギーの計算は、入力ファイルの下から 2 個目の設定値であるエネルギーを平均
化する半径内のデータ点を計算します。目的の範囲に併せて設定値の調整を行ってくださ
い。解析された結果は、OUT ファイルの最後の部分に出力されます。
■出力ファイル例
INFORMATION> WHAM ANALYSIS RESULT
EXP-ID
R.M.S.D(A)
AVERAGE
FREE-ENERGY
1
0.000000
0.000009425
0.712812629E+01
2
0.500101
0.000002134
0.804317891E+01
3
0.410962
0.000006086
0.739754038E+01
4
0.859058
0.000002663
0.790654353E+01
:
:
:
:
:
:
(構造のずれ値) (存在確率分布(P(ξ)) (自由エネルギー値)
最終的に出力された自由エネルギーの値をプロットして、PMF を表記します。自由エネルギ
ーの計算は以下の式に基づいて計算されています。
F(ξ) = −kTlnP(ξ)
myPresto 4.2
129
ここでkと T は計算の設定に依存する定数です。各サイクルの計算において変動するのは
P(ξ)の値になります。存在確率が十分でない場合には、自由エネルギーの計算はおこなわ
ずに、’-----------------------‘のようにエラー表示になります。この場合には、エネ
ルギーを計算する領域を広げるなどして、十分な重なりを得られるように全体を計算しな
おす必要があります。
【注意】WHAM 解析プログラムにはメモリを大量に使用します。一部の計算機環境において
は、StackSize などの制限が行われていると思われますので、できるだけ大きめの StackSize
を設定して計算を実行してください。
【注意】Sample9 の WHAM 解析は、Wham_Analysis.f90 の代わりに、Wham_AnalysisSample.f90
を用いて実行します。これは反応座標を初期座標からの RMSD ではなく分子間距離にするた
めです。
myPresto 4.2
130
5.10
Sample-10:RESPA 法
マルチタイムステップ(RESPA)を用いた MD シミュレーションを説明します。まず、積
分方法を multi-time step(INTEGR= MTS)に設定してください。タイムステップ(= TIMEST)
は通常 0.5 fsec 程度にとってください。これが最も内側の短いタイムステップになります。
マルチタイムステップは3重になっており、最内側のループはタイムステップ TIMEST、2
番目のループはタイムステップ TIMEST×FREQME、一番外側のループはタイムステップ
TIMEST×FREQME×FREQLO で積分されます。相互作用は CALC で指定される項が最内側のルー
プで、MEDI で指定される項が2番目のループで、LONG で指定される項が一番外側のループ
で更新されます。通常、 結合・角部分を短いステップで(CALBON= CALC、CALANG= CALC)、
二面角の項を中間のステップで(CALTOR= MEDI, CALIMP= MEDI)、静電・van der Waals 相互
作用を遅いステップで (CALV14= LONG, CALE14= LONG, CALV15= LONG, CALE15= LONG)積分
するのが効果的です。
【注意】RESPA は、運動方程式をマルチステップで解く方法なので、エネルギー最小化に用
いることはできません。また、SHAKE や剛体モデルとともに用いることはできません。
■制御ファイル
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
INTEGR=
TIMEST=
FREQME=
FREQLO=
FORM
PDB
READ
PDB
2000
MTS
0.5D0
2
2
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
SETTIM=
UPDATE=
OUTTRJ=
OUTLOG=
LOGFOR=
500.0D0
20
100
200
DETA
METHOD=
SETTEM=
INITIA=
STARTT=
RANDOM=
CANONICAL
300.0D0
SET
300.0D0
654321
(つづく)
myPresto 4.2
;
;
;
;
vas-dih.tpl
vas_min.pdb
vas.mntinp
vas_min.pdb
RESPA 法を指定
最内側のタイムステップ
最内側×2
最内側×2×2
CPUTIM= 3600000.0D0
STOPCE= BOTH
131
(つづき)
NAMETR= vas_vac.mnt
BESTFI=
YES
CUTMET=
RESA
DIEFUN=
DIST
CALBON=
CALANG=
CALTOR=
CALIMP=
CALV14=
CALE14=
CALV15=
CALE15=
CALC
CALC
MEDI
MEDI
LONG
LONG
LONG
LONG
CALHYD=
CALV5N=
CALE5N=
CALH5N=
QUIT
NOCALC
NOCALC
NOCALC
NOCALC
EXE> OUTPUT
COORDINATE=
QUIT
PDB
MNTRTR=
ASCI
CUTLEN=
DIEVAL=
99.0D0
4.0D0
;
;
;
;
;
;
;
;
短い
短い
中間
中間
長い
長い
長い
長い
NAMECO=
vas_md.pdb
EXE> END
myPresto 4.2
132
5.11
Sample-11:RATTLE
−水中のインドメサシンの計算−
myPresto では、Velocity-Verlet 法と SHAKE 法を同時に指定することで RATTLE 法が実行
され、位置座標および速度の両方に拘束をかけることができます。
ここでは水中のインドメサシンの系について、水分子とインドメサシンに RATTLE 法を適
用した Velocity-Velret 法による MD 計算を行います。
(1)分子の準備
インドメサシンの構造は、他の分子構築ソフトによって作成してください。サンプルでは、
indo.pdb として、インドメサシンの立体構造を PDB ファイル形式で既に準備してあります。
また、インドメサシンの Gaussian98 による計算結果を indo_g98.out に用意してあります。
まず、Gauss2tplinp により indo.charge/indo.bond を準備し、RESP 指定ファイル resp.in
によって RESP 電 荷を計 算し ま す。RESP 電荷計算ツールは 、AMBER のホームページ
(http://amber.scripps.edu/)より取得できます。RESP 電荷を計算し、indo.charge の電
荷の値を修正するか、mol2 ファイルの電荷の項に RESP 電荷を代入した後、tplgeneL によ
ってトポロジーファイルを作成してください。これらにより作成したインドメサシンの座
標、トポロジーファイル、mol2 ファイルを indo.pdb, indo.tpl, INDO.mol2 とします。
次に、水付加ツール setwater により、インドメサシンの重心を中心に半径 12Åで TIP3P を
CAPwater として付加し、その PDB ファイルを indo_w.pdb とします。TIP3P のトポロジーフ
ァイルは、tip3p.tpl なので、indo.tpl に添付ツール mergetpl でトポロジーファイルを統
合し、インドメサシン+TIP3P 水系のトポロジーファイル indo_w.tpl を作成します。
なお、水中での計算を行なうにあたり、境界条件を設定するファイル indo_w.capbc を準備
し、CAP 拘束の条件をコントロールファイルに記載してください。
myPresto 4.2
133
(2)拘束対象の指定
RATTLE 法の拘束対象指定は SHAKE 法と同様に、SHAKE ファイルを用いて行います。添付ツ
ール SHAKEinp によって、indo_w.pdb, indo_w.tpl から SHAKE 拘束ファイル indo_w.shk を
作成します。
(SHAKE ファイルの詳細は「A 入出力ファイル」、SHAKE ファイルの節を参照してください)
■SHAKE ファイル(indo_w.shk)
SHAKE> SHAKE
indo
4
2
1.1126
1.8434
3
4
5 ->; C
LGD H
LGD
1.1126
1.1135
1.8025
1.8038
2
1.1034
7
8 ->;
C
LGD
H
LGD
2
1.0998
9
10 ->;
C
LGD
H
LGD
2
1.1015
16
17 ->;
C
LGD
H
LGD
2
1.1023
18
19 ->;
C
LGD
H
LGD
2
1.1026
22
23 ->;
C
LGD
H
LGD
2
1.1020
24
25 ->;
C
LGD
H
LGD
4
1.1123
27
28
29
30 ->; C
LGD H
LGD
1.7800
1.1127
1.1123
1.8098
1.8049
2
1.0977
33
3
1.1123
35
36
37 ->;
1.7944
1.1137
34 ->;
C
SHAKE> SHAKE
WAT
3
1
2
3
0.95720 1.51360 0.95720
LGD
H
C
->
H
LGD
H
LGD
H
LGD
H
LGD
LGD
LGD
; O
H
LGD
H1
H
LGD
H2
WAT
myPresto 4.2
134
(3)制御ファイル
RATTLE 法を使用する際には、Velocity-Verlet 法と SHAKE 法を同時に指定します。全て
の H 原子に RATTLE が適用される場合、タイムステップ(TIMEST)は、0.5∼2.0fsec にとれ
ます。
■制御ファイル(rattle.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
SETBOU=
SETSHAKE=
NAMESH=
QUIT
EXE> MD
INTEGR=
SHAKEM=
LOOPLI=
SETTIM=
CPUTIM=
UPDATE=
TIMEST=
OUTCOO=
OUTTRJ=
OUTLOG=
LOGFOR=
STOPCE=
METHOD=
THERMO=
SETTEM=
INITIA=
STARTT=
RANDOM=
CALCAP=
RADCAP=
FORCAP=
FUNCAP=
SETCEN=
CUTMET=
DIEFUN=
CALV15=
CALHYD=
CALE5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
FORM
NAMETO=
indo_w.tpl
PDB
NAMECO=
indo_w.pdb
READ
NAMEBO=
indo_w.capbc
READ
; SHAKE ファイル読み込み指定
indo_w.shk ; SHAKE ファイル名指定
VELO
; Velocity-Verlet 法の指定
ALLB
; SHAKE 方法の指定
10000
5000.0D0
3600000.0D0
20
2.0D0
1000
1000
1000
DETA
TRAN
CANONICAL
NOSE
300.0D0
SET
300.0D0
654321
CALC
10.0
50.0
HARMonic
YES
RESA
CONS
CALC
NOCALC
NOCALC
CUTLEN=
DIEVAL=
CALE15=
CALV5N=
CALH5N=
12.0D0
1.0D0
CALC
NOCALC
NOCALC
PDB
NAMECO=
indo_wmd.pdb
135
5.12
Sample-12:Rigid
−水中のインドメサシンの計算−
ここでは水中のインドメサシンの系について、インドメサシンの水素原子および水分子
に剛体モデルを適用した MD 計算を行います。なお、水分子の剛体モデルは、現在 TIP3P model
と TIP4P model を計算することができます。TIP4P model では、電荷の点の質量がゼロであ
るため、剛体モデル以外では扱うことができません。
【注意】剛体モデルは、Velocity-Verlet 法による計算時のみ有効です。
(1) ファイルの準備
入力ファイルは、前述の Sample-11 と同様に行ってください。TIP4P water の発生も、水
分子付加ツール setwater で行うことができます。トポロジーファイルには、水分子のトポ
ロジーファイル tip4p.tpl を mergetpl にて挿入してください。TIP4P には分子内の力場パ
ラメーターが記載されていますが、剛体モデルでは使用されません。
(2)剛体モデルの指定
剛体モデルの拘束対象指定は剛体モデルファイルを用いて行います。
添付ツール RIGIDinp によって、indo_w.tpl, tip4_rig.model から剛体モデルファイル
indo_w4.rig を作成します。
(剛体モデルファイルの詳細は「A 入出力ファイル」、剛体モデルファイルの節を参照し
てください)
■剛体モデルファイル(indo_w4.rig)
RIGID>
indo
4
2
2
2
2
2
2
4
2
3
NUMBER
2
7
9
16
18
22
24
27
33
35
3
8
10
17
19
23
25
28
34
36
RIGID> COOR
WAT
4 ->
1
0.000
2
0.757
3
-0.757
4
0.000
4
5
29
30
37
0.000
0.586
0.586
0.150
0.000 ->
0.000 ->
0.000 ->
0.000
myPresto 4.2
136
(3)制御ファイル
剛体モデルを使用する際には、制御ファイルの MD フェーズで剛体モデルの使用および剛
体モデルファイル名を指定する必要があります。
(剛体化されていない H 原子が系内に残っている場合は、タイムステップ (TIMEST)を
0.5fsec 程度にとってください。)
■制御ファイル(rigid.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
SETBOU=
QUIT
EXE> MD
RIGIDM=
NAMERM=
INTEGR=
LOOPLI=
SETTIM=
CPUTIM=
UPDATE=
TIMEST=
OUTCOO=
OUTTRJ=
OUTLOG=
LOGFOR=
METHOD=
SETTEM=
INITIA=
STARTT=
RANDOM=
CALCAP=
RADCAP=
FORCAP=
FUNCAP=
SETCEN=
CUTMET=
DIEFUN=
CALV15=
CALHYD=
CALE5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
FORM
PDB
READ
NAMETO=
NAMECO=
NAMEBO=
YES
indo_w4.rig
VELO
10000
5000.0D0
3600000.0D0
20
2.0D0
1000
1000
1000
DETA
CANONICAL
300.0D0
SET
300.0D0
654321
CALC
10.0
50.0
HARMonic
YES
RESA
CUTLEN=
CONS
DIEVAL=
CALC
CALE15=
NOCALC
CALV5N=
NOCALC
CALH5N=
PDB
NAMECO=
indo_w4.tpl
indo_w4.pdb
indo_w4.capbc
; 剛体モデル使用指定
; 剛体モデルファイル名指定
; Velocity-Verlet 法の指定
12.0D0
1.0D0
CALC
NOCALC
NOCALC
indo_w4md.pdb
137
5.13
Sample-13:NPT と PME を用いた周期系の計算
−水中のメタンの計算−
【Andersen の方法】
水で満たされたユニットセルにメタン分子が2個入った周期境界条件の系を、NPT アンサ
ンブル、Andersen の方法で計算します。
系は、2 個のメタンの周囲にツール set_water で水分子を発生させます。立方体ユニット
セルのサイズは各辺 18.64775Åとします。
NPT の計算では、原理的に SHAKE を用いることができません。ここでは、All Atom での
計算を行ないます。"METHOD=NPT"を指定し、積分器は Velocity-Verlet 法 "INTEGR=VELO"
を指定します。Andersen の方法を用いるので、"BAROST=ANDE"を指定します。Andersen の
方法では、等方的なセルの変形しかしません。セルの形状を指定するオプションは、必ず
自由度1の等方的なセルの変形を意味するように、"MODIFI=ISOT"と設定します。周期系の
境界条件下で計算するので境界条件の設定は、"BOUNDA=PERI"に指定してください。
目標の圧力 "SETPRE"は、サンプルでは1気圧を目標にしています。
緩和時間の設定は、系に依存しますが、温度制御の緩和時間"COUPHB"は 100∼500 fsec
程度、圧力制御の緩和時間"COUPPI"は、温度制御の緩和時間より数倍長く、1000∼5000fsec
程度にとるのが良いようです。
1-5 静電相互作用は、Particle-Mesh-Ewald (PME)法で計算することにします。PME の設定
は、まず"CALPME=CALC"を指定、あらわに電場を計算するための"CUTLEN"を指定しますが、
ユニットセルの辺の長さの半分以下であって、通常 6∼8Å程度にとります。メッシュの数
は、X, Y, Z 軸について"MESHLX"、"MESHLY"、"MESHLZ"で指定します。メッシュの幅は 1∼
3Å程度が妥当で、幅が狭いと精度が上がりますが計算時間がかかります 。今は、1辺
18.64775Åを 1Å程度のメッシュに切るとして、"MESHLX=18"("MESHLY"、"MESHLZ"も同じ
指定)に設定します。Ewald パラメータ"EWAPRM"は、系によって精度に影響しますが、だい
たい 0.35 程度に設定します。グリッドポテンシャルからの内挿多項式の次数"PMEORD"は、
低いほど計算が速く精度が落ち、高いほど計算精度が高く速度が落ちますが、3∼6 程度に
設定します。PME は No-cutoff の方法ですが、原子の相互作用テーブルを作らずに計算する
のではなく、近接の静電相互作用は原子の相互作用テーブルを作成して計算するので、
"CALE15=CALC", "CALE5N=NOCALC", "CALV15=CALC", "CALV5N=NOCALC", "CALH5N=NOCALC"を
指定します。
■制御ファイル
myPresto 4.2
138
EXE> INPUT
TOPOLOGY=
COORDINA=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTLOG=
STOPCE=
FORM
PDB
PDB
2000000
5000.0D0
10
0.5D0
1000
NO
METHOD=
INTEGR=
BAROST=
MODIFI=
SETPRE=
COUPHB=
COUPPI=
NPT
VELO
ANDErsen
ISOT
1.0
100.0
2000.0
SETTEM=
INITIA=
STARTT=
CUTMET=
DIEFUN=
300.0D0
SET
300.0D0
RESC
CONS
BOUNDA=
LXCELL=
SETCEN=
CENTRX=
PERI
18.64775
NO
0.0
NAMETO=
NAMECO=
NAMERE=
initial.tpl
initial.pdb
initial.pdb
;1000 psec
CPUTIM=
LOGFOR=
3600000.0D0
DETA
; NPT
; Velocity-Verlet
; Andersen
RANDOM=
654321
CUTLEN=
DIEVAL=
8.0D0
1.0D0
LYCELL=
18.64775
LZCELL=
18.64775
CENTRY=
0.0
CENTRZ=
0.0
MESHLZ=
18
; for PME
CALPME=
EWAPRM=
MESHLX=
PMEORD=
CALC
0.35
18
6
PMESPD=
HIGH
MESHLY=
18
CALV15=
CALE15=
CALHYD=
QUIT
CALC
CALC
NOCALC
CALV5N=
CALE5N=
CALH5N=
NOCALC
NOCALC
NOCALC
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
PDB
NAMECO= final.pdb
139
【Parrinello-Rahmann の方法】
水で満たされたユニットセルにメタン分子が2個入った周期境界条件の系を、NPT アンサ
ンブル、Parrinello-Rahmann の方法で計算します。
系は、2 個のメタンの周囲にツール set_water で水分子を発生させます。立方体ユニット
セルのサイズは各辺 18.64775Åとします。
NPT の計算では、原理的に SHAKE を用いることができません。ここでは、All Atom での
計算を行ないます。"METHOD=NPT"を指定し、積分器は Velocity-Verlet 法 "INTEGR=VELO"
を指定します。Parrinello-Rahmann の方法を用いるので、" BAROST= PARA " を指定します。
Parrinello-Rahmann の方法では、異方的なセルの変形が許容されますので、等方的なセル
の変形しかしません。セルの形状を指定するオプション"MODIFI"は、以下の5つが可能で
す。
MODIFI = FLEX
= MONOckinic
;自由度6、斜方セル(デフォルト)
;自由度4。3方向にそれぞれ伸縮および、基本セルの
角γ(a軸とb軸のなす角度)が変化
= ORTHorhombic
;自由度3。3方向にそれぞれ伸縮
= ISOTropic
;自由度1。等方的な変形。Andersen の方法と類似。
= SINGle_direction
;自由度1。z軸方向のみ変形
更に、境界条件の設定"BOUNDA"は、Parrinello-Rahmann の方法の場合は、"MODIFI"の指
定に関わらず、"BOUNDA=HEXA"に指定してください。
【注意】周期境界条件"BOUNDA=PERI"ではなく、"BOUNDA=HEXA"に指定してください。
目標の圧力 "SETPRE"は、サンプルでは1気圧を目標にしています。
緩和時間の設定は、系に依存しますが、Andersen の方法と同様に、温度制御の緩和時間
"COUPHB"は 100∼500 fsec 程度、圧力制御の緩和時間"COUPPI"は、温度制御の緩和時間よ
り数倍長く、1000∼5000fsec 程度にとるのが良いようです。
PME の指定方法は前節 Andersen の方法と同じです。NPT においてはセル形状が変化する
ため、特に"MODIFI=FLEX"および"MODIFI=MONO"を指定する場合、シミュレーションの進行
に伴い相互作用のカットオフ長"CUTLEN"が、セルの辺の長さの半分より長くなる場合があ
ります。カットオフ長は、セル形状は六方最密格子まで歪む可能性を考え、初期のセルの
辺の長さの半分より十分短くとるか、十分な大きさのセルを準備することが必要です。
myPresto 4.2
140
■制御ファイル
EXE> INPUT
TOPOLOGY=
COORDINA=
REFCOORD=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTLOG=
STOPCE=
FORM
PDB
PDB
2000000
5000.0D0
10
0.5D0
1000
NO
METHOD=
INTEGR=
BAROST=
MODIFI=
SETPRE=
COUPHB=
COUPPI=
NPT
VELO
PARA
ISOT
1.0
100.0
2000.0
SETTEM=
INITIA=
STARTT=
CUTMET=
DIEFUN=
300.0D0
SET
300.0D0
RESC
CONS
BOUNDA=
LXCELL=
SETCEN=
CENTRX=
HEXA
18.64775
NO
0.0
NAMETO=
NAMECO=
NAMERE=
initial.tpl
initial.pdb
initial.pdb
;1000 psec
CPUTIM=
LOGFOR=
3600000.0D0
DETA
; NPT
; Velocity-Verlet
; Parrinello-Rahmann
RANDOM=
654321
CUTLEN=
DIEVAL=
8.0D0
1.0D0
; Parrinello-Rahmann
LYCELL=
18.64775
LZCELL=
18.64775
CENTRY=
0.0
CENTRZ=
0.0
MESHLZ=
18
; for PME
CALPME=
EWAPRM=
MESHLX=
PMEORD=
CALC
0.35
18
6
PMESPD=
HIGH
MESHLY=
18
CALV15=
CALE15=
CALHYD=
QUIT
CALC
CALC
NOCALC
CALV5N=
CALE5N=
CALH5N=
NOCALC
NOCALC
NOCALC
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
PDB
NAMECO= final.pdb
141
5.14
Sample-14:Fast Multipole Method
−カウンターイオンを用いた MD 計算−
Zinc finger 蛋白質(PDB コード:1A1H)を例にとり、Fast Multipole Method(FMM)と
カウンターイオンを用いた MD 計算について説明します。
(1)蛋白質と DNA の複合体のPDBファイルとトポロジーファイルの作成
まず、1A1H のファイルから蛋白質部分と DNA 部分を別々のファイルに分割し、それぞれ
別にトポロジーファイルを生成します。これは、tplgene でトポロジーファイルを生成する
ときのデータベースがペプチド鎖と核酸では異なり、同時に処理できないためです。例で
は、水素付加を終えた蛋白質部分を"zif.pdb"とします。亜鉛に結合するシステインは、ほ
とんどのタンパク質でシステインマイナス S-となっています。myPresto では CYM がシステ
インマイナス S-に相当します。zif.pdb の CYS5,CYS10,CYS35,CYS38,CYS63,CYS66 の6残基
の CYS を CYM に書き直したあと、tplegene で zif.pdb のトポロジーファイルを作成します。
このトポロジーファイルを"zif.tpl"とします。また、水素付加を終えたDNA部分を
"dna.pdb"とし、そのトポロジーファイルを"dna.tpl"とします。
(2) 溶媒水の付加
2つの PDB ファイル"zif.pdb"と"dna.pdb"をマージして、Zinc finger 蛋白質・DNA複合
体の PDB ファイル"zif_DNA.pdb"を作成します。この複合体に、ツール setwater で溶媒水
を付加します。sample-3 の入力ファイル"setwater.inp"にあるように半径 40Åで、複合体
の周囲に溶媒水を生成します。生成した溶媒水の座標ファイルと複合体の PDB ファイル
zif_DNA.pdb をマージしたファイルを"zifcmp.pdb"とします。
(3)カウンターイオンの付加
カウンターイオンの付加では、系に付加した溶媒水分子を Na+ 、Cl− イオンに置換すること
で行います。
準備した PDB ファイル zifcmp.pdb の電荷を計算すると-8 なので、正電荷8を足さないと
系が中性になりません。溶媒水分子が 8186 個ある場合は 1%程度を NaCl に置換するとして、
Na+ イオン 80 個、Cl- イオン 72 個をカウンターイオンとして加えることにします。カウンタ
ーイオンの付加はツール“add_ion.f”によって行います。add_ion は、溶質(溶媒水分子
以外の分子)の作り出す電場を、各溶媒水分子の座標について距離依存誘電率(ε∝r)
で計算し、もっとも電位の高いところ、ないし低いところにある水分子をカウンターイオ
ンで置換します。カウンターイオンで置換後、同様の計算を繰り返し、指定した数のカウ
ンターイオンを全て配置するまで作業を繰り返します。この時、次のカウンターイオンは、
前回までに配置したカウンターイオンより一定距離以上離れた場所に配置します。
myPresto 4.2
142
add_ion.f のコンパイルの仕方:
% f90 add_ion.f ?o add_ion
使い方:
add_ion とタイプする。標準入力から入力します。入力例は、ion.input としています。
% add_ion < ion.input
入力例:
zifcmp.pdb
protein.pdb
ion.pdb
wat.pdb
1
80
72
6.0
1行目:入力ファイル名:溶媒水分子の付加された全系の座標ファイル名。
2行目:出力ファイル名:全系の座標ファイル名。
3行目:出力ファイル名:カウンターイオンの座標ファイル名。
4行目:出力ファイル名:カウンターイオンに置換された溶媒水分子の座標ファイル名。
6行目:Na+ イオンの数
7行目:Cl- イオンの数
8行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加したカ
ウンターイオンより一定距離内に配置しない。その半径(Å)。
こうして生成したカウンターイオンの座標を全系に加えます。
% cp protein.pdb zifcmx.pdb
% cat ion.pdb │ grep NA+ >> zifcmx.pdb
% cat ion.pdb │ grep CL- >> zifcmx.pdb
(4) トポロジーファイルの合成
蛋白質、DNA、溶媒水、カウンターイオンの並びは、トポロジーファイルの MOLECULES 欄
と PDB 上で同じ順番でなければなりません。ここでは、zif.tpl, dna.tpl, tip3p.tpl,
na.tpl, cl.tpl の順にトポロジーファイルをマージします。合成したトポロジーファイル
myPresto 4.2
143
を”zifcmx.tpl”とします。
トポロジーファイル”zifcmx.tpl” の MOLECULES 欄の、WAT,NA,CL を sample-3 に習って編
集します。
(5)
エネルギー最小化
add_ion によって付加されたカウンターイオンの配置は、エネルギー的に安定ではありませ
ん。従って、全系の MD 計算に移る前に、蛋白質・DNA の座標を固定した状態で、溶媒水と
カウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡状態に近づけ
ておきます。 蛋白質とDNAの座標の固定は、M_all.res で指示します。
<M_all.res>
GROUP> LIST
1
1
2
3
END
1
1
85
11
*
*
*
*
1.0
1.0
MASS
MASS
YES
YES
GROUP> STOP
<min_wat.inp>
EXE> INPUT
TOPOLOGY=
COORDINA=
REFCOORD=
POSITION=
;
FORM
PDB
PDB
READ
NAMETO=
NAMECO=
NAMERE=
NAMEPO=
zifcmx.tpl
zifcmx.pdb
zifcmx.pdb
M_all.res
SETBOU=
READ
QUIT
EXE> MINI
METHOD= STEEP
LOOPLI= 6000
MONITO=
100
CUTMET= RESA
DIEFUN= CONS
BESTFI= YES
NAMEBO=
zifcmx.capbc
in case of CAP boundary
CALCAP=
CALC
RADCAP=
40.0
SETCEN=
YES
CALPSR=
CALC
WETPSR=
10.00
QUIT
EXE> OUTPUT
COORDINATE= PDB
QUIT
EXE> END
CPUTIM=
UPDATE=
CONVGR=
CUTLEN=
DIEVAL=
360000.0
10
0.2D0
8.0D0
1.0D0
FUNCAP=
FORCAP=
HARMonic
100.0
NAMECO=
zifcmx_min.pdb
myPresto 4.2
144
(6)溶媒水とカウンターイオンの MD 計算
溶媒水とカウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡状態
に近づけます。
<md_wat.inp>
myPresto 4.2
145
;
; md input for Zinc
;
EXE> INPUT
TOPOLOGY=
COORDINA=
REFCOORD=
SETBOU=
POSITION=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTTRJ=
OUTLOG=
LOGFOR=
METHOD=
SETTEM=
INITIA=
STARTT=
RANDOM=
Finger/DNA
FORM
PDB
PDB
READ
READ
NAMETO=
NAMECO=
NAMERE=
NAMEBO=
NAMEPO=
100000
500.0D0
40
0.5D0
1000
1000
DETA
zifcmx.tpl
zifcmx_min.pdb
zifcmx.pdb
zifcmx.capbc
M_all.res
CPUTIM= 3600000.0D0
STOPCE= BOTH
CANONICAL
310.0D0
SET
310.0D0
654321
;
in case of CAP boundary
CALCAP=
CALC
RADCAP=
40.0
SETCEN=
YES
BESTFI=
YES
; position restraint
CALPSR=
CALC
WETPSR=
10.00
; FMM
USEFMM=
YES
FMTREE=
4
FMPOLE=
6
CUTMET=
DIEFUN=
CALV15=
CALE15=
CALHYD=
CALE5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
RESA
CONS
CALC
CALC
NOCALC
NOCALC
PDB
FUNCAP=
FORCAP=
HARMonic
100.0
FMMSPD=
HIGH
CUTLEN=
8.0D0
DIEVAL= 1.0D0
CALV5N=
CALH5N=
NAMECO=
NOCALC
NOCALC
zifcmx_md.pdb
(7)全系の MD 計算
溶媒部分が十分平衡状態に近づいたら、蛋白質・DNA を含む全系の MD 計算を行います。
myPresto 4.2
146
FMM がオーバーフローするときは FMTREE の値を大きくとるようにします。
<md_wat2.inp>
;
; md input for Zinc Finger/DNA
;
EXE> INPUT
TOPOLOGY=
FORM
NAMETO= zifcmx.tpl
COORDINA=
PDB
NAMECO= zifcmx_md.pdb
REFCOORD=
PDB
NAMERE= zifcmx.pdb
SETBOU=
READ
NAMEBO= zifcmx.capbc
QUIT
EXE> MD
LOOPLI=
100000
SETTIM=
500.0D0
CPUTIM= 3600000.0D0
UPDATE=
20
TIMEST=
1.5D0
OUTTRJ=
1000
OUTLOG=
1000
LOGFOR=
DETA
STOPCE= BOTH
METHOD=
SETTEM=
INITIA=
STARTT=
RANDOM=
CANONICAL
310.0D0
SET
310.0D0
654321
;
in case of CAP boundary
CALCAP=
CALC
RADCAP=
40.0
SETCEN=
YES
BESTFI=
YES
; FMM
USEFMM=
YES
FMTREE=
4
FMPOLE=
8
CUTMET=
DIEFUN=
CALV15=
CALE15=
CALHYD=
CALE5N=
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
RESA
CONS
CALC
CALC
NOCALC
NOCALC
PDB
FUNCAP=
FORCAP=
HARMonic
100.0
FMMSPD=
HIGH
CUTLEN=
8.0D0
DIEVAL= 1.0D0
CALV5N=
CALH5N=
NAMECO=
NOCALC
NOCALC
zifcmx_res.pdb
147
5.15
Sample-15:GB/SA
−Vassopressin の計算−
(1)GB/SA 計算用パラメータファイルの準備
cosgene では、Generalized Born/Surface Area(GB/SA)モデル及び Accessible Surface
Area (ASA)モデルの計算ができます。蛋白質の座標とトポロジーファイルは、いつも通り
に準備してください。ここでは、Vassopressin を例に、初期入力は、2面角入力 vas.dih
として準備されています。最初に tplgene を用いて、初期座標 vas-dih.pdb とトポロジー
ファイル vas-dih.tpl を準備してください。
GB/SA モデルでは、GB/SA 用のパラメータファイルを計算する分子に対して準備する必要
があります。蛋白質に対しては、パラメータファイル作成ツール mkGBSAin.pl と GB/SA パ
ラメータデータベース gb_sa.db を用います。
ASA モデルでも、GB/SA 用のパラメータファイルを計算する分子に対して準備する必要が
あります。パラメータファイルは GB/SA と共通です。
■実行方法
① mkGBSAin.pl を実行するディレクトリに初期座標ファイル(vas-dih.pdb)、トポロジーフ
ァイル(vas-dih.tpl)、gd_sa.db を準備します。
② mkGBSAin.pl を実行します。"mkGBSAin.pl"とタイプします。以下、プログラムの指示に
従い、トポロジーファイル名、パラメータファイル名を指定します。
■実行例
% mkGBSAin.pl
%% INPUT DB FILE NAME. %%
gb_sa.db
%% SELECT INPUT FILE BY THE NEXT NUMBER.
%%
1 : PDB FILE
2 : TPL FILE
2
%% INPUT FILE NAME.
%%
vas-dih.tpl
%% INPUT OUTPUT FILE NAME.
%%
vas-dih.sol
myPresto 4.2
148
(2)エネルギー最小化
GB/SA モデルでは、エネルギー最小化が可能です。作成した GB/SA パラメータファイル
vas-dih.sol を指定します。
cosgene では、GB/SA モデルと、ASA モデルでの計算が可能です。指定方法により、
・CAL-GB= CALC,
CALASA= CALC のとき:
・CAL-GB= NOCALC, CALASA= CALC のとき:
GB/SA モデル、
ASA モデル、
の計算となります。
■制御ファイル(min_vac.inp)
EXE> INPUT
TOPOLOGY=
FORM
NAMETO=
vas-dih.tpl
COORDINA=
PDB
NAMECO=
vas-dih.pdb
REFCOORD=
ASAREA=
PDB
READ
NAMERE=
NAMESA=
vas-dih.pdb
vas-dih.sol
QUIT
EXE> MINI
METHOD=
CONJ
CPUTIM=
360000.0
LOOPLI=
MONITO=
1000
5
UPDATE=
CONVGR=
20
0.1D0
CAL-GB=
CALASA=
CUTMET=
DIEFUN=
CALC
CALC
RESA
CONS
;GB の指定
;SA の指定
CUTLEN=
DIEVAL=
30.0D0
1.0D0
QUIT
EXE> OUTPUT
COORDINATE=
QUIT
EXE> END
myPresto 4.2
PDB
NAMECO=
vas_min.pdb
;GB/SA パラメータファイル
149
(3)MD シミュレーション
MD シミュレーションでも GB/SA 及び ASA モデルを用いることができます。オプションは
エネルギー最小化時と同じです。GB/SA モデルでは、エネルギーのカットオフ長(CUTLEN)
を長くとらないとエネルギーの保存が良くありません。エネルギーのカットオフ長は、20
Å以上、できれば 30Å以上にとってください。
■制御ファイル(md_vac.inp)
EXE> INPUT
TOPOLOGY=
COORDINA=
OUTMONIT=
REFCOORD=
ASAREA=
QUIT
EXE> MD
LOOPLI=
SETTIM=
UPDATE=
TIMEST=
OUTTRJ=
OUTLOG=
LOGFOR=
FORM
PDB
READ
PDB
READ
NAMETO=
NAMECO=
NAMEMO=
NAMERE=
NAMESA=
2000
500.0D0
20
0.5D0
100
200
DETA
METHOD=
SETTEM=
INITIA=
STARTT=
NAMETR=
BESTFI=
CANO
300.0D0
SET
300.0D0
vas_vac.mnt
YES
CAL-GB=
CALASA=
GBDELT=
GBOFFS=
CALC
CALC
0.0
0.09
CUTMET=
DIEFUN=
RESA
CONS
vas-dih.tpl
vas_min.pdb
vas.mntinp
vas_min.pdb
vas-dih.sol
;GB/SA パラメータファイル
CPUTIM= 3600000.0D0
STOPCE= BOTH
INTEGR= VELO
RANDOM=
MNTRTR=
654321
ASCI
CALV15=
CALC
CALE15=
CALC
CALHYD=
NOCALC
QUIT
EXE> OUTPUT
COORDINATE= PDB
QUIT
;GB の指定
;SA の指定
;Born 半径の補正値
;vdW 半径の補正値
CUTLEN=
DIEVAL=
99.0D0
1.0D0
CALV5N=
CALE5N=
CALH5N=
NAMECO=
NOCALC
NOCALC
NOCALC
vas_md.pdb
EXE> END
myPresto 4.2
150
5.16
Sample-16:SRPG
−Streptavidin の結合自由エネルギー計算−
(1)Smooth reaction path generation (SRPG) 法による結合自由エネルギーの計算手順
SRPG 法は、滑らかな解離経路を用意して、それに沿った各点で自由エネルギー計算を行う
事で、タンパク質とリガンドの結合自由エネルギー(ΔG)を計算する方法です。
解離経路の生成には FP 法(sample9)を使用し、経路そのものはリガンドのランドマーク
原子(例えばリガンドの重心に近い重原子)の平均座標で表現します。その際、ルジャン
ドル多項式を使って経路を滑らかにしておきます。
解離過程の PMF は、経路に沿った各点で最近接の構造を選び、それらに対応する計算系を
用意した後、経路に沿ってアンブレラ・サンプリング法で計算します。各計算系は、選択
した構造に水分子とイオンを加える事により生成します。
補正項は、初期座標周辺でリガンド配置を微小量ずらす事により複数構造を生成し、これ
らを使って計算した PMF から計算します。
最後に経路の PMF と補正項から結合自由エネルギーを求めます。
したがって、計算ステップは以下の様になります。
FP 法を使ってタンパク質からリガンドを解離させる
ランドマーク原子の軌跡に沿って滑らかな経路を計算する
リガンドとタンパク質に水分子とイオンを加えて系を作成する
① アンブレラ・ポテンシャルを加えた MD 計算を行い、ランドマーク原子に働く平均力を
計算する
② 平均力を経路に沿って積分し、PMF を計算する
③ 結合状態周辺の自由エネルギー地形を調べる
④ 結合状態と解離状態の存在確率を計算し、結合自由エネルギーを計算する
(2)平均力、平均座標の計算準備
FP 法においてリガンドのランドマーク原子に働く平均力および平均座標を計算するには、
cosgene の入力ファイルの EXE> MD 以下に次のオプションを指定する必要があります。
FILPOT= YES
FPNAME= pmf_r
通常 FPNAME で指定したファイルには経路上の座標と半径を指定します。指定した座標を中
心に、同じく指定した半径内に存在するリガンドのランドマーク原子に働く力、座標から
その平均力、平均座標を計算します。ランドマーク原子は NAMEUM で指定したアンブレラポ
テンシャルファイルの中で指定します(sample9 参照)。
今回の計算では、実行スクリプト ganzene.sh が pmf_r を自動生成・更新します(後述(3))。
myPresto 4.2
151
■記述例(pmf_r)
FILPOT> FILPOT
ATOM
0.3
10.924
1.228 -10.179
←中心座標
←半径
EXE>OUTPUT に次のオプションを加えることで平均力、平均座標を出力することができます。
各平均値は NAMEFP で指定したファイルに出力されます。
FPAVER= FORM
UNITFP= 94
NAMEFP= FP.avg
■出力例(FP.avg)
-4.9246739
-9.3160922
-23.4467904
1.9398118
-0.0362050
2.8454671
左から順に x、y、z の平均座標、そして各軸方向の平均力になります。
(3)FP 法によるリガンドの解離計算
FP 法を使用してタンパク質からリガンドを解離させます。リガンドを短時間で解離させる
ために、高温、真空で計算を行い、さらにリガンドの原子の電荷の値を 0 にしてタンパク
質との間に働く引力相互作用を減らします。
作業は、SRPG_sample/Streptavidin/Make_path/Dissociation 以下で行います。
実行ファイル:
・ 実行スクリプト(ganzene.sh)
入力ファイル:
・ 初期構造とトポロジー(cmx.pdf, cmx.tpl)
トポロジーファイルにおいて、リガンドの全電荷の値を 0 にする。
・ MD 計算入力(md.inp)
・ FP 法入力(GenerateNextFP.inp、Extract_atom.inp、newopt_fp_ini)*
sample9 を参照(ランドマーク原子はビオチンの重心に最も近い重原子とする)。
・ 平均力および平均座標計算の入力(pmf_r)**
ganzene.sh 内で自動作成され、FP 法の繰り返し毎に更新される。
出力ファイル:
・ MD 計算の繰り返し毎に出力される構造、トラジェクトリ、平均力等(w_*.pdb, w_*.cor,
w_*.option, w_*.output, w_*.FP)。
・ 各計算で出力された平均力、平均座標を纏めたファイル(all_avg)。
myPresto 4.2
152
* :FP 法を使用して計算を行ってもリガンドはタンパク質の表面からなかなか解離しない場合があり
ます。したがって、FP 法による計算の繰り返しが一定回数を超えたら、目標座標に向かって直線上ア
ンブレラポテンシャルを発生させて引っ張るようにリガンドを解離させます。回数の指定について
は”Generate_NextFP.inp”の最後の行に以下のように入力して行います。
newopt_fp
newopt_fp2
initial.pdb
xx_traject.cor
-1000
100
s
n
HAR1
1000.0
0.5
6.00 8.00
0.300
1.0
0.30
ATOM
2085 O
WAT
226
-4.789 -9.083 -23.469 16.00 -0.83
51 100 ←FP 法による繰り返しで 51 回目から 100 回目にかけて直上の行で
指定した座標に直線的に向かうようにアンブレラポテンシャルを
発生させる。
リガンドの解離の軌跡(後半は直線状に解離)
**:半径の値が小さいと各種平均値が得られないことがあります。ここではリガンドを解離させるだ
けなので、半径は大きめにします(ganzene.sh 内に指定)。
■実行例
% ./ganzene.sh
myPresto 4.2
153
(4)滑らかな経路の計算
(3)で計算したランドマーク原子の平均座標による軌跡に沿って、滑らかな経路を計算
します。経路の計算にはルジャンドル多項式を使用し、モンテカルロ法を併用して結合状
態と解離状態の 2 点間を結ぶ複数の経路を計算した後、その中から元の軌跡に近い経路を
選びます。
作業は、SRPG_sample/Streptavidin/Make_path/Smooth 以下で行います。
実行ファイル:
・ 経路計算プログラム(path.f)
ルジャンドル多項式を使って経路を計算する。プログラム中の変数 dr の値を換えるこ
とで、出力する経路を構成する座標の間隔を決めることができる。PMF を正確に計算す
る為には間隔は短い方が良い為、ここでは 0.2Åにしてある。
・ 実行スクリプト(RUN.sh)*
入力ファイル:
・ ランドマーク原子の軌跡(log)
平均力と平均座標をまとめたファイル((3)で出力された all_avg の名前を変えてコ
ピーしたもの)** 。
・ ルジャンドル多項式のパラメータ(input_x_yy)
RUN.sh 内で自動生成され、項数 x と探索範囲の広さ yy を指定する。 x、yy の値が大き
い程、広い範囲で様々な経路を作成することができる。
出力ファイル:
・ 計算結果(x_yy.out)***
滑らかな経路を構成する座標、入力平均座標との RMSD 等が出力される。
* :RUN.sh の例(以下は LSF 環境下で経路計算プログラム path を実行する場合を想定)
echo “3 0.5”> input_3_05
←最初の値が項数、次が探索範囲の広さ
bsub?q qall?iinput_3_05 ?o 3_05.out ./path.exe
…
**:入力ファイル(log)の例
左3列が平均座標、右が平均力を表します。
10.5905897
1.2787241
-10.4333034
0.7910588
-0.5060095
0.6768240
10.5601682
1.1843599
-10.3228453
-0.0145502
-0.1970323
0.1232972
10.5234182
1.0966913
-10.1436536
-0.7193757
-0.5401182
-0.2495513
10.4569258
0.8150650
-10.1663318
-0.3373891
0.5938054
-0.7854677
…
myPresto 4.2
154
***:出力ファイル(x_yy.out)の例
最後の dr 間隔で出力した経路の座標を別ファイル(path.dat)に保存します。
@ n_use=
3
region=
0
10.591
1.279
-10.433
1
10.577
1.271
-10.447
2
10.563
1.263
-10.460
3
10.549
1.255
-10.473
0.5000000
←指定した項数と範囲
←初期座標
経路の座標
…
998
-4.894
-9.295
-23.426
999
-4.909
-9.306
-23.436
1000
-4.925
-9.316
-23.447
1
10.591
1.279
-10.433
2
10.560
1.184
-10.323
3
10.523
1.097
-10.144
←最終座標
入力平均座標(軌跡)
…
92
-4.190
-8.728
-22.926
93
-4.925
-9.316
-23.447
r_sum_min=
1.790653
←経路の座標と入力座標との RMSD
qpath=
0
10.591
1.279 -10.433
qpath=
0
10.591
1.279 -10.433
囲内に存在する経路上
…
qpath= 950
-4.152
-8.789 -22.904
qpath=1000
-4.925
-9.316 -23.447
dr=
0.2000000
10.591
1.279
-10.433
1
10.466
1.208
-10.553
2
10.342
1.136
-10.672
…
-4.555
-9.065
-23.189
98
-4.694
-9.160
-23.286
99
-4.832
-9.254
-23.383
myPresto 4.2
dr 間隔で出力した経路
上の座標(path.dat)
97
% ./RUN.sh
の座標
←経路上の座標をこの間隔で出力
0
■実行例
軌跡の座標から一定範
155
【参考】経路の選択について
作成した複数の候補から適切な経路を選択する方法としては、平均座標の軌跡との RMSD を
参考にするのも良いが、経路と軌跡をグラフで重ね合わせてみて、その上で適切と思われ
る経路を使用する事を推奨します。
(5)系の作成および MD の実行
先ず、作成する系の数(経路を作る座標の数)だけディレクトリを用意して、経路上の各
座標との距離が一番短い平均座標を(3)で計算した中から選び出し、それぞれの平均座
標に対応した出力構造に水分子、イオンを加えて新たな系を作成します。作成した系の PDB
ファイルとトポロジーファイルを各ディレクトリに保存します。
次に、作成した系に対してエネルギー最小化、平衡化を行います。サンプリングでは経路
上の座標を中心としたアンブレラ・ポテンシャルを発生させて、ランドマーク原子に働く
平均力を計算します。
作業は、SRPG_sample/Streptavidin/Explicit 以下で行います。
(5-1)系の作成
実行ファイル:
・ 実行スクリプト(set_system.sh)
入力ファイル:
・ 系の座標(path.dat)
(4)で選択した経路の出力ファイルから作成、コピーしておく。
・ ランドマーク原子の軌跡(log)
平均力、平均座標を纏めたファイル((3)で出力された all_avg の名前を変えてコピ
ーしたもの)。
・ 水分子付加プログラム用入力(setwat.inp)
CAP 水の半径、中心座標を記述する(内部で setwater を使用)。
・ イオン不可プログラム用入力(addion.inp)
生理食塩水濃度(0.00275 mol(NaCl)/mol(H2 O))を使用する(内部で add_ion が使用)。
・ タンパク質およびリガンドのトポロジー(cmx.tpl)
水分子とイオン(Na+, Cl-)のトポロジーデータを予め追加しておく。分子数は系生成
スクリプトが調整する為、任意で良い。
・ CAP ポテンシャル用入力(cap_25.capbc)
CAP ポテンシャルの中心座標、半径を入力する。水分子、イオン数は任意で良い。
・ アンブレラ・ポテンシャル用入力(newopt_fp_base)
ポテンシャルの中心座標を除く全項目について入力する。ポテンシャルの中心座標は系
生成スクリプトが追加する。
myPresto 4.2
156
出力ファイル:
・ 計算系リスト(conf.dat)*
経路上の座標番号、最近接の平均座標番号、およびそれらの間の距離を出力する。
**
・ 計算系
各座標に対応する計算系ディレクトリが作成され、エネルギー最小化、平衡化用の入力
ファイルが配置される。
* :conf.dat の例
左から順に経路上の座標番号、(3)の平均座標の出力番号、それら座標間の距離となります。
2 列目の番号は、経路上の各座標から一番近い距離にある平均座標が選択されます。
1
1
0.003
2
3
0.106
3
6
0.248
4
6
0.198
5
10
0.246
…
**:計算系の例
スクリプトを実行した結果、以下の様なディレクトリが作成されます。
1
10
100
11
12
13
14
15
16
17
18
19
2
20
21
22
23
24
25
26
27
28
29
3
30
31
32
33
34
35
36
37
38
39
4
40
41
42
43
44
45
46
47
48
49
5
50
51
52
53
54
55
56
57
58
59
6
60
61
62
63
64
65
66
67
68
69
7
70
71
72
73
74
75
76
77
78
79
8
80
81
82
83
84
85
86
87
88
89
9
90
91
92
93
94
95
96
97
98
99
cmx.tpl
pmf_calc
Calc_pmf.sh conf.dat
pmf_calc.f
M_all.res
dir_list_orgreplaced_wat.pdb
M_min.res
ion.pdb
set_system.sh
add_ionmd_w.inpsetwat.inp
addion.inp
min.inp
setwater
cap_25.capbc newopt_fp
tip3_base.pdb
cmp.pdb
newopt_fp_basewat.pdb
cmw.pdb
path.dat
この時点では各ディレクトリの中身は以下のようになるはずです。
cap_25.capbc
cmx.pdb
cmx.tpl
newopt_fp
■実行例
% ./set_system.sh
なお、以下が set_system.sh の内容になります。
myPresto 4.2
pmf_r
157
#!/bin/csh
# numbre of protein-ligand systems.
@ nsys = 100 ←系の数
@ i = 1
while($i<= $nsys)
# Removing old directories and make new directories
rm -r $i
mkdir $i ←ディレクトリの作成
# Calculation of distances between coordinates on smooth reaction path and average coordinates of ligand
landmark atom, and selection of ligands from dissociation trajectory, which make minimum distances.
set cod = (`awk '{if(NR=='$i') print $2,$3,$4}' path.dat`) ←経路の座標の読み込み
awk'BEGIN{m=0;rmin=999999.0} {m=m+1;if(NR==m)
r=(('$cod[1]'-$1)**2+('$cod[2]'-$2)**2+('$cod[3]'-$3)**2)**0.5;if(r<=rmin) {nmin=m;
rmin=r}}END{printf("%5d%5d%8.3f¥n",'$i',nmin,rmin)}' log >conf.dat ←軌跡の座標との最短距離の計算
set k = `awk '{if(NR=='$i') print $2;}' conf.dat`
cp ../Make_path/Dissociation/w_$k.pdbcmp.pdb ←最短距離を作るリガンドを持った系をコピーする。
# set water molecules and ions in each system. ←水とイオンの付加
./setwater<setwat.inp
cat cmp.pdbwat.pdb>cmw.pdb
./add_ion<addion.inp
cat ion.pdb>>cmx.pdb
# set topology file. ←トポロジーファイルの水分子、イオンの数の調整
set jwat = `awk 'BEGIN{total=0} {if($4=="WAT") total=total+1} END{print total/3}' cmx.pdb`
set jcl = `awk 'BEGIN{total=0} {if($3=="CL") total=total+1} END{print total}' cmx.pdb`
set jna = `awk 'BEGIN{total=0} {if($3=="NA") total=total+1} END{print total}' cmx.pdb`
awk '{if($1=="WAT" && NF>1) printf("WAT%49d¥n",'$jwat');¥
else if($1=="CL" && NF>1) printf("'CL'%50d¥n",'$jcl');¥
else if($1=="NA" && NF>1) printf("'NA'%50d¥n",'$jna');¥
else print}' cmx.tpl> $i/cmx.tpl
myPresto 4.2
158
# set CAP potential file. ←CAPポテンシャル入力ファイルの水分子、イオンの数の調整
awk '{if($1=="WAT") printf("'WAT'%9d%6d%9s¥n",$2,'$jwat',"YES");¥
else if($1=="CL") printf("'CL'%10d%6d%9s¥n",$2,'$jcl',"YES");¥
else if($1=="NA") printf("'NA'%10d%6d%9s¥n",$2,'$jna',"YES");¥
else print}' cap_25.capbc > $i/cap_25.capbc
mvcmx.pdb $i/
# set input file for unbrella potential. ←アンブレラポテンシャルファイルの作成
cat newopt_fp_base>newopt_fp
awk '{if(NR == '$i') printf("'ATOM'%26s%8.3f%8.3f%8.3f¥n","",$2,$3,$4)}' path.dat>>newopt_fp
cp newopt_fp $i/
# set input file for average force and coordinate. ←平均力、平均座標計算用の入力ファイルの作成
echo "FILPOT> FILPOT" > $i/pmf_r
tail -1 newopt_fp>> $i/pmf_r
echo "0.3" >> $i/pmf_r
@ i = $i + 1
end
(5-2)エネルギー最小化、平衡化およびサンプリング
各計算系ディレクトリのエネルギー最小化、平衡化、サンプリングを実施します。
実行ファイル:
・ 実行スクリプト(run)
入力ファイル:
・ エネルギー最小化用入力(min.inp)
・ 位置拘束指定(M_min.res)
エネルギー最小化の際に使用する。対象はタンパク質とリガンド。
・ 平衡化、サンプリング用入力(md_w.inp)
・ 位置拘束指定(M_all.res)
平衡化、サンプリングの際に使用する。対象はタンパク質のみ。
出力ファイル:
・ エネルギー最小化結果(min.out)
・ 平衡化、サンプリング結果(md.out, FP.avg)
※ 各計算系のディレクトリ以下に出力される。
myPresto 4.2
159
■実行例
% ./run
(6)PMF の計算
(5)で計算した経路上の各座標におけるランドマーク原子に働く平均力から PMF を計算
します。作業は、SRPG_sample/Streptavidin/Explicit 以下で行います。
実行ファイル:
・ PMF 計算(pmf_calc.f)
・ 実行スクリプト(Calc_pmf.sh)
pmf_calc の入力ファイルを作成し、PMF 計算を実行する。
入力ファイル:
・ (5)で計算した経路座標および平均力(path.dat)
Calc_pmf.sh を実行した際に作成される。
・ 計算系ディレクトリのリスト(dir_list_org)
Calc_pmf.sh を実行する際に必要。
出力ファイル:
・ PMF 計算結果(pmf.dat)
■実行例
% ./Calc_pmf.sh
(7)結合状態周辺の自由エネルギーの計算
(6)で計算した PMF の結合状態の自由エネルギー最安定点を中心に、その周辺について
これまでと同様に PMF の計算を行います。先ず、(5)の計算で自由エネルギー最安定点に
対応した系の平均座標を中心として、各軸に沿って前後1Å の範囲で 0.1Å 間隔でこれま
でと同様に平均力を計算し、PMF を計算します。次に、各軸の PMF が放物線を描いているか
どうかをグラフで確認します。
作業は、SRPG_sample/Streptavidin/Explicit/deltaG 以下で行います。
実行ファイル:
・ 入力準備(set_fp)
計算系ディレクトリ作成、アンブレラ・ポテンシャル入力の作成、および平均力と平均
座標計算用入力(pmf_r)の作成を行う。
・ 実行スクリプト(run)
入力ファイル:
myPresto 4.2
160
・ 自由エネルギー最安定点の構造およびトポロジー(initial.pdb, initial.tpl)
・ 自由エネルギー再安定点の系の平均座標(ave_cod.inp)
・ CAP ポテンシャル用入力(cap_25.capbc)
・ MD 計算入力(md_w.inp)
・ 位置拘束指定(M_all.res)
・ 計算系ディレクトリのリスト(dir_list_org)
出力ファイル:
・ MD 計算、サンプリング結果(output, FP.avg)
※ 各計算系のディレクトリ以下に出力される。
・ PMF 計算結果(pmf.dat)
■実行例
% ./set_fp
% ./run
% ./Calc_pmf.sh
(8)自由エネルギーの計算
(7)で計算した各軸の PMF を基にして、結合状態の存在確率を計算し、解離状態の存在
確率との比からΔG を計算します。
作業は、SRPG_sample/Streptavidin/Explicit/deltaG 以下で行います。
実行ファイル:
・ ΔG 計算(dg_calc.f)
(6)で計算した PMF のグラフは r > 8Åでフラットになる。非結合状態を r∞ = 15Å
とすると、pmf.dat における非結合状態の PMF 値は 21.9kcal/mol である。
したがって、非結合状態の PMF 値を 0kcal/mol にシフトさせると結合状態 r0 = 0 Åの PMF
値は-21.9kcal/mol となるので、この値を dg_calc.f の変数 g0 として設定する。
入力ファイル:
・ 各軸の PMF(x/pmf.dat, y/pmf.dat, z/pmf.dat)
出力ファイル:
・ 標準出力
■実行例
% ./dg.exe
myPresto 4.2
161
5.17
Sample-17:溶解度予測−アグリゲータ解析−
溶解度予測は、分子記述子に基づくある種の回帰(MLR, PLS, NN ...)で行う事が一般的
です。本サンプルでもその方法を踏襲していますが、GB/SA・ASA といった物理記述子の追
加および重み付き学習法の利用により計算精度の向上を図っています。
本サンプルでは、データベースに付属の約 1300 分子のデータセット、回帰計算に PLS 回帰
を使用して溶解度予測を行います。更に、アグリゲータ分子の溶解度予測結果に対してベ
イジアン分析を行う事により、アグリゲータ予測を実施します。
※ サンプル実行の前に溶解度ツールのインストールを実施してください(B.19 参照)。
(1)記述子計算(sample17/dsc/)
先ず、記述子の計算を溶解度予測の準備として実施します。記述子の計算は、溶解度既知
のデータベースおよび溶解度未知の入力分子について行います。ここで計算する記述子は、
薬物候補低分子用の拡張 Joback 記述子(構造記述子)および GB/SA・ASA といった物理記
述子です(全 60 記述子−下表)。
ID
Name
1MW
2Ar
3DelO_H
4AddN_H
5Ra
6dASA_o
7dG_o
8dASA_wd
9dG_wd
10dASA_w
11dG_w
12ddG_o
13ddG_wd
14ddG_w
15 -CH3, CH4
60>N-GinR
Description
Mass weight of molecule
Number of aroamtic atoms
Number of dissociated H atoms, which bind O
Number of additional H atoms, which bind N
Number of atoms in ring
Accessible surface area par unit volume (in octanol)
Solvation free energy evaluated by the GBSA method (in octanol)
Accessible surface area par unit volume (in water, ion form)
Solvation free energy evaluated by the GBSA method (in water, ion form)
Accessible surface area par unit volume (in water)
Solvation free energy evaluated by the GBSA method (in water)
dG_o / Accessible surface area (in octanol)
dG_wd / Accessible surface area (in water, ion form)
dG_w / Accessible surface area (in water)
Number of -CH3 fragments or CH 4s
... Joback-like sub-structure descriptors (15 - 60 ) ...
>N- group in ring which binds the atom with πelectron.
物理記述子の計算は、水中およびオクタノール中での GB/SA・ASA 等の値を cosgene により
計算します。その際、水中では Hgene で発生させた分子の解離型・非解離型について計算
します。各条件・型の計算では、それぞれ confgene で発生させた複数配座について計算し、
それらを平均したものを採用します。
一方、構造記述子の計算は、trans_code を使用して拡張 Joback 記述子の官能基の存在数を
カウントします。記述子計算の実行手順は以下の通りです。
① 分子の準備(sample17/dsc/)
データベースまたは入力分子は、格納ディレクトリ内に single-mol2 ファイルとして用
意され、カレントディレクトリにその分子リストが用意されている必要があります(下
図)。
myPresto 4.2
162
tch0.mol2
tch1.mol2
...
tchs/
tsts/
tch_inp.lst
tst_inp.lst
tst0.mol2
tst1.mol2
...
分子が multi-mol2 ファイルで用意されている場合、split_mols 等のツールを使用して、
single-mol2 ファイルに分割します(split_mols は tools に含まれています)。
$ mkdir tchs
$ split_mols -i tchs.mol2 -o tchs -p tch
※ データベース
$ mkdir tsts
$ split_mols -i tsts .mol2 -o tsts -p tst
※ 入力分子
分子リストは以下の内容のものを用意します。ID、ファイル名、logS 値を記述しますが、
logS 値が無い場合は ID、ファイル名のみとします(なお、各 mol2 ファイルの@<TRIPOS>
COMMENT 内に logS 値は記述可能で、その場合も ID、ファイル名のみとします)。
$ less tch_inp.lst
0
tch0.mol2
1
tch1.mol2
※ logS 値が分かっているが、各 tch<n>.mol2 に記載済み
または、logS 値が分かっていない場合
…
$ less tst_inp.lst
0
tst0.mol2
-2.675
1
tst1.mol2
-1.972
※ logS 値が分かっており、各 tst<n>.mol2 には未記載で
分子リストで指定する場合
…
② 計算条件の設定(sptool/Descriptor/)
指定可能な物理記述子の計算条件はそれぞれ指定個所が異なります。デフォルト値につ
いては各設定値を参照してください。
計算条件
指定個所
tplgeneL のパラメータ定義ファイル
Descriptor.rb 内の TPLLDBF
GBSAinp のパラメータ定義ファイル
Descriptor.rb 内の GBSADB
cosgene での最小化条件
min_template.erb
cosgene での GB/SA・ASA 計算条件
min_template_o.erb(オクタノール中)
min_template_w.erb(水中)
confgene での発生配座数
Descriptor.rb 内の CNF_NUM
confgene での発生配座角度(360/<n>)
Descriptor.rb 内の CNF_ANG
myPresto 4.2
163
指定可能な構造記述子の計算条件についても同様です。
計算条件
trans_code の記述子定義ファイル
指定個所
Descriptor.rb 内の TRNSDB
③ 計算の実行(sample17/dsc/)
現ディレクトリにおいて以下のコマンドで実行します(Descriptor/にパスが通っていない
場合は 2 番目のコマンドとなります)。
1
$ Descriptor.rb -i tchs -l tch_inp.lst -o tch_out.dsc > tch_out.err 2>&1
$ Descriptor.rb -i tsts -l tst_inp.lst -o tst_out.dsc > tst_out.err 2>&1
2
$ ruby -I <path: Descriptor/> <path: Descriptor.rb> -i tchs -l tch_inp.lst -o tch_out.dsc > tch_out.err 2>&1
$ ruby -I <path: Descriptor/> <path: Descriptor.rb> -i tsts -l tst_inp.lst -o tst_out.dsc > tst_out.err 2>&1
※ スイッチ: "-i" = mol2 格納ディレクトリ, "-l" = mol2 リストファイル, "-o" = 記述子ファイル
※ 実行時には次のディレクトリをカレント以下に作成するので注意してください。
分子リストと同名ディレクトリ: テンポラリ、エラー詳細ファイルを格納
出力記述子ファイルと同名ディレクトリ: 物理記述子設定済み mol2 ファイルを格納
(2)溶解度推算(sample17/sol/)
次に(1)で計算した記述子について回帰計算を行います。回帰計算には PLS 回帰を利用しま
す。重み付き学習法を適用して入力分子に対する学習済みデータベースを作成し、入力分
子と学習済みデータベースのセットに対して PLS による回帰計算及び入力分子の溶解度推
算を行います。その際、各回帰計算および推算結果全体について推算精度(決定係数)が
計算されます(推算結果全体は入力分子にも logS 値が指定されている場合)。
溶解度計算の実行手順は以下の通りです。
① 記述子の準備(sample17/sol/)
(1)のデータベースおよび入力分子の記述子をコピーします。入力分子の記述子に logS 値
が指定されていれば推算精度が計算されます。なお、記述子ファイルの右端列に logS 値
を設定する事も可能です(未設定の場合、logS 値列(右端)は 0.000000e+00)。
$ cp ../dsc/tch_out.dsc .
$ cp ../dsc/tst_out.dsc .
② 計算条件の設定(sptool/Solubility/)
指定可能な物理記述子の計算条件は Solubility.rb 内の当該個所で指定します。
計算条件
指定個所
記述子のサイズ設定
Solubility.rb 内の DSCS
重み付き学習法の bin 数
Solubility.rb 内の BINS
重み付き学習法の decoy 数
Solubility.rb 内の DCYS
補正計算の on/off
Solubility.rb 内の SWT_CRR
myPresto 4.2
164
③ 計算の実行(sample17/sol/)
現ディレクトリにおいて以下のコマンドで実行します(インストール場所にパスが通っ
ていない場合は 2 番目のコマンドとなります)。
1
$ Solubility.rb -i tst_out.dsc -d tch_out.dsc -o tst_sol.out -m w p > tst_sol .err 2>&1
2
$ ruby -I <path: Solubility/> <path: Solubility.rb> -i tst_out.dsc -d tch_out.dsc -o tst_sol.out -m w p >
tst_sol.err 2>&1
※ スイッチ: "-i" = 入力記述子ファイル, "-d" = DB 記述子ファイル, "-o" = 溶解度推算結果,
"-m" = 重み付き学習法 {w(ln)/n(o)} 及び回帰関数 {p(ls)/m(lr)} 切り替え
※ 実行時には次のディレクトリをカレント以下に作成するので注意してください。
入力記述子ファイルと同名ディレクトリ: テンポラリ、エラー詳細ファイルを格納
④ 計算結果の内容(sample17/sol/)
得られた計算結果ファイル(tst_sol.out)には以下の様な項目が有ります。入力分子の
記述子に logS 値が指定されていれば推算精度も計算されます。
推算結果:
項目
内容
ID
入力分子 ID
tchC1
データベースの回帰直線の係数 C1: y = C1 * x + C2
tchC2
データベースの回帰直線の係数 C2: y = C1 * x + C2
tchR2
データベースの決定係数
tchAveErr
データベースの平均エラー
tchMaxErr
データベースの最大エラー(絶対値が最大)
tchWL
重み付き学習時の追加デコイ数
tstExp
入力分子の logS(実験値)
tstPre
入力分子の logS(推算値)
tstErr
入力分子の推算エラー(絶対値)
推算精度:
項目
内容
tstC1
全入力分子の回帰直線の係数 C1: y = C1 * x + C2
tstC2
全入力分子の回帰直線の係数 C2: y = C1 * x + C2
tstR2
全入力分子の決定係数
tchAveErr
全入力分子の平均エラー
tchMaxErr
全入力分子の最大エラー(絶対値が最大)
(3)アグリゲータ予測(sample17/agg/, sample17/agg_trgt/)
最後に、アグリゲータ予測の計算は以下の手順で行います。データベースの logS 頻度分布
からベイジアン解析によって logS 依存のアグリゲータ存在確率を求め、これをシグモイド
myPresto 4.2
165
関数でフィッティングします。その後、得られたシグモイド関数を使って入力分子のアグ
リゲータ予測を行います。
アグリゲータ予測の手順は以下の通りです。
① 溶解度の推算(sample17/agg/dsc/, sample17/agg/sol/)
(1)の通りに記述子の計算を行い、(2)の通りに溶解度推算を行います。
※ 溶解度推算には(1)で計算したデータベースを利用します。
$ cp ../dsc/tch_out.dsc sol/
※ (1)で計算したデータベースを利用
$ cd dsc
$ Descriptor.rb ?i aggs ?l agg_inp.lst ?o agg_out.dsc > agg_out.err 2>&1
$ Descriptor.rb ?i nons ?l non_inp.lst ?o non_out.dsc > non_out.err 2>&1
$ cp *_out.dsc ../sol
$ cd ../sol
$ Solubility.rb ?i agg_out.dsc ?d tch_out.dsc ?o agg_sol.out ?m w p > agg_sol.err 2>&1
$ Solubility.rb ?i non_out.dsc ?d tch_out.dsc ?o non_sol.out ?m w p > non_sol.err 2>&1
② logS 頻度分布の作成(sample17/agg/sol/)
溶解度の推算結果より、アグリゲータ及び非アグリゲータの logS 頻度分布を別個に作成
します。計算は現ディレクトリにおいて以下のコマンドで実行します(インストール場
所にパスが通っていない場合は 2 番目のコマンドとなります)。
1
$ FreqMaker.rb -i agg_sol.out -w 0.5 -o agg.frq
$ FreqMaker.rb -i non_sol.out -w 0.5 -o non.frq
2
$ ruby -I <path: Aggregator/> <path: FreqMaker.rb> -i agg_sol .out -w 0.5 -o agg.frq
$ ruby -I <path: Aggregator/> <path: FreqMaker.rb> -i non_sol .out -w 0.5 -o non.frq
※ スイッチ: "-i" = 溶解度推算ファイル, "-w" = ヒストグラム幅, "-o" = ヒストグラムファイル
その後、アグリゲータ及び非アグリゲータの頻度分布をエディタ等で一つに纏めます(こ
れは手作業で行います)。纏めた logS 頻度分布は、以下の書式に従う様にします。
$ less agg_non.frq
-4.5 5 9
※ <logS> <アグリゲータ度数> <非アグリゲータ度数>
-4.0 5 11
…
③ ベイジアン解析及びフィッティングの実行(sample17/agg/sol/)
logS 頻度分布からベイジアン解析によりアグリゲータの存在確率を計算します。なお、
入力に必要なシグモイド関数の係数初期値は、グラフ等を作成して適宜探索する必要が
あります。計算は現ディレクトリにおいて以下のコマンドで実行します(インストール
場所にパスが通っていない場合は 2 番目のコマンドとなります)。
myPresto 4.2
166
1
2
$ bys -d agg_non.frq
※ グラフ用データを作成(fitting しない)
$ bys -d agg_non.frq -i 1.35 -4.7
※ 係数初期値はグラフを見て決定
$ <path: bys> -d agg_non.frq
$ <path: bys> -d agg_non.frq -i 1.35 -4.7
※ スイッチ: "-d" = データベースファイル, "-i" = シグモイド関数の係数初期値 c1 = a, c2 = b
係数値は入力ファイル名と同名の係数ファイル(agg_non.cff)に出力されます。
なお、フィッティングするシグモイド関数の定義は以下の通りです。
Pagg (log S ) =
1
1+ e
1.0E+00
14
9.0E-01
12
8.0E-01
10
8
6
agg
4
non
7.0E-01
6.0E-01
Probability
Frequency
16
a (log S −b )
5.0E-01
2
4.0E-01
prb
3.0E-01
2.0E-01
sig
1.0E-01
0
0.0E+00
-1.5E+01
-1.0E+01
logS(Calc.)
-5.0E+00
0.0E+00
5.0E+00
logS(Calc.)
④ アグリゲータの予測(sample17/agg_trgt/dsc/, sample17/agg_trgt/sol/)
アグリゲータの予測は、フィッティングで得られたシグモイド関数を使って行います。
予測対象の logS 実験値が存在しない場合、前述に倣って(1)記述子計算、(2)溶解度推算
を行います。ここでは LigandBox から抽出した下記条件(分子量および N 原子、O 原子の
含有率)の組み合わせ、全 9 セットについて計算を行います。
MW(Da)
% of N,O
200 <= * < 300
0 <= * <
15
300 <= * < 400
15 <= * <
30
400 <= * <
500
30 <= * <= 100
まず、全 9 セットについて(1)の通りに記述子の計算を行い、(2)の通りに溶解度推算を
行います。以下は MW={200<=*< 300}かつ%ofN,O={ 0<=*< 15}の例です。
$ cp ../dsc/tch_out.dsc dsc/
※ (1)で計算したデータベースを利用
$ cd dsc
$ Descriptor.rb ?i pcts200-300_0-15 ?l pcts200-300_0-15.lst ?o pcts200-300_0-15_out.dsc
> pcts200-300_0-15_out.err 2>&1
※ 他の pcts<mw>_<no%>についても同様
$ cp pcts200-300_0-15_out.dsc ../sol
$ cd ../sol
$ Solubility.rb ?i pcts200-300_0-15_out.dsc ?d tch_out.dsc ?o pcts200-300_0-15_sol.out ?m w p
> pcts200-300_0-15_sol.err 2>&1
※ 他の pcts<mw>_<no%>についても同様
他の条件セットについても同様に計算します。
myPresto 4.2
167
アグリゲータ予測は、③で得られたシグモイド関数の係数値を利用するので、当該ファ
イルを現ディレクトリ(sample17/agg_trgt/sol/)にコピーします。
$ cp ../../agg/agg_non.cff .
※ ③で計算した係数値を利用
計算は現ディレクトリにおいて以下のコマンドで実行します(インストール場所にパス
が通っていない場合は 2 番目のコマンドとなります)。
以下は MW={200<=*< 300}かつ%ofN,O={ 0<=*< 15}の例です。
1
$ bys -c agg_non.cff -t pcts200-300_0-15_sol.out -n 10 9
2
$ <path: bys> -c agg_non.cff -t pcts200-300_0-15_sol.out -n 10 9
※ スイッチ: "-c" = 係数ファイル, "-t" = 入力ファイル, "-n" = 入力ファイル列数, logS 列番号
※ logS 列番号は 1 からカウント
予測結果は入力ファイル名と同名の結果ファイル(例:pcts200-300_0-15_sol.est)に出
力されます。他の条件セットについても同様に計算します。
⑤ 予測結果の内容(sample17/agg_trgt/sol/)
得られた計算結果(例:pcts200-300_0-15_sol.est)では以下の様な項目が出力されます。
推算情報:
項目
内容
(c1, c2, err)
シグモイド関数の係数及びエラー
total_no
全入力分子数
avg_est(%)
平均アグリゲータ確率
avg_mkr
平均 logS 値
推算結果:
項目
内容
id
入力分子 ID
maker
入力分子 logS 値
estimation
入力分子アグリゲータ確率
myPresto 4.2
168
5.18
Sample-18:CAP 水を用いた生理食塩水中での蛋白質と化合物の複合体の系の計算
蛋白質2量体である HIV プロテアーゼに、化合物が結合した複合体を、生理食塩水中で
CAP 水(孤立系)で、NVT 計算をします。
tplgene は、蛋白質―化合物―イオン―水の入った系を一度に処理することができるので、
この機能を活用すると、トポロジーファイルのマージ操作なしに簡便に系を組み立てる手
法を紹介します。
蛋白質は PDB などからダウンロードすることが多いですが、化合物は、化合物データベ
ースから抜き出した mol2 ファイルか、手作業で作成した mol2 ファイル、ないし PDB のリ
ガンドそのもの、などいろいろな場合が考えられます。
使用するスクリプトは以下の通りです。
0_1_make.sh
0_2_capbc.sh
0_3_shake.sh
上記スクリプト中のプログラムのディレクトリーは、環境に応じて書き変えてください。
なお、蛋白質がジスルフィド結合を含む場合(PDB ファイルに SSBOND 行がある)、tplgene
で生成される PDB ファイルに SSBOND 行が記載されないため、作業手順は、より複雑になり
ます。
ステップ1:
まず、PDB から、1htf.pdb をダウンロードします。必要なファイルは、1htf_complex_org
にあります。下記のコマンドを実行し、ディレクトリごとコピーしてください。
% cp ?R 1htf_complex_org work
以下の操作は、work (cd work)で行ってください。ディレクトリに入っているファイル
は、以下の 3 つです。
1htf.crd
:修正したタンパク質のみの PDB
1htf.pdb
:PDB からダウンロードしたファイルそのもの。例では使用しない。
Lig.mol2
:リガンドの mol2 ファイル。
リガンドの mol2 ファイルの作成については、詳細は省略します。PDB 座標(Lig.pdb)から
の作成であれば、原子電荷が Gasteiger 法になりますが、下記のコマンドを実行すること
で簡易に作成することができます。
% Hgene ?ipdb Lig.pdb ?p ?omol2 Lig.mol2
myPresto 4.2
169
1htf.pdb が、PDB の元のファイルです。ここから、蛋白質部分のみを切り出し、1htf.crd
とします。HIV プロテアーゼは2量体で、25番の ASP2つが、ダイマー界面で向かい合い、
片方の ASP は、H 化されています。そこで、1htf.crd の A 鎖の25番の残基名 ASP を、ASH
と書き変えます。
tplgene で、1htf.crd から、Pro.pdb/Pro.tpl を生成してください。tplgene の入力は以
下のようにします。
pro
end
pro
end
1
1
C99_aa.tpl
1htf.crd
Pro.pdb
Pro.tpl
pro1
pro2
ステップ2:
もっとも簡単には、下記のコマンドを実行することにより、Pro.pdb, Pro.tpl, Lig.mol2
から、数分で、複合体の系 Pro_1.pdb, Pro_1.tpl, 位置拘束ファイル M_all.res
を生成
します。
% ../0_1_make.sh
0_1_make.sh の代わりに手作業で行う時の手順を説明します。Tplgene は、蛋白質―化合
物―イオン―水の入った系を一度に処理することができますが、化合物に関しては、
tplgeneL で処理された情報をマージするようになっています。ですので、あらかじめ、低
分子を tplgeneL で処理する必要があります。低分子は、Lig.mol2 とし、tplgeneL への入
力は以下のようにします。
2
Lig.mol2
1
myPresto 4.2
170
こうして、Lig.tpl
Lig_tplL.pdb を用意します。
全原子の蛋白質の座標 Pro.pdb に、化合物の座標 Lig_tplL.pdb をマージして、Pro_0.pdb
を作ります。
Pro_0.pdb を setwater にかけて、水を発生します。setwater への入力は以下のようにし
ます。
Pro_0.pdb
N
:結晶水は使わない
wat.pdb
S
:球状に水を付けます
-10.0
:蛋白質―化合物の系から、球の表面までの最短距離を 10Åに設定します。
C
:蛋白質―化合物の系の重心を、系の中心にします。
1.0
1.0
3
こうして発生した水を系に加え、新たに座標 Pro.pdb を作ります。この系に対し、生理
食塩水濃度で塩を add_ion で加えます。add_ion への入力は以下のようにします。
Pro.pdb
:蛋白質―化合物―水の系
Pro_0.pdb
:イオンで置換される水を除いた蛋白質―化合物―水の系
ion.pdb
replace.pdb
3
:濃度を指定します。
0.00277
:生理食塩水濃度を指定
6.0
:標準的な、付加するイオン間の最短距離。
Pro_0.pdb と、ion.pdb をマージすることで、:蛋白質―化合物―イオン―水の系を作り
ます。後は 、この 系を tplgene で 処理す れ ば、蛋白質―化合物― イオン― 水の系の
PDB(Pro_1.pdb)とトポロジーファイル(Pro_1.tpl)が生成されます。
もし蛋白質にジスルフィド結合があり、PDB に SSBOND 行の記載が必要な場合、Pro_x.pdb
に含まれる蛋白質の PDB 座標は、SSBOND 行を含む元の PDB ファイルに差し替えてください。
その際、tplgene への入力ファイルは以下のようにします。
myPresto 4.2
171
pro
end
pro
end
1
1
C99_aa.tpl
Pro_x.pdb
Pro_1.pdb
Pro_1.tpl
1
Lig.tpl
pro1
pro2
最後に、蛋白質の鎖の数(1:単量体、2:2量体)に合わせて、位置拘束ファイルを
選んで M_all.res にコピーします。
ステップ3:
Cap 拘束ファイルを作ります。下記のコマンドを実行することで capbc が作成されます。
% ../0_2_capbc.sh
ただし、このスクリプトは、参考までに作られたものなので、出来上がった capbc は、
適当に手で修正してください。蛋白質の鎖が2本の場合のみに、まともな capbc が作成さ
れ、それ以外の場合は手作業での修正が必要です。
ステップ4:
位置拘束ファイルを用いながら、下記のコマンドを実行してエネルギー最小化をしてく
ださい。
% cosgene < ../min.inp
ステップ5:
エネルギー最小化が済めば、必要に応じて、SHAKE 入力ファイルを作成します。下記のコ
マンドを実行して下さい。
myPresto 4.2
172
% ../0_3_shake.inp
SHAKE の入力ファイルは、エネルギー最小化された安定な構造を元に作成しないと、SHAKE
アルゴリズムの収束が悪く、MD 計算が途中で破綻する原因となります。
ステップ6:
SHAKE を用いた MD を行います。下記のコマンドを実行して下さい。
% cosgene < ../md_w.inp
以上で終了です。個別の系では、蛋白質の鎖の数、化合物の数(補因子とリガンドなど)
が異なるため、少し手順を変える必要はありますが、基本はほぼ同じです。
【注意】tplgene では、蛋白質の鎖(チェイン)は、TER 行のみで認識されます。TER がな
いと、どんなに離れたアミノ酸残基同士でも、アミノ酸残基番号が連続でなくても、アミ
ド結合で1本のペプチド鎖として連結します。add_ion や cosgene を通すと、TER 行が失わ
れ,tplgene に再度通すと正しく処理できません。手で後から TER 行を追加するか、TER 行
の記載されたファイルを使う必要があります。また、tplgene, cosgene, add_ion などのツ
ールでは、SSBOND 行も失われます。SSBOND を含む蛋白質では、SSBOND 行が失われたファイ
ルを用いて tplgene でファイルを再作成すると、正しいファイルが生成されません。
【注意】化合物、水、イオンは、HETATM 行で認識されます。ATOM 行で、これらを記述する
と、tplgene では処理できません。
myPresto 4.2
173
5.19
Sample-19:周期系を用いた生理食塩水中での蛋白質の系の NPT 計算
蛋白質2量体である HIV プロテアーゼを、結晶水を利用して生理食塩水中で NPT 計算を
します。
tplgene は、蛋白質―イオン―水の入った系を一度に処理することができるので、この機
能を活用すると、トポロジーファイルのマージ操作なしに簡便に系を組み立てる手法を紹
介します。
使用するスクリプトは以下の通りです。
0_1_make.sh :系の作成
0_CTRL
:エネルギー最小化
1_CTRL
:より丁寧なエネルギー最小化
2_CTRL
:蛋白質を固定した NVT
3_CTRL_npt
MD 計算
:NPT 計算
上記スクリプト中のプログラムのディレクトリーは、環境に応じて書き変えてください。
なお、蛋白質がジスルフィド結合を含む場合(PDB ファイルに SSBOND 行がある)、tplgene
で生成される PDB ファイルに SSBOND 行が記載されないため、作業手順は、より複雑になり
ます。
ステップ1:
まず、PDB から、1htf.pdb をダウンロードします。必要なファイルは、1htf_complex_org
にあります。下記のコマンドを実行し、ディレクトリごとコピーしてください。
% cp ?R 1htf_complex_org work
以下の操作は、work (cd work)で行ってください。ディレクトリに入っているファイル
は、以下の 2 つです。
1htf.crd
:修正したタンパク質のみの PDB
1htf.pdb
:PDB からダウンロードしたファイルそのもの。例では使用しない。
系(1htf.pdb)には、リガンドと結晶水が含まれますが、リガンドは無視して、アポ体構
造の計算をすることにします。
1htf.pdb が、PDB の元のファイルです。ここから、蛋白質部分のみを切り出し、1htf.crd
とします。HIV プロテアーゼは2量体で、25番の ASP2つが、ダイマー界面で向かい合い、
片方の ASP は、H 化されています。そこで、1htf.crd の A 鎖の25番の残基名 ASP を、ASH
と書き変えます。
myPresto 4.2
174
ステップ2:
もっとも簡単には、下記のコマンドを実行することにより、Pro.pdb, Pro.tpl, Lig.mol2
から、数分で、複合体の系 Pro_1.pdb, Pro_1.tpl, 位置拘束ファイル M_all.res
を生成
します。
% ../0_1_make.sh
0_1_make.sh の代わりに手作業で行う時の手順を説明します。tplgene で、1htf.crd から、
Pro.pdb/Pro.tpl を生成してください。tplgene の入力は以下のようにします。
pro
end
pro
end
1
1
C99_aa.tpl
1htf.crd
Pro.pdb
Pro.tpl
1 :TIP3P 水の選択
pro1
pro2
Pro_0.pdb を setwater にかけて、水を発生します。Setwater への入力は以下のようにし
ます。
Pro_0.pdb
Y
:結晶水は使わない
Pro_0.pdb :
Pro_0.pdb に含まれる結晶水を利用します。
wat.pdb
C
:直方体セルの形状で水を付けます
-10.0
-10.0 -10.0:蛋白質―化合物の系から、セルの X,Y,Z 表面までの最短距離を 10Å
に設定します。
C
:蛋白質―化合物の系の重心を、系の中心にします。
1.0
1.0
3
myPresto 4.2
175
こうして発生した水を系に加え、新たに座標 Pro.pdb を作ります。この系に対し、生理
食塩水濃度で塩を add_ion で加えます。add_ion への入力は以下のようにします。
Pro.pdb
:蛋白質―化合物―水の系
Pro_0.pdb
:イオンで置換される水を除いた蛋白質―化合物―水の系
ion.pdb
replace.pdb
3
:濃度を指定します。
0.00277
:生理食塩水濃度を指定
6.0
:標準的な、付加するイオン間の最短距離。
Pro_0.pdb と、ion.pdb をマージすることで、:蛋白質―水―イオンの系を作ります。後
は、この系を tplgene で処理すれば、蛋白質―水−イオンの系の PDB(Pro_1.pdb)とトポロ
ジーファイル(Pro_1.tpl)が生成されます。
もし蛋白質にジスルフィド結合があり、PDB に SSBOND 行の記載が必要な場合、Pro_x.pdb
に含まれる蛋白質の PDB 座標は、SSBOND 行を含む元の PDB ファイルに差し替えてください。
その際の tplgene の入力ファイルは以下のようにします。
pro
end
pro
end
1
1
C99_aa.tpl
Pro_x.pdb
Pro_1.pdb
Pro_1.tpl
1
Lig.tpl
pro1
pro2
最後に、蛋白質の鎖の数(1:単量体、2:2量体)に合わせて、位置拘束ファイルを
選んで M_all.res にコピーします。
myPresto 4.2
176
ステップ3:
wat.pdb の末尾に記載されるセルの中心座標、セルの辺の長さを cosgene 用制御ファイル
に書き込みます。
■wat.pdb の末尾の例
REMARK
SETWATER(v2.0) RESULTS
REMARK
TARGET MOLECULE
-> Pro_0.pdb
REMARK
CRYSTAL WATER
-> Pro_0.pdb
REMARK
CELL
->
C
60.137000
66.351000
76.464000
REMARK
CENTER
->
C
23.581327
-0.029227
-0.004452
REMARK
DENSITY ->
1.000000
REMARK
DAMP F. ->
1.000000
REMARK
NUMBER OF CRYSTAL WATER
:
0
REMARK
NUMBER OF WATER MOLECULE
:
8785
REMARK
NUMBER OF WATER ATOM
:
26355
(PROBE R. =
1.400000A)
セルの辺の長さは、CELL、重心は CENTER に出力されるので、cosgene 用制御ファイル
(0_CTRL, 1_CTRL, 2_CTRL, 3_CTRL_npt)に以下のように記載します。
■制御ファイルへの記載例
CENTRX =
23.581327
; X
CENTRY =
-0.029227
; Y
CENTRZ =
-0.004452
; Z
LXCELL =
60.137000
; X
LYCELL =
66.351000
; Y
LZCELL =
76.464000
; Z
ステップ4:
セルサイズを固定したまま、以下のコマンドでエネルギー最小化をしてください。
% cosgene < ../0_CTRL
最初のエネルギー最小化が済めば、以下のコマンドで2回目のより丁寧なエネルギー最
小化をしてください。
% cosgene < ../1_CTRL
myPresto 4.2
177
NPT 計算は、わずかな原子間衝突のエネルギーなどで、系が壊れますので、孤立系に比べて
丁寧な系の準備が必要です。
ステップ5:
エネルギー最小化が済めば、蛋白質を固定した MD 計算で、溶媒の平衡化を行います。下
記のコマンドを実行して下さい。
% cosgene < ../2_CTRL
ステップ6:
Berendsen の方法を用いた NPT
MD を行い、セルサイズを決定します。以下のコマンドを
実行して下さい。
% cosgene < ../3_CTRL
【注意】Berendsen の方法では、カノニカルアンサンブルは実現されません。
以上で終了です。セルサイズが決まれば、NVT 計算に移行してもよいですし、更に NPT 計
算を続ける場合、厳密にカノニカルアンサンブルを実現できるパリネロ・ラーマンの方法
やアンデルセンの方法に移行しても良いです。最初から厳密な手法を適用すると、系が壊
れやすいです。個別の系では、蛋白質の鎖の数、化合物の数(補因子とリガンドなど)が
異なるため、少し手順を変える必要はありますが、基本はほぼ同じです。
【注意】tplgene では、蛋白質の鎖(チェイン)は、TER 行のみで認識されます。TER がな
いと、どんなに離れたアミノ酸残基同士でも、アミノ酸残基番号が連続でなくても、アミ
ド結合で1本のペプチド鎖として連結します。add_ion や cosgene を通すと、TER 行が失わ
れ,tplgene に再度通すと正しく処理できません。手で後から TER 行を追加するか、TER 行
の記載されたファイルを使う必要があります。また、tplgene, cosgene, add_ion などのツ
ールでは、SSBOND 行も失われます。SSBOND を含む蛋白質では、SSBOND 行が失われたファイ
ルを用いて tplgene でファイルを再作成すると、正しいファイルが生成されません。
【注意】化合物、水、イオンは、HETATM 行で認識されます。ATOM 行で、これらを記述する
と、tplgene では処理できません。
myPresto 4.2
178
(余白)
myPresto 4.2
179
A 入出力ファイル
A.1 構造探索エンジンの入出力ファイル
構造探索エンジンは、以下の目的でファイルの入出力を行う。
(1)シミュレーション条件の指定
(2)シミュレーション状態の保存
(3)シミュレーション結果の出力
これらのファイルを総称して入出力ファイルと呼ぶ。
A.1.1 フェーズの説明
構造探索エンジンは、以下のフェーズでファイルの入出力を行う。
(1)INPUT フェーズ
系のトポロジー、座標、シミュレーション条件などのファイルの入力 。
(2)OUTPUT フェーズ
シミュレーション後の系のトポロジー、座標のファイル出力。
(3)MINimize フェーズ
系のポテンシャルエネルギーの最小化。
(4)MD フェーズ
系の分子動力学シミュレーション。
myPresto 4.0
180
A.2 入力ファイル
構造探索エンジンの入力ファイルを以下に示す。
項番
ファイル名称
対
象
-
用
途
#1
制御ファイル
構造探索エンジンの制御
#2
トポロジーファイル
全フェーズ
シミュレートする系のトポロジー指定
#3
座標ファイル
全フェーズ
シミュレートする系の原子座標指定
#4
SHAKE ファイル
MIN, MD
SHAKE 対象原子と拘束距離の指定
#5
固定原子・自由原子指定
MIN, MD
自由/固定原子の指定
ファイル
#6
CAP 指定ファイル
全フェーズ
セル形状、CAP 拘束の指定
#7
拡張 CAP 指定ファイル
全フェーズ
拡張 CAP 拘束の指定
#8
位置拘束ファイル
全フェーズ
位置拘束の指定
#9
距離拘束ファイル
全フェーズ
距離拘束の指定
#10
二面角拘束ファイル
全フェーズ
二面角拘束の指定
#11
モニター指定ファイル
MD
モニター対象の指定
#12
系 の重 心 合 わ せ指 定 用
MIN, MD
重心合わせ対象原子の指定
MIN, MD
GB/SA 及び ASA 用パラメータの指定
ファイル
#13
系の GB/SA 及び ASA 用パ
ラメータ指定ファイル
#14
リスタートファイル
MD
リスタート情報の指定
#15
剛体モデルファイル
MD
剛体モデル対象原子の指定
myPresto 4.2
181
A.2.1 制御ファイル
対象フェーズ:全フェーズ
用途:構造探索エンジンの実行フェーズ制御とフェーズに指定するパラメータを指定する。
特記事項:
実数の指数を示す文字は”D”でなければならない。
実数指数の指定例)
CPUTIM = 60.0D0
書式:
[実行フェーズ指定行
[フェーズ内パラメータ指定行 ]...
パラメータ終了行
]...
実行フェーズ指定行:実行するフェーズを以下の文字列で指定する。
INPUT フェーズ
=
OUTPUT フェーズ
MINimize フェーズ
“EXE> INPUT”
=
“EXE> OUTPUT”
=
“EXE> MIN”
MD フェーズ
=
“EXE> MD”
実行終了行
=
“EXE> END”
パラメータ終了行:フェーズ内パラメータ指定行の終了を以下の形式で指定する。
“QUIT”
フェーズ内パラメータ指定:各フェーズのパラメータを以下の形式で指定する。
キーワード “=” 値
※キーワードは英字6文字で構成され、値はキーワードに対応し、選択型、実数型、整数
型、文字型の4種類である。
myPresto 4.2
182
キーワード指定例)
UNITAN = 30
;
整数型パラメータ
NAMEAN = aa.ana
;
文字型パラメータ
BINCLO = NO
;
選択型パラメータ
CPUTIM = 60.0D0
;
実数型パラメータ
以下、各フェーズのキーワードと値を示す。英字の大文字が有効となる。
また、「内容」列の括弧内は、「値」列の形式に従い、次の項目を記述する。
・選択型
:大文字は指定文字、アンダーライン付はデフォルト値
・整数型、実数型、文字型
:デフォルト値
A.2.1.1 INPUT フェーズ
項番
#1
項
目
入力トポロジー
キーワード
TOPOLOgy
値
内
容
選択型
ファイルの読み込みと形式
(NOREad │ FORMatted │ BINAry)
#2
UNITTOpology
整数型
装置番号(10)
#3
NAMETOpology
文字型
ファイル名("")
COORDInate
選択型
ファイルの読み込みと形式
#4
入力原子座標
(NOREad │ PDB │ BINAry)
#5
UNITCOordinate
整数型
装置番号(11)
#6
NAMECOordinate
文字型
ファイル名("")
SETSHAke
選択型
ファイルの読み込み
#7
入力 SHAKE 情報
(NOREad │ READ │ AUTO)
#8
UNITSHake
整数型
装置番号(12)
#9
NAMESHake
文字型
ファイル名("")
DBGSHA
選択型
ファイルの書き込み
#10
出力 SHAKE 自動
作成情報
(NOWRite │ ASCIi)
#11
UNITDS
整数型
装置番号(84)
#12
NAMERS
文字型
ファイル名("")
SETVARiables
選択型
ファイルの読み込み
#13
入力固定原子
情報
(NOREad │ READ)
#14
UNITVAribles
整数型
装置番号(13)
#15
NAMEVAriables
文字型
ファイル名("")
myPresto 4.2
183
#16
入力境界条件
SETBOUndary
選択型
ファイルの読み込み
(NOREad │ READ)
#17
UNITBOundary
整数型
装置番号(14)
#18
NAMEBOundary
文字型
ファイル名("")
SETEXC
選択型
ファイルの読み込み
#19
入力拡張 CAP
情報
(NOREad │ READ)
#20
UNITEC
整数型
装置番号(23)
#21
NAMEEC
文字型
ファイル名("")
REFCOOrdinate
選択型
ファイルの読み込みと形式
#22
入力位置拘束
座標
(NOREad │ PDB)
#23
UNITREfcoordinate
整数型
装置番号(15)
#24
NAMEREFcoordinate
文字型
ファイル名
POSITIonrestrain
選択型
ファイルの読み込み
#25
入力位置拘束
情報
(NOREad │ READ)
#26
UNITPOsition
整数型
装置番号(16)
#27
NAMEPOsition
文字型
ファイル名("")
DISTANcerestrain
選択型
ファイルの読み込み
#28
入力距離拘束
情報
(NOREad │ READ)
#29
UNITDIstance
整数型
装置番号(17)
#30
NAMEDIstance
文字型
ファイル名("")
DIHEDRalrestrain
選択型
ファイルの読み込み
#31
入力二面角拘束
情報
(NOREad │ READ)
#32
UNITDH
整数型
装置番号(18)
#33
NAMEDH
文字型
ファイル名("")
OUTMONitoritems
選択型
ファイルの読み込み
#34
入力モニター
対象構造情報
(NOREad │ READ)
#35
UNITMOnitoritems
整数型
装置番号(19)
#36
NAMEMOnitoritems
文字型
ファイル名("")
ASAREA
選択型
ファイルの読み込み
#37
入力 GB/SA 及び
ASA 用パラメー
#38
タ情報
#39
#40
入力 UMBRELLA
(NOREad │ READ)
UNITSA
整数型
装置番号(77)
NAMESA
文字型
ファイル名("")
UMBREL
選択型
ファイルの読み込み
拘束情報
#41
(NOREad │ READ)
UNITUI
整数型
装置番号(22)
myPresto 4.2
184
#42
#43
系の重心の
NAMEUI
文字型
ファイル名("")
SETORIgin
選択型
センタリングの指定
センタリング
(NO │ YES)
A.2.1.2 OUTPUT フェーズ
項番
#1
項
目
出力トポロジー
キーワード
TOPOLOgy
値
内
容
選択型
ファイルの書き込みと形式
(NOWRite │ FORMatted │ BINAry)
#2
UNITTOpology
整数型
装置番号(90)
#3
NAMETOpology
文字型
ファイル名("")
COORDInate
選択型
ファイルの書き込みと形式
#4
出力原子座標
(NOWRite │ PDB │ BINAry)
#5
UNITCOordiante
整数型
装置番号(91)
#6
NAMECOordinate
文字型
ファイル名("")
#7
RMSDCOordinate
選択型
ファイルの書き込みと形式
(NOWRite │ PDB │ BINAry )
myPresto 4.2
185
A.2.1.3 MINimize フェーズ
項番
項
目
キーワード
値
内
容
#1
MIN エネルギー
UNITAN
整数型
装置番号(30)
#2
データ
NAMEAN
文字型
ファイル名("")
#3
ジョブ制御
CPUTIMelimit
実数型
CPU 時間上限(60.0)
#4
MONITOrinterval
整数型
ログ出力間隔(10)
#5
LOGFORmat
選択型
ログ出力形式
(SHORt │ DETAil)
BESTFItmini
#6
選択型
(least square fitting)値の表示
(NO │ YES)
RMSDFIirst
#7
整数型
RMSD 計算対象先頭チェイン番号
(1)
RMSDLAst
#8
整数型
RMSD 計算対象最終チェイン番号
(1)
#9
エネルギー
METHODofmini
選択型
最小化
計算方法
(STEEpest │ CONJugate)
#10
LOOPLImit
整数型
MINIMIZE ループ回数(0)
#11
CONVGRadient
実数型
収束 RMSF 値(0.1)
#12
ISTEPLength
実数型
初期ステップ長(0.01)
#13
UPRATE
実数型
STEEP 法ステップ長上方倍率
(1.2)
DOWNRAte
#14
実数型
STEEP 法ステップ長下方倍率
(0.6)
#15
LINESEarchlimit
整数型
CONJUGATE 法ループ回数(10)
#16
CONVLInesearch
実数型
CONJUGATE 法収束条件(0.1)
CALBONd
選択型
bond 力の計算
#17
相互作用計算
(CALC │ NOCAlc)
#18
CALANGle
選択型
angle 力の計算
(CALC │ NOCAlc)
#19
CALTORsion
選択型
torsion 力の計算
(CALC │ NOCAlc)
#20
CALIMProper
選択型
improper 力の計算
(CALC │ NOCAlc)
#21
CALV14
選択型
1-4 van der Waals 力の計算
(CALC │ NOCAlc)
myPresto 4.2
186
CALE14
#22
選択型
1-4 静電力の計算
(CALC │ NOCAlc)
CUTMEThod
#23
選択型
カットオフ方法
(RESC │ ATOM │ RESA)
#24
CUTLENgth
実数型
カットオフ長(8.0)
#25
USESPL
選択型
スプライン補間の適用
(NO │ YES)
#26
CUT-ON
実数型
スプライン開始距離(6.0)
#27
UPDATEinterval
整数型
相互作用テーブル更新間隔(20)
#28
CALV15
選択型
カットオフあり 1-5vdW 力計算
#29
CALE15
#30
CALHYD
(CALC │ NOCAlc)
選択型
カットオフあり 1-5 静電力計算
(CALC │ NOCAlc)
選択型
カットオフあり 1-5 水素力計算
(CALC │ NOCAlc)
CALV5N
#31
選択型
カットオフなし 1-5vdW 力計算
(CALC │ NOCAlc)
CALE5N
#32
選択型
カットオフなし 1-5 静電力計算
(CALC │ NOCAlc)
CALH5N
#33
選択型
カットオフなし 1-5 水素力計算
(CALC │ NOCAlc)
DIEFUNction
#34
選択型
静電の距離依存
(CONS │ DIST)
#35
#36
PME 法,
DIEVALue
実数型
静電の係数(1.0)
CALPME
選択型
PME 法の実行
Ewald 法
#37
(NO │ YES)
CALEWAld
選択型
Ewald 法の実行
(NO │ YES)
#38
PMESPD
選択型
PME 法での計算間隔の調整
(NORM │ HIGH)
#39
PMEUPD
選択型
PMESPD= HIGH の場合の計算方法
(CUT │ RECI)
#40
REATOL
実数型
Ewald 法での許容誤差(1.0d-19)
#41
EWAPAR
実数
PME 法、Ewald 法での逆空間計算
係数(0.35)
myPresto 4.2
187
#42
PMEORDer
整数型
PME 法多重極展開数(5)
#43
MESHLX
整数型
PME 法 x 軸メッシュ数(16)
#44
MESHLY
整数型
PME 法 y 軸メッシュ数(16)
#45
MESHLZ
整数型
PME 法 z 軸メッシュ数(16)
USEFMM
選択型
FMM 法の実行(NO │ YES)
FMMSPD
選択型
FMM 法での計算間隔の調整
#46
FMM 法
#47
(NORM │ HIGH)
#48
FMTREE
整数型
FMM 法 Tree サイズ (3)
#49
FMPOLE
整数型
FMM 法多重極展開数(8)
#50
FMNUMA
整数型
FMM 法セル内最大原子数(1000)
CALPSR
選択型
位置拘束計算
#51
拘束力計算
(CALC │ NOCAlc)
#52
WETPSR
実数型
位置拘束重み(5.0)
#53
CALDSR
選択型
距離拘束力計算
(CALC │ NOCAlc)
#54
WETDSR
実数型
距離拘束重み(1.0)
#55
CALDHR
選択型
二面角拘束力計算
(CALC │ NOCAlc)
#56
WETDHR
実数型
二面角拘束重み(10.0)
#57
CALREPulsion
選択型
repulsion 力計算
(CALC │ NOCAlc)
#58
WETREPulsion
実数型
repulsion 重み(1.0)
#59
REPSCAle
実数型
repulsion ス ケ ー ル フ ァ ク タ
(1.0)
#60
REPDELta
実数型
repulsion 許容誤差(1.0)
#61
CALCAP
選択型
cap 拘束力計算
(CALC │ NOCAlc)
#62
EXTCAP
選択型
拡張 cap 拘束力計算
(CALC │ NOCAlc)
#63
RADCAP
実数型
cap 半径(20.0)
#64
FORCAP
実数型
cap係数(150.0)
#65
FUNCAP
選択型
cap 種別
(HARMonic │ BIQUadratic)
#66
TEMPERature
実数型
拘束温度(300.0)
myPresto 4.2
188
SHAKEMethod
#67
選択型
shake 種別
(NOSHake │ HBONd │ ALLBond)
#68
COVSHK
実数型
shake 収束値(1.0D-6)
#69
LIMSHK
整数型
shake ループ上限(1000)
CAL-GB
選択型
GB 計算(CALC │ NOCAlc)
#71
GBWELE
実数型
水の誘電率(78.3)
#72
GBMELE
実数型
蛋白の誘電率 (1.0)
#73
GBDELT
実数型
Born 半径の補正値 (0.0)
#74
GBLAMB
実数型
容積補正値(1.0)
#75
GBOFFS
実数型
van der Waals 半径補正値(0.09)
CALASA
選択型
ASA 計算(CALC │ NOCAlc)
#77
ASAPRO
実数型
PROBE 半径(1.4)
#78
ASAWEI
実数型
ASA 重み(1.0)
#79
ASACUT
実数型
ASA 用カットオフ長(4.5)
BOUNDAry
選択型
基本セルの形状
#70
#76
#80
GB 計算
ASA 計算
境界条件
(NO │ PERI │ ELLIPSoid │ SPHERE)
#81
SETCENter
選択型
先頭分子の重心をセルの中心に
設定
(NO │ YES)
#82
CENTRX
実数型
セルの中心 x 座標(0)
#83
CENTRY
実数型
セルの中心 y 座標(0)
#84
CENTRZ
実数型
セルの中心 z 座標(0)
#85
LXCELL
実数型
立方体セルの x 軸サイズ(40)
#86
LYCELL
実数型
立方体セルのy軸サイズ(40)
#87
LZCELL
実数型
立方体セルの z 軸サイズ(40)
#88
ELLIPA
実数型
楕円体セルの半径(30)
#89
ELLIPB
実数型
楕円体セルの半径(30)
#90
ELLIPC
実数型
楕円体セルの半径(30)
#91
RADIUS
実数型
SPHERE セルの半径(30)
#92
REPLAC
選択型
座標引き戻し方法
(ATOM │ RESI │ CHAI)
myPresto 4.2
189
A.2.1.4 MD フェーズ
項番
項
目
キーワード
値
内
#1
リスタート
UNITRI
整数型
装置番号(40)
#2
ファイル入力
NAMERI
文字型
ファイル名("")
#3
リスタート
UNITRO
整数型
装置番号(41)
#4
ファイル出力
NAMERO
文字型
ファイル名("")
#5
原子速度出力
MNTRVElocity
選択型
形式
容
(NO │ ASCIi │ SINGle │ DOUBle)
#6
UNITVElocity
整数型
装置番号(43)
#7
NAMEVElocity
文字型
ファイル名("")
#8
OUTVELocity
整数型
出力間隔(0)
MNTRENergy
選択型
形式
#9
エネルギー
情報出力
(NO │ ASCIi │ SINGle │ DOUBle)
#10
UNITENergy
整数型
装置番号(44)
#11
NAMEENergy
文字型
ファイル名("")
#12
OUTENErgy
整数型
出力間隔(0)
MNTRCOordinate
選択型
形式
#13
原子位置出力
(NO │ ASCIi │ SINGle │ DOUBle)
#14
UNITCOordinate
整数型
装置番号(42)
#15
NAMECOordinate
文字型
ファイル名("")
#16
OUTCOOrdinate
整数型
出力間隔(0)
MNTRTRajectory
選択型
形式
#17
トラジェクトリ
ー出力
(NO │ ASCIi │ SINGle │ DOUBle)
#18
UNITTRajectory
整数型
装置番号(50)
#19
NAMETRajectory
文字型
ファイル名("")
#20
OUTTRJ
整数型
出力間隔(0)
MNTRTOtalenergy
選択型
形式
#21
総エネルギー
(total
(NO │ ASCIi │ SINGle │ DOUBle)
#22
potential
UNITTOtalenergy
整数型
装置番号(59)
#23
energy) 出力
NAMETOtalenergy
文字型
ファイル名("")
#24
ジョブ制御
CONTINuousjob
選択型
同一ジョブ内の MD 計算間で結果
の物理量を引き継ぐ
(NO │ YES)
#25
RESTARt
選択型
トラジェクトリ O │ YES)
myPresto 4.2
190
OUTRST
#26
実数型
自動リスタートファイル出力
秒間隔(0.0): 0 以下は出力しな
い
#27
OUTRSL
整数型
自動リスタートファイル出力
ループ間隔(0)
:0 以下は出力しない
#28
NAMETI
文字型
入力座標トラジェクトリ
ファイル名("")
#29
NUMTRJ
整数型
座標トラジェクトリの位置(0)
#30
CPUTIMelimit
実数型
CPU 時間上限(60.0)
#31
OUTLOG
整数型
ログ出力間隔(1)
#32
LOGFORmat
選択型
ログ出力形式
(SHORt │ DETAil)
#33
BESTFIt
選択型
ベストフィットの実行
(NO │ YES)
#34
RMSDFIirst
整数型
RMSD 計算対象先頭チェイン 番号
(1)
#35
RMSDLAst
整数型
RMSD 計算対象最終チェイン 番号
(1)
#36
MD 方法
LOOPLImit
整数型
MD ループ回数(0)
#37
TIMESTep
実数型
MD 時間増分(1.0)
#38
SETTIMelimit
実数型
シミュレーション時間(5.0)
#39
HEATLOop
整数型
昇温ループ回数(0)
#40
STARTTempearture
実数型
初期温度(300.0)
#41
INITIAlvelocity
選択型
初期速度指定
(ZERO │ SET │ RESEt)
#42
RANDOMseed
整数型
初 期 速 度 設 定 用 の乱 数 種
(584287)
#43
SETTEMperature
実数型
シミュレーション温度(300.0)
#44
TEMPCOntrol2
選択型
温度制御種別
(NO │ YES)
#45
STOPCEnterofmass
選択型
系全体の回転、移動を停止
(NO │ TRANslate │ ROTAtion │
BOTH)
myPresto 4.2
191
#46
METHOD
選択型
アンサンブル種別
(MICRocanonical│ CANOnical │
NPT │ EXPAnded)
#47
THERMOstat
選択型
Canonical アンサンブルの温度制
御種別 (CONStant│ NOSE-hoover)
#48
SCLUPD
整数型
GAUSS の束縛法での速度スケーリ
ング間隔(0)
#49
COUPLIngtime
実数型
Nose-Hoover 法でのカップリング
時間(100.0)
#50
BAROSTat
選択型
NPT アンサンブルの圧力制御種
別
(ANDEersen │ PARA │ BEREndsen)
#51
MODIFI
選択型
Parrinello Rahman 法でのセル
変形条件
(FLEX │ MONO │ ORTH │ SING │
ISOT )
#52
SETPRE
実数型
設定圧力(1.0)
#53
COUPHB
実数型
温度制御用カップリング
タイムスケール(1000.0)
#54
COUPPI
実数型
圧力制御用カップリング
タイムスケール(1000.0)
#55
INTEGRation
選択型
積分器の種別
(LEAP-flog │ VELOcity)
#56
FREQME
整数型
計算頻度(中)(1)
#57
FREQLO
整数型
計算頻度(長)(1)
EXPAND-ensemble
選択型
拡張アンサンブル種別
#58
拡張アンサンブ
ル
(FORCe-bias │
SIMUlated tempering │
GST │ EFFE )
#59
DUMMYLoop
整数型
ダミーループ回数(1)
#60
RESETC
整数型
ヒストグラム更新間隔初期値
(300000)
#61
BINSIZe
実数型
ヒストグラムのビンサイズ (5.0)
#62
ENEMIN
実数型
最小エネルギー(-10000.0)
#63
ENEMAX
実数型
最大エネルギー(10000.0)
myPresto 4.2
192
#64
TEMMIN
実数型
最小温度(250.0)
#65
TEMMAX
実数型
最大温度(700.0)
#66
LIMITS
実数型
最小検索閾値 (0.001)
#67
LIMITC
実数型
確率密度関数計算閾値(0.001)
#68
STTNUM
整数型
温度分割数(100)
#69
STEBAS
実数型
最小エネルギー(ベースエネルギー)(0.0)
#70
GSTMIN
実数型
パラメータλの下限(0.001d0)
#71
GSTMAX
実数型
パラメータλの上限(0.006d0)
#72
GSTNUM
整数型
パラメータλの個数(20)
#73
GSTUPD
整数型
パラメータλの更新間隔(100)
#74
GSTCON
整数型
パラメータλの収束 MD 回数
#75
GSTSAM
(10000000)
整数型
パラメータλのすケーリング前
のサンプリング回数(50000)
#76
GSTBAS
実数型
最小エネルギー(ベースエネルギー)(25.5)
#77
GSTETA
実数型
(0.5)
#78
FBRSTO
選択型
FB 分布データファイル出力形式
(NOWR │ ASCI │ DOUB)
#79
NAMEFO
文字型
出 力 FB 分布データファイル名
("")
#80
FBRSTI
選択型
FB 分布データファイル入力形式
(NORE │ ASCI │ DOUB)
#81
NAMEFI
文字型
入 力 FB 分布データファイル名
("")
#82
UNITFR
整数型
FB 分布データファイル装置番号
(85)
#83
UNITEP
整数型
確率データファイルの 装置番号
(78)
#84
NAMEEP
文字型
確 率 デ ー タ フ ァ イ ル 名
("expand.prob")
#85
UNITES
整数型
スケール因子データファイルの
装置番号(77)
#86
NAMEES
文字型
スケール因子データファイル名
("expand.scale")
myPresto 4.2
193
#87
UNITEE
整数型
エネルギーデータファイルの
装置番号(79)
#88
NAMEEE
文字型
エネルギーデータファイル名
("expand.energy")
#89
Tsallis
ELOWER
実数型
低エネルギー側閾値(0.0d0)
#90
Dynamics
EUPPER
実数型
高エネルギー側閾値(0.0d0)
#91
ROF1DR
実数型
ρ1 のパラメタ d の条件
#92
ROF2XI
実数型
ρ2 のパラメタξの値
#93
ROF2VX
実数型
ρ2 のパラメタδの条件
#94
ROF2VY
実数型
ρ2 のパラメタγの条件
#95
UNITZT
整数型
zeta 値モニタファイル装置番
号
(80)
NAMEZT
#96
文字型
zeta 値モニタファイル名
("zeta_TD.dat")
OUTZET
#97
整数型
zeta 値モニタファイル出力間
隔
(1)
MNTRZT
#98
選択型
zeta 値モニタファイル出力形
式
(NO │ ASCI │ SING │ DOUB)
UNITCK
#99
整数型
Tsallis 積分チェック値モニタ
ファイル装置番号(75)
NAMECK
#100
文字型
Tsallis 積分チェック値モニタ
ファイル名("check_TD.dat")
OUTCHK
#101
整数型
Tsallis 積分チェック値モニタ
ファイル出力間隔(1)
MNTRCK
#102
選択型
Tsallis 積分チェック値モニタ
ファイル出力形式
(NO │ ASCI │ SING │ DOUB)
#103
#104
分布密度関数
のモニタ出力
UNITDD
整数型
Tsallis 分布密度関数モニタフ
ァイル装置番号(83)
NAMEDD
文字型
Tsallis 分布密度関数モニタフ
ァイル名("")
myPresto 4.2
194
OUTDDF
#105
整数型
Tsallis 分布密度関数モニタフ
ァイル出力間隔(1)
MNTRDD
#106
選択型
Tsallis 分布密度関数モニタフ
ァイル出力形式
(NO │ ASCI │ SING │ DOUB)
#107
エネルギーの
UNITPK
整数型
装置番号(81)
#108
モニタ出力
NAMEPK
文字型
ファイル名("")
#109
OUTPKT
整数型
出力間隔(0)
#110
MNTRPK
選択型
出力形式(NO │ ASCI │ SING │
DOUB)
FLGPKT
#111
選択型
出力項目(---, --+, -+-, -++,
+--, +-+, ++-, +++)
potential, kinetic, total を
3 文字で表し、"+"が出力対象
#112
全体の物理量
UNITQU
整数型
装置番号(82)
#113
モニタ出力
NAMEQU
文字型
ファイル名("")
#114
(重心、全運動 OUTQUA
整数型
出力間隔(1)
#115
量、全角運動
MNTRQU
選択型
出力形式
量、全力、全ト
(NO │ ASCI │ SING │ DOUB)
ルク、rmsd)
#116
相互作用計算
CALBONd
選択型
bond 力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#117
CALANGle
選択型
angle 力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#118
CALTORsion
#119
CALIMProper
選択型
torsion 力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
選択型
improper 力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#120
CALV14
選択型
1-4 van der Waals 力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#121
CALE14
選択型
1-4 静電力の計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#122
CUTMEThod
選択型
カットオフ方法
(RESC │ ATOM │ RESA)
#123
CUTLENgth
実数型
カットオフ長(8.0)
#124
UPDATEinterval
整数型
相互作用テーブル更新間隔(20)
myPresto 4.2
195
USESPL
#125
選択型
スプライン補間の適用
(NO │ YES)
#126
CUT-ON
実数型
スプライン開始距離(6.0)
#127
CALV15
選択型
カットオフあり 1-5vdW 力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
CALE15
#128
選択型
カットオフあり 1-5 静電力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
CALHYD
#129
選択型
カットオフあり 1-5 水素力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
CALV5N
#130
選択型
カットオフなし 1-5vdW 力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#131
CALE5N
#132
CALH5N
#133
DIEFUNction
選択型
カットオフなし 1-5 静電力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
選択型
カットオフなし 1-5 水素力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
選択型
静電の距離依存
(CONS │ DIST)
#134
#135
PME 法,
DIEVALue
実数型
静電の係数(1.0)
CALPME
選択型
PME 法の実行
Ewald 法
(NO │ YES)
CALEWAld
#136
選択型
Ewald 法の実行
(NO │ YES)
PMESPD
#137
選択型
PME 法での計算間隔の調整
(NORM │ HIGH)
PMEUPD
#138
選択型
PMESPD= HIGH の場合の計算方法
(CUT │ RECI)
#139
REATOL
実数型
Ewald 法での許容誤差(1.0d-19)
#140
EWAPAR
実数
PME 法、Ewald 法での逆空間計算
係数(0.35)
#141
PMEORDer
整数型
PME 法多重極展開数(5)
#142
MESHLX
整数型
PME 法 x 軸メッシュ数(16)
#143
MESHLY
整数型
PME 法 y 軸メッシュ数(16)
#145
MESHLZ
整数型
PME 法 z 軸メッシュ数(16)
USEFMM
選択型
FMM 法の実行(NO │ YES)
#146
FMM 法
myPresto 4.2
196
FMMSPD
#147
選択型
FMM 法での計算間隔の調整
(NORM │ HIGH)
#148
FMTREE
整数型
FMM 法 Tree サイズ (3)
#149
FMPOLE
整数型
FMM 法多重極展開数(8)
#150
FMNUMA
整数型
FMM セル内最大原子数(1000)
CALPSR
選択型
位置拘束計算
#151
拘束力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#152
WETPSR
実数型
位置拘束重み(5.0)
#153
CALDSR
選択型
距離拘束力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#154
WETDSR
実数型
距離拘束重み(1.0)
#155
CALDHR
選択型
二面角拘束力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
#156
WETDHR
実数型
二面角拘束重み(10.0)
#157
CALREPulsion
選択型
repulsion 力計算
#158
WETREPulsion
実数型
repulsion 重み(1.0)
#159
REPSCAle
実数型
repulsion scale factor (1.0)
#160
REPDELta
実数型
repulsion 許容誤差(1.0)
#161
CALCAP
選択型
cap 拘束力計算
(CALC │ NOCAlc │ MEDIum │ LONG)
(CALC │ NOCAlc │ MEDIum │ LONG)
#162
RADCAP
実数型
cap 半径(20.0)
#163
FORCAP
実数型
cap係数(150.0)
#164
FUNCAP
選択型
cap 種別
(HARMonic │ BIQUadratic)
EXTCAP
#165
選択型
拡張 cap 拘束力計算
(CALC │ NOCAlc)
#166
TEMPERature
実数型
拘束温度(300.0)
#167
SHAKEMethod
選択型
shake 種別
(NOSHake │ HBONd │ ALLBond)
#168
COVSHK
実数型
shake 収束値(1.0D-6)
#169
LIMSHK
整数型
shake ループ上限(1000)
RIGIDModel
選択型
剛体モデル指定(NO │ YES │ AUTO)
#171
UNITRM
整数型
装置番号(56)
#172
NAMERM
文字型
ファイル名("")
#170
剛体モデル
myPresto 4.2
197
DBGRIG
#173
選択型
剛体モデル自動生成情報出力指
定
(NOWR │ ASCI)
#174
UNITDR
整数型
装置番号(84)
#175
NAMEDR
文字型
ファイル名("")
CAL-GB
選択型
GB 計算
#176
GB 計算
(CALC │ NOCAlc│ MEDIum │ LONG)
#177
GBWELE
実数型
水の誘電率(78.3)
#178
GBMELE
実数型
蛋白の誘電率 (1.0)
#179
GBDELT
実数型
Born 半径の補正値 (0.0)
#180
GBLAMB
実数型
容積補正値(1.0)
#181
GBOFFS
実数型
van der Waals 半径補正値(0.09)
CALASA
選択型
ASA 計算
#182
ASA 計算
(CALC │ NOCAlc│ MEDIum │ LONG)
#183
ASAPRO
実数型
PROBE 半径(1.4)
#184
ASAWEI
実数型
ASA 重み(1.0)
#185
ASACUT
実数型
ASA 用カットオフ長(4.5)
CALUMB
選択型
UMBRELLA ポテンシャル計算
#186
UMBRELLA
拘束計算
#187
境界条件
(NOCAlc │ CALC │ MEDIum │ LONG)
BOUNDAry
選択型
基本セルの形状
(NO │ PERI │ ELLIPSoid │ SPHERE)
#188
SETCENter
選択型
先頭分子重心をセルの 中心に設
定
(NO │ YES)
#189
CENTRX
実数型
セルの中心 x 座標(0.0)
#190
CENTRY
実数型
セルの中心 y 座標(0.0)
#191
CENTRZ
実数型
セルの中心 z 座標(0.0)
#192
LXCELL
実数型
立方体セルの x 軸サイズ(40.0)
#193
LYCELL
実数型
立方体セルのy軸サイズ(40.0)
#194
LZCELL
実数型
立方体セルの z 軸サイズ(40.0)
#195
ANGLBC
実数型
LYCELL と LZCELL の角度(90.0)
#196
ANGLCA
実数型
LZCELL と LXCELL の角度(90.0)
#197
ANGLAB
実数型
LXCELL と LYCELL の角度(90.0)
#198
ELLIPA
実数型
楕円体セルの半径(30.0)
#199
ELLIPB
実数型
楕円体セルの半径(30.0)
myPresto 4.2
198
#200
ELLIPC
実数型
楕円体セルの半径(30.0)
#201
RADIUS
実数型
SPHERE セルの半径(30.0)
#202
REPLAC
選択型
座標引き戻し方法
(ATOM │ RESI │ CHAI)
myPresto 4.2
199
A.2.2 トポロジーファイル
対象フェーズ:全フェーズ
用途:シミュレートする系のトポロジーを指定する。
特記事項:
指定により、アスキー、バイナリ(8 バイト実数形式指定)にすることができる。
書式:出力指定により以下の2種類に分かれる。
(1) ASCII 形式指定(TOPOLO= FORM)
特記事項:
行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。
各指定部分は分子指定部分で記述された順序どおりに記述しなければならない。
キーワードは、"TPL> " に続く4文字を認識する。
書式: トポロジーファイルは以下の部分で構成される。
タイトル記述
分子指定記述
[TORSION 指定記述]
原子指定記述
[IMPROPER 指定記述]
[BOND 指定記述]
[ANGLE 指定記述]
ポテンシャル関数指定記述
非結合相互作用指定記述
(1-1)タイトル記述
当該トポロジーのタイトルを記述する。10 行を越えてはならない。
"TPL> TITL"行
[タイトル行 ...]
例)
TPL> TITLE
ALA-DIMER (AMBER UNITED ATOM)
myPresto 4.2
200
(1-2)分子指定記述
当該トポロジーの分子を記述する。
"TPL> MOLE"行
[分子名行 ...]
分子名行は以下の部分で構成される。
分子名称
分子数
分子名称:40 文字以内の英字名を記述する。
分子数
:当該分子の個数を記述する。
例)
TPL> MOLECULE
ALA-DIMER-1
1
WATER(TIP3P-MODEL)-2
449
(1-3)原子指定記述
分子指定記述の順に、その分子を構成する原子の情報を記述する。
"TPL> ATOM"行
分子名称行
[原子記述行 ...]
原子記述行は以下の部分で構成される。
原子名
電荷
原子タイプ
1-2 結合原子数
[1-2 結合原子相手 ..]
相互作用タイプ 残基名
1-3 結合原子数
残基番号
質量
vanderWaals 半径
1-4 結合原子数
[1-3 結合原子相手..]
[1-4 結合原子相手 ..]
[内部座標記述(z-matrix)]
原子名
:8 文字以下で原子名を記述する。
原子タイプ
:4 文字以下で原子タイプを記述する。
相互作用タイプ :整数で相互作用タイプを記述する。
残基名
:8 文字以下で残基名を記述する。
残基番号
:分子内の残基の相対番号を記述する。
質量
:1mol あたりの原子の質量を g 単位で記述する。
vanderWaals 半径:van der Waals 半径をÅ単位で記述する。
myPresto 4.2
201
1-2 結合原子数:1-2 の結合をしている原子で、当該原子より後にある原子の数を記述する。
1-3 結合原子数:1-3 の結合をしている原子で、当該原子より後にある原子の数を記述する。
1-4 結合原子数:1-4 の結合をしている原子で、当該原子より後にある原子の数を記述する。
1-2 結合原子相手:1-2 の結合をしている原子の相対位置を 1-2 結合原子数分だけ記述する。
1-3 結合原子相手:1-3 の結合をしている原子の相対位置を 1-3 結合原子数分だけ記述する。
1-4 結合原子相手:1-4 の結合をしている原子の相対位置を 1-4 結合原子数分だけ記述する。
内部座標記述(z-matrix):以下の通り。
・1-2 結合原子相手:1-2 の結合をしている原子の相対位置。
・1-3 結合原子相手:1-3 の結合をしている原子の相対位置。
・1-4 結合原子相手:1-4 の結合をしている原子の相対位置。
・位相基準原子:位相の基準となる原子の相対位置。
・平衡距離:平衡距離をÅ単位で記述する。
・平衡角:平衡角を度数(degree)単位で記述する。
・位相:初期位相を度数(degree)単位で記述する。
例)
TPL> ATOM
ALA-DIMER-1
N
N3
14
ALA
1
14.010
1.850
-0.263
;
分子名行
->
;
原子名 原子タイプ
->
;
残基名 残基番号
->
;
質量
->
;
1-2 結合原子数
->
;
1-2 結合相手原子
vanderWaals 半径
4
2
2
1
2
3
5
6
->
;
1-3 結合相手原子
7
8
->
;
1-4 結合相手原子
0
0
0
0
4
0.0000
0.0000
0.0000
相互作用タイプ
電荷
1-3 結合原子数
1-4 結合原子数
-> ;内部座標(z-matrix)
(1-4)BOND 指定記述
分子指定記述の順に、その分子内に存在する BOND の情報を記述する。
"TPL> BOND"行
分子名称行
[BOND 記述行 ...]
BOND 記述行は以下の部分で構成される。
BOND 構成原子 1
BOND 構成原子 2
係数
平衡距離
myPresto 4.2
202
BOND 構成原子 1,2 :整数で BOND を構成する原子を記述する。
係数
:BOND の力の係数を KCAL/(MOL*Å2 )単位で記述する。
平衡距離
:平衡距離をÅ単位で記述する。
例)
TPL> BOND
ALA-DIMER-1
1
2
434.00
1.010
;
分子名行
;
構成原子 1
構成原子 2
係数
平衡距離
(1-5)ANGLE 指定記述
分子指定記述の順に、その分子内に存在する ANGLE の情報を記述する。
"TPL> ANGL"行
分子名称行
[ANGLE 記述行 ...]
ANGLE 記述行は以下の部分で構成される。
ANGLE 構成原子 1
ANGLE 構成原子 2
ANGLE 構成原子 3
係数
平衡角
ANGLE 構成原子 1,2,3 :ANGLE を構成する原子を整数で記述する。2 が ANGLE の中心。
係数
:ANGLE の力の係数を KCAL/(MOL*θ2 )単位で記述する。
平衡角
:平衡角を度数(degree)単位で記述する。
例)
TPL> ANGLE
ALA-DIMER-1
2
1
3
35.000
109.50
;
分子名行
;
構成原子 1
構成原子 2
係数
平衡角
(1-6)TORSION 指定記述
分子指定記述の順に、その分子内に存在する TORSION の情報を記述する。
"TPL> TORS"行
分子名称行
[TORSION 記述行 ...]
TORSION 記述行は以下の部分で構成される。
myPresto 4.2
203
TORSION 構成原子 1
TORSION 構成原子 2
TORSION 構成原子 4
係数
TORSION 構成原子 3
重複 torsion 数
対象性
初期位相
1-4 相互作用計算フラグ
TORSION 構成原子 1,2,3,4:TORSION を構成する原子を整数で記述する。
原子 1,2,3 と原子 2,3,4 の組が平面を構成する。
係数:TORSION の力の係数を KCAL/MOL 単位で記述する。
重複 TORSION 数
:当該 TORSION と重なりのある TORSION の数を記述する。
対象性
:当該 TORSION の対象性(周期の逆数)を記述する。
位相
:当該 TORSION の初期位相を度数(degree)単位で記述する。
1-4 相互作用計算フラグ:当該 TORSION の 1 と 4 の原子間の静電・van der Waals 力を計算
する場合は 1 を、そうでない場合 0 を記述する。
例)
TPL> TORSION
ALA-DIMER-1
;
分子名行
2
1
5
6
->
;
構成原子 1 構成原子 2 構成原子 3
1.4
6
3
0.0
->
;
係数
;
1-4 相互作用計算フラグ
1
重複 TORSION 数
対象性
構成原子 4
初期位相
(1-7)IMPROPER-TORSION 指定記述
分子指定記述の順に、その分子内に存在する IMPROPER-TORSION の情報を記述する。
"TPL> IMPR"行
分子名称行
[IMPROPER 記述行 ...]
IMPROPER 記述行は以下の部分で構成される。
IMPROPER 構成原子 1
IMPROPER 構成原子 2
IMPROPER 構成原子 4
係数
IMPROPER 構成原子 3
重複 IMPROPER 数
対象性
初期位相
1-4 相互作用計算フラグ
IMPROPER 構成原子 1,2,3,4:IMPROPER を構成する原子を整数で記述する。
原子 1,2,3 と原子 2,3,4 の組が平面を構成する。
係数
:IMPROPER の力の係数を KCAL/MOL 単位で記述する。
重複 IMPROPER 数 :当該 IMPROPER と重なりのある IMPROPER の数を記述する。
myPresto 4.2
204
対象性
:当該 IMPROPER の対象性(周期の逆数)を記述する。
位相
:当該 IMPROPER の初期位相を度数(degree)単位で記述する。
1-4 相互作用計算フラグ:当該 IMPROPER の 1 と 4 の原子間の静電・van der Waals 力を計
算する場合は 1 を、そうでない場合 0 を記述する。
例)
TPL> IMPROPER
ALA-DIMER-1
;
分子名行
6
5
1
7
->
;
構成原子 1 構成原子 2 構成原子 3
14.0
1
3
180.0
->
;
係数
;
1-4 相互作用計算フラグ
0
重複 IMPROPER 数
対象性
構成原子 4
初期位相
(1-8)ポテンシャル関数指定記述
系のポテンシャル関数の情報を記述する。
"TPL> FUNC"行
[ポテンシャル関数記述行 ...]
ポテンシャル関数記述行は以下の部分で構成される。
番号
係数の個数
ポテンシャル関数名称
番号
:複数行記述する場合に 1 から昇順に整数値で記述する。
係数の個数
:ポテンシャル関数の係数の個数を記述する。
ポテンシャル関数名称:ポテンシャル関数の名称を記述する。
(AMBER │ OPLS │ ECEPP │ CHARM)
例)
TPL> FUNCTION
1
4
AMBER
;
番号
係数の個数
(1-9)非結合相互作用指定記述
系の非結合相互作用情報を記述する。
"TPL> NONB"行
myPresto 4.2
[非結合相互作用記述行 ...]
ポテンシャル関数名称
205
ポテンシャル関数によって、非結合相互作用記述行の書式が異なる((A), (B))。
(A)van der Waals の場合
非結合相互作用記述行に以下を記述する。
相互作用タイプ 1
相互作用タイプ 2
関数タイプ
vanderWaals 深さ
1-4vanderWaals 係数
vanderWaals 半径
1-4 静電係数
相互作用タイプ 1 :原子の相互作用タイプを記述する。
相互作用タイプ 2 :"0"を記述する。
関数タイプ
:"1"を記述する。
vanderWaals 半径 :当該原子の van der Waals 半径をÅ単位で記述する。
vanderWaals 深さ :van der Waals のエネルギーの深さを KCAL/MOL 単位で記述する。
1-4vanderWaals 係数
:1-4 の van der Waal エネルギー計算で使用する係数を記述す
る。
1-4 静電係数
:1-4 の静電エネルギー計算で使用する係数を記述する。
(B)水素結合の場合
相互作用タイプ 1
相互作用タイプ 2
関数タイプ
12 乗項係数
10 乗項係数
相互作用タイプ 1 :原子の相互作用タイプを記述する。
相互作用タイプ 2 :原子の相互作用タイプを記述する。
関数タイプ
:"2"を記述する。
12 乗項係数
:当該原子間の 12 乗項の係数を KCAL/(MOL*Å12 )単位で記述する。
10 乗項係数
:当該原子間の 10 乗項の係数を KCAL/(MOL*Å10 )単位で記述する。
例)
myPresto 4.2
206
TPL> NONBOND
; van der Waals の場合
1
0
1
->
; 原子タイプ 1 原子タイプ 2("0") 関数タイプ("1")
1.9080
0.0860
->
;
vanderWaals 半径
0.8333
0.5
;
1-4vanderWaals 係数
vanderWaals 深さ
1-4 静電係数
; 水素結合の場合
14
14
1.8000
2
->
0.2420
; 原子タイプ 1 原子タイプ 2
;
12 乗項係数
関数タイプ ("2")
10 乗項係数
(2) 実数形式指定(TOPOLO= BINA)
タイトル
分子
原子
残基
Improper
ポテンシャル関数数
チェイン
伸縮
原子種別
タイトル:
行数
INTEGER×1
タイトル文
CHARACTER(80)×行数
分子:
分子数
INTEGER×1
分子名
CHARACTER(40)×分子数
所属チェイン数
INTEGER×分子数
原子:
myPresto 4.2
変角
二面角
207
原子数
INTEGER×1
所属分子
INTEGER×原子数
所属チェイン
INTEGER×原子数
所属残基
INTEGER×原子数
非連結相互作用の種別
INTEGER×原子数
1-2 相互作用数
INTEGER×原子数
1-3 相互作用数
INTEGER×原子数
1-4 相互作用数
INTEGER×原子数
静電荷
REAL*8×原子数
質量
REAL*8×原子数
VanDerWaals 半径
REAL*8×原子数
原子名
CHARACTER(8)×原子数
型名
CHARACTER(4)×原子数
所属残基名
CHARACTER(8)×原子数
1-2 相互作用テーブル No
INTEGER×原子数×1-2 相互作用数
1-3 相互作用テーブル No
INTEGER×原子数×1-3 相互作用数
1-4 相互作用テーブル No
INTEGER×原子数×1-4 相互作用数
残基:
残基数
INTEGER×1
先頭原子番号
INTEGER×残基数
最終原子番号
INTEGER×残基数
チェイン:
チェイン数
INTEGER×1
最終原子番号
INTEGER×チェイン数
伸縮:
伸縮数
INTEGER×1
構成原子
INTEGER×伸縮数×2
係数
REAL*8×伸縮数
最小エネルギー距離
REAL*8×伸縮数
myPresto 4.2
208
変角:
変角数
INTEGER×1
構成原子
INTEGER×変角数×3
係数
REAL*8×変角数
最小エネルギー角
REAL*8×変角数
二面角:
二面角数
INTEGER×1
構成原子
INTEGER×二面角数×4
とりうる角度の数
INTEGER×二面角数
係数
REAL*8×二面角数
対称性
REAL*8×二面角数
位相
REAL*8×二面角数
1-4VanDerWaals 係数
REAL*8×二面角数
1-4 静電係数
REAL*8×二面角数
Improper:
Improper 数
INTEGER×1
構成原子
INTEGER×Improper 数×4
とりうる角度の数
INTEGER×Improper 数
係数
REAL*8×Improper 数
対称性
REAL*8×Improper 数
位相
REAL*8×Improper 数
1-4VanDerWaals 係数
REAL*8×Improper 数
1-4 静電係数
REAL*8×Improper 数
ポテンシャル関数数:
ポテンシャル関数数
INTEGER×1
関数種別
INTEGER×ポテンシャル関数数
関数名
CHARACTER(40)×ポテンシャル関数数
myPresto 4.2
209
原子種別:
原子種別数
INTEGER×1
ポテンシャル関数種別(FUNC_VDW, FUNC_HYD)
INTEGER×原子種別数×原子種別数
1/距離**6 の VanDerWaals
REAL*8×原子種別数×原子種別数
1/距離**12 の VanDerWaals
REAL*8×原子種別数×原子種別数
1/距離**10 の水素結合
REAL*8×原子種別数×原子種別数
1/距離**12 の水素結合
REAL*8×原子種別数×原子種別数
vdW 最小半径
REAL*8×原子種別数×原子種別数
井戸型ポテンシャルの深さ
REAL*8×原子種別数×原子種別数
1-4vdW スケールファクタ
REAL*8×原子種別数×原子種別数
1-4 静電スケールファクタ
REAL*8×原子種別数×原子種別数
myPresto 4.2
210
A.2.3 座標ファイル
対象フェーズ:全フェーズ
用途:シミュレートする系の原子座標を指定する。
特記事項:
指定により、アスキー,バイナリ(8 バイト実数形式指定)にすることができる。
書式:出力指定により以下の2種類に分かれる。
(1) ASCII 形式指定(COORDI= PDB)
PDB フォーマットの仕様に従う。
(2) 実数形式指定(COORDI= BINA)
日付
CHARACTER(80)×1
ユーザ名
CHARACTER(80)×1
原子数
INTEGER×1
x座標
REAL*8×原子数
y座標
REAL*8×原子数
z座標
REAL*8×原子数
myPresto 4.2
211
A.2.4 SHAKE ファイル
対象フェーズ: MIN,MD フェーズ
用途: SHAKE 対象原子と拘束距離を指定する。
特記事項:
行中の“;”以降はコメントとなる。また、”->”は継続行をあらわす。
SHAKE を構成する原子の数は 2,3,4 のいずれかとする。
複数の分子間にまたがる SHAKE は記述できない。
書式: SHAKE 指定は以下の行で構成される。
[ SHAKE 情報先頭行
分子指定行
SHAKE 拘束情報行... ]...
SHAKE 情報先頭行:先頭の文字列が“SHAKE> SHAKE”である行
分子指定行:
分子名を記述した行
SHAKE 拘束情報行:SHAKE 対象原子数、SHAKE 対象原子の分子内相対原子番号、SHAKE 拘束
距離を記述した行。SHAKE を構成する原子数にしたがって以下のように記述する。
2 原子 SHAKE の場合:
“2” 原子 1 の番号
原子 2 の番号
原子 1-原子 2 間の距離
原子 2 の番号
原子 3 の番号
3 原子 SHAKE の場合:
“3” 原子1の番号
原子 1-原子 2 間の距離
原子 2-原子 3 間の距離
原子 3-原子 1 間の距離
4 原子 SHAKE の場合:
“4” 原子1の番号
原子 2 の番号
原子 3 の番号
原子 4 の番号
原子 1-原子 2 間の距離
原子 2-原子 3 間の距離
原子 3-原子 1 間の距離
原子 1-原子 4 間の距離
原子 3-原子 4 間の距離
原子 2-原子 4 間の距離
myPresto 4.2
212
例)
SHAKE> SHAKE
ALA-DIMER-1
4
1
2
3
4
1.01000 1.64962
2
9
10
1.01000
->
->
1.01000
->
->
SHAKE> SHAKE
WATER(TIP3P-MODEL)-2
3
->
1
2
3
->
0.95720
myPresto 4.2
1.51360
0.95720
1.01000
1.64962
1.64962
;
;
;
;
;
;
;
;
SHAKE 情報先頭
分子名
SHAKE 原子数=4
SHAKE 対象原子の番号
原子間距離
SHAKE 原子数=2
SHAKE 対象原子の番号
原子間距離
;
;
;
;
SHAKE 情報先頭
分子名
SHAKE 原子数=3
SHAKE 対象原子の番号
;
原子間距離
213
A.2.5 固定原子・自由原子指定ファイル
対象フェーズ: MIN,MD フェーズ
用途: 固定原子、自由原子を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:自由/固定原子の指定は以下の行で構成される。
[ 自由/固定原子情報先頭行
自由/固定原子情報行... ]...
自由/固定原子情報先頭行:
以下の文字列で指定する。
(1)原子リスト指定 =
“SETVAR> LIST”
(2)原子範囲指定 =
“SETVAR> RADIUS”
自由/固定原子情報:先頭行にしたがって以下のように記述する。
(1)“SETVAR> LIST”の場合:
形式
チェイン先頭番号 チェイン最終番号 残基先頭番号
残基最終番号
原子名指定 (リスト出力)
(2)“SETVAR> RADIUS”の場合:
指定方式にしたがって以下のように記述する。
中心原子指定:
形式
"ATOM"
原子番号 半径下限
半径上限
原子名指定
(リスト出力)
中心座標指定:
形式
"COOR"
x 座標
y座標
z 座標
半径下限
半径上限
原子名指定(リスト出力)
myPresto 4.2
214
※上記にある項目は以下の値で構成される。
リスト出力
::= "YES"|"NO"
(デフォルトは "NO")
形式
::= "FREE"|"FIX"
原子名指定
::= ワイルドカード(*)指定可能
例)
SETVAR> LIST
; 原子リスト指定先頭行
FIX
1
1
1
FREE
2
10000 1
130
*
1
O*
YES
SETVAR> RADIUS
FIX
ATOM
100
10.0
20.0
C*
FREE
COOR
0.0 10.0 2.0
10.0
20.0
*
myPresto 4.2
YES
;
原子情報
;
原子情報
;
原子範囲指定先頭行
;
中心原子指定
;
中心座標指定
215
A.2.6 CAP 指定ファイル
対象フェーズ: 全フェーズ
用途: セル形状、CAP 拘束を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:バウンダリの指定は以下の行で構成される。
[ バウンダリ情報先頭行
バウンダリ情報先頭行:
バウンダリ情報行 ... ]...
以下の文字列で指定する。
(1)CAP 計算対象指定 =
“BOUND> INCLUDE”
(2)CAP 中心指定 =
“BOUND> CENTER”
(3)立方体セルサイズ指定 =
“BOUND> BOX”
(4)CAP 半径指定 =
“BOUND> RADIUS”
バウンダリ情報:先頭行にしたがって以下のように記述する。
(1)“BOUND> INCLUDE”の場合:
分子名
チェイン先頭番号
チェイン最終番号
(リスト出力)
(2)“BOUND> CENTER”の場合:3種類の指定があり、それぞれ以下のように記述する。
チェイン重心指定:
“CHAI” チェイン番号
原子指定:
“ATOM”
中心原子の所属するチェイン番号
中心原子の所属する残基番号
原子名
myPresto 4.2
216
座標指定:
“COOR”
x 座標
y座標
z 座標
(3)“BOUND> BOX”の場合:
x 成分 y 成分 z 成分
(4)“BOUND> RADIUS”の場合:
半径値
※上記にある項目は以下の値で構成される。
リスト出力
::= "YES"|"NO"
(デフォルトは "NO")
例)
BOUND> INCLUDE
WATER
1
200
YES
BOUND> CENTER
;
CAP 計算対象指定先頭行
;
CAP 計算対象指定
;
CAP 中心指定先頭行
;
チェイン重心指定
CHAIN
1
ATOM
1
1
CA
;
原子指定
COORDINATEs
0.0D0
0.0D0
0.0D0
;
座標指定
;
立方体セルサイズ指定先頭行
;
立方体セルサイズ指定
BOUND> RADIUS
;
CAP 半径指定先頭行
30.0D0
;
CAP 半径指定
BOUND> BOX
0.0D0
0.0D0
myPresto 4.2
0.0D0
217
A.2.7 拡張 CAP 指定ファイル
対象フェーズ: 全フェーズ
用途: 拡張 CAP 拘束対象、拘束条件を指定する
特記事項:
行中の“;”以降はコメントとなる。
書式:拡張 CAP 拘束の指定は以下の行で構成される。
[“EXTCAP>CONDition”行
“EXTCAP>INCLude”
拘束条件指定行
行
拘束対象指定行... ] ...
拘束条件指定行:“EXTCAP>CONDition”行に引き続き、以下のように指定する。
球体 CAP 拘束の中心、半径、力の係数を指定;
“SPHEre”
半径
中心の x 座標
力の係数
中心の y 座標
中心のz座標
[リスト出力]
楕円体 CAP 拘束の焦点、焦点からの距離の和、力の係数を指定;
“GEometric ELlipsoid”
焦点 A の x 座標
焦点 A の y 座標
焦点 A の z 座標
焦点 B の x 座標
焦点 B の y 座標
焦点 B の z 座標
焦点からの距離の和/2.0d0
力の係数
[リスト出力]
楕円体 CAP 拘束の中心、x 軸方向、y 軸方向、z 軸方向の半径、力の係数を指定;
“ALgebraic ELipsoid”
中心の x 座標
x 軸方向の半径
力の係数
中心の y 座標
中心の z 座標
y 軸方向の半径
z 軸方向の半径
[リスト出力]
myPresto 4.2
218
拡張 CAP 拘束計算対象指定行:
“EXTCAP>INCLude”に引き続き、以下のように指定する。
チェイン単位での指定;
“CHAI”
分子名
先頭チェイン番号
最終チェイン番号
[リスト出力]
残基単位での指定;
“RESI” 先頭チェイン番号 最終チェイン番号
先頭残基番号 最終残基番号 残基名 [リスト出力]
原子単位での指定;
“ATOM” 先頭チェイン番号 最終チェイン番号
先頭残基番号 最終残基番号 原子名 残基名
[リスト出力]
※上記にある項目は以下の値で構成される。
リスト出力
::= "YES"|"NO"
(CAP 拘束を2つ指定する例)
EXTCAP> COND
;SPHERE 39.0 26.0 -4.0 27.0 100.0 YES
GEEL 86.0 2.0 -1.0 10.0 58.0 1.0 48.5 150.0 YES
;ALEL 0.0 0.0 0.0 12.0 12.0 12.0 150.0 YES
;
;
;
;
CAP 拘束1の拘束条件を指定
(球体による指定)
(楕円体による指定)
(楕円体による指定)
EXTCAP> INCL
;CHAI WAT 1 216 YES
;RESI 1 1 1 3 HYD YES
ATOM 9 9 1 5 * * YES
;
;
;
;
CAP 拘束1の拘束対象を指定
(チェイン単位での指定)
(残基単位での指定)
(原子単位での指定)
EXTCAP> COND
;SPHERE 39.0 26.0 -4.0 27.0 100.0 YES
GEEL 86.0 2.0 -1.0 10.0 58.0 1.0 49.5 150.0 YES
;ALEL 0.0 0.0 0.0 12.0 12.0 12.0 150.0 YES
;
;
;
;
CAP 拘束2の拘束条件を指定
(球体による指定)
(楕円体による指定)
(楕円体による指定)
EXTCAP> INCL
;CHAI WAT 1 216 YES
;RESI 1 1 1 3 HYD YES
ATOM 10 1365 1 1 * WAT YES
;
;
;
;
CAP 拘束2の拘束対象を指定
(チェイン単位での指定)
(残基単位での指定)
(原子単位での指定)
myPresto 4.2
219
A.2.8 位置拘束ファイル
対象フェーズ: 全フェーズ
用途: 位置拘束を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:位置拘束の指定は以下の行で構成される。
[位置拘束情報先頭行
位置拘束情報行... パラメータ終了行
終了情報行]...
位置拘束情報先頭行:以下の文字列で指定する。
(1)拘束リスト指定 =
“GROUP> LIST”
(2)拘束範囲指定 =
“GROUP> RADIUS”
パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。
“END”
終了情報行:先頭の文字列が“GROUP> STOP”である行
位置拘束情報:先頭行にしたがって以下のように記述する。
(1)“GROUP> LIST”の場合:
チェイン先頭番号 チェイン最終番号 残基先頭番号
残基名指定 係数
"MASS"
残基最終番号 原子名指定
(リスト出力)
(2)“GROUP> RADIUS”の場合:
中心チェイン番号
係数
"MASS"
中心残基番号
中心原子名
半径下限
半径上限
原子名指定
(リスト出力)
※上記にある項目は以下の値で構成される。
リスト出力
::= "YES"|"NO"
(デフォルトは "NO")
myPresto 4.2
220
拘束力を原子の質量に比例させる場合、"MASS"を指定する。
例)
GROUP> LIST
1
1
5
13
CA
*
1.0
MASS
1
1
1
67
N*
ARG
1.0
MASS
YES
;
拘束リスト指定先頭行
;
位置拘束情報
;
位置拘束情報
;
拘束範囲指定先頭行
END
GROUP> STOP
GROUP> RADIUS
1
10
CA
0.0
5.0
C*
1.0
MASS
YES
;
位置拘束情報
1
10
CA
0.0
5.0
N*
1.0
MASS
YES
;
位置拘束情報
1
10
CA
0.0
5.0
O*
1.0
MASS
YES
;
位置拘束情報
1
10
CA
0.0
5.0
S*
1.0
MASS
YES
;
位置拘束情報
END
GROUP> STOP
myPresto 4.2
221
A.2.9 距離拘束ファイル
対象フェーズ: 全フェーズ
用途: 距離拘束を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:距離拘束の指定は以下の行で構成される。
[距離拘束情報先頭行
距離拘束情報行... パラメータ終了行
終了情報行]...
距離拘束情報先頭行:以下の文字列で指定する。
(1)拘束リスト指定 =“RDDSTC> LIST”
パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。
“END”
終了情報行:先頭の文字列が“RDDSTC> STOP”である行
距離拘束情報:先頭行にしたがって以下のように記述する。
(1)“RDDSTC> LIST”の場合:
原子指定1
原子指定2
下界係数
上界係数
下界距離
上界距離(リスト出力)
※上記にある項目は以下の値で構成される。
原子指定
::= 所属チェイン番号
所属残基番号
リスト出力
::= "YES"|"NO"|"HBOND"
所属残基名
原子名
(デフォルトは "NO")
myPresto 4.2
222
例)
RDDSTC> LIST
; 拘束リスト指定先頭行
1
1 ILE
HA
1
2 ALA
HN
1.00
1.00
1.95
2.50
YES
;
距離拘束情報
1
2 ALA
HA
1
65 VAL
CG*
1.00
1.00
2.70
4.90
YES
;
距離拘束情報
1
8 HIS
HD2
1
19 THR
HG2*
1.00
1.00
2.00
5.00
;
距離拘束情報
1
4 PRO
HB*
1
5 ALA
HN
1.00
1.00
1.95
3.50
;
距離拘束情報
1
4 PRO
HB*
1
6 CYS
HN
1.00
1.00
1.95
3.50
;
距離拘束情報
1
4 PRO
HD*
1
66 LEU
CD*
1.00
1.00
2.70
6.40
;
距離拘束情報
1
20 ASN
HB*
1
43 ALA
HB*
1.00
1.00
2.00
4.50
;
距離拘束情報
1
5 ALA
HB*
1
7 VAL
HN
1.00
1.00
1.95
5.00
;
距離拘束情報
1
11 ALA
HB*
1
61 VAL
CG*
1.00
1.00
2.70
6.40
;
距離拘束情報
1
29 THR
HA
1
51 PHE
CZ
1.00
1.00
2.70
6.40
;
距離拘束情報
1
89 ILE
HN
1
76 ARG+ O
0.50
0.50
1.70
2.30 HBOND ;
END
RDDSTC> STOP
myPresto 4.2
距離拘束情報
223
A.2.10 二面角拘束ファイル
対象フェーズ: 全フェーズ
用途:二面角拘束を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:二面角拘束の指定は以下の行で構成される。
[二面角拘束情報先頭行
二面角拘束情報行...
パラメータ終了行 終了情報行]...
二面角拘束情報先頭行:
以下の文字列で指定する。
(1)拘束リスト指定 =
“CDIHE> LIST”
(2)拘束番号指定 =
“CDIHE> NUMBER”
パラメータ終了行:パラメータ指定行の終了を以下の形式で指定する。
“END”
終了情報行:先頭の文字列が“CDIHE> STOP”である行
二面角拘束情報:先頭行にしたがって以下のように記述する。
(1)“CDIHE> LIST”の場合:
所属チェイン番号
下界係数
上界係数
原子指定 1 原子指定 2 原子指定 3 原子指定 4
下界角
上界角 (リスト出力)
(2)“CDIHE> NUMBER”の場合:
原子番号 1
原子番号 2
原子番号 3 原子番号 4
下界係数
上界係数
下界角
上界角
(リスト出力)
myPresto 4.2
224
※上記にある項目は以下の値で構成される。
原子指定
::= 所属残基番号
リスト出力
::= "YES"|"NO"
原子名
(デフォルトは "NO")
例)
CDIHE> LIST
; 拘束リスト指定先頭行
1
11 CA
11 C
12 N
12 CA
1.0
1.0
175.0 -175.0
Y
;
二面角拘束情報
1
16 CA
16 C
17 N
17 CA
1.0
1.0
175.0 -175.0
Y
;
二面角拘束情報
END
CDIHE> STOP
CDIHE> NUMBER
77
79
END
CDIHE> STOP
myPresto 4.2
81
; 拘束リスト指定先頭行
93
2.0
2.0
-90.0
-40.0
Y
;
二面角拘束情報
225
A.2.11 モニター指定ファイル
対象フェーズ: MD
用途:モニター対象を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
キーワードは、"MONI> " に続く4文字を認識する。
書式:モニターの指定は以下の行で構成される。
[モニター指定情報先頭行
モニター指定情報行...
モニター指定情報先頭行:
]...
以下の文字列で指定する。
(1)原子位置指定=“MONI> COOR”
(2)距離指定 =
“MONI> DIST”
(3)変角指定 =
“MONI> ANGL”
(4)二面角指定 = “MONI> TORS”
モニター指定情報行:先頭行にしたがって以下のように記述する。
(1)“MONI> COOR”の場合:
原子指定1
(リスト出力)
(2)“MONI> DIST”の場合:
原子指定1
原子指定2
(リスト出力)
(3)“MONI> ANGL”の場合:
原子指定1
原子指定2
原子指定3
(リスト出力)
myPresto 4.2
226
(4)“MONI> TORS”の場合:
原子指定1 原子指定2 原子指定3 原子指定4 (リスト出力)
※上記にある項目は以下の値で構成される。
原子指定
::= チェイン番号
リスト出力
::= "YES"|"NO"
残基番号
原子名
(デフォルトは "NO")
例)
MONI> COORDINATE
;原子位置指定先頭行
1 3 CA
YES
;モニター指定情報
1 3 C
YES
;モニター指定情報
MONI> DISTANCE
1 1 O
1 4 H
;距離指定先頭行
YES
;モニター指定情報
MONI> ANGLE
1 1 C
;変角指定先頭行
1 1 O 1 2 N
YES
;モニター指定情報
MONI> TORSION
;二面角指定先頭行
1 1 C
1 2 N
1 2 CA
1 2 C
YES
;モニター指定情報
1 3 N
1 3 CA
1 3 C
1 4 N
YES
;モニター指定情報
myPresto 4.2
227
A.2.12 系の重心合わせ指定用ファイル
対象フェーズ: MIN, MD
用途:重心合わせ対象原子を指定する。
特記事項:
行中の“;”以降はコメントとなる。
“(
)”の中の項目は省略可能である。
書式:重心合わせ対象原子の指定は以下の行で構成される。
[ BESTFIT 対象原子情報先頭行
BESTFIT 対象原子情報行... ]...
重心合わせ対象原子情報先頭行:
以下の文字列で指定する。
(1)原子リスト指定 =
“SETBST> LIST”
(2)原子範囲指定 =
“SETBST> RADIUS”
重心合わせ対象原子情報:先頭行にしたがって以下のように記述する。
(1)“SETBST> LIST”の場合:
形式
チェイン先頭番号 チェイン最終番号 残基先頭番号
残基最終番号
原子名指定 (リスト出力)
(2)“SETBST> RADIUS”の場合:
指定方式にしたがって以下のように記述する。
中心原子指定:
形式
"ATOM"
原子番号 半径下限
半径上限
原子名指定
(リスト出力)
中心座標指定:
形式
"COOR"
x 座標
y座標
z 座標
半径下限
半径上限
原子名指定(リスト出力)
myPresto 4.2
228
※上記にある項目は以下の値で構成される。
リスト出力
::= "YES"|"NO"
(デフォルトは "NO")
形式
::= "FREE"|"FIX"
原子名指定
::= ワイルドカード(*)指定可能
例)
SETBST> LIST
FIX
1
FREE
2
; 原子リスト指定先頭行
1
10000
1
130
*
1
1
O*
YES
SETBST> RADIUS
FIX
ATOM
100
10.0
20.0
C*
FREE
COOR
0.0 10.0 2.0
10.0
20.0
*
myPresto 4.2
YES
;
原子情報
;
原子情報
;
原子範囲指定先頭行
;
中心原子指定
;
中心座標指定
229
A.2.13 系の GB/SA 及び ASA 用パラメータ指定ファイル
対象フェーズ: MIN, MD
用途:GB/SA 及び ASA 用パラメータを設定する。
特記事項:
本ファイルで全原子のデータが設定されなければ、計算結果は保証しない。
行中の“;”以降はコメントとなる。
書式:GB/SA の原子情報は以下の行で構成される。
[GB/SA 情報先頭行
GB/SA 情報行...
]...
GB/SA 情報先頭行:以下の文字列で指定する。
(1)原子リスト指定=“SOL> LIST”
(2)総称名指定
=“SOL> ATOM”
GB/SA 情報行:先頭行にしたがって以下のように記述する。
(1)“SOL> LIST”の場合:
入力したトポロジーに対し、1対1のリストで GB/SA の情報を指定する。
[未使用 20 文字
水素フラグ
ASA の vdW 半径(Å)
ASA 用の atomic solvation parameter(kcal/mol/Å2)
GB/SA 用の atomic solvation parameter(cal/mol/Å 2)
[GB の vdW 半径(Å) GB のスケール因子]]...
(2)“SOL> ATOM”の場合:
指定した原子に対して、GB/SA の情報を設定する。原子、残基名にワイルドカード使用可。
[原子名 残基名
水素フラグ
ASA の vdW 半径(Å)
ASA 用の atomic solvation parameter(kcal/mol/Å2)
GB/SA 用の atomic solvation parameter(cal/mol/Å 2)
[GB の vdW 半径(Å) GB のスケール因子]]...
myPresto 4.2
230
例)
SOL>LIST
SOL
1
N
LYS1
SOL
2
H1 LYS0
1.550000 -0.132000
5.400000
1.625000
0.790000
0.000000
5.400000
1.150000
0.850000
0.000000
SOL>ATOM
H*
LYS0
myPresto 4.2
0.000000
0.000000
5.400000
1.150000
0.850000
231
A.2.14 Umbrella 拘束ファイル
対象フェーズ: MD
用途:Umbrella Potential の条件を指定する。
特記事項:
行中の“;”以降はコメントとなる。
書式:Umbrella Potential の指定は以下の行で構成される。
[UmbrellaPotential 情報先頭行
UmbrellaPotential 情報行...]
Umbrella 情報先頭行:Potential 種別を以下の文字列で指定する。
(1) FillingPotential-Potential(ガウス関数型)
"FILL> GAUS"
(2) FillingPotential-Potential(単一中心調和振動子型)
"FILL> HAR1"
(3) FillingPotential-Potential(単一中心線形)
"FILL> LIN1"
(4) FillingPotential-Potential(2中心調和振動子型)
"FILL> HAR2"
(5) FillingPotential-Potential(2中心線形)
"FILL> LIN2"
UmbrellaPotential 情報行:
関数個数と適用原子数の指定行 原子指定行... 各構造 のトラジェクトリ指定行 ...
(1)関数個数と適用原子数の指定行:
関数(中心の構造)の数
(2)原子指定行:
関数個数および適用原子数を指定する。
適用原子数
PDB 上の原子 ID を昇順に記述する。
原子 ID
(3)各構造のトラジェクトリ指定行:
各構造のトラジェクトリ指定行は、以下の行で構成される。
[ポテンシャル高さ行
[ポテンシャル広がり行]..
[構造1行
[構造2行]]..]..
myPresto 4.2
232
(3-1)ポテンシャル高さ行:
当該構造を中心とするポテンシャルの力の定数または高さを指定する。
力の定数(umb%coef)または Gauss 関数の高さ(umb%weight)
(3-2)ポテンシャル広がり行:
当該構造を中心とするポテンシャルの広がりを記述する。
CAP 半径(ε:epsilon)または Gauss 関数の幅(EllipCoef)
(3-3a)構造座標行:構造1行
当該構造での原子座標を PDB フォーマットで記述する。
(x 座標=31∼38 カラム、y 座標=39∼46 カラム、z 座標=47∼54 カラム)
...
x 座標
y 座標
z 座標 ...
(3-3b)構造座標行:構造2行 (HAR2/LIN2 の場合)
当該構造での原子座標を PDB フォーマットで記述する。
(x 座標=31∼38 カラム、y 座標=39∼46 カラム、z 座標=47∼54 カラム)
...
x 座標
myPresto 4.2
y 座標
z 座標 ...
233
例)
FILL> GAUS
;
関数形指定
3
;
関数の数と使用する原子数
;
原子指定行
4.00000000000000
;
構造1を中心とする高さ
0.0300000
;
幅
2
86
102
0.0300000
ATOM
86
N
VAL A
22
-6.505
3.453
0.990 16.00 -0.38
ATOM
102
N
VAL A
22
-7.661
3.818
-1.008 16.00 -0.65
;構造1の座標
5.00000000000000
;
構造2を中心とする高さ
0.0300000
;
幅
0.0300000
ATOM
86
N
VAL A
22
-6.405
3.443
ATOM
102
N
VAL A
22
-7.561
3.828
0.980 16.00 -0.38
;構造2の座標
-1.018 16.00 -0.65
5.00000000000000
;
構造3を中心とする高さ
0.0300000
;
幅
0.0300000
ATOM
86
N
VAL A
22
-6.405
3.443
0.980 16.00 -0.38
ATOM
102
N
VAL A
22
-7.561
3.828
-1.018 16.00 -0.65
;構造3の座標
FILL> HAR1
;
関数形指定
2
;
関数の数と適用する原子数
86
;
原子指定行
50.0
;
構造1を中心とする力の定数
0.5
;
構造1の CAP 半径
1
ATOM
86
N
VAL A
22
-6.505
3.453
0.990 16.00 -0.38
;構造1の座標
20.0
;
構造2を中心とする力の定数
1.0
;
構造2の CAP 半径
ATOM
86
N
VAL A
22
-6.405
3.443
0.980 16.00 -0.38
FILL> HAR2
;
関数形指定
1
1
;構造2の座標
;
関数の数と適用する原子数
86
;
原子指定行
50.0
;
構造1,2 を中心とする力の定数
0.5
;
構造1,2 を中心とする CAP 半径
ATOM
86
N
VAL A
22
-6.505
3.453
0.990 16.00 -0.38
;構造1の座標
ATOM
86
N
VAL A
22
-6.405
3.443
0.980 16.00 -0.38
;構造2の座標
myPresto 4.2
234
A.2.15 リスタートファイル
対象フェーズ: MD
用途: リスタート情報を指定する。自動リスタートファイルはリスタートファイルと同じ
フォーマットで、指定された時間ごとに出力され、障害発生時のロールバックと
して用いる。
特記事項:
リスタートファイルはバイナリファイルである。
リスタートファイルは以下の行で構成され、総データ量は計算条件により異なる。
書式:
タイトル行(各計算条件共通)
原子数行(各計算条件共通)
エネルギー情報行(各計算条件共通)
原子情報行(各計算条件共通)
[原子の力情報行(Velocity Verlet 法または RESPA 法使用時のみ)]
[Nose-Hoover 法情報行(Nose-Hoover 法使用時のみ)]
[剛体モデル情報行(剛体モデル使用時のみ)]
[NPT アンサンブル情報行(NPT アンサンブル使用時のみ)]
[マルチカノニカルアンサンブル情報行(マルチカノニカルアンサンブル使用時のみ)]
タイトル行:各計算条件共通
タイトル
:character*80×1
原子数行:各計算条件共通
原子数
:integer*4×1
自由原子数
:integer*4×1
エネルギー情報行:各計算条件共通
ループ回数
:integer*4×1
シミュレート時間
:real*8×1
総エネルギー
:real*8×1
運動エネルギー
:real*8×1
ポテンシャルエネルギー
:real*8×1
myPresto 4.2
235
原子情報行:各計算条件共通
原子座標
:real*8×3×原子数
自由原子速度
:real*8×3×自由原子数
原子の力情報行:Velocity Verlet 法 または RESPA 法使用時のみ
Velocity Verlet 法使用時:
Gradient
:real*8×3×原子数
RESPA 法使用時:
Gradient(Short)
:real*8×3×原子数
Gradient(Medium)
:real*8×3×原子数
Gradient(Long)
:real*8×3×原子数
Nose-Hoover 法情報行:Nose-Hoover 法使用時のみ
仮想系の座標
:real*8×3×分子種別数
仮想系の運動量
:real*8×3×分子種別数
仮想系の速度
:real*8×3×分子種別数
剛体モデル情報行:剛体モデル使用時のみ
剛体の速度
:real*8×3×剛体数
剛体の座標
:real*8×3×剛体数
剛体の四元数
:real*8×3×剛体数
剛体の角運動量
:real*8×3×剛体数
剛体の並進力
:real*8×3×剛体数
剛体のトルク
:real*8×3×剛体数
剛体の並進力(Short)
:real*8×3×剛体数 ※
剛体の並進力(Medium)
:real*8×3×剛体数 ※
剛体の並進力(Long)
:real*8×3×剛体数 ※
剛体のトルク(Short)
:real*8×3×剛体数 ※
剛体のトルク(Medium)
:real*8×3×剛体数 ※
剛体のトルク(Long)
:real*8×3×剛体数 ※
※印は、RESPA 法使用時のみ
myPresto 4.2
236
NPT アンサンブル情報行:Andersen 法 または Parrinello-Rahman 法使用時のみ
Andersen 法使用時:
セルサイズ
:real*8×1
ピストン情報
:real*8×4
熱浴情報1
:real*8×4
熱浴情報2
:real*8×4
Parrinello-Rahman 法使用時:
セル行列
:real*8×1
セル行列の逆行列
:real*8×1
セル行列の行列式
:real*8×1
ピストン情報
:real*8×20
熱浴情報1
:real*8×4
熱浴情報2
:real*8×4
Andersen 法 または Parrinello-Rahman 法使用時:
ビリアル行列
:real*8×3×3×エネルギー種別数
ビリアル行列(Short)
:real*8×3×3×エネルギー種別数
※
ビリアル行列(Medium)
:real*8×3×3×エネルギー種別数
※
ビリアル行列(Long)
:real*8×3×3×エネルギー種別数
※
※印は、RESPA 法使用時のみ
マルチカノニカルアンサンブル情報行:マルチカノニカルアンサンブル使用時のみ
当該ステップのエネルギー
:real*8×1
サンプリング区間内のループ数
:integer*4×1
総ループ数
:integer*4×1
サンプリング区間のエネルギーヒストグラム :real*8×サンプル数
全体のエネルギーヒストグラム
:real*8×サンプル数
スケーリングファクター
:real*8×サンプル数
当該ステップ後のエネルギー範囲の下限
:integer*4×1
当該ステップ後のエネルギー範囲の上限
:integer*4×1
当該ステップのエネルギー範囲の下限
:integer*4×1
当該ステップのエネルギー範囲の上限
:integer*4×1
myPresto 4.2
237
A.2.16 剛体モデルファイル
対象フェーズ: MD
用途: 剛体モデルの分子と原子を指定する。
特記事項:
行中の“;”以降はコメントとなる。
剛体モデルは Velocity-Verlet 指定時("INTEGR=VELO")のみ有効である。
SHAKE/RATTLE で指定した構造は、剛体モデルとして指定できない。
複数の剛体モデルに同じ原子を指定することはできない。
剛体モデルは MD フェーズで有効である(Minimize では扱えない)。
書式:剛体モデル対象原子の指定は、以下の行で構成される。
[剛体モデル先頭行
剛体モデル先頭行:
[剛体分子指定行
剛体原子情報行]... ]...
以下の文字列で指定する。
(1)剛体原子リスト指定 =
"RIGID> NUM"
(2)剛体原子リスト+モデル座標指定 =
"RIGID> COO"
剛体分子指定行:
分子名を指定する。
剛体原子情報行:先頭行にしたがって以下のように記述する。
(1) "RIGID> NUM"の場合:
原子数
[相対原子 ID... ]
(2) "RIGID> COO"の場合:
原子数
[相対原子 ID
x 座標
y 座標
z 座標]...
myPresto 4.2
238
例)
RIGID> NUM
;
剛体原子リスト指定
WAT
;
剛体分子名行
;
剛体原子情報行
RIGID> COO
;
剛体原子リスト +座標指定
WAT
;
剛体分子名行
;
剛体原子情報行
3
3
1 2 3
1
0.0 0.1 0.0 ->
2
-0.8 0.4 0.0 ->
3
myPresto 4.2
0.8 0.4 0.0
239
A.3 出力ファイル
構造探索エンジンの出力ファイルを以下に示す。
項番
#1
ファイル名称
MIN エネルギートラジェク
出力フェーズ
MIN
トリ
#2
MD エネルギートラジェク
モニター 指定トラジェク
途
エネルギー最小化での
エネルギートラジェクトリ
MD
トリ
#3
用
MD 計算での
エネルギートラジェクトリ
MD
トリ
モニター指定ファイルの内容に対する
トラジェクトリ
#4
総エネルギーデータ
MD
総エネルギー(total potential energy)
#5
座標トラジェクトリ
MD
原子座標のトラジェクトリ
#6
速度トラジェクトリ
MD
原子速度のトラジェクトリ
myPresto 4.2
240
A.3.1 MIN エネルギートラジェクトリ
出力フェーズ: MIN
内容: エネルギー最小化でのエネルギートラジェクトリ 。
特記事項:
MIN エネルギーデータファイルは 8 バイトのバイナリファイルである。
書式:
[ MIN 情報
MIN エネルギー情報 ]×出力回数
MIN 情報:
当該ループ回数
:integer*4×1
WORK1
:real*8×1
CPU 時間
:real*8×1
MIN エネルギー情報:
ステップ長
:real*8×1
root mean square change
:real*8×1
WORK2
:real*8×1
エネルギー詳細情報※
:real*8×29(29:エネルギー種別数)
root-mean square force
:real*8×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*8×1
※「WORK1」「WORK2」フィールドは、現在未使用。0.0d0 が設定される。
※「エネルギー詳細情報」の各フィールドの内容は、次ページの通り。
myPresto 4.2
241
エネルギー詳細情報の内訳:
(1)ポテンシャルエネルギー
(2)Bond
(3)Angle
(4)Torsion
(5)Improper torsion
(6)1-4 van der Waals
(7)1-4 静電
(8)1-5 van der Waals
(9)1-5 静電
(10)1-5 水素結合
(11)1-5 van der Waals (カットオフなし)
(12)1-5 静電
(カットオフなし)
(13)1-5 水素結合
(カットオフなし)
(14)位置拘束
(15)距離拘束
(16)二面角拘束
(17)Repulsion
(18)CAP 拘束
(19)未使用1
(20)未使用2
(21)未使用3
(22)未使用4
(23)Generalized Born
(24)Accessible Surface Area
(25)未使用5
(26)未使用6
(27)未使用7
(28)未使用8
(29)未使用9
myPresto 4.2
242
A.3.2 MD エネルギートラジェクトリ
出力フェーズ: MD
内容: MD 計算でのエネルギートラジェクトリ。
特記事項:
指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に
することができる。
書式:出力指定により以下の3種類に分かれる。
(1) ASCII 形式指定(MNTREN= ASCII)
[ MD 情報行
MD エネルギー情報行]×出力回数
MD 情報行:
当該ループ回数
シミュレート時間
CPU 時間
MD エネルギー情報行:
総エネルギー
運動エネルギー 温度
“root-mean square force”
エネルギー詳細情報※
“1-5 van der Waals 数”
“1-5 水素結合数”
“root-mean square deviation”
※「エネルギー詳細情報」の各フィールドの内容は、前ページの通り。
(2) 4 バイト実数形式指定(MNTREN= SINGLE)
[ MD 情報
myPresto 4.2
MD エネルギー情報 ]×出力回数
243
MD 情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*4×1
CPU 時間
:real*4×1
MD エネルギー情報:
総エネルギー
:real*4×1
運動エネルギー
:real*4×1
温度
:real*4×1
エネルギー詳細情報
:real*4×29(29:エネルギー種別数)
root-mean square force
:real*4×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*4×1
(3) 8 バイト実数形式指定(MNTREN= DOUBLE)
[ MD 情報
MD エネルギー情報 ]×出力回数
MD 情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*8×1
CPU 時間
:real*8×1
MD エネルギー情報:
総エネルギー
:real*8×1
運動エネルギー
:real*8×1
温度
:real*8×1
エネルギー詳細情報
:real*8×29(29:エネルギー種別数)
root-mean square force
:real*8×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*8×1
myPresto 4.2
244
A.3.3 モニター指定トラジェクトリ
出力フェーズ:MD
内容: モニター指定ファイルの内容に対するトラジェクトリ。
特記事項:
指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に
することができる。
書式:出力指定により以下の3種類に分かれる。
(1) ASCII 形式指定(MNTRTR= ASCII)
[ トラジェクトリー情報行
データ行]×出力回数
トラジェクトリ情報行:
当該ループ回数
※
原子位置数
二原子間距離数
変角数
二面角数
当該データの個数
当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数
データ行:
実数値×当該データの個数
(2) 4 バイト実数形式指定(MNTRTR= SINGLE)
[ トラジェクトリー情報
myPresto 4.2
データ ]×出力回数
245
トラジェクトリ情報:
当該ループ回数
:integer*4×1
原子位置数
:integer*4×1
二原子間距離数
:integer*4×1
変角数
:integer*4×1
二面角数
:integer*4×1
当該データの個数
:integer*4×1
データ:
データ
※
:real*4×(当該データの個数)
当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数
(3) 8 バイト実数形式指定(MNTRTR= DOUBLE)
[ トラジェクトリー情報
データ ]×出力回数
トラジェクトリ情報:
当該ループ回数
:integer*4×1
原子位置数
:integer*4×1
二原子間距離数
:integer*4×1
変角数
:integer*4×1
二面角数
:integer*4×1
当該データの個数
:integer*4×1
データ:
データ
※
:real*8×(当該データの個数)
当該データの個数=3×原子位置数+二原子間距離数+変角数+二面角数
myPresto 4.2
246
A.3.4 総エネルギーデータ
出力フェーズ:MD
内容: 総エネルギーデータ (total potential energy)
特記事項:
指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に
することができる。
書式:出力指定により以下の3種類に分かれる。
(1) ASCII 形式指定(MNTRTO= ASCII)
[ 総エネルギーデータ情報行]×出力回数
総エネルギー情報行:
総エネルギーデータ
(2) 4 バイト実数形式指定(MNTRTO= SINGLE)
[ 総エネルギー情報 ]×出力回数
総エネルギー情報:
総エネルギー
:real*4×1
(3) 8 バイト実数形式指定(MNTRCO= DOUBLE)
[ 総エネルギー情報 ]×出力回数
総エネルギー情報:
総エネルギー
myPresto 4.2
:real*8×1
247
A.3.5 座標トラジェクトリ
出力フェーズ:MD
内容: 原子座標のトラジェクトリ。
特記事項:
指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に
することができる。
書式:出力指定により以下の3種類に分かれる。
(1) ASCII 形式指定(MNTRCO= ASCII)
[ エネルギー情報行
原子座標情報行]×出力回数
エネルギー情報行:
当該ループ回数
シミュレート時間
CPU 時間
総エネルギー
ポテンシャルエネルギー “root-mean square force”
“1-5 水素結合数”
運動エネルギー
温度
“1-5 van der Waals 数”
“root-mean square deviation”
原子座標情報行:
[x 座標
y 座標
z 座標]×自由原子数
(2) 4 バイト実数形式指定(MNTRCO= SINGLE)
[ エネルギー情報
原子座標情報 ]×出力回数
myPresto 4.2
248
エネルギー情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*4×1
CPU 時間
:real*4×1
総エネルギー
:real*4×1
運動エネルギー
:real*4×1
温度
:real*4×1
ポテンシャルエネルギー
:real*4×1
root-mean square force
:real*4×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*4×1
原子座標情報:
原子座標
:real*4×3×自由原子数
(3) 8 バイト実数形式指定(MNTRCO= DOUBLE)
[ エネルギー情報
原子座標情報 ]×出力回数
エネルギー情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*8×1
CPU 時間
:real*8×1
総エネルギー
:real*8×1
運動エネルギー
:real*8×1
温度
:real*8×1
ポテンシャルエネルギー
:real*8×1
root-mean square force
:real*8×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*8×1
原子座標情報:
原子座標
myPresto 4.2
:real*8×3×自由原子数
249
A.3.6 速度トラジェクトリ
出力フェーズ: MD
内容: 原子速度のトラジェクトリ 。
特記事項:
指定により、アスキー、バイナリ(4 バイト実数形式指定、8 バイト実数形式指定)に
することができる。
書式:出力指定により以下の3種類に分かれる。
(1) ASCII 形式指定(MNTRVE= ASCII)
[ エネルギー情報行
原子速度情報行]×出力回数
エネルギー情報行:
当該ループ回数
シミュレート時間
CPU 時間
総エネルギー
ポテンシャルエネルギー “root-mean square force”
“1-5 水素結合数”
運動エネルギー
温度
“1-5 van der Waals 数”
“root-mean square deviation”
原子速度情報行:
[x 成分
y 成分
z 成分]×自由原子数
(2) 4 バイト実数形式指定(MNTRVE= SINGLE)
[ エネルギー情報
原子速度情報 ]×出力回数
myPresto 4.2
250
エネルギー情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*4×1
CPU 時間
:real*4×1
総エネルギー
:real*4×1
運動エネルギー
:real*4×1
温度
:real*4×1
ポテンシャルエネルギー
:real*4×1
root-mean square force
:real*4×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*4×1
原子速度情報:
原子速度
:real*4×3×自由原子数
(3) 8 バイト実数形式指定(MNTRVE= DOUBLE)
[ エネルギー情報
原子速度情報 ]×出力回数
エネルギー情報:
当該ループ回数
:integer*4×1
シミュレート時間
:real*8×1
CPU 時間
:real*8×1
総エネルギー
:real*8×1
運動エネルギー
:real*8×1
温度
:real*8×1
ポテンシャルエネルギー
:real*8×1
root-mean square force
:real*8×1
1-5 van der Waals 数
:integer*4×1
1-5 水素結合数
:integer*4×1
root-mean square deviation
:real*8×1
原子速度情報:
原子速度
myPresto 4.2
:real*8×3×自由原子数
251
B ユーティリティ
B.1
setwater
蛋白質などの系に水を付加します。作成できる水分子のモデルは、TIP3P または TIP4P で
す。使用前に、水分子の座標データ(システム添付:tools/setwater/tip3_base.pdb およ
び tip4_base.pdb)を作業ディレクトリにコピーしておきます。
また、結晶水も付加することができます。結晶水を付加する場合は、結晶水だけを抜き
出した PDB 形式の座標を準備してください。この場合の書式は、レコード名"HETATM"、残
基名"HOH"としてください。
結晶水の例
HETATM
HETATM
HETATM
1
2
3
O
O
O
HOH
HOH
HOH
1
2
3
-7.948
-7.948
-7.948
-7.948
-7.948
-7.948
-7.948
-4.844
-1.741
【注意】setwater は、事前に周期境界条件、温度 300K、密度 1g/cm3 で平衡化した水の座
標をもとに、溶媒水の座標を発生させます。使用前に、水分子の座標データ(システム
添付:tools/setwater/tip3_base.pdb および tip4_base.pdb)を作業ディレクトリにコ
ピーしておきます。
【注意】結晶水は PDB などの水素の省略された形(酸素だけ)を想定しています。また、
結晶水の付加では、酸素に水素を付加するとき、水素は一定方向にのみ配向します。
入力データ
(1)蛋白質など水を付加する系の PDB ファイル名
(2)結晶水の PDB ファイルの使用の有無
(3)結晶水の PDB ファイル名(結晶水の PDB ファイルを使用する場合)
(4)結果の出力の PDB ファイル名
(5)水を入れるセルの形状
(6)水を入れるセルの半径、セルの辺の長さ
myPresto 4.0
252
(7)水を入れるセルの中心の種別(系の中心で指定、任意の座標で指定)
(8)水を入れるセルの中心の座標(セルの中心を座標で指定する場合)
(9)付加する水分子の密度の係数(通常は 1.0)
(10)van der Waals 半径のダンピングファクター(通常は 1.0)
(11)水分子のモデル(TIP3P または TIP4P)
■使用例
% setwater
--- setwater --Input file name (PDB of target molecule) ?
protein.pdb
(1)
-> none.pdb
Do you use crystal water file (Y or N) ?
Y
(2)
Input file name (PDB of crystal water) ?
crystal_water.pdb
(3)
-> box.pdb
Input file name (output) ?
new_water.pdb
(4)
-> res
Input cell type (sphere="S", ellipsoid="E", cube="C", parallelepiped="P") ?
E
(5)
Input length (A,B,C) ?
10.0 20.0 30.0
(6)
-> ellipsoid :
10.0000000000 20.0000000000 30.0000000000
Input center of water (mass center="C", 3D-coordinate="D") ?
D
(7)
Input coordinate (X,Y,Z) ?
10.0 0.0 0.0
(8)
-> coodinate :
10.0000000000
0.0000000000
0.0000000000
Input density of water (usually 1.0) ?
1.0
(9)
->
1.0000000000
Input vdW damping factor (usually 1.0) ?
1.0
(10)
->
1.0000000000
Input water model (TIP3P="3", TIP4P="4") ?
3
(11)
->
TIP3P
%
myPresto 4.2
253
B.2
mergetpl
複数のトポロジーファイルを1つのトポロジーファイルにマージします。
入力データ
(1)マージ対象のトポロジーファイル名(1 個目)
(2)マージ対象のトポロジーファイル名(2 個目)
(3)マージ対象のトポロジーファイル名(3∼10 個目)
(4)結果の出力のトポロジーファイル名
【注意】ポテンシャル関数指定記述("TPL> FUNC"行)および非結合相互作用指定記述("TPL>
NONBOND"行)の内容が異なる場合、マージした結果のトポロジーファイルは正しくあり
ません。結果のトポロジーファイルには、最初に入力指定したトポロジーファイルの
"TPL> FUNC"行 および "TPL> NONBOND"行 の内容が出力されます。
【注意】上記の問題は、tplgene で作成した蛋白質のトポロジーファイルと tplgeneL で作
成した低分子のトポロジーファイルをマージする場合、剛体で取り扱う TIP4P モデルの
水分子のトポロジーファイルをマージする場合、また、人手で改変したトポロジーファ
イルを取り扱う場合などで発生しやすいので、特に注意が必要です。
■使用例
% mergetpl
--- mergetpl
Input file
aa.tpl
Input file
bb.tpl
Input file
cc.tpl
Input file
--name ? ( end: RETURN )
(1)
name ? ( end: RETURN )
(2)
name ? ( end: RETURN )
(3)
name ? ( end: RETURN )
Output file name ?
output.tpl
--- done --%
(4)
myPresto 4.2
254
◆水分子のトポロジーファイルの扱い
水分子のトポロジーファイルとして、TIP3P モデルおよび TIP4P モデルをシステムに添付
しています(tools/common/tip3p.tpl および tip4p.tpl)。これらの TIP3P と TIP4P のトポ
ロジーファイルは、"OW"原子に対応する、非結合相互作用指定記述("TPL> NONBOND"行)
の"相互作用タイプ"の内容が異なります。
【TIP3P】
18
0
1
1.76830
0.152000
0.833333
0.500
1.7699
0.155000
0.833333
0.500
【TIP4P】
18
0
1
よって、TIP4P のトポロジーファイルを使う場合は、マージの際に"TPL> NONBOND"行の「OW」
に相当する部分の値を TIP4P 用に修正する必要があります(TIP3P との混在はない)。
(省略)
:
TPL> NONBONDS
;NUMBER OF TYPE=
1
0 1
2
0 1
3
0 1
4
0 1
5
0 1
6
0 1
7
0 1
8
0 1
9
0 1
10
0 1
11
0 1
12
0 1
13
0 1
14
0 1
15
0 1
16
0 1
17
0 1
18
0 1
:
(省略)
myPresto 4.2
39
1.90800
1.90800
0.60000
0.00000
0.60000
1.48700
1.38700
1.28700
1.18700
1.10000
1.45900
1.40900
1.35900
0.00000
1.82400
1.66120
1.66120
1.76990
0.086000
0.109400
0.015700
0.000000
0.015700
0.015700
0.015700
0.015700
0.015700
0.015700
0.015000
0.015000
0.015000
0.000000
0.170000
0.210000
0.210000
0.155000
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.8333333
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
0.500;
c
c3
h
ho
hs
hc
h1
h2
h3
hx
ha
h4
h5
hw
n
o
o2
ow
TIP4P
255
B.3
SHAKEinp
トポロジーファイルと PDB ファイルから、対象原子の原子番号と拘束距離を指定した
SHAKE ファイルを作成します。このツールで水分子 TIP3P モデルを指定するためには、TIP3P
モデルの SHAKE ファイル(システム添付:tools/SHAKEinp/tip3_shk.model)が必要です。
使用前に、このファイルを作業ディレクトリにコピーしておきます。SHAKE ファイルが作業
ディレクトリの存在しない場合にはシステム内のデータを用いて TIP3P 情報を出力します。
入力データ
(1)SHAKE ファイルを作成する系のトポロジーファイルファイル名
(2)SHAKE ファイルを作成する系の PDB 名
(3)出力 SHAKE ファイル名
(4)水分子 TIP3P モデルを使用するか否か(水分子が含まれる場合のみ)
オプション
-itpl
-ipdb
-oshk
-h
<tpl_file>
<pdb_file>
<shk_file>
トポロジーファイル名を <tpl_file> に指定します。
PDB ファイル名を <pdb_file> に指定します。
SHAKE ファイル名を <shk_file> に指定します。
SHAKEinp の使用法を表示します。
コマンドライン・オプションを用いて指定した項目は、対話入力での入力がスキップされ
ます。オプションで指定しなかったものだけを対話的に入力することになります。
■使用例
% SHAKEinp
Please input TPL filename.
indo_tip3p.tpl
Please input PDB filename.
indo_tip3p.pdb
Please input SHAKE filename.
indo_tip3p.shk
INFORMATION>
H2O was detected.
Do you want to use TIP3P model?[yes/no]
yes
(1)
(2)
(3)
(4)
INFORMATION> toolWriteTip3p
The file "tip3_shk.model" is found.
Information given by this file is used for the Tip3p model.
%% Program is done. %%
%% This program is normal end. %%
myPresto 4.2
256
B.4
RIGIDinp
トポロジーファイルから剛体モデル指定ファイルを作成します。このプログラムではト
ポロジーファイルから、水素と結合している原子の情報を取得し、その結合原子グループ
を剛体とみなし、拘束を行います。
水分子の TIP3P、TIP4P モデルを剛体に指定する場合には、TIP3P、TIP4P モデルの剛体指
定ファイル(システム添付:tools/RIGIDinp/tip3_rig.model、tip4_rig.model)が必要と
なります。プログラム実行前に、これらのファイルを作業ディレクトリにコピーしておき
ます。また、任意のフラグメントの拘束を行う場合には、フラグメント DB ファイル(シス
テム添付:tools/RIGIDinp/fragment.db)にフラグメント情報を記述する必要があります。
プログラム実行前に、このファイルを作業ディレクトリに置いて下さい。
入力データ
(1)剛体モデル指定ファイルを作成する系のトポロジーファイル名
(2)剛体モデルの指定レベル
(i) 水素原子との結合のみを剛体として指定
(ii)(i)に加え、任意のフラグメントを剛体として指定
オプション
-i
<tpl_file>
トポロジーファイル名を<tpl_file>に指定します
-l
[ allH │ fr ]
剛体モデルの指定レベルを指定します
(i) 水素原子との結合のみを拘束
⇒ allH
(ii)(i)+ フラグメントを拘束
⇒ fr
※オプション”-l”を指定しない場合には、水素原子との結合のみを拘束します。
【注意】出力する剛体モデルファイル名は XXX.rig となります。
(XXX はトポロジーファイル名から拡張子を除いたもの)
myPresto 4.2
257
■使用例
% RIGIDinp ?i indo.tpl
また、オプション"-h"または、"-help"の指定により、RIGIDinp の使用法を見ることがで
きます。
% RIGIDinp -h
または、
% RIGIDinp -help
myPresto 4.2
258
B.5
GBSAinp
トポロジーファイルから、GB/SA 用パラメータ指定ファイルを作成します。mkGBSAin.pl
で GB/SA 用パラメータ指定ファイルを作成するためには、GB/SA 用のパラメータ DB ファイ
ル(システム添付:tools/GBSAinp/gb_sa.db)が必要です。使用前に、このファイルを作
業ディレクトリにコピーしておきます。
【注意】入力に PDB ファイルを指定した場合、内部で connectAtomPDB.x を利用します。
その為、connectAtomPDB.x を mkGBSAin.pl と同じディレクトリに配置します。
入力データ
(1) GB/SA 用のパラメータ DB ファイル名(システム添付:gb_sa.db)
(2) GB/SA 用パラメータファイルを作成する系のトポロジーまたは PDB ファイル名
(3) 出力 GB/SA 用パラメータ指定ファイル名
■使用例
% mkGBSAin.pl
%% INPUT DB FILE NAME. %%
gb_sa.db
%% SELECT INPUT FILE BY THE NEXT NUMBER.
1 : PDB FILE
2 : TPL FILE
2
%% INPUT FILE NAME.
%%
vas-dih.tpl
%% INPUT OUTPUT FILE NAME.
vas-dih.sol
myPresto 4.2
%%
%%
259
B.6
自由エネルギー計算(Filling potential 法 + WHAM 法)解析
Filled Potential 計算における反発ポテンシャルと求心ポテンシャルを示す Umbrella
Potential ファイルを作成し、座標トラジェクトリ群と Umbrella Potential の解析結果か
ら自由エネルギーのヒストグラムを解析します。
B.6.1
Generate_NextFP
MD の座標トラジェクトリ、この MD での Umbrella Potential ファイル、およびユーザ
指定を読み込み、新規の Umbrella Potential ファイルを作成します。
入力データ
(1)制御ファイル
(1−1)前回の MD での Umbrella Potential 指定ファイル名
(1−2)出力 Umbrella Potential 指定ファイル名
(1−3)初期座標 PDB ファイル名
(1−4)前回の MD での座標トラジェクトリファイル名
(1−5)座標トラジェクトリの読み飛ばし回数
(1−6)座標トラジェクトリ読み込み回数
(1−7)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble)
(1−8)PDB ファイルの画面表示オプション("y"es │ "n"o)
(1−9)求心関数の種別
(1−10)温度
(1−11)ガウス型反発関数の高さ
(1−12)ガウス型ポテンシャル中心座標の更新間隔を制御する範囲
(1−13)ガウス型反発関数の幅
(1−14)求心関数の高さ
(1−15)求心関数の幅
(1−16)目標とする最終座標
(1−17)掃引開始回数、終了回数
(2)初期座標 PDB ファイル
(3)前回の MD での座標トラジェクトリファイル
(4)前回の MD 入力の Umbrella Potential 指定ファイル
■使用例
% Generate_NextFP
<
genefp.inp
myPresto 4.2
260
■制御ファイル例
newopt_fp
newopt_fp2
initial.pdb
xx_traject.cor
-1000
2000
s
y
HAR2
300.0
0.5
2.5 6.0
3.0
5.0
1.0
ATOM
4131 O
ATOM
4131 O
1 50
; 入力 Umbrella Potential 指定ファイル
; 出力 Umbrella Potential 指定ファイル
; 初期座標
; 前回の MD のトラジェクトリ
; トラジェクトリの読み飛ばし回数
; トラジェクトリ読み込み回数
; トラジェクトリファイル形式
; PDB ファイルの原子表示
; 求心関数種別 (HAR1 │ HAR2 │ LIN1 │ LIN2)
; 対象の温度
; ガウス型反発関数の高さ
; ガウス型ポテンシャルの中心座標の更新間隔を制御する範囲
; ガウス型反発関数の幅
; 求心関数の高さ
; 求心関数の幅
WAT
839
0.000
0.000 -8.000 15.00 -0.83 ; 目標焦点座標 1
WAT
839
0.000
0.000 -8.000 17.00 -0.83 ; 目標焦点座標 2
; 掃引開始回数、終了回数
出力データ
(1) Umbrella Potential ファイル
■出力 Umbrella Potential ファイル例
FILL> GAUS
2
6
1
0.0000000
0.0300000
; DIMENSION
; ATOM ID
; WEIGHT DIM=
; RADIUS DIM=
ATOM
NUMBER OF ATOMS
1
1
0.000
0.5000000
3.0000000
; WEIGHT DIM=
; RADIUS DIM=
ATOM
0.5000000
3.0000000
ATOM
myPresto 4.2
1
; DIMENSION
; ATOM ID
; WEIGHT DIM=
; RADIUS DIM=
-2.000 ; CENTER-1 ATOM=
6
0.269
-2.312 ; CENTER-1 ATOM=
6
2
2
0.283
FILL> HAR1
1
6
0.000
NUMBER OF ATOMS
1
1
0.283
0.269
-2.312 ; CENTER-1 ATOM=
6
261
B.6.2
Extract_Atom
MD の座標トラジェクトリ、この MD での Umbrella Potential ファイル、およびユーザ指
定を読み込み、Umbrella Potential 対象原子の座標のみ切り出したトラジェクトリファイ
ルを生成します。
入力データ
(1)制御ファイル
(1−1)Umbrella Potential 指定ファイル名
(1−2)座標トラジェクトリファイルの原子数
(1−3)座標トラジェクトリファイル数
(1−4)入力、出力座標トラジェクトリファイル名
(1−5)座標トラジェクトリの読み飛ばし回数
(1−6)座標トラジェクトリ読み込み回数
(1−7)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble)
(2)座標トラジェクトリファイル群
(3)前回の MD 入力の Umbrella Potential ファイル
■制御ファイル例
newopt_fp
1023
4
xx_trj1.cor
xx_trj2.cor
xx_trj3.cor
xx_trj4.cor
-1000
2000
s
w_1.cor
w_2.cor
w_3.cor
w_4.cor
;
;
;
;
;
;
;
;
;
;
入力 Umbrella Potential 指定ファイル
トラジェクトリファイルの原子数
入力トラジェクトリファイル数
入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 入力/出力トラジェクトリファイル名 トラジェクトリの読み飛ばし回数
トラジェクトリ読み込み回数
トラジェクトリファイル形式
1
2
3
4
■使用例
% Extract_Atom
<
extract.inp
myPresto 4.2
262
B.6.3
Wham_Analysis
複数 MD の座標トラジェクトリと、Umbrella Potential 指定 ファイルから、各トラジェ
クトリでの自由エネルギーを計算します。
入力データ
(1)制御ファイル
(1−1)最終世代の Umbrella Potential 指定ファイル名
(1−2)座標トラジェクトリの読み飛ばし回数
(1−3)座標トラジェクトリ読み込み回数
(1−4)座標トラジェクトリファイル形式 ("s"ingle │ "d"ouble)
(1−5) 自由エネルギー計算の平均値計算のサンプリング距離
(1−6)WHAM 解析の収束ループ数
(1−7)計算温度
(1−8)WHAM 解析時のメモリ指定("m"emory │ "s"peed)
(1−9)座標トラジェクトリファイル数
(1−10)入力座標トラジェクトリファイルと各世代 Umbrella Potential ファイル
(2)各世代の座標トラジェクトリファイル
(3)各世代の Umbrella Potential ファイル
■制御ファイル例
w_4.option ; 最終世代の入力 Umbrella Potential 指定ファイル名
0
; トラジェクトリの読み飛ばし回数
2000
; トラジェクトリ読み込み回数
s
; トラジェクトリファイル形式
0.5
; 自由エネルギー計算の平均値計算のサンプリング距離
1000
; WHAM 解析収束ループ
310
; 計算温度
m
; メモリ優先
4
; MD の世代数
w_1.cor w_1.option ; 1 世代目のトラジェクトリファイルと Umbrella
w_2.cor w_2.option ; 2 世代目のトラジェクトリファイルと Umbrella
w_3.cor w_3.option ; 3 世代目のトラジェクトリファイルと Umbrella
w_4.cor w_4.option ; 4 世代目のトラジェクトリファイルと Umbrella
■使用例
% Wham_Analysis
myPresto 4.2
<
wham.inp
Potential ファイル
Potential ファイル
Potential ファイル
Potential ファイル
263
出力データ
(1) 自由エネルギー計算結果
標準出力の最後に下記のようなトラジェクトリ番号、RMSD、自由エネルギーの表を出
力します。指定された範囲に座標が存在しない場合は自由エネルギーの欄に"--------"
を出力します。
■出力ファイル例
FILL> GAUS
2
6
1
; DIMENSION
; ATOM ID
NUMBER OF ATOMS
INFORMATION> WHAM ANALYSIS RESULT
EXP-ID R.M.S.D(A) AVERAGE
1 4.000000
0.000000115
2 4.513558
0.000000103
3 4.090083
0.000000228
4 3.778652
0.000000000
FREE-ENERGY
0.984069810E+01
0.990723128E+01
0.942155513E+01
-----------
myPresto 4.2
264
B.7
拡張アンサンブル向け解析ツール
拡張アンサンブルでの結果を解析するためのツールです。
各種の拡張アンサンブル MD でサンプリングした構造をクラスタリングし、代表的な構造
を PDB ファイルとして出力します。
本ツールは座標抽出ツールと座標クラスタリングツールの二つで構成されています。
(1)トラジェクトリ抽出ツール
reweighting ツールが出力したエネルギー確率分布を元に座標トラジェクトリ
を抽出するツール
(2)座標クラスタリングツール
座標トラジェクトリをクラスタリングするツール
cosgene
エネルギー
座標トラジェクトリ
トラジェクトリ
reweighting ツール
各温度の
エネルギー分布
トラジェクトリ抽出ツール
座標トラジェクトリ
座標クラスタリングツール
PDB ファイル
myPresto 4.2
デンドログラム
エネルギー分布
265
B.7.1 reweightFB
Force-biased McMD のエネルギートラジェクトリファイル、およびユーザ指定を読み込み、
新規の canonical 分布を示すファイルを作成します。
入力データ
(1)制御ファイル
(1−1)Force-biased McMD 法での MD エネルギートラジェクトリファイル名
(1−2)出力ファイル名
(a)収束ループでのループ回数と relative partition function 値
(b)エネルギー、密度および総合確率
(c)各温度でのエネルギーの canonical 分布
(d)温度、平均エネルギー
(1−3)ヒストグラムパラメータ
(a)bin のサイズ(KCAL/MOL)(MD の値とあわせる)
(b)bin の個数(MD の値とあわせる)
(c)エネルギートラジェクトリのサンプリング範囲の下限
(d)エネルギートラジェクトリのサンプリング範囲の上限
(1−4)温度、確率密度関数のパラメータ
(a)シミュレーション時の設定温度
(b)出力する canonical 分布の温度下限(K)
(c)出力する canonical 分布の温度上限(K)
(d)出力する canonical 分布の間隔(K)
(e)canonical 分布を求める確率密度関数の下限値
(2)Force-biased McMD 法での MD エネルギートラジェクトリファイル
■制御ファイル例
F.B.scale
; Force-biased McMD のエネルギートラジェクトリファイル名
function.dat dencity.dat canonical.dat temperature.dat
; 出力ファイル名
1.0 351 1 44
; bin サイズ bin 数
; エネルギートラジェクトリのサンプリング 範囲の下限
; エネルギートラジェクトリのサンプリング 範囲の上限
600 200 800 10 1.d-05 ; 温度 温度下限 温度上限 温度ステップ 確率密度関数下限
■使用例
% reweightFB
<
rew.inp
myPresto 4.2
266
B.7.2 reweightST
Simulated-Tempering MCMD のエネルギートラジェクトリファイル、およびユーザ指定を
読み込み、新規の canonical 分布を示すファイルを作成します。
入力データ
(1)制御ファイル
(1−1)Simulated-Tempering 法での MD のエネルギートラジェクトリファイル名
(1−2)出力ファイル名
(a)各温度でのエネルギーの canonical 分布
(b)各温度の平均エネルギー
(1−3)ヒストグラムパラメータ
(a)ポテンシャルの bin のサイズ(KCAL/MOL)(実行した MD の値とあわせる)
(b)温度の bin のサイズ
(c)分布を出力する温度の下限
(d)分布を出力する温度の上限
(e)温度の分割数
(1−4)サンプリング区間
(a)サンプリング区間の先頭
(b)サンプリング区間の最後
(1−5)初期温度
(2) Simulated-Tempering 法での MD のエネルギートラジェクトリファイル
("S.T.energy")
■制御ファイル例
S.T.energy
; Simulated-Tempering のエネルギートラジェクトリ
canonical average
; 出力ファイル名
1.0 100.0 200.0 700.0 6.0 ; ポテンシャル bin サイズ 温度 bin サイズ
; 温度下限
温度上限
0 800
; サンプリング区間先頭
600.0
; 初期温度
温度分割数
■使用例
% reweightST
myPresto 4.2
<
rew.inp
サンプリング区間最後
267
B.7.3 reweightGST
Generalized Simulated-Tempering MCMD のエネルギートラジェクトリファイル、および
ユーザ指定を読み込み、新規の canonical 分布を示すファイルを作成します。
入力データ
(1)制御ファイル
(1−1)Generalized Simulated-Tempering 法での MD のエネルギートラジェクトリ
ファイル名
(1−2)出力ファイル名
(a)収束ループでのループ回数とポテンシャルの分配関数
(b)エネルギー、密度および総合確率
(c)各温度でのエネルギーの canonical 分布
(d)温度、平均エネルギー
(1−3)ヒストグラムパラメータ
(a)ポテンシャルの bin のサイズ(KCAL/MOL)(実行した MD の値とあわせる)
(b)λの下限 (実行した MD の値とあわせる)
(c)λの上限 (実行した MD の値とあわせる)
(d)λの分割数
(e)G.S.T.でのエネルギー基準値 (実行した MD の値とあわせる)
(f)ηの値(実行した MD の値とあわせる)
(1−4)サンプリング区間
(a)サンプリング区間の先頭
(b)サンプリング区間の最後
(1−5)温度
(a)分布を出力する温度の下限
(b)分布を出力する温度の上限
(c)初期温度
(2)G.S.T.法でのエネルギートラジェクトリファイル("G.S.T.energy")
■制御ファイル例
G.S.T.energy
; Generalized Simulated Tempering のエネルギートラジェクトリ
partition dencity canonical average
; 出力ファイル名
1.0 0.001 0.006 10 0.0 4.5
; bin サイズ λ下限
λ上限
λ分割数
200 800 100
; 温度下限 温度上限 温度分割の幅
エネルギー基準値
η値
myPresto 4.2
268
B.7.4 selection
トラジェクトリ抽出ツールは、入力したポテンシャルエネルギーの確率分布に従って、
座標トラジェクトリの構造を抽出し、再構成するツールです。
入力データ
トラジェクトリ抽出ツールの入力を以下に示します。
(1)座標トラジェクトリ
cosgene の出力トラジェクトリ
(2)エネルギー確率分布
reweighting ツールの出力ファイル
(3)トラジェクトリ抽出ツールの制御ファイル
(3-1)エネルギー確率分布ファイル名
(3-2)座標トラジェクトリファイル名
(3-3)トラジェクトリファイルの型(Single │ Double)
(3-4)サンプリング区間先頭
(3-5)サンプリング区間最後
(3-6)確率分布にかける係数(抽出する座標数はこの係数に比例する)
(3-7)出力トラジェクトリファイル名
(3-8)原子数
制御ファイル例)
bestfit 対象原子指定ファイル例(水素以外の蛋白質原子のみ bestfit する)
pdf.total
ala8.cor_ST
S
0
10000000
100.0
select.cor
32
myPresto 4.2
269
標準出力例)
***** COORDINATE TRAJCETORY SELECT TOOL FOR COSGENE (2005/08/31) *****
FUNCTION : SELECT TRAJECTORY AND OUTPUT TRAJECTORY FILE
INPUT :
(1) ENERGY PROBABILITY DENCTY FUNCTION FILE NAME
(2) COSGENE TRAJCECTORY FILE NAME
(3) TRAJECTORY FORMAT
(4) START LOOP NUMBER
(5) END LOOP NUMBER
(6) SELECTION RATE
(7) OUTPUT TRAJECTORY FILE NAME
OUTPUT :
(1)SELECTED TRAJECTORY
***************************************************************
INPUT ENERGY PROBABILITY DENCITY FUNCTION FILE NAME
INPUT TRAJECTORY FILE NAME
INPUT COORDINATE TRAJECTORY FORMAT ("S"ingle │ "D"ouble)
INPUT START LOOP NUMBER
INPUT END LOOP NUMBER
SELECTION RATE (0.0 < RATE
OUTPUT NEW TRAJECTORY FILE NAME
***** SELECT TRAJECTORY RESULT
*****
1) DISTRIBUTION
POTENTIAL-ENERGY PROBABILITY(%) TRAJECTORIES
SAMPLES SAMPLE-RATE(%)
-0.55000E+01
0.933
0
0 -----0.45000E+01
1.000
1
1 100.000
-0.35000E+01
0.987
0
0 -----0.25000E+01
0.970
0
0 -----0.15000E+01
1.007
0
0 -----0.50000E+00
1.023
4
4 100.000
0.50000E+00
1.039
2
2 100.000
0.15000E+01
1.031
4
4 100.000
0.25000E+01
1.022
10
10 100.000
0.35000E+01
0.952
13
12
92.308
0.45000E+01
0.905
10
10 100.000
0.55000E+01
0.837
12
9
75.000
0.65000E+01
0.796
15
11
73.333
0.75000E+01
0.776
13
11
84.615
P.D.F. SUM=
99.9852000000000
STRUCT SUM=
2000
SAMPLE SUM=
1056
2) INPUT FILES
TRAJECTORY FILE
ala8.cor_ST
:
3) SELECTION
TOTAL TRAJECTORY NUMBER :
2000
SAMPLING BOUND
:
0 10000000
SAMPLING NUMBER
:
2000
RATE
:
100.000000000000
OUTPUT NUMBER
:
1056
TRAJECTORY FILE
:
select.cor
***************************************************************
myPresto 4.2
270
B.7.5 clustering
各種の拡張アンサンブル計算でサンプリングした構造をクラスタリングし、代表的な構
造を PDB ファイルとして出力します。
入力データ
(1)制御ファイル
(1−1)トポロジーファイル名
(1−2)ベストフィットの適用("Y" │ "N")
(1−2−1)ベストフィット対象原子指定ファイル名
(1−3)RMSD 計算対象原子の指定("Y" │ "N")
(1−3−1)RMSD 計算対象原子指定ファイル名
(1−4)サンプル数
(1−5)クラスタ数
(1−6)サンプリング区間先頭
(1−7)サンプリング区間最後
(1−8)入力トラジェクトリファイル名
(1−9)トラジェクトリファイルの型("S" │ "D")
(1−10)クラスタリング方法("nearest " │ "furthest" │ "median " │ "centroid"
│ "average " │ "flexible" │ "ward
" )
(1−10−1)flexible 指定時のβ値
(1−11)出力 PDB 名先頭
(1−12)デンドログラムファイル名
(2)cosgene の入力トポロジーファイル
(3)cosgene の出力トラジェクトリファイル
(4)ベストフィット対象原子指定ファイル(ベストフィット対象原子指定時)
ベストフィット対象原子を cosgene の「系の重心合わせ指定用ファイル」と
同じ書式で指定します。
(p.161「A.2.11 系の重心合わせ指定用ファイル」を参照)
(5)RMSD 計算対象原子指定ファイル(RMSD 計算対象原子指定時)
RMSD 計算対象原子を cosgene の「系の重心合わせ指定用ファイル」と同じ書式で
指定します。(p.161「A.2.11 系の重心合わせ指定用ファイル」を参照)
【注意】
メモリ使用量の観点から、サンプリングする構造は 1000 個以内が望ましいです。
myPresto 4.2
271
【注意】
サンプリングする構造を 1000 個以上に指定することは可能です。メモリ確保に失敗した
ときは以下のエラーメッセージを出力し、プログラムの実行を停止します。
"CANNOT ALLOCATE MEMORY, DECREASE SAMPLING NUMBER"
■制御ファイル例
ala8.tpl
n
n
10
10
10
40
ala8.cor_ST
S
nearest
ala8.cls
ala8.tree
;
;
;
;
;
;
;
;
;
;
;
;
トポロジーファイル名
ベストフィットの適用
RMSD 計算対象原子の指定
サンプル数
クラスタ数
サンプリング区間先頭
サンプリング区間最後
入力トラジェクトリファイル名
トラジェクトリファイルの型
クラスタリング方法
出力 PDB 名先頭
デンドログラムファイル名
■ベストフィット対象原子指定ファイル例
(水素以外の蛋白質原子のみベストフィットする例)
SETBST> LIST
FIX 1
1
FIX 2
2
FIX 3 1000
1 32 H*
1 1 *
1 1 *
YES
YES
YES
; 蛋白(チェイン 1)の 1∼32 残基の"H*"は bestfit 対象外
; リガンド(チェイン 2)の全原子は bestfit 対象外
; 水分子(チェイン 3∼1000)の全原子は bestfit 対象外
■RMSD 計算対象指定ファイル
(水素以外のリガンド原子のみ RMSD 計算する例)
SETBST> LIST
FIX 1
1
FIX 2
2
FIX 3 1000
1 32 *
1 1 H*
1 1 *
YES ; 蛋白(チェイン 1)の 1∼32 残基の全原子は bestfit 対象外
YES ; リガンド(チェイン 2)の"H*"は bestfit 対象外
YES ; 水分子(チェイン 3∼1000)の全原子は bestfit 対象外
myPresto 4.2
272
出力データ
(1)ログ(標準出力に出力)
(1−1)ツールの使用方法
(1−2)データ入力問い合わせ
(1−3)クラスタリング条件
(1−4)入力トポロジーファイル情報
(1−5)ベストフィット対象原子一覧(ベストフィット対象原子指定ファイルに
表示指定がある場合)
(1−6)RMSD 計算対象原子一覧(RMSD 計算対象指定ファイルに表示指定がある場合)
(1−7)クラスタリング進行状況
(1−8)出力 PDB ファイル名
(2)代表構造の PDB ファイル
クラスタ番号、構造数、エネルギーおよびループ回数をコメント出力し、
原子情報を出力します。出力ファイル名は「"出力 PDB 名先頭"+"."+ループ回数」
となります。
(3)デンドログラムファイル
ループ回数とポテンシャルを葉の名称としたデンドログラムを出力します。
■代表構造の PDB ファイル例
REMARK
REMARK
REMARK
REMARK
ATOM
ATOM
ATOM
ATOM
ATOM
CLUSTER
STRUCTURE
LOOP
POTENTIAL
1 CA ACE
2 HH31 ACE
3 HH32 ACE
4 HH33 ACE
5 C
ACE
:
1
NUMBER:
140
:
10000
:
176.955627441406
1
2.508
1.314
1
2.771
1.634
1
2.166
0.280
1
1.718
1.947
1
3.771
1.408
■デンドログラムファイル例
(
(
"10000 176.96 KCAL/MOL"
,
(
"13000 174.52 KCAL/MOL "
,
"16000 184.61 KCAL/MOL "
)
(つづく)
myPresto 4.2
-3.948 12
-4.954 1.01
-3.974 1.01
-3.546 1.01
-3.102 12.01
0.11
0.11
0.11
0.60
273
(つづき)
)
,
(
(
"19000 163.18 KCAL/MOL "
,
(
"22000 162.05 KCAL/MOL "
,
"28000 147.56 KCAL/MOL "
)
)
,
"25000 146.70 KCAL/MOL "
)
)
;
myPresto 4.2
274
B.8
存在確率(Potential Mean Force)解析ツール
PMF 解析ツールは、1次元あるいは2次元のデータと存在確率を入力し、各データが存在
する確率を出力します。カノニカルアンサンブルおよびマルチカノニカルアンサンブル計
算に対応しています。
2次元データの解析結果は PMF ツールの解析結果を等高線作成ツールで、excel 用の等高
線のグラフに加工することができます。
B.8.1 pmf
モニター指定トラジェクトリファイル、エネルギートラジェクトリファイル、エネルギ
ー確率分布ファイル(マルチカノニカルアンサンブルに対しては必須)およびユーザ指定
を入力し、各データの存在確率を出力します。
入力データ
(1)制御ファイル
(1−1)MD の形式("C"anonical │ "M"ulti-canonical)
(1−2)データの次元数( 1 │ 2 )
(1−3)トラジェクトリデータの型("S"ingle │ "D"ouble)
(1−4)モニター指定トラジェクトリファイル名
(1−5)エネルギートラジェクトリファイル名
(1−6)データの上限、加減(2 次元の場合は計 4 つ)
(1−7)データの bin の数(2 次元の場合は計 2 つ)
(1−8)出力ファイルのフォーマット("N" │ "S" │ "C")
N:全ヒストグラムデータ
S:スキャッタープロット形式
C:等高線データ
(1−9)出力ファイル名
(1−10)エネルギー確率分布ファイル((1−1)が "M"の場合は必須)
(1−11)スキャッタープロットのサンプル数((1−8)が "S"の場合は必須)
(1−12)出力データ種別("P"robability │ "E"nergy)
(1−13)エネルギー換算のための温度((1−12)が "E"の場合は必須)
(2)モニター指定トラジェクトリファイル
(3)エネルギートラジェクトリファイル
(4)エネルギー確率分布ファイル((1−1)が "M"の場合は必須)
myPresto 4.2
275
■制御ファイル例
C
; 実行した MD の種別"C"anonical │ "M"ulti-canonical
2
; 構造の数 (1 or 2)
S
; モニター指定・エネルギートラジェクトリの型 ("S"ingle │ "D"ouble)
aa.tra
; モニター指定トラジェクトリファイル名
aa.ene
; エネルギートラジェクトリファイル名
-180.0 180.0 -180.0 180.0
; 構造 1 の上下限 構造 2 の上下限
30 30
; 構造の分割数
C
; 出力形式 ("N"ormal │ "S"catter-plot │ "C"ontour-map)
cont.data
; 出力ファイル名
P
; 確率を出力
出力データ
入力データ(1−8)の指定が "N", "S", "C"の場合、それぞれ以下のデータを出力し
ます。
(1)"N"の場合
入力データに従ったヒストグラムを作成し、csv ファイル形式でヒストグラムデータを作
成します。
各行は、"構造 1 の下限, [構造 2 の下限,] 確率"で構成されます。
■出力例
-0.1800000E+03, -0.1800000E+03,
0.2000000E-02
-0.1680000E+03, -0.1800000E+03,
0.5200000E-02
-0.1560000E+03, -0.1800000E+03,
0.1160000E-01
(2)"S"の場合
確率分布に従い、ユーザが指定した数だけ代表点を作成します。
データ形式は(1)と同じ csv ファイル形式です。
myPresto 4.2
276
(3)"C"の場合
先頭行がデータの行列数、データの下限値、データの範囲、最大値、モニター指定トラ
ジェクトリ名で、次の行から確率分布を行列で表した csv ファイル形式のデータを作成し
ます。
このファイルは等高線作成ツールで、等高線データに変換することができます。
■出力例
SIZE= 8 8
LOWER= -180.0 -180.0 BOUND= 360.0 360.0 MAX =
0.312E-01 FILE=aa.tra
0.200E-02,0.520E-02,0.116E-01,0.144E-01,0.240E-02,0.160E-02,0.320E-02,0.200E-02
0.120E-02,0.120E-02,0.200E-02,0.400E-02,0.360E-02,0.800E-03,0.800E-03,0.120E-02
0.800E-03,0.400E-03,0.360E-02,0.400E-02,0.280E-02,0.800E-03,0.800E-03,0.400E-03
B.8.2 contour
pmf ツールで作成した等高線データファイルを入力し、CSV ファイル形式の等高線データ
を作成します。
入力データ
(1)制御ファイル
(1−1)入力等高線データファイル名
(1−2)等高線の数
(1−3)等高線の値
(1−4)出力等高線ファイル名
出力データ
(1)等高線ファイル
myPresto 4.2
277
B.9
pca
主成分分析により、指定した原子の座標のクラスタリングを行い、代表構造と主成分分
析結果を出力します。
入力データ
(1)制御ファイル
(1−1)トポロジーファイル名
(1−2)構造の重ね合わせの適用("Y" │ "N")
(1−3)重ね合せ対象原子指定ファイル名((1−2)が "Y" の場合に必須)
(1−4)RMSD 計算対象原子の特定("Y" │ "N")
(1−5)RMSD 計算対象原子指定ファイル((1−4)が "Y" の場合に必須)
(1−6)サンプリングする構造数
(1−7)クラスタの個数
(1−8)サンプリングの開始
(1−9)サンプリングの最後
(1−10)座標トラジェクトリファイル名
(1−11)座標トラジェクトリファイルの型("S" │ "D")
(1−12)クラスタリング手法
("nearest" │ "furthest" │ "median" │ "centroid" │
"average" │ "flexible" │ "ward")
(1−13)flexible でのβ値((1−12)が "flexible" の場合に必須)
(1−14)主成分のスケーリング適用("Y" │ "N")
(1−15)プロットデータの 1 軸
(1−16)プロットデータの 2 軸
(1−17)kmax の値
(1−18)プロットデータのファイル名
(2)重ね合せ対象原子指定ファイル((1−2)が "Y" の場合)
(3)RMSD 計算対象原子指定ファイル((1−4)が "Y" の場合)
(4)座標トラジェクトリファイル
出力データ
(1)プロットデータファイル
(2)樹形図ファイル(ファイル名は "pca.tree" )
(3)代表構造 PDB ファイル(ファイル名は "pca.*" )
myPresto 4.2
278
■制御ファイル例
ala_ala.tpl
; topology file name
y
; use bestfit ("y" │ "n")
ala_ala.bst
; bestfit file name, when use bestfit
y
; restrict rmsd target
ala_ala.rmsd
; rmsd target file name, when restrict rmsd target
200
; sampling number of coordinate
4
; delegate structure count
0
; sampling start number
1000
; sampling last number
select.cor
; coordinate traJctory file name
s
; coordinate traJctory file format ( "s" │ "d" )
average
; clustering method name
pca
; result pdb file prefix
n
; scale principle comnponent ("y" │ "n")
2
; 1-axis plot data dimension
3
; 2-axis plot data dimension
30
; number of clustering elements
pca.plot
; plot data
myPresto 4.2
("y" │ "n")
279
B.10
Gamess2tplinp
量子化学計算プログラム GAMESS の出力ファイルから tplgeneL の入力ファイルを作成し
ます。
入力データ
(1)GAMESS の出力ファイル名
出力データ
(1)電荷情報ファイル(XXX.charge)
(2)結合次数情報ファイル(XXX.bond)
(3)Z-matrix 情報ファイル(XXX.zmat)
【注意】上記の XXX は GAMESS の出力ファイル名から拡張子を除いたものです。
■使用法
% Gamess2tplinp
methanol.log
myPresto 4.2
280
B.11
Gauss2tplinp
量子化学計算プログラム Gaussian98 の出力ファイルから tplgeneL の入力ファイルを作
成します。
入力データ
(1)Gaussian98 の出力ファイル名
出力データ
(1)電荷情報ファイル(XXX.charge)
(2)結合次数情報ファイル(XXX.bond)
(3)Z-matrix 情報ファイル(XXX.zmat)
【注意】上記の XXX は Gaussian98 の出力ファイル名から拡張子を除いたものです。
■使用法
% Gauss2tplinp
myPresto 4.2
methanol.out
281
B.12
tpl2mol2
トポロジーファイルと PDB ファイルから、MDL mol または Sybyl mol2 形式のファイルを
作成して出力します。以下のオプションを用いて、入出力のファイル形式を指定します。
オプション
-ipdb
<pdbfile>
PDB ファイル<pdbfile>を入力ファイルとします
-itpl
<tplfile>
トポロジーファイル<tplfile>を入力ファイルとします
-omol2
<mol2file>
出力ファイルを Sybyl mol2 ファイル<mol2file>とします
-omdl
<mdlfile>
出力ファイルを SD ファイル<mdlfile>とします
-h, -help
ヘルプメッセージを表示します
【注意】トポロジーファイルおよび PDB ファイルの指定(オプション:-ipdb, -itpl)は
必須です。
■使用法
% tpl2mol2
-ipdb 2ala.pdb
-itpl 2ala.tpl
-omol2 2ala.mol2
-omdl 2ala.mol
myPresto 4.2
282
B.13
add_ion
溶質(溶媒水分子以外の分子)の作り出す電場を、各溶媒水分子の座標について距離依
存誘電率(ε∝r)で計算し、もっとも電位の高いところ、ないし低いところにある水分
子をカウンターイオンで置換します。カウンターイオンで置換後、同様の計算を繰り返し、
指定した数のカウンターイオンを全て配置するまで作業を繰り返します。この時、次のカ
ウンターイオンは、前回までに配置したカウンターイオンより一定距離以上離れた場所に
配置します。
入力データ
1行目:入力ファイル名:溶媒水分子の付加された全系の座標ファイル名。
2行目:出力ファイル名:全系の座標ファイル名。
3行目:出力ファイル名:カウンターイオンの座標ファイル名。
4行目:出力ファイル名:カウンターイオンに置換された溶媒水分子の座標ファイル名。
5行目:イオンの付加方法;
1:カウンターイオンの数を直接入力
2:系の電荷を中和する必要最低限の数を自動的に付加する。
3:イオンの濃度(イオン mol/水 mol)を指定し、系の電荷を中和するイオン数
を自動的に付加する。
イオン付加方法=1の場合
6行目:Na+ イオンの数
7行目:Cl- イオンの数
8行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した
カウンターイオンより一定距離内に配置しない。その半径(Å)。
イオン付加方法=2の場合
6行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した
カウンターイオンより一定距離内に配置しない。その半径(Å)。
イオン付加方法=3の場合
6行目:イオンの濃度(イオン mol/水 mol)
7行目:カウンターイオンを順次付加したとき、次のカウンターイオンを以前付加した
カウンターイオンより一定距離内に配置しない。その半径(Å)。
myPresto 4.2
283
■入力例
zifcmp.pdb_vac
protein.pdb
ion.pdb
wat.pdb
1
80
72
6.0
■使用例
add_ion とタイプする。標準入力から入力します。入力例は、ion.input としています。
% add_ion < ion.input
myPresto 4.2
284
【注意】add_ion によって付加されたカウンターイオンの配置は、エネルギー的に安定では
ありません。従って、全系の MD 計算に移る前に、蛋白質・DNA の座標を固定した状態で、
溶媒水とカウンターイオンだけの溶媒部分に対し MD 計算を行い、溶媒部分を十分平衡
状態に近づけておきます。
【注意】蛋白質、DNA,溶媒水、カウンターイオンの並びは、トポロジーファイルの MOLECULES
欄と PDB 上で同じ順番でなければなりません。
myPresto 4.2
285
B.14
confgene
Sybyl mol2 形式のファイルで記述された入力分子の配座を発生し、PDB 形式、Z-matrix、
RESP 入力ファイル、Gaussian 入力ファイルを作成して出力します。配座の発生は、ランダ
ムサーチにより、環以外の部分についてのみ行います。電荷情報は、ユーザ自身が手入力
で指定できますが、自動計算も可能です。
【注意】電荷の自動計算は、完全ではありません。また、結合次数の情報が正確でなけれ
ば、電荷の計算は正しく行われません。原子の順番は、並べ替えられます。PDB 出力、
RESP 出力、Gaussian 入力ファイルなどの出力ファイルでの原子の並びは、相互に矛盾
無く出力されます。
入力データ
(1)配座を発生させたい分子の mol2 ファイル名
(2)発生させたい配座の総数。
配座数が原理的に存在しない場合やランダムサーチの一定の試行回数において原子間
衝突のない配座が得られない場合、指定した数よりも生成する配座の数が少なくなる場
合があります。
(3)回転角の指定(N)
回転可能な二面角を(360÷N)度ずつ回転させることで配座を発生させます。
(4)原子の総電荷。
自動計算の場合は「a」と入力。数値は、左詰めで、空白を数字の前に入れないこと。
(5)原子を並べ替えるときの、出発点とする原子の番号。
分子に含まれる原子数以下の任意の数字。通常1で良い。この原子を出発点に、グラフ
上で近い原子に、若い番号を割り当てるように原子の並べ替えを行ないます。
出力ファイル
(以下、生成した配座の数が N 個の場合)
(1)conf1.pdb ∼ confN.pdb
:
発生した配座。conf1.pdb は、入力座標と同じです。メチル基など等価な原子が回転した場
合も、異なる配座と数えるため、化学的には同じ配座が含まれる場合があります。
(2)conf1.com ∼ confN.com
:
発生した配座(conf1.pdb∼confN.pdb)に対応する Gaussian 入力ファイル。実行オプショ
ンは AM1 での構造最適化になっていますが、コメント行には RESP 計算用の電場グリッド発
生オプションが記載されます。
myPresto 4.2
286
(3)resp.in
:
RESP 入力ファイル
(4)qin
:
RESP 用初期電荷ファイル。全て電荷は 0 と設定しています。
(5)zmat.dat
:
分子の初期配座での Z-matrix です。
■使用法
% confgene
Input File name (mol2 file)
ligand.mol2
File =ligand.mol2
Input number of conformers
2
(1)
(2)
no_conf= 2
Input number of rotation phase(=6:60 deg,=3:120 deg)
3
(3)
no_phase= 3
Input total charge of the molecule(a=auto calc)
-2
charge
(4)
=-2
readmol3=ligand.mol2
numatom 41, 40
Input start atom number
1
myPresto 4.2
(5)
287
B.15
confgeneC
Sybyl mol2 形式のファイルで記述された入力分子の配座を発生し、Sybyl mol2、MDL mol
形式、PDB 形式ファイルを作成して出力します。配座の発生は、4 員環以上の環構造の部分
について生成します。また、分子内にキラル中心が存在する場合には、光学異性体も同時
に生成して出力します。
入力データ
必須項目
(1)配座を発生させたい分子のファイル名
(2)入力分子のファイルフォーマット(1:Sybyl mol2、2:MDL mol、3:PDB)
(3)発生させたい配座の総数
採り得る全ての配座を生成させたい場合には「a」を指定します。
配座数が原理的に存在しない場合や配座生成時に原子間衝突のない配座が得られない
場合、指定した数よりも生成する配座の数が少なくなる場合があります。また、
「a」を
指定した場合で異性体が多数ある場合には、最大 999 件のデータを出力します。
オプション(対話形式では指定できません)
(4)回転角の指定(N)
回転可能な二面角を(360÷N)度ずつ回転させることで配座を発生させます。指定し
ない場合には N=6 として処理を行います。
(5)原子間チェックオプション
チェックオプションを指定した場合には、原子間距離が近い構造を作成した場合には、
構造が重ならない様に座標の修正を行います。
出力ファイル
(以下、生成した配座の数が N 個で、出力ファイル形式で Sybyl mol2 を指定した場合)
(1)confXXX.mol2:XXX は 1 から N の 3 桁の数字
発生した配座座標を出力したもの。出力ファイル形式で MDL mol、PDB を指定した場合には、
拡張子がそれぞれ mol、pdb となります。
(2)confXXXc.mol2:XXX は 1 から N の 3 桁の数字
ファイル名の数字の後ろに c の文字がある場合には、光学異性体ファイルである事を示し
ます。出力ファイル形式で MDL mol、PDB を指定した場合には、拡張子がそれぞれ mol、pdb
となります。
myPresto 4.2
288
■使用法
% confgeneC
Please select Input File Format by the next number!
1 : Sybyl mol2 (*.mol2)
2 : MDL mol (*.mol)
1
(1)
INFORMATION> toolGetFilename
Sybyl mol2 input file was selected.
Please select Output File Format by the next number!
1 : Sybyl mol2 (*.mol2)
2 : MDL mol (*.mol)
3 : PDB pdb (*.pdb)
1
(2)
INFORMATION> toolGetFilename
Sybyl mol2 output file was selected.
Please select Input File Name!
sample.mol2
(3)
Please input number of conformers(a=all pattern).
a
(4)
input file = sample.mol2
number of conformers that want to be created = 999
num of rotation phase = 6
INFORMATION> toolSetChiralFlg
This molecule has 3 chiral center(s).
INFORMATION> toolCountCirc
Circular structure(s) have found.
INFORMATION> toolCreateChiralMol
New coordinates are generated for chiral center "C(3)"
INFORMATION> toolCreateChiralMol
New coordinates are generated for chiral center "C(5)"
INFORMATION> toolCreateChiralMol
New coordinates are generated for chiral center "C(6)"
This program creates 11 conformers.
Program is done normally.
myPresto 4.2
289
B.16
自由エネルギー摂動法(開発中)
以下の(1)∼(3)の機能により、自由エネルギー摂動法による自由エネルギー計算
を行います。(1)は cosgene の機能で、(2)および(3)はツールです。
(1)指定した原子の vdW パラメータおよび電荷をスケーリングし、スケーリングによっ
て新たに発生する出力トポロジーデータに加える「vdW パラメータおよび電荷のスケ
ーリング機能」
(2)cosgene 形式のトポロジーファイルおよび座標トラジェクトリファイルを入力し、そ
れらのトポロジーデータおよび座標データを用いて各ステップごとのエネルギー計
算を行う「analyze ツール」
(3)cosgene 形式のエネルギートラジェクトリファイルを2つ入力し、それらのエネルギ
ーデータから自由エネルギー計算を行う「FEP ツール」
【注意】自由エネルギー摂動法関連ツールは開発中であり、計算結果は保証しません。
B.16.1 計算方式
以下の(1)∼(4)手順で、自由エネルギー摂動法による自由エネルギー計算を行い
ます。
(1)cosgene による MD 計算を行い、PDB ファイル、座標トラジェクトリファイル、エネ
ルギートラジェクトリファイル、スケーリングされたトポロジーファイルを出力す
る。
(2)(1)で出力されたトポロジーファイルに基づき、(1)で出力された座標トラジェ
クトリファイルの座標についてエネルギー計算を行い、エネルギートラジェクトリ
ファイルを出力する。
(3)(1)および(2)で得られたエネルギートラジェクトリファイルを用いて自由エネ
ルギー計算を行う。
(4)(1)∼(3)を繰り返し、それぞれの自由エネルギーの総和を算出することで、自
由エネルギー摂動法による自由エネルギー計算を行う。
myPresto 4.2
290
【 自由エネルギー摂動法イメージ図 】
1.tpl
1.pdb
2.tpl
1.cor
2.tpl
2.pdb
3.tpl
2.cor
cosgene
analysys
cosgene
analysys
vdW/charge を
2.tpl と 1.cor から
vdW/charge を
2.tpl と 1.cor から
スケーリング
エネルギーを計算
スケーリング
エネルギーを計算
2.tpl
1.cor
2.pdb
ene1a.traj
ene1b.traj
3.tpl
2.cor
3.pdb
ene2a.traj
FEP
FEP
⊿G 1を算出
⊿G 2 を算出
⊿G 1+⊿G 2+・・・+⊿G 19 = ⊿G
自由エネルギー⊿Gを算出する。
myPresto 4.2
ene3b.traj
291
B.16.2 vdw パラメータおよび電荷のスケーリング機能(cosgene)
cosgene に対して、スケーリング対象原子、vdW パラメータのスケーリングファクタ
ーおよび電荷のスケーリングファクターをファイル入力し、指定した原子の vdW パラメー
タおよび電荷のスケーリングを行います。スケーリングにより新たに発生するトポロジー
データは、出力トポロジーデータに加えられます。
使用方法
制御ファイルの OUTPUT フェーズでスケーリング指定を行い、INPUT フェーズで「スケー
リングファイル」の入力指定を行います。対象原子およびスケーリングファクターの指定
は「スケーリングファイル」で行います。
(1)スケーリング指定(OUTPUT フェーズ)
項番
項目
キーワード
値
#1
スケーリング指定
TPLSCL
選択型
内容
VdW パラメータおよび電荷の
スケーリング(NO │ YES)
(2)「スケーリングファイル」入力指定(INPUT フェーズ)
項番
項目
キーワード
値
#1
スケーリング
SCALIN
選択型
内容
「スケーリングファイル」指定
(NORE │ FORM)
ファイル指定
#2
UNITSC
整数型
装置番号(28)
#3
NAMTSC
文字列
ファイル名(””)
(3)「スケーリングファイル」書式
対象フェーズ:OUTPUT フェーズ
用途:VdW パラメータおよび電荷のスケーリング対象原子およびスケーリングファクター
を指定する。
書式:スケーリングファイルは以下の行で構成される。
[ 対象原子 ID
vdW 半径スケーリングファクター
電荷スケーリングファクター ]...
■使用例
1
0.95d0
0.95d0
6
0.90d0
0.90d0
myPresto 4.2
292
B.16.3 analyze
トポロジーファイルおよび座標トラジェクトリファイルを入力し、各ステップのエネル
ギー計算を行います。計算結果の出力は、cosgene の書式による標準出力へのログ出力およ
び cosgene のエネルギートラジェクトリファイル形式でのファイル出力を行います。
入力データ
(1)制御ファイル
制御ファイルは以下のグループからなり、各グループは“QUIT”で終了します。
・EXE> INPUT グループ
:入力ファイル名を記載する。
・EXE> MD グループ
:エネルギー計算条件を記載する。
※ 制御ファイルの書式は、cosgene の制御ファイルの書式を踏襲します。
※ cosgene の制御ファイルには EXE> MIN グループ、EXE> ANALYZE グループおよび EXE>
OUTPUT グループがありますが、本ツールの制御ファイルにこれらの記述がある場合はそれ
らを読み飛ばします。(エラー処理は行いません。)
(2)トポロジーファイル(ASCII 形式のみ)
(3)座標トラジェクトリファイル(ASCII, SINGLE, DOUBLE に対応)
座標トラジェクトリファイルの入力指定は、制御ファイルの INPUT フェーズで以下のよう
に行います。
項番
項目
キーワード 値
#1
座標トラジェクトリ CRDTRJ
内容
選択型 座標トラジェクトリファイル指定
(NORE │ ASCI │ SING │ DOUB)
ファイル指定
#2
UNITCT
整数型 装置番号(29)
#3
NAMTCT
文字列 ファイル名(””)
出力データ
(1)ログ(cosgene のログ書式で標準出力に出力)
(2)エネルギートラジェクトリファイル(ASCII, SINGLE, DOUBLE に対応)
■使用法
% analyze
myPresto 4.2
<
analysis.inp
>
analysis.log
293
B.16.4 FEP
2 つのエネルギートラジェクトリファイルを入力し、それらのエネルギーデータから自由
エネルギーを計算して標準出力に出力します。
入力データ
(1)制御ファイル
(1−1)設定温度 [K]
(1−2)温度の閾値 [K]
(1−3)自由エネルギー計算ループ初期値
(1−4)トラジェクトリファイル名(文字列、80字以内)
(1−5)(1−4)で指定したファイルのファイル形式
(“A”scii │ “S”ingle │ “D”ouble )
(1−6)トラジェクトリファイル名(文字列、80字以内)
(1−7)(1−6)で指定したファイルのファイル形式
(“A”scii │ “S”ingle │ “D”ouble )
(2)cosgene が出力するエネルギートラジェクトリファイル
(ASCII, SINGLE, DOUBLE に対応)
(3)analyze が出力するエネルギートラジェクトリファイル
(ASCII, SINGLE, DOUBLE に対応)
出力データ
(1)自由エネルギー(標準出力に出力)
■使用法
% analyze
<
analysis.inp
>
analysis.log
■FEP ツール制御ファイル例
300.0
; 設定温度
5.0
; 閾値
1
; ループ初期値
ini.trj
; トラジェクトリファイル名
D
; ini.trj のファイル形式(“A”scii │ “S”ingle │ “D”ouble )
fin.trj
; トラジェクトリファイル名
D
; fin.trj のファイル形式(“A”scii │ “S”ingle │ “D”ouble )
myPresto 4.2
294
B.17
Hgene
化合物への H 原子付加/削除、原子電荷計算(Gasteiger)などを行います。
入出力は PDB、MDL mol、Sybyl mol2 または Mopac dat(出力のみ)形式に対応しています。
用意されているオプションは以下の通りです(ヘルプ参照“-H”)。
入力ファイルオプション(*.mdl, *.mol2/*.sm2, *.pdb)
-imdl, -imol2, -ipdb
出力ファイルオプション
-omdl, -omol2, -opdb, -omopcrt
処理内容オプション
-h(--hydrogen)
H 原子(原子情報、結合情報)を付加する
入力ファイルが MDL mol、Sybyl mol2 の場合のみ対応
-d(--delete-hydrogen)
H 原子(原子情報、結合情報)を削除する
-ch(--charge) [value]
電荷[value]を mopac dat ファイルの一行目に設定する
mopac dat ファイルを出力する場合のみ対応
-dc(--default-charge)
デフォルト電荷(入力ファイルに含まれる値)を使用する
MDL mol の場合は sed_charge の値
Sybyl mol2 の場合は入力値のまま
本オプションを指定しない場合は Gasteiger 電荷(デフォルト)
Sybyl mol2 ファイルを出力する場合のみ対応
-p(--ph)
酸/塩基性官能基が解離状態となる様に H 原子を付加する
つまり、解離型を生成する
-co(--correct-bondtype)
芳香族環の結合次数”ar”を”1”又は”2”で書き換え
-ct(--check-totalelec)
原子の全電荷数チェック
各原子の電子状態が閉殻になっていない場合にエラー
-bo(--bondorder)
指定した原子番号の結合について指定した結合数を割り当てる
10 ヶ所まで指定可能
入力が PDB ファイルの場合のみ対応
myPresto 4.2
295
■使用法
a) MDL mol → Sybyl mol2 変換:
% Hgene -imdl sample.mol -omol2 sample.mol2
b) Sybyl mol2 → MDL mol 変換:
% Hgene -imol2 sample.mol2 -omdl sample.mol
c) PDB → MDL mol 変換
% Hgene -ipdb sample.pdb -omdl sample.mol
d)水素付加オプション(-h):
% Hgene -imdl sample.mol -omol2 sample.mol2 -h
e)水素削除オプション(-d):
% Hgene -imdl sample.mol -omdl sample_out.mol -d
f)電荷指定オプション(-ch):
% Hgene -ipdb sample.pdb -omopcrt sample.dat -ch 0
g)電荷入力値採用オプション(-dc):
% Hgene -imdl sample.mol -omol2 sample.mol2 -dc
h)解離型生成オプション(-p):
% Hgene -imdl sample.mol -omol2 sample.mol2 -p
i)結合次数指定オプション(-bo):
% Hgene -ipdb sample.pdb -omdl sample.mol -p -bo 7 9 2
※原子 7 番と 9 番の結合に二重結合を割り当てる
myPresto 4.2
296
B.18
MVO
MVO(Maximum Volume Overlap)法で化合物の重なり具合をスコアで評価し、最も重なりの
大きい化合物の探索を行います。
入力化合物はマルチ mol2 ファイル形式に対応します。
探索対象化合物の mol2 ファイルに sievgene のスコアが付加されている場合は、sievegne
のスコアと MVO スコアから得られるスコア値での評価ができます。
入力データ
(1)制御ファイル
(1−1)入力する参照化合物ファイル名(mol2 ファイル)
(1−2)入力する探索対象化合物ファイル名(mol2 ファイル)
(1−3)出力する探索結果の1位化合物ファイル名(mol2 ファイル)
(1−4)MVO 計算対象となる二原子の電荷の差分絶対値の閾値
(1−5)sievgene スコアと MVO スコアの割合 Cweight
(スコア=sievgene スコア*(1-Cweight) + MVO スコア* Cweight
出力データ
(1) 探索結果の1位化合物ファイル
ログ
標準出力に制御ファイルの設定条件、各化合物の MVO 計算結果、探索結果が表示されま
す。
myPresto 4.2
297
************************************************
*
*
*
selectMVO(Maximum Volume Overlap method)
*
*
*
* Japan Biological Information Research Center *
*
Aomi 2-41-6, Koto-ku, Tokyo 135-0064 *
*
JAPAN
*
*
*
*
v1.0: May 26, 2010
*
*
*
************************************************
input
input
input
input
input
reference file name [default=query.mol2]
target file name [default=coordinate.mol2]
best structure file name(output) [default=output.mol2]
Q_THR value(threshold of atomic charge remainder)[default=
MVO score weight(0.0<=x<=1.0)[default=
1.00000]
0.20000]
INFORMATION>
1) REFERENCE_FILE:
../test_old/lig_ref.mol2
ATOMS
BONDS
MOLECULES
48
52
2
2) TARGET_FILE:
../test_old/ex.cor
ATOMS
BONDS
MOLECULES
69
72
54
3) OUTPUT_FILE:
output.mol2
4) Q_THR
:
0.20000
5) MVO_WEIGHT:
0.10000
MVO>
QUERY
1
1
1
TARGET
1
2
3
RMSD
29.01840
29.69470
29.18910
SIEVGENE
360.12521
351.95981
347.95001
MVO_SCORE
338.34360
341.00656
292.69943
TOTAL_SCORE
357.94702
350.86447
342.42493
2
2
53
54
30.47210
30.91340
317.28790
331.87891
0.00000
0.00000
285.55911
298.69101
MVO
140.72887
TOTAL_SCORE
364.37772
:
BEST(QUERY,TARGET):
@
QUERY
1
1
TARGET
15
RMSD
29.81970
15
SIEVGENE
389.22760
■使用法
%selectMVO <
mvo.inp
>
mvo.log
myPresto 4.2
298
B.19
sptool
sptool は溶解度予測を行う為のツール群です。分子の構造情報をコード化し(記述子計
算)、回帰計算により未知の分子の溶解度を推算します。また、推算した溶解度を使用して
アグリゲータの予測も行います。
ツール群の機能は以下の 3 つ分かれます。
名前
機能
Descriptor
記述子を計算する
Solubility
溶解度を推算する
Aggregator
アグリゲータを予測する
また、sptool は以下のディレクトリ構成となっています(下図左)。
sptool
Descriptor/
Solubility/
Aggregator/
*.rb
cosgene/
confgene/
GBSAinp/
Hgene/
tplgeneL/
trans_code/
...
*.rb
mlr/
pls/
wln/
*.rb
bys/
$ vi .bashrc
...
#sptool
SPTOOL=~/sptool
DSC_PTH=$SPTOOL/Descriptor
SOL_PTH=$SPTOOL/Solubility
AGG_PTH=$SPTOOL/Aggregator
BYS_PTH=$AGG_PTH/bys
RUBYLIB=$RUBYLIB:$DSC_PTH
RUBYLIB=$RUBYLIB:$SOL_PTH
RUBYLIB=$RUBYLIB:$AGG_PTH
export RUBYLIB
PATH=$PATH:$DSC_PTH
PATH=$PATH:$SOL_PTH
PATH=$PATH:$AGG_PTH
PATH=$PATH:$BYS_PTH
export PATH
$ source . bashrc
プログラムの構築は、各種ツールのソースディレクトリ(src/等)に移動して適宜 make を
実行して下さい。Ruby(ver1.8.5)スクリプトについては、起動ファイル(Descriptor.rb,
Solubility.rb の SRC_DIR)にソースディレクトリの絶対パスを設定して下さい。また、環
境変数の設定は必要に応じて行って下さい(上図右)。
B.19.1 Descriptor
分子の構 造 情 報を読 み込ん で記述子を 計算します。 こ の ツ ー ル は各記述子の 計算に
cosgene, confgene, Hgene, GBSAinp, tplgeneL, trans_code 等を利用します。インストー
ル後、Descriptor.rb の SRC_DIR にソースディレクトリ(Descriptor/)を設定して下さい。
起動コマンド:
起動コマンドは以下の通りです。
Descriptor.rb -i <input_dir> -l <input_lst> -o <output_file>
input_dir
single-mol2 ファイルを格納したディレクトリ名
input_lst
格納された single-mol2 ファイルのリスト
output_file
記述子ファイル名
myPresto 4.2
299
Mol2 ファイルリスト:
入力に必要な mol2 ファイルリストは以下の様に記述子します。
<id> <mol2_file> [<logS>]
(例: 4
id
mol2 ファイルの ID
mol2_file
mol2 ファイル名(*.mol2)
logS
logS 値(実験値、任意)
mol4.mol2
-1.590)
logS 値は実験値が分かっている場合に設定(データベースもしくは検証用)
mol2 ファイル内の@<TRIPOS>COMMENT 以下に記述されている場合には必要ない
物理記述子(Mol2 ファイル):
mol2 ファイルの@<TRIPOS>COMMENT 以下に物理記述子を記述する事が出来ます。
記述は以下の書式行います。
#<identifier> <value>
(例:#LogS
-1.590)
identifier
物理記述子(LogS, DelO_H, AddN_H, …)
value
設定値
記述可能な物理記述子は以下の通りです。
識別子
内容
LogS
logS 値
DelO_H
解離 H 原子数(-OH)
AddN_H
付加 H 原子数(-NH)
dG_o
オクタノール中の GB/SA 値
ddG_o
オクタノール中の GB/SA 値(単位表面積当たり)
dASA_o
オクタノール中の 表面積(単位体積当たり)
dG_w
水中の GB/SA 値
ddG_w
水中の GB/SA 値(単位表面積当たり)
dASA_w
水中の 表面積(単位体積当たり)
dG_wd
水中解離型の GB/SA 値
ddG_wd
水中解離型の GB/SA 値(単位表面積当たり)
dASA_wd
水中解離型の 表面積(単位体積当たり)
計算条件設定:
指定可能な物理記述子の計算条件はそれぞれ指定個所が異なります。デフォルト値につい
ては各設定値を参照してください。
計算条件
指定個所
tplgeneL のパラメータ定義ファイル
Descriptor.rb 内の TPLLDBF
GBSAinp のパラメータ定義ファイル
Descriptor.rb 内の GBSADB
cosgene での最小化条件
min_template.erb
myPresto 4.2
300
cosgene での GB/SA・ASA 計算条件
min_template_o.erb(オクタノール中)
min_template_w.erb(水中)
confgene での発生配座数
Descriptor.rb 内の CNF_NUM
confgene での発生配座角度(360/<n>)
Descriptor.rb 内の CNF_ANG
指定可能な構造記述子の計算条件も同様です。
計算条件
trans_code の記述子定義ファイル
指定個所
Descriptor.rb 内の TRNSDB
B.19.2 Solubility
重み付き 学 習 法に よ る強化学習 を伴っ た回帰計算を 実行 します 。イ ン ス ト ー ル後、
Solubility.rb の SRC_DIR にソースディレクトリ(Solubility/)を設定して下さい。
起動コマンド:
起動コマンドは以下の通りです。
Solubility.rb -i <input_file> -o <output_file> -d <db_file> -m <w/n> <p/m>
input_file
入力分子記述子ファイル名(Descriptor.rb の output_file を想定)
output_file
回帰計算結果ファイル名
db_file
データベース記述子ファイル名(Descriptor.rb の output_file を想定)
w/n
学習選択 w(eighted learning) / n(o learning)
m/p
回帰選択 m(lr) / p(ls)
回帰計算結果の内、推算結果は以下の様な書式になります。
推算結果:
項目
内容
ID
入力分子 ID
tchC1
データベースの回帰直線の係数 C1: y = C1 * x + C2
tchC2
データベースの回帰直線の係数 C2: y = C1 * x + C2
tchR2
データベースの決定係数
tchAveErr
データベースの平均エラー
tchMaxErr
データベースの最大エラー(絶対値が最大)
tchWL
重み付き学習時の追加デコイ数
tstExp
入力分子の logS(実験値)
tstPre
入力分子の logS(推算値)
tstErr
入力分子の推算エラー(絶対値)
推算精度:
項目
tstC1
myPresto 4.2
内容
全入力分子の回帰直線の係数 C1: y = C1 * x + C2
301
tstC2
全入力分子の回帰直線の係数 C2: y = C1 * x + C2
tstR2
全入力分子の決定係数
tchAveErr
全入力分子の平均エラー
tchMaxErr
全入力分子の最大エラー(絶対値が最大)
B.19.3 FreqMaker
logS の頻度分布を作成します。
起動コマンド:
起動コマンドは以下の通りです。
FreqMaker.rb -i <input_file> -w <width> -o <output_file>
input_file
入力 logS ファイル名(Solubility.rb の output_file を想定)
width
ヒストグラム幅
output_file
ヒストグラムファイル名
ヒストグラムファイル:
出力するヒストグラムファイルは以下の様な書式になります。
<logS>
<frequency>
(例: -1.50
logS
logS 値(<width>刻み)
frequency
頻度
24)
B.19.4 wln
重み付き学習を行います。入力した各分子について強化学習データベースを用意します。
${FC} -o wln wln.f でコンパイルしてください(Fortran コンパイラ FC = ifort, g77 ...)。
起動コマンド:
起動コマンドは以下の通りです。
wln -t <input_file> -d <db_file> -b <bin> -c <decoy> -n <dsc_num>
input_file
入力分子記述子ファイル名
db_file
データベース記述子ファイル名
bin
類似度分布の分散の bin 数
decoy
最大強化学習回数(= decoy 数)
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
入力分子記述子ファイル(<input_file>-<id>.dsc, <id>は入力分子の行番号)
b)
強化学習データベース(<db_file>-<id>.dsc, <id>は入力分子の行番号)
c)
類似度分布ファイル(*.dst)
d) 強化学習分子リスト(*.lst)
myPresto 4.2
302
B.19.5 pls
PLS 回帰(Partial Least Squares Regression)分析を行います。${FC} -o pls pls.f で
コンパイルしてください(Fortran コンパイラ FC = ifort, g77 ...)。
起動コマンド:
起動コマンドは以下の通りです(5-1 と 5-2 または 5-3 のみ)。
(5-1) 回帰計算
pls -d <db_file> -n <dsc_num>
db_file
データベース記述子ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
データベース回帰結果ファイル(*.rgr)
b)
回帰係数ファイル(*.cff)
(5-2) 入力評価
pls -t <input_file> -c <coeff_file> -n <dsc_num>
input_file
入力分子記述子ファイル名
coeff_file
回帰係数ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
評価結果ファイル(*.cal)
b)
PLS 分析ファイル(*.pls)
(5-3) 回帰計算および入力評価
pls -t <input_file> -d <db_file> -n <dsc_num>
input_file
入力分子記述子ファイル名
db_file
データベース記述子ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
データベース回帰結果ファイル(*.rgr)
b)
評価結果ファイル(*.cal)
c)
回帰係数ファイル(*.cff)
d)
PLS 分析ファイル(*.pls)
B.19.6 mlr
重回帰(multiple liner regression)分析を行います。${FC} -o mlr mlr.f でコンパイ
ルしてください(Fortran コンパイラ FC = ifort, g77 ...)。
起動コマンド:
起動コマンドは以下の通りです(6-1 と 6-2 または 6-3 のみ)。
(6-1) 回帰計算
mlr -d <db_file> -n <dsc_num>
myPresto 4.2
303
db_file
データベース記述子ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
データベース回帰結果ファイル(*.rgr)
b)
回帰係数ファイル(*.cff)
(6-2) 入力評価
mlr -t <input_file> -c <coeff_file> -n <dsc_num>
input_file
入力分子記述子ファイル名
coeff_file
回帰係数ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
評価結果ファイル(*.cal)
(6-3) 回帰計算および入力評価
mlr -t <input_file> -d <db_file> -n <dsc_num>
input_file
入力分子記述子ファイル名
db_file
データベース記述子ファイル名
dsc_num
記述子列数(拡張 Joback 記述子サイズ = 60 記述子, id 及び logS を除く)
OUTPUT
a)
データベース回帰結果ファイル(*.rgr)
b)
評価結果ファイル(*.cal)
c)
回帰係数ファイル(*.cff)
B.19.7 bys
ベイジアン解析を行います。ベイズ推定を行った後、シグモイド関数でフィッティング
します。${FC} -o bys bys.f でコンパイルしてください(Fortran コンパイラ FC = ifort,
g77 ...)。フィッティングするシグモイド関数の定義は以下の通りです(c1=a, c2=b)。
Pagg (log S ) =
1
1+ e
a (log S −b )
起動コマンド:
起動コマンドは以下の通りです(7-1 と 7-2 または 7-3 のみ)。
(7-1) ベイジアン解析
bys -d <db_file> -i <c1_value> <c2_value>
db_file
頻度分布ファイル名(データベース)
c1_value
シグモイド関数の係数 C1 初期値
c2_value
シグモイド関数の係数 C2 初期値
OUTPUT
a)
データベース解析結果ファイル(*.prb)
b)
シグモイド係数ファイル(*.cff)
myPresto 4.2
304
(7-2) 入力評価
bys -t <input_file> -n <dsc_num> <dsc_idx> -c <coeff_file>
input_file
入力ファイル名(回帰結果)
dsc_num
列サイズ(回帰結果列数 = 10 列)
dsc_idx
列番号
coeff_file
シグモイド係数ファイル名
OUTPUT
a)
(logS の列番号 =
9、列番号 1∼10)
評価結果ファイル(*.est)
(7-3) ベイジアン解析および入力評価
bys -t <input_file> -n <dsc_num> <dsc_idx> -d <db_file> -i <c1_value> <c2_value>
input_file
入力ファイル名(回帰結果)
dsc_num
列サイズ(回帰結果列数 = 10 列)
dsc_idx
列番号
db_file
頻度分布ファイル名(データベース)
c1_value
シグモイド関数の係数 C1 初期値
c2_value
シグモイド関数の係数 C2 初期値
OUTPUT
a)
評価結果ファイル(*.est)
b)
データベース解析結果ファイル(*.prb)
c)
シグモイド係数ファイル(*.cff)
(logS の列番号 =
9、列番号 1∼10)
頻度分布ファイル(データベース):
入力する頻度分布ファイル(データベース)は以下の様な書式になります。
<marker> <state_frq > <non_state_frq>
marker
logS 値
state_frq
アグリゲータ度数
non_state_frq
非アグリゲータ度数
(例: -1.50
24
59)
B.19.8 trans_code
Ullmann の定理を利用して入力分子に含まれる官能基数をカウントします。官能基の定義は
薬物候補低分子用の拡張 Joback 記述子です(定義ファイルは DB/に配置)。コンパイルは、
ソースディレクトリ(src/)に移動した後、Makefile を適宜修正して make して下さい。
起動コマンド:
起動コマンドは以下の通りです。
(8-1) 分子構造から記述子に変換(mol2 形式 DB)
trans_code -i <input_file> -o <output_file> -d <db_file>
input_file
分子構造ファイル名(mol2 ファイル、multi-mol2 形式も可)
output_file
記述子ファイル名
myPresto 4.2
305
db_file
官能基定義ファイル名(multi-mol2 形式、DB 用)
(8-2) 分子構造から記述子に変換(binary 形式 DB)
trans_code -i <input_file> -o <output_file> -d <db_file> -b
input_file
分子構造ファイル名(mol2 ファイル、multi-mol2 形式も可)
output_file
記述子ファイル名
db_file
官能基定義ファイル名(binary 形式、DB 用)
“-b”
binary 利用スイッチ
(8-3) 分子構造から記述子に変換(binary 形式 DB)
trans_code -i <input_file> -o <output_file> -c
input_file
官能基定義ファイル(multi-mol2 形式、DB 用)
output_file
官能基定義ファイル名(binary 形式、DB 用)
“-c”
binary 生成スイッチ
物理記述子(Mol2 ファイル):
mol2 ファイルの@<TRIPOS>COMMENT に以下の記述があれば、trans_code より出力される記述
子ファイルに以下の物理記述子の項目が含まれる様になります。
記述は以下の様に行います。
#<identifier> <value>
(例:#LogS
-1.590)
identifier
物理記述子(LogS, DelO_H, AddN_H, …)
value
設定値
記述可能な物理記述子は以下の通りです。
識別子
内容
LogS
logS 値
DelO_H
解離 H 原子数(-OH)
AddN_H
付加 H 原子数(-NH)
dG_o
オクタノール中の GB/SA 値
ddG_o
オクタノール中の GB/SA 値(単位表面積当たり)
dASA_o
オクタノール中の 表面積(単位体積当たり)
dG_w
水中の GB/SA 値
ddG_w
水中の GB/SA 値(単位表面積当たり)
dASA_w
水中の 表面積(単位体積当たり)
dG_wd
水中解離型の GB/SA 値
ddG_wd
水中解離型の GB/SA 値(単位表面積当たり)
dASA_wd
水中解離型の 表面積(単位体積当たり)
myPresto 4.2
306
(余白)
myPresto 4.2
307
参考文献
◆ General
[1] K. Morikami, T. Nakai, A. Kidera, M. Saito & H. Nakamura.
PRESTO(PRotein
Engineering SimulaTOr): A vectorized molecular mechanics program for biopolymers.
Computers Chem. Vol.16, No.3, 243-248(1992).
◆ Empirical parameters of the potential energy functions
a) AMBER UNITED ATOM parameter
[2] S.J. Weiner, P.A. Kollman, D.A. Case, U.C. Singh, C.Ghio, G. Alagona, S. Profeta,
Jr. & P. Weiner.
A new force field for molecular mechanical simulation of nucleic
acids and proteins.
J. Am. Chem. Soc. 106, 765-784(1984).
b) AMBER ALL ATOM parameter
[3] S.J. Weiner, P.A. Kollman, D.T. Nguyen, & D.A. Case.
for simulations of proteins and nucleic acids.
An all-atom force field
J. Computat. Chem. 7,
230-252(1986).
c) AMBER force field (C96, Param99, GAFF)
[4] W.D. Cornell, P. Cieplak, C.I. Bayly, I.R. Gould, K.M. Merz, Jr., D.M. Ferguson,
D.C. Spellmeyer, T. Fox, J.W. Caldwell & P.A. Kollman. A second generation force
field for the simulation of proteins, nucleic acids, and organic molecules. J.
Am. Chem. Soc. 117, 5179-5197(1995).
[5] P.A. Kollman, R. Dixon, W. Cornell, T. Fox, C. Chipot & A. Pohorille.
The
development/application of a 'minimalist' organic/biochemical molecular mechanic
force field using a combination of ab initio calculations and experimental data.
In Computer Simulation of Biomolecular Systems, Vol. 3, A. Wilkinson, P. Weiner
& W.F. van Gunsteren, Ed. Elsevier, (1997). pp. 83-96.
[6] M.D. Beachy & R.A. Friesner.
J. Am. Chem. Soc. 119, 5908-5920(1997).
myPresto 4.2
308
[7] J. Wang, P. Cieplak & P.A. Kollman.
How well does a restrained electrostatic
potential (RESP) model perform in calculating conformational energies of organic
and biological molecules?.
J. Comput. Chem. 21, 1049-1074(2000).
[8] Junmei Wang, Romain M. Wolf, James W. Caldwell, Peter A. Kollman, David A. Case,
"Development and testing of a general amber force field", J. Compt. Chem. 25,
1157-1174, (2004).
d) OPLS parameter
[9] W.L. Jorgensen, & J. Tirado-Rives.
The OPLS potential functions for proteins.
Energy minimizations for crystals of cyclic peptides and crambin.
J. Am. Chem.
Soc. 110, 1657-1666 (1988).
e) ION in parameter files
[10] J. Aqvist.
Ion-water interaction potentials derived from free energy
perturbation simulations.
J. Phys. Chem. 94, 8021-8024(1990).
[11] T. Darden, D. Pearlman & L.G. Pedersen. Ionic charging free energies: Spherical
versus periodic boundary conditions.
J. Chem. Phys. 109, 10921-10935(1998).
f) TIP3P water
[12] W.L. Jorgensen, J. Chandrasekhar, J. Madura & M.L. Klein. Comparison of Simple
Potential Functions for Simulating Liquid Water.
J. Chem. Phys. 79,
926-935(1983).
[13] W.L. Jorgensen & J.D. Madura.
Mol. Phys. 56, 1381(1985).
g) CHARMM
[14] B. R. Brooks, R. E. Bruccoleri, B. D. Olafson, D. J. States, S. Swaminathan,
and M. Karplus. CHARMM: A Program for Macromolecular Energy, Minimization, and
Dynamics Calculations.
J. Comp. Chem. 4, 187-217 (1983).
◆ Energy minimization
a) Conjugate gradient minimization
[15] M.J.D. Powell.
Restart procedures for the conjugate gradient method.
Prog. 12, 241-254(1977).
myPresto 4.2
Math.
309
[16] S.J. Watowich, E.S. Meyer, R. Hagstrom & R. Josephs.
A stable, rapidly
converging conjugate gradient method for energy minimization.
J. Comp. Chem. 9,
650-661(1988).
b) Minimization with SHAKE Constraints
[17] W.F. Gunsteren & M. Karplus.
macromolecules.
A method for constrained energy minimization of
J. Comp. Chem. 1, 266-274(1980).
◆ Molecular dynamics
a) General documents
[18] W.F. Gunsteren.
engineering.
The role of computer simulation techniques in protein
Protein Engineering 2, 5-13(1988).
[19] 岡崎進,「コンピュータ・シミュレーションの基礎」, 化学同人(2000).
b) Method of differentiation (method of integration)
[20] L. Verlet.
Computer "Experiments" on classical fluids. I. thermodynamical
properties of Lennard-Jones molecules.
Phys. Rev. 159, 98-103(1967).
c) SHAKE constraints
[21] J.P. Ryckaert, G. Ciccotti & H.J.C. Berendsen.
Numerical integration of the
cartesian equations of motion of a system with constraints: Molecular dynamics
of n-alkanes.
J. Comp. Phys. 23, 327-341(1977).
d) Distance restraint
[22] W. Braun & N. Go.
J. Mol. Biol. 186, 611(1985).
e) Position restraint
[23] R.E. Brouccoleri & M. Karplus.
J. Comput. Chem. 7, 165(1986).
f) Torsion restraint
[24] G.M. Clore, A.T. Brunger, M. Karplus & A.M. Gronenborn.
J. Mol. Biol. 191,
523(1986a).
g) Soft repulsion
[25] M. Nilges, A.M. Gronenborn, A.T. Brunger & G.M. Clore. Protein Eng 2, 27(1998).
myPresto 4.2
310
h) Constant temperature simulation
[26] H.J.C. Berendsen, J.P.M. Postma, W.F. van Gunsteren, A. DiNola & J.R. Haak.
Molecular dynamics with coupling to an external bath.
J. Chem. Phys. 81,
3684-3690(1984).
i) BEST fit (Jacobi's diagonalization)
[27] S.K. Kearsley. On the orthogonal transformation used for structural comparisons.
Acta Cryst. A45, 208-210(1989)
j) Particle Mesh Ewald
[28] U.Essmann, L.Perera, M.L.Berkowitz, T.Darden, H.Lee and L.G.Pedersen. A smooth
particle meth Ewald method.
J. Chem. Phys. 103, 8577-8593(1995)
k) Thermostat, Rigid-body
[29] T. Terada and A. Kidera.
Generalized form of the conserved quantity in
constant-temperature molecular dynamics.
J. Chem. Phys. 116, 33-41(2002)
l) NPT Ensemble
[30] Glenn J. Martyna, Mark E. Tuckerman, Douglas J.Tobias, Michael L. Klein,
Explicit reversible integrators for extended systems dynamics,
Molecular Physics,
1996, vol.87, No.5, 1117-1157.
m) RESPA
[31] M. Tuckerman, B. J. Berne, G. J. Martyna,
molecular dynamics,
Reversible multiple time scale
J. Chem. Phys. 97 (3), 1 August 1992.
n) Fast Multipole Method
[32] L. Greengard, "The Rapid Evaluation of Potential Fields in Particle Systems",
MIT Press, Cambridge, MA, 1988.
[33] L. Greengard and V. Rokhlin, "A Fast Algorithm for Particle Simulations",
Journal of Computational Physics, 73, 325-348, 1987.
myPresto 4.2
311
◆ Implicit water model
a) Generalized Born / Surface Area
[34] Still, W. C., Tempczyk, A., Hawley, R., C. & Hendrickson, T. Semianalytical
Treatment of Solvation for Molecular Mechanics and Dynamics.
J. Am. Chem. Soc. 112,
6127 (1990).
[35] Hawkins, D., Gregory., Cramer, J., Christopher. & Truhlar, G., Donald.
Parameterized Models of Aqueous Free Energies of Solvation Based on Pairwise
Descreening of Solute Atomic Charges from a Dielectric Medium.
J Phys Chem 100,
19824-39 (1996).
[36] Hawkins, D., Gregory., Cramer, J., Christopher. & Truhlar, G., Donald. Pairwise
solute descreening of solute charges from a dielectric medium. Chemical Physics
Letters 246, 122-129 (1995).
[37] Onufriev, A., Bashford, D. & Case, D. A. Modification of the Generalized Born
Model Suitable for Macromolecules.
J Phys Chem. B 104, 3712-3720 (2000).
b) Accessible Surface Area
[38] Richmond, T. J.
Solvent accessible surface area and excluded volume in proteins.
Analytical equations for overlapping spheres and implications for the hydrophobic
effect.
J Mol Biol 178, 63-89. (1984).
[39] T. Ooi, M. Oobatake, G. Nemethy, H. A. Scheraga,
Accessible surface areas as
a measure of the thermodynamic parameters of hydration of peptides.
Proc. Natl.
Acad. Sci. U S A 84 (1987)3086-90.
[40] Kinjo, A. R., Kidera, A., Nakamura, H. & Nishikawa, K. Physicochemical evaluation
of protein folds predicted by threading.
Eur Biophys J 30, 1-10. (2001).
c) Atomic Solvation Parameter
[41] Ponder JW, Case DA. Force fields for protein simulations. Adv Protein Chem
2003;66:27-85.
myPresto 4.2
312
◆ Multicanonical MD
a) Multicanonical MD
[42] N. Nakajima, H. Nakamura, and A. Kidera, "Multicanonical ensemble generated by
molecular dynamics simulation for enhanced conformational sampling of peptides",
J. Phys. Chem. B 101, 817-824 (1997).
[43] J. Higo, N. Nakajima, H. Shirai, A. Kidera, H. Nakamura, "Two-component
multicanonical Monte Carlo method for effective conformational sampling", J. Comp.
Chem. 18, 2086 (1997).
[44] N. Nakajima, "A selectively enhanced multicanonical molecular dynamics method
for conformational sampling of peptides in realistic water molecules", Chem. Phys.
Letters, 288, 319 (1998).
[45] H. Shirai, N. Nakajima, J. Higo, A. Kidera and H. Nakamura, "Conformational
sampling of CDR-H3 in antibodies by multicanonical molecular dynamics simulation",
J. Mol. Biol., 278, 481-496 (1998).
[46] S.T. Kim, H. Shirai, N. Nakajima, J. Higo, and H. Nakamura, "Enhanced
conformational diversity search of CDR-H3 in antibodies: Roles of the first CDR-H3
residue", PROTEINS: Struct. Funct. and Genet., 37, 683-696 (1999).
[47] H. Nakamura, S. Ono, and J. Higo, "A general ab initio approach for free energy
landscapes of biological molecules around the transition states: Fusion of the
classical molecular mechanics simulation and the quantum chemical calculation",
Proc. Japan Acad. 75, Ser.B, 291-294 (1999).
[48] N. Nakajima, J. Higo, A. Kidera, H. Nakamura, "Free energy landscape of peptides
by enhanced conformational sampling", J. Mol. Biol. 296, 197 (2000).
[49] S. Ono, N. Nakajima, J. Higo and H. Nakamura,
"Peptide free energy profile is
strongly dependent on the force field: Comparison of C96 and AMBER95",
J. Comput.
Chem. 9: 748-762 (2000).
[50] J. G. Kim, Y. Fukunishi, H. Nakamura, Dynamical origin of uniform sampling in
multicanonical ensemble,
Physical Review E 67, 011105 (2003).
[51] J. G. Kim, Y. Fukunishi, A. Kidera and H. Nakamura, "Determination of
multicanonical weight based on a stochastic model of sampling dynamics",
Physical
Review E 68, 021110 (2003).
[52] J. G. Kim, Y. Fukunishi, A. Kidera and H. Nakamura, "Stochastic formulation of
sampling dynamics in generalized ensemble methods",
(2004).
myPresto 4.2
Physical Review E 69, 021101
313
[53] Yukihisa S. Watanabe, Yoshifumi Fukunishi, Haruki Nakamura, "Modelling of third
cytoplasmic loop of bovine rhodopsin by multicanonical molecular dynamics", J. Mol.
Graph. Model. 23, 59-68 (2004).
b) Multicanonical WHAM
[54] Satoshi Ono, Nobuyuki Nakajima, Junichi
Higo and Haruki Nakamura, "The
multicanonical weighted histogram analysis method for the free energy landscape
along structural transition paths", Chem. Phys. Lett. 312, 247-254 (1999).
c) Force-biased Multicanonical MD
[55] Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, "Multicanonical molecular
dynamics algorithm employing adaptive force-biased iteration scheme", Phys. Rev.
E 70, 057103 (2004).
d) Force-biased Multicanonical MD with GB/SA
[56] Yukihisa S. Watanabe, Jae Gil Kim, Yoshifumi Fukunishi, Haruki Nakamura, "Free
energy landscapes of small peptides in an implicit solvent model determined by
force-biased multicanonical molecular dynamics simulation", Chem. Phys. Lett. 400,
258-263 (2004).
[57] Narutoshi Kamiya, Yukihisa S. Watanabe, Satoshi O no, Junichi Higo, "AMBER-based
hybrid force field for conformational sampling of polypeptides", Chem. Phys. Lett.
401, 312-317 (2005).
◆ Free Energy Estimation
a) WHAM
[58] A. M. Ferrenberg and R. H. Swendsen, Phys. Rev. Lett. 61, 2635 (1988).
b) Filling potential method
[59] Y. Fukunishi, Y. Mikami, and H. Nakamura, "The filling potential method: A method
for estimating the free energy surface for protein-ligand docking", J. Phys. Chem.
B. 107, 13201-13210 (2003).
◆ In silico screening method
myPresto 4.2
314
[60] "A virtual active compound produced from the negative image of a ligand-binding
pocket, and its application to in-silico drug screening", Y. Fukunishi, S. Kubota,
C. Kanai, H. Nakamura, Journal of Computer-Aided Mol Design, (2006) 20, 237-48.
[61] "Finding ligands for G-protein coupled receptors based on the protein-compound
affinity matrix", Y. Fukunishi, S. Kubota, H. Nakamura, Journal of Molecular
Graphics and Modelling, 25, 633-43, (2007).
myPresto 4.2
myPresto 4.204
Fly UP