Comments
Description
Transcript
平成22年度卒業生(学士)
好熱菌を用いた三残基アミノ酸フラグメントデータベースの構築と解析 黒田 研究室 学籍番号:06251069 町田 惠久海 【背景・目的】 タンパク質の熱安定性は、タンパク質を工業的・産業的に応用する際の大きな課題である。 一般的にタンパク質は、それを構成するアミノ酸残基による分子内・分子間での相互作用に よって、ポリペプチド鎖が折りたたまれて立体構造を形成し、機能を発揮する。多くのタン パク質は高温環境で熱変性を起こして機能を失ってしまうのに対し、好熱菌由来のタンパク 質は高温環境でも変性しない。そのため、好熱菌由来のタンパク質は高温環境でも機能を失 わず工業的価値が高い。好熱菌は他の種と比較して、DNA における CG 含有量やタンパク質 におけるアミノ酸組成に特徴があることが知られている。しかし好熱菌由来のタンパク質を 構成するアミノ酸の局所的な構造的特長は未だに得られていない。よって本研究では、アミ ノ酸の局所構造の解析を目的として好熱菌と非好熱菌(常温菌と真核生物の2種)を由来と するタンパク質データセットを作成した。このデータセットから、構造単位を持ちかつサン プル数が最大に得られるアミノ酸三残基フラグメントのデータを抽出し、解析を行った。 【方法】 PDB(タンパク質構造データベース)から好熱菌・常温菌(好熱菌を除いた真正細菌) ・真 核生物を由来とするタンパク質のデータを収集し、データ群ごとに配列ファミリーに分割し、 それぞれの代表配列を選択した。さらに、好熱菌-常温菌、好熱菌-真核生物の組み合わせ で代表配列同士を比較し、互いに類似するアミノ酸配列が存在するもののみを選出し、解析 に用いるデータセットとした。得られたデータセットに対し、三残基アミノ酸フラグメント のアミノ酸組成・二面角(PHI・PSI) ・溶媒露出表面積の平均値を、好熱菌-非好熱菌(常温 菌・真核生物)とで相関係数を算出し、それぞれの相関係数を同様に一残基で算出した場合 と比較した。また、得られたフラグメントから統計的手法を用いて、好熱菌由来のタンパク 質の予測を行った。 【結果・考察】 データセットに含まれるタンパク質の配列は、好熱菌-常温菌では 548 ずつ、好熱菌-真 核生物では 300 ずつ得られた。三残基アミノ酸フラグメントの組成・二面角・中央残基の溶 媒露出表面積の平均値を取り相関を取った(図1)。またこれらの相関係数は、一残基のアミ ノ酸で同様に行って得られる相関係数より、どのパラメータにおいても相関係数が減尐して いた(図2) 。これより一残基アミノ酸よりも三残基アミノ酸フラグメントのほうが、好熱菌 の特徴をより強く示すことがわかった。 結論として、好熱菌の三残基アミノ酸フラグメントは、組成・溶媒露出表面積・二面角に おいて非好熱菌とは違う分布を持つことがわかった。今回構築した好熱菌由来のタンパク質 のデータベースは、熱安定性の高い構造をもつ三残基アミノ酸フラグメントに特化したデー タベースであるといえる。 一残基による比較 常温菌-好熱菌 三残基による比較 1.000 相関係数 0.800 0.600 0.400 0.200 0.000 (図1)好熱菌-常温菌による三残基フラグメントの 組成。横軸が好熱菌のフラグメント・縦軸が常温菌の フラグメントを表す。 組成 ACC PHI PSI (図2)常温菌-好熱菌間の相関係数の比較 構造ドメインデータベースの作成および解析 黒田研究室 学籍番号:07251007 岩崎 駿 [ 背景・目的 ] 生命現象解析の対象は、 「遺伝子」から「タンパク質」へと変化しつつある。しかし、タンパク質の 中には、分子量が大きく、発現・精製等の実験手法の条件検討が困難なものも存在する。そこで、実 験条件の検討が比較的容易なタンパク質の構造単位「構造ドメイン」に分割する手法がとられる。構 造ドメインに分割する手法で一般的に利用されるのが限定分解という実験手法であるが、多量のタン パク質が必要な上に、時間や労力も必要される。そこでアミノ酸配列情報から構造ドメイン領域を予 測する手法が開発されてきた。 本研究では、より多く独立して構造を取りうるドメインを含んだ「構造ドメイン」データベースの 作 成 を 行 う 。 こ の デ ー タ ベ ー ス で は 、 マ ル チ ド メ イ ン タ ン パ ク 質 を SCOP (The Structual Classification Of Protein database) から選出し、そのマルチドメインタンパク質が含むドメイン間に 働く相互作用についての定義を検討し、構造ドメインを定義する。 [ 手法 ] データベース作成手順( fig. 1 ): DB群 (Ⅰ) SCOP (version 1.75) よりマルチドメインタンパク質を取得する。 SCOP PDB (Ⅱ)選出されたタンパク質を SCOP の定義でドメインごとに分割する。 (Ⅲ)そのドメインの中で PDB (Protein Data Bank) に登録されてい (Ⅰ) マルチドメインタンパク質 る結晶化されたタンパク質全長との配列相同性の高いものを独立 (Ⅱ) ドメイン分割 タンパク質配列 して構造を取り得るドメインと定義する。 (Ⅳ)1つのタンパク質内に連続して独立して構造を取り得るドメイン (Ⅲ) ドメイン選出 が 2 つある場合、ドメインペアを作成する。また1つのタンパク 質内に選出されなかったドメインが 2 つある場合もドメインペア (Ⅳ)ペア作成 (Ⅴ・Ⅶ)相互作用情報 を作成する。 (Ⅵ)構造ドメインの定義 (Ⅴ) 各ペアのドメイン間相互作用情報として、PDB より疎水性相互 作用情報、また PDB と二次構造予測プログラム DSSP を用いて水 (Ⅷ)構造ドメインデータベース 素結合・ジスルフィド結合情報を取得する。 (Ⅵ) 作成した二つのペアにおいて、各相互作用情報の距離・結合力・ fig.1 データベース作成の手順 数について独立であると定義される AFD と Non AFD の検出感度 の差が最大化される場所を構造ドメインと定義した。 (Ⅶ)SCOP より選出したマルチドメインタンパク質全体に対しても、ドメイン間結合情報を取得する。 (Ⅷ)マルチドメインタンパク質の中から「構造ドメイン」の定義を用いて「構造ドメイン」を選出し、 データベース化する。 [ 結果・考察 ] SCOP よりマルチドメインタンパク質を 16974 個選出した。得られたタンパク質を SCOP の定義に したがいドメイン分割し、37051 個のドメインを得た。得られたドメインの中で PDB に登録されたタ ンパク質全長と配列相同性をもつドメインを 5689 個得た。それを独立して構造を取りうるドメインと し、類似配列ごとにグループ分類することで 107 のペアを作成した。同時に独立でないと定義された ドメインもグループ分類し、1132 のペアを作成した。 そこから以下の定義を決定した。 表 1 独立して構造を取り得るドメインを含む割合 ・ -0.5cal の水素結合を1つ未満 ・ 5.0Åの疎水性クラスターを2つ未満 ・ ジスルフィド結合を1つ未満 表 1 では、定義を用いて SCOP より得た マルチドメインタンパク質から「構造ドメ イン」を選出した。類似配列のグループ分 類による結果も含めて、より独立して構造 を取りうるドメインを多く含む「構造ドメ イン」を検出できた。 SCOP Our Method for SCOP SCOP Our Method for SCOP 独立構造グループ数 グループ総数 292 1199 109 272 独立構造ドメイン数 5689 1925 ドメイン総数 37051 4928 割合 24.35 40.07 割合 15.35 39.06 正しくフォールディングするガウシアルシフェラーゼの精製のプロトコルの開発 黒田研究室 学籍番号: 07251040 関 琢磨 【背景・目的】 海洋カイアシ類由来の Gaussia Luciferase (GLuc) は他のルシフェラーゼと比較して、発光反応が ATP 非依存である、分子サイズが小さい、などの利点がある。その為レポータータンパクとして注目されてい る。しかし GLuc には配列中に 10 個のシステイン残基が存在し、正しい S-S 結合の形成が難しくフォー ルディング効率が一定でないという欠点があるため、精製純度が低く未だ構造解析のための結晶化に至っ ていない。そこで精製条件を最適化する必要がある。本研究では大腸菌を宿主として、GLuc のフォール ディング効率を向上させることを目的とした。 【研究方法】 今回用いた GLuc は、pAED ベクターに His タグ、GLuc、C9D タグ (C 末端に 9 つのアスパラギン 酸を付加したタグ。このタグの付加により GLuc の上清画分が増加することが先行研究により示されてい る)を順に挿入した GLuc(GLuc-C9D と名付ける)である。BL21 (DE3) を宿主に用いて 37℃で O.D. 590nm=0.5~0.6 になるまで LB 培地で培養した。IPTG(最終濃度 1μm)による発現誘導を行ない 25℃で4 時間培養した。集菌後に超音波破砕し上清画分を回収した。上清画分を His アフィニティーカラムによっ て精製した後に、buffer 置換の為に外液を 50 mM Tris-Hcl buffer (pH 8.0)で透析を2時間行った。透析 後の GLuc-C9D を 4℃で静置インキュベーションし、そのフォールディング変化を 1 日経過ごとに逆相 HPLC で分析し、フリーシステイン濃度を計測するため DTNB 測定をし、分光光度計で発光活性を計測 した。 【結果および考察】 4℃で 1 日以上インキュベーションすることにより、GLuc は単一の S-S 結合パターン(図 1)を持ち活性 が高くなる(図 2)フォールディングを形成することがわかった。図 1 (A) では GLuc を示すピークが複数観 測され、単一の S-S 結合パターンを持つ構造ではないと分かった。しかし、図 1-(B) (C) (D)では1つのピ ークになり、単一の S-S 結合パターンの構造を持っていると示唆している。また、図 2 の結果から発光強 度が最も高くなる日は 3 日目だと分かった。図 1 と図 2 からフォールディングが変わり1つのピークに近 づくと活性も高くなる傾向があることが分かった。また DTNB 測定を行なったところ、1 日目から2日目 にかけてフリーシステイン濃度が著しく減尐を確認しており、4℃で 1 日以上インキュベーションにより S-S 結合が形成されることが分かった。これらの結果からインキュベーションを行なうことによりフォー ルディングが変化し、正しい S-S 結合を形成する GLuc が得られることが分かった。今後は大量培養によ り結晶化に適した試料の作成につながるだろう。 250 (D) (A) (B) (C) (D) 系列5 系列6 系列7 系列8 (C) (B) 発光強度 200 150 100 50 (A) 0 360 時間 (秒) 図1 4 ℃インキュベーション下の GLuc-C9D の HPLC ピーク。 は正しいフォールディング は間違えたフォールディング 460 波長 (nm) 560 図 2 4℃インキュベーション下の GLuc-C9D の発光強度の変化。 ―(A)透析直後 ―(B)インキュベーション 2 日目 ―(C)インキュベーション 3 日目 ―(D)インキュベーション 4 日目 660 正しくフォールディングしたガウシアルシフェラーゼの発現・精製及び NMR 解析用サンプルの作製 黒田研究室 学籍番号: 07251048 田中 亮太 【背景・目的】 自然界にはホタルを始めとして生物発光を行う多くの甲虫、甲殻類、バクテリアなどが存在している。 これらはいずれも酵素であるルシフェラーゼが基質のルシフェリンの酸化反応を触媒することによって発 光を行っている。これと同様の基質を利用するルシフェラーゼとして、カイアシ類の Gaussia princeps が持 つルシフェラーゼ (GLuc) が挙げられるが、これは他のルシフェラーゼと比較すると分子量が 19.9 kDa と 小さく、発光強度は数百倍、反応は ATP 非依存的であるという特徴からレポータータンパクとしての活用 が期待されている。しかし、GLuc の構造は、10 個のシステインによる 5 つのジスルフィド結合を有する ということ以上の詳細については未だ不明のままである。そこで本研究では構造決定へ向け、GLuc の変 異体を作製し、結晶化や NMR 解析により適したタンパク質へと改良すると同時に、それぞれの最適条件 を探索することを目的とした。 【研究方法】 先行研究にて発現量が多く、 菌体破砕の際に上清画分にタンパク質が多く現れるとされた組み換えGLuc (pAED-GLuc C9D タグ付き)に対し、アミノ酸残基を挿入する(Fig.1)。これによって得られたプラスミド で BL21 (DE3) を形質転換し培養後、更に IPTG でタンパク質発現を誘導し 25℃で 4 時間培養する。得ら れた菌体を破砕後、タンパク質を His アフィニティーカラム、逆相 HPLC カラムをもちいて精製をする。 その後、精製タンパク質をプロテアーゼである Factor Xa にて処理して GLuc の両端に付属する His タグ、 C9D タグを切断し構造解析が可能な状態にする。また NMR 解析用にその変異体を用い、最小培地でラベ リングした GLuc の作製と測定条件の設定を行う。 Fig.1:変異を挿入した部位 【結果および考察】 His タグと GLuc の間にヒスチジン、メチオニンの二残基を挿入したところ、これまで切断可能であ った C9D タグだけではなく、His タグも処理可能となり、GLuc 部位のみでの構造解析を試みることが可 能となった。しかし、タンパク質の収量はこれまでの約 40%に減尐してしまった。そこで挿入する残基を、 トレオニン、グリシンの二残基へと変更したところ、両タグが処理可能な上、タンパク質の収量は残基挿 入前と比較してほとんど減尐は見られなかった (Fig.2)。また、NMR 解析ではより高濃度のサンプルを用 い、そのタグを切断して pH をより低く設定する必要があることがわかった。今後はこの変異体を利用し て精度の高い NMR 解析や結晶構造解析など、更なる GLuc の構造解析を進めていく予定である。 Fig.2:挿入前後の HPLC チャート Fig.3:測定した1次元 NMR スペクトル ヘリックスを含むドメイン境界配列の解析及びその予測 黒田研究室 学籍番号 : 09251506 辻 良太郎 [背景・目的] 生物学的に重要な機能を持つタンパク質は、いくつかのドメインにより構成される場合が 多い。しかし、このような多ドメインタンパク質の中には、発現や精製が困難で解析が進ん でいないものも存在する。このようなタンパク質の場合、単独で構造を取り、発現、精製が 比較的容易な構造ドメインに分割して実験を行うという手法が取られる。この際に、ドメイ ン境界領域を計算的に予測する手法は、そもそも発現しないタンパク質の解析や解析の迅速 化、実験コストの削減に貢献する。 先行研究では、ループ構造からなるドメイン境界領域予測手法が開発されており、既に高 い効率が得られている。しかし、これらの予測手法では、既知のドメイン境界領域の約 30% を占めるヘリックスを含む境界領域の予測は困難である。そこで、本研究ではヘリックスを 含むドメイン境界領域の予測に特化した予測機開発を目的とする。 [方法] ① 構造ドメインデータセットの作成: SCOP (Structural Classification of Proteins) によって 定義された多ドメインタンパク質を取得し、そのドメイン間で「水素結合数 4 個未満、疎水 性クラスター形成数 1 個未満、ジスルフィド結合数 1 個未満」ならば独立して構造を形成し ている構造ドメインであると定義して、それを選出した。 ② リンカー領域の定義: 本研究では、リンカー領域を「前後のドメイン領域から独立して いるドメイン境界領域」と定義した。①で選出された構造ドメインをもつタンパク質に対し て、①と同様の定義で独立しているリンカー領域を決定した。さらに、取得したリンカー領 域の中で、 「70%以上の残基がヘリックスを形成するリンカー領域」をヘリカルリンカーと定 義し、これを持つタンパク質をデータセットとして選出した。 ③ 予測機の構築: 本研究では、統計的スコアを用いた手法と SVM による手法で予測機を 開発した。統計的スコアは、各アミノ酸についてヘリカルリンカー領域と、ドメイン領域内 ヘリックスの組成の差を用いて作成した。SVM ベクターのエンコーディングには、Binary Coding によるアミノ酸配列パターン情報と、上記の統計的スコアを用いた。 ④ SVM 最適化: 学習に使用する Window 長や SVM パラメータについて最適化を行った。 最適化の条件として AUC 値を用いて、5-Fold Cross Validation Test により検定した。また、予 測法の Sensitivity と Precision を試験データのリンカー領域に前後 20 残基の誤差を認め、算出 した。 [結果・考察] 本解析からヘリカルリンカーはドメイン内ヘリックスに比べて、Arg のような電荷を持っ たアミノ酸を多く含むという傾向が明らかとなった (図 1) 。これはヘリカルリンカーが溶媒 に露出した環境にあるためだと考えられる。さらに、これまで困難だったヘリカルリンカー の予測効率の向上が確認できた (表 1) 。また、SVM ベクターに統計的スコアを用いると有 効であることが示唆された。 表 1. 各手法での Sensitivity と Precision および AUC 値 図 1.データセットのドメイン内ヘリック スとヘリカルリンカーのアミノ酸組成。 赤点はχ2 検定で有意差(P < 0.05)が認めら れたアミノ酸を示している。 手法 Sensitivity Precision AUC A 0.424 0.438 0.697 B 0.470 0.484 0.701 C 0.409 0.422 0.705 統計的スコア 0.409 0.422 0.621 DomCut 0.136 0.141 0.533 random 0.215 0.222 0.510 A、B、C は SVM による手法で、学習データが異なる。 A:Binary Coding、B:統計的スコア、C:A+B DomCut は統計的手法でループ構造のドメイン境界領域を 予測する方法である。 random は 1 タンパク質あたり 1 か所をランダムに予測領 域として算出した。