...

No.38 - DDBJ

by user

on
Category: Documents
15

views

Report

Comments

Transcript

No.38 - DDBJ
 HOME
塩基配列の登録
利用の手引き
検索・解析
FTP・WebAPI
レポート・統計
サイト内検索
お問い合せ
English
HOME > レポート・統計 > メルマガ
No. 38 2008年6月9日発行
申込・変更 最新号
過去の号 発行:DDBJ
国際実務者会議終了(5/20−22)
台風接近の為,交通機関等を懸念される
中,無事に,今年の国際実務者会議が 5月
20日から22日まで国立遺伝学研究所(静岡
県三島市)で開催することができました。3バ
ンク(DDBJ/NIG, EMBL-Bank/EBI,
GenBank/NCBI)の実務担当者が国際塩基
配列データベース共同構築を円滑に進める
ための年1回の熱い討議が終了し,実務的な
問題解決への糸口となったことと思います。
来年は USA での開催予定,また,熱い 3日
間になることでしょう。
隔月公開の DDBJ メールマガジン第38号 web 版です。メールマガジンに関するご質問やご意見がありましたら
までどうぞ。
Have you ever seen DDBJ ?
国立遺伝学研究所 生命情報・DDBJ 研究センター センター長の菅原秀明教授と,日本 DNA データバンク バンク長の舘野義
男教授は,3月31日国立遺伝学研究所を退職いたしましたが、4月1日からは特任教授として,DDBJ 研究事業に携わっており
ます。今回,菅原教授の最終講義の中から,DDBJ のウェブの背景にある状況をご理解いただけるスライドを抜粋してご紹介
いたします。
第21回国際実務者会議が三島で開催
DDBJ/NIG(国立遺伝学研究所), EMBL-Bank/EBI(欧州バイオインフォマティクス研究所), GenBank/NCBI(米国立バイオテク
ノロジー情報センター) の3大国際 DNA データバンクは,INSDC; International Nucleotide Sequence Database Collaboration
として国際塩基配列データベースの共同構築と運営を行なっています。3バンクは,生物学の発展に伴って発生するデータ項
目や内容の追加・削除・更新など,バンク活動の実務について協議するため,DNAデータバンク国際実務者会議を毎年1回開
催しています。1987年7月にドイツのハイデルベルグで第1回が開催されて以来今回で21回目となります。 開催地は,日
(NIG),欧(EBI),米(NCBI)の持ち回りとなっています。
2008年の第21回国際実務者会議は,5月20日-22日に国立遺伝学研究所(静岡県三島市)で開催されました。通信技術が発
達した昨今では,国際会議といえども,参加者は自国に居るままインターネットなどを介して議論を行なうものも少なくありま
せんが,国際実務者会議では,毎度,必ず3バンクの実務担当者が多忙なスケジュールを調整して一堂に会し,通常3日間に
わたり集中討議を行ないます。この形式により,出席者全員が互いに知り合いになり,時には厳しい議論も友好意識のもとで
繰り広げられます。20年以上も続いている根拠の一つは,この友好関係にあります。
会議では,常に生物学の発展ならびに登録者や利用者のニーズに留意し,これに応えるような対応をとっています。その結
果,これまでに,遺伝子中心から遺伝子とゲノム両方を考慮した登録対応に移行し,配列長制限の撤廃,第三者によるアノ
テーションの許可,大量登録に対応する新しい配列分類の設定 といった事項などが議論され決定されてきました。また近頃の
非タンパク遺伝子研究の隆盛を反映して,ここ数年来は,RNA に関する新規事項の追加が必ず検討議題にあがっています。
さらに,研究動向を少し先取りした議論も行われます。例えば,新世代のシークエンサーが研究のあり方やデータの形に与え
る影響についても議論してきています。そして,この会議での決定に基づいて,3バンク共通のアノテーション規範である
Feature Table Definition の改訂も毎年行なわれており,通常,1年以内に公開データベースに改訂が反映されることになりま
す。
今年三島で開催された 21回実務者会議,今回も多くの議題が提案され,より良いデータバンク活動へ向けて白熱した議論が
展開されました。
今回の21回実務者会議の実務者会議での決定事項は,DDBJ のホームページ(DDBJ メールマガジン ,ドキュメントのページ )
や DDBJ/CIB Report にて報告予定です。塩基配列の登録だけでなく,各種データベースの利用に際しても有用ですので,是
非ご参照ください。
(参考)
・ INSDC ホームページ: http://www.insdc.org/
・ The DDBJ/EMBL/GenBank Feature Table: Definition :http://www.ddbj.nig.ac.jp/FT/full_index.html
・ RNA ワールドへの対応--時代の要請にあわせた Feature Table Definition 改訂- (今月の DDBJ トピック 12月):http://www.ddbj.nig.ac.jp/whatsnew/2007/071207-j.html
・ 国際実務者会議報告:http://www.ddbj.nig.ac.jp/insdc/icm2007-j.html 他
大量データの公開
DDBJ が登録を受付け,2008年4月から5月にかけて DDBJ/EMBL/GenBank 国際塩基配列データベースから公開した大量
データは以下の通りです。
ミヤコグサ ( Lotus japonicus ) ゲノムデータの公開
かずさDNA研究所から登録されたミヤコグサ ( Lotus japonicus ) のゲノムデータが公開されました。アクセッション番号は以下
の通りです。
・HTG: リスト参照 (1,076 entries)
・PLN: リスト参照 (1,049 entries)
・WGS: BABK01000001-BABK01109991 (109,991 entries)
・CON: DF093176-DF093536 (361 entries)
これらは 5/28, 5/29 分の新着データとして DDBJ より公開されております。
また, anonymousFTP サイトから一括取得が可能です。
・HTG ファイル: Lotus_japonicus_HTG_080529_1.seq.gz
・PLN ファイル: Lotus_japonicus_PLN_080529_1.seq.gz
・WGS ファイル: Lotus_japonicus_WGS_080528_1.seq.gz
・Contig ファイル: Lotus_japonicus_CON_080529_1.seq.gz
カイコ ( Bombyx mori ) のゲノム配列データ新規公開
農業生物資源研究所から登録されたカイコ ( Bombyx mori ) のゲノム配列データが公開されました。
アクセッション番号と件数は, それぞれ以下の通りです。( )内はFTPファイル名です。
WGS ( Bombyx_mori_WGS_080423_1.seq.gz )
-BABH01000001-BABH01088672(88,672 entries)
scaffold CON ( Bombyx_mori_CON_080423_1.seq.gz )
-DF090316-DF092116(1,801 entries)
GSS (fosmid end) ( Bombyx_mori_GSS_080423_1.seq.gz )
-DE143284-DE189151 (45,868 entries)
-DE246947-DE248527 (1,581 entries)
-DE420876-DE647768 (226,893 entries)
GSS (BAC end) ( Bombyx_mori_GSS_080424_1.seq.gz )
-DE378561-DE420875 (42,315 entries)
HTG (BAC clone) ( Bombyx_mori_INV_080423_1.seq.gz )
-AP008992-AP009041 (50 entries)
これらは4/23, 4/24分の新着データとして DDBJ より公開されております。また, anonymousFTP から一括取得が可能で
す。
メダカ ( Oryzias latipes ) EST 265,853 エントリの新規公開
基礎生物学研究所から登録されたメダカ ( Oryzias latipes ) の EST データ 265,853 エントリが公開されました。
アクセッション番号は以下の通りです。
-DK000001-DK265853(265,853 entries)
これらは5/2分の新着データとしてDDBJより公開されております。また, anonymousFTP サイトから一括取得が可能です。
-FTPファイル: Oryzias_latipes_EST_080502_1.seq.gz
GSC よりゲノム情報の記述に関する新規ガイドライン発表
Genomic Standards Consortium (GSC) が ゲノム・メタゲノムの記述に関する新規のガイドライン "Minimum Information about
a Genome Sequence (MIGS)" を創設し,論文にまとめ,Nature Biotechnology (5月発行)に掲載されました。 また,論文発表
に合わせて,GSC が Press release を行ないました
Genomic Standards Consortium(GSC) が Genomic Standards Consortium(GSC) は,主要なゲノムセンターならびに生命情報
機関の代表者が名を連ねる国際的な組織であり,DDBJ バンク長の舘野義男もそのメンバーで,論文の著者の1人にもなって
います。 以下は,Press release の日本語要約です。
2008年5月9日付プレスリリース
世界の主要なゲノムならびに生命情報機関の代表者をメンバーとする Genomic Standards Consortium (GSC) が ゲノム・メタ
ゲノムの記述に関する新規のガイドライン" Minimum Information about a Genome Sequence (MIGS)"を創設し,Nature
Biotechnology に発表しました。
発表された新規ガイドラインは,最小限の情報 (MI) の表示規範です。 ゲノム配列決定技術の進歩に伴ってゲノムならびにメ
タゲノム配列決定プロジェクトの数は加速度的に増加し,ゲノムデータの量も右肩上がりで増加しています。大量データのデー
タベースへの蓄積と有効利用のためにはデータの電子化は必須であり,それゆえ MIGS のような共通の規範の設定がますま
す必要不可欠なものとなっています。
公共データベース中といえども,ゲノム・メタゲノムの情報の記載が不十分なものも多く,特に,近年,驚異的なスピードで増加
中の環境サンプルにおいてその傾向が顕著です。GSC はこれに対応するためも,このプロジェクトを立ち上げました。
最近では様々な MI standard が発表されていますが,それらに比べて,MIGS は容易に使用可能で,実際,最近 MIGS を使用
したケースが多数確認されています。 この論文の主たる著者でありGSCの創設メンバーである 英国 Ecology & Hydrology
Center の Dr. Dawn Field は,「いつでも誰でも GSC への参加を歓迎する」と述べています。
-GSC とは?
GSC (Genomic Standards Consortium) は,2005年9月に設立され,ゲノムデータの記述を標準化することにより,データの相
互利用と統合化を促進することをめざしています。 メンバーには, DDBJ,EMBL,GenBank の国際塩基配列データベースを
構築する3つのデータバンクをはじめとして, JCBI,JGI,EBI,Sanger といった世界をリードするゲノム研究機関の研究者達
が含まれており,彼らは, ゲノムデータベースの構築や大規模比較ゲノム研究に携わる生物学,コンピューターサイエンスの
両分野から,これまでの経験を生かして,標準化のためのルール作りとその啓蒙に貢献しています。
-MIGS について
MIGS (Minimum Information about a Genome Sequence) は,真核生物,バクテリア,古細菌,細胞小器官,プラスミド,ウイル
ス等のゲノム情報を記述するものです。MIGS を用いることによって,核酸の由来,生物が置かれている環境,試料を採取し
た日付や時間,試料の採取や配列決定の手順,といったゲノム情報を特定するにあたっての決め手となる部分を可能な限り
記述することができます。将来,シークエンサー等のテクノロジーの進歩によって変化する可能性はあるものの,大規模ゲノ
ム時代の到来によって,今後ますますその重要性が高まると考えられます。
Reference Nature Biotechnology 26, 541 - 547 (2008), PMID;18464787
"The minimum information about a genome sequence (MIGS) specification"
getentry での Protein ID による DAD 検索不具合についてのお詫び
getentry は DDBJ が WWW および E-mail で提供しているアクセッション番号などによる高速なエントリ検索システムです。
このたび, getentry にて Protein ID をキーとして DAD ( DDBJ amino acid database ) 検索を行った場合, 一部のエントリで
誤った結果が表示される状態が発生していたことが判明いたしました。詳細については下記の通りです。
・不具合内容: 検索対象データベースとして DAD を, ID として Protein ID を選択して検索を行った場合に 得られる検索結果
のうち, 一部のエントリにおいて以下の状態が発生する。 複数の CDS Feature を有し, /pseudo qualifier を含む CDS Feature
以降に, /translation qualifier を含む CDS Feature があるエントリ において, /translation qualifier を含む CDS Feature に記さ
れた /protein_id からのハイパーリンクが 正しく機能していない。また, その Protein ID を指定した DAD 検索ができない。
・期間:2007年2月27日 から 2008年5月22日 まで
・問題があった Protein ID を含む DDBJ フラットファイルのアクセッション番号: (->番号リストはこちら )
・対応:問題の不具合を修正し, データの是正を行いました。現在は対応作業が完了し, 正常に検索結果を得ることができま
す。
・再検索のお願い
getentry にて, 該当する期間に, 該当する内容にて検索を行ったと思われる方は, お手数おかけ致しますが, 再度検索を実行
して下さいますようお願い申し上げます。
ご迷惑をおかけしましたことを心よりお詫び申し上げます。
ARSA 検索対象 DB 削除のお知らせ
ARSA は DDBJ が WWW で提供している高速なキーワード検索サービスです。
ARSA では, 現在 DDBJ, DAD をはじめとする24種のデータベース( DB )を検索対象としています。このうち PFAM 関連の DB
として下記の6種の DB を提供しておりました。
・PFAMA
・PFAMB
・PFAMHMMLS
・PFAMHMMFS
・SWISSPFAM
・PFAMSEED
上記のうち, PFAMHMMLS, PFAMHMMFS, SWISSPFAM, PFAMSEED の 4DB につきましては, PFAMA のサブセットとなりキー
ワード検索対象としては冗長であるため, 2008年5月28日をもちまして検索対象から削除致しました。 今後は, PFAM 関連の
キーワード検索として, PFAMA, PFAMB をご利用下さい。
ARSA では, 今後も機能改善・サービス改善に努めてまいります。
皆様のご理解とご協力をどうぞよろしくお願いいたします。
日韓中バイオインフォマティクス・トレーニングコース 森明弘
2008年3月18日から21日まで,韓国・済州島にて第7回日韓中バイオインフォマティクス・トレーニングコースが開催され,日本
からも 10名の受講生が参加しました。参加者の一人である森 明弘さんに参加報告レポートをご寄稿いただきましたので紹介
します。
尚、日韓中バイオインフォマティクス・トレーニングコースの詳細は こちら をご覧下さい。
(* 来年度(2009年)は日本で開催予定です。詳細は決まり次第 HP にてご連絡いたします)
「[第7回日韓中トレーニングコースを経て得られたもの」
森 明弘
国立遺伝学研究所 生物遺伝資源情報研究室
今回の日韓中トレーニングコース(以下、講習会と呼ぶ)の会場は、韓国・済州
島(Jeju island)にある済州大学の国際センターであった。済州島は韓国のリゾート地と聞いていたので、かなり期待をして現地
へ乗り込んでいったが、繁華街がある島の反対側に国際センターが位置し、車などの移動手段がない参加者にとって、「勉強
するには最適な場所」であった。ちなみに、会場付近では動物園以外ではじめて「野キジ」を目撃した。参加者は日中韓から1
0名ずつ選ばれた人と、韓国の有志の学生の合計40名弱の人たちが集まって、とても「熱い」講師による「熱い」2日半の集中
講義が行われた。
会場の済州大学の国際センター。外観だけでなく、
内装もすごくきれいな建物であった
この講習会については、前回韓国で行われた第4回目から知ってはいたし興味は持っていたが、なかなか参加するにはい
たっていなかった。しかし現在行なっているプロジェクト以外のことでバイオインフォマティクスの基礎知識を学び、自分が関
わっているプロジェクトを将来的に幅を持たせるために応募した。
バイオインフォマティクスと一口に言っても、進化を始め、タンパクの立体構造の予測、プロテオソームなどのオーミックス研究
も含まれる大変幅広い分野である。また、分野の幅が広いだけでなく、各論一つ一つがとても興味深く、また奥の深い分野で
もある。その各論を網羅的に勉強することは、研究しながらでは、時間的制約からどうしても自分の知っている分野もしくは、
やりたい分野だけに偏ってしまう場合が多くなってしまう。結果として、現在行なっている仕事での問題が、他分野でのアプ
ローチで解決する可能性はあるかもしれないが、分野の幅が広いため、結局わからずじまいになってしまっているのが現状と
してある。
この講習会では、幅広いバイオインフォマティクスの各分野を専門講師によって学ぶことができる。具体的には、バイオイン
フォマティクスの基礎(Dr.館野@遺伝研)から始まり、蛋白質の構造解析(Dr. Standley@PDBj)、Mass Spectrometryの基本的
解析(Dr. Xie@Shanghai Center for Bioinfomation Technology)、マイクロアレイの解析(Dr. Liu@ Shanghai Center for
Bioinfomation Technology)、分子進化(Dr. Zhong@Fudan Univ)、 Interactomics(Bhak@Korean BioInformation Center)、ゲノム
アノテーション(Dr. Kim@ Korean BioInformation Center)、オーミックス・データマイニング(Dr. Kim@Soongsil Univ)、ゲノムの
進化(Dr. 五条堀@遺伝研)、ゲノムの進化の実例(Dr.斎藤@遺伝研)の以上10講座である。現在行なっている仕事(ゲノムの
配列解析)の延長線上では、蛋白質構造やゲノムアノテーション、Interactomics、マイクロアレイの解析、オーミックス・データ
マイニングなどが必要な分野であると考えているが、個人一人で行う勉強量としては、まだまだ専門知識の不足は否めない。
しかし、今回の講習会では、それらの専門分野の講師から一同に学べたことには、たいへん有意義な集中講義であった。ま
た、分子進化を含む進化についての講義も、配列解析をしたあとで、特徴ある配列を分類するときに使えそうなアイデアがあ
ることに気がつき、大変役に立った。
授業風景。
PCは一人一台ずつ貸していただけるので、
講義で紹介されているプログラムを実際に
昼食時間の様子
動かして講義を受けながら進める。
しかし、この講習会では2日半で10科目(合計20時間)の講習があることため、「ちょっとバイオインフォマティクスを学びたい
な」という人には厳しい内容になっているかもしれない。この講習会は、バイオインフォマティクスのひとつの分野で研究に従
事している人が、他の分野に手を伸ばすときの手助け、または他分野でのアプローチの方法を軽く学ぶのには、ちょうどよい
内容の集中講義になっていると思った。実際、今回の各国の参加者の多くは、多かれ少なかれバイオインフォマティクスの関
連分野を研究している学生・ポスドクが多かったように思えた。
また、短い休み時間にできないような仕事の話でも、同年代や関連した仕事を行っているの人達が集まっているので、夕食後
に会場のロビーで、ざっくばらんに他の参加者との話しをすることができた。たまたま、自分の仕事に関連した仕事を、植物を
使って実験を行っている参加者と話すことができたし、さらにそこに同じような問題を理論的にアプローチをしている人もい
た。同じような問題に対しても、異なった研究バックグランドを持つ人達の三者三様の考え方・アプローチの仕方があったし、
改善すべき点もそれぞれに存在していたので、かなり熱い議論を夜中まですることができた。彼らの仕事も他の参加者が行っ
ている仕事も、とても興味深いものがあり、自分の仕事を進める上でも、参考になる手法(情報)も得ることができたし、何より
も非常にいい刺激になった。自分が行ないたい(知りたい)分野の研究を行っている人達が参加している可能性が多いため、
他の参加者達と積極的に会話をし、必要な情報をこの講習会で吸収するにはまたとない機会となった。
講習会開始前の参加者による集合写真。
あれ?ビンを頭にのせている人もいるゾ。
さらに、この講習会を経て得たものがある。韓国には、学校間を超えて、学生主導で勉強会等を開いているバイオインフォマ
ティクス学生会があり、その会長がこの講習会に参加していて話す機会があった。ビールを片手に話をするが、よくよく考えて
みると、学生(若手研究生)主体で日本にも学校間を超え1つの分野の勉強会が行われていないのが現状である。そこで、こ
の機会をいい期に、韓国のバイオインフォマティクス学生会みたいに、現在日本でも学校間を越えての勉強会を計画・進行中
である。このようなきっかけがあることも、国を超えてお互いに刺激しあえるこの講習会の醍醐味でもあると思える。
今回の講習会への参加では、主催者側の配慮により、講習会前日と講習会後の半日は自由時間を持つことができたので、済
州島を十分に満喫することができた。講習会前日には、遺伝研からともに参加した3人で、世界遺産である城山日出峰の頂上
から日の出をみた。
城山日出峰の頂上から見た日の出。世界遺産からの日の出
には感動したが、約1時間極寒の中で待ったので、3人
の表情に疲労感がただよう。
また、講習会後の自由時間には、現地で知り合った参加者(合計4名)で、済州大学の国際センター付近の観光スポットを楽し
く回ることができた。最後ではあるが、このような講習会への参加の機会を与えていただき、また執筆の機会まで与えてくれた
DDBJスタッフにも厚くお礼を申し上げたい。
「お茶博物館」入り口でガイドさんに説明を聞く3人。3本の棒は、
漢拏山(済州島で一番高く、世界遺産登録された山)を背景に
済州島では玄関門の意味である。済州島が火山島なので、
写る4人。バイオインフォマティクス学生会は、このメンバー
いたるところに石があるので、それを積み上げただけのものが、
を中心に、計画・進行中である。
木の下に積みあがっている石である。ガイドさん曰く、特に
意味がないようだ。
[email protected]
この DDBJ メールマガジンは国立遺伝学研究所内の方と,所外の希望者に配信しています。 配信希望・変更・不要の方は,画面右
上の「申込み・変更」ページをご利用になるか,次のメールアドレスまでご連絡下さい: [email protected]
発行:日本 DNA データバンク (DDBJ)
大学共同利用機関法人 情報・システム研究機構
国立遺伝学研究所 生命情報・ DDBJ 研究センター
〒411-8540 静岡県三島市谷田1111
▲このページの先頭へ
サイトマップ │サイトポリシー │当サイトのご利用にあたって │個人情報の取扱いについて
CopyrightcDNA Data Bank of Japan. All Rights Reserved.
Last modified:
Fly UP