Comments
Description
Transcript
116 - 日本惑星科学会
116 日本惑星科学会誌 Vol. 23, No. 2, 2014 惑星探査データの保存と公開 ~ PDS4の紹介~ 山本 幸生 1 1.はじめに カイブとサービスを提供している. 室内実験と比較して,惑星探査による「その場観測」 3.PDSの意味 は金銭的コストが高く,その結果データを得る機会は 制限され,同種のデータを取得することが容易でない. PDS という言葉は場面によって異なる意味で使用 科学における客観性と再現性という意味において,こ さ れ る. 「PDS に 問 い 合 わ せ る 」と い う 使 い 方 は, の容易に取得することのできないデータを第三者が利 NASA の 一 部 門 と し て の PDS 部 門 や PDS Nodes の 用できるように整備することは,惑星探査の科学的価 個々のノードを意味している.また「PDS からデータ 値を維持する上でも重要な作業であると言える. を公開する」では,PDS 部門や PDS Nodes が個々に管 こと惑星探査においては,データを保存するための 理しているウェブサイトのことを意味する.本稿で紹 仕組みとして,NASA が開発している Planetary Data 介する「PDS でデータをアーカイブする」という文脈 System(PDS)と呼ばれるシステムが事実上の標準 (de における PDS の使い方は, 「データアーカイブの技術 facto standard)として利用されている [1].De facto と 的な仕組み」のことを指すが,難解なことに,この表 して採用されている理由は単純で,NASA が最も多 現はしばしば混乱の元となる.それは「何をどこまで くの惑星探査機を打ち上げ,最も多くの惑星探査デー 行ったら PDS でデータをアーカイブしたことになる タをアーカイブしているからに他ならない.本稿では のか」という点を明確に示していないため,受取手に 惑星探査データの特徴に触れながら,この PDS の最 よっては異なった対応を想像するからである. 新状況について紹介する. 2.惑星探査データの特徴とPDS Nodes 4.PDSの対応レベル 曖昧さを減らすために,PDS の対応レベルとして 4 一重に惑星探査データと言っても単純ではない.惑 段階を定義する. 星探査機には様々な学術分野の観測機器が搭載されて (1) PDS に従ったフォーマット・ディレクトリ構造 おり,各々の学術分野には歴史ある「しきたり」が存 でファイル群を保存する 在する.研究者にとって「しきたり」に従った方法で (2) PDS が求めるドキュメント整備を行う データがアーカイブされていることは,データを扱っ (3) PDS のピアレビュー (査読) に合格する た研究を始める上での敷居を下げることになる.PDS (4) PDS のウェブサイトからデータを公開する では分野横断的なデータアーカイブを実現するために, (1) と (2) は技術的・人的リソースを含んだコストの問 PDS Nodes と呼ばれる学術分野や技術分野のまとま 題であり, (3) と (4) 宇宙機関をまたぐ政治的な問題と りを切り口とした拠点を設け,そこからデータのアー 言 え る.ESA で は (1)と (2)の み 対 応 し た Planetary 1.宇宙航空研究開発機構 宇宙科学研究所 [email protected] ■2014遊星人Vol23-2.indd 116 Sciecne Archive (PSA)を開発し,ピアレビューやデ ータの公開は独自に行っている.JAXA も基本 ESA 2014/06/12 8:48:19 惑星探査データの保存と公開 ~ PDS4の紹介~/山本 117 と同じ方針としているが,プロジェクトによっては 自の記述形式を用いる.特に PDS ラベルとデータ部 PDS からデータを公開することもある. 分を 1 つのファイルに合わせ込む Detached 形式は, 5.PDSウェブサイトから公開するこ との課題 他のファイルフォーマットを強く意識していることが 感じられる. PDS4 では,メタ情報部分は XML という汎用な記 技術的な話に入る前に,ここで PDS のウェブサイ 述方式に置き換わり,設計には XML スキーマ (拡張子. トから公開することの課題を述べておく.PDS のウ xsd)を利用し,スキマトロン (拡張子.sch)を使って ェブサイトには,世界中の惑星探査データをアクセス 検証ルールを作成する方式へと変更された.この一般 する人が集まるため,データを本当に利用してもらい 的な技術の導入により,周辺システムとの親和性が向 たいと望むのであれば,PDS のウェブサイトからデ 上し,また関連技術を有する技術者の調達が容易とな ー タ を 公 開 す る 意 義 は 大 き い. で は な ぜ JAXA は った.しかしながら,惑星科学を主たる専門とする研 PDS からデータを公開することを躊躇するのか.そ 究者が,PDS4 に準拠したデータアーカイブを自力で れは主導権と知的財産権に関係しており,そのことに 行うのは,もはや非現実的な段階へと差し掛かった可 ついて JAXA 内で十分な議論がなされていないため 能性がある. である. PDS4 のデータ部分は,4 つの基本的なクラスへと PDS のウェブサイトからデータを公開するために 再整理された.配列型 (Array) ,テーブル型 (Table_ は,論文と同様に「ピア・レビュー」と呼ばれる査読 Base) ,構文解析可能なバイト列 (Parsable_Byte_ プロセスを通さなければならない.このことはすなわ Stream) ,符号化バイト列 (Encoded_Byte_Stream)で ち,日本のデータで日本が公開したいと希望するのに, ある.この再整理により,既存フォーマットとの対応 PDS に投稿し PDS のウェブサイトから公開する以上, がより明確になった.例えばシンプルな FITS フォー 査読結果によってはリジェクトされ,データの主導権 マット (Binary Table Extension を 利 用 し て い な い が NASA に握られてしまう可能性がある. FITS)の画像データは PDS4 の Array と互換性がある. また PDS のウェブサイトからデータを公開すると, 固定長の ASCII で書かれたテーブルは Table_Base と 特殊な場合を除き,それらのデータはパブリックドメ し て,HTML,XML,CSV な ど は Parsable_Byte_ イン扱いにされてしまう.パブリックドメインとは, Stream,JPEG,PNG,PDF は Encoded_Byte_ 知的財産権がないことを意味しており,商用利用や改 Stream といった具合である. 変に関する権利を放棄することになるため,今のとこ したがって既存のフォーマットを流用すれば,デー ろ JAXA の方針と相容れるものではない. タ部分の準備は,比較的少ない手間で PDS4 に対応す ることが可能である.しかしながら,PDS4 のデータ 6.PDS4概要 部分は Encoded_Byte_Stream を用いるべきでないと いうポリシーがある [4].これは JPEG や PNG による PDS の開発は 1990 年の PDS1 からスタートした.現 データの公開は PDS として認めないことを案に表明 在は 2010 年に公開され今もなお開発の続いている しているが,その一方で同様に複雑なデータ構造を持 PDS4 が最新版である.PDS4 は IT 分野の発展を十分 つ Common Data Format (CDF)も除外されてしまう に取り入れた設計が行われている.メタデータ記法, など,課題点は残っている. データ型の再定義,用語の再整理が行われ,これまで の PDS3 とは大きく変わっている. 7.PDS4によるアーカイブ例 PDS3 は,敢えて言うならば,天文分野で良く使わ れる FITS 形式 [2] に似通っている.観測年月日や観測 PDS4 に は 論 理 的 な 概 念 と し て Bundle-Collection- 領域などのメタ情報部分は,FITS ヘッダーの代わり Product の層構造がある.これはファイルシステムを に PDS ラベルと呼ばれるテキストファイルを利用し, 考えると比較的容易に理解可能である [3].Bundle は そこに Object Description Language(ODL)という独 トップディレクトリ,Collection はその下に作られる ■2014遊星人Vol23-2.indd 117 2014/06/12 8:48:19 118 日本惑星科学会誌 Vol. 23, No. 2, 2014 ! " !###$% & " ! !'" ! !'" ! ! ! !"#$ !% ()*+ 図1:PDS4のディレクトリ構造例.黒字(太字)は観測機器チームで用意.赤字はPDS4のウェブサイトからダウンロー ドするファイル. ディレクトリ(browse, context, data, document, xml_ 体以外の部分で用意すべきファイルが多いことが分か schema, etc.),また Product は各種 Collection ディレ る.これこそが PDS4 でデータを整備することの,す クトリに含まれるファイルに相当する. なわち長期的なアーカイブをめざした場合に必要な手 図 1 に「 は や ぶ さ 2」の カ メ ラ(ONC)を 想 定 し た 間なのである. PDS4 の デ ィ レ ク ト リ 構 造 例 を 示 す. こ の 例 で は HAY2_ONC と 言 う Bundle 名 称 に,context,data, 8.おわりに document,xml_schema の各 Collection が用意されて いる.プロジェクト用意すべきファイル,観測機器チ NASA は 2011 年 11 月以降打ち上げの全ミッション ームが用意すべきファイルが黒字で示されている.こ に対して PDS4 を適用することを決めた.また惑星探 の例における実際のデータ本体は,FITS 形式の abc. 査データの標準化に対して意見の言える国際惑星デー fit と,そのメタ情報を含む abc. xml である.データ本 タ連合 (International Planetary Data Alliance; IPDA) ■2014遊星人Vol23-2.indd 118 2014/06/12 8:48:20 惑星探査データの保存と公開 ~ PDS4の紹介~/山本 119 [4] は,PDS4 を惑星探査データアーカイブの標準とし て推奨した.このことは即ち,PDS3 に関する NASA のサポートは絶望的であり,一方で PDS4 を使用する のであれば全面的な協力が得られる状況にある.日本 は継続中のミッション(あかつき)では PDS3 を採用し, 今 後 打 ち 上 げ ら れ る ミ ッ シ ョ ン(は や ぶ さ 2, BepiColombo)については PDS4 を採用する予定であ る.そのため一刻も早く PDS4 を構築する体制を作ら なければならない. 参考文献 [1] The Planetary Data System, http://pds.nasa.gov/. [2] Wells, D.C. et al., 1981, Astron. Astrophys. Suppl. 44, 363-370. [3] PDS4 Concepts Version 1.0.0, http://pds.nasa.gov/ pds4/doc/concepts/Concepts_130507_v1.pdf. [4] Data Provider’s Handbook, http://pds.nasa.gov/pds4/ doc/dph/current/PDS4_DataProvidersHandbook_ 20130507.pdf. [5] International Planetary Data Alliance, http:// planetarydata.org. ■2014遊星人Vol23-2.indd 119 2014/06/12 8:48:20