...

116 - 日本惑星科学会

by user

on
Category: Documents
17

views

Report

Comments

Transcript

116 - 日本惑星科学会
116
日本惑星科学会誌 Vol. 23, No. 2, 2014
惑星探査データの保存と公開
~ PDS4の紹介~
山本 幸生
1
1.はじめに
カイブとサービスを提供している.
室内実験と比較して,惑星探査による「その場観測」
3.PDSの意味
は金銭的コストが高く,その結果データを得る機会は
制限され,同種のデータを取得することが容易でない.
PDS という言葉は場面によって異なる意味で使用
科学における客観性と再現性という意味において,こ
さ れ る.
「PDS に 問 い 合 わ せ る 」と い う 使 い 方 は,
の容易に取得することのできないデータを第三者が利
NASA の 一 部 門 と し て の PDS 部 門 や PDS Nodes の
用できるように整備することは,惑星探査の科学的価
個々のノードを意味している.また「PDS からデータ
値を維持する上でも重要な作業であると言える.
を公開する」では,PDS 部門や PDS Nodes が個々に管
こと惑星探査においては,データを保存するための
理しているウェブサイトのことを意味する.本稿で紹
仕組みとして,NASA が開発している Planetary Data
介する「PDS でデータをアーカイブする」という文脈
System(PDS)と呼ばれるシステムが事実上の標準
(de
における PDS の使い方は,
「データアーカイブの技術
facto standard)として利用されている [1].De facto と
的な仕組み」のことを指すが,難解なことに,この表
して採用されている理由は単純で,NASA が最も多
現はしばしば混乱の元となる.それは「何をどこまで
くの惑星探査機を打ち上げ,最も多くの惑星探査デー
行ったら PDS でデータをアーカイブしたことになる
タをアーカイブしているからに他ならない.本稿では
のか」という点を明確に示していないため,受取手に
惑星探査データの特徴に触れながら,この PDS の最
よっては異なった対応を想像するからである.
新状況について紹介する.
2.惑星探査データの特徴とPDS
Nodes
4.PDSの対応レベル
曖昧さを減らすために,PDS の対応レベルとして 4
一重に惑星探査データと言っても単純ではない.惑
段階を定義する.
星探査機には様々な学術分野の観測機器が搭載されて
(1)
PDS に従ったフォーマット・ディレクトリ構造
おり,各々の学術分野には歴史ある「しきたり」が存
でファイル群を保存する
在する.研究者にとって「しきたり」に従った方法で
(2)
PDS が求めるドキュメント整備を行う
データがアーカイブされていることは,データを扱っ
(3)
PDS のピアレビュー
(査読)
に合格する
た研究を始める上での敷居を下げることになる.PDS
(4)
PDS のウェブサイトからデータを公開する
では分野横断的なデータアーカイブを実現するために, (1)
と
(2)
は技術的・人的リソースを含んだコストの問
PDS Nodes と呼ばれる学術分野や技術分野のまとま
題であり,
(3)
と
(4)
宇宙機関をまたぐ政治的な問題と
りを切り口とした拠点を設け,そこからデータのアー
言 え る.ESA で は
(1)と
(2)の み 対 応 し た Planetary
1.宇宙航空研究開発機構 宇宙科学研究所
[email protected]
■2014遊星人Vol23-2.indd
116
Sciecne Archive
(PSA)を開発し,ピアレビューやデ
ータの公開は独自に行っている.JAXA も基本 ESA
2014/06/12
8:48:19
惑星探査データの保存と公開 ~ PDS4の紹介~/山本
117
と同じ方針としているが,プロジェクトによっては
自の記述形式を用いる.特に PDS ラベルとデータ部
PDS からデータを公開することもある.
分を 1 つのファイルに合わせ込む Detached 形式は,
5.PDSウェブサイトから公開するこ
との課題
他のファイルフォーマットを強く意識していることが
感じられる.
PDS4 では,メタ情報部分は XML という汎用な記
技術的な話に入る前に,ここで PDS のウェブサイ
述方式に置き換わり,設計には XML スキーマ
(拡張子.
トから公開することの課題を述べておく.PDS のウ
xsd)を利用し,スキマトロン
(拡張子.sch)を使って
ェブサイトには,世界中の惑星探査データをアクセス
検証ルールを作成する方式へと変更された.この一般
する人が集まるため,データを本当に利用してもらい
的な技術の導入により,周辺システムとの親和性が向
たいと望むのであれば,PDS のウェブサイトからデ
上し,また関連技術を有する技術者の調達が容易とな
ー タ を 公 開 す る 意 義 は 大 き い. で は な ぜ JAXA は
った.しかしながら,惑星科学を主たる専門とする研
PDS からデータを公開することを躊躇するのか.そ
究者が,PDS4 に準拠したデータアーカイブを自力で
れは主導権と知的財産権に関係しており,そのことに
行うのは,もはや非現実的な段階へと差し掛かった可
ついて JAXA 内で十分な議論がなされていないため
能性がある.
である.
PDS4 のデータ部分は,4 つの基本的なクラスへと
PDS のウェブサイトからデータを公開するために
再整理された.配列型
(Array)
,テーブル型
(Table_
は,論文と同様に「ピア・レビュー」と呼ばれる査読
Base)
,構文解析可能なバイト列
(Parsable_Byte_
プロセスを通さなければならない.このことはすなわ
Stream)
,符号化バイト列
(Encoded_Byte_Stream)で
ち,日本のデータで日本が公開したいと希望するのに,
ある.この再整理により,既存フォーマットとの対応
PDS に投稿し PDS のウェブサイトから公開する以上,
がより明確になった.例えばシンプルな FITS フォー
査読結果によってはリジェクトされ,データの主導権
マット
(Binary Table Extension を 利 用 し て い な い
が NASA に握られてしまう可能性がある.
FITS)の画像データは PDS4 の Array と互換性がある.
また PDS のウェブサイトからデータを公開すると,
固定長の ASCII で書かれたテーブルは Table_Base と
特殊な場合を除き,それらのデータはパブリックドメ
し て,HTML,XML,CSV な ど は Parsable_Byte_
イン扱いにされてしまう.パブリックドメインとは,
Stream,JPEG,PNG,PDF は Encoded_Byte_
知的財産権がないことを意味しており,商用利用や改
Stream といった具合である.
変に関する権利を放棄することになるため,今のとこ
したがって既存のフォーマットを流用すれば,デー
ろ JAXA の方針と相容れるものではない.
タ部分の準備は,比較的少ない手間で PDS4 に対応す
ることが可能である.しかしながら,PDS4 のデータ
6.PDS4概要
部分は Encoded_Byte_Stream を用いるべきでないと
いうポリシーがある [4].これは JPEG や PNG による
PDS の開発は 1990 年の PDS1 からスタートした.現
データの公開は PDS として認めないことを案に表明
在は 2010 年に公開され今もなお開発の続いている
しているが,その一方で同様に複雑なデータ構造を持
PDS4 が最新版である.PDS4 は IT 分野の発展を十分
つ Common Data Format
(CDF)も除外されてしまう
に取り入れた設計が行われている.メタデータ記法,
など,課題点は残っている.
データ型の再定義,用語の再整理が行われ,これまで
の PDS3 とは大きく変わっている.
7.PDS4によるアーカイブ例
PDS3 は,敢えて言うならば,天文分野で良く使わ
れる FITS 形式 [2] に似通っている.観測年月日や観測
PDS4 に は 論 理 的 な 概 念 と し て Bundle-Collection-
領域などのメタ情報部分は,FITS ヘッダーの代わり
Product の層構造がある.これはファイルシステムを
に PDS ラベルと呼ばれるテキストファイルを利用し,
考えると比較的容易に理解可能である [3].Bundle は
そこに Object Description Language(ODL)という独
トップディレクトリ,Collection はその下に作られる
■2014遊星人Vol23-2.indd
117
2014/06/12
8:48:19
118
日本惑星科学会誌 Vol. 23, No. 2, 2014
!
"
!###$%
&
"
!
!'"
!
!'"
!
!
!
!"#$
!%
()*+
図1:PDS4のディレクトリ構造例.黒字(太字)は観測機器チームで用意.赤字はPDS4のウェブサイトからダウンロー
ドするファイル.
ディレクトリ(browse, context, data, document, xml_
体以外の部分で用意すべきファイルが多いことが分か
schema, etc.),また Product は各種 Collection ディレ
る.これこそが PDS4 でデータを整備することの,す
クトリに含まれるファイルに相当する.
なわち長期的なアーカイブをめざした場合に必要な手
図 1 に「 は や ぶ さ 2」の カ メ ラ(ONC)を 想 定 し た
間なのである.
PDS4 の デ ィ レ ク ト リ 構 造 例 を 示 す. こ の 例 で は
HAY2_ONC と 言 う Bundle 名 称 に,context,data,
8.おわりに
document,xml_schema の各 Collection が用意されて
いる.プロジェクト用意すべきファイル,観測機器チ
NASA は 2011 年 11 月以降打ち上げの全ミッション
ームが用意すべきファイルが黒字で示されている.こ
に対して PDS4 を適用することを決めた.また惑星探
の例における実際のデータ本体は,FITS 形式の abc.
査データの標準化に対して意見の言える国際惑星デー
fit と,そのメタ情報を含む abc. xml である.データ本
タ連合
(International Planetary Data Alliance; IPDA)
■2014遊星人Vol23-2.indd
118
2014/06/12
8:48:20
惑星探査データの保存と公開 ~ PDS4の紹介~/山本
119
[4] は,PDS4 を惑星探査データアーカイブの標準とし
て推奨した.このことは即ち,PDS3 に関する NASA
のサポートは絶望的であり,一方で PDS4 を使用する
のであれば全面的な協力が得られる状況にある.日本
は継続中のミッション(あかつき)では PDS3 を採用し,
今 後 打 ち 上 げ ら れ る ミ ッ シ ョ ン(は や ぶ さ 2,
BepiColombo)については PDS4 を採用する予定であ
る.そのため一刻も早く PDS4 を構築する体制を作ら
なければならない.
参考文献
[1] The Planetary Data System, http://pds.nasa.gov/.
[2] Wells, D.C. et al., 1981, Astron. Astrophys. Suppl. 44,
363-370.
[3] PDS4 Concepts Version 1.0.0, http://pds.nasa.gov/
pds4/doc/concepts/Concepts_130507_v1.pdf.
[4] Data Provider’s Handbook, http://pds.nasa.gov/pds4/
doc/dph/current/PDS4_DataProvidersHandbook_
20130507.pdf.
[5] International Planetary Data Alliance, http://
planetarydata.org.
■2014遊星人Vol23-2.indd
119
2014/06/12
8:48:20
Fly UP