VizieR の仕組み、VizieR の思想
2000年 3月 21日
# 以下の報告は、A&A (2000) に掲載予定の、
"The VizieR database of Astronomical Catalogues"
F.Ochsenbein, P.Bauer, & J.Marcout
に基づき、中嶋がまとめたものである。
VizieR の登場とその背景
多くの天文カタログを集め、整備して machine readable の形で保存し、
必要に応じてユーザーに提供するサービスが、CDS を中心として始まってから、
ほぼ30年になる。集められ整備されたカタログの数は、1999年10月現在で約1000件、
これに2000件余りの machine readable 化された Journal tables が加わる。
数がこれほど多くなると、ユーザーが、適切なカタログを選びまたその中から正しく
データを取り出すことが困難になってくる。また最近では、USNO-A2.0 のような
巨大なカタログ(約5億天体)も出てきて、これに拍車をかけている。近く公開される
予定の GSC-II は、18等級以上の天体を約20億個含む、ということである。
そこでこれらのカタログデータを web 上で容易に利用できる tool が必要である
と言うことで、VizieR が開発された。実用化されたのは1996年2月であり、また
1997年5月には Hipparcos カタログの公開に合わせて大きな改定が行われた。同様な
意図で、CDS では、カタログデータを星野写真上にプロットする tool で "ALADIN"
と呼ばれるものを開発している。
蓄積された天文データは、有効に利用されてこそ意味がある。CDS がこれらの tool
を開発している背景には、このような考え方があると思われる。
VizieR の仕組み
CDS と、NASA GSFC の ADC が中心になり、我々 ADAC などがミラーリングを
行っている anonymous ftp カタログサービスでは、各カタログに、"ReadMe"
という詳細な説明ファイルが付けられている。これは、そのカタログについての
ユーザー向けの一般的な説明と共に、カタログデータの内容や format、データの
単位や範囲などが厳密な形式で記載されている。
この ReadMe ファイルを適当なプログラムで処理することにより、コンピュータは
カタログデータについて「理解」することが可能になり、ユーザーのいろいろな
具体的な要求に正しく応えてデータを抜き出してくることができる。VizieR は
このような方法で、ユーザーの求めに応じてカタログのデータを検索する。
ReadMe ファイルによって、カタログは、machine readable から "machine
understandable" になる、というわけである。このために、ReadMe ファイルの
標準化の作業に、かなりの時間がついやされた。
ReadMe ファイルが完備され、カタログデータがそれに従って正しく配列された
状態で、カタログが anonymous ftp サービスに登録されると(これを "integrate
する" と称する)、これは半ば自動的に VizieR サービスに組み込まれる。
組み込まれると、カタログの性格や、その中のいろいろな表の種類、表の中の
カラムの内容などが、"META dictionary" のいろいろな分類の中に書き込まれる。
またカタログデータ本体は、ReadMe の format に従って RDBMS (現状では Sybase)
のファイル
として組み込まれる。しかし、データが1千万行を越えるような巨大カタログ
(mega-catalogue) では RDBMS の効率が悪くなるので、これらについては、
データの分割とそれに対応する特別の検索ソフトを用いることになっている。
このような方法で処理されるカタログとしては、次のようなものがある。
- USNO-A1.0 488 万行
- USNO-A2.0 526
- GSC1.1 25
- GSC1.2 25
- GSC-ACT 25
- 2MASS 20
- DENIS 17.5
以上の他に、一つの与えられた天域についてすべてのカタログから関連データ
を検索する、という目的の特別な分類法とソフトが開発されている。
また、検索する際の user interface は、"ASU" (Astronomical Standardized URL)
を用いる。また "XML" の利用も検討されている。
質問などは MAIL:
中嶋@一橋大学へ。