VizieR の仕組み、VizieR の思想

　　　　　　2000年 3月 21日

＃以下の報告は、A&A (2000) に掲載予定の、
　　"The VizieR database of Astronomical Catalogues" 　F.Ochsenbein, P.Bauer, & J.Marcout
　に基づき、中嶋がまとめたものである。

VizieR の登場とその背景

多くの天文カタログを集め、整備して machine readable の形で保存し、必要に応じてユーザーに提供するサービスが、CDS を中心として始まってから、ほぼ30年になる。集められ整備されたカタログの数は、1999年10月現在で約1000件、これに2000件余りの machine readable 化された Journal tables が加わる。

数がこれほど多くなると、ユーザーが、適切なカタログを選びまたその中から正しくデータを取り出すことが困難になってくる。また最近では、USNO-A2.0 のような巨大なカタログ(約5億天体)も出てきて、これに拍車をかけている。近く公開される予定の GSC-II は、18等級以上の天体を約20億個含む、ということである。

そこでこれらのカタログデータを web 上で容易に利用できる tool が必要であると言うことで、VizieR が開発された。実用化されたのは1996年2月であり、また 1997年5月には Hipparcos カタログの公開に合わせて大きな改定が行われた。同様な意図で、CDS では、カタログデータを星野写真上にプロットする tool で "ALADIN" と呼ばれるものを開発している。

蓄積された天文データは、有効に利用されてこそ意味がある。CDS がこれらの tool を開発している背景には、このような考え方があると思われる。

VizieR の仕組み

CDS と、NASA GSFC の ADC が中心になり、我々 ADAC などがミラーリングを行っている anonymous ftp カタログサービスでは、各カタログに、"ReadMe" という詳細な説明ファイルが付けられている。これは、そのカタログについてのユーザー向けの一般的な説明と共に、カタログデータの内容や format、データの単位や範囲などが厳密な形式で記載されている。

この ReadMe ファイルを適当なプログラムで処理することにより、コンピュータはカタログデータについて「理解」することが可能になり、ユーザーのいろいろな具体的な要求に正しく応えてデータを抜き出してくることができる。VizieR はこのような方法で、ユーザーの求めに応じてカタログのデータを検索する。

ReadMe ファイルによって、カタログは、machine readable から "machine understandable" になる、というわけである。このために、ReadMe ファイルの標準化の作業に、かなりの時間がついやされた。

ReadMe ファイルが完備され、カタログデータがそれに従って正しく配列された状態で、カタログが anonymous ftp サービスに登録されると(これを "integrate する" と称する)、これは半ば自動的に VizieR サービスに組み込まれる。

組み込まれると、カタログの性格や、その中のいろいろな表の種類、表の中のカラムの内容などが、"META dictionary" のいろいろな分類の中に書き込まれる。またカタログデータ本体は、ReadMe の format に従って RDBMS (現状では Sybase) のファイルとして組み込まれる。しかし、データが１千万行を越えるような巨大カタログ (mega-catalogue) では RDBMS の効率が悪くなるので、これらについては、データの分割とそれに対応する特別の検索ソフトを用いることになっている。

このような方法で処理されるカタログとしては、次のようなものがある。

USNO-A1.0　488 万行
USNO-A2.0　526
GSC1.1　　　　25
GSC1.2　　　　25
GSC-ACT　　　25
2MASS　　　　20
DENIS　　　　17.5

以上の他に、一つの与えられた天域についてすべてのカタログから関連データを検索する、という目的の特別な分類法とソフトが開発されている。

また、検索する際の user interface は、"ASU" (Astronomical Standardized URL) を用いる。また "XML" の利用も検討されている。
　　　　　　　

質問などは MAIL: 中嶋＠一橋大学へ。