本文へスキップします。

H1

ユサコニュース詳細

USACO News:詳細

2005/09/30:第156号XMLゲートウェイを用いたメタサーチ標準化の動向
 

XMLゲートウェイを用いたメタサーチ標準化の動向
近年,異なる複数のデータベースリソースを単一のインターフェイスで一括検索する
メタサーチ(MetaSearch)を実現するための標準化手法として,「XMLゲートウェイ」と
呼ばれるサーバを介する仕組みが注目されている。

メタサーチを実現する従来の手法では,データベース側がZ39.50等の検索プロトコルに
準拠した検索クエリーに対応している場合にそれを利用する手法と,各コンテンツプロバイダ/
ベンダーが提供するWebインターフェイス(HTML)を独自に解析する手法の二通りが
主流となっている。後者は「スクリーン・スクレーピング」と呼ばれており,文字コードやセッションID等
の処理を個別に行う必要があることや,Webインターフェイスの変更に常に追随する必要があること,
出力データのフォーマットに必ずしも一貫性がないために解析結果を保証することが難しいこと等が
問題として指摘されている。また,Z39.50の実装にはサーバ/クライアント(この場合はメタサーチを
行うシステム)ともにコストと効果の問題があり,国内での普及が進んでいないのが現状である。

一方,XMLゲートウェイを用いた検索では,SRW/SRU(※)という標準化されたインターフェイスを
介して,データベースに対する検索処理が行われる。出力は,Dublin Core(ダブリン・コア)や
MARCXML等に準拠したXML形式で得られるため,その加工や処理はスクリーン・スクレーピング
に比べて極めて容易であり,解析結果の信頼性も高い。
また,Z39.50に比べて実装が容易であるという利点がある。すでにSRW/SRUに関しては,
米国議会図書館のZ39.50 International: Next Generation(ZING)において仕様が策定されており,
現在これらを元にNISO Metadata Initiative(NISO-MI)において国際規格化の準備が進められている。

(※)
・SRW: Search and Retrieve Web service
・SRU: Search and Retrieve URL Service

海外では,すでにPubMedやJSTOR,Thomson Scientificといった著名なコンテンツプロバイダが
XMLゲートウェイを提供しており,コンテンツプロバイダ側のメタサーチに対する意識も変化してきている。
また,Ex Libris社では,同社の提供するメタサーチエンジン「MetaLib」において,MetaLib自身を
XMLゲートウェイ化することにより,機関独自の検索ポータルを作成することを可能とする「X-Server」
の開発を進めるなど,コンテンツプロバイダ/ベンダーともに活発な動きが見られる。

これに対し,国内の主要なデータベースベンダーでは,メタサーチのためにXMLゲートウェイを用意する
ケースはほとんどない。ユーザーに簡易かつ多様な検索方法を提供するための手法として,
メタサーチの重要性は今後もますます高まることが予想されるだけに,国内のコンテンツプロバイダ/
ベンダーもこのような標準化の動向に注目し,必要な検討を行うことが望まれる。


<参考資料>
・NISO Metadata Initiative (Wiki)
http://www.lib.ncsu.edu/niso-mi

・米国議会図書館:Z39.50 International: Next Generation
http://www.loc.gov/z3950/agency/zing/index.html

・JSTOR XML Gateway
http://www.jstor.org/about/xml_gateway.html

ユサコニュース一覧に戻る