情報知識学会ニューズレター > No.37 (1996.4.1) > 電子図書館の課題

電子図書館の課題

慶應義塾大学文学部 細野公男

1.はじめに

情報化社会および情報技術の時代を象徴することばとして、電子図書館がよく使用されている。しかしながらその概念は定着しておらず、定義も千差万別である。電子図書館はきわめて大きな市場となる可能性をはらんでおり、ビジネスチャンスとしての期待感もある。また、関連する分野・領域も広く、種々の取り組みが可能である。このような事情を考えれば、概念を明確にして定義を与えることはむずかしく、その必要性も希薄であるかのようにみえる。一方、電子図書館の本質や特徴を把握し、現在および今後の可能性や課題を明らかにするため には、その概念をはっきりさせる必要がある。

電子図書館が現在脚光を浴びるようになった理由の1つとして、イリノイ(アーバナシャンペーン校)、ミシガン、カリフォルニア(バークレー校、サンタバーバラ校)、スタンフォード、カーネギーメロンの6つの大学が、National Science Foundation、Advanced Research Projects Agency(国防省)、National Aeronautics and Space Administrationから合計2440万ドルの資金を得て、1994年から電子図書館プロジェクトに着手していることがあげられる(1),(2)。現在は4年間のプロジェクトの3年目に入っているが、当初考えられた薔薇色の未来はやや色あせつつある。これは、電子図書館を現実のものとするために解決せねばならない困難な問題が、明らかになってきたからである。

2.電子図書館の類型

電子図書館に係わる課題を明らかにするためには、まず電子図書館の類型をあげておく必要があろう。その類型は種々の角度からとらえることができるが、一例として以下の3つが考えられる。

  1. 電子化された情報を統合的に提供する図書館
  2. ネットワ−ク情報資源
  3. 仮想図書館

このうち2は従来の図書館がもつ情報提供機能と類似のものが、ネットワーク上で実現されているという意味での比喩的な図書館である。データベースサービス機関をはじめ同種のサービスを展開する機関は多い。それにもかかわらず図書館ということばが使用されているのは、米国や英国で図書館がいかに生活の中に浸透しているかを示している。3は我々の情報入手行動の多くが図書館に依存しているだけでなく、情報の入手が依然として冊子体資料に基づく行動の影響を受けていることを示している。電子図書館での情報検索において図書の厚みをメタファとして取り込む試みがなされているのも、従来の活字文化が電子化の時代でも無視できないことを示している。電子図書館の発展には、活字文化の歴史を十分踏まえて行わねばならない。なお、類型3は、情報の検索・入手のためのユーザインタフェースの問題と捉えることもできる。

いずれの類型でも電子図書館が適切に機能するかは、どのような情報をいかに蓄積するかにかかっている。図書館が図書館たるゆえんは、特定の利用者集団を想定したコレクションの構築にある。そのために収集すべき情報の選択が行われ、蓄積される情報の品質管理がなされている。換言すれば、現実にそうであるか否かは別にして、本質的には図書館に蓄積されている情報は、品質の保証された永続的な情報なのである。したがって、基本的にその品質が管理されておらず、また一過性であるインタ−ネットでの情報資源とは、異なった側面をもっている。

電子図書館に係わる問題は、1と2に関するものが多く、上述した6つの機関を中心に種々の試みがなされている(1),(2)。以下に展開するのは、電子図書館が効果的に機能するために解決せねばならない根元的な課題である。

3.規模の問題

比較的小規模でかつ限定された蓄積情報を対象にした研究成果が、大規模デ−タを収録対象とする実用の電子図書館環境にも同じように適用できるわけでは必ずしもない。蓄積情報の増大は、情報要求者が適合する情報源を特定することをさらに困難にするからである。求める情報を収録すると期待されるネットワ−ク上の情報源を検索する手段は提供されているが、文献、写真、音楽、動画など多様な蓄積情報の中から適切なものを効果的・効率的に探せるかどうかには、疑問がある。関連する問題として無益点の問題もある(3)。これは、大規模デ−タベ−スから検索者の情報要求に合致する情報を提供する現在の商用情報検索サ一ビスでは不可避な問題であり、そのサ一ビスの発展に大きな障害となっている。ブ−ル検索を基本とする現在の検索方法では検索結果が多量になりがちであり、検索者が適合性をチェックできる物理的・心理的限界(無益点)を越えることがしばしばある。そのため、検索者は無益点以内に出力結果を抑えようとして検索条件を厳しくするため、結果として再現率を低下させてしまうという事態が生じている。これは規模が異なれば情報の処理方法はまったく異なることを意味するが、電子図書館環境でも同様な事態が生じ得る。

現在、種々の検索エンジンが開発されているが、多様な多くの情報源の中から利用者にとって適切な情報が容易に得られるようになるには、まだ多くの月日が必要であろう。

4.著作権の問題

電子図書館環境では著作権もきわめて大きな問題である。とくに既存の冊子体資料の円滑な電子化は、著作権をどのように処理するかにかかっている。冊子体資料を主たる蓄積情報とする伝統的な図書館での著作権の問題は、『公正使用』との関連で捉えられることが多く、また有料か無料かの論議が中心であった。しかし、デジタル化された情報は、冊子体資料に比較して複製や改変が著しく容易なため、著作権に係わる問題はさらに複雑な様相を呈している。

一例として、B社がA社の映像を著作権処理して新たな製品を作成・販売する場合、A社製品の著作権がB社製品の使用時にどの程度保証されるかどうかがあげられる。B社製品の著作権の侵害は、A社製品の著作権の侵害にもなるからである。したがって、A者は自社の製品の使用に関してきわめて厳しい制限を課すことが考えられる。これは娯楽製品ではさら顕著になろう。

著作権は著作権者の保護をうたうものであるが、その適用が円滑な情報流通を阻害するものであってはならない。また、情報の生産者と流通者との間での著作権に対する意識には、差異がある。研究者は自分の論文が流通することには抵抗感がないため、著作権の取り扱いに関しては一般に寛容であるといえよう。一方、学術出版社は、営業上その製品の著作権に関して極めて厳しい立場をとるのが普通である。したがって、出版社と電子化に係わる契約を結ぶにあたって検討すべき事項は多い。

5.検索の問題

電子図書館機能がもつべき要件の1つとして、情報資源へのアクセスが伝統的な図書館に比較してはるかに多様・迅速・高度でなければならないことがあげられる。つまり、電子図書館では従来の手法・アプロ−チよりも高度で多様な検索手法・アプロ−チが実現されなければならない。たとえば、同じ検索式であっても、利用者の教育レベルや求める情報の種類が異なれば、異なった検索結果が得られるようなソフトウェアである。ミシガン大学ではこのようなソフトウェアの開発を行っている(2)。

また、イリノイ大学では利用者がどのような視点から情報を探すかの調査を行っているが(2)、これはより効果的な検索キーの設定に役立つといえよう。なお、この調査では図表や結論部に着目して文献を探す例が報告されている。これは主題を表すキーワードだけではなく、文献の構成部分も検索キーとして重要であることを示している。商用情報検索サービスの特定フイールド指定検索をさらに複雑にした検索方法の開発が必要であろう。

原資料の文字をOCRで読み取とる処理を経てデジタル化が行われる場合には、OCRの読み取り精度に問題があるため、記号・文字の文字化けが生じることは避けられない。デジタル化に伴うこのような変換誤りは、検索時に索引語の照合ミスをもたらし、検索性能に悪影響を及ぼすことになる。

既存の冊子体メディアをデジタル化して得られた電子化情報を検索対象とする場合、ブ−ル検索に基づく従来の方法ではこのような文字化けに対処することはできない。商用デ−タベ−ス検索サ一ビスでは、綴りの違いを部分一致(トランケ−ション)手法の使用によって処理しているが、電子図書館環境においては、変換誤りにも対処できるような、さらに高度な部分一致機能が必要である。

この課題を解決するためには、綴りがいかに異なっていても検索できる方法の開発が考えられる。近似照合(approximate matching)やファジ−照合(fuzzy matching)などの名称で呼ばれる照合原理に基づく検索方法はその一例である。

6.情報の電子化および変換

電子化する情報の選択方針の確立および電子化に伴う作業管理も重要である。構成、内容、タイプの全く異なる複数種類の情報を1つの電子図書館にどう融合させるか、メタデータをどのように構築するかを考える必要がある。さらに、電子図書館では既存の冊子体資料の変換が大きなプロジェクトを構成するが、変換作業の重複を避けるために国レベルあるいは国際レベルでの調整をはかることが望ましい。そのためには、電子化済み(変換済み)の情報を記録する総合目録の作成が必要となる。

7.その他

全体として1つの大きな図書館を考える集中型を志向するのか、複数の図書館が共存して相互に密接なつながりをもつ分散型を志向するのかも考えなければならない。DIALOGなどのような商用データベースサービスに比べると、ファイルの種類、収録メディアの形態(テキスト、動画)、情報の提供体制・方法などの多様化は著しい。分散化を志向するのであれば、電子図書館間の相互依存体制も検討する必要がある。

したがって、どちらが妥当であるかどうかは、運用体制、検索言語、検索方法(たとえばクロスファイル検索)、プロトコルの統一、標準化などの問題と密接に関連するといえよう。

8.おわりに

電子図書館に関して解決しなければならない問題には、技術的なものと非技術的なものとがあるが、とくに解決が困難なのは非技術的な問題であろう。情報は利用者が存在してこそ意味があることを考えれば、すべての試みは究極的には利用者ニーズと合致するものでなければならない。この点で図書館・情報学でこれまで論議されてきたことや培われた考え方・技術は、電子図書館の発展・普及に多くの示差を与えよう。

引用文献

最終更新日: 2018-04-27 (金) 11:32:09

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS