「情報と知識」についてさまざまな側面から考え、研究し、議論していく場である情報知識学会では、現在のコロナ禍の中で、地域や距離を超えて、多くの学会員、特に学生会員や若手の会員にとって新たな知見を得られ、会員間の交流を促進するオンラインセミナーとして企画されました。ぜひ、多くの学会員、特に学生会員、若手会員の皆様が積極的に参加されることを期待しております。情報知識学会を構成する多面的な領域の会員・専門家から、現在の「情報と知識」に関連する講演を企画してゆきます。ご期待下さい。
論文や書誌、研究データ等の学術情報は、Web経由で発見することが一般的 になりつつある。これらの情報はGoogleのような一般向けの検索エンジンで発 見することも可能だが、学問の分野では著者や発行元、発行時期、引用関係な どが検索結果一覧に出ていた方が便利である。このため、海外では様々な学術 情報検索に特化したインターフェースが構築されている。
国立情報学研究所では以前より論文や書誌情報を探索するサービス、CiNii (サイニィ)を提供し、研究者の情報収集や大学図書館における書誌情報サー ビスに寄与してきた。しかし近年、情報資源を利用した研究活動の変化に伴い、 実験結果や調査情報などの研究データや研究助成情報についても、合わせて検 索・発見することが期待されることとなった。
そこで国立情報学研究所では2021年4月より、CiNii Research(サイニィリ サーチ)と呼ばれる新しい検索サービスの提供を開始した。CiNii Researchが 他の学術情報検索サービスと違う部分は、内部で論文や書誌、研究データ、 そして研究助成情報の関係性を紐づけて、リッチな「関係性情報」を提供して いることである。
これは各エンティティ(データ一つ一つの実体)が有する「引用関係」や 「著作関係」、「成果物関係」を、内部でその指し示すデータに繋ぎ合わせ、 検索結果に表示させるというものである。この関係性を情報として付与し、 独自のアルゴリズムによる名寄せ統合やデータの重複削除を実施し、 CiNii Researchの内部には大規模な「知識ベース」が構築された。
超高速でワクチン開発やウイルス分析が進むCOVID-19の研究や、機械学習分 野のアルゴリズムの発展を見ると分かるように、これからの研究は迅速性と論 文や研究データの成果等の知識ベースを使った関係性を、ハイレベルなツール でキャッチできるスキルが必要となる。
本セミナーでは特に次世代の研究環境を担う学生や若手研究者に、この次世 代情報探索ツールとしてのCiNii Research構築の裏側と知識ベースの概要につ いて解説する。
講師:大澤 留次郎(情報コミュニケーション事業本部 事業創発本部 課長)
凸版印刷では、現代日本人には難読になってしまった「くずし字」に対してコンピュータの力を借りて解読する「くずし字OCR」技術の開発に取り組んている。発表では、くずし字OCR技術の現状と課題について報告する。
講師: 中西 保仁 (印刷博物館 課長)
印刷博物館は人類の知的環境構築に貢献してきた印刷出版文化を体系的に取り上げたユニークな施設。その設立の経緯から特徴的な活動内容を紹介する。さらにスタートしたばかりの印刷文化学がなにをめざしているのかにも触れたい。
講師:岡 敏生(事業開発本部 総合研究所 情報技術研究室、本学会理事)
2010年代の AI ブーム再来とともに機械学習技術が注目を浴びることになったが、近年では PoC(Proof of Concept) 疲れという言葉をよく耳にするようになった。そんな中、凸版印刷では少しずつ機械学習の実活用に向けた活動を進めている。ここでは当社における取り組みの一例を簡単に紹介するとともに、大学と企業における研究活動の違いについて考察する。