「国立国会図書館のデータを使い尽くそうハッカソン」にいってきました

このエントリーをはてなブックマークに追加
開発のkomaDと申します。
入社してそろそろ一ヶ月、無料寿司に一歩でも近づくため、初投稿しています。

さて先日、「国立国会図書館のデータを使い尽くそうハッカソン」というイベントに参加してきました。
その名のとおり、国立国会図書館が公開しているAPIを使ってなにかアプリを作ろうという趣旨のイベントですが、なんと開催場所が国会図書館の会議室です。
(下の写真は、書庫の最下層である地下8階(!)から地上を見上げたものです。)
国会図書館の館内で国会図書館のAPIをつかえるなんて、図書館利用者としては最高の瞬間ですよね?



今回は、ハッカソンで知った、国会図書館が目指しているところのLinked Open Data(LOD)のことと成果物の公開に使ったKnowledge Connectorというサービスについて、ご紹介したいと思います。


さてハッカソンのテーマでもあるLinked Open Dataですが、何となく聞いたことがあるようなないような、という感じの言葉ではないでしょうか。
あらためて言葉の意味を復習しますとこのようになります。

(http://www.ndl.go.jp/jp/aboutus/standards/lod.html から抜粋)
LODとは、ウェブ上でデータを公開し共有するための方法で、さまざまなデータ同士を結び付けて(Linked Data)、誰でも自由に利用できるよう公開されている(オープンライセンス)ものです。ウェブの創始者であるティム・バーナーズ=リーによると、Linked Dataには次のような4つの原則があります。

1. 事物の名前としてURIを用いること
2. これらの名前を参照できるように、HTTP URIを用いること
3. URIを参照したときに、RDFやSPARQLのような標準技術を用いて、有用な情報を提供できるようにすること
4. さらに多くの事物を発見できるように、他のURIへのリンクを含むこと


人間が閲覧できる形式だけでなく、コンピュータが解析可能な形式にすることで、よりデータを利用しやすくすることを目指しているというわけですね。
ところで3のRDF,SPARQLについては、ちょっと聞きなれないのではないでしょうか。
ちょっと調べてみますと……。


RDF(Resource Description Framework)
 ウェブ上にある「リソース」を記述するための統一された枠組みであり(中略)特にメタデータについて記述することを目的としており、セマンティック・ウェブを実現するための技術的な構成要素の1つとなっている。

(https://ja.wikipedia.org/wiki/Resource_Description_Framework から抜粋)

SPARQL(SPARQL Protocol and RDF Query Language)
RDFクエリ言語の一種である。
(https://ja.wikipedia.org/wiki/SPARQL から抜粋)


つまり、外部にAPIで情報公開するとき、RDF(という形式)で表現して、SPARQL(という方法)で取得してもらうことを目指しているというわけです。

例えばですが、「コンピュータ」という言葉の下位語を検索するSPARQLはこんなふうになります。
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
SELECT * WHERE {
    ?uri1 rdfs:label "コンピュータ"; skos:narrower ?uri2.
        ?uri2 rdfs:label ?label.
}

なんとなく、SQLみたいな雰囲気がありますよね。(上では"narrower"が下位語をあらわしています。)

これをURIにくっつけて送信すると結果を取得できます。

[問い合わせ発行のリンク]
実際に国会図書館のサイトに問合せるとどうなるか、皆さんも見てみてください。

このサービスは「典拠管理」とよばれるもので、これによって、例えば異なるペンネームで執筆する作者を同一人物だと同定したり、ある主題をもつ書籍が、他の主題を持つ書籍とどういう関係にあるのか(「ウェアラブルコンピュータ」についての本は、「コンピュータ」について書かれた本の下位カテゴリで、「PDA」の本と兄弟関係だ等)がわかるようになっています。



こういったAPIを活用してハッカソンのチームでは、「国会図書館に所蔵されていない本を見つけるアプリ」というややマニアックなアプリを作成しました。
本来、日本には納本制度というものがあり、出版される書籍は原則、国会図書館に所蔵されるはずなのですが、厳密にそれが運用されているかというとグレーなところがあります。
すこしまえですが、ある作品について映像資料はあるのに、書籍がなかったみたいなこともあり話題になりました。

チームでつくったアプリでは、国会図書館に所蔵があるかどうかを検索したうえで、実際にその本が存在しているかを別のサービスを使って調べ、所蔵の有無を確実に特定するようにしています。
このアプリを使って古本を買いあされば、お小遣い稼ぎをしたうえに、文化的資産の拡充もできるというみんなが得しかしないアプリです。


また今回のハッカソンではつくった成果をKnowledge Connectorというサイトに掲載しました。(http://idea.linkdata.org/idea/idea1s1349i)
このサイトのことは、ハッカソンに参加して初めて知ったのですが、LODの取り組みに関連してハッカソンの成果物を掲載できるサイトだそうで、こんなふうにハッカソン後にどこかに残しておけるというのもなかなか良いなと思い、ご紹介させていただきました。
(こちらに初めての方への案内があります→ http://idea.linkdata.org/about)


最後に、図書館のなかの様子をちょっとご紹介します。
冒頭の写真は、書庫の最下層から地上を見上げたものでしたが、その他こんな感じで、戦前の新聞やちょっと懐しい時期のマンガ雑誌など書庫に並んでいる姿を目にすることができました。



こんな風に国会図書館では、出版された新聞や雑誌がずっとあとの時代でも参照できるように、大切に管理をしているそうです。
データは蓄積と有効活用、両方が大切なんだなーと感じた瞬間でした。

それでは皆様も、APIが使いたくなったら、いつでも国会図書館のAPIにアクセス! してくださいね。

次の記事
« Prev Post
前の記事
Next Post »
Related Posts Plugin for WordPress, Blogger...