地球環境情報プラットフォーム構築推進プログラム(DIAS)
国立情報学研究所(NII)チーム

トップページ

GeoNLP Annotator - 任意のウェブページを地図化するChromeアプリ

GeoNLP Annotatorとは?

GeoNLP Annotator
GeoNLP Annotatorは、任意のウェブページをGeoNLPで解析し、地名情報を登録して公開するための注釈作業を行うための、Chromeアプリです。その目的は、ユーザ参加型の地名辞書作成を支援する機能、および任意のウェブページに対して地名の解析とその結果の保存を可能とすることにあります。もし結果に問題があれば、それを修正して共有・アーカイブする機能も実現しており、ユーザが欲しい地名辞書を自ら構築して利用することもできます。

図1 図1

GeoNLP Annotatorの主な機能は以下の通りである。まず、Google Chromeブラウザを起動し、そこにGeoNLP Annotatorを拡張機能としてインストールする。次に解析したいページを表示し、その中で解析したいテキストを、図1のように選択して反転させる。

図2 図2

このテキストを対象に解析を行った結果を図2に示す。ここで解析機能にはGeoNLPを用いているが、さらに図3に示すように、もし解析結果の地名リストに漏れがあれば、辞書に足りない地名を新規登録するためのインタフェースも用意した。

図3 図3

地球環境データでは、行政区域などの公式な地名に加えて、地元でしか使われないローカルな地名や、場所に紐づく広義の地名(施設名)など、標準的な地名辞書には含まれない地名を扱う必要が生じる。そこで、こうした地名を新規登録するインタフェースを用意することで、地名の名称と緯度経度をデータベース上にアーカイブできるようにした。これを後で担当者が整理し、品質管理して地名辞書形式に変換すれば、地名解析で使える地名を拡張できるようになる。

このように、ユーザが参加しながら地名辞書を構築していくワークフローを提供することで、ユーザが本当に必要とする地名をアーカイブしていくための基盤を用意できた。このようなワークフローは特定の分野に依存したものではないため、将来的には横展開することが可能である。

インストール

GeoNLP Annotatorは、ウェブブラウザから呼び出すGoogle Chrome拡張という仕組みを用いており、Chrome Web Storeから無料でダウンロードとインストールが可能である。