...

Linked Data を利用した 立ち寄り観光支援システムの社会実験

by user

on
Category: Documents
6

views

Report

Comments

Transcript

Linked Data を利用した 立ち寄り観光支援システムの社会実験
人工知能学会研究会資料
SIG-SWO-035-02
Linked Data を利用した
立ち寄り観光支援システムの社会実験
Implementing Tourism Service Based On Linked Data with Social Experiments
牧山宅矢 1 大野祐 2 森田武史 3,杉山岳弘 2, 小薬洋昭 4, 手嶋秀之 4,山口高平 1
Takuya Makiyama1, Yu Ono2, Takeshi Morita3, Takahiro Sugiyama4, Hiroaki Kogusuri4,
Hideyuki Tejima4 and Takahira Yamaguchi1
1
慶應義塾大学
Keio University
2
静岡大学
2
Shizuoka University
3
青山学院大学
3
Aoyama Gakuin University
4
中日本高速道路株式会社
4
Central Nippon Expressway Company Limited
1
Abstract: Linked Data facilitates the integration of different data domains. However, experiments
to show the effect by consuming Linked Data have not been conducted yet. We implemented a
tourism service with Linked Data targeting Hamamatsu, Shizuoka Prefecture. Moreover, we
conducted social experiments on verification of our tourism service.
.
1
はじめに
Linked Open Data(LOD)は,RDF と呼ばれる最小単位
でデータを扱い,さまざまなドメインをまたいでデ
ータをつなぎ合わせること(拡張容易性)によりデ
ータ利用者の利便性を向上させるプラットフォーム
として取り組 みが進められている .一方で ,Linked
Data の有用な使い方については確立されておらず,
明確な評価もされていないのが現状である.本稿で
は,高速道路立ち寄りというタスクに着目し,Web ペ
ージからスクレイピングを行い Linked Data を作成
する.さらに現在公開されている Linked Open Data や
他団体のデータと組み合わせることによって異なる
ドメインを有する Linked Data を構築する.それらを
利用して,高速道路利用者が周辺地域の観光スポッ
トに立ち寄る際に支援するシステムを実装する.さ
らに,静岡県浜松市を対象とした社会実験によって
そのシステムの有用性を評価する.
2
実装システム
システム全体の構成図は図 1 のようになっている.
図 1 システム全体構成図
以下ではシステム全体を Linked Data 作成,立ち寄り支援ア
プリケーション,行動確認ウェブページに分割して説明す
る.
2.1
Linked Data 生成
Web ページからデータを収集しデータ型を変換して
RDF を作成する.さらに,既存の LOD や,外部組織の
データと組み合わせることによって Linked Data を
構築する.
連絡先:牧山宅矢,山口高平
慶應義塾大学理工学部管理工学科
〒223-8522 神奈川県横浜市港北区日吉 3-14-1
02-01
TEL:045-566-1614
E-mail:[email protected],[email protected]
.ac.jp
人工知能学会研究会資料
2.1.1 RDF 作成
Web サイト及び WebAPI を用いて情報を収集する.
さらに HTML ファイルから半自動的に必要な部分を
抽出する.HTML の構造は Web ページごとに異なる
ためスクレイピングプログラムを作成した.正規表
現,DOM TREE 構造を利用した方法を用いデータの
抽出を行う. 抽出したデータに対してモデリング
を行い,rdflib1という python ライブラリを利用し
て,RDF データへの変換を行う.また,述語を表現する
際には標準語彙(Linked Open Vocabularies)及び独自
に定義した語彙を用いて記述する.さらに,所在地や
営業時間,料金などの情報はリテラル値になってい
るためコンピュータが自動的に処理することができ
ない.そこでリテラル値を機械可読なデータ型に変
換する.図 2 にデータ型変換後の RDF モデルを示す.
SIG-SWO-035-02
位置情報を持つ.また,高速道路情報の IC についても
同様に緯度経度を持つ.そこで位置情報を用いてそ
れぞれのスポットの最寄りの IC を調べることによ
り,「gn:nearby」という周辺にあるという意味を持つ
標準語彙を利用したプロパティを用いることによっ
てデータセット間にリンクを生成している.
現在公開されている LOD と作成した Linked Data と
の連携を行う.本稿では,外部データセットとしてふ
じのくにオープンデータカタログ2と日本語
Wikipedia オントロジー [1]を利用した.ふじのくに
オープンデータカタログは防災情報や,統計情報な
ど静岡県が所有するさまざまな行政データをオープ
ン化したものである.RDF 形式ではないので CSV デ
ータを RDF 化したものを利用する.外部 LOD とのリ
ンクを生成する際,原則としてまずリソースの文字
列の完全照合を行うことにより,両者のリソースが
同義であるかどうかを判断する.しかし,文字列の表
記ゆれを含んでいるものが多いためリンク生成の精
度が低くなってしまう.また,本稿で扱う LOD は位置
情報(緯度経度情報)を含んでいるため以下の判断
基準でリソースの一致を行う.
(1)スポットの文字列の部分照合を行う
表記ゆれに対応するため,それぞれの名称から空白
や「・」を取り除いた上で,文字列を比較,照合するか
判断する.
(2)地点間の距離が一定基準以内である
それぞれの緯度経度から求めた直線距離が一定基準
以内(100 メートル以内)であることを条件する.
図 2 データ型変換後の RDF モデル例
また静岡大学の学生が作成した観光行動データ,自
治体から提供されたクーポンデータなどは CSV デ
ータから RDF 化する.
2.1.2 データセット間リンク生成
RDF トリプルはデータセットごとに生成されている
ため,この時点ではデータセット間に関係性がない.
そのため,データセット間にリンクを生成する必要
がある.図 3 は観光情報と高速道路情報に関するリ
ソースにリンクを生成した例である.
図 4 LOD リンク生成の例
図 1 図 4 のリンク生成例では観光情報に関する
Linked Data とふじのくにオープンデータカタログ,
日本語 Wikipedia オントロジーの 3 つのデータセッ
ト感にリンクを生成している.観光情報の Linked
Data には龍泉院というスポットが存在するがスポッ
トの詳細情報に関するトリプルが存在しない.そこ
図 3 gn:nearby を用いたリンク生成例
観光情報のデータセット観光スポットは緯度経度の
2
1
rdflib : https://github.com/RDFLib/rdflib/.
ふじのくにオープンデータカタログ:
http://open-data.pref.shizuoka.jp
02-02
人工知能学会研究会資料
で,ふじのくにオープンデータカタログにある龍泉
院のリソースにリンクを生成することにより,龍泉
院にある文化財の情報を取得することができる.さ
らに,日本語 Wikipedia オントロジーにリンクを生成
することにより文化財の詳細情報やクラス-インス
タンス関係を取得することが可能になる.また,観光
情報の Linked Data と日本語 Wikipedia オントロジー
にリンクを生成することにより,縁のある人物など
日本語 Wikipedia オントロジーに特有の情報も取得
することが可能である.
2.1.3 構築した Linked Data
SIG-SWO-035-02
セットにリンクされている.観光行動と観光施設間
のリンクの例を図 7 に示す.
図 7. 観光施設情報と観光行動情報のリンク例
図 5 構築した Linked Data
今回作成した Linked Data を図 5 に示す.黒い丸の
部分は今回作成したデータセットであり,赤い丸の
部分は既に存在する LOD で計 9 つの異なるデータセ
ットから構成されている.総トリプル数は約 200000
トリプルである.以下では今回作成した Linked Data
のハブとなっている観光情報についてのデータセッ
ト内の RDF モデル例を示す.
図 6
図の例でははままつフルーツパークという観光施
設と,そこで体験できる観光行動のリンク例を示し
ている.はままつフルーツパークでは「イルミネーシ
ョンを見る」という行動と「フルーツバイキングを
食べる」という 2 種類の観光行動が観光客に提供さ
れていることを表現している.施設情報と観光情報
を分けることによって,これまでは食べる目的のユ
ーザには表示されていなかったはままつフルーツパ
ークが表示されるようになる.また,それぞれの観光
行動ごとに提供されている時間が異なる場合もある.
例に上がっている浜松フルーツパークでも,フルー
ツバイキングは 10:00 から 17:30 まで利用でき,一方
でイルミネーションの点灯は 18:00 から 21:00 までと
なっている.観光施設情報と観光行動情報を分ける
ことによって,より実態に即した観光情報表現が可
能になるのである.
2.1.4 Linked Data 格納
今まで作成してきた Linked Data を RDF データベー
ス OWLIM-Lite3に格納する.格納した Linked Data に
対して検索できるように SPARQL Endpoint を作成し
た.そこに SPARQL クエリを投げることでスポット
情報を取得するアプリケーションから DB の接続に
は phpsesame4というライブラリを用いた.
2.2
アプリケーション
以下では,今回構築した Linked Data を利用したア
プリケーションの機能一覧を示し,Linked Data を利
用したアプリケーション構築の事例として紹介する.
観光情報に関する RDF モデル
観光スポットの RDF モデルはスポット名,緯度経度,
住所などの基本情報から構成されている.さらに,日
本語 Wikipedia オントロジーやふじのくにオープン
データカタログの文化財,パワースポット,ロケ地に
関する情報,Flickr,高速道路情報などの外部のデータ
3OWLIM-Lite:http://www.ontotext.com/products/ontote
xt-graphdb/graphdb-lite/
4 phpsesame:
https://github.com/alexlatchford/phpSesame
02-03
人工知能学会研究会資料
本稿では高速道路利用者を対象に,高速道路を走行
中及び高速道路上の SA/PA で休憩をしているときに
利用することを想定しアプリケーションを開発した.
また,移動中の利用も考えられるため,スマートフォ
ン上で動作する仕様としとした.以下で実装した機
能について述べる.
実装したスポット検索機能は大きく2種類に分類
できる.
(1)インタラクティブなスポット絞り込み
ユーザとのインタラクションを通してユーザコン
テキストを取得し,ユーザコンテキストから該当す
るスポットを絞り込む機能である. この機能のスク
リーンショットを図 8 に示す
Wikipedia オントロジーを利用することで作品名か
ら作品のキャストや詳細情報を閲覧することが可能
になっている.アプリケーションで提供する検索方
法一覧が表 1 である.
表 1 検索機能一覧
検索方法名
無料スポット
浜松名物
静大生オススメ
子供向けスポット
スポット一覧
パワースポット
文化財巡り
ロケ地
動画で探す
クーポン一覧
図 8 推薦機能の画面遷移
ユーザとの簡単な質問形式のインタラクションを通
して,旅行の目的として食べる/見る・遊ぶ・体験・癒
し,グループ構成として家族/カップル,夫婦/男性グル
ープ/男女グループ/女性グループ,スポットで使える
予算,時間を取得する.このようにして取得したユー
ザコンテキストを利用し,Linked Data に対してクエ
リを投げることによりユーザにマッチしたスポット
を取得する.
(2)Linked Data を利用したスポット検索
ユーザコンテコンテキストとは関係なく Linked
Data を利用してさまざまなスポット情報を表示し,
ユーザが自分で探索を行う機能である.ここでは検
索の中の1つの例であるロケ地情報の検索例につい
て図 9 に示す.
ロケ地情報に関しては,まずふじのくにオープン
データからスポットに関係するロケ地情報として作
品名と簡潔な説明を取得する.さらに日本語
検索条件
入場に料金が必要ない
浜松の名物である,うな
ぎ,餃子,花,フルーツ,
楽器に関係がある
静岡大の学生がオスス
メしている
子ども連れの家族が楽
しめる
全スポット
パワースポット
文化財があるスポット
映画のロケに使われた
紹介動画がある
クーポンが提供されて
いる
ユーザが興味のあるスポットを発見した場合,ス
ポット詳細ページに遷移しスポットの詳細情報を参
照することができる.スポット詳細ページでは以下
の3種類の機能が利用できる.
(1)クーポン機能
社会実験期間,地方自治体からクーポンが提供さ
れていた.アプリケーションと実サービスを連携さ
せるため,アプリケーションにもクーポン機能を実
装することにした.アプリケーション上でクーポン
を使用する場合の画面遷移は以下の図 10 のように
なる.
図 10
図 9 ロケ地情報に関する検索
SIG-SWO-035-02
クーポン利用時の画面遷移
クーポンが存在するスポットのスポット詳細ページ
には,「粗品進呈クーポンあり!」などどのタイプの
クーポンが存在するのかを知らせるボタンが表示さ
れる.このボタンをタップするとクーポン利用人数
入力画面へと遷移する.クーポンの最小利用人数,最
大利用人数を満たす範囲内で,クーポンを利用する
02-04
人工知能学会研究会資料
人数を入力し,「このクーポンを使う!」ボタンをタ
ップすると,クーポン利用画面に遷移する.このクー
ポン利用画面をスポットにおいて関係者に見せるこ
とによってサービスを受けることができる.
(2)スケジュール機能
スケジュール機能ではユーザの位置情報,観光情報
にあるスポットの位置情報,交通規制情報のドメイ
ンをリンクすることにより,現在地から観光スポッ
ト,観光スポットにおける滞在時間,観光スポットか
ら最寄り IC までの時間を表示することによりユー
ザの立ち寄り行動の時空間管理を行う.
ユーザの行動インスタンスは遷移したページ,そ
の時刻,その時点での緯度,経度を表現するプロパテ
ィを持つ.スポットの詳細ページとそのスポットを,
ウェブページの主題を表現する dc:subject でつなぐ
ことによって,ユーザのアプリケーション上の行動
と位置情報,観光情報をリンクさせている.以上のよ
うな形式のデータを利用して,ユーザの行動を見え
る化するウェブページを作成した.作成したウェブ
ページのスクリーンショットが図 12 である.
(3)立ち寄り意思表示機能
スポット詳細情報確認後ユーザがそのスポットに
立ち寄ることを決めた場合「ここに行く」ボタンを
押すことで立ち寄りの意思を示される.また,実際に
立ち寄りが行われた後,「立ち寄った」ボタンを押す
ことによってこのアプリによって立ち寄ったことが
確認できる.
2.3
行動確認ウェブページ
社会実験においてユーザが立ち寄ったかどうかを判
断するには,アクセスログから得られるユーザのペ
ージ遷移の情報,端末情報,位置情報や詳細を見たス
ポットの情報などを統合して確認する必要がある.
アクセス数の推定は難しいが,各ユーザの位置情報
や行動遷移を手動で確認するのは非常にコストがか
かることが予想される.そのため,位置情報は地図に
プロットして,ページ遷移の情報は時間に沿ってビ
ジュアル化することでユーザの行動を把握すること
が簡単になる. 今回はユーザのアクセスログを RDF
形式に変換し,既存の Linked Data とリンクすること
で情報の統合を容易にした.観光情報と行動データ
のリンクは図 11 のようになっている.
図 12 行動確認ページ
このページでは,まず行動を見たいユーザがアクセ
スした期間,利用した機能,位置情報の共有の有無に
よってユーザを絞り込む.絞り込んだユーザの中か
ら一人を選ぶと,そのユーザの位置情報の遷移や利
用したページ,アクセス時の端末情報,グループ構成
や目的地などのユーザコンテキストが分かる.また,
ユーザの位置情報の遷移がプロットされた地図には
全スポットの位置も表示され,簡単に位置関係の把
握ができる.さらに,そのユーザがスポットの詳細ペ
ージを見ていた場合,そのスポットの当日の営業時
間が表示される.このページを見るだけでスポット
の営業時間内にユーザが立ち寄りを行ったかどうか
がわかる. 個々のユーザの行動を見るだけでなく,全
ユーザの位置情報をプロットして利用者の多い地域
を調べたり,個々のアプリケーションのページに着
目したりすることもできる.
3
図 11 ユーザ行動データと観光施設データの
リンク例
SIG-SWO-035-02
社会実験
本稿で取り扱う立ち寄り観光について言及する.
高速道路からの立ち寄りは,本来の目的地に行くと
いう予定を変更し,さらにスポットでの料金や高速
道路料金を余計に払わなければいけない行動であり,
コストや時間の面から考えると大変難しい.
社会実験ではユーザに実際にアプリケーションを
利用してもらいアクセスログを記録する.そして今
研究で実装したユーザの行動確認ページを利用して,
ユーザの行動を確認しアクセス数や立ち寄り数を算
出した.
02-05
人工知能学会研究会資料
3.1
社会実験の準備・運営体制
この項では実験の準備・運営体制について,以下に
実施日時,実施場所,当日の流れ,の順で述べていく.
【実施日時】
(日程)
平成 26 年 6 月 7 日 (土) ~ 7 月 6 日
(日)
【集客方法】
月曜日~金曜日:チラシ・ポスター設置
土曜日,日曜日:チラシ配布 [10:00~17:00]
チラシ・ポスター設置 [終日]
【実施場所】
・東名高速道路:上郷 SA(上り),浜名湖 SA(集
約),牧之原 SA(下り)
・新東名高速道路 NEOPASA 浜松 SA(上下),遠
州森町 PA(下り),掛川 PA(下り),藤枝 PA(下り),
静岡 SA(下り)
社会実験の対象エリアと各 SA,PA を次ページの図
29 に示す.
図 13
SIG-SWO-035-02
図 14 アクセス時のページ遷移
3.2
実験結果と評価
今回のアプリケーションにおける,立ち寄りまで
のユーザの利用段階と, 各段階での UU 数,離脱率を
まとめたものが図 15 である.
社会実験の対象エリア
図中で濃い赤色のマーカーでマッピングされてい
る SA は休日に調査スタッフがチラシ配りを行った
SA である.一方オレンジ色のマーカーでマッピング
されている SA,PA は,チラシ,ポスターを設置はした
がチラシ配布は行わなかった SA,PA である.
【実験当日の流れ】
1. SA 利用者に対して,立ち寄りアプリの概要・ア
クセス方法を明示したチラシを配布
(SA 利用者がアプリに興味を示す)
2. 立ち寄り支援アプリの利用調査
→アプリを自由に操作
(ユーザが立ち寄りを実施)
3. 立ち寄り終了後,Web アンケート調査
当日の流れの 1 に関して,土・日曜日のみチラシ配
布を実施した.月曜日~金曜日に関しては SA 内に設
置したチラシ・ポスター・デジタルサイネージより
SA 利用者はアプリの存在を知ることができた.
今回の実験ではユーザの位置情報やページ遷移の
ログをとるため,個人情報の取り扱いについてユー
ザに同意を得る必要がある.そのため実験時にアク
セスしたユーザは,次ページの図 14 に示すように最
初にアクセスした際に慶應義塾大学における個人情
報の取り扱い規約について同意するかかどうか求め
られる.
図 15 各段階での UU 数と離脱率
UU 数と離脱率以外の重要な指標をまとめたもの
が表 2 である.
表 2 重要な指標とその値
指標
値
平均 PV 数
6.66PV
平均滞在時間
4 分 10 秒
社会実験におけるコンバージョン率は,立ち寄り
数をアクセス数で割った 3.56%である.Mobify 社によ
る調査 [2]によるとモバイル EC サイトにおけるス
マートフォン,タブレットによるコンバージョン率
は業界によるが 1.13%~3.69%であり,今回のコンバー
ジョン率は高いといえる.
次にどの検索機能,推薦機能が立ち寄りに寄与し
たのかを分析する.各検索機能について,その機能を
利用した全体ユーザ数をその機能を利用し立ち寄っ
たユーザ数で割ることによって,その機能が立ち寄
りに寄与した割合を算出した.その結果をグラフに
したものが次ページの図 16 である.
02-06
人工知能学会研究会資料
立
ち
寄
り
寄
与
率
10%
9%
8%
7%
6%
5%
4%
3%
2%
1%
0%
SIG-SWO-035-02
250
200 U
U
150 数
(
100 U
50 U
)
0
アクセスUU
立ち寄り寄与率
図 16 各機能のアクセス UU 数と立ち寄り寄与率
グラフからわかるように,インタラクションによっ
てスポットを絞り込む機能が最も立ち寄り寄与率が
高い.無料スポット検索機能はアクセス数が多く,立
ち寄り寄与率も高い.2.2 において検索機能例として
紹介したロケ地検索機能はスポットの情報からそこ
でロケがなされた映画の情報,さらにそのキャスト
の情報などまで提供することが可能であるが立ち寄
りには寄与しなかった.
3.3
考察
立ち寄り観光を行うユーザは目的地が存在するた
め時間制約が強い.ユーザからインタラクティブに
コンテキストを取得しスポットを絞り込む機能が立
ち寄りにつながったのは,ユーザが地震で各検索機
能を利用してスポットを探すより手間がかからない
からだと推測される.また,高速道路を下りて立ち寄
り観光を行うとそれだけで余計に高速道路料金,ガ
ソリン代等がかかる.無料スポット検索機能の注目
度,立ち寄り寄与率が高かったのは,交通費がかかる
分スポットで利用する金額はなるべく抑えようとす
る心理がうかがえる.
ふじのくにオープンデータカタログ,日本語
Wikipedia オントロジーと既存のデータを利用して
情報量を増やしたロケ地検索機能は注目されている
ものの立ち寄りにつながっていない.日本語
Wikipedia オントロジーでは映画のキャストや作品
の詳細情報が得られるがそれらは観光スポットへの
関心を高めるものではなかったといえる.スポット
への関心を高めるには,例えばそのスポットが登場
するシーンの動画など,スポットに対して興味を抱
かせる情報を提供する必要がある.
4
ている Linked Open Data を組み合わせることによっ
て 9 つのドメインを有する Linked Data を構築した.
さらに,それを利用し高速道路利用者の立ち寄り支
援サービスを開発した.サービスの評価を行うため
に浜松市を対象とした社会実験を実施した.実験の
結果,立ち寄り率は 3.56%であり,既存のモバイル EC
サイトと比較しても高いコンバージョン率であっ
た.Linked Data を利用したサービス開発の注意点と
して,ロケ地検索の例のように単純にすべての情報
を提示しても効果は薄く,サービスの目的にあった
データの提供が必要であることがわかった.今後の
課題や展望としては,スポットの絞込み機能に推薦
機能を追加する,データを見える化するページを一
歩進めて立ち寄りを自動判定する機能を追加するな
どが考えられる.
5
[1] Susumu Tamagawa, Shinya Sakurai, Takuya Tejima,
Takeshi Morita, Noriaki Izumi, and Takahira Yamaguchi
“Learning a Large Scale of Ontology from Japanese
Wikipedia,” in IEEE/WIC/ACM International
Conference on Web Intelligence and Intelligent Agent
Technology, 2010, pp. 279-286.
[2] D. Fay, “2014 E-Commerce Mobile Conversion
Rate Benchmarks, ” 4 2 2014. [ オ ン ラ イ ン ].
Available:
http://www.mobify.com/insights/2014-mobile-conver
sion-rate-benchmarks/. [アクセス日: 25 1 2015].
6
おわりに
本稿では,位置情報を持つ観光情報や高速道路情報
に着目して Linked Data を作成し,また現在公開され
参考文献
謝辞
本研究は,中日本高速道路株式会社からの支援を受
けて実施されており,ここに記して感謝します.
02-07
Fly UP