...

地域特産メニュー抽出手法の提案

by user

on
Category: Documents
39

views

Report

Comments

Transcript

地域特産メニュー抽出手法の提案
情報処理学会第 76 回全国大会
1N-7
地域特産メニュー抽出手法の提案
宇部雅彦†
村田嘉利†
鈴木彰真†
岩手県立大学ソフトウェア情報学部†
1. はじめに
旅行や出張の際に地域特産料理を食べること
は旅行者にとって楽しみの一つであるだけでな
く,地域経済の振興の面からみても推進される
べきである.特に,無名な地域特産料理の知名
度向上は地域活性化につながる.しかしながら,
そのような料理を出す店舗を見つけることが難
しい.また,地元の人に日常食として認識され
ていた場合,地域特産の料理として宣伝されな
い.現在,位置情報付きコンテンツからの地域
限定語句の抽出[1]が提案されているが,地域特
産料理の推薦は行われていない.そこで,知名
度の低い地域特産メニューを抽出し,検索サイ
トとして提供するシステムを提案する.本稿で
は,店舗のメニューをインターネット上から情
報収集し,地域特産メニューを抽出するアルゴ
リズムを考案した.また,抽出実験によって提
案アルゴリズムの評価を行った.
2. 先行研究
一般的な商品情報抽出として,HTML 文書から
の商品情報抽出方式の提案[2]がある.この論文
では,オンラインショップの HTML 文書について,
商品情報の記述における特徴を調査し,それを
用いた抽出手法を提案している.
この商品情報抽出方式を利用し,店舗情報サ
イトからメニュー情報とメニューを取扱う店舗
情報を抽出する.HTML から必要部分以外の情報
を削り取る Web スクレイピング手法との併用に
より,地域単位でメニュー情報を比較すること
が可能になり,地域特産メニューを抽出するこ
とができる.
3. 地域特産メニュー抽出システム
3.1. メニュー情報の収集
地域特産メニューの抽出を行うためには,店
舗ごとのメニュー情報を収集しなければならな
い.また,地域特産メニューは県レベルから市
町村レベルまで存在する.全てのレベルに対応
できるように,詳細な店舗住所の収集も行う必
要がある.本研究では,食べログ[3]からこれら
図1 地域特産メニュー抽出の概要
の情報を収集し,それぞれを対応付けた.
3.2. 地域特産メニュー抽出アルゴリズム
地域名入力による地域特産メニュー抽出の概
要を図1に示す.まず,入力地域内の店舗リス
トを取得し,地域内全店舗のメニューリストを
取得する.次に,店舗同士のメニューリストを
比較し,単独店舗が取り扱う独自のメニューを
除外することで,地域内で共通するメニューリ
ストを抽出する.その上で,地域内で共通する
メニューリストを首都圏のメニューリストと比
較し,一般に普及しているメニューとして首都
圏のメニューを除外する.比較結果は,入力地
域の地域特産メニューとして出力される.
3.3. 抽出システムの設計
抽出アルゴリズムを実現するプログラムを作
成した.プログラムの構成は,図2に示す通り
にメニュー情報収集部分は利用者の地域名入力
から,店舗情報と店舗住所情報を食べログ[3]か
ら抽出し,データベースに格納する.その後,
店舗毎にメニュー情報を抽出し,データベース
に格納する.
Proposal of Local Foods Extraction Method
M.Ube†, Y.Murata† and A.Suzuki†
†Iwate Prefectural University
図2 プログラムのシーケンス図
1-573
Copyright 2014 Information Processing Society of Japan.
All Rights Reserved.
情報処理学会第 76 回全国大会
一方,地域特産メニュー抽出部分では,入力
地域内で共通するメニューリストをデータベー
スから検索する.抽出地域範囲は要求に合わせ
て県から市区町村までの指定を自由に変更でき
るようにした.その後,検索結果から首都圏で
存在するメニュー名を除外し,地域特産メニュ
ーを抽出する.抽出結果は文字列として出力さ
れる.
4. 盛岡市における地域特産メニューの評価
4.1. 評価の概要と結果
抽出アルゴリズムの有効性を評価するため,
岩手県盛岡市の地域特産メニュー抽出を行った.
抽出結果から,得られたメニュー名を特産品情
報サイト[4]より調べることで,メニュー名が地
域特産であるかどうか評価した.盛岡における
抽出実験の結果と評価結果を表 1 に示す.表 1
の左右でそれぞれ地域特産メニューとそれ以外
に分類した.
表 1 の右に示すメニューを除外するため,フ
ィルタリングが必要になる.表 1 の「ジュー
♪」など,検索結果からメニューではない文字
列や首都圏にない一般メニューがあった.また,
表 1 の「唐揚げ BIG プレート」など,東北地方
で展開しているチェーン店のメニュー名が複数
取得され,首都圏では取得できずに抽出結果か
ら除外された場合があった.そのため,これら
は地域特産メニューとしては除外されなければ
ならない.加えて,「コーヒーはサービス」な
ど,複数のメニューが組み合わされた場合は接
続詞で分割を行い,どちらも首都圏に存在する
ときは除外すべきである.
一方,「ちいたんたん」などの地域特産メニ
ューは同一料理でありながら、異なった複数の
メニュー名が抽出されたため,メニュー名の部
分一致を用いて 1 つのメニュー名に統合すべき
である.
4.2. 追加のフィルタリングによる再評価
そこで,抽出結果から該当データを除外する
フィルタリングを実装した.また,複数抽出さ
れた同一メニューを統合する機能を実装した.
実装したフィルタリングを表 1 の抽出結果に適
用した結果を表 2 に示す.表 2 に示されたよう
に,岩手県盛岡市の地域特産メニューが抽出で
きた.さらに,同県久慈市,北上市についても
同様の手法で地域特産メニューが抽出できた.
しかし,首都圏で見られる対象地域の地域特産
メニューが一部除外される結果となった.首都
圏に存在するメニューの中に,抽出地域の地域
特産メニューが含まれており,今後その除外方
表1 地域特産メニュー抽出結果と評価結果
表2 抽出結果のフィルタリング結果
法については検討する.また,今回抽出実験を
行った地域以外の地域についても抽出手法とフ
ィルタリングの精度について検討を行い,最適
化を行っていく.
5. おわりに
本稿では,知名度の低い地域特産を取り扱う
店舗とメニューを抽出するため,それらの情報
をウェブサイトから収集し,提案手法による岩
手県盛岡市,久慈市,北上市の地域特産メニュ
ー抽出を行った.提案した手法では,抽出結果
に地域特産メニューが混在するという結果が得
られた.そのため,上記の抽出結果に対してフ
ィルタリングを実施し,地域特産メニューのみ
が抽出できた.
今後の展望として,一般に普及するメニュー
の判定方法の検討をおこなう.また,本稿での
抽出地域以外の地域についてのシステムとフィ
ルタリングの評価を行うことで,より最適な抽
出をすることを目標とする.
その上で,地域特産メニューの分布を店舗の
住所情報から抽出し,地域特産メニューの知名
度を推定するシステムに応用していく.
参考文献
1) 奥, 健太.; 西崎 ,剛司.; 服部, 文夫.; 地域限定性
スコアに基づく位置情報付きコンテンツから
の地域限定語句の抽出. 情報処理学会論文誌,
データベース 5(3), 2012-09-28, 97-116
2) 富田, 一.; 手塚, 祐.; 山本, 修.; 長岡, 満. HTML
文書からな商品情報抽出方式の提案. 電子情報
通信学会技術研究報告 1998, 97 (502), 15-22.
3) グルメ・レストランガイド [食べログ].
http://tabelog.com.
4) 特産品情報サイト★たくさんとくさん★.
http://www.takusan.net.
1-574
Copyright 2014 Information Processing Society of Japan.
All Rights Reserved.
Fly UP