Comments
Description
Transcript
電子情報通信学会ワードテンプレート (タイトル)
DEIM Forum 2014 F8-2 同一料理に対する多様なレシピ集合からの 効率的な選別を目的とした可視化手法 村瀬 秀† 牛尼 剛聡 ‡ †九州大学芸術工学部 〒815-8540 福岡市南区塩原 4-9-1 ‡九州大学大学院芸術工学研究院 E-mail: †[email protected], 〒815-8540 福岡市南区塩原 4-9-1 ‡[email protected] あらまし 近年,投稿型レシピサイトが一般的に利用されるようになった.投稿型レシピサイトでは,利用 者がレシピを投稿できるため,ひとつの料理に対して多数のレシピが存在する場合が多い.特定の料理を作ろ うとしてレシピサイトでレシピを見ている利用者は,同一の料理に対する様々なレシピから自分が作るレシピ を選別する必要がある.しかし,候補となる全てのレシピを閲覧することは現実的ではない.そこで,他のユ ーザが行った評価を利用してレシピを選別することが多い.しかしユーザの評価に基づいた選別では,新しい レシピは選別の候補にならない可能性が高く,その料理のバリエーション(料理の全体像)を把握して,自分 の嗜好や目的に合致したレシピを選別したいという要求に対応できない.この問題を解決するために,本論文 では,ユーザが指定した料理に対して,多数のレシピが存在する状況で,レシピの選別を支援する可視化手法 を提案する.本研究では,レシピの構成要素を分析することでレシピのバラエティーを発見し,ユーザが料理 の全体像が理解できるような可視化を行う. キ ーワード レシピ選別, 可視化手法, 階層的クラスタリング 1. まえがき リ構造 を可 視化する 手法 を提案する. 具 体的には , レシ ピに含まれる材料の出 現頻 度を調べ, 料理をいくつかの 近年, 投 稿型レシピサイト には 大 量のレシピが 投稿さ 部分 要素( 料 理パーツ) に分割する. 例え ば, オムライス れ, ユーザは 様々なレシピから自 分の 目 的にあ ったレシ は,「ライス 」,「 オムレツ」, 「ソース」 という料理パ ーツに分 ピを選 択でき るよ うにな った. レシピサイト の代 表 的な 利 解できる. 次に材料の出 現数から, 料理パ ーツの代表の 用方法の 一つは , ユーザが調理したい料理 を指 定して, 材料 を決め, 手順 内で代表の 材料と他の 材料の共 起数 そのレシピを検索するとい うものである. しかし, 投稿型サ を調べ, 共 起の多 い材 料 をパ ーツに分 類させる. 分類さ イト には 膨大な数のレシピが登録されているため, 料理を れた材料の共 起数から次の 代表とな る材 料を決め, これ 指定した場 合には , 大量のレシピが検索 結 果として 返さ を繰 り返す. 最 終的に 共起した 順に材 料 を図 示すること れることが多 い. 例え ば, 代表的なレシピサイト の一つで で材料のカテ ゴリ構 造の可視化 を行う. ある「 楽天レシピ」 [1 ]では,201 4 年 1 月の段階で「 オムラ イス」 のレシピとして 1 ,755 件が登録されており, 今後もさ らに増加していくと予想される. レシ ピサイト の検索 結果として返される大量のレシ ピを, ユーザがすべて 確認することは 現実的でない. そこで, 多 くのレシピサイト では , 人気 順で 検索 結 果 をランキ ングし て ユーザのレシピ選 別を支援している. しかし, ユーザは 2. 関連研究 石橋 ら[2]は,食 材 の利 用頻 度 と典 型度 か ら,ユ ーザ の嗜 好に 合 った レシ ピ推 薦 を目 的と し ,食 材の 得 点を 以下 の式 か ら求 めて レシ ピ を推 薦す る 手法 を提 案 して いる. 食材 n の 得 点= 必ずしも人気があるレシピを求めていない場合がある. 料 食材 n の 利 用 頻 度 × 食材 n の 典 型 度 理名 をクエリとして返される結 果のレシピには, 利用する 食材や, 調理 手順に 様々なバ リエーシ ョンがあり, それら の特徴を把握してからレシピを選びたい場合 も多い. 上記の問 題 を解 決するために, 本研究では 検索 結果 として返されるレシピ集合に対して, その全体的な カテ ゴ ここ で, 食 材の 利用 頻度 は ,ユ ーザ の 調理 履歴 か ら食 材の 出現 頻 度を 求め ,調 理 した 日が 近 いほ ど重 み を低 くす るこ と で同 じ食 材ば か りが 出て こ ない 工夫 を して いる. 望 月ら[3]は ,レシ ピサ イ トに おけ る ユー ザ個 人 の嗜 +𝑤2×食品群[小]のコサイン類似度 好に 合わ せ た偏 りの ない レ シピ 推薦 を 目的 とし , 調理 +𝑤3×食品群[中]のコサイン類似度 履歴 から 見 つけ 出し たユ ー ザの 嗜好 食 材を 用い た 推薦 , +𝑤4×食品群[大]のコサイン類似 度 冷蔵 庫の 余 剰食 材を 考慮 し た推 薦, 調 理履 歴の レ シピ (𝑤1 +𝑤2 + 𝑤3 + 𝑤4 = 1 0 ≤ 𝑤1, 𝑤2 , 𝑤3 , 𝑤4 ≤ 1) の調 理法 を 考慮 した 推薦 の 3つ を提 案 して いる . ユー こ れら の 研究 では ,本 研 究で 対象 と する よう な ,同 ザの 調理 履 歴か ら嗜 好食 材 を見 つけ 出 す方 法に つ いて 𝑘 𝑘 は ,食 材 k の 典型 度を 𝑝 ,利用 頻 度を u とし ,レ シピ 𝑟𝑗𝑘 に含 まれ る 食材 を 𝐼𝑗𝑘 とする と き,レ シ ピの 得点 𝑆𝐼 (𝑟𝑗𝑘)を 以下 の式 か ら求 めて レシ ピ の推 薦に 用 いる 手法 を 提案 している. 一料 理の 複 数の レシ ピを 選 別の 支援 す るこ とは 考 慮さ れていない . 提案手法 3. 本章 では , 同一 料理 とし て 登録 され た 様々 なレ シピ ∑ 𝑆𝐼 (𝑟𝑗𝑘 ) 𝑖∈𝐼𝑗𝑘 𝑢 𝑖 ∙ 𝑃𝑖 ∑ 𝑖∈𝐼𝑗𝑘 𝑃𝑖 のバ リエ ー ショ ンを 提示 す るた めに , レシ ピ集 号 の全 体像 抽出 し ,可 視化 す る手 法を 提 案す る .具 体的 に は, 提案手法は , 以下 のス テッ プ から 構成 さ れる . 1. レシピの代 表 的な 材料 の抽 出 冷蔵 庫の 余 剰食 材を 用い た 推薦 する た めに ,ま ず ,ユ 2. 料理の構成 要 素( パー ツ) へ の分 割 ーザ が冷 蔵 庫の 余っ てい る 食材 をデ ー タベ ース に 登録 3. 可視化図の 作 成 する .そ し て登 録さ れて い る食 材を 多 く含 むレ シ ピの 以 下に , それ ぞれ のス テ ップ につ い て詳 細に 説 明し 得点 を大 き くす る. また , 余剰 食材 は 古い もの を 優先 てい く. な お, 対象 とす る 料理 のレ シ ピ集 合は 与 えら 的 に 使う こ と が 望 ま しい と し て , 登 録日 を 𝑑と し ,登 れて いる も のと する .レ シ ピは ,材 料 一覧 ,及 び 手順 録日によっ て ,以 下の 式で 食 材に 重み 付 けを 行う . から構成さ れ るも のと する . 𝑤 (𝑐 ) = (𝑑 − 1) 𝑑 3.1 代表的な材料の抽 出 調理 履歴 か ら求 めた 調理 法 の履 歴に よ る推 薦の た めに レ シ ピ集 合 𝑅に お け る代 表 的 な 材 料を 抽 出 す る .そ は,まず ,レシ ピを「 煮物 」 「焼 物 」 「 炒物 」 「揚 物 」 「蒸 の た め に レ シ ピ 集 合 𝑅に お け る 材 料 𝑓の 出 現 頻 度 を 物」 「 和え 物 」 「生 物 」 「汁 物 」の 8つ の 調理 法に 分 類し 𝐹𝑟𝑒𝑞(𝑓, 𝑅)と表 記す る .レ シピ サ イト に含 ま れる 材料 の た.そし て ,調 理法 𝑐の レシ ピの 得点 を ,全 調理 履 歴中 集 合を 𝐹と す ると き , 𝐹に 含ま れ る 全て の 要 素 𝑓 に対 し の 𝑐が出現 し た回 数に よっ て 求め てい る .そ して ,3つ て 𝐹𝑟𝑒𝑞(𝑓, 𝑅)を求め る .𝐹𝑟𝑒𝑞(𝑓, 𝑅)が大き い 食材 は,レ シ の推 薦手 法 の推 薦度 を最 適 化す るこ と で最 終的 な レシ ピ集合𝑅にお け る代 表的 な材 料 であ ると 考 えら れる . ピの推薦を 行 う. 福 本ら[4]は ,食 材の 重要 度 と食 品群 に 注目 し,レシ ピ間 の類 似 度を 算出 する 手 法を 提案 し た.例 え ば, 「オ ムラ イス 」 とい う料 理に お いて 「鶏 肉 」を 材料 に 含む レシ ピと , それ ぞれ 「豚 肉 」と 「椎 茸 」を 含む 別 のレ シピ の類 似 度を 考え る際 ,従来 手法 では , 「豚 肉」と「椎 茸」 は「 鶏 肉」 と独 立し た 別の 食材 で ある ため , 類似 度は 高く な らな い. しか し ,こ の手 法 では 食品 群 を考 慮す るた め , 「 鶏肉 」と「豚 肉」が 同じ「肉 類」に 分類 され 「 , 椎 茸 」を 含む レ シピ に比 べ て類 似度 が 高く なる . また , 「大」 「中 」 「 小」の3 つ の食 品群 を 作り,食 品に それ ぞれ の 食品 群を 対応 付 け, 食材 の 重要 度は 料 理に おけ る出 現 度だ けで なく , その 食材 が 属し てい る 食品 群に つい て も出 現度 を算 出 し合 算し た .最 終的 な レシ ピ間の類似度は コサイン類 似度と食品 群の重み 付け 𝑤𝑛を利用して 以 下の 式に よっ て 求め る. レシピ間類似度= 𝑤1×食材単体のコサイン類似度 3.2 料理の構成要素( パ ーツ )へ の 分割 料理 の全 体 像を ユー ザに 提 示す る際 , その 料理 のレ シピ 集合 に おけ る代 表的 な 材料 を提 示 する だけ で は, その 料理 の 手順 を知 らな い 利用 者に と って は, 全 体像 を構築する こ とが 困難 であ る . 一般 的に , 料理 は要 素か ら 構成 され る .例 えば ,オ ムラ イス に 対し ては , 「 オ ム レツ 」, 「 ラ イス 」, 「 ソ ー ス」 とい う3 種 類の 要素 に分 割 でき る. こ のと き, 料 理の バリ エー シ ョン は, それ ぞ れの 構成 要 素の バリ エ ーシ ョン の組 み 合わ せで ある と 考え られ る .し たが っ て, レシ ピを 構 成要 素に 分割 し ,そ れぞ れ の構 成要 素 を作 成す る際 に 利用 する 材料 を 提示 する こ とに より , ユー ザは ,レ シ ピ集 合の バリ エ ーシ ョン の 全体 像を 効 率的 に把 握で き ると 考え られ る .オ ムラ イ スに おけ る 材料 の分割イメ ー ジを 図2 に示 す . 図3: 材料の共起 図2: オムライスの材料 の分 割 次 に ,構 成要 素を 抽 出す る手 法 につ いて 述 べる .我々 は, 構成 要 素は ,代 表的 な 材料 とそ れ に付 随す る 材料 によ って 構 成さ れる と考 え た. レシ ピ は, 複数 の ステ ップ から 構 成さ れる が, 一 つの ステ ッ プに は, 一 つの 構成 要素 に 関す る調 理方 法 が記 述さ れ てい る場 合 が多 い. すな わ ち, 一つ のス テ ップ にお い て, 複数 の 構成 要素 に関 す る調 理を 行う こ とは 稀で あ ると 考え ら れる . 本手 法で は,上記 の考 え に基 づい て , 「 同じ ステ ッ プに 出現 する 材 料は 同じ 構成 要 素の ため に 使用 され る 材料 である可能 性 が高 い」 とい う 仮説 を立 て た. 上 記の 考 えに 基づ いて , 材料 を構 成 要素 に基 づ いて 図4: パーツへの分割の 繰り 返し グル ープ 化 する ため に, 代 表的 な材 料 と他 の材 料 との 共起 回数 を 利用 する .材 料 の共 起例 を 図3 に示 す .図 3よ り同 じ 手順 にあ る「 玉 ねぎ 」「ハ ム 」「 コー ン 」は 共起 して い ると 判断 する . また ,ス テ ップ 2に お いて は, 「ご 飯」,「塩 」,「 コ ショ ウ」 が 共起 して い る. レシピ集合 に含まれ る全ての 材料の共起 を集計 ご飯 パー ツ に分 割さ れた 材 料の 内, 共 起数 の上 位 3件 の「 玉ね ぎ 」「 ニン ジ ン」「 鳥肉 」が そ れぞ れ代 表 の材 料と なり パ ーツ 化さ れる . 次に 玉ね ぎ パー ツに 注 目す ると ,同 様 にし て「 ウイ ン ナー 」「ピ ーマ ン 」「 ハ ム」 がパーツ化 さ れる . し, 最も 多 く共 起し てい る 代表 的な 材 料が 表す 構 成要 素に 対し て ,代 表的 な材 料 以外 の材 料 を分 類す る .例 とし て, オ ムラ イス のレ シ ピ集 合に お ける ,代 表 的な 食材 「ご 飯 」と の共 起回 数 の上 位を 図 4 に 示す . その 結果 ,玉 ね ぎ, ニン ジン , 鳥肉 の共 起 回数 が多 か った ため,こ れら は , 「 ご飯」の 構成 要素 に 所属 する 材 料で あるとする . 共起回数が最 も多い代 表的な材 料のパーツ にすべ ての 材料 を 分割 した 後に , 分割 され た 材料 の中 で 共起 回数 の上 位 3件 を新 しい 代 表的 な食 材 とし て, そ れ以 外の 材料 を 分割 する .こ れ を繰 り返 す こと で関 係 が強 い材 料か ら 順に 木構 造を 作 るこ とが 可 能で ある . 図4 にパーツへ の 分割 工程 の例 を 示す . 3.3 可視化図の作成手 法 上記 の処 理 によ って 得ら れ た構 造に 基 づい て, 可視 化図 を作 成 する .図 5に 可 視化 図の 描 き方 を示 す .具 体的 には , まず 中央 に料 理 名, 次の 階 層に 代表 と なる 材料 を配 置 する .そ の後 共 起数 に基 づ いて それ ぞ れの 構成 要素 を 生成 され た順 に 配置 する . この 時, 階 層が 一つ 変わ る に従 って 材料 名 の文 字サ イ ズを 小さ く する . こう する こ とで ,そ の料 理 にと って 重 要な 材料 と ,階 層構 造が 認 識し やす くす る .ま た各 材 料は 単純 に 直線 で繋 ぐだ け にし ,無 駄な 情 報を 極力 入 れな い構 造 とす る. 図5: 文字のサイズの変 更 図6: オムライスの可視 化図 実験・評価 4. 提案手法の有 効性を評 価するた めに被験者 実験を 行った. 4.1 対象とするデータ 評価実験の内容 4.3 可視化図を見 る場合と 見ない場 合でレシピ 検索に 差が 出る か を被 験者 実験 に より 調査 し た. 被験 者 は, 大学生5人 で ある . 実験 には , 楽天 レシ ピの レ シピ デー タ を用 いた .デ 被験 者に は ,制 限時 間 5 分 の間 に楽 天 レシ ピで オム ータ は 2012 年 の 総レ シピ 数 442,504 件 まで のも の につ ライ スの レ シピ をな るべ く 多く 見て , 見た 中で 一 番作 いて,以下 の 項目 をデ ータ ベ ース に格 納 した . りた いと 思 った レシ ピを 一 つ選 択し て もら い, 次 の3 ・レシピの ID ・レシピの 料 理名 ・レシピに 含 まれ る材 料名 ・レシピの 手 順 また ,レ シ ピの 手順 につ い ては 文章 を 形態 素解 析し , つの設問に 5 段階 評価 で回 答 して もら っ た. ①選んだレ シ ピに 対し ての 確 信度 ②よく使わ れ る材 料, あま り 使わ れな い 材料 の把 握 ③バリエー シ ョン の把 握 実験結果及び考察 4.4 食材 名の み を抽 出し た. な お, 材料 の 表記 揺れ の 問題 を解 決 す るた め ,5,513 件の 辞 書デ ー タ を用 意 し ,デ 被験者の評 価 点を 平均 した 結 果を 図 7 に 示す . ータベース に 格納 した . 5 提案図の作成 4 4.2 楽天 レシ ピ にお いて ,料 理 名に ‘オ ム ライ ス‘ を含 むレ シピ 数 862 件に 基づ い て, 提案 手 法に よっ て 作成 した 可視 化 図を 図6 に示 す .な お, 可 視化 図を 作 成す る際 ,代 表 的な 材料 の抽 出 と構 造の 取 得は プロ ト タイ プシ ステ ム を利 用し て行 い ,得 られ た 構造 から の 可視 化図の作成 は 手動 で行 った . 3 なにも見ない 2 提案図を見る 1 0 確信度 材料の典型度 バリエーション 図7: 実験結果 実験 結果 よ り, よく 使わ れ る材 料や あ まり 使わ れな い材 料の 把 握と 料理 のバ リ エー ショ ン を把 握す る こと に関して提 案 図が 特に 有効 で ある こと が 示さ れた . 確信 度に つ いて は, それ ほ ど差 がで な かっ たが ,こ れは ,制 限 時間 に設 定し た 5 分 だと , 人気 順を 閲 覧し ても 確信 を もて るレ シピ を 容易 に見 つ けら れる こ とが 原因 であ る と思 われ る. 材 料の 典型 度 に関 して は 典型 度の 高い 食 材は 大部 分提 案 図に 記載 し てい るの で ,あ まり 使わ れ ない 材料 につ い ても 把握 で き, 見な い 場合 に比 べ大 き な差 が出 たと 考 えら れる . バリ エー シ ョン につ いて は 料理 名を 提案 図 に記 載さ れ てい る気 に なる 材料 によ っ て絞 り込 み検 索 を行 うこ と で, 新し い バリ エーション を 発見 でき たと 考 えら れる . 5. まとめ レシピに含ま れる食材 の出現頻 度と手順を 解析し 食材 ごと の 共起 数か ら, 料 理を 構成 要 素( パー ツ )に 分割 し, パ ーツ 内で さら に パー ツに 分 割す ると い う作 業を 繰り 返 すこ とで ,料 理 にお ける 材 料の カテ ゴ リ構 造を 算出 し た. また その 結 果か らユ ー ザの レシ ピ 選別 を支 援す る 可視 化手 法を 提 案し た. 実 験で はレ シ ピを 検索 する 際 に, よく 使わ れ る材 料や あ まり 使わ れ ない 材料 の把 握 ,レ シピ のバ リ エー ショ ン の把 握と い う2 点に つい て 提案 図が 特に 有 効で ある と いう 結果 が 得ら れた. 本研 究で は ,レ シピ の可 視 化を 行う 際 に, 食材 の手 順に 注目 し 共起 数か ら食 材 をパ ーツ に 分割 した . しか し, 現状 で はパ ーツ に分 割 され る食 材 数に 偏り が でき ると いう 問 題が ある .こ れ は代 表的 な 材料 の出 現 数に 差が ある た めで ある .こ の 問題 を解 決 する ため に ,食 材の 分量 を 考慮 する とい う こと が考 え られ る. だ が, レシ ピサ イ トの 分量 の表 記 は,「 少々 」,「 好 きな だけ 」 など ,ユ ー ザの さじ 加減 で 決ま って し まう ため , 研究 に反 映さ せ るこ とが 出来 な かっ た. 今 後は ,分 量 の表 記ゆ れも 計 算し ,可 視化 に 反映 出来 る よう なシ ス テム の開発など も 検討 した い. また今回は提 案図の最 終的な配 置を手動で 行った が自動で行 う 手法 を検 討す る 必要 があ る . 参考文献 [1]“ 楽天レ シ ピ:レ シ ピを 見つ け る, 料理 す る, 投 稿す る,みんな で 作る ”, http://recipe.rakut en.co.jp / [2] 石 原 和 幸, 上 田 真 由 美, 平 野靖, 梶 田 将 司, 間 瀬健 二:“ FF -IRF を 用 いた 個 人 嗜 好 レシ ピ 推 薦 手 法 の有 効性 検 証”, 信 学 技 報. M VE,マ ルチ メ ディ ア ・ 仮想 環境基礎, vol.107, no.454, pp.51-56(2008) [3]望月 美里, 高 橋裕 樹:“ 余 剰 食 材の 有 効 活用 と 嗜 好に 基 づ く多 彩 な レ シ ピ推 薦”, 映 像 情報 メ デ ィ ア 学会 技術報告. vol.36(8), pp.127-130, (2012) [4] 福本 亜 紀, 井上 悦子 , 中川 優:“ 食 材の 重要 度 と食 品群 を考 慮 した レシ ピ感 類 似度 の算 出 手法 ”,D EIM Forum 2012 D9-2