Comments
Description
Transcript
言葉の関連性を用いたなぞかけ生成と その評価
筑波大学大学院博士課程 システム情報工学研究科修士論文 言葉の関連性を用いたなぞかけ生成と その評価 前田実香 (知能機能システム専攻) 指導教員 鬼沢武久 2005 年 1 月 概要 本論文では言葉遊びの一つである「なぞかけ」を生成するシステムを構築し、人間が「おもし ろい」と感じられるなぞかけを生成することを目標とする。システムに「お題」として 1 つの言 葉を入力すると、人間がなぞかけを考える時の手順に従ってなぞかけに使われる言葉が選択され、 「 A とかけて B ととく。そのこころは C / C ′ 。」というなぞかけの文が出力される。システムは「言 葉の関連」という観点から言葉を選択しておもしろさを判断し、人間が意外性を感じられ内容を 理解・納得できるなぞかけを生成する。被験者実験の結果から、言葉の関連の強さがおもしろさ に影響する 1 つの要素であることが示されている。また、被験者がおもしろさの理由として挙げ た点から、おもしろいなぞかけを生成するために考慮すべきことを考察している。 さらに実験で得られたなぞかけのおもしろさの要素や、なぞかけ生成を行っている人の知見を もとにシステムを改良する。改良後のシステムは 4 つの言葉の構造を満たすだけでなく「言葉の 連想のしやすさ」「音韻の類似性と長さ」「典型的ななぞかけの表現を付加することができるか」 という 3 つの観点から総合的に評価することで、おもしろいなぞかけを生成する。 システムの生成したなぞかけは被験者実験で評価される。被験者はシステムが生成したなぞか けと人間が生成したなぞかけの内容を「意外性があるか」 「内容が理解・納得できるか」「おもし ろいか」の 3 項目で評価する。実験の結果、システムによって人間が内容を理解でき、意外と感 じられるなぞかけが生成できていることを示す。また、システムの生成したなぞかけは、人間が 生成したなぞかけと比較すると「意外性がある」という点では差がなく、人間が生成したなぞか けと区別がつきにくい「人間らしさ」を有するものであることを示す。さらに、システムと人間 のなぞかけに対するおもしろさの評価とその理由を比較し、本システムで行った評価と「おもし ろさ」の要素について考察する。 目次 第1章 はじめに ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 1 第2章 なぞかけの構造とそのおもしろさ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3 2.1 なぞかけとは ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 3 2.2 なぞかけの構造の分類 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 4 2.2.1 構造 1 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 4 2.2.2 構造 2 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 5 2.2.3 構造 3 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 5 2.3 なぞかけのおもしろさ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 6 第3章 なぞかけ生成の基本システム ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7 3.1 システムの概要 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 7 3.2 データベース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 8 3.3 なぞかけ生成の手順 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 8 3.4 関連度の範囲 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 10 3.5 音韻的の類似性の判断 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 10 第4章 被験者実験 1 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 12 4.1 関連度設定実験とデータ作成 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 12 4.2 関連度の範囲決定実験 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 13 4.3 システム評価実験 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 14 4.4 なぞかけ評価アンケートの結果 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 15 4.5 関連度の範囲を設定することの妥当性に関する検証 ・・・・・・・・・・・・・・・・・・・・・・・・・ 16 4.6 考察 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 18 第5章 システムの改良 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 19 5.1 システムの改良 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 19 5.2 データベース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 21 5.2.1 連想語データベース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 21 5.2.2 音韻データベース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 21 5.2.3 表現付加データベース ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 22 5.3 なぞかけ生成の手順 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 22 5.4 なぞかけのおもしろさの評価 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 23 5.4.1 連想距離に関する評価 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 24 5.4.2 音韻に関する評価 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 25 5.4.3 表現付加に関する評価 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 26 5.4.4 総合評価 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 27 第6章 被験者実験 2 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 29 6.1 表現付加データベースの構築 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 29 6.2 範囲決定のための予備実験 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 29 6.3 システム性能評価実験 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 31 6.4 システム性能に対する考察 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 33 6.5 おもしろさの評価の比較 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 34 6.6 システム性能の考察 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 37 6.7 生成されたなぞかけの例 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 38 第7章 おわりに ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 39 謝辞 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 40 参考文献 ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 41 第1章 はじめに ユーモアの理解は人間の知的行動一つである。ユーモアや笑いに関する研究は、今日まで哲学、 心理学、社会学など様々な分野でなされており、多くの理論や仮説が存在する。近年では人工知 能の分野でもユーモアの理解と生成に関する研究が行われている[1]。人工知能分野でおもしろさ の特徴や程度を定量化している研究として[2,3]がある。文献[2]では、心理学モデルにファジィ理 論を応用し、話を聞くことで生じる笑いの程度を推定するモデルを構築している。文献[3]では、 落語、漫才、CM のおもしろさの特徴を分析・比較している。一方、ユーモアが発生する構造を 用いて新たなユーモアを生成する研究も行われている。文献[4,5]では、駄洒落や駄洒落なぞなぞ の構造を解析し、それを用いて新たな駄洒落を生成している。また、これらの研究では、生成さ れたユーモアを評価・検証することで、ユーモアに対する新たな知見を得ている。ユーモアの研 究が進むことでより快適なインタフェースが導入されるという考えもあり[1,4,6]、実際に商品化 されている例もある。この商品化されたソフトは、画面上のオウムをモチーフにしたキャラクタ ーが、ユーザーが入力した言葉に因んだ駄洒落を話しかけてくるという「だじゃれどりアララ」 [7]というものである。このようにユーモアに関する研究は学術的な価値だけでなく、ヒューマン フレンドリーなシステムを構築するという実用的な価値もあると考えられる。 従来の研究、例えば文献[4,5]では、人間が内容を理解できおもしろいと思える駄洒落ができて いる。しかしこれらの研究では、使用される言葉の音韻の類似性や文法的な規則によって駄洒落 を生成しており、 「おもしろいか」を基準にしてはいない。したがって従来の研究では、結果的に おもしろい駄洒落が得られているにすぎない。 文献[8,9]では、言葉遊びの一つである「なぞかけ」を題材に、なぞかけに使われる言葉の関係 という観点からおもしろさを捉え、なぞかけを生成するシステムを構築している。文献[9]では、 言葉の関連性がおもしろさに影響する 1 つの要因であることを被験者実験によって確認するとと もに、人間は言葉の関連に加えて言葉から想像される情景や表現方法、音韻が一致している部分 の長さなどの要因を総合的に考えておもしろさを評価しているという考察が得られている。本論 文ではこれらの考察をもとに、人間が「おもしろい」と感じられるなぞかけを生成する目標のた め、複数の観点からなぞかけのおもしろさを総合的に評価する。また、なぞかけのおもしろさに 対するシステムと人間の評価を比較することで、システムの評価が人間の評価と合っていること を示す。 本論文ではまず、2 章でなぞかけの構造とおもしろさのしくみについて概説する。3 章ではなぞ 1 かけを生成するシステムについて説明し、4 章ではシステムの性能を評価する実験と結果の考察 を行う。また、5 章では得られた考察をもとにシステムを改良し、6 章で再度評価実験を行う。最 後に 7 章でまとめと今後の課題について述べる。 2 第2章 なぞかけの構造とそのおもしろさ この章では、本研究で取り扱うなぞかけの性質と、なぞかけに使われる言葉の構造について説明 する。また、なぞかけ生成の経験者の知見などから得た、 「おもしろい」なぞかけを生成するため に考慮すべき点について述べる。 2.1 なぞかけとは なぞかけは、 「お題」として言葉 A が与えられたとき、 A 、 B 、 C 、 C ′ の 4 つの言葉を用いて 「 A とかけて B ととく。そのこころは C / C ′ 。」という形式の文を考える言葉遊びであり、落語の 大喜利の題材としてもよく用いられている。前半の「 A とかけて B ととく。」の部分で一見関係の ない A と B という言葉をあげ、後半の「そのこころは C / C ′ 。」の部分で C と C ′ という言葉を介し てその何らかの共通点を示す。 コンピュータ上でおもしろさを扱う研究でなぞかけを題材に用いる理由として、以下の 3 点が 挙げられる。 (1) 文の形式に規則があること なぞかけは、前半のなぞを出題する「 A とかけて B ととく。」という文と、そのなぞの答え を示す「そのこころは C / C ′ 。 」という文の 2 文で構成される。このようになぞかけは、表 現方法の一要因である文の形式と内容の展開方法が決まっている。そのため小噺などの形 式の自由な文章を生成する際に必要な複雑な言語処理や、ストーリーの展開方法の良し悪 しによるおもしろさの影響を考慮する必要がなく、基礎研究としてコンピュータ上で扱い やすい。 (2) 内容の多様性 上述したように、なぞかけは文の形式が決まっているが、使用される言葉によって生成さ れるなぞかけの内容は非常に多岐にわたる。そのため複数のなぞかけを提示されても、内 容がワンパターン化せず、なぞかけの答えである「こころ」の部分が容易に予想できない。 3 (3) 比較評価の容易さ 1つの構造を用いて様々な内容のなぞかけを生成することができるため、複数のなぞかけ のおもしろさやおもしろさの理由を比較評価することができる。おもしろさの評価が高い なぞかけとおもしろさの評価が低いなぞかけの、異なる部分に注目することで新たなおも しろさの要素を発見することができる。 2.2 なぞかけの構造の分類 なぞかけは、使われる A 、B 、C 、C ′ の4つの言葉の関係から 3 種類に分類することができる。 以下では 3 種類のなぞかけの構造についてそれぞれ説明する。 2.2.1 構造 1 1番目の分類は文字の形状を利用したなぞかけである。 例 1)青とかけて曇天ととく。そのこころは日が出て晴れる[10]。 例 2)逢うとかけて衣の綻びととく。そのこころは糸で縫う[10]。 この種類のなぞかけは「字なぞ」とも呼ばれており、使われている 4 つの言葉の関係は図 2.1 のようになっている。 B C( ) Aとかけて ととく。そのこころは C′ 字 の一部 と全体 C A 音韻的類似 C′ 関係はない 図 2.1 性質の 説明 B なぞかけの構造 1 例1では、 「青」という字に「日」という字をつけると「晴(れる)」という字になり、また「曇 天」は「日」が出て「晴(れる)」という性質がある。「青」と「曇天」は一見全く関係のない言 4 葉に見えるが、「日が出て(日という辺をつけると)晴れる(という字になる)」という意外な共 通点でまとめることによって納得感を出している。 2.2.2 構造 2 2 番目は単語または文章中の 1 文字の場所を説明する形のものである。 例 3)あさきのさの字とかけて十五夜の月とく。そのこころは秋の中だ[10]。 例 4)いろはのろの字とかけて野辺の朝露と解く。心は葉(は)の上にある[10]。 図 2.2 にこの構造での 4 つの言葉の関係を示す。 B C( ) Aとかけて ととく。そのこころは C′ 語中の 1文字と 全体 C A 音韻的類似 C′ 関係はない 図 2.2 関連性 B なぞかけの構造 2 例 3 で説明すると、あさきの「さの字」は「あ(の字と)き(の字の)中」にある。また「十 五夜の月」も「秋の中」に現れる。ここでは「あ(の字と)き(の字)」と「秋」の音が一致して いることから「秋/あきの中」ということで「さの字」と「十五夜の月」の共通点を示している。 2.2.3 構造 3 3 番目は字の形や語中の文字に関わらず、言葉の関連と音韻の類似からのみできているなぞか けである。 例 5)台風とかけて血液型とときます。そのこころは大型(O 型)もあります この構造での 4 つの言葉の関係を図 2.3 に示す。 5 B C( ) Aとかけて ととく。そのこころは C′ C 関連性 A 音韻的類似 C′ 関係はない 図 2.3 関連性 B なぞかけの構造 3 例5では「台風」と「大型」、「血液型」と「O 型」には意味的に関連があり、また「大型」と 「O 型」は音韻が類似している。 「台風」と「血液型」という一見関係ない言葉を「大型(O 型)」 という音韻の類似した言葉で関連を示している。 本論文では以上 3 つの構造のうち最も一般的であり、また A 、 B 、 C 、 C ′ にあたる言葉を単語 として扱える 3 番目の構造を持つなぞかけを対象とする。また、図 2.3 の 4 つの言葉の関係を以 下「なぞかけの基本構造」と呼ぶ。 2.3 なぞかけのおもしろさ なぞかけの基本構造では、 A と C 、 B と C ′ はそれぞれ意味的な関連性がある言葉の組で、 C と C ′ は音韻が一致または類似している言葉の組である。また、それ以外の言葉の組(例えば B と C ) は、それぞれ関連性がないか、あっても非常に低い関連性の言葉の組になっている。 しかし、4 つの言葉がなぞかけの基本構造を満たしていても「おもしろい」なぞかけになると は限らない。おもしろいなぞかけを作るためには、この基本構造を満たした上でさらにいくつか の点を考慮する必要がある。 なぞかけは、前半の部分で一見関係のない A と B をあげ、後半の C と C ′ を介してその意外な関 係を示す。このことで意外性と納得感が生まれ、それがおもしろさを引き起こす。容易に思いつ く言葉を用いると「こころ」の部分が予測できおもしろくない。逆に思いつくのが困難な言葉を 用いると納得できずおもしろくないか、場合によっては内容が理解できず、なぞかけとして成立 していないとみなされることがある。 6 第3章 なぞかけ生成の基本システム この章では、なぞかけを生成するシステムの構成となぞかけの生成手順について述べる。シス テムは言葉のデータベースを利用し、人間がなぞかけを生成する手順に従ってなぞかけに用いる 言葉を選択する。システムは、言葉の選択の際に言葉の関連度という観点でおもしろさを判断し、 「意外性」があり「内容が理解・納得」できるなぞかけを生成する。 3.1 システムの概要 2.2.3 の基本構造をもつなぞかけを生成するシステムを考える。図 3.1 にシステム全体の概要を 示す。 データベース お題 入力 関連度と音韻の判断 出力 なぞかけ システム 図 3.1 システムの概要 お題として 1 つの言葉を入力すると、システムは後で述べる言葉の関連度と音韻をもとにして 言葉のデータベースを検索し、お題についてのなぞかけを出力する。なぞかけは 1 つのお題につ いて複数出力されることもある。 7 3.2 データベース システムが利用するデータベースには、ネットワーク構造で言葉が格納されている。なぞかけ に用いる言葉(図 2.3 の A 、 B 、 C 、 C ′ )は、その言葉の読みを表わす文字列、関連のある任意個 数の言葉(以下関連語と呼ぶ)と関連の度合いを表す関連度から構成される。例えば、図 3.2 に 示すように「桜」という言葉の関連語は、「咲く」、「散る」、「植える」、「見る」といった動詞や、 「吹雪」、 「4月」、 「花見」といった名詞、 「きれい」といった形容詞などである。データベースに 格納される言葉は 220 語で、それらは言葉遊び辞典[10]から、時代背景などに影響される言葉や 固有名詞などを除いて作成したものである。 花見【hanami】 0.97 0.73 咲く【saku】 0.85 0.6 桜【sakura】 0.67 吹雪【fubuki】 0.5 もち【moti】 図 3.2 データベースのイメージ図 言葉の間には関連度が設定されている。関連度は被験者に対して行ったアンケートをもとに [0.0,1.0]の値を設定している。設定方法の詳細については 4.1 節で述べる。 3.3 なぞかけ生成の手順 人間がなぞかけを考えるときの方法として、一般に以下の方法が述べられている[11]。与えら れたお題である言葉 A から、まず落ちになるこころの言葉 C を考え、見つけた言葉 C と音韻的に 似ている言葉 C ′ を考える。考え付いた言葉 C ′ と関連のある言葉 B を考え、 「 A とかけて B ととく。 そのこころは C / C ′ 。」というなぞかけの文の形式で表現する。 本システムでは、この人間がなぞかけを考える方法に則った手順で、図 2.3 の基本構造を満た す 4 つの言葉を決定する。 本システムにおけるなぞかけの生成手順は以下の 5 ステップから成る。 生成の流れを図 3.3 に示す。 8 1. 入力された「お題」を言葉 A とする。 2. データベースから A を検索し、その関連語を言葉 C とする。 3. C の音韻を調べ、音韻的に類似した言葉を C ′ とする。 C ′ は A 、 C に対して関連語でない ことを確認する。 4. C ′ を検索し、その関連語を言葉 B とする。言葉 B は A 、 C 、 C ′ に対して関連語でないこ とを確認する。 5. 手順1∼4で A → C → C ′ → B の順に言葉がすべて見つかった場合「 A とかけて B ととく。 そのこころは C / C ′ 。」というなぞかけの文の形で出力する。 開始 お題Aの入力 1 Aを検索 C’があるか? Yes No Aがあるか? Yes No C’の関連語Bを検索 Aの関連語Cを検索 Cがあるか? Yes Bがあるか? Yes No No なぞかけを出力 音韻類似語C’を検索 生成失敗 1 終了 図 3.3 なぞかけ生成の流れ図 C 、 C ′ 、 B は候補が複数になることもあるため、1 つのお題 A について複数のなぞかけが出力 されることもある。 9 3.4 関連度の範囲 図 2.3 の基本構造で示す通り、 「 A とかけて B ととく。そのこころは C / C ′ 。」というなぞかけの A と C 、 B と C ′ は、それぞれ関連をもつ言葉の組である。何らかの関連のある語を当てはめれば 形式的にはなぞかけが成立する。しかし A から C 、または B から C ′ の関連度が高い、つまり容易 に思いつく言葉を用いている場合は、落ちであるこころの部分がわかってしまうため、意外性が ないなぞかけになり、おもしろくない。逆に関連度が低い、つまり思いつくのが困難な言葉を用 いている場合は、こころの部分を聞いても納得できず、おもしろさを感じないか、極端な場合は なぞかけとして成立していないとみなされることがあり、おもしろくない。 そこで生成されるなぞかけの候補を関連度によって選択し、 「意外性」があり「内容が理解・納 得できる」程度の関連度を持つなぞかけのみを提示する。関連度の範囲に含まれていないなぞか けは提示しない。選択される関連度の範囲の決定方法については 4.2 で述べる。 3.5 音韻的な類似性の判断 3.3 の手順 3 で、システムが言葉 C から言葉 C ′ を決定するときは音韻の類似性を考慮している。 以下の規則に従って 2 つの言葉の音韻の類似度を求める。 1. 違いが全くない場合、2 つの言葉の音韻の類似度は 1 とする。 2. 1 音素違う場合は表 3.1 に示す音素類似度[4]を参照し、違っている 2 つの音素間の類似度 を言葉全体の類似度とする。 3. 2 音素以上異なっている場合は、類似度は 0 とする。比較する 2 つの言葉は、音韻の類似 度は 0.6 を閾値とし、0.6 以上であれば「類似している」、0.6 未満であれば「類似していな い」とみなす。 10 表 3.1 音素類似度 比較対象音素 音素類似度 b,d,g p,t,k m,n,N h,s a,o,u e,i s,z b,p d,t g,k 上記以外の母音間 上記以外の子音間 一音素の脱落・挿入 0.9 0.9 0.9 0.8 0.7 0.7 0.6 0.6 0.6 0.6 0.5 0.1 0.1 11 第4章 評価実験 1 3 章で述べたシステムが生成するなぞかけに対し、被験者による評価実験を行う。実験は、ま ず言葉の組の関連度を設定する関連度設定実験、なぞかけ生成に用いる関連度の範囲を決定する 範囲決定実験の 2 つの予備実験を行って関連度と生成時に用いられる関連度の範囲を決定し、さ らにシステム評価する実験という流れで行う。また、関連度の範囲を設定したことの妥当性を、 人間の挙げるおもしろさの理由をもとにして検証し、なぞかけのおもしろさの要素について考察 する。 4.1 関連度設定実験とデータ作成 関連度は人間が感じている言葉のつながりを反映するために、被験者実験で求める。20 代の男 女 6 名に対してデータベース内の 1 組の言葉を提示し、その関連の強さを以下に示す 5 段階で点 数付けしてもらう。 強い 5点 少し強い 4点 ふつう 3点 少し弱い 2点 弱い 1点 各言葉の組に対して被験者 6 名の評価の平均値を求め、[0.0, 1.0]の値に正規化したものを関連 度として設定する。表 4.1 に関連度設定の一例を示す。 12 表 4.1 被験者 言葉の組 新聞 - 刷る バット - 野球 川 - 橋 4.2 関連度設定の一例 A B C D E F 平均値 関連度 3 3 2 3 2 4 5 5 5 4 5 4 4 4 4 4 3 2 2.83 4.67 3.50 0.57 0.93 0.70 関連度の範囲決定実験 次に、なぞかけ生成の際に選択する言葉の関連度の範囲を決定するための実験を行う。前節で 作成したデータベースを用いてなぞかけを生成し、被験者におもしろさを以下の 5 段階で点数付 けしてもらう。被験者は前節のデータ作成実験に関わっていない 20 代男性 4 名である。 おもしろい 5点 少しおもしろい 4点 ふつう 3点 少しおもしろくない 2点 おもしろくない 1点 関連度の範囲を広げると、なぞかけの言葉の候補としてより多くの言葉が選択されるため、生 成されるなぞかけの数は関連度の範囲に依存する。本実験ではこのなぞかけの生成数と、生成数 に対する評価の高いなぞかけの数の割合という 2 つの観点から、なぞかけ生成に用いる関連度の 範囲を決定する。生成数を考慮するのは、生成されるなぞかけが少なすぎるとシステムの評価実 験に用いる範囲として適さないためである。関連度の上限と下限を変えたときシステムから生成 されたなぞかけののべ数(システムの生成数×被験者 4 名)と、のべ生成数に対する評価が高い (4 点以上の)なぞかけの割合を表 4.2 に示す。 13 表 4.2 上限 下限 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.60 8 25.0% 8 25.0% 範囲別ののべ生成数と評価が 4 以上のなぞかけの割合 0.65 8 25.0% 8 25.0% 4 50.0% 0.70 68 29.4% 68 29.4% 48 31.3% 48 27.1% 8 25.0% 0.75 52 27.2% 52 27.2% 60 30.0% 48 27.1% 6 29.2% 8 12.5% 0.80 148 27.7% 148 27.7% 112 29.5% 100 27.0% 68 26.5% 84 31.0% 8 12.5% 0.85 204 31.4% 204 31.4% 160 30.6% 148 30.4% 116 28.4% 84 31.0% 24 16.7% 16 12.5% 0.90 272 32.7% 272 32.7% 220 32.7% 204 32.4% 160 34.4% 124 36.3% 56 32.1% 84 19.0% 0.95 332 32.5% 332 32.5% 272 32.0% 256 32.0% 196 31.6% 164 32.2% 84 32.3% 84 32.1% 1.00 356 30.6% 356 30.6% 332 30.5% 276 30.1% 224 29.9% 188 31.4% 108 26.9% 96 28.1% 生成数 割合 表 4.2 より、評価の高いなぞかけの割合が最も高いのは関連度が[0.55,0.65]のときの 50%であ るが、この場合は生成数が 1(のべ生成数は 4)と少なく、システムの評価実験のために用いる値 として適切ではない。評価の高いなぞかけの割合が 2 番目に高いのは関連度の範囲を[0.70,0.90] に設定したときで 36.3%である。また生成数からみても 31(のべ生成数は 124)であることから、 今回は[0.70,0.90]を範囲として用いる。なぞかけはこの範囲に含まれている関連度をもつ言葉の みを用いて生成される。 システム評価実験 4.3 4.2 節で設定した関連度の範囲で生成されるなぞかけを用いて、システムの性能を評価する実験 を行う。被験者はこれまでの実験に関わっていない 18∼25 才の大学生・大学院生の男女 29 名で ある。29 名のうち 5 名は、お題を与えられてなぞかけを考え、作ったなぞかけを人前で発表する という行為を日常的に行っている筑波大学落語研究会のメンバーであり、この 5 名をグループ X とする。残りの 24 名は、なぞかけ生成の経験がない学生で、グループ Y とする。両グループに対 してシステムが生成した 31 のなぞかけを以下の 3 つの点についてそれぞれ 5 段階の評価をして もらう。 ・意外性があるか 5:ある 4:少しある 3:ふつう 2:少しない 1:ない 14 ・内容が理解、納得できるか 5:できる 4:少しできる 3:ふつう 2:少しできない 1:できない ・総合的にみておもしろいか 5:おもしろい 4:少しおもしろい 3:ふつう 2:少しおもしろくない 1:おもしろくない なぞかけ評価アンケートの結果 4.4 29 名の被験者が各項目に与えた評価の平均値を図 4.1 に示す。 5 4 評 価3 値 3.7 3.6 3.0 3.0 3.0 グループX(5名) グループY(24名) 全被験者(29名) 3.2 2.5 2.6 2.6 2 1 意外性 図 4.1 理解・納得 評価項目 なぞかけの評価の平均と標準偏差 15 総合 まず「意外性があるか」の項目については、評価の平均値は 3.0、また評価が高い(4 以上の)な ぞかけの割合は全体の 37.3%を占めている。逆に評価が低い(2 以下の)なぞかけの割合は 31.0% である。また項目 B「内容が理解・納得できるか」は、平均値 3.6、評価が 4 以上の割合も 55.8% と過半数を超えており、理解・納得できるものができている。最後に項目 C の総合評価について は平均値が 2.6 となり、「3:ふつう」を下回る結果になっている。 グループ X とグループ Y の評価の平均値を比較すると、 「意外性」と「総合的にみておもしろい か」の項目について有意差はあるとはいえない。 「内容が理解・納得できるか」に関しては 5%水 準で有意差が見られる。グループ X の被験者は普段作ったなぞかけを口頭で発表している。その ため字を読んで理解できるかに加え、音として耳から聞いて理解できるかという点も考慮に入れ ているという背景があり、その分評価が厳しくなったと考えられる。 実験後に被験者から得られた感想として、 「なぞかけ生成は非常に難しい作業という認識をして おり、システムの能力に驚いた」というものがある。なぞかけのおもしろさに対しての評価は低 くても、なぞかけを生成できるというシステムの能力に対しては評価が与えられている。 4.5 関連度の範囲を設定することの妥当性に関する検証 なぞかけに使われる言葉の関連度の範囲を定めるというシステムの方針が妥当であることを確 かめるための検証を行う。 1つのお題について生成された複数のなぞかけを被験者に提示し、その中で一番おもしろいと 思うなぞかけを選択してもらう。提示するなぞかけは、関連度が範囲に含まれているものとそう でないものが混ざっており、被験者にはシステムがそのなぞかけをおもしろいと判断したかどう かは知らされていない。被験者には、そのなぞかけを選択した理由、もしくは選択しなかった理 由を記述してもらう。被験者は 20 代男女9名である。システムと被験者の判断の組み合わせ別に 見た割合と、それぞれの組み合わせについて被験者が挙げた理由を表 4.3 に示す。 表 4.3 システムと人間の判断の組み合わせと、被験者が挙げた判断の理由 シス テム 人 間 ○ ○ × ○ × × 割合 理由 意 外 性 、イメ ー ジしや す い 、身 近 な 言 葉 1 4 .1 % 自然である 音 韻 に 無 理 が あ る 、縁 起 が 悪 い言 葉 2 5 .2 % 意 外 性 、 納 得 で き る 、 Aと B が 意 外 (* ) コミカル 、趣 き が あ る 、強 引 さ 思 い つ か な す ぎ る 、思 い つ い て しまう 4 0 .7 % か か って いる 言 葉 が 短 すぎ る、音 韻 (* )「 Aと か け て B と と く に 」 あ た る 二 つ の 言 葉 2 0 .0 % 16 表 4.3 に示すように、システムと人間の判断の組み合わせは、システムと人間の選択が一致し た 2 通り(システム・人間共に選択した場合、システム・人間共に選択しなかった場合)と、シ ステムと人間の選択が一致しなかった 2 通り(システムは選択したが人間は選択しなかった、シ ステムは選択しなかったが人間は選択した)に分けることができる。以下ではそれぞれの場合に ついて例を挙げて述べる。 (1)システム・人間共に「おもしろい」と判断したなぞかけ 例 花見とかけてイクラととく。そのこころは酒/サケ。 例 僧とかけておみくじととく。そのこころは経/凶。 被験者が上の例のなぞかけを「おもしろい」とした理由は「意外性がある」ことである。シス テムと人間が共に「おもしろい」と判断した例では、被験者はその他に「人間が作ったような自 然な印象を受ける」 (下例)、 「身近な言葉が使われている」 、 「思いつきやすい」などの理由が挙げ ている。 (2)システムは「おもしろい」と判断したが、人間は「おもしろくない」と判断したなぞかけ 例 てんぷらとかけて蓋ととく。そのこころは揚げる/開ける。 このなぞかけを人間が選択していない最も大きな理由は「音韻的に似ていると思えない」とい うものである。この判断の組み合わせでは、音韻的な問題に関する理由が最も多くなっている。 その他にここでは考慮していない「縁起が悪い言葉を使っている」といった単語自体のイメージ による理由から、被験者はそのなぞかけを選択していない例もある。 (3)システムは「おもしろくない」と判断したが、人間は「おもしろい」としたなぞかけ 例 花見とかけて湿布ととく。そのこころは春/貼る。 例 僧とかけててんぷらととく。そのこころは衣/ころも。 上の 2 つの例では、システムはそれぞれ「関連度が高すぎて意外性がない」 (上例)、 「関連度が 低すぎて納得できない」 (下例)の理由で選択していない。しかし人間は、 「『花見』と『湿布』の ギャップが大きい」(上例)、「全体を読んだ時におもしろいイメージが浮かぶ」(下例)ことを理 由に選択している。その他にここでは考慮していない「言葉自体の印象がおもしろい」、「強引さ が逆におもしろい」という理由も挙げられている。 (4)システム・人間共に「おもしろくない」としたなぞかけ 例 新聞とかけてマッチととく。そのこころは刷る/擦る。 システムはこのなぞかけを「関連度が低く思いつきにくい」ため選択しておらず、また人間も 「『新聞』から『刷る』が思いつきにくい」ことを理由に選択していない。システムと人間が共に 「おもしろくない」としたなぞかけでは、その他に「思いつきやすく意外性がない」、「音韻がか かっている部分が短すぎる」という理由が挙げられている。 17 4.6 考察 以上の実験結果から、言葉の関連度が高く当たり前すぎて思いついてしまう意外性のないなぞ かけや、逆に関連が低くて思いつきにくく納得できないなぞかけを候補から除くという本システ ムの方針は妥当であると言える。しかし言葉の関連度とは別の理由からおもしろいと思うなぞか けを選択している被験者もおり、人間がおもしろさを感じるには単語自体の持つイメージや文章 全体から想像される情景、表現の人間らしさなど多くの要素が影響していることがわかる。した がって、人間がよりおもしろいと感じるなぞかけを選択して提示するには、システムで考慮して いる関連度に加えて表現や言葉から思い浮かぶ情景の点も考慮し、総合的なおもしろさを評価す ることが必要と考えられる。 またシステムが用いているデータベースに含まれる言葉は 220 語であり、決して十分な量とは いえない。また、システムでは 1 組の言葉 A と言葉 B の間に「関連度」として 1 つの値を与えて いるが、言葉の組によっては A から B と B から A の思いつきやすさが違うことも考えられる。デ ータベースが改善されても必ずしもおもしろいなぞかけが生成できるとは限らないが、より多く のおもしろいなぞかけを生成するにはデータベースの量と質を充実させることも必要である。 18 第5章 システムの改良 この章では、4 章で行った実験の考察をもとにシステムを改良する。改良後のシステムは、 「連想 のしやすさ」 「音韻」「典型的な表現の付加」を評価し、さらにおもしろさを 3 つの観点から総合 的に評価するしくみを持つ。 5.1 システムの改良 3 章で示したシステムでは、1 組の言葉にその関連の強さとして 1 つの関連度を与えている。し かし言葉の組によっては、言葉 A から言葉 B への連想のしやすさと、 B から A への連想のしやす さは異なる。なぞかけでは、こころの部分の連想のしやすさをより的確に評価することが必要と 考えられる。そこで言葉の組 A と B に対し、関連度の向きを考え、それを連想のしやすさとして 扱う。 4 章で行った実験の結果から、言葉の関連がおもしろさに影響する 1 つの要素であることが確 認されている。しかし人間がなぞかけをおもしろいと感じるには、その他の様々な要素も考慮す る必要がある。 まず考慮すべき点として「音韻」と「表現の付加」の評価方法がある。音韻に関して、システ ムでは音素を比較する方法で判断しているが、人間にとって「類似していると思えない」と感じ る例もあり、なぞかけに適した評価方法に改良する必要がある。また、同じ言葉を用いていても、 文章を付加して表現を変えることでなぞかけのおもしろさが増すことがある。特に後半のこころ の部分はなぞかけの「落ち」になる重要な部分で、その表現を付加したり変えたりすることでよ り「おもしろい」と感じられるなぞかけを作ることができる。落語研究会に所属し、普段からな ぞかけを考え人前で発表するという行為を行っている人は、なぞかけ生成の方法やおもしろくす る方法を経験的に身につけている。そのような人が、なぞかけをよりおもしろくするために表現 を付加する例をあげる。 19 ・ 「宴会とかけて中国ととく。そのこころは幹事/漢字。」 ⇒「宴会とかけて中国ととく。そのこころは幹事/漢字が重要です。」 ・ 「鉄道とかけて取材ととく。そのこころは汽車/記者。」 ⇒「鉄道とかけて取材ととく。そのこころは汽車/記者がつきものです。」 (筑波大学落語研究会のメンバーに対して行ったなぞかけに関するインタビューから) これらの知見をもとに、なぞかけを生成する際に「連想のしやすさ」 、「音韻」、「典型的な表現 の付加」を評価し、さらに 3 つの観点からおもしろさを総合的に評価することで、人間にとって より「おもしろい」なぞかけを生成できるようにシステムを改良する。改良されたシステムの概 要を図 5.1 に示す。 連想語DB 音韻DB 表現付加DB 表現付加 お題 入力 なぞかけの生成と評価 出力 なぞかけ システム 図 5.1 改良されたシステムの概要 お題として 1 つの言葉を入力すると、システムは連想語データベース、音韻データベース、表 現付加データベースの 3 つのデータベースを参照しながら、図 2.3 で述べたなぞかけの基本構造 を満たす言葉を選択し、なぞかけの文章の形で出力する。その際、構造を満たすだけでなく、 「連 想のしやすさ」、「音韻の類似性」、 「典型的な表現が付加できるか」の 3 点を総合したおもしろさ を評価して、なぞかけに用いる言葉を選択する。また、なぞかけに使われる典型的な表現が付加 できる場合は、表現を付加した形のなぞかけ出力する。 20 5.2 データベース 改良されたシステムで使用するデータベースは「連想語データベース」 「音韻データベース」 「表 現付加データベース」の 3 つである。以下でそれぞれのデータベースについて説明する。 5.2.1 連想語データベース 連想語データベースには、大規模な連想実験をもとに作成された連想概念辞書[12]を利用する。 連想概念辞書では、ある刺激語から連想される言葉(これを連想語と呼ぶ)の連想のしやすさを連想 距離として定義している。刺激語からの連想距離が短い連想語ほど連想しやすく、連想距離が長 い連想語ほど連想しにくいという性質をもつ[13]。 本システムでは上記の連想概念辞書のうち、刺激語、連想語、連想距離の 3 項組を連想語デー タベースとして使用する。表 5.1 に連想語データベースに格納されているデータの例を示す。表 の例では、「雪」という言葉からは連想距離の短い「粉雪」 「結晶」という言葉が連想しやすく、 それらと比較して「北極」は連想距離が長く連想しにくい言葉になっている。この連想距離を利 用して、なぞかけのこころの部分の言葉の連想のしやすさの程度を判断する。 表 5.1 刺激語「雪」に対する連想語データベースの例 ⋮ ⋮ ⋮ 刺激語 連想語 連想距離 雪 天気 4.320 雪 粉雪 2.295 雪 結晶 1.890 雪 北極 8.910 また、連想距離は言葉 A から言葉 C と、言葉 C から言葉 A では異なる値が設定されている。こ のため、連想する言葉の方向を考えていない関連度と比較すると、より的確に「こころ」の部分 の連想のしやすさを評価することができる。 5.2.2 音韻データベース 音韻データベースは 5.2.1 の連想語データベースの刺激語と連想語に NTT の言語データベース [14]の音韻を付加したものである。子音のみ・母音のみの置換の評価をしやすくするため、音韻 情報はローマ字表記にする。 21 5.2.3 表現付加データベース 表現付加データベースは、1 組の刺激語と連想語の関係を説明するのに適した表現が格納され ている。表現はなぞかけの文の最後に付加される。表現は Web 上で公開されているなぞかけ[15] と、筑波大学落語研究会の公演ビデオから抽出された、なぞかけに使われる頻度が高く一般的と 思われるものを利用している。付加される 10 種類の表現を表 5.2 に示す。 表 5.2 付加される 10 種類の表現 番号 1 2 3 4 5 6 7 8 9 10 表現 のひとつです もあるでしょう が欠かせません なものです ともいいます することもあるでしょう によくあります がつきものです がなくては味気ないです の具合が気になります 1 組の刺激語と連想語に対して、どの表現が付加されるかは、以下の規則に従って定める。 規則 1:連想概念辞書[12]で、「1:上位概念」「2:下位概念」「3:部分・材料概念」「4: 属性概念」 「5:類義概念」 「6:動作概念」 「7:環境概念」の関係を持つ刺激語と 連想語の組は、それぞれ表 3.2 の番号 1∼7 の表現が付加できるものとする。 規則 2:連想概念辞書[12]で、上記の 7 種類の関係以外の「8:その他」の関係を持つ刺激 語と連想語の組は、被験者の判断から付加できる表現を定める。 なお、刺激語と連想語の組によっては複数の関係を持つものもあるため、1 組の刺激語と連想 語に付加できる表現は複数になることもある。 5.3 なぞかけ生成の手順 改良後のシステムでは、4 つの言葉が選択された後に、そのなぞかけのおもしろさを総合的に 評価する手順が改良前のシステムに追加され、 「おもしろい」と評価されたなぞかけのみを出力す る。また、表現が付加できる場合は表現を付加した形のなぞかけを出力する。改良後のシステム 22 のなぞかけ生成の流れを図 5.2 に示す。 1 開始 No お題Aの入力 C’があるか? Yes C’の刺激語Bを検索 Aを検索 No Aがあるか? No Bがあるか? Yes Yes Aの連想語Cを検索 No Cがあるか? Yes No おもしろいか? Yes 表現付加可か? No Yes 音韻類似語C’を検索 追加された手順 おもしろさの評価 表現を付加 1 生成失敗 なぞかけを出力 終了 図 5.2 5.4 なぞかけ生成の流れ図(改良後) なぞかけのおもしろさの評価 基本構造を満たしたなぞかけがおもしろいかどうかを評価する方法について述べる。人間がな ぞかけのおもしろさを考える際は、さまざまな観点を総合してなぞかけ全体を評価している。音 韻が完全には一致していなくても連想しやすさが適当であれば全体としてはおもしろいなぞかけ になる、連想しやすく意外性が低い言葉ではあるが表現が付加できれば全体としてはおもしろい なぞかけになる、といったことが考えられる。そこでシステムはなぞかけ全体のおもしろさを、 23 連想距離、音韻、表現付加の 3 点から総合的に評価する。 5.4.1 連想距離に関する評価 図 2.3 の基本構造で示す通り、 「 A とかけて B ととく。そのこころは C / C ′ 。」というなぞかけの A と C 、 B と C ′ は意味的な関連性が存在し、それぞれ連想されうる意味をもつ言語対である。基 本構造を満たせばなぞかけとして成立するが、容易に連想できる言葉を用いたなぞかけや連想す るのが困難な言葉を用いたなぞかけはおもしろくない。 本研究で意図している「内容が理解・納得」でき、かつ「意外性がある」なぞかけを生成する ために、連想距離、つまり連想のしやすさを考慮する必要がある。適切な連想距離をもつ言葉は 「内容が理解・納得」でき、かつ「意外性がある」と考えられ、そのなぞかけの評価は高くなる。 適切な連想距離を表すファジィ集合のラベルを range とすると、ある連想距離 d がファジィ集合 range に属する度合いはメンバーシップ関数 µ range (d ) で表わされる。メンバーシップ関数 µ range (d ) は式 5.1 の性質を持つ。 0 ≤ µ range (d ) ≤ 1 (5.1) 連想距離に関する評価 D は以下の式 5.2 で定義する。 D = µ range (d AC ) ∧ µ range (d BC ′ ) (5.2) ただし、a ∧ b は a と b のうち小さい方の値をとる演算、µ range (d AC ) , µ range (d BC ′ ) はそれぞれ A か ら C 、 B から C ′ への連想距離 d AC , d BC′ のファジィ集合 range への帰属度である。 ある d AC , d BC′ が与えられたときの D の求め方を図 5.3 に示す。 帰属度 0 μrange(d) range 1 μrange(dBC’) μrange(dAC) この場合 D = μrange(dAC) ∧ μrange(dBC’) = μrange(dAC) dAC dBC’ 連想距離d 図 5.3 D の求め方の例 24 µ range (d BC′ ) と µ range (d AC ) の小さい方の値をとることでなぞかけ全体の連想距離の評価 D を決 定するのは、 D はファジィ集合 range への帰属度の低い連想距離の影響を強く受けるとの考えか らである。例えば、 A から C への連想距離が短く思いつきやすいなぞかけの場合を考える。 C が 容易に思いつくということは、こころの部分の一部がわかってしまい、 B から C ′ への連想距離に 関わらず全体として思いつきやすくおもしろくないなぞかけと評価される可能性がある。連想距 離が長い場合も同様のことがいえる。そのためシステムでは評価が低い方の値をなぞかけ全体の 評価とし、容易に思いついたり意外すぎて理解できなかったりする可能性のあるなぞかけの評価 が高くなることを防いでいる。 5.4.2 音韻に関する評価 音韻に関する評価は、 C と C ′ の音韻の類似性と音韻の長さから決定する。人間が作ったなぞか け[15]と、筑波大学落語研究会の講演ビデオ内で発表されたなぞかけを参考にし、音韻の類似性 P1 と音韻の長さ P2 を以下のように分類する。 音韻の類似性 P1 ・一致:2 つの言葉の音韻が完全に一致するもの 例)「炒める”itameru”」と「痛める”itameru”」 ・長短:短母音 2 つと長母音を置換したもの。 例)「カレー”kare-”」と「カレイ”karei”」 ・リズム:長音または促音を追加・削除したもの 例)「大河”taiga”」と「タイガー”taiga-”」 ・置換:子音または母音を置換したもの 例)「気持ち”kimochi”」と「キムチ”kimuchi”」 音韻の長さ P2 ・2 音以下 ・3 音 ・4 音以上 ただし、2 つの言葉の音韻の長さが異なる場合は、短い方の長さを用いる。 文献[5]では調音類似に基づいて駄洒落の音韻の評価値を設定している。なぞかけの音韻は駄洒 落の一種と考えることもできるが、満たすべき条件は異なり、駄洒落とは異なる評価をする必要 がある。駄洒落の場合、ある程度音韻が類似していれば駄洒落が成立しているとみなされるが、 なぞかけのこころの部分の C と C ′ の音韻は、一般的に完全に一致していることが前提である。音 韻が比較的長い場合は完全に一致しない例もあるが、 C と C ′ の音韻が短すぎると音韻が完全に一 25 致する場合でも「うまさ」が感じられなくなるため、評価が低くなる。これらの理由から、本シ ステムではなぞかけ独自の音韻の評価を設定する。類似性と長さの両方を合わせた音韻に関する 評価を表 5.3 に示す値で設定する。 表 5.3 音韻に関する評価 P 1 類似性 P 一致 長短 リズム 置換 P 2 4∼ 1 1 0.8 0.6 3 1 1 0.8 0 .4 2 0.8 0.8 0 0 単 語 長 例えば、 「ステッキ」”su/te/cq/ki/”と「素敵」”su/te/ki/”では、類似性 P1 は促音”cq”の挿入なので 「リズム」の類似、長さ P2 は音韻が短い「素敵」”su/te/ki/”の 3 が用いられ、 P = 0.8 となる。 5.4.3 表現付加に関する評価 表現付加に関する評価 K は、表現付加データベースを参照することで決定する。 A から C を連 想するときと、 B から C ′ を連想するときに付加できる表現の中で一致するものがある場合は、な ぞかけ全体として表現が「付加できる」、ない場合は「付加できない」とする。 K は以下の式で決定される。 1 K = 0 ( K AC I K BC ′ ≠ φ ) (5.5) ( K AC I K BC ′ = φ ) ただし K AC は、 A と C の関係を説明するときに付加できるとされた表現の集合、 K BC′ は、 B と C ′ の関係を説明するときに付加できるとされた表現の集合、 φ は空集合を表す。 例を挙げて説明する。 A 「体」から C 「歯」へは表 5.2 の番号 2 の表現「もあるでしょう」、 B 「木」から C ′ 「葉」へは番号 2 の表現「もあるでしょう」と番号 8 の表現「が欠かせません」が 付加できる。この場合は、 K AC = {2} K BC ′ = {2,8} K AC I K BC′ = {2} 26 より、 K =1 となり、全体としての番号 2 の表現「もあるでしょう」が「付加できる」という評価になる。 その結果、 「体とかけて木ととく。そのこころは歯/葉もあるでしょう。 」というなぞかけが出力さ れる。2 つ以上の表現が「付加できる」と評価された場合は、その中からランダムに選んだ表現 を用いて出力する。 5.4.4 総合評価 以上「連想距離」「音韻」「表現付加」という 3 つの観点を総合して、なぞかけ全体のおもしろ さを評価する。おもしろさの評価にはファジィ推論[16]を用いる。ファジィ推論は、 「連想距離が 適切で、音韻が短く、表現が付加できないならば、おもしろさは中程度である」など、人間の知 識を表現しやすいため、なぞかけの評価に適していると考えられる。 ファジィ推論で用いるルールを表 5.4 に示す。表 5.4 の S , M , B は、なぞかけ生成経験者の意見 や、4.4 の実験で被験者が述べたおもしろさの理由をもとに設定している。例えば表 5.4(a)の ( D, P, K , E ) = (B, B,1, B) は、 「思いつきやすさが適切で、音韻が一致かつ長く、表現が付加できるな らば、そのなぞかけはおもしろい」を表している。連想距離 D と音韻 P の両者とも値が大きい、 つまり「思いつきやすさが適切で、音韻が一致かつ長さが長い」なぞかけは全体の評価 E も高く なり、両者とも値が小さい時は E は低くなる。 K = 1 、つまり表現が付加できるときと、 K = 0 、 つまり表現が付加できないときを比較すると、表現が付加できるときの評価が高くなる。これら のルールと図 5.4 に示す三角型ファジィ集合を用いて総合的なおもしろさの評価を[0.0, 1.0]の値 で出力する。 27 表 5.4 総合評価のためのファジイルール (a)表現が付加できるとき E (K =1) P SS MS BM (b)表現が付加できないとき D S M S M B B S B B メンバーシップ値 1 0 P S D E (K =0) S SS MS BS M B 0.5 入力値 1 図 5.4 三角型ファジィ集合 28 M S S M B S M B 第6章 評価実験 2 この章では、改良後のシステムで生成されるなぞかけを評価する被験者実験について述べる。ま ず、表現付加データベースを構築するための実験と、なぞかけ生成の際に用いる適切な連想距離 を表すファジィ集合 range を求める予備実験を行う。次に、ファジィ集合 range を用いて出力した なぞかけで、システムの性能を評価する。また、なぞかけのおもしろさに対するシステムと人間 が行う評価との比較する。 6.1 表現付加データベースの構築 5.2.3 で述べた表現付加データベースを構築するための実験を行う。この実験によって、表現付 加データベースには、5.2.3 の規則 2 の「8:その他」の関係をもつ刺激語と連想語の組に対して、 その関係を説明する表現として適する表現が格納される。 被験者は 1 組の刺激語と連想語の関係を説明する文章として、表 5.2 の 10 種類の表現の中から 適するものを選択する。例えば、刺激語「花見」と連想語「桜」が提示され、被験者が番号 3 の 表現を用いて「『花見』は『桜』が欠かせません」、番号 8 の表現を用いて「『花見』は『桜』がつ きものです」 、番号 10 の表現を用いて「『花見』は『桜』の具合が気になります」とするとき、 「花 見」と「桜」に付加される表現の番号は「3、8、10」となる。 6.2 連想距離のファジィ集合決定のための予備実験 システムで生成の際に用いられる、なぞかけに適切な連想距離であるファジィ集合 range を求め るための実験を行う。この実験では、連想距離は制限なし、音韻は表 5.3 の 0.8 以上、表現が付 加できるものは付加する、という条件でなぞかけを生成する。音韻と表現付加の高い値を条件に するのは、純粋に連想距離となぞかけのおもしろさの関係を得るためである。 システムに「お題」として連想語データベースに格納されている言葉を与える。出力されたな ぞかけの中からランダムに選んだ 57 個のなぞかけを被験者に提示し、 「おもしろい/おもしろくな 29 い」のどちらかを選択してもらう。選択は「言葉のつながり方が思いつくか」 「内容が理解・納得 できるか」「意外性があるか」「容易に『こころ』の部分が思いついてしまわないか」を基準に行 う。被験者は 20 代前半の男女 7 名である。表 6.1 に被験者に提示したアンケートの例を示す。 表 6.1 予備実験のアンケートの例 ○ × ⋮ 吹く/拭くこともあります 鼻/花 毛/け 拭く/服 ⋮ ⋮ ⋮ 台風とかけて清掃員ととく。そのこころは うさぎとかけてかすみ草ととく。そのこころは 草食動物とかけてひらがなととく。そのこころは 皿とかけてファッションととく。そのこころは ○:おもしろい ×:おもしろくない 被験者の評価をもとに、なぞかけ生成に適切な連想距離を表すファジィ集合 range を求める。範 囲を広く設定すると選択される可能性のある言葉が増えるため、多くのおもしろいなぞかけを生 成することができる。しかし同時におもしろくないなぞかけも多く生成され、おもしろいなぞか けの割合が下がることもある。そこでファジィ集合 range は、おもしろいなぞかけの数ではなく割 合をもとに決める。表 6.2 に連想距離の範囲の上限・下限を変化させたときに「おもしろい」と 評価されたなぞかけの割合を示す。 表 6.2 範囲を変化させたときのおもしろいなぞかけの割合 上限 下限 1.5 2.0 2.5 3.0 1.0 NaN NaN NaN NaN 1.5 NaN NaN NaN 2.0 NaN NaN 2.5 NaN 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 3.5 0.2 0.2 0.3 0.4 0.0 4.0 0.2 0.2 0.3 0.3 0.1 0.1 4.5 0.3 0.3 0.4 0.5 0.4 0.4 0.7 5.0 0.3 0.3 0.4 0.4 0.3 0.3 0.4 0.1 5.5 0.3 0.3 0.4 0.4 0.3 0.3 0.3 0.1 0.1 6.0 0.3 0.3 0.3 0.4 0.3 0.3 0.3 0.2 0.2 0.3 6.5 0.3 0.3 0.3 0.4 0.3 0.3 0.3 0.2 0.2 0.3 0.3 7.0 0.3 0.3 0.3 0.3 0.3 0.2 0.3 0.2 0.2 0.2 0.2 0.0 7.5 8.0 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.2 0.2 0.3 0.3 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.2 0.0 0.0 NaN NaN NaN 8.5 0.3 0.3 0.3 0.4 0.3 0.3 0.3 0.2 0.3 0.4 0.4 0.4 0.9 0.9 0.9 9.0 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.4 0.4 0.4 0.4 9.5 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.4 NaNは、その範囲に設定したときなぞかけが1つも出力されず、評価ができなかったことを示す 30 表 6.2 では、表の右上に行くほど範囲が広くなっている。先ほど述べたように、範囲を広くす ると、おもしろいなぞかけと同時におもしろくないなぞかけが生成される可能性が増える。しか し範囲が狭すぎると、おもしろい可能性のあるなぞかけを除いてしまうことになる。システムで は連想距離の他に、音韻と表現の付加という観点も加えた総合的な評価を行っており、連想距離 の評価が中程度でも、音韻の評価が高く表現が付加できれば、総合的におもしろいなぞかけと評 価される可能性がある。そこで連想距離の観点のみの評価ではおもしろくなる可能性のあるもの をなるべく残し、総合的におもしろさを評価するという方針をとる。また、改良前のシステムで は、関連度の範囲を求め、範囲内の言葉のみを選択するという方法をとっている。改良後のシス テムでは適切な連想距離の範囲をファジィ集合で表すことで、おもしろい可能性のあるなぞかけ を残している。 おもしろいなぞかけの割合が最も高いのは範囲を[7.0, 8.5]、[7.5, 8.5]、[8.0, 8.5]に設定すると きで、おもしろいなぞかけの割合は 0.9 である。おもしろいなぞかけの割合が同じであれば、そ の中で最も広い範囲をファジィ集合 range の決定に用いる。そのため、この中で最も範囲が広い [7.0, 8.5]を使用する。また、おもしろいなぞかけが 1/3 以上となる範囲の中で最も範囲が広いの は[2.5, 8.5]である。そこでシステムで用いる適切な連想距離を表すファジィ集合 range を図 6.1 の ように定める。メンバーシップ値 0 以上になる範囲を[2.5, 8.5]、メンバーシップ値 1 となる範囲 を[7.0, 8.5]としている。 メンバーシップ値 1 0 2.5 7.0 8.5 連想距離 図 6.1 適切な連想距離の範囲を表すファジィ集合 range 6.3 システム性能評価実験 次にシステムが生成したなぞかけの内容を評価する被験者実験を行う。実験では、S 群、H 群 の 2 種類のなぞかけを混ぜて提示する。被験者は提示されたなぞかけがどちらの群に含まれるか は知らさていれない。 31 S 群:システムが出力したなぞかけ H 群:人間が作ったなぞかけ 30 9 S 群のなぞかけは、6.2 章で求めたファジィ集合 range を用いて生成したなぞかけである。シス テムのおもしろさの評価値 E は[0.0, 1.0]の値で表現される。評価値 E が 0.5 以上の場合、システ ムはそのなぞかけを「おもしろい」と評価したとし、実験ではその中からランダムに選択したも のを用いる。 H 群のなぞかけは、筑波大学落語研究会のメンバー6 名が生成したものである。落語研究会メ ンバーに与える「お題」は、連想語データベースからランダムに選択された 20 語とする。落語研 究会のメンバーには「なぞかけを人前で発表する」という状況を想定してもらい、 「考えついたが おもしろくないので発表はしない」と判断するなぞかけは除いてもらっている。1 つの「お題」 について生成するなぞかけの数は任意とする。複数思いついた場合はすべて記述してもらい、1 つも思いつかなかった場合は空欄にしてもらう。また生成されたなぞかけのうち、記述方法が明 らかに違い、内容に関わらず違いがわかってしまうもの、動作など文字で読んだときにわからな い情報や「私の○○」など生成者に依存する情報が含まれているもの、いくつかのなぞかけで連 作として作られたものは不適当なものとして除いている。 被験者は予備実験に関わっていない 20 代前半の男女 21 名で、いずれもなぞかけ生成の経験が 全くないか、個人的に考えたことがある程度で、なぞかけ生成に関する特別な知識は持っていな い。評価は以下の 3 項目についてそれぞれ 5 段階で行う。また「人間が作った」と思うなぞかけ に印をつけてもらう。 ・意外性があるか 5:ある 4:少しある 3:どちらともいえない 2:あまりない 1:ない ・理解、納得できるか 5:できる 4:少しできる 3:どちらともいえない 2:あまりできない 1:できない 32 ・おもしろいか 5:おもしろい 4:少しおもしろい 3:どちらともいえない 2:あまりおもしろくない 1:おもしろくない 6.4 システム性能に関する考察 被験者 21 名の評価の平均値と標準偏差を図 6.2 に示す。 5.00 4.50 4.00 4.25 3.80 3.61 3.50 S群(システム) H群(人間) 3.60 3.46 評 価 3.00 値 2.91 2.50 2.00 1.50 1.00 意外性 理解・納得 おもしろさ 評価項目 図 6.2 被験者 21 名の評価の平均と標準偏差 まず「意外性があるか」の項目に対しては、評価平均値が 3.80 となっており、意外性があるな ぞかけが生成できたといえる。「理解・納得できるか」については、平均値が 3.46 となり、人間 が理解できるものが生成できたといえる。3 つめの「おもしろいか」に対しては、被験者全員の 平均値は 2.91 と「3:どちらともいえない」を下回る結果になっている。 S 群(システムが生成したなぞかけ)と H 群(人間が生成したなぞかけ)を比較すると、「理 解・納得できるか」と「おもしろいか」の項目については 5%水準で有意差がみられ、人間が勝 っている。 「意外性があるか」については、システムと人間の間で有意差は見られない。また被験 33 者は、合計でのべ 171 のなぞかけを「人間が作ったなぞかけ」と判断している。171 のうち、実 際に人間が作ったなぞかけはのべ 87 で、正解率は 49%である。 これらの結果から、システムは「内容の理解・納得しやすさ」と「おもしろさ」の評価の高い なぞかけを生成する能力では人間に劣るものの、 「意外性のある」なぞかけを生成する点では同等 の能力があることがわかる。またなぞかけのおもしろさは低いが、用いた言葉や形式、内容は人 間と区別がつかない「人間らしい」なぞかけが生成できていることがわかる。 人間が生成した H 群のなぞかけのうち、多くの被験者が「人間が作った」と判断したなぞかけ を挙げる。括弧内に「人間が作った」と判断した人数を示す。 「家庭とかけて卓球ととく。そのこころは愛/愛が一番です。」(16 名) 「森とかけて謝るととく。総理/ソウリーもあるでしょう。」(11 名) 「点とかけて 999 ととく。そのこころは線/千ではありません。」(15 名) これらのなぞかけが「人間が作った」と判断された理由について考察する。1 つ目と 2 つ目の なぞかけでは、 「森総理」や「卓球」の「愛」選手といった固有名詞が使用されている。また、 「愛」 選手はニュースにもよく登場する現在話題の人物の 1 人といえる。連想語データベースにも著名 人の名前などの固有名詞が含まれているが、このような固有名詞や時代を反映した言葉を含むな ぞかけは「人間が作った」と判断されやすいと考えられる。 3 つ目のなぞかけでは「∼ではありません」という否定の表現が用いられている。ある言葉を 否定の表現を使って説明する方法は、なぞかけ生成において意外性と理解・納得度を同時に上げ ることのできる高度な技法である。被験者はこの高度な技法に関心させられ、 「人間が作った」と 判断すると共に、おもしろさの点でも高い評価(21 名の平均値 4.21)を与えている。また、提示さ れた 39 のなぞかけの中で唯一「999」という数字を用いていることも、「人間が作った」と判断 された理由の 1 つと考えられる。 6.5 おもしろさの評価の比較 システムは生成時に、連想距離、音韻、表現付加の 3 点から総合的なおもしろさを評価してい るが、その評価と人間が行うおもしろさの評価の比較を行う。 人間のおもしろさの評価は、被験者実験から決定する。システムが生成したなぞかけを 21 名の 被験者に提示し、そのおもしろさを「おもしろい」「どちらともいえない」「おもしろくない」の 3 段階で評価してもらう。提示されるなぞかけは、システムがおもしろさは低いと評価したもの と高いと評価したものが混ざっており、被験者にはシステムの評価値は知らされていない。また、 被験者は評価の理由も回答する。理由は以下に示す 7 種類の中から任意個選択する。7 種類の理 由の中には、肯定的な理由(「∼なのでおもしろい」)と否定的な理由(「∼なのでおもしろくない」) 34 が含まれている。選択肢の中に適する理由がない場合は自由に記述する。 A:意外性がある B:内容が納得できる C:情景などがイメージしやすい D:使われている言葉がおもしろい E:簡単ですぐに思いついてしまう F:意味がわからない、わかりにくい G:かかっている言葉が短い 被験者のなぞかけに対するおもしろさの評価には個人差がある。なぞかけによっては、 「おもし ろい」と評価する被験者と「おもしろくない」と評価する被験者が分かれるものもある。そのよ うななぞかけは、被験者の好みや気分など本研究で扱っていない不確定性の高いおもしろさの要 素を多く含む可能性が高く、おもしろさの評価とその理由をシステムと人間の間で比較する実験 に用いるのは不適切であると考える。そこで、以下 4 つの条件のいずれかを満たすなぞかけは多 くの人間が「おもしろい」または「おもしろくない」と評価するなぞかけとし、それらのなぞか けを用いてシステムと人間の評価を比較する。 条件 1:全被験者 21 名のうち過半数の 11 名以上が「おもしろい」と評価している。 →「おもしろい」なぞかけ 条件 2:全被験者 21 名のうち過半数の 11 名以上が「おもしろくない」と評価している。 →「おもしろくない」なぞかけ 条件 3:全被験者 21 名のうち、9 名以上が「おもしろい」と評価し、かつ 16 名以上が「おも しろい」または「どちらともいえない」と評価している。 →「おもしろい」なぞかけ 条件 4:全被験者 21 名のうち、9 名以上が「おもしろくない」と評価し、かつ 16 名以上が「お もしろくない」または「どちらともいえない」と評価している。 →「おもしろくない」なぞかけ 表 6.3 に、4 つの条件のいずれかを満たしたなぞかけについてのシステムと人間の評価と、そ れぞれの理由を選択した人数を示す。表 6.3 で網掛けされているなぞかけは、システムと人間の 評価が一致していないものである。一致しなかった理由を 3 つに分類し、それぞれについて例を 挙げて説明する。 35 表 6.3 システムと人間の判断と、理由を選択した人数 理由 No. 1 3 5 6 9 10 11 12 15 16 17 18 なぞかけ 文字とかけて月ととく。そのこころは点/天です なみだとかけてズボンととく。そのこころは拭く/服です 切符とかけて足ととく。そのこころは券/腱です 鯛とかけて折り紙ととく。そのこころは釣る/鶴です 正月とかけて精神ととく。そのこころは新年/信念です ピアノとかけて発明ととく。そのこころは白鍵/発見です アルバイトとかけて性格ととく。そのこころは 短期/短気の具合が気になります 形とかけてイタチととく。そのこころは点/テンです 林とかけて意地悪ととく。そのこころは虫/無視です 恥とかけてうどんととく。そのこころは知る/汁です 練習とかけてしっぺ返しととく。そのこころは復習/復讐です とんかちとかけて喜びととく。そのこころは凶器/狂喜です システム × × × × ○ ○ 人間 A B × 2 3 ○ 1 10 ○ 7 7 ○ 4 8 ○ 3 11 ○ 6 7 C D 2 2 2 5 1 0 1 0 1 3 2 5 E 0 16 3 4 1 4 2 3 3 3 1 4 F G 2 3 3 0 0 0 ○ ○ 8 7 1 5 × × 2 1 0 1 × ○ 8 3 6 5 × ○ 10 9 0 4 ○ ○ 5 13 6 7 ○ ○ 12 8 2 10 ○:おもしろい ×:おもしろくない 0 7 0 17 0 6 0 8 4 0 1 2 0 2 1 2 0 0 ・ 「思いつきやすい」という評価は合っていたが、程度の違いによりおもしろさの評価が一致しな かったもの 例)No.3:なみだとかけてズボンととく。そのこころは拭く/服。 システムは「なみだ→拭く」が容易に連想できるため評価を低くしている。被験者は 10 名が「内 容が納得できる」という理由を選び、 「簡単ですぐ思いついてしまう」という理由も選んでいるこ とから、比較的思いつきやすい傾向のなぞかけであることがわかる。程度の差はあるものの、 「思 いつきやすい」という評価の内容では、システムと人間の評価が一致していると考えられる。 ・使われている言葉の性質によるもの 例)No.6:鯛とかけて折り紙ととく。そのこころは釣る/鶴です。 システムは「鯛→釣る」が連想しやすいため評価を低くしている。被験者は「内容が納得でき る」「意外性がある」の他に、「情景などがイメージしやすい」という理由で「おもしろい」と評 価している。 「鯛」 「折り紙」 「鶴」が具体的な物体を指す名詞であることから、言葉を聴いたとき にそのイメージが浮かびやすく、全体として理解しやすい内容であったと考えられる。本システ ムでは使われている言葉のおもしろさや情景のイメージのしやすさを考慮していないが、これら の点が大きく影響した例であるといえる。 ・意味を補完する言葉を必要とするため、連想のしやすさに差が出たもの 例)No.15:林とかけて意地悪ととく。そのこころは虫/無視です。 この例で被験者が挙げた理由に、 「(虫/無視)『が多いです』とすればよりおもしろい」というも 36 のがある。表現付加データベースには、この「が多いです」という表現は格納されていないため、 システムは表現を付加することはできないと判断した。しかし人間は「が多いです」等の言葉を 補完しておもしろさを感じることができる。システムが人間と同じように表現を付加するには、 表現付加データベースの表現の種類を増やすことで実現できると考える。またこの例は、表現を 付加することでおもしろさが増すという仮定を裏付ける結果になっている。 その他、被験者が自由記述した理由で目立ったものは、 「ある言葉からある言葉が連想されるの は理解できるが、連想された言葉が特徴を生かしていない」というものである。例を挙げて説明 する。 「盲導犬とかけて応接間ととく。そのこころは鼻/花が欠かせません。」というなぞかけの「盲 導犬→鼻」という連想に対して、「理解はできるが、『犬→鼻』でも十分で『盲導犬』である必要 がない」という理由が挙げられている。このような言葉が使われているなぞかけでは、意外性が あり内容の理解もできるがおもしろさを感じないという指摘がある。この問題を解決するために は、言葉 A から言葉 B の連想のしやすさを考える際に、 A から B の連想距離に加え A から連想さ れうる他の言葉の個数やその連想距離を考慮することや、 A の上位概念・下位概念と B の連想距 離も考慮に入れることが必要と考えられる。このような手順を加えることによって、より納得感 のあるなぞかけが生成できると考えられる。 6.6 システム性能の考察 実験全体を通して、本システムは人間よりも「『意外性がある』反面『理解しにくい』」なぞか けを高く評価する傾向にある。システムが「思いつきやすすぎて意外性がない」と評価するなぞ かけでも、被験者には適度な意外性と理解しやすさであると評価されている例や、システムが「適 度な意外性」と判断するなぞかけでも、被験者には「意外すぎて理解しにくい」と評価されてい る例がある。 連想距離という指標で考える時、「意外性」と「理解しやすさ」はトレードオフの関係にある。 意外性を求めすぎると理解しがたい内容になり、逆に理解しやすさを求めすぎると意外性がなく なる。「意外性」と「理解しやすさ」の両方を満たす連想距離のファジィ集合 range は 6.1 で示し た通り、予備実験の被験者の評価から求めている。システムの「『意外性がある』反面『理解しに くい』」なぞかけを高く評価する傾向の原因を探るため、予備実験で使用したなぞかけのサンプル 調査を行う。実験に用いたのべ 399 のなぞかけサンプルのうち比較的連想距離が遠い、つまり意 外性が高いなぞかけの中に特に高い評価を得ているなぞかけがある。それによってファジィ集合 range が比較的遠いところに設定され、システム全体の評価が意外性を高めようとする傾向になっ たと考えられる。 ファジィ集合 range の決定方法については議論すべき点であるが、システムはファジィ集合 37 range という基準をもとに、意外性や理解のしやすさを判断し、なぞかけのおもしろさを評価でき ているといえる。より人間に近い判断をしてなぞかけを生成するには、生成したなぞかけに対す る人間の評価をフィードバックすることでファジィ集合 range を更新する学習機能が必要と考え られる。 また、5.4 で行っている評価方法では、連想距離に関する評価 D は d AC , d BC′ の range への帰属 度 µ range (d AC ) 、 µ range (d BC′ ) から求めている。そのため、 µ range (d AC ) や µ range (d BC′ ) が低い場合、そ れが連想しにくいため帰属度が低いのか、連想しやすいため帰属度が低いのかは考慮されていな い。 D の値が同じであっても、 µ range (d AC ) と µ range (d BC′ ) が共に連想しにくい、つまり連想距離が 大きい値である場合と、共に連想しやすい場合、つまり連想距離が小さい値である場合、さらに 片方が大きくもう片方が小さい場合とでは、全体の評価も若干違うものになることが考えられる。 表 5.4 のルールは、なぞかけ生成の経験者の意見や被験者の挙げるおもしろさ理由から作成した が、連想距離に関してはさらに詳しい場合分けをする必要もあると考えられる。 評価とは別に、実験後に被験者から寄せられた感想として、「『∼がつきものです』等の表現が つくことでおもしろさが増す」というものがある。その反面、 「表現がついたことで理解しにくく なるものがある」、「文として不自然と感じるものがある」との指摘もされている。本システムで 生成されたなぞかけの意外性を維持しながら、より理解・納得できおもしろいなぞかけを生成す るためには、付加する表現を増やしたり、付加の判定を厳しくしたりすることも必要と考えられ る。 6.7 生成されたなぞかけの例 システムによって生成されたなぞかけの例を挙げる。 ぶどうとかけてトラックととく。そのこころは摘む/積むこともあるでしょう。 勝負とかけて家系ととく。そのこころは決闘/血統ともいいます。 王様とかけて学問ととく。そのこころは治める/修めることもあるでしょう。 経済とかけてせんべいととく。そのこころは景気/ケーキの具合が気になります。 商店とかけて調子ととく。そのこころは店舗/テンポです。 料理とかけて白鳥ととく。そのこころはカレー/華麗です。 このように、多様ななぞかけが出力されていることがわかる。 38 第7章 おわりに 本論文では、なぞかけで用いられる 4 つの言葉の構造をもとに、人間にとって意外性があり内 容が理解・納得できるなぞかけを生成するシステムについて述べた。まず言葉の関連という観点 に注目し、関連度に範囲を設けて意外性と理解・納得できるかを判断するシステムを構築した。 評価実験からシステムが生成したなぞかけは、意外性があり、内容が理解できるものであること が示された。また、関連度の範囲を設定するという本研究の方針は妥当であることを検証すると ともに、人間がなぞかけにおもしろさを感じるには様々な観点を総合して評価するしくみが必要 であるという知見を得た。そこで、なぞかけ生成の際におもしろさを「言葉の連想のしやすさ」 「音韻」 「表現が付加できるか」の 3 つの観点から総合的に評価する手順を追加しシステムを改良 した。改良後のシステムが生成したなぞかけは、人間が生成したなぞかけに比べて理解のしやす さとおもしろさの点で劣るが、意外性は差異がなく、人間の作ったなぞかけと区別がつかない「人 間らしい」なぞかけであることが示された。また、システムが行った評価は、人間の評価と一致 しない例もあったが、「なぞかけに適切な連想距離、ファジイ集合 range 」という 1 つの基準に沿 って、意外性の有無や理解のしやすさの評価ができていることを確認した。 今後の課題としては 2 つの点が挙げられる。1 つ目は、出力されるなぞかけのバリエーション を増やすことである。そのためには改良後のシステムでも考慮していない「言葉そのものの持つ おもしろさ」 「情景などのイメージのしやすさ」などの観点も加えることや、付加する表現の多様 化、単語以外の表現も可能にすることが必要である。2 つ目は、システムが行うおもしろさの評 価の精度を上げることである。システムのおもしろさの判断基準となるファジィ集合 range の、決 定方法を改善したり、生成したなぞかけに対する評価をフィードバックをして値を更新したりし て、より人間に近い評価が行えるようにする必要がある。 39 謝辞 本研究を進めるにあたって、指導教員である鬼沢武久教授にはご多忙の中ご丁寧な指導を賜り、 深く感謝いたします。また、なぞかけについての貴重なご意見と知見をくださり、アンケート作 成にも快く協力してくださった筑波大学落語研究会の皆様、研究についてのアドバイスや様々な 面で研究生活をサポートしてくださった鬼沢研究室の皆様、貴重な時間を割いて実験に協力して くださったたくさんの被験者の皆様に御礼申しあげます。 40 参考文献 [1]Graeme Ritchie, Prospects for Computational Humor, Proc. of 7th IEEE International Workshop on Robot and Human Communication (ROMAN-98), pp. 283-291, September 1998. [2]伊達大輔, 鬼沢武久, 笑いの程度推定のためのファジィモデル, 日本ファジィ学会誌, Vol. 9, No. 4, pp. 570-579, 1997 [3]増山英太郎, 勝見正彦, お笑い演目のイメージ比較−落語,漫才,CM について−, 人間工学 会誌, Vol. 28, No. 1, pp. 37-45, 1992 [4]滝沢修, キム・ビンステッド, 日本語駄洒落なぞなぞ生成システム”BOKE”, 人工知能学 会誌, Vol. 13, No. 6, pp. 920-927, 1992 [5]横川壽彦, 調音類似に基づく駄洒落候補の自動生成, 第 10 回インテリジェント・システ ム・シンポジウム講演論文集, pp. 253-256, 2003 [6]Olivio Stock, Carlio Strapparava, An Experiment in Automated Humorous Output Production, Proc. of Intelligent User Interfaces (IUI) ’03, pp. 300-302, January, 2003 [7]株式会社アニモ http://www.animo.co.jp/product/index.html [8]Mika Maeda, Takehisa Onisawa, Generation of NAZOKAKE Based on Classification of Its Structures, Proc. of SCIS & ISIS 2004, September, 2004 [9]前田実香, 鬼沢武久, 言葉の関連性とおもしろさを取り入れたなぞかけ生成, 2004「エンタ テインメント感性」ワークショップ講演論文集, pp. 37-42, December, 2004 [10]鈴木棠三, ことば遊び辞典(新版), 東京堂出版, 1981 [11]「なぞかけ」って? http://www.uhb.co.jp/nazokake/what.html [12]慶応義塾環境情報学部石崎研究室編, 連想概念辞書(2004 年度版第1版) [13]岡本潤, 石崎俊, 概念間距離の定式化と既存電子辞書との比較, 自然言語処理, 言語処理 学会, Vol. 8, No. 4, 2001 [14]天野成照, 近藤公久, 日本語の語彙特性, 三省堂, 2000 41 [15]なぞかけ問答 http://www.town.akasaka.okayama.jp/nazokake/ [16]本多中二, 大里有生, ファジィ工学入門, 海文堂, 1989 42