Comments
Description
Transcript
2択のクイズを用いた情報カスケード実験 - S.Mori`s Web Page
2 択のクイズを用いた情報カスケード実験 実験の手順とデータアーカイブについて 守 真太郎† 入江 洋介† 久門 正人†† 高橋 泰城††† † 北里大学理学部物理学科,〒 252-0373 神奈川県相模原市北里 1-15-1 †† スタンダード&プアーズ,〒 100-0005 東京都千代田区丸の内 1-6-5 ††† 北海道大学大学院文学研究科, 〒 060-0810 北海道札幌市北区北 10 条西 7 丁目 E-mail: †[email protected], ††[email protected], †††[email protected], ††††[email protected] あらまし 2010 年から 2013 年まで 5 回に渡り実施した 2 択のクイズを用いた情報カスケード実験の詳細とデータアー カイブについて説明する。実験データの利用についても述べる。 キーワード 情報カスケード,2 択のクイズ, データアーカイブ, 実験手順 Information cascade experiment with two-choice quiz Experimental procedures and data archive Shintaro MORI† , Yosuke IRIE† , Masato HISAKADO†† , and Taiki TAKAHASHI††† † Department of Physics, Kitasato University, Kitasato 1-15-1, Sagamihara-shi, Kanagawa, 252-0373 Japan †† Standard and Poor’s, 1-6-5 Marunouchi, Chiyoda-ku, Tokyo, 100-0005 Japan ††† Department of Behavioral Science, Hokkaido University, N10W7 Kitaku-ku, Sapporo-shi, Hokkaido, 060-0810 Japan E-mail: †[email protected], ††[email protected], †††[email protected], ††††[email protected] Abstract We exlain in detail about the procedures and the strcuture of data archive of the voting experiments from 2010 to 2013. We also write about the usage of the experimental data. Key words information cascade, two-choice quiz, data archive, experimental procedure 1. は じ め に 他の被験者の選択情報をもとに推測し選択する。自己情報とし て壷 X からランダムに玉を取り出し, その玉の色を確認するこ 選択において, 通常, 自己の持つ情報(自己情報)をもとに選 とができる。玉 R なら壷 X は壷 R である確率が高く, 玉 B な 択肢を選ぶ。しかし, 他者の選択の情報があるとき, それに影響 ら壷 B である確率が高い。ここでいう確率とは, ベイズ統計で されて自己情報を更新し, 場合によっては自己情報の示す選択 の事後確率である。玉を引く前は, 壷 X が壷 R, 壷 B の確率の とは異なる選択肢を選ぶことがある。とくに, 参照できる他者 事前分布は 50%だが, 玉を引くことにより事後分布は 50%から の人数が多いときその傾向は強い。情報カスケードは, そうし 変化する。事後分布は一般に壷 R, 壷 B での各玉の比率に依存 た参照できる人数が多い状況で, 自己情報の示す選択を捨て, 多 する。そして, 自己情報と自分より前に壷を選択した被験者の 数の他者が選択した選択肢を選ぶことが連鎖する事象のことで 選択の時系列情報をもとに, 被験者が1人1人順番に選択する。 ある [1]。 自分より前の被験者が自己情報のみで選択した場合, 壷 R, 壷 B 情報カスケードの実験は, 通常 2 個の壷の選択を用いる [2]。 のそれぞれの選択者数の差が 2 を越えると, 自己情報には依存 それぞれの壷には玉 B(青)と玉 R(赤)が異なる比率で入っ せず多数の選択した壷が正解である事後確率が 50%を越え, 多 ているとする。二個の壷を壷 B, 壷 R としたとき, 壷 B には玉 数派の壷を選択することが合理的になる。以降, 同じ状況が続 B の比率が高く, 壷 R には玉 R の比率が高い。そして, 壷 R, 壷 き, 多数派の選択が連鎖することになる。これが情報カスケー B からランダムに選ばれた壷 X が壷 R か壷 B かを自己情報と ドのメカニズムである。 一方, 本稿で扱うのは 2 択のクイズを用いた情報カスケード し, 自己情報を信じるのか, 他者の選択情報に重きを置くのかと 実験である。そこでは,2 個の壷 R, 壷 B の代わりに, クイズで いった決断も可能になってくる。もちろん, 他者の選択の情報 の 2 個の選択肢を用いている。この場合, 自己情報は, 各問題に が実験者により恣意的にコントロールされているかどうかを被 対する知識であり, 壷の実験と異なり実験者側で個別の被験者 験者が判定することは難しいが, 壷の場合と比較して判断の材 の自己情報をコントロールすることはできない。可能なのは, 料は多く(注 2)、被験者の信用を得やすいであろう。 問題の難易度を変化させて, 被験者全体での自己情報の平均を 本実験の目標は, 自己情報がゼロの被験者の比率 p をコント コントロールすることである。また, 選択肢は二つ存在するが, ロールして集団レベルでの変化を見ること, 特に情報カスケー 壷と異なり, 選択肢間の差違を消すことも難しい。これを 2 択 ドが被験者列の長さが無限大の極限で相転移かどうかを検証 のバイアスと呼ぶことにする。例えば, 誰も知らない問題の場 することにあった [3], [4]。壷の実験では, 自己情報しか与えな 合でも, 各選択肢を被験者の 50%が選ぶとは限らない。一方, 壷 い被験者と自己情報を与えず他者の選択の情報のみを与えた の場合, 壷 R, 壷 B の R と B という文字情報さへ消すことが可 被験者だけとし, 後者の比率 p をコントロールすればよい。そ 能 (注 1) である。また, クイズの場合, 被験者が正解を知ってい の際, 自己情報のみの被験者は, 自己情報のみで選択し, 独立投 る, または知らない場合は正解を調べることで知ることが可能 票者 (independent voter) と呼ぶ。独立投票者が正解を選ぶ確 であるが, 壷の場合は教えない限り, 実験者しか正解を知らな 率 q は壷の玉の比率から計算することができる。自己情報が い。また, 正解を教えても, その壷がどの壷なのかが分からなけ なく, 他者の選択情報のみの被験者は選択者の多い選択肢を選 れば, 他の被験者にその情報を伝えることはできない。一方, ク ぶ(注 3)。このような, 多数派の選択を選択する被験者をハーダー イズの場合は, 問題と正解は 1 対 1 に対応するため, 被験者間 (herder), コピーキャット (copycat) と呼ぶ。多数派を選択す の情報交換が可能な場合, 正解情報を伝えることが可能になる。 ることは, 自己情報のみの被験者はその情報に基づいて選択, 自 このことは, 大規模な集団実験を実施する場合に問題情報の伝 己情報を持たない被験者は多数派を選択と予想すると, 多数派 達のコントロールの難しさにつながる。壷の場合は, 被験者の の選択肢が正解である事後確率は 50%を越えるため合理的で 選択毎に正解を教えるかどうかで学習効果を見ることが可能で ある。この場合のハーダーの振る舞いは, 過去の被験者の選択 ある。一方,2 択のクイズでも同じことは可能であるが, その場 の正答率を z とし, z > 1/2 なら正解を, z < 1/2 なら不正解 合, 被験者間の直接の情報伝達を断つ必要がある。実験が 1 回 を,z = 1/2 ならランダムに正解を選ぶとモデル化でき, デジタ で終わる場合には問題がない。単に, 実験室内での接触を禁じ ルハーダー (digital herder) と呼ぶ。一方, 玉を引き, 他者の選 ればすむ。しかし, 異なる日時に多数回の実験を実施する場合, 択の情報も持っている被験者の選択は, 自己情報と他者の選択 異なる日時の実験に参加する被験者同士の接触を完全に断つの の両方の情報があるため, その選択にはさまざまな可能性が出 はほぼ不可能である。とくに, 正解を教えた場合, どんなに難し てくる。 い問題であっても, 問題情報は容易に伝達可能になる。 このように, 情報カスケード実験で 2 択のクイズを用いるこ とは, 壷を用いることと比較してデメリットが多い。自己情報 まとめると, 被験者は以下のように分類される。 ( 1 ) 玉を引いた情報のみの被験者 玉と同じ色の壷を選ぶと考えられる。他者の選択は影響しな のコントロール, 2 択のバイアス, 問題情報の守秘などである。 いので独立投票者だが, 正解率 q は, 壷の中の玉の比率で決ま 特に, 最初の二つのデメリットはデータ解析においてさまざま り, 一般に q < 1 になる。 な問題をもたらす。一方,2 択のクイズを用いるメリットは被験 者の興味を維持しながら実験を実施することが可能な点であ ( 2 ) 他者の選択情報のみを知る被験者 多数派の選択肢を選ぶデジタルハーダーと考えられる。正解 る。クイズを用いた実験では 1 時間に 100 問程度の問題に回答 率は, 参照する被験者の多数派が正解の確率に等しい。 する。壷で同じ実験を実施した場合, 回答するのは本質的に同 ( 3 ) 玉を引き, かつ他者の選択情報を知る被験者 じ問題で, 異なるのは他者の選択の情報のみであるため集中し 自己情報と他者の選択情報をもとに選択するため, その選択 て実験に取り組むのが難しく, 回答毎に正解を示す, 報酬を表示 には個人差もあり, モデル化でも多数の可能性がある。自己情 するなどの何らかのゲーム性を持たせる工夫が必要になる。ま 報の示す壷と他者の選択の多数派の壷が一致している場合はそ た, 被験者の側からすると, 他者の選択情報が信用出きるかどう の壷を選ぶと考えられるが, 異なる場合, どちらを選ぶかは被験 かが判断が難しいという問題もある。実験者側の都合で他者の 選択情報が恣意的に操作されている可能性があり, 被験者の疑 (注 2) :逆に言えば, 実験者がこの点でも実験をコントロールするのは難しい。実 いを招きやすい。一方, クイズの場合,2 択から選ぶ単調な作業 験 4 を除き, 他者の情報には一切操作を加えず実験を行っているが, 各実験で 1 であることには違いないが, 被験者は問題を楽しむことができ, 実験の最後まで興味を維持することが容易である。また, 他者 人ぐらいは情報操作の可能性を質問する被験者が存在した。 (注 3) :壷の選択の情報カスケード実験で, 自己情報の取得にコストをかけたとき の振る舞いが調べられた [5]。自己情報の取得に適当なコストがある場合, ゲーム の選択情報と自分の知識を比較して, 他者の選択情報が信用で 理論的には, 最初の被験者はコストを払って玉を引き,2 番目以降の被験者は玉を きるのかを判断することも可能である。その上で, 各問題に対 引かず, 最初の被験者と同じ選択肢を選ぶことが均衡解となる。実験では, 必ずし も均衡解の振る舞いが見られるわけではなかった。最初の被験者でも 5 割程度し か玉を引かず,2 番目の被験者はコストを払って玉を引く比率が高かった。後半の (注 1) :被験者, 壷ごとにランダムに R と B の対応を入れ替えるか, そのままに するか決めればよい 被験者は玉を引かない比率が増加し均衡解の振る舞いと近かった。そして, 玉を 引かない自己情報がない被験者は, 多数派の壷を選ぶ傾向が強かった。 表 1 2010 年から 2013 年までに実施した 2 択のクイズを用いた情報 者毎に異なるであろう。 論文 [3] で扱ったモデルは, 分類 1,2 の被験者の集団の場合に カスケード実験一覧:北里大は北里大学理学部, 北大は北海道大 対応する。分類1の被験者の比率を 1 − p, 正解を選ぶ確率を q, 学社会科学実験センター, ネットは NTT コム goo リサーチに よりインターネットで実施。 分類 2 の比率を p とする。t 番目に選択する被験者の選択を, X(t) = 1 で正しい選択,X(t) = 0 で誤った選択で表すとする。 No. 実施場所 1 日時 対象被験者 被験者総数 北里大 2010/10/9∼23 理学部学生 62 過去 t 人の選択の正答率を z(t) としたとき,t + 1 番目の被験者 2 北大 2011/6/15∼7/14 文学部学生 104 が正解を選ぶ確率は, 3 北大 2012/6//13,14 文学部学生 120 4 ネット 2013/7/4,5 23 歳以上 218 5 北里大 Pr(X(t + 1) = 1|z(t)) = (1 − p) · q + p · θ(z(t) − 1 ) 2 t 1∑ z(t) = X(t) t s=1 2013/9/30∼11/8 複数学部学生 125 の振る舞いを明かにする必要がある。我々は, 分類1のみを独 となる。この確率に基づく確率過程は情報カスケード相転移を 立投票者, それ以外をハーダーと考え,2 択のバイアスはないと することが厳密に示すことが出来る。情報カスケード相転移と 仮定した分析を行い, 情報カスケード相転移が起こることを示 は,t → ∞ の極限で正答率 z(t) の分布関数が, ひとつの正答率 した [4]。 z+ でピークをもつか, ふたつの正答率 z− , z+ でピークをもつか 2. 実験の詳細 の相転移である。前者を One-peak 相, 後者を Two-peak 相と 呼ぶ。過去に行われた実験は, 分類 3 の被験者集団のみのケー 2 択のクイズを用いた情報カスケード実験は,2010 年の 10 月 スを扱い, 被験者に自己情報と過去の被験者の選択の時系列を から 2013 年 11 月まで 5 回実施した。最初および第 5 回の実 見せたとき, 被験者が QRE モデル (注 4) に従うとするのがもっ 験は主に北里大学理学部学生, 第 2 回,3 回は北大文学部学生, 第 とも尤度が高く, その場合, 系は相転移せず, 必ず One-Peak 相 4 回が goo リサーチにより一般人をリクルートして行われた。 にあることが理論的に示された [6]。 goo リサーチによる一般人を被験者とした実験以外はすべて実 一方, クイズの場合, 被験者の分類は, 各問題に対する被験者 の知識に応じて以下のようになる。 ( 1 ) 正解を知る被験者 「正解を知る被験者」は正解を選ぶと考えられる。この場合, 他者の選択は影響しないので, 独立投票者であり q = 1 である。 ( 2 )「正解を知っている」と考える被験者 験室実験である。goo リサーチでの実験は, 年齢が 23 以上,30 から 40 歳代の一般人を対象としたアンケート実験である。5 回の実験を時系列順に実験 1 から実験 5 とラベルし, 実施日時, 実施場所, 対象被験者, 被験者数などの情報を表 1 にまとめた。 2. 1 記 号 以下, 実験の詳細を記述するにあたり, 使用する記号をまとめ 「正解を知っている」と考える被験者は必ずしも正解を選ぶ ておく。問題番号 i のとる値の集合を I, 参照した人数 r のと とは限らない。他者の選択が影響しない独立投票者と考えたと る集合を R, 問題に対して何番目に回答したのかを表す t のと しても q < 1 である。 る集合を T で表す。参照人数 r が過去全員の場合, 順番 t の被 ( 3 )「正解を何となく知っている」と考える被験者 験者は t − 1 人の回答を参照していることになり,r は t に依存 正解を確実に知っているわけではないが, 何となく正解が予 する。このケースを r = ∞ と表すことにする。また, 過去全員 想できる, または分かると考えている場合, 他者の選択の影響は を参照し, さらに正解時のリターンが選択者数に逆比例する倍 小さいであろう。それでも, 影響が全くないとは言えないので, 率(オッズ)で与えられる場合, r = 1/∞ で表すとする。実験 独立投票者とは考えにくくハーダーと考えられる。また,q < 1 1,2,3 では同じ実験を 2 回繰り返し, それぞれをグループ A, グ である。 ループ B で区別した。実験 4,5 では 1 回のみであり, グループ ( 4 ) 正解がまったく分からない被験者 A のみとする。グループの集合を G, グループを g ∈ G で表す 問題の正解がどちらかまったく分からない場合, 多数派の選 とする。被験者を id でラベルし, その集合を ID で表すとする。 択を選ぶことが合理的であり, ハーダーであると考えられる。 集合 I の要素数 |I| は 2 択の問題数, 集合 T の要素数は一般に ただし,2 択のバイアスから, 必ずしも多数派を選ぶとは限らず, グループ g, 問題番号 i に依存し,T (g, i) と書くことにする。 他の被験者の選択情報がない場合でも q = 1/2 とは限らない。 クイズを用いた実験では, 被験者の分類が複雑になり, かつ, I = {1, · · · , |I|}, T = {1 · · · , T (g, i)} 実験者側で個別にコントロールすることも難しい。また,2 択の グループ g の被験者 id が問題 i に対し t 番目に r 人参照で回 バイアスから, 正解を知らない被験者の正解を選ぶ確率 q につ 答したとき, その選択を X(g, i, r, t) と書くことにする。正解は いても制限はない。このように, 実験デザインや実験後のデー 1, 不正解は 0 で表す。 タ解析が困難になるデメリットが大きいが, 壷より現実的な状 況での情報カスケードの実験と考えることも出来る。クイズの 実験の解析では, 被験者がどの分類に対応し, それぞれの被験者 (注 4) :Quantal Response Equiribrium Model X(g, i, r, t) ∈ {0, 1} また, グループ g で問題 i に r で t 番目に回答した被験者 id を id(g, i, r, t) で表す。以下, 各実験における G, ID, I, R, T と g ∈ G, i ∈ I, r ∈ R, t ∈ T に対する X(g, i, r, t), id(g, i, r, t) の し, 実験の説明と謝礼に関する説明を受けた。実験は 2 択のク 取得方法を説明する。 イズに回答するものであること, 実験の意図が, 被験者の選択が 2. 2 実 験 他の被験者の回答によってどう影響されるかを調べるものであ 1 2010 年 10 月に北里大学理学部で実施した実験である。被験 ること, 過去の被験者の選択の情報は, 直近の r 人の被験者の選 者は理学部(物理学科, 化学科)2,3,4 年生を 62 名リクルート 択に関するものであり,r の値は 0 から始まり, 1, 2, 3, 5, 7, 9 と し,10 月 9,16,23 日の 3 日間で実施した。本実験の目的は, [3] の 最後に過去の被験者全ての選択の情報であること, などである。 理論モデルの主張を実験で検証することにあった。実験者は守 と物理学科 4 年の入江, 石澤, 神田, 辻, 熊谷と物理学科 3 年の 南川の計 7 名。クイズの問題数は 100 問で, 実質的な回答時間 は 1 時間半程度であった。 R = {0, 1, 2, 3, 5, 7, 9, ∞} ここで,r = 0 とは, 他の被験者の選択の情報がなく, 被験者の自 己情報のみで回答する場合に対応する。また,r = ∞ は過去全 まず, 事前に被験者を 31 名からなる A,B 二つグループに分 員の被験者の選択情報を与えた場合である。報酬に関しては, け, 実験実施日のいずれかの日の 1 時間間隔で指定した日時に 実験の参加費が 2000 円であり, それにすべての回答での平均正 理学部情報科学演習室に来てもらった。 答率が各グループの上位 5 名に対し,1000 円のボーナスを支払 うことを説明した。 G = {A, B}, |I| = 100, T (g, i) = 31 以上の説明ののち, 実験がスタートした。被験者は実験者と 情報科学演習室には 4 つのテーブルを設置し,A,B 各グループ, 対面形式で 2 択のクイズに回答する。実験者は紙に印刷した問 最大 2 名, 合計で最大 4 名が同時に実験に参加した。同じグ 題を示し, 被験者はそれを読んで二つの選択肢を指で指し示す ループの被験者が情報演習室に来る時刻には 1 時間の時間差が 形式で実験は進行する。そのため, 他のテーブルの被験者には, ある。100 問の問題を前半 50 問, 後半 50 問に分け,t 番目の被 問題や選択の情報が直接伝わることはない。まず,r = 0 として, 験者が前半 50 問を回答した後に,t + 1 番目の被験者が前半 50 被験者は自分の知識のみで回答する。次に, 同じ問題に対して 問の回答を開始し, そのとき t 番目の被験者は後半 50 問を回答 過去の被験者の選択情報をもとに回答する。被験者の順番が t した。t 番目に参加した被験者は 100 問全てに t 番目に回答し とすると, その問題に対してすでに t − 1 人の被験者が回答し た。被験者 id は i, r に依存せずグループ g, 順番 t と 1 対 1 に ている。t − 1 未満の r ∈ {1, 2, 3, 5, 7, 9} に対し, 小さい r から 対応する。id を 順番に t − r から t − 1 までの直近 r 人に対して, 各選択肢を選 んだ人数を実験者が回答記録をもとにカウントし被験者に伝え id(g, i, r, t) = gt , g ∈ {A, B}, t ∈ {1, · · · , 31} る。そして, 被験者は選択肢を再度指さすことにより選択する。 そして, 最後に t − 1 人の被験者の回答記録をもとに同様の情報 と g と t で表すことにする。 時間差をもうけて 2 名同時に参加できるようにした理由は, 情報カスケードの実験では, 過去に回答した他の被験者の選択の 情報を伝えるため被験者の順番を厳密に決める必要がある (注 5) を与え, 被験者は回答する(注 6)。 例えば,t = 1 の最初の被験者の場合,r = 0 でノーヒントで回 答して, その問題の回答は終了し, 次の問題の回答に移る。t = 1 が, そうすると各グループの被験者数に比例した実験時間が必 の場合, 過去に回答した被験者いないため,r = 0 は全員の回答 要になる。31 名で 1 人 2 時間の場合 62 時間となり, 実験実施 を参照して回答した場合 r = ∞ と考えることもできる。t = 2 日が 6 日は必要になる。そこで,1 時間の時差で実験を平行して の被験者は,r = 0 で回答後,t − 1 = 1 未満の r ∈ {1, 2, 3, 5, 7, 9} 実施することにより実験時間を短縮した。こうして, 朝 9 時か は存在しないので r = ∞ で回答する。このとき, 被験者は t = 1 ら夜 9 時までの 12 時間で 11 名の被験者のデータをとれる体制 の被験者の r = 0 = ∞ の 1 人分の選択を知ることになり,r = 1 とし,3 日間で各グループ 31 名分のデータを取得した。この実 での回答でもある。t = 2 の被験者はこれで回答は終了し次の 験時間が長くなることが被験者を二つのグループに分けた理由 問題に移る。t = 3 の被験者は r = 0 で回答後,t − 1 = 2 未満 のひとつである。相転移の検証では時系列の長さを無限大に外 の r ∈ {1, 2, 3, 5, 7, 9} は r = 1 なので,r = 1 で t = 2 の被験 挿する必要があり, 時系列データ {X(g, i, r, t)} の長さ T (g, i) 者の r = ∞ = 1 での回答を参照して回答する。最後に,r = ∞ は重要である。グループ数を増やすことによる実験時間の短縮 で t = 2 の被験者の r = ∞ = 1 での回答, t = 1 の被験者の 化と T (g, i) の大きさはトレードオフの関係にあり, ここでは 2 r = 0 = ∞ での回答の 2 人分の回答を参照して回答する。そ グループとしている。複数のグループに分ける実験時間以外の して, 次の問題の回答にうつる。r = ∞ での回答は過去二人の メリットは, 時系列の数はマクロな量の評価でサンプル数と等 回答を参照しているので r = 2 の回答でもある。t = 4 の被験 しいこと, また, 情報カスケード効果により選択が一方に偏るた 者は r = 0 で回答し,t − 1 = 3 未満の r ∈ {1, 2, 3, 5, 7, 9} の最 め, 情報カスケードの様子を見るには, 時系列の後半ではなく初 小値は r = 1 なので,r = 1 で t = 3 の r = 1 の回答を参照して 期の情報が重要な点が挙げられる。 被験者は情報科学演習室に入室後, 実験者の指示に従って着席 回答する。そして,r = 2 で t = 3 の r = ∞ = 2 の回答と t = 2 の r = ∞ = 1 の回答を参照して回答。最後に r = ∞ で t = 3 の r = ∞ = 2,t = 2 の r = ∞ = 1,t = 1 の r = 0 = ∞ の (注 5) :問題毎に順番は変わってもよいため, 実験1以降は問題毎に順番が異なる 実験とした。 (注 6) :t = 1 で回答する被験者は例外であり,r = 0 でしか回答しない。 3 人分の回答を参照して回答してこの問題での回答を終える。 な個室ではないため, 被験者は実験者の説明を受けることは可 r = ∞ での回答は r = 3 に対応する。一般に,t 番目の被験者 能である。WEB サーバーは Ubuntu Linux 上の WEBRick を は,t > r + 1 のとき,r は t − 1 未満なので直近の過去 r 人の r 用い, サーバープログラムは Ruby で実装した。 人参照したときの回答を参照して回答する。つまり,t − 1 から 実験実施の 4 日間のうち,6 月 15 日は 3 限から 5 限,16 日は t − r 番目の間の s ∈ [t − r, t − 1] 番目の被験者の r 人参照し 1 限から 5 限の計 8 コマに被験者を 5,6 名,7 月 13 日は 1 限か た回答を参照して回答する。その際,s > r + 1 なら r 人参照の ら 5 限,14 日は 1,2 限の計 7 コマに被験者を 10 名から 11 名を 回答があるのでそれを参照する。s = r + 1 の場合は r = ∞ で 割り振り, 実際に集団実験室に来た被験者をランダムに A,B の の回答が r 人参照の回答なのでそれを参照する。r < = r の場合, r = ∞ の全員参照の回答を参照することになる。r 人すべてが 二つグループに分け, 最終的に各グループの人数が同数の 52 名 r 人参照して回答しているわけではないが, r = ∞ の回答で r 人参照での回答と見做す。例えば,t = 12 の被験者が r = 9 で となるようにコントロールした。 id ∈ ID = {A1 , · · · , A52 , B1 , · · · , B52 } 回答する場合に参照するのは, s ∈ [3, 11] 番目の被験者の r = 9 ただし, 実験 1 と比較して問題数・回答数が増える一方で実験 での回答だが, s = 11 では r = 9 が存在しても,3 < =s< = 10 で は r = 9 の回答はないため r = ∞ での選択を参照する。 しも 104 名の全被験者が 120 問すべてに回答できたわけではな 以 上 の 手 順 に 従 い,|G| = 2, |I| = 100 よ り, r ∈ R = い。実験 1 日目は実験サーバーと北大のネットに接続に手間取 時間が短くなったこと, また, ネット接続のトラブルのため必ず {0, 1, 2, 3, 5, 7, 9, ∞} に対して長さ T (g, i) = 31 の 200 の選 り, サーバーとクライアント PC を直結して実験したため, 1 人 択の時系列 {X(g, i, r, t)} を取得した。 の被験者を相手に実験する状況となり(注 7), 複数で実験が可能 になったのは 6 月 16 日からであった。結果として 6 月の 2 日 X(g, i, r, t) ∈ {0, 1}, g ∈ G, i ∈ I, r ∈ R, t ∈ T 間で約 30 名,7 月の 2 日間で約 70 名のデータを取得したが, 上 この実験のデータを用いて正答率の分布関数を求めたものが論 記の事情から問題毎に被験者数は異なっている。T (g, i) の平均 文 [3] に掲載されている。そこでは分類1の被験者を独立投票 は 50.8 である(注 8)。 者 (q = 1), それ以外の被験者を q = 1 2 のハーダーとして, r = 0 での平均正答率 zavg から, ハーダーの平均比率 pavg を次の関 係式で評価している。 zavg = (1 − pavg ) · 1 + pavg WEB プログラムの出題は, 問題毎に被験者の回答の順番を厳密 1 · 2 (1) ここで, 右辺第一項は独立投票者(正答率 q = 1, 比率 1 − p)の 寄与を, 第二項はハーダー(正答率 12 , 比率 p)の寄与を表して いる。この実験では z は約 60%だったので,p は 80%と見積も ることが出来る。また, [4] では, 同じ仮定のもと, カスケード相 転移の秩序変数や正答率の収束の様子, またハーダーの応答関 数を計算している。 2. 3 実 験 G = {A, B}, |I| = 120, T (g, i) = 47 ∼ 52 2 2011 年 6 月 15,16,7 月 13,14 日の 4 日間に北大大学院社会科 学実験研究センターでで実施した。被験者は文学部学生を 104 名リクルートして実施した。リクルートにおいて被験者には条 件を設定していない。本実験の目的は, 実験1で確認された正 答率の分布の変化が情報カスケード転移かどうかを検証するた めに, また, ハーダーの応答関数を調べるため時系列の長さ, サ に決定するため他の回答者が回答していない問題からとした。 その選び方はランダムではなく, 被験者 id の数字が奇数なら最 初は小さいほうから, 偶数なら大きい方から, また問題番号の小 さなほうからと大きな方からを交互に入れ替えながら出題する ようにした(注 9)。 被験者は集団実験室に入室後, 実験者の指示に従って着席し, 実験の説明と謝礼に関する説明を受けた。実験は 2 択のクイズ に回答するものであること, 実験の意図が, 被験者の選択が他の 被験者の回答によってどう影響されるかを調べるものであるこ と, 過去の被験者の選択の情報は, 直近の r 人の被験者の選択に 関するものであり,r の値は 0 から始まり, 1, 5, 11, 21, ∞ と最後 に過去の被験者全ての選択をもとに, その逆数に比例する倍率 の, 最大 7 回回答することを説明した。 R = {0, 1, 2, 3, 5, 7, 9, ∞, 1/∞} ンプル数のより大きな実験を実施することにあった。実験者は 北里大の守と入江, 北大の Ruokang Han, 中村の計 4 名。クイ ズの問題数は 120 問で, 被験者の空いたコマを用いて実施した ため, 実験時間は説明を含めて 90 分。実質的な回答時間は 1 時 ここで,r = 1/∞ は倍率の場合である。倍率の定義は, 過去 t 人 がすでに回答しているとし, 選択肢 A,B の選択者数が CA , CB とする。t 人が 1 人 1 ポイント持つとし,t + 1 番目の被験者と 間程度であった。 本実験から実験者と被験者の対面方式での実験から,WEB (注 7) :残りの被験者は Ruokang Han と高橋が別の課題で対応。 (注 8) :#{T (g, i) = 52} = 143,#{T (g, i) = 51} = 5,#{T (g, i) = サーバー上の WEB プログラムを用いて問題を出題し, 被験者 50} = 2,#{T (g, i) = 49} = 85,#{T (g, i) = 48} = 4,#{T (g, i) = は実験室に備え付けのノート PC の WEB ブラウザで回答する 47} = 1 方式に変更した。実験室には 12 から 13 のパーティションがあ (注 9) :A1 の被験者に対して, まず i = 1 番を出題しようとし, それを他の被験 者が回答していれば,i = 2 を, と i の小さな方から選んで出題。回答終了後, 今 り, そこに入ることにより被験者は他の被験者の PC の画面を 度は i = 120 の出題が可能かどうかを調べ, 他の被験者が回答中の場合,i = 119 見ることは難しくなる。ただし, パーティションであって完全 を調べるという風に出題する。 図1 実験 2 の被験者説明画面:上図は実験の意図, 下図は倍率の説明。 図 2 実験 2 の回答画面。i = 1 の問題に対して,t = 1, r = 0 の場合 に回答(最上図)。その後, この r = 0 での回答に対する自信度 合わせて合計 t + 1 ポイントある。その t + 1 ポイントを正解を 選んだ被験者で分けると仮定したポイントを倍率として t + 1 を回答 (上から 2 番めの図)。t = 1 の回答はここで終了。t = 2 で回答する被験者は,r = 0 で選択し, 自信度を同様に回答したの ち, r = ∞ として過去すべて= t = 1 の r = 0 での選択を参考 番目の被験者に示す(注 10)。選択肢 A,B の倍率を MA , MB とす に回答 (上から 3 番めの図)。この後,r = 0 と同様に自信度を回 ると, 答。そして,r = 1/∞ として, 倍率を参考に回答(最下図) 。倍率 MA = t+1 t+1 , MB = CA + 1 CB + 1 は,t = 1, r = 0 での選択をもとに計算。最後に, 倍率の回答に対 する自信度を回答。 となる。競馬などの Pari-mutuel 方式の場合, リターンは最終 的な得票数で決めた倍率で決まるが, 本実験では被験者に表示 例を用いて被験者に説明した(図 1 の下図を参照のこと)。被 した倍率で正解時のリターン決めている。倍率については具体 験者の報酬は, 実験参加費として 600 円, それに倍率以外の場合 は正解すると 1 ポイント,倍率の場合は正解すると倍率に等し (注 10) :ただし, 小数 2 桁以下は四捨五入し, 小数一桁までとした。 いポイントを獲得するとし, 総獲得ポイントを1ポイント 1 円 で換算してそれを参加費に加算した。 また, この実験では r = 0, ∞, 1/∞ の回答の後に, 自分の選択 にどの程度自信があるのかという自信度を回答してもらった。 自信度は主観的な量であり,r = 0, ∞ の場合は自分の回答が必 ず正しいと考える場合は 100%, 全く自信がない場合は 50%と いう 50% から 100% まで 10% 刻みの数値を選ぶものである。 r = 1/∞ の場合, 自信度が 50%未満であっても倍率が大きな 場合は選択する可能性があると考え,5% 未満および 10% から 100% までを 10% 刻みの数値から選ぶとした。 実験説明の後, 実験同意書に記名・押印してもらい, 実験を 開始した。問題の出題が WEB プログラムによる点や参照人 数の集合 R が異なる他は, 実験1とほぼ同じである。ある問 題 i に回答する場合,r = 0 から r = 1/∞ の倍率まで順番に 回答し, その後で別の問題にうつる。そのため,g, i, r, t での選 択 X(g, i, r, t) を行った被験者 id は r に依存せず同じ被験者 によるものであり, id(g, i, r, t) は r に依存しない。ただし, 実 験 1 と異なり被験者 id は順番 g, t と 1 対 1 に対応せず, 一般 に i に依存する (注 11)。注意すべき点は,r での回答で参照する 過去 r 人の被験者の選択は r での選択であるという点である。 例えば,r = ∞ と r = 1/∞ は共に, 過去すべての被験者の選択 をもとに各選択肢の選択者数 CA , CB を計算するが, r = ∞ と r = 1/∞ での選択 X(g, i, r, t) は一般に異なるので, g, i, t が同 じでも CA , CB は二つのケースで一般に異なる。 以 上 の 手 順 に 従 い,|G| = 2, |I| = 120 よ り,r ∈ R = {0, 1, 5, 11, 21, ∞, 1/∞} に対して長さ T (g, i) の 240 の選択 図3 実験 3 の回答画面。問題 i に対し, 被験者が r = 0, ∞, 1/∞ で 回答する順番は異なる。つまり, 同じ i, r, t であっても r が異な ると id(g, i, r, t) は一般に異なる。 の時系列 {X(g, i, r, t)} を取得した。 X(g, i, r, t) ∈ {0, 1}, g ∈ G, i ∈ I, r ∈ R, t ∈ {1, · · · , T (g, i)} 実験は 2 日間とも 1 限から 5 限, 平均 12 名の被験者に対し て行った。13 日の被験者集団をグループ A,14 日の被験者集団 この実験データを用いた論文は [4] と [7] である。そこでも, 分 類1の被験者を独立投票者 (q = 1) とそれ以外をハーダーとし て解析を行っている。 2. 4 実 験 3 2012 年 6 月 13,14 日に北大大学院社会科学実験研究センター でで実施した。被験者は文学部学生を 120 名リクルートして実 をグループ B とし, それぞれの人数は 57 名と 63 名であった。 id ∈ ID = {A1 , · · · , A57 , B1 , · · · , B63 } 今回は, 数名を除いてほぼ全員が 120 問に回答した。理由は, サーバープログラムが順調に動いたこと, 実験 2 と比較して回 答回数が減ったことがある(注 12)。 施した。本実験の目的は, 実験 2 の倍率に対する被験者の反応 の追試および, 情報カスケード相転移をより明確に確認するた めに,r 有限での選択をなくし, かつ最大規模の実験を実施する ことにあった。リクルートにおいて実験 2 に参加していないと いう条件を被験者に設定した。実験者は北里大の入江, 北大の Ruokang Han, 中村の計 3 名。クイズの問題数は 120 問で, 被 験者の空いたコマを用いて実施したため, 実験時間は説明を含 めて 90 分。実質的な回答時間は 1 時間程度であった。実験は 説明を含めて実験 2 とほぼ同様に行った。変更点は WEB サー G = {A, B}, |I| = 120, T (A, i) ≃ 57, T (B, i) = 63 被験者は集団実験室に入室後, 実験者の指示に従って着席し, 実験の説明と謝礼に関する説明を受けた。実験は 2 択のクイズ に回答するものであること, 実験の意図が, 被験者の選択が他の 被験者の回答によってどう影響されるかを調べるものであり, 過去の被験者の選択の情報は, 過去のすべての被験者の選択に 関するものと選択をもとに倍率としたものであること, などで ある。 バーを Ubuntu Linux 上の Apache2 としたこと, サーバープロ グラムを PHP で実装したこと, および, 出題形式である。出題 形式については後に説明する。 R = {0, ∞, 1/∞} (注 12) :グループ A の 1 名の被験者が後半 60 問の r = 1/∞ の 15 問目を回 答中に回答を中止したため, その被験者が回答中の問題を他の 4 名の被験者が回 (注 11) :最初の数名は,1 人で実験参加となったため,g, t と id が 1 対 1 に対応 する。 答できなかった。結果として r = 1/∞ では 119 問しか回答していない被験者 が 4 名,74 問のみの被験者が 1 名となった。 倍率の定義は実験 2 と同じである。本実験でも倍率の理解は難 しいと考え, 具体例を用いて被験者に説明した。被験者の報酬 は, 実験参加費として 500 円, それに倍率以外の場合は正解する と 2 ポイント,倍率の場合は正解すると倍率に等しいポイント を獲得するとし, 総獲得ポイントを1ポイント 1 円と換算し, そ れを参加費に加算した。 実験説明の後, 実験同意書に記名・押印してもらい, 実験を開 始した。実験 2 との主な違いは,R の差異と出題形式の変更で ある。実験 2 では, ある問題を出題すると, 被験者は r ∈ R の すべてのケース(注 13) で回答し, 次の問題の回答に移った。実験 3 では,120 問の問題を前半 60 問, 後半 60 問に分けて, 途中に 5 分間の休憩を挟むことにした。被験者は前半の 60 問をランダ ムな順番で r = 0 の自分の知識だけで回答し, 次に同じ 60 問を ランダムな順番で r = ∞ の過去すべての被験者の選択情報を もとに回答し, 最後に同じ 60 問をランダムな順番で r = 1/∞ の倍率の情報をもとに回答した。後半 60 問も同様に回答し, 被験者は 120 問の問題に回答した。注意すべき点は,r = ∞ と r = 1/∞ は共に過去すべての被験者の選択をもとに各選択肢の 選択者数 CA , CB や倍率 MA , MB を計算して被験者に表示す るが, 同じ g, i, t であっても r = ∞ と r = 1/∞ での選択は一 般に異なるので, 選択者数 CA , CB は二つのケースで一般に異 なる。さらに実験 3 では, ある被験者 id が問題 i に r で回答す るときの順番 t は,r によって異なる。そのため,g, i, r, t での選 択 X(g, i, r, t) を行った被験者 id(g, i, r, t) は r にも依存する。 以 上 の 手 順 に 従 い,|G| = 2, |I| = 120 よ り,r ∈ R = {0, ∞, 1/∞} に 対 し て 長 さ T (g, i) の 240 の 選 択 の 時 系 列 {X(g, i, r, t)} を取得した。 X(g, i, r, t) ∈ {0, 1}, g ∈ G, i ∈ I, r ∈ R, t ∈ {1, · · · , T (g, i)} この実験データを用いた論文は [7] である。そこでも, 分類1の 被験者を独立投票者 (q = 1) とそれ以外をハーダーとして解析 図 4 を行っている。 2. 5 実 験 4 実 験 4 の 被 験 者 説 明 画 面:r = ∞(上 図), r = 1/∞( 中 図),r = 1/∞ での倍率の説明(下図)。 2013 年 7 月 4 日から 5 日にインターネット上でアンケート 実験を実施した。NTT コム goo リサーチ(注 14) の goo リサー チ・ライトという商用アンケート調査サービスを利用した実験 である。本実験の目的は, 実験 1 から実験 3 までの大学生を被 験者とした実験結果の普遍性を検証するために, 大学生より上 の年齢層の一般人を対象にデータを取得することにあった。ま た, 集団実験は実施に手間がかかるため, 商用サービスによる集 団実験の代替可能性の検証も目的であった。goo リサーチ・ラ イトは 40 問までのアンケート調査が可能だった(注 15) ので,10 問を r = 0 と r = ∞ で回答, 別の 10 問を r = 0 と r = 1/∞ で回答という 20 問 40 回回答のアンケート実験とした。被験者 は約 200 名のモニター(注 16) でお願いしたが, 実際の被験者数は (注 13) :ただし, 被験者の順番が t のとき,r < = t − 1 の r と,t − 1 に対応する r が R に無ければ,r = ∞。 218 名となった。 G = {A}, |I| = 20, ID = {1, · · · , 218} {0, ∞} i ∈ {1, · · · , 10} R= {0, 1/∞} i ∈ {11, · · · , 20} アンケートは goo リサーチの WEB サイトで行われるが, 他 の実験と異なり, 過去の回答者の回答情報をアンケート画面に 反映は出来ないため, 実験 3 のデータを用いて,r = ∞, r = 1/∞ での他の被験者の選択情報の画面を作ることとした。問題の選 択は, 実験 3 での正答率が 40%から 70%程度の難しい問題で, 20 名から 30 名の被験者が回答した時点で, 各選択肢を選んだ 被験者の比率がほぼ 7:3,6:4 の比になっているものとした。こ の比率を選んだ理由は, 50%近くの比率でのハーダーの選択が (注 14):NTTコム オンライン・マーケティング・ソリューション株式会社 (注 15):実験当時 (注 16):goo リサーチからのアンケート調査などに答えることでポイントが獲 得することを目的に goo リサーチに登録した人。以下, 被験者とする。 情報カスケード相転移において重要(注 17) だからである。ただ, 比率を完全に 6:4,7:3 にした問題を出題した場合, 被験者が情 報操作を疑う可能性などを考慮し,1 名程度 CA , CB を操作し た(注 18)。また, 実験説明画面では, 他者の選択の情報は, ある大 表2 実験 4 のデータ:回答者数,r = 0, ∞ または r = 0, r = −1 で の正答率:回答者数は i ∈ {1, · · · , 10} は,r = 0, ∞ に共に回答し た被験者数, i ∈ {11, · · · , 20} は,r = 0, −1 に共に回答した被験 者数である。 i 回答者数 正答率 r = 0 正答率 r = ∞ 1 176 0.272 0.699 意した(注 19)。ネット検索で正解を調べて回答する可能性を排除 2 163 0.479 0.669 するため, 制限時間を設けた。r = 0 の場合は 7 秒,r = ∞, 1/∞ 3 161 0.571 0.224 は 10 秒である。こうした時間制限のため, 218 名が 40 問すべ 4 189 0.603 0.847 てに回答できた訳ではない。r = 0, ∞ に共に回答した被験者数 5 210 0.348 0.748 は 161 名から 210 名,r = 0, 1/∞ では 164 名から 211 名であっ 6 208 0.442 0.192 7 203 0.468 0.842 8 199 0.181 0.131 9 200 0.495 0.230 10 200 0.525 0.820 学で行った集団実験の結果を用いた実際のものであることを注 た (表 2 参照)。 アンケート実験は, 実験説明のスライドで実験の趣旨を説明 し, 回答方法, 倍率, 報酬について説明したのち開始した(注 20)。 1 問 20 秒弱,20 問で 15 分弱の実験であった。7 月 4 日からス i 回答者数 正答率 r = 0 正答率 r = 1/∞ タートし, 被験者数が 200 名前後になった時点で終了した。他 11 183 0.361 の被験者の情報はすべての被験者に対して同じであり, この実 12 169 0.544 0.45 験では選択の時系列ではなく, 多数の被験者の同じ選択情報に 13 164 0.628 0.476 対する選択の情報を取得した。 14 192 0.547 0.458 15 211 0.445 0.517 16 209 0.526 0.612 17 207 0.536 0.502 18 201 0.647 0.602 19 203 0.478 0.567 20 202 0.639 0.569 X(i, id, r, t = CA + CB + 1) ∈ {0, 1}, id ∈ ID {0, ∞} i ∈ {1, · · · , 10} r∈ {0, 1/∞} i ∈ {11, · · · , 20} 2. 6 実 験 (2) 5 0.306 2013 年 9 月 30 日から 11 月 8 日に北里大学理学部で実施し た実験である。実施は理学部のセミナー室で行った。被験者 この実験では被験者をグループに分けることはせず, グルー は理学部, 海洋生命学部, 獣医学部の 1,2,3,4 年生を 125 名リク プ A のみとした。また, 被験者は 160 問回答するが, 半分の ルートして実施した (注 21)。実験 1 の被験者と重複はない。本 80 問は前半の 120 問 (i ∈ {1, · · · , 120}) からランダムに出題 実験の目的は, 実験 2 ではアンケートとして実施した主観確率 された問題を r = 0, ∞ の順に回答し,5 分の休憩後に残り半 とその変化の計測を行うこと。また, 実験 4 と同じく情報カス 分の 80 問は後半の 120 問 (i ∈ {121, · · · , 240}) からランダム ケード転移やハーダーの応答を北大の被験者グループとは別の に出題された問題を r = 0, 1/∞ の順に回答するとした(注 22)。 被験者グループで検証する目的もあった。実験者は北里大の守 このため,id(g, i, r, t) は r に依存しない。ただし,X(g, i, r, t) は と入江および物理学科 4 年の桑波田, 吉田の 4 名。クイズの問 i ∈ {1, · · · , 120} のとき r ∈ {0, ∞} でしか値を持たず, また, 題数は 240 問, 回答数はそのうちの 160 問, 実質的な回答時間 i ∈ {121, · · · , 240} のとき r ∈ {0, 1/∞} でしか値を持たない。 は 1 時間程度であった。実験は実験 3 と同様に実験用の WEB プログラムを開発して行った。ただし, 後述するように過去の 実験と選択方法に違いがあり, 2 択の選択と主観確率の選択を 同時に行うようにしている。クライアント端末は PC ではなく Nexus7 などの 7 インチタブレットを用い, タッチペンで選択 する形式とした。このことにより, 他の被験者の画面を見るこ とが難しくなった。また, 実験者は被験者間の接触を監視し, 実 験室内での情報伝達は禁止した。 (注 17) :実験 2,3 では, 6:4 の比率に対してハーダーの約 70%は多数派を選択 する。 (注 18) :実際の問題と用いた CA , CB などの情報は付録を参照のこと。 (注 19):付録:説明画面 3 を参照 (注 20):付録:説明画面を参照 (注 21):9 月 30 日に 12 名,10 月 1 日に 16 名,10 月 2 日に 12 名,10 月 3 日 G = {A}, |I| = 240, ID = {1, · · · , 125} {0, ∞} i ∈ {1, · · · , 120} R= {0, 1/∞} i ∈ {121, · · · , 240} 10 月 4 日に実験で,WEB サーバーがダウンし復旧しなかっ たこと, および, 後半の 120 問の r = 0, r = 1/∞ の実験で被験 者画面に問題があり, その部分のデータを削除して 10 月 3 日か ら再開したため, 前半の r = 0, ∞ に関しては T (g, i) の平均は 83 を越えたが, 後半の r = 0, 1/∞ に関しては T (g, i) は約 47 程度となった。 83.2 T (g, i) ≃ 46.9 i ∈ {1, · · · , 120} i ∈ {121, · · · , 240} に 11 名, 10 月 4 日に 20 名,10 月 7 日に 24 名,10 月 8 日に 16 名,10 月 9 日 に 6 名, 10 月 11 日に 5 名,10 月 26 日,28 日,11 月 8 日に 1 名が参加。被験 者の時間割やリクエストをもとに 3,4,5,6 限の適当な時間帯に実施日時を設定し た。1回の被験者数の上限は 20 名とした。 (注 22) :完全にランダムではなく, 回答者数の少ない問題からランダムに選んで 出題し, 問題間での回答者数のバラツキを抑えた。 ることとした(図 5 参照)。 正解したときの報酬は選択が正しいかどうかで計算し, 自信 度の数値は一切関係ないことを説明した。ただし, この実験は 自信度と選択が他の被験者の選択でどのように変化するのかを 計測するのが目的であることを伝え, 正直に自信度を回答して くれるよう頼んだ。その際, 自信度は主観的な概念であり, 深刻 に考えこむこともないことも注意した。実験説明の後, 実験同 意書に記名してもらい, 実験を開始した。 以上の手順に従い,i ∈ {1, · · · , 120} では r ∈ {0, ∞} に対し て,i ∈ {121, · · · , 240} では r ∈ {0, 1/∞} に対して, 長さ T (g, i) の 120 の選択の時系列 {X(g, i, r, t)} を取得した。 X(g, i, r, t) ∈ {0, 1}, g = A, i ∈ I {0, ∞} i ∈ {1, · · · , 120} r∈ {0, 1/∞} i ∈ {121, · · · , 240} t ∈ {1, · · · , T (g, i)} (3) 3. データの詳細と再利用 ア ー カ イ ブ す る 実 験 デ ー タ は, 各 実 験 の 時 系 列 デ ー タ X(g, i, r, t) と 2 択のクイズである。選択の時系列データ, ク イズは csv 形式のテキストファイルである。表 A· 1 にデータの 概略をまとめた。 クイズは, クイズ番号 i, 問題文, 選択肢 0, 選択肢 1, 正解の選 択肢と番号 ∈ {0, 1} の 6 列のデータである(注 24)。 図 5 実験 5 の被験者説明画面とトラップ問題:2 択の選択と自信度 の選択を同時に行う (上図)。r = ∞ がケース C に対応し, 自信 度は 50%から 100%。r = 1/∞ がケース M に対応し, 自信度 は 10%から 100%。下図はトラップ問題の例。被験者はこうし たトラップ問題を必ず回答する。被験者にトラップ問題の存在 は伝えていない。 選択の時系列データは, 実験番号 1, · · · , 5, グループ番号 g, 問 題番号 i, 参照人数 r, 順番 t, 選択 X(g, i, r, t),id の 7 列を基本と し,8 列目を付加情報とした。グループ番号は g = A を 1,g = B を 2,r は,∞ は 99,1/∞ は −1, それ以外は参照人数 r そのまま とした。id は、1 から |ID| までの整数値とし、t, X(g, i, r, t) は 整数値をとるので、7 列目まではすべて整数である。付加情報 被験者は集団実験室に入室後, 実験者の指示に従って着席し, 実験の説明と謝礼に関する説明を受けた。正解したときの報 酬は r = 0, ∞ では 10 円, r = 1/∞ は 5 円にその選択肢の倍 率を乗じたものとした。今回の実験では 2 択の選択を行うと きに, 自信度も同時に回答するとした。絶対の自信があるなら 100% , まったく自信はない場合は 50%とした。ただし, その場 合でも A か B の一方の 50%を選ぶ必要がある。r = 0, ∞ の 場合, 自信度が 50%以上のものを選択するはずなので, 選択肢 として 50%から 10%刻みで 100%までを用意し, 自信度を選択 することで同時に選択肢を選択することとした。まったく自信 はないけれど A を選択するなら,A の自信度 50%を選択し, 同 様にまったく自信はないけれど B を選択するなら B の自信度 50%を選択する。r = 1/∞ の場合, 自信度が 50%未満でも倍率 の値によっては選択する場合がある。そうした点を説明し, ま は, 実験 1 はなし, 実験 2,5 では自信度, 実験 3 は問題表示から 回答ボタンを押すまでの時間, 実験 4 では参照データで正解の選 択肢を選んだ被験者の比率とした。A が正解なら,CA /CA + CB である。実験 2 では自信度は r = 0, ∞, 1/∞ でしか計測して いない(注 25)。8 列目は, データがない (NA) 場合は −1, 自信度, 回答時間, 正解の比率は実数値とした。 最後に, 実験データの利用は, 本文書, または実験 1,2 のデー タのみなら [4], 実験 2,3 のデータのみなら [4] を引用することを 条件に原則自由とする。本実験の設定には様々な問題があると 考えられ, また, 本文書では説明不足な点もあるかと思う。実験 に関する質問や修正点など, 可能な限り対応したいと考えてい るので, ご連絡をお願いする。また, 実験で用いた WEB プログ ラムもリクエストがあれば提供する。 4. 謝 辞 た, 各選択肢に対して自信度は 10%から 100%を用意した。ま た, 不真面目に参加する被験者がいる可能性を考慮し, トラップ 問題(注 23) を用意し, 自信度 100%で正解を選ぶかどうか確かめ 本実験の実施において, 神田朋彦ヘンリー, 石澤遼, 熊谷直紀, プ問題の出題はランダムである。 (注 24) :実験 5 は i ∈ {241, · · · , 250} でトラップ問題とした。 (注 23) :トラップ問題について事前に被験者に説明はしていない。また、トラッ (注 25) :t = 1 の最初の被験者は r = 0 のみである。 辻崇史, 南川晴紀(実験 1),Ruokang Han 氏, 中村文彦氏(実験 • ∼360 ポイント以上: 360 ポイント付与 2,3),NTT コムオンラインの藤森敬之氏(実験 4), 吉田俊介, • ∼320 ポイント以上: 320 ポイント付与 桑波田康太(実験 5)に多大なご協力をいただきました. ここ • ∼280 ポイント以上: 280 ポイント付与 に深く感謝します. 本研究は JPSJ KAKENHI Grant Number • ∼240 ポイント以上: 240 ポイント付与 21654054,25610109 の助成を受けています. 文 献 [1] S. Bikhchandani, D. Hirshleifer, and I. Welch, “A theory of fads, fashion, custom, and cultural changes as informational cascades,” J. Polit. Econ., vol.100, pp.992–1026, 1992. [2] L.R. Anderson and C.A. Holt, “Information cascades in the laboratory,” Am. Econ. Rev., vol.87, pp.847–862, 1997. [3] M. Hisakado and S. Mori, “Digital herders and phase transition in a voting model,” J. Phys. A, vol.44, pp.275204– 275220, 2011. [4] S. Mori, M. Hisakado, and T. Takahashi, “Phase transition to two-peaks phase in an information cascade voting experiment,” Phys. Rev. E, vol.86, pp.026109–026118, 2012. [5] D. Kubler and G. Weizsacker, “Limited depth of reasoning and failure of cascade formation in the laboratory,” Rev. Econ. Stud., vol.71, pp.425–441, 2004. [6] J.K. Goeree, T.R. Palfrey, B.W. Rogers, and R.D. McKelvey, “Self-correcting information cascades,” Rev. Econ. Stud., vol.74, pp.733–762, 2007. [7] S. Mori,M. Hisakado, and T. Takahashi, “Collective adoption of max―min strategy in an information cascade voting experiment,” J.Phys.Soc.Jpn.,vol.82,pp.0840004–0840013, 2013. 付 録 1. 実験 4 に関する追加情報 被験者に対する説明画面 1 の内容 • これから, みなさんには二択のクイズに答えて頂きます。 クイズは全部で 20 問です。それぞれの問題にノーヒントで答 えて頂き, その次にヒントをもとに答えて頂きます。 • ヒントのパターンには,「人数」「倍率」の二つのパター ンがあり, それぞれ 10 問用意しています。各 10 問に対して 2 回回答して頂きますので, 回答回数は全部で 40 回となります。 • 「人数」のパターンでは, 一回正解するごとに 10 ポイン トとします。1 問でノーヒントと, ヒントありの 2 回回答して いただくので, 最大 20 ポイントです。 • 「倍率」のパターンでは, ノーヒントの場合の正解は同じ く 10 ポイントとします。一方,「倍率」のヒントでは, 倍率を 5 にかけた数値が正解時の獲得ポイントとなります。 • みなさんの獲得するポイントは, この調査への参加謝礼 とは別に, 正解を選んだことに対するポイント値が加算された ものとなります。「人数」「倍率」情報の詳しいことは, 次ペー ジ以降にご説明します。 被験者に対する説明画面 2 の内容 • 【本アンケートのポイントについて】 (通常ポイント)40 ポイント+(ポーナスポイント)各設 問で正解した場合 ※ポイントは,7 月上旬に後付け付与いたし ます。 • ∼440 ポイント以上: 440 ポイント付与 • ∼400 ポイント以上: 400 ポイント付与 • ∼200 ポイント以上: 200 ポイント付与 • ∼160 ポイント以上: 160 ポイント付与 • ∼120 ポイント以上: 120 ポイント付与 • ∼80 ポイント以上: 80 ポイント付与 • ∼40 ポイント以上: 40 ポイント付与 被験者に対する説明画面 3 の内容 • 「人数」のヒントというのは, 二択の各選択肢を選んだ人 数の情報を教えるというものです。この「人数」の情報は, 昨年 6 月にある大学で実施した調査のデータをもとに作成したもの です。そこでは, みなさんが回答するのと同じ問題に対し,120 名の学生が順番に回答しました。回答するごとにヒントの人数 は変化します。 • ただし, その回答はみなさんと同じく,「人数」のヒント をもとにしたものです。つまり, ノーヒントで回答したもので はありません。 • 正解を知らない学生は, 人数のヒントをもとに多数派の 選択肢を選んだ可能性もあるでしょうし, 天の邪鬼な学生なら 反対の少数派の選択肢を選んだことでしょう。 • ただし, 報酬は正解を選んだ数に比例するという条件は みなさんと同じです。 被験者に対する説明画面 4 の内容 • 「倍率」のヒントは, 各選択肢を選んだ人数の情報をもと に倍率を計算し, 人気のない選択肢の倍率を高く, 人気のある選 択肢の倍率を低くしています。 • 倍率は「人数」にほぼ反比例しています。選択肢 A に 20 %, 選択肢 B に 80 %の比率で選択が分かれた場合, A の倍率は 1/0.2 の 5 倍,B の倍率は 1/0.8 で 1.3 倍とします。 • 50 %以上の被験者が選んだ選択肢は 2 倍以下,50 %未満 の選択肢は 2 倍以上となります。 • 倍率の計算に用いた被験者のデータは,「人数」と同じく, 昨年 6 月のある大学で調査したデータを用いています。その調 査でも「倍率」のヒントで回答しています。つまり, ノーヒン トでの回答ではありません。 • 正解を知らない場合, リスクを避けて倍率の小さな選択 肢を選ぶこともあれば, あえて倍率の大きな選択肢を選ぶこと もあったと考えられます。調査での報酬もみなさんと同じく倍 率に比例したものでした。 表 A· 1 実験データアーカイブ:実験情報, 被験者の総選択回数データ, 問題データ, 付加情報。 データは http://202.24.143.74/TWOCHOICE/ にある。実験 3, 実験 4 および実験 5 での選択回数で括弧内は r = 1/∞ または {0, 1/∞} にけるものである。実験 5 では、 {0, 1/∞} での回答画面の不備のため、id ∈ {1, · · · , 40} のデータを削除して id = 41 か ら実験を再開した。そのため被験者数は 85 名となっている。トラップ問題は {0, 1∞} と {0, 1/∞} で 1 回ランダムに出題する。全被験者 125 名は {0, ∞} で回答している が、{0, 1/∞} で回答したのは 69 名だったため、125 + 69 = 194 とした。 No. |G| |I| R |ID| 選択回数 問題データ 実験データ 1 2 100 {0, 1, 2, 3, 5, 7, 9, ∞} 62 6200 QEXP1.csv EXP1.csv なし 2 2 120 {0, 1, 5, 11, 21, ∞ 1/∞} 104 12195 QEXP2.csv EXP2.csv 自信度 3 2 120 {0, ∞, 1/∞} 120 14400(14350) QEXP3.csv EXP3.csv 回答時間 4 1 10 {0, ∞}({0, 1/∞}) 218 1909(1941) QEXP4.csv EXP4.csv C1 /(C1 + C0 ) 5 1 120 {0, ∞}({0, 1/∞}) 125(85) 10103(5696) QEXP5.csv EXP5.csv 自信度 10 Trap,{0, ∞} or {0, 1/∞} 125 194 表 A· 2 i 問題文 1 生まれたときから角が生えている 唯一の哺乳類はどれ? 付加情報 実験 4 で用いた問題とヒント 選択肢 A 選択肢 B CA CB 正解 サイ キリン 9 21 B A 2 野菜の和え物「サラダ」の語源と なった調味料はどれ? 塩 酢 17 13 3 月面に裸で放り出された人間はどうなる? 全身が瞬時に凍り付く 体内の水分が蒸発する 19 11 B 4 打楽器の一種で木琴の仲間はどちらか? ヴィブラフォン シロフォン 18 22 B 5 ティラノサウルスが棲息していた ジュラ紀 白亜紀 6 14 B 6 フランスの初代皇帝となったナポレオン コルシカ島 セントヘレナ島 9 21 A 7 クリスマスソング「きよしこの夜」 が生まれた国は現在のどこ? イギリス オーストリア 8 22 B ハチ セミ 13 17 A マンゴスチン パパイヤ 5 15 A 返す関数はどれ? CORREL 関数 DEVSQ 関数 18 12 A とされている時代はいつか? が生まれた島はどこ? 8 成虫になる前に「さなぎ」になる昆虫はどっち? 9 熱帯果実の女王と呼ばれる, 10 エクセルで 2 つの配列データの相関係数を マレー原産の果実はどれ? 問題文 選択肢 A 選択肢 B 11 1 分間にはばたく回数が最も多い昆虫はどれ? カ ミツバチ 1.4(21) 3.1(9) A 12 国全体での犯罪発生件数が多いのはどちらか? ポーランド フランス 2.4(12) 1.6(18) B 13 音楽記号 presto(プレスト) の意味は? はなはだしく 急速に 2.6(11) 1.6(19) B 14 「ドイツ 3 大 B」と呼ばれる作曲家はバッハ, ブラームス ビバルディ 1.6(18) 2.4(12) A i ベートーベンとあと一人は誰? MA (CA ) MB (CB ) 正解 15 次のアメリカ大統領の中で, 副大統領の経験者は誰? ブッシュ クリントン 2.2(13) 1.7(17) A 16 交響曲第 6 番「悲愴」で知られる作曲家は誰? チャイコフスキー ベートーヴェン 3.1(9) 1.4(21) A 17 ナポレオン戦争後に開催され,「会議は踊る, ウィーン会議 ベルサイユ会議 1.6(18) 2.4(12) A ヒンドゥー教 ゾロアスター教 3.4(8) 1.3(22) A スペイン広場 トレビの泉 3.1(9) 1.4(21) A ニンジン ジャガイモ 3.1(9) 1.4(21) B されど会議は進まず」と評された国際会議はどれ? 18 カンボジアにある世界遺産アンコールワットは 元々どの宗教の寺院遺跡? 19 オードリー・ヘップバーンが映画「ローマの休日」 の中でアイスクリームを食べた場所はどこ? 20 フランス語で「大地のリンゴ」 と呼ばれる植物はどれ?