Comments
Description
Transcript
統計・多変量解析と ソフトコンピューティング 第¾章 確率試行の
統計・多変量解析と ソフトコンピューティング 第 章 確率試行のシミュレーション 本稿掲載の ページ 古橋 武 目次 目次 第 章 確率試行のシミュレーション 乱数について 多数回試行のシミュレーション 大数の法則) コイン投げのシミュレーション さいころ投げのシミュレーション 正規分布の確率密度関数と確率分布関数 正規分布のシミュレーション 平均のシミュレーション 中心極限定理) コイン投げのシミュレーション 指数分布のシミュレーション 不偏分散のシミュレーション 参考文献 第¾章 確率試行のシミュレーション 乱数について 図 関数の入力 乱数の生成 まず, 関数を体験しよう.図 は を立ち上げて,最初に 現れる画面 (シートと呼ばれる)に 関数を入力したところを示す.図説 の「乱数の生成」は対応する ファイルのファイル名である.これら ファ イルは以下の !""###$%&'!&()!"($*+" , からダウ ンロードできる.シート上の一つ一つのますはセルと呼ばれる.セルは列をアルファベッ トで表し,行を数字で表している.図ではセル - に . と入力してある.セルに文字・記号などを打ち込むには入力したいセルにカーソルを持っ 第章 確率試行のシミュレーション ていって,マウスの左ボタンを 度連続してクリックすることで入力可能となる.本書 ではマウスの左ボタンをクリックすることを左クリック,右ボタンの場合を右クリック, 度連続してクリックすることをダブルクリックとよぶ. につづくカッコの中に は何も打ち込む必要はない.上式を打ち込んだ後に / キーを押すと, 関数 の入力が確定される.次にカーソルをセル - の右下隅に持って行くと,カーソルの形が 細い十字に変わるので,マウスの左ボタンを押しながらカーソルを移動させると太い黒 枠がカーソルについてくる(ドラッグすると呼ばれる).図 は 行目までドラッグし て,左ボタンから指を離した結果である.太枠内のどのセルでもよいから選んで左ダブ ルクリックすると 関数がコピーされていることを確認できる.これで 個の乱 数を一度に生成できる.図 はこれらの乱数の折れ線グラフを作画する手順を示す.図 中の数字の示す順番に操作を行う.まず, セル - を左クリックし,次に キーを 押しながらセル - を左クリックする.これでグラフに表示したいデータの範囲を指定 できたので,その後に 挿入→ グラフ→ 折れ線→ 0 折れ線と左クリックして いくことで作画できる.図 は折れ線グラフのできあがりの画面である.なお,シート 上の 個の 関数を再計算させるには,1 ボタンを押せばよい.1 ボタンを押 す度に,シート上の全関数が再計算される. 図 関数のコピー結果 乱数の生成 関数は,その出力を とすると の区間の擬似一様乱数を生成する. 本書ではこの区間を 2 と表記する.なお, 表記する. の場合は 3 4 として区別して の場合には 4 とする.ここで,乱数列とは,要素間に規則性の ない数列のことである.乱数は乱数列の要素である.一様乱数とは,ある有限の区間を 区切ったときに,その区間内の全ての要素が同じ確率で現れるような乱数のことである. また,擬似乱数とは,規則に基づいて生成される数列が,実用の範囲内では乱数列と見 なせる数列の要素のことである. 関数は区間 を約 兆分割した各分割点 の値を出力する.本書で用いる限りでは,ほぼ一様と言ってよい乱数(擬似一様乱数)で 乱数について 図 折れ線グラフの作画 図 折れ線グラフの出来上がり 乱数の生成 ある. 関数の入力されているいずれのセルでもよいので,カーソルを持って行って, 右クリック→セルの書式設定→表示形式→数値→小数点以下の桁数. と設定するとこ の乱数は小数点以下 0 桁まで生成されていることが分かる. 関数のアルゴリズムは次の通りである 3 4.ここでは のマクロのプログ ラミング言語である 5-5&+ -+ !!+/ により記述する.なお,マ クロについては 5- の解説書が数多く出版されているのでそちらを参照された い.本書では節にマクロの使用例を紹介する.さらに,マクロは第章以降で多用す る. の初期値をそれぞれ 3 ,4 3 ,4 3 4 の間の整数値に設定し 第章 確率試行のシミュレーション て,以下の計算を繰り返す. . 6 . 6 . 6 , . 6 , 7 7 0 式中の ,2 2 は素数である.6 関数は を で割った余りを出力 する関数である.上式の計算を繰り返すと,式 は ∼ , の全ての整数値を順不 同に出力した後,ふたたび初期値にもどり,以降同じ整数値列を出力する.図 0はこの ことを確かめている の画面である.セル -0 の を初期値として,セル -, 以 下では一つ上のセルの値を入力として式 の計算結果を出力している.セル -0 から - までで ∼ , の間の全ての整数値を一度ずつ出力した後,セル - にて初 期値の を出力している.このことを確認するために - 列の 0 行目から 行目 までの数値を 列にコピーして昇順に並べ替えている.図 ,は のコピーと並べ替え の手順を示す.コピー元の範囲指定にはセル -0 を左クリックした後に キーと 8 キーを同時に押しながら↓キーを押す操作を行う.これにより先頭のセルから最下行の セルまでを少ない操作回数で指定できる.以降,図中の → →・ ・ ・ と操作を進 めることで, のデータのコピーと昇順の並べ替えを行っている. 番目の操作では 「値のみ」を選択する.こうしないとセル 0 以下には を生成する式がコピーされて しまう.図 0では,さらに 列で 列の上下の隣り合うセル同士の差を求めている.こ の計算式はセル 0 からセル まで記述されている.もし, 列にて数値の重複も しくはジャンプがあれば,この差分値は1以外となる.セル 90 にて 列の の数をか ぞえたところ , 個であった.並べ直した , 個の の値の間には重複もジャン プもなかった. 同様にして,式 , の計算式がそれぞれ ∼ ,2 ∼ の全ての整数値 を順不同で出力することを確認できる.ある初期値から始めて, の関数はそ れぞれ異なる周期で整数値を出力する. つの関数が同時に初期値と同じ値を出力する周 期は約 兆である 34 これはそれぞれの素数から を引いた値 ,2 ,2 の最 小公倍数 .,0, , である. 式 0 は の値をそれぞれの素数で割った後に和を求め,さらに で割った 余りを出力する関数である. , は より小さい有理数であ り,それぞれ分母に異なる素数を持つので,決して同じ値になることはない.また, , 7 7 , 乱数について 0 図 0 関数の :; の性質 :; の性質 図 , :; のコピーと並べ替え である. の区間が約 兆分割されている. , 7 7 を で割って余りをとることは, の各区間の分割点を 区間上に重ね 合わせることに相当する.この場合に一致する分割点はない.なぜならば を素数, を である整数として 7 . 7 7 , 第章 確率試行のシミュレーション が成立するとする. 7 は 7 を で割った余りに相当する.上式は . と変形できるが, は異なる素数であり, であるので,左辺は もしくは割り切 れないで小数点以下の値を持つ.一方,右辺は より大きい整数であるので矛盾する.すな わち,式 0 の 6 の値は の区間を約 兆分割する有理数の点からなる.図 + は式 ∼ の計算を一億回繰り返した時の ,7 7 の値の出現頻度のグラフである. 4 の区間を 4 4 と 刻 みの小区間に 等分し, , 7 7 の値が各区間内に入る頻 度を求めた結果である.この結果を 4 4 4 の 区間に分け,全てを 4 区間 に重ね合わせた結果を図 ( に示す.これは式 0 の出力値 6 の出現頻度 に相当する.初期値を変えて何度同じグラフを描いても同様の結果を得ることができる. 関数が 区間の数値をまんべんなく出力することが分かる.約 兆個の周期 の乱数列に対して 億個の乱数列は一部でしかないが, 関数の性能の一端を見 ることができる. 図 は式 0 の出力値 6 の自己相関係数の計算例を示す.式 ∼0 を 用いて,ある初期値から始めて百万個の乱数を生成し,先頭から 個ずつの組に分け, 先頭の第 組と以降の第 組のデータとの自己相関係数 を求めた結果である.自己相 関係数 は . により定義される.ここで, は第 組の 番目のデータであり, はそれぞれ全乱 数の平均値と不偏分散である. . である.不偏分散 は . により与えられる.第 組のデータ同士の自己相関係数はほぼ であり,第 組と以降の 組との係数の絶対値はほとんどが 以下である.分布形状においても述べたように,約 兆個の周期の乱数列に対して百万個程度の乱数列はほんの一部でしかないが, 関数の性能の一端を別の角度から見ることができる. さて, のシート上では 関数は図 2 のように各セルに を記 入して用いられる. の 関数に式 ∼ の の初期値を指定 する機能はない. 関数の初期値設定は 任せである.そこで,百万個のセ ルに. を記入し, 2 の区間を百万分割して,そのうちのある区間を指定し, 乱数について 図 関数の出力値の分布形状 図 関数の出力値の自己相関係数 その区間内の値の出現回数を求めるシミュレーションを実施した.図 , はそのシ ミュレーション画面である.第 列に 関数による乱数を 個生成して,それ ぞれの右隣のセルで,セル - と で指定された範囲内の数値が出現した場合に を出 力する設定である.:1 は, の条件が成立したときに の値を出力し,不成立の ときに を出力する関数である.すなわち,セル - ではセル の値が より小さ いときに を出力し, 以上の場合には,次の :1 文により より大きい場合 に を出力し, 以下の場合に を出力する.セル の値が 3 4 の 区間にあるとき が出力される.これを右方向に第 列までコピーして,百万個の乱 数を生成している.セル では以上の全データの中で の数を数えている.この例 では百万回に 回だけ指定区間内の値が生成されたという結果が得られている.この計 算を 回繰り返したところ,出現回数の平均値は であり,真の平均値は 0< の 確率で 3 0 04 の区間内にあるという結果が得られた. の 関数の性 第章 確率試行のシミュレーション 能の一端を見ることができる. 図 乱数値の出現回数のシミュレーション(乱数値のシミュレーション) 図 乱数値の出現回数のシミュレーション(その ) 多数回試行のシミュレーション 大数の法則) 大数の法則とは次のことをいう. ある独立試行において事象が起きる確率(数学的確率)が であるとする. このような前提条件の下で、その事象が起きる比率が試行回数を増やすにつ れて近づく値(経験的確率)は である. ここで,試行とはコインを投げたり,さいころ投げたりする行為をいう.独立試行と は,繰り返し行ったとしてもある回の試行が他の回の試行に影響を及ぼすことがない試 行をいう.そして,事象とは試行の結果によって定まる事柄をいう.さいころ投げでは ∼, の目のどれかが出るという事象が起きる.さいころの目が偶数であるという事象は 集合 , と表される. 多数回試行のシミュレーション 大数の法則) コイン投げのシミュレーション コインを 回投げて,表裏の出る回数を数えるシミュレーションを体験しよう.その ために 関数を用いる. 関数は より大きく より小さい擬似一様乱数 を生成する.この 関数を用いてコイン投げのシミュレーションを行う.図 で はセル -∼- , に関数 . := を入力してある.この関数は により の範囲の擬似一様乱数を生成し, := 関数により小数点以下を切り捨てている.コインの表を ,裏を の値に対応さ せれば,セル -∼- , の値はコインを 回投げたときの結果を表している.セル - の 関数 . 86=- - , はセル -∼- , の範囲内で数値が含まれるセルの個数を数える.コインを投げた回数を 表示している.次にセル 8 では . 86=:1>-> >-> , - >-> により,セル -∼- , の範囲内でセル - と同じ数値を含んでいるセルの個数を数え, その結果をコインを投げた総数で割っている.結果はコインの裏の出た比率(経験的確 率)となる.セル -2 - ,2 - をそれぞれ >->,>-> ,,>-> と > 記号を付けて表記し ているのは,式 をセル 8 にコピーした際に,いずれのセル番号も -2 - ,2 - のままで変化しないことを指定している.一方,- には > 記号がついていないので,式 が一つ下のセルへとコピーされた際に自動的に - から - への変換がなされる. 8 の値はコインの表の出た比率である.図 ではコインの表裏の比率を棒グラフに 表してある.試行回数が少ない場合は,表裏の生起する比率は 0 から大きく異なること が多い. 図 は棒グラフを作成する手順を示す.図中の番号順に手続きを進める.まず, 棒グラフに表示したい範囲を指定し, 挿入, 縦棒,' 縦棒の一番左のボタン を左クリックをする.表示された棒グラフを図 に示す.ただし,このままでは横軸 のラベルがデータ区間と合っていない.そこで,横軸ラベルの設定を行う.横軸の数値 の辺りを右クリックすると,図 の左上のメニューが現れるので図中の番号順に手続 きを進める. データの選択, 横軸ラベルの編集, データ区間 セル - ∼- ) を選択,0 OK.以上により,図 の棒グラフが得られる. 図 第章 確率試行のシミュレーション コイン投げのシミュレーション /. コイン投げのシミュレーション (/. ) 図 コイン投げ /. グラフ作成 図 0は,コインを 回投げたときの表裏の比率を示す.比率は 0 に近い値を示 している.コインの表/裏の出る確率はそれぞれ 0 の設定であった.コイン投げの試 行回数が 回のときには,シミュレーションを繰り返す度に表裏の比率は大きく変化し た.試行回数を 回に増やしたことで,表裏の比率(経験的確率)が 0 に近づいた. 多数回試行のシミュレーション 大数の法則) 図 コイン投げ /. グラフの横軸ラベルの設定 図 コイン投げ /. グラフの横軸ラベルの設定手順 これは大数の法則のシミュレーションによる体験の一つである. 図 から図 0への書き換えは次の手順による.まず,図 ,に示すように出力の 比率を表示する場所を移動する.次に,図 に示すように,セル -∼- , のコインの 表裏を出力する :=? 関数を -∼- , の範囲にコピーする.そして,セル - の 86=-- , を 86=-- , としてコイン投げの回数 をカウントす 第章 確率試行のシミュレーション る範囲を拡げる.同様に,セル 1 2 1 のカウント範囲も拡げる.これにより,同図中 の棒グラフが得られる.このままでは縦軸のラベルの範囲が自動調整されているために, 必ずしも見易くはない.そこで縦軸のラベルを設定する.縦軸の数値の辺りを右クリッ クすると図 の左のメニューが現れる.ここで,軸の書式設定を選択し,次に現れる右 の画面において軸のオプションの最小値を に固定する.得られた棒グラフが図 0中 のものである. 図 0 コイン投げのシミュレーション /. コイン投げのシミュレーション (/. ) 図 , コイン投げ /. 出力範囲の移動 さいころ投げのシミュレーション さいころ投げのシミュレーションを を用いて実行する. ∼, の各目の出る確率 をいずれも ", とし,各目の出る比率を棒グラフに表す.図 はその画面である.さ 多数回試行のシミュレーション 大数の法則) 図 コイン投げ /. グラフ作成 図 コイン投げ /. グラフの縦軸ラベルの設定手順 いころの目は . :=, 7 により得る.この関数は,,? により , の範囲の擬似一様乱数を得て,:= 関数により小数点以下を切り捨て, を足すことで, ∼, の目をほぼ均等の確率で出力 する.この関数を -∼-0 , までコピーし,セル - にてその範囲のデータ数と,セル 1 ∼1 にて各目の出現する比率を得ている. 試行回数が 0 回と多いことで各目の 比率が ", に近い値となっている. 第章 確率試行のシミュレーション 図 さいころ投げのシミュレーション /.0 さいころ投げのシミュレーション (/.0 ) 正規分布の確率密度関数と確率分布関数 正規分布の確率密度関数は . ! により与えられる.ここで, は平均, は標準偏差である. . . 準正規分布の確率密度関数 . ! 0 とすると,標 , が得られる.標準正規分布の確率分布関数 は,上式の を用いると . ½ により与えられる. 標準正規分布の形状の作図の様子を図 に示す.まず,変数 の値を入力する.セ ル - に の最小値(ここでは' としている)を入力する.次に,セル -0 に関数 . 6- 7 多数回試行のシミュレーション 大数の法則) 0 を入力する.62 関数は の値の小数点以下 7 桁目を四捨五入する関数であ る.上式はセル - の値に を足して,小数点以下 桁目を四捨五入する.この理由は 以下の通りである. 進数で小数を表す場合には丸め誤差が存在する. を足し続けて いくと丸め誤差が累積されて,小数点以下 0 桁目にわずかなずれが現れてしまうことが あるからである. 進数の を 進数で表現すると . と循環小数で表される.添え字の はその数字が 進数であることを示す. 進数の数 字を 進数に換算するには とする. 進数で . 7 7 7 7 . , 0 7 を厳密に表すことはできない. 図 標準正規分布の作図 標準正規分布の作図 次に,標準正規分布の確率密度関数の値を求める関数を入力する.図 に示すよう に,セル 8 に . 6:=- 1 と入力している.6:= 関数は が 1 のとき,平均 2 標準偏差 の 正規分布の . における確率密度関数の値をを与える. . 2 は - における標準正規分布の確率密度関数の値を与える. . であるので,式 , 第章 確率試行のシミュレーション 図 標準正規分布の作図手順 図 標準正規分布の確率分布関数 グラフの作図手順を図 に示す. 表示したいデータの範囲をカーソルで選択し, 挿入, 散布図、 散布図(平滑線)と左クリックしていくことで実行できる. 標準正規分布の確率分布関数を与える 6:= = のイメージを図 に 多数回試行のシミュレーション 大数の法則) 示す.式 より,確率分布関数 は確率密度関数 の積分値であるので,同 図 + の確率密度関数と . . の直線と 軸で囲まれた塗りつぶされた領域の面積が のときの確率分布関数の値である.同図 ( はこの面積値 を縦軸にとった グラフ(確率分布関数)を示す. 正規分布のシミュレーション 図 標準正規分布の再現のシミュレーション /.0 (標準正規分布の再現 (/.0 )) 標準正規分布に従う乱数(標準正規乱数)を生成して標準正規分布を再現するシミュ レーションを行う.標準正規乱数は標準正規分布の確率密度関数に基づく乱数であり,大 数の法則によると,この乱数を生成して出現頻度分布を求めると,生成する乱数の数を 増やすにつれて出現頻度分布は標準正規分布に近づく. 図 はそのシミュレーション画面である.標準正規乱数は小数点以下を四捨五入し て整数値で生成している.各整数値の出現回数を求めて,全データ数で割ることで出現 頻度を求めている.標準正規乱数は . 6:5 第章 確率試行のシミュレーション により生成している. 6:5 関数は標準正規分布の確率分布関数の逆関数を与 える. は 2 の区間の擬似一様乱数を与えるので,この乱数を入力とする逆関数 の出力は擬似標準正規乱数となる.この様子を図 に示す.図中の上の曲線は標準正 規分布の確率分布関数である. 関数の出力は縦軸の の値として与えられ る.6:5 関数の出力は横軸の の値である. 関数の出力は 区間 にほぼ一様に分布している. 0 付近の の値に対する 6:5 関数の値は 付近に集中し, 付近の の出現頻度は高くなる. が もしくは に近い辺り では,6:5 は広い範囲に分散し,絶対値の大きな の出現頻度は低くなる.理 想的な出現頻度を縦軸にとって同図の下に示す.これは標準正規分布の確率密度関数で ある.擬似一様乱数の入力に対する出力は擬似標準正規乱数となる. 図 確率分布関数の逆関数演算による擬似標準正規乱数の生成 図 では . 66:5 とすることで,標準正規乱数の小数点以下を四捨五入している.同図では各整数値の出現 頻度を棒グラフに表示している.得られたグラフは正規分布に近い形状をしている.こ 多数回試行のシミュレーション 大数の法則) の棒グラフに正規分布のグラフを並べて表示すれば,頻度分布と正規分布とを対比して 見ることができる.図 0は対比結果である.セル 9 では . 6:= 7 0 6:= 0 0 の範囲の確率を求めている.6:= により, 関数は標準正規分布に おいて より小さな値の確率を出力する.以下のセルにはセル 9 の内容をコピーする だけでよい.なお,セルの表示桁数を図のように小数点以下 桁に設定するには,まず 桁数を設定したいセルの範囲を選択し,その範囲内にカーソルを持ってきて右クリック すると,図 ,の左のメニューが現れる. セルの書式設定, 表示形式, 数値, ' ,0 小数点以下の桁数を に設定すればよい.次に,既作成のグラフに標準正 規分布の棒グラフを追加する.グラフエリア内を右クリックすると,図 のメニュー が現れる. データの選択、 追加, 系列名を「標準正規分布」とし, データの 範囲を指定し,0 OKにより図 0の図が得られる.ダウンロードサイトにある ファイル(標準正規分布との対比)では棒グラフがカラーで表示されている.この ファイル内の赤の棒グラフが標準正規分布の理論式に基づく確率分布である.青の棒グ ラフが概ね理論値に沿っていることが分かる.頻度分布を繰り返し再計算させてみると, 青の頻度分布が理論値に近い分布をしていることを見て取ることができる. 図 0 標準正規分布との対比(標準正規分布との対比) 第章 確率試行のシミュレーション 図 , セルの表示桁数の設定 図 標準正規分布との対比 棒グラフの追加手順 平均のシミュレーション 中心極限定理) 中心極限定理とは次のことをいう. 母集団の分布がどんな分布であっても,標本平均 の分布は標本の大き さ を増やしたとき近似的に正規分布に従う. すなわち,コインを 回投げたときに表の出る回数を ! とすると,標本平均 . の分布は を大きくすると正規分布に近づく. ! 平均のシミュレーション 中心極限定理) コイン投げのシミュレーション 中心極限定理を のシミュレーションにより体験できる.図 においてコイン を . 回投げ,表の出た回数を ! として,比率 ! を求めることを 組とする.第 組 において表の出た回数を ! とし,比率を . ! と表す.図 では . 0 組につ いてそれぞれの比率 . を求めている.各組の比率 は 59 関 数により求めている.セル - の 59-- はセル -2 - の数値の平均値を 出力する.第 組の 番目のコインの表裏の値を とすると,第 組の表の比率 は . 0 と表される.セル - では 0 組の比率の平均値 を求めている.この平均値 は以下 の式により与えられる. . , セル 8 では不偏分散 を求めている.5- 9@: 関数は次式で与えられる不偏 分散 を出力する. . 図 は 0 組において表の出た比率の出現頻度および正規分布に基づく確率分布を 求めている画面の抜粋である.セル 8 0 ではセル - ∼-@: の 0 個のセルの中から, セル - 0 で指定された値 . の出現回数を数え,セル 8 の全組数 .0 で割ること で, の出現頻度を求めている. 確率分布を求める際に,6:= = と設定すれば式 の に 式 0 を用いた場合の値を出力できる.ここでは, の代わりにセル - 2 8 で 求めた 0 組の比率の平均値 と不偏分散の平方根 0 ='6:= 0 を用いて,6:= 7 = により 0 の区間の確率 を得ている.なお,= は 6:= = が確率分布関数の における 値を出力することを指定するパラメータである.これを 1 とすると, における確 率密度関数の値の出力を指定する.図 は得られた棒グラフである.シミュレーショ ンを繰り返すと,ほとんどのときに,表の出た比率 . および の出現頻度は対応す る正規分布に基づく確率より大きいこと,また, . 0 の出現頻度は対応する正規分 第章 確率試行のシミュレーション 図 コイン投げのシミュレーション(中心極限定理の体験2 .)(コイン投げ(中 心極限定理)/.) 図 コイン投げ(頻度"確率分布の計算2 .) (コイン投げ(中心極限定理)/.) 図 コイン投げ(頻度"確率分布,.) 布に基づく確率より小さいことを確認できる.標本の大きさ が小さい場合は,標本平 均の分布は正規分布とは異なっている. 図 ∼図 は標本の大きさ . として,0 組において表の出た比率 の出現 頻度および正規分布に基づく確率分布を求めている画面の抜粋である.シミュレーショ ンを繰り返すと,表の出た比率の出現頻度は正規分布に基づく確率の値の周辺にばらつ くことが分かる.標本を . と大きくしたことで,表の出た比率の出現頻度は正規分 平均のシミュレーション 中心極限定理) 布に近づいている.これは中心極限定理のシミュレーションによる体験の一つである. 図 コイン投げのシミュレーション(中心極限定理の体験2 . ) (コイン投げ(中 心極限定理)/. ) 図 コイン投げ(頻度"確率分布の計算2 . )(コイン投げ(中心極限定理) /. ) 指数分布のシミュレーション 確率分布が平均値の左右で非対称である例として,指数分布を取りあげる.まず,こ の分布のシミュレーションを図 ∼図 ,に示す.指数分布の確率密度関数は . "# 第章 確率試行のシミュレーション 図 コイン投げ(頻度"確率分布,/. ) と与えられる.この関数を 3 2 4 の区間について積分することで,次式の確率分布関数 が得られる. . "# . # # . 図 の疑似標準正規乱数の生成法と同様にして疑似指数乱数を生成する.すなわち, の値として, 関数により 2 区間の疑似一様乱数を与える. . # 次に, の逆関数により疑似指数乱数を得る. . " $ ここで, ' も 2 区間の疑似一様乱数なので,これを で置き換えて も 2 区間の疑似一様乱数を得ることができる.よって,疑似指数乱数を生成する関 数は次式となる. . " $ 図 では,セル - において式 の疑似指数乱数を生成している.ここではセ ル - にて " . としている.セル - では小数点以下 桁目を切り捨てている.このエ クセルの画面では,行方向に 0 組(ただし, 組には 個の指数乱数しか入っていな い)の指数乱数を生成している.図 0のセル 8 ではセル -∼9@: の 0 個のセル の中から の値の出現頻度を求めている.図 ,は得られた頻度分布を示す.横軸の値 が の棒グラフは 3 2 の区間の値の出現頻度を表している. 図 ∼図 は標本の大きさ . として,0 組における出現頻度分布と正規分布 の対比を示している. 個の指数関数値の平均値は小数点以下 桁目を四捨五入してい 平均のシミュレーション 中心極限定理) 0 図 指数分布のシミュレーション(指数分布のシミュレーション) 図 0 指数分布(頻度分布の計算2 . )(指数分布のシミュレーション) 図 , 指数分布(頻度分布) る.データ区間は ∼ の間を 刻みとし,ぞれぞれの値の出現頻度を求めている.図 より,. の場合は,平均値の出現頻度分布は正規分布とは大きくずれていること が分かる. 図 は標本の大きさ . として,0 組における出現頻度分布と正規分布の対 比を示している.標本を大きくすることで頻度分布が正規分布に近づいている様子が分 かる. , 第章 確率試行のシミュレーション 図 指数分布のシミュレーション(中心極限定理の体験2 .)(指数分布(中心極 限定理)/.) 図 指数分布(頻度"確率分布の計算2 .)(指数分布(中心極限定理)/.) 図 指数分布(頻度"確率分布,/.) 不偏分散のシミュレーション 図 指数分布(頻度"確率分布,/. ) 不偏分散のシミュレーション さて,コイン投げやさいころ投げにより得られる値を . とする.この 値の不偏分散 と標本分散 % は . と表される. と % の違いは . % で割るか で割るかである.不偏分散はその期待値 が母分散に等しくなるような補正がなされている.標本分散の期待値は母分散よりは小 さな値にずれる.このため標本から分散を求める演算には不偏分散が用いられる. の 5 関数は式 にて示したように不偏分散の値を出力する.ここで母分散とい うことばが初めて登場した.統計解析においては母集団を規定するパラメータである母 平均,母分散の検定・推定を行うことが基礎にある.母集団とは調査対象となるデータ の全体をいう.データは数値データであったり,属性などのカテゴリデータであったり するが,本書では数値データを扱う.母平均,母分散は母集団の平均値,分散値である. 通常これらの値は未知であり,母集団から抽出された標本の平均値,分散値をもとに母 平均,母分散の検定・推定がなされる. 本節ではシミュレーションにより,不偏分散 の期待値が標本分散 % の期待値より も母分散に近い値となることを確かめる.図 は標本分散,不偏分散の分布をシミュ レーションにより求めている例である.セル -∼- では平均 . ,分散 . の正 規分布に基づく乱数(正規乱数)を 個生成している.ここで, . , . は標本 の母集団の分布を規定するパラメータであり,それぞれ母平均,母分散と呼ばれる.セ ル -∼- の値は,母集団から得られた標本である.セル 8∼8 では母平均 . が 分かっているとして,各乱数値 と母平均との差の 乗値 を求め,セル - で セル 8∼8 の平均値を求め,小数点以下を四捨五入している.ここでは,これを分散 とよんでいる.セル - で標本分散,セル - で不偏分散を求め,それぞれ小数点以下 第章 確率試行のシミュレーション を四捨五入している.以上 個の正規乱数を用いた計算結果を一組として,0 組につ いて同じ計算を繰り返し,各分散について平均値を求めたところ,セル - の分散の平 均値とセル 8, の不偏分散の平均値が母分散 . に近い値となった.一方,セル -, の標本分散の平均値は母分散よりも小さな値となった.組数を 0 組としたことで不偏 分散の平均値は期待値に近づき,これが母分散に近い値となった.図 は, 行目の 分散値, 行目の標本分散値, 行目の不偏分散値の出現頻度を棒グラフに表示した結 果である.分散と不偏分散の棒グラフが類似の傾向を示し,標本分散のグラフだけが他 のグラフと比べて分散値の小さな方へと分布の偏りが見られる. 図 不偏分散のシミュレーション(不偏分散のシミュレーション) 図 分散の平均値の出現頻度の棒グラフ 参考文献 参考文献 3 4 - AB+// +/* : C2 DEB / Æ/ +/* F+( F&*'+/*B &B( 9/+G @&/+ %+ ++ % 8 !!* +2 5 2 2 !! ' 2 34 - AB+// +/* : C2 D8/ EB / Æ/ +/* F+( F&*'+/*B &B( 9/+G @&/+ %+ ++ ' % 8 !!* +2 5 2 2 ! 2 索引 索引 2 区間2 3 2 4 区間2 進数の小数2 0 59 関数2 コイン投げ2 さいころ投げ2 シート2 シートの再計算2 86=:1 関数2 試行2 86= 関数2 自己相関係数2 , 5-2 := 関数2 6:= 関数2 02 ,2 6:= 関数2 6:5 関数2 関数2 関数の周期2 6 関数2 0 5 関数2 一様乱数2 折れ線グラフ2 確率分布関数2 2 確率密度関数2 擬似一様乱数2 擬似標準正規乱数2 擬似乱数2 区間2 経験的確率2 2 事象2 循環小数2 0 数学的確率2 正規分布2 正規乱数2 セル2 大数の法則2 縦軸のラベルの設定2 ダブルクリック2 中心極限定理2 独立試行2 ドラッグ2 > 記号2 左クリック2 表示桁数2 標準正規分布2 2 標準正規乱数2 標準偏差2 標本2 標本分散2 索引 不偏分散2 ,2 2 不偏分散の平方根2 平均2 平均値2 棒グラフの作成2 棒グラフの追加2 母集団2 母分散2 母平均2 マクロ2 丸め誤差2 0 右クリック2 横軸ラベルの設定2 乱数2 乱数列2 索引 著者 古橋 武 名古屋大学工学研究科計算理工学専攻 本稿の内容は, 古橋武・宮本定明著 「統計・多変量解析とソフトコンピューティング ―超多自由度系解析を目指して―」 金田・笹井監修,計算科学講座 第 巻,共立出版2 !""###$%&'!&()!"($*+" , から抜粋したものです.共立出版社の許可を得て A( ページに掲載しています.著作権 法上で認められている例外を除き,出版社の許可なく複写することはできません.