統計・多変量解析とソフトコンピューティング第¾章確率試行の

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download 統計・多変量解析とソフトコンピューティング第¾章確率試行の

Transcript

統計・多変量解析とソフトコンピューティング第¾章確率試行の

統計・多変量解析と
ソフトコンピューティング
第章確率試行のシミュレーション
本稿掲載のページ
古橋武
目次
目次
第
章確率試行のシミュレーション
乱数について
多数回試行のシミュレーション大数の法則）
コイン投げのシミュレーション
さいころ投げのシミュレーション
正規分布の確率密度関数と確率分布関数
正規分布のシミュレーション
平均のシミュレーション中心極限定理）
コイン投げのシミュレーション
指数分布のシミュレーション
不偏分散のシミュレーション
参考文献
第¾章
確率試行のシミュレーション
乱数について
図関数の入力乱数の生成
まず，関数を体験しよう．図はを立ち上げて，最初に
現れる画面（シートと呼ばれる）に関数を入力したところを示す．図説
の「乱数の生成」は対応するファイルのファイル名である．これらファ
イルは以下の !""###$%&'!&()!"($*+"
,
からダウ
ンロードできる．シート上の一つ一つのますはセルと呼ばれる．セルは列をアルファベッ
トで表し，行を数字で表している．図ではセル - に
. と入力してある．セルに文字・記号などを打ち込むには入力したいセルにカーソルを持っ
第章
確率試行のシミュレーション
ていって，マウスの左ボタンを度連続してクリックすることで入力可能となる．本書
ではマウスの左ボタンをクリックすることを左クリック，右ボタンの場合を右クリック，
度連続してクリックすることをダブルクリックとよぶ．につづくカッコの中に
は何も打ち込む必要はない．上式を打ち込んだ後に / キーを押すと，関数
の入力が確定される．次にカーソルをセル - の右下隅に持って行くと，カーソルの形が
細い十字に変わるので，マウスの左ボタンを押しながらカーソルを移動させると太い黒
枠がカーソルについてくる（ドラッグすると呼ばれる）．図は行目までドラッグし
て，左ボタンから指を離した結果である．太枠内のどのセルでもよいから選んで左ダブ
ルクリックすると関数がコピーされていることを確認できる．これで個の乱
数を一度に生成できる．図はこれらの乱数の折れ線グラフを作画する手順を示す．図
中の数字の示す順番に操作を行う．まず，セル - を左クリックし，次にキーを
押しながらセル - を左クリックする．これでグラフに表示したいデータの範囲を指定
できたので，その後に挿入→ グラフ→ 折れ線→ 0 折れ線と左クリックして
いくことで作画できる．図は折れ線グラフのできあがりの画面である．なお，シート
上の個の関数を再計算させるには，1 ボタンを押せばよい．1 ボタンを押
す度に，シート上の全関数が再計算される．
図関数のコピー結果乱数の生成
関数は，その出力をとするとの区間の擬似一様乱数を生成する．
本書ではこの区間を 2 と表記する．なお，
表記する．
の場合は 3
4 として区別して
の場合には 4 とする．ここで，乱数列とは，要素間に規則性の
ない数列のことである．乱数は乱数列の要素である．一様乱数とは，ある有限の区間を
区切ったときに，その区間内の全ての要素が同じ確率で現れるような乱数のことである．
また，擬似乱数とは，規則に基づいて生成される数列が，実用の範囲内では乱数列と見
なせる数列の要素のことである．関数は区間を約兆分割した各分割点
の値を出力する．本書で用いる限りでは，ほぼ一様と言ってよい乱数（擬似一様乱数）で
乱数について
図折れ線グラフの作画
図折れ線グラフの出来上がり乱数の生成
ある．
関数の入力されているいずれのセルでもよいので，カーソルを持って行って，
右クリック→セルの書式設定→表示形式→数値→小数点以下の桁数. と設定するとこ
の乱数は小数点以下 0 桁まで生成されていることが分かる．
関数のアルゴリズムは次の通りである 3 4．ここではのマクロのプログ
ラミング言語である 5-5&+ -+ !!+/ により記述する．なお，マ
クロについては 5- の解説書が数多く出版されているのでそちらを参照された
い．本書では節にマクロの使用例を紹介する．さらに，マクロは第章以降で多用す
る．の初期値をそれぞれ 3 ,4 3 ,4 3 4 の間の整数値に設定し
第章
確率試行のシミュレーション
て，以下の計算を繰り返す．
. 6 . 6
. 6
,
. 6 , 7 7 0
式中の ,2 2 は素数である．6 関数はをで割った余りを出力
する関数である．上式の計算を繰り返すと，式は ∼
, の全ての整数値を順不
同に出力した後，ふたたび初期値にもどり，以降同じ整数値列を出力する．図 0はこの
ことを確かめているの画面である．セル -0 のを初期値として，セル -, 以
下では一つ上のセルの値を入力として式の計算結果を出力している．セル -0 から
-
までで ∼
, の間の全ての整数値を一度ずつ出力した後，セル -
にて初
期値のを出力している．このことを確認するために - 列の 0 行目から行目
までの数値を列にコピーして昇順に並べ替えている．図 ,はのコピーと並べ替え
の手順を示す．コピー元の範囲指定にはセル -0 を左クリックした後にキーと 8
キーを同時に押しながら↓キーを押す操作を行う．これにより先頭のセルから最下行の
セルまでを少ない操作回数で指定できる．以降，図中の → →・
・
・と操作を進
めることで，のデータのコピーと昇順の並べ替えを行っている．番目の操作では
「値のみ」を選択する．こうしないとセル 0 以下にはを生成する式がコピーされて
しまう．図 0では，さらに列で列の上下の隣り合うセル同士の差を求めている．こ
の計算式はセル 0 からセルまで記述されている．もし，列にて数値の重複も
しくはジャンプがあれば，この差分値は１以外となる．セル 90 にて列のの数をか
ぞえたところ , 個であった．並べ直した , 個のの値の間には重複もジャン
プもなかった．
同様にして，式，の計算式がそれぞれ ∼
,2 ∼
の全ての整数値
を順不同で出力することを確認できる．ある初期値から始めて，の関数はそ
れぞれ異なる周期で整数値を出力する．つの関数が同時に初期値と同じ値を出力する周
期は約兆である 34 これはそれぞれの素数からを引いた値 ,2 ,2 の最
小公倍数 .,0,
, である．
式 0 はの値をそれぞれの素数で割った後に和を求め，さらにで割った
余りを出力する関数である． , はより小さい有理数であ
り，それぞれ分母に異なる素数を持つので，決して同じ値になることはない．また，
, 7 7 ,
乱数について
0
図 0 関数の :; の性質 :; の性質
図 , :; のコピーと並べ替え
である．
の区間が約兆分割されている． , 7 7 を
で割って余りをとることは，
の各区間の分割点を区間上に重ね
合わせることに相当する．この場合に一致する分割点はない．なぜならばを素数，
をである整数として
7
.
7
7
,
第章
確率試行のシミュレーション
が成立するとする． 7 は 7 をで割った余りに相当する．上式は
. と変形できるが，は異なる素数であり，
であるので，左辺はもしくは割り切
れないで小数点以下の値を持つ．一方，右辺はより大きい整数であるので矛盾する．すな
わち，式 0 の 6 の値はの区間を約兆分割する有理数の点からなる．図
+ は式 ∼ の計算を一億回繰り返した時の ,7 7 の値の出現頻度のグラフである．
4 の区間を 4 4 と刻
みの小区間に等分し， , 7 7 の値が各区間内に入る頻
度を求めた結果である．この結果を 4 4 4 の区間に分け，全てを 4 区間
に重ね合わせた結果を図 ( に示す．これは式 0 の出力値 6 の出現頻度
に相当する．初期値を変えて何度同じグラフを描いても同様の結果を得ることができる．
関数が区間の数値をまんべんなく出力することが分かる．約兆個の周期
の乱数列に対して億個の乱数列は一部でしかないが，関数の性能の一端を見
ることができる．
図は式 0 の出力値 6 の自己相関係数の計算例を示す．式 ∼0 を
用いて，ある初期値から始めて百万個の乱数を生成し，先頭から個ずつの組に分け，
先頭の第組と以降の第組のデータとの自己相関係数を求めた結果である．自己相
関係数は
.
により定義される．ここで，は第組の番目のデータであり，はそれぞれ全乱
数の平均値と不偏分散である． . である．不偏分散は
.
により与えられる．第組のデータ同士の自己相関係数はほぼであり，第組と以降の
組との係数の絶対値はほとんどが以下である．分布形状においても述べたように，約
兆個の周期の乱数列に対して百万個程度の乱数列はほんの一部でしかないが，
関数の性能の一端を別の角度から見ることができる．
さて，のシート上では関数は図 2 のように各セルにを記
入して用いられる．の関数に式 ∼ のの初期値を指定
する機能はない．関数の初期値設定は任せである．そこで，百万個のセ
ルに. を記入し，
2 の区間を百万分割して，そのうちのある区間を指定し，
乱数について
図関数の出力値の分布形状
図関数の出力値の自己相関係数
その区間内の値の出現回数を求めるシミュレーションを実施した．図，はそのシ
ミュレーション画面である．第列に関数による乱数を個生成して，それ
ぞれの右隣のセルで，セル - とで指定された範囲内の数値が出現した場合にを出
力する設定である．:1 は，の条件が成立したときにの値を出力し，不成立の
ときにを出力する関数である．すなわち，セル - ではセルの値がより小さ
いときにを出力し，
以上の場合には，次の :1 文によりより大きい場合
にを出力し，
以下の場合にを出力する．セルの値が 3
4 の
区間にあるときが出力される．これを右方向に第列までコピーして，百万個の乱
数を生成している．セルでは以上の全データの中での数を数えている．この例
では百万回に回だけ指定区間内の値が生成されたという結果が得られている．この計
算を回繰り返したところ，出現回数の平均値はであり，真の平均値は 0< の
確率で 3
0 04 の区間内にあるという結果が得られた．の関数の性
第章
確率試行のシミュレーション
能の一端を見ることができる．
図乱数値の出現回数のシミュレーション（乱数値のシミュレーション）
図乱数値の出現回数のシミュレーション（その）
多数回試行のシミュレーション大数の法則）
大数の法則とは次のことをいう．
ある独立試行において事象が起きる確率（数学的確率）が
であるとする．
このような前提条件の下で、その事象が起きる比率が試行回数を増やすにつ
れて近づく値（経験的確率）は
である．
ここで，試行とはコインを投げたり，さいころ投げたりする行為をいう．独立試行と
は，繰り返し行ったとしてもある回の試行が他の回の試行に影響を及ぼすことがない試
行をいう．そして，事象とは試行の結果によって定まる事柄をいう．さいころ投げでは
∼, の目のどれかが出るという事象が起きる．さいころの目が偶数であるという事象は
集合 , と表される．
多数回試行のシミュレーション大数の法則）
コイン投げのシミュレーション
コインを回投げて，表裏の出る回数を数えるシミュレーションを体験しよう．その
ために関数を用いる．関数はより大きくより小さい擬似一様乱数
を生成する．この関数を用いてコイン投げのシミュレーションを行う．図で
はセル -∼- , に関数
. := を入力してある．この関数はによりの範囲の擬似一様乱数を生成し，
:= 関数により小数点以下を切り捨てている．コインの表を，裏をの値に対応さ
せれば，セル -∼- , の値はコインを回投げたときの結果を表している．セル - の
関数
. 86=- - ,
はセル -∼- , の範囲内で数値が含まれるセルの個数を数える．コインを投げた回数を
表示している．次にセル 8 では
. 86=:1>-> >-> , - >->
により，セル -∼- , の範囲内でセル - と同じ数値を含んでいるセルの個数を数え，
その結果をコインを投げた総数で割っている．結果はコインの裏の出た比率（経験的確
率）となる．セル -2 - ,2 - をそれぞれ >->，>-> ,，>-> と > 記号を付けて表記し
ているのは，式をセル 8
にコピーした際に，いずれのセル番号も -2 - ,2 -
のままで変化しないことを指定している．一方，- には > 記号がついていないので，式
が一つ下のセルへとコピーされた際に自動的に - から -
への変換がなされる．
8
の値はコインの表の出た比率である．図ではコインの表裏の比率を棒グラフに
表してある．試行回数が少ない場合は，表裏の生起する比率は 0 から大きく異なること
が多い．
図は棒グラフを作成する手順を示す．図中の番号順に手続きを進める．まず，棒グラフに表示したい範囲を指定し，挿入，縦棒，' 縦棒の一番左のボタン
を左クリックをする．表示された棒グラフを図に示す．ただし，このままでは横軸
のラベルがデータ区間と合っていない．そこで，横軸ラベルの設定を行う．横軸の数値
の辺りを右クリックすると，図の左上のメニューが現れるので図中の番号順に手続
きを進める．データの選択，横軸ラベルの編集，データ区間セル - ∼-
）
を選択，0 ＯＫ．以上により，図の棒グラフが得られる．
図第章
確率試行のシミュレーション
コイン投げのシミュレーション /. コイン投げのシミュレーション
（/. ）
図コイン投げ /. グラフ作成
図 0は，コインを回投げたときの表裏の比率を示す．比率は 0 に近い値を示
している．コインの表／裏の出る確率はそれぞれ 0 の設定であった．コイン投げの試
行回数が回のときには，シミュレーションを繰り返す度に表裏の比率は大きく変化し
た．試行回数を回に増やしたことで，表裏の比率（経験的確率）が 0 に近づいた．
多数回試行のシミュレーション大数の法則）
図コイン投げ /. グラフの横軸ラベルの設定
図コイン投げ /. グラフの横軸ラベルの設定手順
これは大数の法則のシミュレーションによる体験の一つである．
図から図 0への書き換えは次の手順による．まず，図 ,に示すように出力の
比率を表示する場所を移動する．次に，図に示すように，セル -∼- , のコインの
表裏を出力する :=? 関数を -∼- , の範囲にコピーする．そして，セル
- の 86=-- , を 86=-- , としてコイン投げの回数をカウントす
第章
確率試行のシミュレーション
る範囲を拡げる．同様に，セル 1 2 1
のカウント範囲も拡げる．これにより，同図中
の棒グラフが得られる．このままでは縦軸のラベルの範囲が自動調整されているために，
必ずしも見易くはない．そこで縦軸のラベルを設定する．縦軸の数値の辺りを右クリッ
クすると図の左のメニューが現れる．ここで，軸の書式設定を選択し，次に現れる右
の画面において軸のオプションの最小値をに固定する．得られた棒グラフが図 0中
のものである．
図 0
コイン投げのシミュレーション /. コイン投げのシミュレーション
（/. ）
図 , コイン投げ /. 出力範囲の移動
さいころ投げのシミュレーション
さいころ投げのシミュレーションをを用いて実行する． ∼, の各目の出る確率
をいずれも ", とし，各目の出る比率を棒グラフに表す．図はその画面である．さ
多数回試行のシミュレーション大数の法則）
図コイン投げ /. グラフ作成
図コイン投げ /. グラフの縦軸ラベルの設定手順
いころの目は
. :=, 7
により得る．この関数は，,? により , の範囲の擬似一様乱数を得て，:=
関数により小数点以下を切り捨て，を足すことで， ∼, の目をほぼ均等の確率で出力
する．この関数を -∼-0
, までコピーし，セル - にてその範囲のデータ数と，セル
1 ∼1 にて各目の出現する比率を得ている．試行回数が 0
回と多いことで各目の
比率が ", に近い値となっている．
第章
確率試行のシミュレーション
図さいころ投げのシミュレーション /.0
さいころ投げのシミュレーション
（/.0
）
正規分布の確率密度関数と確率分布関数
正規分布の確率密度関数は
.
!
により与えられる．ここで，は平均，は標準偏差である． . .
準正規分布の確率密度関数
.
!
0
とすると，標
,
が得られる．標準正規分布の確率分布関数は，上式のを用いると
.
½
により与えられる．
標準正規分布の形状の作図の様子を図に示す．まず，変数の値を入力する．セ
ル - にの最小値（ここでは' としている）を入力する．次に，セル -0 に関数
. 6- 7 多数回試行のシミュレーション大数の法則）
0
を入力する．62 関数はの値の小数点以下 7 桁目を四捨五入する関数であ
る．上式はセル - の値にを足して，小数点以下桁目を四捨五入する．この理由は
以下の通りである．進数で小数を表す場合には丸め誤差が存在する．
を足し続けて
いくと丸め誤差が累積されて，小数点以下 0 桁目にわずかなずれが現れてしまうことが
あるからである．
進数のを進数で表現すると
. と循環小数で表される．添え字のはその数字が進数であることを示す．進数の数
字を進数に換算するには
とする．進数で . 7 7 7 7 . ,
0 7 を厳密に表すことはできない．
図標準正規分布の作図標準正規分布の作図
次に，標準正規分布の確率密度関数の値を求める関数を入力する．図に示すよう
に，セル 8 に
. 6:=- 1 と入力している．6:= 関数はが 1 のとき，平均 2 標準偏差の
正規分布の .
における確率密度関数の値をを与える． . 2
は - における標準正規分布の確率密度関数の値を与える．
.
であるので，式
,
第章
確率試行のシミュレーション
図標準正規分布の作図手順
図標準正規分布の確率分布関数
グラフの作図手順を図に示す．表示したいデータの範囲をカーソルで選択し，
挿入，散布図、散布図（平滑線）と左クリックしていくことで実行できる．
標準正規分布の確率分布関数を与える 6:= = のイメージを図に
多数回試行のシミュレーション大数の法則）
示す．式より，確率分布関数は確率密度関数の積分値であるので，同
図 + の確率密度関数と .
.
の直線と軸で囲まれた塗りつぶされた領域の面積が
のときの確率分布関数の値である．同図 ( はこの面積値を縦軸にとった
グラフ（確率分布関数）を示す．
正規分布のシミュレーション
図標準正規分布の再現のシミュレーション /.0
（標準正規分布の再現
（/.0
））
標準正規分布に従う乱数（標準正規乱数）を生成して標準正規分布を再現するシミュ
レーションを行う．標準正規乱数は標準正規分布の確率密度関数に基づく乱数であり，大
数の法則によると，この乱数を生成して出現頻度分布を求めると，生成する乱数の数を
増やすにつれて出現頻度分布は標準正規分布に近づく．
図はそのシミュレーション画面である．標準正規乱数は小数点以下を四捨五入し
て整数値で生成している．各整数値の出現回数を求めて，全データ数で割ることで出現
頻度を求めている．標準正規乱数は
. 6:5
第章
確率試行のシミュレーション
により生成している． 6:5 関数は標準正規分布の確率分布関数の逆関数を与
える．
は 2 の区間の擬似一様乱数を与えるので，この乱数を入力とする逆関数
の出力は擬似標準正規乱数となる．この様子を図に示す．図中の上の曲線は標準正
規分布の確率分布関数である．関数の出力は縦軸の
の値として与えられ
る．6:5 関数の出力は横軸のの値である．関数の出力は区間
にほぼ一様に分布している．
0 付近のの値に対する 6:5 関数の値は
付近に集中し，
付近のの出現頻度は高くなる．がもしくはに近い辺り
では，6:5 は広い範囲に分散し，絶対値の大きなの出現頻度は低くなる．理
想的な出現頻度を縦軸にとって同図の下に示す．これは標準正規分布の確率密度関数で
ある．擬似一様乱数の入力に対する出力は擬似標準正規乱数となる．
図確率分布関数の逆関数演算による擬似標準正規乱数の生成
図では
. 66:5 とすることで，標準正規乱数の小数点以下を四捨五入している．同図では各整数値の出現
頻度を棒グラフに表示している．得られたグラフは正規分布に近い形状をしている．こ
多数回試行のシミュレーション大数の法則）
の棒グラフに正規分布のグラフを並べて表示すれば，頻度分布と正規分布とを対比して
見ることができる．図 0は対比結果である．セル 9 では
. 6:= 7 0 6:= 0
0 の範囲の確率を求めている．6:=
により，関数は標準正規分布に
おいてより小さな値の確率を出力する．以下のセルにはセル 9 の内容をコピーする
だけでよい．なお，セルの表示桁数を図のように小数点以下桁に設定するには，まず
桁数を設定したいセルの範囲を選択し，その範囲内にカーソルを持ってきて右クリック
すると，図 ,の左のメニューが現れる．セルの書式設定，表示形式，数値，
' ，0 小数点以下の桁数をに設定すればよい．次に，既作成のグラフに標準正
規分布の棒グラフを追加する．グラフエリア内を右クリックすると，図のメニュー
が現れる．データの選択、追加，系列名を「標準正規分布」とし，データの
範囲を指定し，0 ＯＫにより図 0の図が得られる．ダウンロードサイトにあるファイル（標準正規分布との対比）では棒グラフがカラーで表示されている．この
ファイル内の赤の棒グラフが標準正規分布の理論式に基づく確率分布である．青の棒グ
ラフが概ね理論値に沿っていることが分かる．頻度分布を繰り返し再計算させてみると，
青の頻度分布が理論値に近い分布をしていることを見て取ることができる．
図 0 標準正規分布との対比（標準正規分布との対比）
第章
確率試行のシミュレーション
図 , セルの表示桁数の設定
図標準正規分布との対比棒グラフの追加手順
平均のシミュレーション中心極限定理）
中心極限定理とは次のことをいう．
母集団の分布がどんな分布であっても，標本平均の分布は標本の大き
さを増やしたとき近似的に正規分布に従う．
すなわち，コインを回投げたときに表の出る回数を ! とすると，標本平均 .
の分布はを大きくすると正規分布に近づく．
!
平均のシミュレーション中心極限定理）
コイン投げのシミュレーション
中心極限定理をのシミュレーションにより体験できる．図においてコイン
を . 回投げ，表の出た回数を ! として，比率 ! を求めることを組とする．第組
において表の出た回数を ! とし，比率を . ! と表す．図では . 0
組につ
いてそれぞれの比率 .
を求めている．各組の比率は 59 関
数により求めている．セル - の 59-- はセル -2 - の数値の平均値を
出力する．第組の番目のコインの表裏の値をとすると，第組の表の比率は
.
0
と表される．セル - では 0
組の比率の平均値を求めている．この平均値は以下
の式により与えられる．
.
,
セル 8 では不偏分散を求めている．5- 9@: 関数は次式で与えられる不偏
分散を出力する．
.
図は 0
組において表の出た比率の出現頻度および正規分布に基づく確率分布を
求めている画面の抜粋である．セル 8 0 ではセル - ∼-@: の 0
個のセルの中から，
セル - 0 で指定された値 .
の出現回数を数え，セル 8 の全組数 .0
で割ること
で，
の出現頻度を求めている．
確率分布を求める際に，6:= = と設定すれば式のに
式 0 を用いた場合の値を出力できる．ここでは，の代わりにセル - 2 8 で
求めた 0
組の比率の平均値と不偏分散の平方根
0 ='6:= 0 を用いて，6:= 7
= により 0 の区間の確率
を得ている．なお，= は 6:= = が確率分布関数のにおける
値を出力することを指定するパラメータである．これを 1 とすると，における確
率密度関数の値の出力を指定する．図は得られた棒グラフである．シミュレーショ
ンを繰り返すと，ほとんどのときに，表の出た比率 . および
の出現頻度は対応す
る正規分布に基づく確率より大きいこと，また， . 0 の出現頻度は対応する正規分
第章
確率試行のシミュレーション
図コイン投げのシミュレーション（中心極限定理の体験2
.）（コイン投げ（中
心極限定理）/.）
図コイン投げ（頻度"確率分布の計算2 .）
（コイン投げ（中心極限定理）/.）
図コイン投げ（頻度"確率分布，.）
布に基づく確率より小さいことを確認できる．標本の大きさが小さい場合は，標本平
均の分布は正規分布とは異なっている．
図 ∼図は標本の大きさ . として，0
組において表の出た比率の出現
頻度および正規分布に基づく確率分布を求めている画面の抜粋である．シミュレーショ
ンを繰り返すと，表の出た比率の出現頻度は正規分布に基づく確率の値の周辺にばらつ
くことが分かる．標本を . と大きくしたことで，表の出た比率の出現頻度は正規分
平均のシミュレーション中心極限定理）
布に近づいている．これは中心極限定理のシミュレーションによる体験の一つである．
図コイン投げのシミュレーション（中心極限定理の体験2 . ）
（コイン投げ（中
心極限定理）/. ）
図コイン投げ（頻度"確率分布の計算2
. ）（コイン投げ（中心極限定理）
/. ）
指数分布のシミュレーション
確率分布が平均値の左右で非対称である例として，指数分布を取りあげる．まず，こ
の分布のシミュレーションを図 ∼図 ,に示す．指数分布の確率密度関数は
. "# 第章
確率試行のシミュレーション
図コイン投げ（頻度"確率分布，/. ）
と与えられる．この関数を 3
2 4 の区間について積分することで，次式の確率分布関数
が得られる．
.
"#
.
#
# .
図の疑似標準正規乱数の生成法と同様にして疑似指数乱数を生成する．すなわち，
の値として，関数により 2 区間の疑似一様乱数を与える．
.
#
次に，の逆関数により疑似指数乱数を得る．
.
"
$
ここで， ' も 2 区間の疑似一様乱数なので，これをで置き換えて
も 2 区間の疑似一様乱数を得ることができる．よって，疑似指数乱数を生成する関
数は次式となる．
.
"
$
図では，セル - において式の疑似指数乱数を生成している．ここではセ
ル - にて " . としている．セル - では小数点以下桁目を切り捨てている．このエ
クセルの画面では，行方向に 0
組（ただし，組には個の指数乱数しか入っていな
い）の指数乱数を生成している．図 0のセル 8 ではセル -∼9@: の 0
個のセル
の中からの値の出現頻度を求めている．図 ,は得られた頻度分布を示す．横軸の値
がの棒グラフは 3
2 の区間の値の出現頻度を表している．
図 ∼図は標本の大きさ . として，0
組における出現頻度分布と正規分布
の対比を示している．個の指数関数値の平均値は小数点以下桁目を四捨五入してい
平均のシミュレーション中心極限定理）
0
図指数分布のシミュレーション（指数分布のシミュレーション）
図 0 指数分布（頻度分布の計算2 . ）（指数分布のシミュレーション）
図 , 指数分布（頻度分布）
る．データ区間は ∼ の間を刻みとし，ぞれぞれの値の出現頻度を求めている．図
より，. の場合は，平均値の出現頻度分布は正規分布とは大きくずれていること
が分かる．
図は標本の大きさ . として，0
組における出現頻度分布と正規分布の対
比を示している．標本を大きくすることで頻度分布が正規分布に近づいている様子が分
かる．
,
第章
確率試行のシミュレーション
図指数分布のシミュレーション（中心極限定理の体験2
.）（指数分布（中心極
限定理）/.）
図指数分布（頻度"確率分布の計算2 .）（指数分布（中心極限定理）/.）
図指数分布（頻度"確率分布，/.）
不偏分散のシミュレーション
図指数分布（頻度"確率分布，/. ）
不偏分散のシミュレーション
さて，コイン投げやさいころ投げにより得られる値を .
とする．この
値の不偏分散と標本分散 % は
.
と表される．と % の違いは .
%
で割るかで割るかである．不偏分散はその期待値
が母分散に等しくなるような補正がなされている．標本分散の期待値は母分散よりは小
さな値にずれる．このため標本から分散を求める演算には不偏分散が用いられる．
の 5 関数は式にて示したように不偏分散の値を出力する．ここで母分散とい
うことばが初めて登場した．統計解析においては母集団を規定するパラメータである母
平均，母分散の検定・推定を行うことが基礎にある．母集団とは調査対象となるデータ
の全体をいう．データは数値データであったり，属性などのカテゴリデータであったり
するが，本書では数値データを扱う．母平均，母分散は母集団の平均値，分散値である．
通常これらの値は未知であり，母集団から抽出された標本の平均値，分散値をもとに母
平均，母分散の検定・推定がなされる．
本節ではシミュレーションにより，不偏分散の期待値が標本分散 % の期待値より
も母分散に近い値となることを確かめる．図は標本分散，不偏分散の分布をシミュ
レーションにより求めている例である．セル -∼- では平均 . ，分散 . の正
規分布に基づく乱数（正規乱数）を個生成している．ここで， . ， . は標本
の母集団の分布を規定するパラメータであり，それぞれ母平均，母分散と呼ばれる．セ
ル -∼- の値は，母集団から得られた標本である．セル 8∼8 では母平均 . が
分かっているとして，各乱数値と母平均との差の乗値を求め，セル -
で
セル 8∼8 の平均値を求め，小数点以下を四捨五入している．ここでは，これを分散
とよんでいる．セル - で標本分散，セル - で不偏分散を求め，それぞれ小数点以下
第章
確率試行のシミュレーション
を四捨五入している．以上個の正規乱数を用いた計算結果を一組として，0
組につ
いて同じ計算を繰り返し，各分散について平均値を求めたところ，セル - の分散の平
均値とセル 8, の不偏分散の平均値が母分散 . に近い値となった．一方，セル -,
の標本分散の平均値は母分散よりも小さな値となった．組数を 0
組としたことで不偏
分散の平均値は期待値に近づき，これが母分散に近い値となった．図は，
行目の
分散値，行目の標本分散値，行目の不偏分散値の出現頻度を棒グラフに表示した結
果である．分散と不偏分散の棒グラフが類似の傾向を示し，標本分散のグラフだけが他
のグラフと比べて分散値の小さな方へと分布の偏りが見られる．
図不偏分散のシミュレーション（不偏分散のシミュレーション）
図分散の平均値の出現頻度の棒グラフ
参考文献
参考文献
3 4 - AB+// +/* : C2 DEB / Æ/ +/* F+(
F&*'+/*B &B( 9/+G @&/+ %+ ++ % 8 !!* +2 5 2 2 !! ' 2 34 - AB+// +/* : C2 D8/ EB / Æ/ +/*
F+( F&*'+/*B &B( 9/+G @&/+ %+ ++ '
% 8 !!* +2 5 2 2 ! 2 索引
索引
2 区間2 3
2 4 区間2 進数の小数2 0
59 関数2 コイン投げ2 さいころ投げ2 シート2
シートの再計算2 86=:1 関数2 試行2 86= 関数2 自己相関係数2 ,
5-2 := 関数2 6:= 関数2 02 ,2 6:= 関数2 6:5 関数2 関数2
関数の周期2 6 関数2 0
5 関数2 一様乱数2 折れ線グラフ2 確率分布関数2 2 確率密度関数2 擬似一様乱数2 擬似標準正規乱数2 擬似乱数2 区間2 経験的確率2 2 事象2 循環小数2 0
数学的確率2 正規分布2 正規乱数2 セル2
大数の法則2 縦軸のラベルの設定2 ダブルクリック2 中心極限定理2 独立試行2 ドラッグ2 > 記号2 左クリック2 表示桁数2 標準正規分布2 2 標準正規乱数2 標準偏差2 標本2 標本分散2 索引
不偏分散2 ,2 2 不偏分散の平方根2 平均2 平均値2 棒グラフの作成2 棒グラフの追加2 母集団2 母分散2 母平均2 マクロ2 丸め誤差2 0
右クリック2 横軸ラベルの設定2 乱数2 乱数列2 索引
著者
古橋武
名古屋大学工学研究科計算理工学専攻
本稿の内容は，
古橋武・宮本定明著
「統計・多変量解析とソフトコンピューティング ―超多自由度系解析を目指して―」
金田・笹井監修，計算科学講座第巻，共立出版2 !""###$%&'!&()!"($*+"
,
から抜粋したものです．共立出版社の許可を得て A( ページに掲載しています．著作権
法上で認められている例外を除き，出版社の許可なく複写することはできません．

統計・多変量解析と ソフトコンピューティング 第¾章 確率試行の

Comments

Description

Transcript

統計・多変量解析とソフトコンピューティング第¾章確率試行の