Comments
Description
Transcript
数学の問題CM1
統計学 講義 第 10 回 確率分布の基礎 Part-3 2016 年 5 ⽉ 20 ⽇(⾦)1 限 担当教員: 唐渡 広志(からと・こうじ) 研究室: 経済学研究棟4階432号室 email: website: [email protected] http://www3.u-toyama.ac.jp/kkarato/ 1 お知らせ 中間試験 ギリシャ⽂字 [⼩⽂字,⼤⽂字,読み⽅例] ⽇時と場所:5⽉31⽇(⽕)3 限,13:00 – 14:30, D11教室 持ち込み:⾃筆のノート(A4の紙1枚,表 裏),電卓(平⽅根が計算できるもの) パソコンや通信機器の使⽤は禁⽌ 範囲:第 2 回から第 12 回まで 演習問題の回収期⽇と処分 演習問題 #1−6 の提出締切は 5 ⽉ 20 ⽇(⾦) まで。 これ以降提出しても成績に反映されません。 回収した演習問題(#1−6)は 6 ⽉ 3 ⽇まで預 かり,それ以降は処分します。 配布物と演習問題 ホームページからダウンロード 2 講義の目的 標準化された確率変数の特徴について学びます。 実現値が連続的に変化する確率分布の特徴について学び ます。 keywords: 連続型確率変数,離散型確率変数,確率密度,⼀ 様分布,指数分布,正規分布,カイ2乗分布 参考書 ⽩砂 pp.107 – 114 ⿃居 pp. 77 – 92 ⼤屋 pp. 102 – 134 3 確率変数の標準化 Z aX bについて,a Z 1 V X X X E X E X 1 V X ,b E X V X とするとき V X V X を標準化された確率変数とよぶ. E Z E aX b aE X b 1 V X E X E X V X 0 2 1 V X V X 1 V Z V aX b a 2V X V X V X 必ず E Z 0, V Z 1 が成立する。 4 標準化された確率分布 (1) 0.0 0.2 p 0.4 0.6 X の分布 -2 -1 0 1 2 3 2 3 x 0.0 0.2 p 0.4 0.6 Z の分布 -2 -1 0 1 z 確率変数を(1次式で)変換しても棒の⾼さ(確率)は変わらない 5 E X 0 .7 V X 0.61 0.3 -1 0 1 2 3 1 2 3 である確率は等しい. V X の分布 0.0 X E X 0.3 0.6 0.61 -2 x p 例.X 1 である確率と Z 1 0. 7 0.0 X の分布 p 0.6 標準化された確率分布 (2) -2 -1 0 z 6 「離散」と「連続」 ヴァイオリンで出せる⾳には「切れ⽬」がない. 出せる⾳は「連続的」 ミ E ファ F ミとファの間には無数の⾳が存在する ピアノで出せる⾳には「切れ⽬」がある. 出せる⾳は「離散的」 ミとファの間には出せる⾳がない 7 離散型確率変数と連続型確率変数 離散型確率変数 変数が特定の値をとる確率変数 離散→実現値に切れ⽬がある サイコロの⽬(離散⼀様分布) ⼆項分布(成功回数) ポアソン分布(交通事故発⽣件数) 幾何分布,パスカル分布 など 連続型確率変数 変数の測定尺度をいくらでも細 かくできる確率変数 連続→実現値に切れ⽬がない 離散の場合:実現値に切れ⽬がある 2 3 ⾝⻑や体重の値の分布,株価の 変化率の分布,正規分布,指数 分布,連続⼀様分布,カイ2乗分 布など 連続の場合:実現値は2と3の間に無数にある (いくらでも細かくできる) 2 3 8 離散型確率分布と連続型確率分布 曲線の⾼さは確率を⽰さない!? 0.3 0.2 0.2 0.0 0.1 0.1 0.0 確率 0.3 0.4 0.5 0.4 棒の⾼さが確率を⽰す 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 X 離散型確率分布 実現値に切れ⽬がある 連続型確率分布 実現値に切れ⽬がない 9 連続型確率変数の確率:Pr (160≦X<161) 0.03 幅 : 1cm 0.02 確率 0.04 0.05 ⾝⻑の連続型確率分布 高さ 0.00 0.01 0.03 150 160 170 180 190 Pr 160 X 161 0.031 0.03 Pr 160 X 160.5 0.028 0.5 0.014 1cmの幅に3%の⼈がいる. 幅を狭くすると 幅がないと確率が定義できない 0.5cmの幅に1.4%の⼈がいる. さらに幅を狭くすると Pr X 160 0.026 0 0 !? 10 長さ1単位あたりの「確率密度」の定義 確率を定義するためには区間の幅が必要 幅をゼロにすると,確率もゼロになってしまう。 160.0 cm 以上160.1 cm 未満の⼈はいるが,ちょうど160.000000000…cmの⼈はほとんどいない ある程度の範囲(幅)をとらないと確率は定義できない。 そこで「確率密度」という概念を定義する。 確率密度 ⾼さ Pr x X x 1 cm ⻑さ 1 単位 (1cm ) あたりの確率密度 1 cm X : 連続型変数(身長 ; 単位は cmとする) x : X の実現値 1 cm : 確率を定義するための 範囲(幅) 11 確率密度関数 確率密度関数 : f x 確率密度は X の実現値 x に対応してさまざ まな値をとる⾼さ f (x) を⽰している。 【重要】 確率 ⾯積 Pr x X x x 0.02 0.03 Pr x X x x x 0.01 f (x) 確率密度 (⾼さ) ・確率密度は確率そのもの ではない。 ・確率密度と確率は区別し なければならない。 0.00 確率 f x 確率密度は微⼩な範囲の幅 x あたりの確 率に対応している。 150 160 170 x:小さな範囲(幅) 12 確率密度関数 f (x) を用いて確率を定義 f x Pr x X x x x 幅 確率 Pr x X x x f x x 面積 高さ f x : 確率密度関数 点 x における高さ 確率ではない x : 小さな幅 Pr : 確率 幅をもった面積 高さ 幅 【重要】連続型確率分布では,⾼さと幅,つまり⾯積によって確率を 定義する。 「確率」= ⾼さ × 幅 13 「極限」で考える確率密度関数 幅を狭くするとより正確に⾯積を計算で intervals=0.5 きる。 0.4 例. x1 x10 0.1 Pr 2 X 3 0.2 0.2 Density 0.4 intervals=1 幅 x = 0.5 Pr 2.0 X 2.1 Pr 2.9 X 3.0 0.0 f x1 x1 f x10 x10 0.0 Density 極限x を 0 に近づけること 0 2 4 10 0 f x i x i 6 x 2 6 x i 1 幅intervals=0.1 x = 0.1 0.2 0.0 0.0 0.2 Density 0.4 0.4 intervals=0.2 幅 x = 0.2 Density 4 0 1 2 3 4 x 5 6 7 0 1 2 3 4 5 6 7 x 14 確率を計算するために積分を利用する a からb までの区間を n 等分して確率(面積) を計算 Pr a X b f x1 x f x 2 x n f x n x f x i x i 1 n番目の棒の面積 和の記号の代わりにインテグラルを⽤いる 確率密度関数 f (x) の区間 [a,b) に敷き詰められた微細な⻑⽅形の総和は, a 以上 b 未満の確率に等しい(関数 f (x) を区間 [a,b) で積分する)。 【注意】 ・連続変数の合計は Σ ではなく ∫(インテグラル)を⽤いる。 ・積分とは合計することである。 ・Δx に代えて dx という記号を⽤いる。 ・何等分したかは考えずに,⾯積の区間だけを⽰す。 15 確率変数 X が区間 (3, 4) に入る確率 0.5 f x 0.3 f 1 0.2 x の幅を⼩さくして , f xi x をたくさん⾜す 積分をとる 0.1 ⾼さ: 確率密度 Pr { 3 < X < 4 } = 0.0954 0.0 Density 0.4 X の確率密度関数 f (x) 0 1 2 3 4 5 6 7 X 16 連続型確率分布の特徴 ・任意の実現値をとる確率は0以上である。 離散のときは P X x i 0 ・すべての実現値が起こる確率の合計は1である。 離散のときは P X x i 1 i 1 n 期待値 分散 17 例.確率の計算 2 2 x , 0 x 1 確率密度関数 f x x 0, x 1 0, b b 2.0 1 1 1 積分計算例. x dx x b a 1 1 a 1 a 1.5 例1 f x 2 2 x 0.5 1.0 0.75 例2 0.0 0.25 -1 .0 0 .0 1 .0 2 .0 18 例.連続型確率分布の期待値 期待値 2 2 x, 0 x 1 確率密度関数 : f x x 0, x 1 0, 19 例.連続型確率分布の分散 分散 実現値 x と期待値の差(偏差)の2乗に確率 f (x) dx をかけて合計する 20 連続型確率変数の期待値演算ルール 離散型と同じ結果 21 練習問題 (1) 2 3 x , 確率密度関数 f x 5 10 0, 2x4 x 2, x 4 1. Pr 3 x 4 13 0.65 20 1.0 2. E X 16 0.2 0.4 0.6 3. V X 4. 0.0 fx(x) 0.8 5 0 1 2 3 4 5 6 88 300 E X2 3.2 0.29333... 158 10.533 15 x 22 代表的な連続型確率分布 (1):正規分布 正規分布 (Normal distribution) の確率密度関数 E X ミュー, 正規分布の平均は , 分散は 2 で与えられている V X シグマ2乗 0.06 N (170,36) の正規分布 平均 ,分散 2 の正規分布 0.02 0.04 釣鐘状の形 (Bell Shape) を N , 2 と表現する 170 0.00 f(x) 2 140 150 160 170 x 180 190 200 正規分布に近い現象: ⾝⻑,株価の変化率 23 正規分布の確率密度関数 f (x) や e は数学的な定数 や の値が変わると f (x) の形が変わる. 正規分布は や の⺟数(パラメータ)によって形を特徴づけることができ る。 平均 ,分散 の正規分布を N ( ) という書き⽅で表現する。 24 ネイピア数(自然対数の底) N 1 1 は N の値が十分に大きくなると,ある一定の値 e 2.718282 に近づく。 N 1.0 1.5 1 1 N N N のグラフ 0.0 0.5 (1+1/N)^N 2.0 2.5 e: exponential(指数),ネイピア数 0 5 10 15 20 25 150 N 2 2.25 2.370370 2.593742 2.653298 2.691588 2.704814 2.716924 2.718146 2.718268 2.718280 2.718282 0 50 y 100 y e x のグラフ 1 2 3 10 20 50 100 1,000 10,000 100,000 1,000,000 10,000,000 -4 -2 0 2 4 e −1 = 0.3678794… e0 = 1 e1 = 2.718282… 25 0.25 例. 3種類の正規分布 0.20 N 10, 2 0.15 N 0, 3 0.00 0.05 0.10 f(x) N 10, 4 -20 -10 0 10 20 x 26 代表的な連続型確率分布 (2):指数分布 指数分布の確率密度関数 指数分布の平均および分散は f x e x , x 0 の値によって与えられる. 1 1 E X , V X 2 0.5 Exponential Distribution 0.3 1 2 0.5 指数分布に近い現象:ある事柄が起きる 間隔の確率 0.1 0.2 E X 機械の寿命,耐⽤年数,交通事故発⽣の 間隔 0.0 f(x) 0.4 (ラムダ)= 0.5 の指数分布 0 2 4 6 8 10 X 27 代表的な連続型確率分布 (3):一様分布 ⼀様分布の確率密度関数 一様分布の平均および 分散は 区間 a, b のとり方によって決ま る. ba EX 2 b a 2 V X 12 1.0 1.5 例.区間 [0,1] の⼀様分布 1 0 0.5 2 0.0 0.5 E X -1.0 -0.5 0.0 a0 0.5 1.0 b 1 1.5 2.0 サイコロの出⽬は「離散型」の⼀様分布 28 練習問題 (2) 一様分布の平均と分散 1. 区間 [ 0,1] の一様分布の期待値と分散を求めなさい。 2. 区間 [ 2, 2 ] の一様分布の期待値と分散を求めなさい。 29 離散型一様分布(例.サイコロの出目) 1 確率関数 : Pr X x , X 1, 2,, n n 1 n 1 nn 1 n 1 E X x Pr X x x 2 2 n x 1 n x 1 n V X E X 2 E X 2 1 n 2 n 1 x n x 1 2 2 1 nn 12n 1 n 1 n 2 1 6 4 12 n 2 例. 正十二面体サイコロの出目n 12 12 1 6.5 EX 2 12 2 1 143 V X 11.92 12 12 https://upload.wikimedia.org/wikipedia/commons/thumb/b/b4/D12_regular_dodecah edron.JPG/220px-D12_regular_dodecahedron.JPG 30 代表的な連続型確率分布 (4):カイ2乗分布 m は自由度, は オイラーのガンマ関数 ・自由度 m によって形が変わる分布 ・m 2のカイ2 乗分布は指数分布に一致する E X m V X 2m f(x) 0 5 10 x 15 20 0.00 0.02 0.04 0.06 0.08 自由度 m = 10 0.00 0.05 0.10 0.15 0.20 f(x) 自由度 m = 3 0 10 20 30 40 x 31 まとめ 確率変数 X を標準化した Z X E X V X の期待値と分散は E Z 0, V Z 1 である。 連続型の確率変数 X について実現値をxとするとき, Pr x X x x 確率密度関数 : f x x a, b における確率は Pr a x b f x dx を用いて確率を定義する。このとき, b a より計算する。 連続型の確率変数の期待値および分散は次のように計算する。 E X x f x dx , V X 2 x E X f x dx 平均 ,分散 2 の正規分布を N , 2 と記述する。 32