Comments
Description
Transcript
一部から全体を知る-母集団と標本 統計的推定 :一部分を
一部から全体を知る-母集団と標本 統計的推定 :一部分を調査し、集団全体の特性を把握する方法。 標本(サンプル) :集団の一部分 母集団 :もとの集団全体 抽出されたひとまとまり = 標本(サンプル) 標本(サンプル)が複数あるとき 標本(サンプル)数(ここでは=2) 標本(サンプル)に含まれる個体数 =標本(サンプル)サイズ 一部から全体を知る-母集団と標本 標本統計量 母集団 標本(サンプル) 母集団サイズ N 標本サイズ n 母平均 m 標本平均 x 母分散 V=σ2 標本分散 母標準偏差 σ 標本標準偏差u 母比率 P 標本比率 U=u2 p 一部から全体を知る-標本平均の性質 A市の中学校2年生の身長 全数調査(N=42000) 階級値 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 計 度数 84 210 336 462 672 966 1302 1764 2310 3024 3654 4116 4284 4032 3570 2982 2310 1806 1428 1008 714 420 336 168 31 42000 相対度数(%) サンプル数40の標本調査から 得られた標本平均の分布 n=15の標本 調査を40回 行ってみる。 標本平均は 40個得られる。 標本平均の 分布を作成。 階級値 158 159 160 161 162 163 164 計 度数 1 2 4 23 6 3 1 40 標本平均の平均E(x)(これを 標本平均の期待値という): cm 標本平均の標準偏差 D(x): cm 中心極限定理 100% 母平均m: cm cm 母標準偏差σ: 相対度数(%) E(x) = m D( x ) = σ n 一部から全体を知る-標本平均の性質 標本平均の性質(まとめ) 母集団が正規分布をしているか、標本サイズnが十分に大きい値のと き、標本平均xの分布は次の性質をもつ。 ①標本抽出を多数繰り返すとき、得られる標本平均xの期待値E(x)は 母平均mに等しい。 E(x) = m ②標本平均xの標準偏差D(x)は、母標準偏差σの1/√nに等しい。 D( x ) = σ σ n σ n を標準誤差という。 ③標本平均は、平均m、標準偏差 の n 正規分布に従う。 m− 標本平均 の分布 2σ n m− σ n m m+ σ n m+ 2σ n 一部から全体を知る-統計的推定 金沢大学の男子生徒数は5000人です。標本調査によって体重の平均 値を推定してみます。 サンプルサイズn=100、平均値x=64.1kg、標準偏差u=5.2kg。 男子学生全体の平均体重を64.1kgとみなしてよいか? → 。 区間推定法: 標本統計量の値に幅を持たせ、母集団の統計量を推 定する方法。 信頼区間: 「m1kg~m2kgの間にある」。m1を下限値、m2を上限値。 二つにはさまれた区間を信頼区間。 精度: 信頼区間を2で割った値。 信頼度: 推定結果がどの程度信頼できるかを確率で表したもの。 例 「信頼度95%」:同じ推定を100回行ったとしたら5か間違う(=母 集団の統計量が信頼区間から外れる)可能性がある。 一部から全体を知る-Z推定 標本平均の分布 期待値(平均): m 標準偏差: σ / n m x 標準正規分布 x を基準化すると、 x − 期待値 x − m = Z= 標準偏差 σ / n 0 Z 一部から全体を知る-Z推定 標準正規分布 Zが-1.96から1.96をとる確率は95%。 式で表現すると、 − 1.96 < Z = ( x − m) / σ < 1.96 n σ σ < m < x + 1.96 x − 1.96 n n -1.96 0 1.96 母標準偏差が既知なら、標本平均から、母集団の平均の幅を推測できる! 母集団の標準偏差が未知でも、サンプルサイズが十分に大きければ (n>100)標本標準偏差uは母標準偏差σとほぼ一致する。 つまり・・・標本平均と標本標準偏差から、母集団の平均の幅を推測できる! 標準正規分布表 一部から全体を知る-Z推定 Z推定のまとめ m1 = x − Z (α / 2) 下限値: 上限値: m2 = x + Z (α / 2) σ n σ n 信頼度 定数 100(1-α) Z(α/2) 100(1-0.01)=99% Z(0.01/2) = Z(0.005) = 2.58 100(1-0.05)=95% Z(0.05/2) = Z(0.025) = 1.96 αは有意水準という。信頼度と意味は同じ。 Z(α/2)は標準正規分布上で上側確率(中心 0から遠い側の確率)がα/2となる横軸の値。 α/2 α/2 3 2 Z(α/2) 1 0 1 2 3 Z(α/2)