Comments
Description
Transcript
パワーポイント12
数理統計学 西 山 前回のポイント<定理8> 1. データ(サンプル)の合計値 正規分布をあてはめる ルートNをかけて標準偏差を求める 2. データ(サンプル)の平均値(合計も) 正規分布を当てはめる(定理10) 定理8がポイント 定理8「ばらつきルートNの法則」 データの特徴は、平均がμ、標準偏差がσ N個のサンプルをとると 教科書では省略 合計値 期待値 N 標準偏差 N 平均値 期待値 標準偏差 N 正規分布を当てはめる! << 中心極限定理(データは30~100個以上が目安) クイズ 1. 2. 正しいサイコロを100回振るときに出る目の数 の平均値はどのくらいになりますか?1シグマで 予想してください。 日本人の身長分布はN(170,100)とする。無作 為に10人をとって平均身長を求める。10人の平 均は何センチ位になりますか。1シグマで予想し てください。 実験結果(1万回) 10回の平均値、ほか40回、100回 不偏性 > sd(jikken10) [1] 0.5417527 > sd(jikken40) [1] 0.2716625 > sd(jikken100) [1] 0.1702467 解答 ― (1)のみ 目の出方 平 均 の 出 方 母集団はサイコロ EX 3.5 V X 2.92 E X 3.5 2.92 V X 0.0292 100 1.71 SDX 0.17 100 練習問題【1】 日本人の体重分布には正規分布N(55,225)が 当てはまっているとする。11人のサンプルをとる として・・・ 1. サンプル平均の値が60Kg以上になるのは、 どの位の確率ですか? 2. サンプル平均の値が50Kg台になるのは、 どの位の確率ですか? 解答(1)のみ; (2)はどこかで出題 母集団の特徴: 平均=55Kg、標準偏差=15Kg 11個のサンプル平均 (µ) (σ) EX 55Kg 15 SD X N 11 4.52 Kg X 55 60 55 P X 60 P PZ 1.11 4.52 4.52 練習問題【2】<合計の問題> 旅客機利用客の体重は、全体として平均55Kg、標準 偏差10Kgで正規分布していると言われる。では、定 員400人が満席の時の旅客総ウェイトの最大値をいく らと見込むとよいか? 合計値と平均値 は本質的に同じ問 題 総ウェイト= 400 (400人の平均体重 ) 定理8―母集団の確認から 55 10 2 2 正規分布の 3シグマの法則 400人がサンプル E X 55 100 V X 0.25 400 10 SD X 0.5 400 平均56.5Kgを超 えないはず! 合計は 22600Kg 合計にも<ルートN法則> 1人ずつを見ると、平均55Kg、標準偏差10Kg 400人の合計は? 平均値=400 55 22000 標準偏差 400 10 200 正規分布を当てはめて、最大22000+3×200、22600Kgまで 10年間、毎日飛んでみた > JIKKEN <- REPLICATE(3650,SUM(RNORM(400,MEAN=55,SD=10))) 小文字で > mean(jikken); sd(jikken) [1] 22003.49 [1] 200.3838 > max(jikken) [1] 22613.95 400人合計(Kg) 練習問題【3】二値変数の合計 値 -10 +10 確率 0.5 0.5 1000 100回後の標準偏差? 100日目 -1000 実験結果(1万回) 100回後の合計 ほぼ正規分布 > mean(jikken4) [1] -0.04 > sd(jikken4) [1] 100.0514 【解答】 どんなデータか? 値 -10 +10 0 10 確率 0.5 0.5 結果の出方? 正規分布 E 合計 0 SD合計 100 10 100 【クイズ】 2号館に設置されているエレベーターの定員は11名であ り、最大積載量は750Kgと明示されている。定員一杯の とき、平均68.2Kgだと「乗れない!」ということになる。そ んなことがあるのか?統計上の観点にたって、考えると ころを自由に述べなさい。 但し、上のエレベータに乗る かもしれない人たち(=母集団)の体重分布は、 N(55,225)としておく。 簡単のため11人満員の時の状況だけを考える 【解答】 合計値の分析=平均値の分析 11人の総体重=11人 11人の平均体重 E X 55 11人の平均体重は最大の ときで 225 V X 20.45 55 3 411 .52 68.56 SDX 20.45 4.52 3シグマで最大値を予測しておけばよい。ないし、4シグマ。