...

回帰分析 Part-2

by user

on
Category: Documents
13

views

Report

Comments

Transcript

回帰分析 Part-2
計量経済学 講義
第8回
回帰分析 Part 2
2013 年 11 ⽉ 1 ⽇(⾦)2 限
担当教員:
唐渡 広志
研究室:
経済学研究棟4階432号室
email:
website:
[email protected]
http://www3.u-toyama.ac.jp/kkarato/
1
講義の目的
PCによる単純回帰分析の⽅法について学び
ます。
べき乗関数や指数関数の回帰分析について
学びます。
keywords: 分散分析表,⾃由度調整済み決定係数,分析ツール
(Excel),両対数モデル,弾⼒性,半対数モデル,変化率
教科書: pp. 94 – 126(第3章)
2
【復習1】回帰分析
(単純)回帰
サンプルサイズ n のデータ X i , Yi  について回帰モデル
分析とは
Yi    X i  ui
の回帰パラメータ ,  の推定値を計算することである。
,  の推定値の計算公式
ˆ  S xy 
S xx
 X  X Y  Y 
 X  X 
i
i
2
i
ˆ  Y  ˆ X
ˆ  ˆ X i
推定回帰直線 Yˆi  
残差
残差の特徴
uˆ i  Yi  Yˆi
3.1
3.2
Ŷi を理論値とよぶ。Yi を実績値とよぶ。
3.3
残差 = 実績値-理論値
ルール1 .  uˆ i  0
ルール 2 .  X i uˆ i  0
3.5
3.7 
3
【復習2】回帰分析
【残差2乗和】残差の
ばらつきを⽰す指標
【残差分散】残差の
ばらつきを⽰す指標
 uˆ
2
i
実績値の
ばらつき
ˆ
2
3.15を参照
 S yy  S yˆ yˆ


理論値の
ばらつき
uˆ


2
i
3.17 
n2
【決定係数】推定回帰直線の
あてはまりの良さを⽰す指標 R 2 
(アール・スクウェア)
【回帰の標準誤差】

 Y
Yˆi  Y
または R 2
 
【決定係数 =相関係数の2乗】 R 2  rxy
2

2
Y 
2
i

S yˆ yˆ
S yy
uˆ

 1
S yy
2
i
ˆ 
2
ˆ
u
 i
n2
3.9
3.16
3.10
4
分散分析表 (ANOVA) p.107
観測データ(実績値)における変動要
因(ばらつき)を理論値の変動と残差
の変動に分解すること。
3.15 
S yˆ yˆ   uˆ i2  S yy
  
理論値の
ばらつき
残差の
ばらつき
実績値の
ばらつき
モデル全体の妥当性を測る
指標(後⽇詳しく勉強)
5
自由度調整済み決定係数
自由度 n  2
R2  1 
2
ˆ
u
 i
3.16  uˆ i2
S yy
S yy の分母・分子を n  1 で割ると
自由度 n  1
2
ˆ
u
 i
R2  1  n 1
S yy
自由度調整済み決定係数
 uˆ
2
i
n 1
ˆ
2
n

adj. R  1 
 1 2
S yy
sy
2
残差2乗和の⾃由度
が誤っている
2
3.18
正しい⾃由度に調整した決定係数
n 1
6
例
推定回帰直線
Yˆ  0.5  1.1X
i
R
2
uˆ i2
1.8

1
1
 0.931
S yy
i
adj . R
2
26
uˆ i2

1
n2
S yy n  1
1
1 .8 2
 0.896
26 3
分散分析表
⾃由度
変動
(偏差2乗和)
分散
観測された
分散⽐
回帰(理論値)
1
24.2
24.2
26.9
残差
2
1.8
0.9
-
合計(実績値)
3
26
-
7
Excelによる回帰分析:関数
slope 関数
「傾き」
= slope ( Yのデータ, Xのデータ)
intercept 関数 「切⽚」
= intercept ( Yのデータ, Xのデータ)
rsq 関数
「決定係数」
= rsq ( Yのデータ, Xのデータ)
8
Excelによる回帰分析:近似曲線の描画
散布図上で観測点を右クリック
 近似曲線の追加
 近似曲線の書式設定
 「グラフに数式を表⽰する」にチェック
 「グラフにR-2乗値を表⽰する」にチェック
12
y = 1.1x + 0.5
R² = 0.9308
10
8
6
4
2
0
0
2
4
6
8
10
9
Excel「分析ツール」(1)
1. 「データ」タブ「データ分析」
2. 「データ分析」ダイアログの中から「回帰分析」を選択
10
Excel「分析ツール」(2)
3. 「回帰分析」ダイアログ,Yのデー
タとXのデータを指定
ラベル(変数名)を含
める場合は,チェック
11
Excel「分析ツール」(3)
4. 「回帰分析」の出⼒結果
分散分析表
11⽉18⽇ごろに勉強
12
Excel「分析ツール」(4)
̂
11⽉11⽇以降に勉強
̂
例題で確認: p.143, 例題12, 表3.18
13
練習問題 (1)
表3.1 (p.95) のデータについて,Excel 関数を
⽤いて回帰直線を推定し,決定係数を計算
しなさい。また,「分析ツール」の回帰分
析を利⽤して以下の空欄を埋めなさい。
Yˆi 

R2 
, adj.R 2 
Xi ,
, ˆ 
14
練習問題 (2)
 右のデータ(p.109, 表3.5)につい
て,「分析ツール」の回帰分析を利
⽤して以下の空欄を埋めなさい。
Yˆi 

R2 
, adj.R 2 
Xi ,
, ˆ 
15
Excel「分析ツール」(5)
理論値と残差の出⼒
理論値 Ŷi
残差 ûi
「残差」にチェック
16
Excel「分析ツール」(6)
出⼒先の指定:デフォルトでは新規ワークシートが⾃動で⽣成されてそこに出⼒。
「⼀覧の出⼒先」にチェックをいれて,セル番地を指定すると特定の場所に書き出
すこともできる。
17
150
f(x)
100
100000
0
0
50
50000
f(x)
150000
直線以外での当てはめ
0
5
10
x
15
20
0
5
10
15
20
x
y  ax b や y  ae cxのような式の a, b, c を求めるにはどうしたらよいか?
18
指数関数
0
200
400
y
600
800
1000
(xを指数とよぶ。c > 1 は定数であり,指数の底 [base] とよばれる)
-2
0
2
4
6
8
10
12
x
19
【復習】特殊な底
底が e の指数関数(⾃然指数関数)
0
10
20
y
30
40
50
m
-2
-1
0
1
x
2
3
4
e
1
2
10 2.59374246
100 2.70481383
1,000 2.71692393
10,000 2.71814593
100,000 2.71826824
1,000,000 2.71828047
10,000,000 2.71828169
100,000,000 2.71828179
1,000,000,000 2.71828203
20
指数関数の逆関数
0
-2
0
200
2
400
4
x
y
6
600
8
800
10
12
1000
 y が c を底とする x の指数関数であるとき,x の値は c を底とする y の対数に等しい.
 指数関数の逆関数をとるとき,指数の底 c は y の対数の底になる.
-2
0
2
4
6
x
8
10
12
0
200
400
600
800
1000
y
21
ベキ関数: y = axb の対数線型化 (pp.115-119)
x
y
110
214.142
317.321
420
522.361
624.495
726.458
828.284
930
1031.623
0
5
10
15
y
20
25
30
35
または
4
6
8
10
log10 x
0
0.301
0.477
0.602
0.699
0.778
0.845
0.903
0.954
1
log10 y
1
1.151
1.239
1.301
1.349
1.389
1.423
1.452
1.477
1.5
4
log_10 y
2.0
5
6
2.5
7
3.0
x
0
0.693
1.099
1.386
1.609
1.792
1.946
2.079
2.197
2.303
ln y
2.303
2.649
2.852
2.996
3.107
3.198
3.276
3.342
3.401
3.454
0
0.0
1
0.5
2
1.0
3
1.5
2
ln y
0
ln x
0.0
0.5
1.0
ln x
1.5
2.0
0.0
0.2
0.4
0.6
0.8
1.0
log_10 x
22
両対数モデル (1)

変数の置き換え
Yi
 両辺の変数に対数が使⽤されているので
両対数(ダブルログ)モデルとよぶ。
 ln y と ln x の関係をみている。ln x が1単
位増えると,ln y は b だけ変化する。

Xi
対数変換した上で Yi    X i  ui を推定
aの求め方
  ln a  aˆ  expˆ 
表3.7 (p.117) を参照
23
両対数モデル (2):弾力性
 x1 , y1 
b の意味: ln x が 1 単位増えるときの ln y の変化量 ?
ln y1  ln a  b ln x1
ln y0  ln a  b ln x 0
引き算
b
 x 0 , y0 
y0
x0
ln y1  ln y0  b ln x1  ln x 0 
ln y1  ln y0 y の変化率 の近似

【復習】対数差分は変化率の近似
ln x1  ln x 0 x の変化率 の近似
【重要】x の変化率に対する y の変化率の⽐ (=b) のことを「 y の x (に関す
る)弾⼒性」とよぶ。
意味弾⼒性 b は x が1%変化したときの y の変化率を⽰している。b > 1 な
らば弾⼒的,b < 1 ならば⾮弾⼒的。
例. 需要の価格弾⼒性:(需要関数において数量の変化率/価格の変化率)
24
練習問題 (3)
表3.7 (p.117)のデータについて,従業員数 x,売上⾼ y を⽤いてベキ乗関数 y = axb
を推定しなさい。
1600
8.000
1400
7.000
1200
6.000
1000
5.000
ln y
x
y  ax b  ln y  ln a  b ln x
800
4.000
600
3.000
400
2.000
200
1.000
0
0
500
1000
1500
0.000
0.000
y
aˆ  expˆ   exp 0.8944  0.409
ln y = −0.8944 + 1.0884 ln x
R² = 0.3916
2.000
4.000
ln x
6.000
8.000
yˆ i  0.409 x 1i .088
25
自然指数関数: y = aecX の対数線型化 (pp.119-122)
4
0
200
2
600
y
ln y
1000
6
1400
8
X が 1 単位増えると,ln y は0.5増加する
0
2
4
6
x
8
10
0
2
4
6
8
10
x
26
半対数モデル (1)

変数の置き換え
Yi

Xi
 左辺にだけ対数が使⽤されているので半
対数(セミログ)モデルとよぶ。
 ln y と x の関係をみている。x が1単位増
えると,ln y は c だけ変化する。
x はそのまま使える
表3.8 (p.120) を参照
27
半対数モデル (2):変化率の測定
c の意味: X が 1 単位増えるときの ln y の変化量 ?
ln y1  ln a  cX1
引き算
ln y0  ln a  cX 0
ln y1  ln y0  c  X1  X 0 
X1  X 0  1 ならば c  ln y1  ln y0
【復習】対数差分は変化率の近似
【重要】半対数モデルの回帰パラメータ c は X が 1 単位増えるときの,変化
率の近似値になっている。
28
練習問題 (4)
表3.8 (p.120)のデータについて,年次 X,⼈⼝ y を⽤いて指数関数 y = aecX を推定
しなさい。
推定結果
ˆ
ln yi  ln a  cX i  ui
Yi  27.612  0.021X i
ˆ  ln aの推定値からaの推定値を計算する
aˆ  expˆ   exp 27.612  1.0195E-12
以上より指数関数は
yˆ i  1012  1.0195 e 0.021X i
パラメータ c の意味
ln yi  ln yi 1  c  X i  X i 1 
 ln
yi
 c  X i  X i 1 
yi 1

yi
 e c  X i  X i1 
yi 1

yi  yi 1
 e c  X i  X i1   1
yi 1
0.0000000000010195 = 10-12 ×1.0195
E-12⼩数点12桁⽬以降にゼロ以外
の数値が初めて出る⼩さい値
cˆ  0.021,
X i  X i 1  5 年 より
yi  yi 1
 e 0.0215  1  0.1107
yi 1
5年あたりの⼈⼝成⻑率は11.07%
1年あたりは e0.021−1 = 0.0212 (2.12%)
29
練習問題(5)
[1]. y: 一人あたりGDP,x: 一人当たり資本装備率とする.1980-2008年のデータ(サン
プルサイズは29)を利用してべき関数 y = axb,両対数モデルで回帰分析を行ったとこ
ろ次の結果が得られた.一人あたり資本装備率が 1% 増えると,一人当たりGDPは
何%増えるか?
また, y の x に関する弾力性の値を答えなさい.
[2]. 関西地方の2012年7月平日(n = 23日)の最高気温(℃) X と電力消費量(万kwh) y
を用いて指数関数 y = aecX を推定する。 半対数モデルで回帰分析を行ったところ次の
結果が得られた。気温が1度上昇すると,電力消費量は何%変化すると言えるか?
30
まとめ
Excel で(単純)回帰分析を⾏う場合,関数
を利⽤する⽅法,散布図に直接書き込む⽅
法,「分析ツール」を利⽤する⽅法があ
る。
変数に関して⾮線型であっても,変数変換
によって標準モデルに直すことができれ
ば,最⼩2乗法が適⽤可能である.
両対数モデルから変数間の弾⼒性を求める
ことができる。
⾃然指数関数を対数化した半対数モデルの
傾きは成⻑率(変化率)に対応している.
31
Fly UP