Comments
Description
Transcript
E_Views_4 - hungry sleepy greedy
第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 4-1.多重共線性 回帰に用いる説明変数間に高い相関関係がみられるとき(=強く線形結合しているとき) 、これ らの説明変数は多重共線関係にあると言われる。 多重共線性が発生しているもとでは、OLS 推定 の精度が著しく悪化する恐れがあることが知られている。 多重共線性にまつわる諸問題は、OLS 推定量を行列で記述すると理解しやすい。8 しかし、行列演算を用いた説明は本書第Ⅰ部の範囲を 超える。ゆえに、ここでは簡単な重回帰モデルを用いた説明にとどめる。 4-1-1.多重共線性とは いま2つの説明変数をもつ重回帰モデルを想定しよう。 Yt = α + β 1 ⋅ Χ 1 t + β 2 ⋅ Χ 2 t + u t (4-1) 極端な例として、説明変数 X1 と X2 が完全な相関関係にあると仮定しよう。 Χ 2 t = γ ⋅ Χ 1t (4-2) ただし、係数γは既知とする。 (4-2)式を(4-1)式に代入すると、 Yt = α + ( β 1 + β 2 ⋅ γ ) ⋅ Χ 1 t + u t = α + q ⋅ Χ 1 t + u t (4-3) すなわち、このモデルで識別可能な係数は本来 αとqのみである。上式を OLS 推定すると、 Y t = αˆ + qˆ ⋅ Χ 1 t + e t (4-4) このとき以下の関係が成立する。 q̂ = β 1 + β 2 ⋅ γ (4-5) (4-1)式が何らかの経済 (4-5)式を満たす(β1,β2)の組み合わせは無数にある。一方で、 理論に立脚しているとすれば、無限の組み合わせのうち1つだけ理論と整合的な「真の係数」 が存在するはずだ。しかし、 (4-1)式を OLS 推定したとしても、得られる係数推定値は「無限 にある組み合わせのうちのどれか1組」にすぎず、それが「真の係数」と一致する確率は極め て小さい。この意味で、OLS 推定の精度は非常に低いといえる。 8 (完全な)多重共線性が存在する場合には説明変数行列がフル・ランクにならず、OLS 推定量を導出する過程で必要 となる逆行列が定義できなくなる。ゆえに、当然ながら OLS 推定量も定義できない。 81 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 4-1-2.分散拡大要因(VIF : Variance Inflation Factor) 4-1-1 節の例は極端なケース(説明変数間の完全相関)である。実際には、説明変数間に(完 全ではないが)高い相関があるケースが問題となる。係数推定値の精度は、その分散の大きさ によって評価される。もちろん分散が小さいほうが推定の精度は高い。 (4-1)式のOLS推定値の分散は以下のように表される。 (ここでは証明を省略する) Var ( β i ) = σ ∑ (X 1 − X i ) 1 − r122 2 2 it σ2:誤差項の分散(均一分散を仮定) (4-6) r12:説明変数 X1 と X2 の単相関係数 (4-6)式より、 X1 と X2 の相関が高くなるほど OLS 推定値の分散が高くなる (=精度が低下する) 。 なお、説明変数がk個の回帰の場合、 Yt = α + β 1 ⋅ Χ 1t + β 2 ⋅ Χ 2 t + L L + β k ⋅ Χ kt + u t (4-7) この回帰式のOLS推定値の分散は以下のように表される。 (証明を省略) Var ( β i ) = σ ∑ (X 1 − X i ) 1 − R i2 2 2 it (4-8) Ri2:Xiを被説明変数として、他の(k-1)個の変数で回帰させたときの決定係数 やはり当該係数推定値の分散は、当該説明変数と「その他の説明変数の線形結合」の相関が 高いほど大きくなる。なお(4-8)式に含まれる VIF i = 1 1 − R i2 (4-9) を「分散拡大要因(VIF : Variance Inflation Factor) 」という。絶対的な基準はないが、一 般には VIF が 10 よりも大きくなった場合には、 「多重共線性」によって当該変数の係数推定値 の精度が損なわれている恐れがある。 4-1-3.VIF の算出 各々の説明変数について、自分以外の説明変数で回帰させたときの決定係数を求めれば、 (4-9) 式をもとに VIF を計算することができる。しかし、説明変数が多い場合にはこの方法は煩雑であ る。だが、幸いなことに、以下の手順をふめばk個の説明変数の VIF を一括して算出できる。 82 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) ① k個の説明変数の単相関行列 R を求める。 ② R の逆行列を算出する(R-) ③ R- の各対角要素は、対応する説明変数の VIF となっている。 E-Views と Excel での作業を組み合わせると、全ての説明変数の VIF を一括して算出できる。 Q4-1(Workfile 名:Q4-1.wf1) “Q4-1 資産効果あり消費関数.xls”には、1973∼1998 年度の以下のデータが含まれる。 C90 : 実質 民間最終消費支出 [1990 年基準:10 億円 ] DI90 : 実質 家計可処分所得 [1990 年基準:10 億円 ] AST90 : 実質 家計金融資産残高 [1990 年基準:10 億円 ] LP90 : 6大都市 市街地価格指数 [1990 年基準 = 100 ] 問 1)消費関数“ C90 = a0 + a1×DI90 +a2×AST90 +a3×LP90 ”を推定せよ。 問 2)下記の指示に従って各説明変数の VIF を算出し、多重共線性の有無を検証せよ。 ⇒ 操作手順は以下のとおり (以下の作業についての解答例は巻末〔P242〕に掲載されている) ① E-Views の Workfile で全ての説明変数を選択し、ダブルクリックして“Open Group”を選ぶ。 ② View → Correlations → Common Sample とすすみ、説明変数の単相関行列を表示する。この とき表示された単相関行列の変数の並び順を覚えておく。 ③ 単相関行列(ここでは 3×3 対称行列)をコピーし、Excel の新しいシートにコピーする。 ④ Excel においてコピーされた行列の下方にある任意の空白セルにカーソルを移動する。 ⑥ Excel のメニューより、「挿入(I) → 関数(F) → 関数の分類“数学/三角” → 関数名 “MINVERSE(逆行列)” 」とすすみ、 「関数の引数」で“配列”欄右のボタンを押して単相関行 列全体をドラッグする。 ⑦「OK」を押すと、当該セルにのみ数値が出力されるので、このセルをいったんコピーする。 ⑨ このセルを基準に、単相関行列と同じ広さ(ここでは 3×3)を右下方にドラッグする。その ままキーボードの F2 ボタンを押し、さらに Ctrl と Shift と Enter を同時に押す。 ⑩ この結果として出力されたものが「単相関行列の逆行列」である。したがって、この行列の対 83 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 角要素が、③で確認した順番に対応した各説明変数の VIF となる。 ⇒「VIF>10」となり、多重共線性による推計精度の低下が懸念される変数はあったか? ※ 余裕があれば、 金融資産残高(AST)を除いたうえで消費関数を推定し、 併せて VIF を算出せよ。 ⇒ 多重共線性の問題は解決されたか? 4-1-4.多重共線性の問題は回避可能か? 多重共線性を回避する方法は、実のところほとんどない。 第 1 に、誤差項が「古典的標準線 形回帰モデルの諸仮定」 (第 2 章参照)を満たすケースであっても多重共線性は発生しうる。な ぜなら、多重共線性は「統計理論上の問題」ではなく「標本データの問題」であるからだ。最 善の方法でパラメータ推定した場合でさえ、用いる標本のセットに問題があれば推定測度が低 下してしまう。かといって、一般に、分析者が代替的な標本セットを用意することは難しいの で、いったん発生してしまった多重共線性は容易に解消されない。第 2 に、経済理論上は正し い説明変数の選択をしたとしても多重共線性は発生しうる。もちろん、問題となる変数を除外 することによって多重共線性はなくなるかもしれない。しかし、それではもとの経済理論を実 証したことにはならない。 なお、多重共線性を回避する推定法として「Ridge 回帰」がある。しかし、Ridge 回帰は推定 された係数がそのまま「感応度」や「 (対数回帰の場合は)弾力性」として解釈できない。9 ま た、LSE(London School of Economics)に属する計量経済学者たちは、誤差修正モデル(Error Correction Model:ECM)が多重共線性の回避にも有益だと主張する。 4-2.構造変化の検定 4-2-1.構造変化とは いま以下のような単純なモデルの推定を行うとしよう。 Yi= α +β・Xi +ui ui ∼NID(0,σ2) (4-10) 観測者が有しているデータセットが以下の散布図のようになっているケースについて考える。 9 多くの計量ソフトでは「Ridge 回帰」がデフォルトでサポートされておらず、自らプログラムを書いて実行しなけれ ばならない。 84 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 図 4-1.構造変化のイメージ ①標本:1∼m (合計n1 個) ※ 任意のポイント(m)で標本を分割した場合 ②標本:(m+1)∼n (合計n2 個) 第 1 期間:1 ∼ m 300 ⇒ 計n1 標本 第 2 期間:m+1 ∼ n ⇒ 計n2 標本 Y 250 200 [第 1 期間での推定] Yi= a0 +a1・Xi +ei 150 [第 2 期間での推定] Yi= b0 +b1・Xi +vi 100 50 0 0 100 200 300 400 500 X [構造変化の有無] ・帰無仮説「a0 = b0 かつ a1 = b1」が棄却されない。 ⇒ 構造変化は生じていない ・帰無仮説「a0 = b0 かつ a1 = b1」が棄却される。 ⇒ ポイント(m)で構造変化が発生 構造変化の「型」としては、①切片(定数項)のみ、②傾き(係数)のみ、③切片(定数項)と傾き(係数) の両方の 3 種類が考えられる。構造変化が生じているにもかかわらず、これを無視して(n1+n2) 個の標本をひとまとめに推計すると、得られた係数推定値は「第 1 期間」 ・ 「第 2 期間」のいずれの切 片・傾きとも異なってしまう。よって、構造変化の有無を検定することが重要になる。 図 4-2.構造変化を無視した推計 300 全標本を一括して推計する と、第 1 期間・第 2 期間のい ずれの切片・傾きでもない係 数推定値が得られてしまう。 250 Y 200 150 100 50 0 0 100 200 300 X 85 400 500 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 4-2-2.構造変化の有無に関する検定 E-Views では、複数の「推計結果の安定性の検定(裏を返せば、構造変化の検定) 」が用意さ れているが、このうち比較的判断が容易な「One-Step Forecast Test」について実習問題を交 えながら、のみ説明する。 Q4-2-1(Workfile 名:Q4-2.wf1) 「Q4-2 貨幣需要関数.xls」には、1968∼1998 年度の実質 M2+CD(M2CD)と実質 GDP(RGDP) 、 実質国債利回り(R)の系列が収録されている。[1990 年基準の GDP デフレータで実質化、 単位は 10 億円および%] 以下の貨幣需要関数を推定して構造変化の有無を検定せよ。 M2CD = C + a1×RGDP +a2×R ・・・・・(1) ※“EQ01”として保存 ⇒ 操作手順は以下のとおり (以下の作業についての解答例は巻末〔P244〕に掲載されている) 【検定の手順】 1)予備検討:散布図から構造変化の有無を推測 M2CD、RGDP、R を選択し(順番厳守) 、ダブルクリックして“Open Group”を選ぶ。さらに 「VIEW → Multiple Graphs → SCATTER → First Series against ALL」と進む。 ⇒ 傾きは安定的か?10 2)統計学的な判定 ① 最初に、誤差項の自己相関・不均一分散について確認せよ(第 3 章の復習) 。 注)ここで誤差項に自己相関や不均一分散が確認されたとしても、さしあたり無視する こと(理由は後述) ②「View → Stability Test → Recursive Estimates(OLS only) 」とすすむ。 ③ OUTPUT の欄で“One Step Forecast Test”をチェックする。 【検定手法の直観的理解】 この検定では、前期までの標本を用いて推計したパラメータによって、今期の値を高い 精度で予測できるか否かをみている。もしも正しく予測できているなら「予測残差(予測 値と実績値の差) 」は小さくなるはずだ。このとき、実際に今期の標本を加えてモデルを推 10 散布図から類推可能なのは「傾き」の変化のみである。なぜか? 86 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 計しても、係数推定値はほぼ同じになるであろう。よって、構造変化はないと判断される。 逆に、前期までの推計結果で今期の値を正しく予想できていないなら「予測残差」は大き くなる。このとき、今期からはパラメータを変えたほうがよいことになり、構造変化が起 っていると判断される。なお、手法の性質上、観測期間の初期では(標本数が少ないため に)検定の精度が低くなる。 【出力結果の見方】 1)図中に実線で表される「逐次残差」が、 点線内におさまる =「予測残差」が小さい → 構造変化は起こっていない。 点線の範囲を逸脱 =「予測残差」が大きい → 構造変化が発生している 2)図中の○のプロットの意味 「前期までの標本で推計したモデルで、今期の値を正しく予測可能」という帰無仮説が 正しい確率(単位は左軸に表示)を意味する。つまり、 ⇒ ○が上方にプロットされる → 帰無仮説が正しい確率が低い → 構造変化が発生 3)有意水準の設定は分析者に委ねられるが、少なくとも 5%未満とすることが妥当であろう。 図 4-3.実習問題(Q4-2)に関する“One Step Forecast Test”の結果 60000 40000 20000 0 -20000 .00 -40000 .05 .10 .15 1975 1980 1985 One-Step Probability 1990 1995 Recursive Residuals ① 1980 年代から次第に予測制度が低下する。 ② 1986 年で有意確率が顕著に下落する。 ⇒ バブル期に構造変化が生じていることが示唆される。 87 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 4-2-3.構造変化への対処 検定によって構造変化が確認された場合、十分な標本が確保できるのであれば、期間を分割し てそれぞれの標本について OLS 推定を行うことが望ましい。しかし、標本のサイズが十分でない ケース(例えば実習問題 Q4-2-1)では、ダミー変数を導入して対処することになる。 Q4-2-2(Workfile 名:Q4-2.wf1 に上書き) Q4-2-1 で検出された構造変化の発生時点をふまえ、貨幣需要関数の推定結果を改善せよ。 改善した結果は“EQ02”として保存すること。 ⇒ 操作手順は以下のとおり (以下の作業についての解答例は巻末〔P246〕に掲載されている) 【構造変化への対処】 ① 適切なダミー変数を作成する。 1968∼1985 年度に「1」 、それ以降に「0」の値をとるダミー変数を「D6885」という名で 作成する。 (ダミー変数の作成方法は第 2 章を参照) ② 4-2-1 節で述べたように構造変化には様々な「型」がある。この点をふまえ、ダミー変数を 用いたさまざまな回帰を行う。 1)定数項ダミーとして「D6885」を付加して推計 2)実質 GDP の係数ダミー「RGDP×D6885」を付加して推計 3)実質金利の係数ダミー「R×D6885」を付加して推計 4)上記3つの組み合わせによって推計 ③ もっとも推計結果が改善された定式化を採用し、 “EQ02”として保存する。なお、ダミー変数 を導入して構造変化に対処する場合には、 係数推定値の大きさが経済理論に照らして妥当な水 準であるかどうかにも十分に留意されたい。 構造変化を考慮する前のモデルで誤差項に自己相関や不均一分散が認められたとしても、ダミ ー変数等で構造変化に適切に対処することにより、誤差項に自己相関や不均一分散がなくなるこ とも少なくない。実際、実習問題 Q4-2-2 の最終的な結果と Q4-2-1 のもとの回帰の結果を比較す ると、 決定係数だけでなく Durbin-Watson 値もかなり改善されている。すなわち、 この問題は 3-2-1 節で述べた“Omitted Variables”の問題の一形態と解釈できる。 88 第 4 章.OLS 推定にまつわるその他の諸問題(多重共線性・構造変化) 《演習》高度成長終焉後の所得税収関数における構造変化の検定 (保存 Workfile 名“Test4.wf1” ) “Test4 所得税収関数.xls”には、家計部門における 1975∼1998 年(68SNA)の「所得税・罰 金支払(TAXH) 、雇用者所得(YNH) 、財産所得(YAH) 」のデータが収録されている。 1) 「log(TAXH)= α+β・log (YNH)+γ・log (YAH)+ε」を推計せよ。 2)誤差項の分散均一性を検定せよ(ここでは有意水準 10%で判定せよ) 3)構造変化の有無を検証せよ。構造変化が確認された場合、任意の方法で結果を改善せよ。 (含:誤差項の自己相関、不均一分散の面での改善) ⇒ 解答例は巻末〔P249〕に掲載されている 89