Comments
Description
Transcript
固定効果と操作変数
第 7 回輪講ゼミ 2015.01.09 脇 拓臣 0.はじめに 本日の実証分析では,因果効果の推定手法として「固定効果法(FE; fixed effects) (第 19 章) 」 「操作変数 法(IV; instrumental variable)(第 20 章) 」について勉強する. 1.固定効果法(FE) パネルデータが手元にあるならば,前章でとりあげた DD を一般化した手法とも言える FE による因果効 果の推定が可能である. 失業者に対して職業訓練を与えるプログラムによってどれくらい収入が上がったかを測定するとする.収 入に影響を与える要因にはプログラム受講の有無の他に,性別・学歴などさまざまなものがある.しかし, この測定において非常に重要な要因となる失業者の能力は,観察者には入手できない.失業者の能力は,収 入に大きな影響を与えると同時に, 学歴などの共変量やプログラムの受講の有無にも大きな影響を与えるが, 能力を直接観察することは出来ない.能力を取り込まずプログラムの受講の有無の他に性別・学歴などを説 明変数とし,収入を目的変数として OLS を行うと,欠落変数バイアスが発生し,推定値が不正確になる可能 性がある. 同様に,会社に対するある法規制が企業業績に与える影響を測定したいとする.企業業績に与える要因と して,当該法規制の適用の有無や,研究開発投資・従業員数・店舗数などさまざまなものがある.しかし, 経営者の経営手腕や企業文化などの要因も,業績や研究開発投資・従業員数などに影響を与えるだろう.だ が,これらの要因は適切に測定できず,統計分析において直接使用できない.業績を目的変数とし,経営手 腕や企業文化を説明変数に取り込まずに OLS を行うと,推定値が不正確になってしまう可能性がある. この場合,観察できない要因が時間を経ても変化しないと仮定できるなら,FE が使える. FE の発想は,ユニットごとの観察不能な要因の影響が存在していても,その要因が時間を経ても変化せず 一定であり,かつ,複数時点についてのデータを取得できるなら,ユニットごとの固有の特徴=固定効果を 除去するということにある.固有の特徴を除去すれば,残りの変化は,観察不能な要因の影響がない部分で あることになり,欠落変数バイアスから解放される. 1.1 FE の推定方法 FE による推定値の計算は,ユニットごとにダミー変数を設定して,それぞれのユニットの固定効果を OLS で推定することで行う(正確には,ユニット数より 1 個尐ないダミー変数を使う) .この際,観察不能な要因 が固定効果に入り込んでおり,中身を明らかにできないのだが,観察不能な要因の影響を除去することに意 味があるので,具体的な固定効果の内容は気にしない. FE の推定手法にはダミー変数法の他に,全てのデータからユニットごとの平均値を差し引いた上で OLS を行う方法がある.法規制と企業業績の具体例で,100 個のデータがあったとする.まず,企業 1 について 企業業績・研究開発投資…の異なる時点間の平均値をとり,その平均値を各変数から差し引く.企業 2 につ いても同じように行う.これを企業 100 まで行い,変換をし終わったデータで,OLS による推定を行う.こ のユニット平均値除去法でもダミー変数法と同様に FE 推定値が計算できる. 1.1 クラスタリング(clustering) パネルデータではなく,1 時点のみの単純なクロスセクションデータを使って OLS を行うときの重要な前 提の一つは,データ内の全てのユニットがバラバラに選ばれていることだ.仮にパネルデータ内の各ユニッ トがバラバラに選ばれていても, ユニットごとに複数時点からデータが取得されており, 各ユニット内では, これら複数時点のデータはバラバラではない.このため同一ユニット内では,異なる時点のデータの間に相 関関係が存在する可能性がある.そのため,同一ユニットに属するデータを 1 つのグループ(クラスター) 1 第 7 回輪講ゼミ 2015.01.09 脇 拓臣 とし,その中で相関関係があり得ることを考慮に入れて標準誤差を計算する必要がある.これがクラスタリ ングであり,FE の推定においての注意点の 1 つである.クラスタリングは,通常の OLS における通常の標 準誤差と頑健な標準誤差との関係によく似ている.クラスタリングありの標準誤差の方が,ない場合の標準 誤差よりも大きくなるので,クラスタリングを施すと統計的有意性が出にくくなる.しかし,同一ユニット 内に属するデータがバラバラだと想定することは非現実的なので,クラスタリングは行うべきである. 1.3 FE の構造 パネルデータには,ユニット内変化とユニット間変化の 2 種類の変化がある.ユニット内変化とは,同一 ユニット内における異時点間のデータの値の異同のことである.これに対し,ユニット間変化とは,同一時 点における異なるユニット間のデータの値の異同のことである(図 1) .ユニット平均値除去法は,ユニット ごとに平均値を差し引くので,各ユニット内の異時点間の違いだけに着目していることになる.この意味で FE の特徴はパネルデータにおける変化のうち,ユニット間変化を全て捨て去り,ユニット内変化だけを利用 している点にある.これに対し,FE ではない OLS はユニット内変化もユニット間変化も等しく利用するも のである.しかし,ユニット間変化には観察不能な要因による影響が入り込んでいる可能性があるので,こ れを利用することは好ましくないことが多い. 1.4 FE の判別条件 FE が因果効果を推定できるための判別条件は,①観察不能な固定効果を除去すると説明変数と誤差項とが 無相関であること,②時間の経過に関わらず一定の説明変数が無いことである.①は固定効果が時間の経過 に関わらず一定であることに近い.②は全く変化のない説明変数についてユニット平均値を除去すると全て 0 になってしまい,それを説明変数とする回帰のしようがないからである.①が満たされないケースは観察 不能な説明変数が時間の経過に関わらず一定でなく,時間の経過とともに変化している場合,または目的変 数を考慮して説明変数が決まるという内生性あるいは同時決定性がある場合である. ここで, 「警察予算が増えると,犯罪は減るか(目的変数:犯罪率,説明変数:警察予算,ユニット:市区 町村) 」というモデルを FE で推定する例を考える.判別条件違反の 1 つ目の例として,好景気という説明変 数が欠落している場合が考えられる.好景気だと,地方公共団体の予算が増え警察予算も増えるが,同時に 犯罪も減るので,警察予算の増加によって犯罪が減ったという結論に至りかねない.この問題を解決するに は,時間の経過とともに変化する説明変数を組み入れることである.2 つ目の例として,各市町村が前年度 の犯罪率を見て,犯罪率が高い場合には警察予算を増額し,犯罪率が低ければ警察予算を減額する場合が考 えられる.このような場合にも FE での推定にはバイアスが発生する. 2.RE(random effects;ランダム効果法) FE は時間の経過にかかわらず一定の説明変数がある場合には使えないが,それでも性別が収入に及ぼす効 果を測定したい場合に使われるのが RE という推定手法である.FE においては,ユニットごとの固定効果が 時間の経過に関わらず変化しないという前提が置かれていたが,RE はこの部分がランダムに変動するとい う前提をとる.直感的には,FE がユニット間変化を捨て,ユニット内変化だけを利用するのに対し,RE は ユニット内変化に加えてユニット間変化も取り込み推定するという仕組みである. しかし,ユニット間変化を取り込むと欠落変数バイアスが再度浮上してくる可能性がある.そこで RE が 適切に推定できるための判別条件は,FE の判別条件①に加え,時間の経過にも関わらず変化しない観察不能 な効果と説明変数とが無相関であることである.この判別条件が充足されるなら,RE は FE に比べて効率的 であり,FE よりも小さな標準誤差が得られる.もっとも RE の第 2 の判別条件が充足されることはあまりな いので,FE を使うことが適切な場合が多い. 2 第 7 回輪講ゼミ 2015.01.09 脇 拓臣 3.さまざまなバリエーション 3.1 時間の影響 FE の判別条件①は,全ユニットに同じように影響を与える要因があると,充足されない.例えば全ての企 業業績に影響を与える景気の変化のような要因である.このときに FE の判別条件を再生させるための有効 な方法として,このような要因を「時間の影響」という形でモデルの中に取り込むことがある. 時間の影響をモデル化する方法として,全ユニットに同じような直線的なトレンドがあると考えられる場 合は時点トレンドをモデルに組み込むとよい.もし一定時期まで増えてそこから先は減っていくというトレ ンドがある場合は,時点トレンドの二乗項も追加するとよい.またトレンドがユニットごとに違うと与えら れる場合は時点トレンドとユニットダミーの交差項を使えばよい. トレンドを見出すことができないが,時点ごとにすべてのユニットに共通した影響が発生することも考え られる.例えば,景気の良し悪しはあるが,それは全ユニットに共通して影響する.この時は,時点ごとの ダミーをモデルに組み込めばよい.時点ダミーの入ったモデルは,DD を一般化したものと考えられる. 3.2 時間差 さまざまな政策の効果が実際に現れるのが,直ちにではなく,一定の時間差をもってであると想定される 場合がある.例えば,低出生率が問題となっているので,子育て支援策を実施してその効果を測定したいと する.このとき,子育て支援策を実施したから,直ちに効果が現れ出生率が上がるとは考え難い.政策の実 施を見て決心した両親が努力し子供が生まれても,政策の実施から効果が現れるまでに,1 年以上のタイム ラグがあるのが普通である.このときは,各ユニットのその時点の説明変数だけでなく,当該ユニットの過 去の時点の説明変数(ラグ付き説明変数)もモデルに組み込めばよい.逆に,企業の株価が来期以降の当該 企業の業績に対する市場の予測に基づいて決まるというような,将来の予想に基づいて現在の状態が決まる 場合には,同じユニットの将来の時点の説明変数(リード付き説明変数)をモデルに組み込んだほうがよい. 3.3 因果効果の異質性 これまでの,処置効果がどのユニットにも同じであるといった同質性とは逆に,処置効果がユニットごと に違っているという異質性の方が現実的な場合もある.異質性を取り込むときは,処置の有無のダミー変数 と説明変数との間の交差項をモデルに組み込めばよい. 4.操作変数法(IV) これまでの因果効果の推定手法は,処置を割り当てるかどうかのメカニズムが混同的でない,すなわち処 置を受けるか否かの意思決定が,処置を受けることによってどのような結果がもたらされるかを考慮せずに なされている(内生性がない) ,ということを前提としてきた.しかしこういった場合はしばしば見かけられ る.例えば,失業者向けの職業訓練プログラムを受講するかどうかは,プログラムの受講によって自分の能 力がどうなるかの予測に基づいて決まるはずである. このような場合には階層化・マッチング・FE といった手法では因果効果を判別できず,バイアスが発生す る場合がある.その場合に因果効果を判別するために使われる手法が操作変数(IV)である. IV の発想は 1930 年頃に発明された.供給者はどれくらいの価格であればどれくらいの量を供給するか考 え,需要者はどれくらいの価格であればどれくらいの量を買うかを考える.価格・数量の組み合わせは,供 給者の意思決定と需要者の意思決定の 2 つの相互作用の結果として観察される.このように相互依存関係の ある状況で,複数の意思決定を同時に判別しようとする問題状況を同時方程式(連立方程式)と呼ぶ.この 同時方程式を解く手法として IV が発明された.その後,IV が実際に世間に広まったのは Angrist(1990)が IV 3 第 7 回輪講ゼミ 2015.01.09 脇 拓臣 を使うことで内生性を克服して因果効果を推定できることを示してからである. 4.1 IV の具体例:従軍経験が平均賃金に与える影響 Angrist は従軍経験が平均賃金に与える影響を推定した.この分析の問題意識は,米国において退役軍人に 対してさまざまな社会保障が与えられているが,退役軍人は本当に社会保障が必要なほど,従軍経験がある ことによってその後の人生に悪影響が発生しているかという点にある.これは従軍するかどうかという意思 決定が,従軍することによって得られる賃金と従軍しないことによって得られる賃金とを比較しつつなされ ており,混同的な割当メカニズムである.だとすると,従軍経験者と未経験者の平均賃金を比較して,前者 が後者よりも低いという結果が導かれたとしても,それは元々そのような人が従軍しただけの話であり,従 軍経験自体による因果効果だと結論付けることはできない. ここで Angrist はベトナム戦争の際に米国で行われていたくじによる徴兵制に目を付けている.この徴兵制 は,1 から 366 までの番号を付けたくじを壺に入れ,そこからくじを引いて書いてあった数字の日が誕生日 の者を当選者とし,これを予定人数に達するまで引き続ける手法をとっている.もちろんこのくじに当選し ても,身体検査などをパスしないと徴兵されない.また,くじをしなくても自発的に従軍するのは自由であ る.しかし,このくじの当選者の方が落選者よりも従軍確率が高くなるのは確かである.そして重要なのは, この従軍確率の違いは,対象者の意思で生じたものではなく,くじというランダムな割当で発生した点だ. とすれば,くじの当選者と落選者の平均賃金を比較すれば,従軍経験という処置が,混同的な割当メカニズ ムではなく, ランダムな割当メカニズムによって割り当てられたことになり, 因果効果が推定できるはずだ. こうして Angrist は従軍経験によって平均賃金が 15%減尐することを IV によって示し,IV が内生性克服 のツールとして拡大した. 4.2 2SLS IV の定義は「それ自体直接的には,目的変数に影響を与えないが,内生的な説明変数に対する影響を通し てのみ,間接的に目的変数に影響を与えている変数」である.IV を使用すると因果効果を判別できる理由と して二段階最小二乗法(2SLS; two-stage least squares)を説明する.二段階最小二乗法とは,最初に IV で内生 的な説明変数を回帰し,続いてその推定結果で目的変数を回帰する手法である. 内生的な説明変数の変化が図 2 の(a)(b)(c)からなっているとする.この変化は目的変数を考慮してなされて いる内生的な部分(a)と目的変数とは無関係に生じている外生的な部分(b)(c)とに分解できる.まず,IV を説 明変数として,1 段階目の OLS を行う(目的変数:従軍確率,説明変数:くじの当選落選) .OLS を行うと, 内生的な説明変数の変化のうち,IV に相関している部分だけ取り出され,それ以外は IV によって説明され ない誤差項となる.IV は目的変数と直接関連していない変数なので,説明される部分は外生的な部分の(b) だけとなり,残りの部分は IV によって説明されない部分として残る.次に 2 段階目の OLS を行う(目的変 数:平均賃金,説明変数:1 段階目で推定された従軍確率) .内生的な説明変数を説明変数にそのまま使うと, (a)(b)(c)全ての変化を使うことになり,内生的な部分の影響を受ける.その代わりに 1 段階目の OLS の推定 値を使えば,IV によって切りだされた(b)の部分だけ使われるので,目的変数の影響を受けていない外生的な 部分だけのもたらす影響を測定できる. 4.3 IV の判別条件 1 他の推定手法と同様に,IV は因果効果を判別できるためには,2 つの前提条件が必要である. 1 つ目は, 「IV は目的変数に直接影響しない(除外制約) 」 ,あるいは「IV と誤差項が相関していない(外 生性) 」という条件である.IV が,内生的な説明変数経由以外の経路で目的変数に影響を与えないなら,内 生的な説明変数を入れてしまえば,IV をモデルに入れる必要がなく除外できるので「除外制約」という名前 が付けられている.また IV が目的変数に影響を与えるのは,内生的な説明変数を通じた間接的な経路だけ 4 第 7 回輪講ゼミ 2015.01.09 脇 拓臣 であって,それ以外の経路がないという意味で「唯一経路条件」とも呼ばれる. 図 3 は唯一経路条件が満たされていない場合に何が起きるかを示している.この場合,IV が内生的な説明 変数を経由せず直接目的変数と相関する部分があることになる.すると内生的な説明変数で OLS を行った場 合に IV によって説明される変化(b’)は,内生的な説明変数の変化のうち,外生的な部分だけでなく内生的な 部分も含んだものになる.したがって,1 段階目の推定値を説明変数として目的変数を回帰すると,再び内 生性の問題によるバイアスが発生することになる.これが悪いまたは無効な IV と呼ばれるケースである. 唯一経路条件の難しさは,それが成立しているかどうかを検定する手法が存在しないことである.このた め,唯一経路条件の成否は分析者が言葉で説明して読者を説得するしか無い.Angrist の例であれば,くじは ランダムに当選者を割り当てているから,くじ事態が直接平均賃金に影響を与えることは考え難く,唯一経 路条件は成立する.この他にも,自然災害の発生や新たな法律の制定など,目的変数とは無関係にイベント が発生した場合(外生的ショック)は,有効な IV となりやすい.外生的ショックは,観察データにおいて ランダム化比較試験(RCT)の代わりになるため,自然実験とも呼ばれる. しかし,国別比較分析で見られるような「どの語族に属するか」や「その言語に女性代名詞がどれくらい あるか」というような怪しい IV も存在している.こういった変数は,一見外生的そうであるが,よく考え ると他の社会的要因の代理変数になっているので,唯一経路条件が成立しているのか怪しい場合が多い. 4.4 IV の判別条件 2 2 つ目の条件は「IV が内生的な説明変数に影響を与えていること(関連性) 」である.関連性条件は,成 立するかしないかの二択の条件ではなくて,程度問題である.IV が内生的な説明変数に強い影響を与えてい るほど「強い IV」で望ましく,IV が内生的な説明変数にあまり影響を与えている場合は「弱い IV」として 望ましくない.図 2 で示したように.IV による因果効果の推定で使われるのは,内生的な説明変数の変化全 体のうちの IV によって切りだされた部分(b)だけである.IV が使う部分(b)の割合が大きく IV の影響力が高 ければ,強い IV の影響力がとなって精度の高い推定ができるが,(b)の割合が小さな場合は,弱い IV になっ て精度が低くなる(図 4) これは 1 段階目の OLS において,そこでの目的変数である内生的な説明変数が,IV によってどれほど説 明されているか見れば,簡単にチェックできる.OLS の場合であれば,IV が統計的に優位でないかどうかの 仮説検定で確かめる.複数の変数が使われている場合は,F 検定で 10 を超える値,変数が 1 つの場合は t 値 で 3.2 を超える値(p 値で 0.0016 未満)になっているかどうかが目安である. IV の強弱を判断するためには, 1 段階目の推定結果を見ることが必須なので, IV による分析を行う場合は, 必ず 1 段階目の推定結果を報告しなければならない. 5 第 7 回輪講ゼミ 脇 2015.01.09 図 1 パネルデータの構造 図 2 内生的な説明変数の変化① 図 3 内生的な説明変数の変化② 図 4 内生的な説明変数の変化③ 6 拓臣