Comments
Description
Transcript
全 文 - terrapub
日本統計学会誌 第 39 巻, 第 1 号, 2009 年 9 月 33 頁 ∼ 63 頁 高頻度データ系列におけるジャンプ検出の実証分析 増田 弘毅∗ , 森本 孝之† Empirical Analysis on Jump Detection in High-Frequency Data Hiroki Masuda∗ and Takayuki Morimoto† 日次ボラティリティの推定および予測は計量経済学における重要な問題であり, 日内高頻度 データに基づいた実現ボラティリティ (realized volatility, RV) の有用性が認識されてから久し い. 近年では, 連続時間価格過程の枠組みでモデルフリーに定義され, 突発的な価格変動 (ジャン プ) に対して頑健に拡散的変動の情報のみを効率よく抽出できるノンパラメトリック統計量であ る realized bipower variation (BPV) へ注目が移っている. 本稿では, BPV のジャンプの検出へ の応用として, Lee and Mykland (2008) によって提案されたジャンプ検出統計量を用いた実証分 析結果を紹介する. この統計量は元々のデータ系列の時間スケールに関わらず, 標本数が十分大 きければジャンプの時点やその符号付きサイズの情報まで抽出できるため, 資産市場のミクロ構 造を分析するのに有益である. Estimation and prediction of daily financial volatility have been central issues in financial econometrics. In particular there have been many literatures reporting on a study of realized volatility (RV) based on high-frequency data. In addition, much attention is currently focused on realized bipower variation (BPV). BPV is theoretically defined in the framework of a continuous time price process independent of specific model structure. Moreover it enables us to effectively extract robust information about the diffusive volatility against jumps. In this paper, as an application of BPV, we introduce an empirical analysis of non-parametric jump-detection using the statistics proposed by Lee and Mykland (2008). Given a sufficiently large sample size, the statistics allows us to apply the test to data at any sampling frequency and to extract information of timing and signed size of jumps. Thus it is informative when investigating market microstructure in financial markets. キーワード: 高頻度データ, Bipower variation, ジャンプ, Lee-Mykland 統計量, ニュースの発表 はじめに 1. 資産市場における価格変動を確率過程でモデリングするに際し, “それはジャンプを含 むものであるのか?” という問いは, 長年計量ファイナンスの研究分野で関心を集め, 研究 されてきた (歴史的には Press (1967), Merton (1976), Beckers (1981), あるいは Ball and Torous (1983) まで遡ることができる) . 近年, ジャンプの推定手法 (例えば Chernov et al. ∗ † 九州大学大学院数理学研究院, 〒 812-8581 福岡県福岡市東区箱崎 6-10-1 (E-mail: [email protected]). 関西学院大学理工学部, 〒 669-1337 兵庫県三田市学園 2-1 (E-mail: [email protected]). 34 日本統計学会誌 第39巻 第1号 2009 (2003), Eraker et al. (2003), あるいは Aı̈t-Sahalia (2004) などを参照されたい) の発展に 伴い, もし価格過程にジャンプが含まれるのであれば: • そのジャンプの大きさはどのくらいなのか?; • ジャンプの頻度はどのくらいなのか?; • ジャンプにクラスター現象は見られるのか?; • また, 資産市場に流入した情報 (ニュース) とジャンプに関連があるのか?, といった問題に関する研究に注目が集まってきた. これまでの先行研究でも, 多くの文献で 資産収益率へのマクロ経済ニュースの影響が研究されてきている. 例えば Andersen et al. (2003, 2007b) は, 為替レート, 株式, 及び債券におけるジャンプがファンダメンタルズに関 連していることを示した. 近年では, ノンパラメトリックなジャンプ推定手法の発展に伴 い, ニュースがジャンプを生成するという実証結果が報告されている. 連続時間確率過程の枠組みでボラティリティ推定を行う際には, 資産価格の構造がセミ マルチンゲールであるという設定が最もポピュラーである. 実現ボラティリティ (realized volatility, RV) を用いて例えば日次などの累積ボラティリティ系列のモデルフリーな推定 量を直ちに算出できるが, RV はその定義から突発的ジャンプの影響を無視できないという 事実がある. 例えば, 予期しなかったニュースによる大きく希なジャンプ変動を含む過去の データ系列から RV を計算してそれをボラティリティ予測に直接的に用いた場合, ジャン プがなかった場合に比べて精度が不安定になり得よう. 近年, realized bipower variation (以下 BPV) を用いた高頻度データの分析が Barndorff- Nielsen and Shephard (2004, 2006) によって始まり, 注目を集めている. BPV は RV と同 様に計算容易な統計量であるが, ジャンプ変動に対して頑健に, 連続的変動に起因する累積 ボラティリティを推定できるという利点を持ち, その資産市場分析への応用としては, 価格 系列におけるジャンプの検出が第一に考えられる. 実際, 現在までにも BPV はジャンプ の検出に大きく貢献してきており, 今日現在でもそれらの拡張・変形に関する研究が数多 く報告されているが,1) 特に近年 Lee and Mykland (2008, 以下 Lee-Mykland) によって提 案されたノンパラメトリックな方法は, 広範な価格過程の族に対してジャンプの日内構造 をも識別できるため, 資産市場のミクロ構造を分析するツールとしても有益である. 特に, Barndorff-Nielsen and Shephard (2006) は, マクロ経済ニュースの発表をジャンプのあっ 1) −BV 例えば, Huang and Tauchen (2005) は BPV と RV の比の統計量として相対ジャンプ測度 RVRV を用い, ジャンプの検出検定を行っている. また類似のジャンプ検出検定として, Jiang and Oomen (2008) は, 日内 の算術収益率と対数収益率の差分和によって定義されたスワップ分散測度 (swap variance measure) SwV に −RV 基づく SwV を提案している. SwV 高頻度データ系列におけるジャンプ検出の実証分析 35 た日と関連付けることによって 10 年間の為替レートデータを, Lee-Mykland は, 3 ヶ月間 の高頻度データを用いてニュースの発表と個別株式と S&P 500 指数の収益率との間の関 係を, それぞれ分析している. また, Huang (2006) は, ボラティリティとジャンプのマク ロ経済ニュースへの反応を調べるために 10 年間の S&P 500 と米国長期国債の 5 分間の先 物データを用いて日次ジャンプを推定し, Lahaye et al. (2007) は, 株価指数, 個別銘柄, 為 替レート, といった資産市場の価格収益率におけるジャンプをマクロ経済ニュースと関連 づけ, ジャンプとニュースの関係を分析している. さらに, Beine et al. (2006) は, 中央銀 行の介入とジャンプとの関連性を研究し, Dungey et al. (2007) は, ジャンプと共ジャンプ (co-jumps) を推定して金利の期間構造における同時的なジャンプを分析している. 本稿の目的は, Lee-Mykland によって提案されたジャンプ検出統計量を介して, 株価指 数, 個別銘柄, 為替レートといった資産市場の価格収益率におけるジャンプを,「予期した ニュース」あるいは「予期せぬニュース」と関連づけ, その影響を実証分析を通じて評価 することにある. Lee-Mykland 統計量は, ある期間でのジャンプの存在の検出のみならず, ジャンプが生じた時点, および, それらジャンプの符号 (ジャンプによる突発的変動の正負) といった, より詳細な情報まで自動的に与えてくれる点において優れている. この特徴は, Barndorff-Nielsen and Shephard (2006) や Aı̈t-Sahalia and Jacod (2009) による検定方式 などとは共有され得ないものである. ジャンプの生じる頻度, 時点, 構造等の特徴の把握は, 例えば以下の点においてボラティリティのより安定した予測に有益な情報をもたらす: • ジャンプが検出された微小区間の収益率データを除いて計算した RV を累積ボラティ リティの連続部分の簡易モデルフリー推定量とすれば, それは通常の BPV 以上に, 大 きなジャンプ変動に頑健なものとなることが期待できる (第 2 節の数値実験例を参照 されたい); • ジャンプが生じたと判断される微小区間の収益率データに基づいてジャンプ系列の 構造の分析が可能となる; • Dungey et al. (2007) においても分析されたように, 複数の価格データ系列に対して 個別にジャンプの検出を行えば, それは直接的に共ジャンプ構造の分析を可能とする. 以下, 第 2 節で BPV とそれを本質的に利用した Lee-Mykland のジャンプ検出法の概略 と簡単な数値実験結果を述べ, 続く第 3 節でジャンプ検出の実証分析結果を紹介する. 最後 に第 4 節において, 本稿の実証結果のまとめ, および今後の展望について簡単に述べる. 2. Lee-Mykland によるジャンプ検出法 本節では, 後述の実証分析におけるジャンプ検出の方法論を概説する. 36 2.1 日本統計学会誌 第39巻 第1号 2009 資産価格過程モデルの設定 固定された期間 I := [0, T ], T > 0, において, ある資産価格過程 S = (St )t∈I が n + 1 時 点 (ti )n i=0 で観測されているとしよう. ここで n は標本数, 0 ≡ t0 < t1 < · · · < tn ≡ T であ る. 対数価格 X := log S の確率変動が以下で既述されていると仮定する: ∫ t ∫ t ∑ X t = X0 + µs ds + σs dws + ζj . 0 0 (2.1) j≤Nt ここで, w は一次元標準ウィーナー過程, µ および σ は実際に上記の積分が定義されるよ うな実数値適合的過程2) であり, また, (Nt )t∈I は適合的な強度過程 λt を持つ計数過程 (N は非負整数値過程で, ∆Nt := Nt − lims↑t Ns = 1 a.s., ∀t ∈ I), ζj は I 上 j 番目の符号付 ジャンプサイズを表す確率変数で ζj 6= 0 a.s. (∀j ≥ 1) なるものである. 右辺第四項の和は Nt = 0 であれば 0 とみなされる. Jt で時点 t での符号付ジャンプサイズを表せば, (2.1) を 確率微分形式で書くと以下の通りである: dXt = µt dt + σt dwt + Jt dNt . 以下では, σt > 0 a.s. (∀t ∈ I), および I での X のジャンプの回数は a.s. 有限であると仮 定する: 後者は, 強度過程 λ が I 上 a.s. で有界であることを意味する. (2.1) の下では, 各区間 Ii := (ti−1 , ti ] での対数収益率は ∆i X := Xti − Xti−1 ∫ ti ∫ = µs ds + ti−1 ∫ と表される (ここで Zt := σs dws + ti−1 ∫ ti =: ∑ j≤Nt ζj Nti−1 <j≤Nti ti µs ds + ti−1 ∑ ti σs dws + ∆i Z (2.2) ti−1 ζj とおいた): ∆i N = Nti − Nti−1 = 0 であれば X は Ii でジャンプを持たず, つまり ∆i Z = 0 となる. こうして, X の Ii での確率変動は, 連続的 変動 ((2.2) の第一項と第二項の和) とジャンプによる突発的変動 ((2.2) の第三項) に分解さ れる. ここでの連続的変動は, 最もポピュラーな連続セミマルチンゲール (計量経済学の分 野ではブラウニアン-セミマルチンゲールとよばれることが多い) としてモデリングされて おり, 非常に広いノンパラメトリックなモデル族を成す. このように, 形式的なモデルとして期間 I における収益率系列 (∆i X)n i=1 を対象とするわ けであるが, その系列相関は µ, σ, およびジャンプ部分の具体的な構造によって千差万別で ある. 確率過程からの高頻度データ, 即ち max1≤i≤n (ti − ti−1 ) → 0 なる設定によるモデリ 2) 技術的詳細は省略するが, ここでいう「適合性」は, X が定義されているフィルター付き確率空間のフィルト レーションに準ずる. 高頻度データ系列におけるジャンプ検出の実証分析 37 ングの大きな利点の一つとしては, µ, σ, およびジャンプ部分の具体的な構造は未知のまま で, BPV を介して連続変動による累積ボラティリティの情報のみを抽出できるという事実 が挙げられる. 実際この性質は, 本稿の実証分析の道具となる Lee-Mykland のジャンプ検 出手法において本質的である. 2.2 累積ボラティリティのノンパラメトリック推定量: RV と BPV I 上で得られる収益率系列 (∆i X)ni=1 に基づき, RV は RVn = n ∑ (∆i X)2 i=1 で定義され, n → ∞ (データの高頻度性) のとき確率収束 ∫ T ∑ p RVn → σs2 ds + (∆Xs )2 =: QVc + QVd 0 0<s≤T が成り立つ. RVn は I における累積ボラティリティの代用変数として用いられてきたが, 慣例として「I での累積ボラティリティ」を QVc (X の連続部分の二次変動) とみなし, 多 くの計量経済学研究者は QVc の推定に焦点を当ててきた. 実際, 例えば X の比較的大きい ジャンプが希に生じるような状況においては, 不連続部分の二次変動 QVd は QVc に比べて 非常に不安定であり, 従って, RVn を直接的に適用する場合には, 累積ボラティリティの安 定した推定および予測は信頼性の低いものとなり得よう. これに対して近年 Barndorff-Nielsen and Shephard (2004, 2006) によって QVc のジャン プ変動に頑健なノンパラメトリック推定量である BPV の適用が提案され, 注目を集めた. BPV は, 隣接する 2 個の対数収益率の絶対値の積を一つずつずらしつつ足し合わした量と して定義される: BP Vn = n−1 ∑ |∆i X||∆i+1 X|. i=1 さて, BP Vn について 2 QVc π が成り立つことが知られており, 従って, π2 BP Vn によって Z の影響に対して頑健に連続部 BP Vn →p 分の累積ボラティリティ QVc を一致推定できる. RVn と同様に BP Vn の定義自体は µ や σ, およびジャンプ過程 Z の具体的な確率構造に依存せず, 計算容易である. このノンパラ メトリック推定量としての使い勝手の良さが, 近年 BPV が注目されている一つの大きな理 由と言えよう. X がジャンプを有する場合には正の確率で QVd 6= 0 となり得るため, RVn は QVc を一 致推定する事すらできないが, X が連続確率過程の場合には, 理論上, 漸近的に RVn が最も 優れた推定量であることが知られている: 詳細は, 例えば Barndorff-Nielsen and Shephard (2006) を参照されたい. 38 2.3 日本統計学会誌 第39巻 第1号 2009 Lee-Mykland 統計量 ここでは前節の設定を引き継いだ下で, Lee-Mykland 統計量によるジャンプ検出法を 概説する. 理論背景に関して本質的ではないが, 以降では簡単のため ti = iT /n とし, h = hn := ti − ti−1 で (等間隔) 観測時間幅を表す. 2.3.1 統計量の構成 Lee-Mykland 統計量は, 対象とするデータ系列を採取した全期間と比較して十分小さい 任意の期間, 即ち, 十分大きい n に対する各 Ii = (ti−1 , ti ] においてジャンプが発生したか 否かを判定するための統計量である. これは大雑把に言えば, “微小時間区間 Ii における収 益率を局所平均 µti−1 h および局所ボラティリティ σti−1 で規格化した量の成す系列は, I で ジャンプがない場合には近似的に正規確率変数列となるであろう” という直観に基づいて 定式化される. 実際, 各 Ii での収益率 ∆i X について, (2.2) をオイラー近似して ∆i X − µti−1 h ∆i w ∆i Z √ √ ∼ √ + σti−1 h h σti−1 h (2.3) が従う. ここで ∆i w Ui := √ h はウィーナー過程の性質から N (0, 1) に従う i.i.d. 列である. もし Ii においてジャンプがあ れば, 即ち ∆i Z 6= 0 であれば, (2.3) の右辺第二項は, h → 0 のとき, 分子で 1 回のジャンプ の大きさが残る一方で分母は 0 へ減衰していくので, Ui に比べて非常に大きい値 (→ ±∞) となるであろう. よって, (2.3) の左辺に (確率的に) 近い何らかの統計量を構成できれば, その大小によって Ii のジャンプの有無を判定できることが予想される. ジャンプ検出に際して,連続変動とジャンプ変動のオーダーの差異を利用するという発想 自体は新しいものではないが,µ や σ の具体的構造を全く前提としない状況において「µti−1 と σti−1 の推定量」を厳密に構成することは困難である. このことを踏まえ,Lee-Mykland は更に, Ii においてジャンプがなかった場合での近似的な平均と標準偏差を, 時刻 ti−1 か ら K = Kn (∈ N) ステップまで立ち戻ったウィンドウ Wi := [ti−K , ti−1 ] における収益率 データに基づいた統計量で置き換え, データ適合的なジャンプ検出法を定式化した. ここ で, 1/2 < γ < 1 を定数として Kn = O(nγ ) ととる; γ のとり方により, Wi の長さは Kn hn = O(nγ−1 ) → 0 であることに注意しよう. 39 高頻度データ系列におけるジャンプ検出の実証分析 この下で µ̂i (γ) := 1 K −1 ( σ̂i (γ) := i−1 ∑ ∆j X = j=i−K+1 1 K −2 i−1 ∑ Xti−1 − Xti−K , K −1 )1/2 |∆j−1 X||∆j X| j=i−K+2 と定義するとき, I における Lee-Mykland 統計量系列 {Ti (γ)}i≤n は以下で定義される: Ti (γ) = ∆i X − µ̂i (γ) . σ̂i (γ) (2.4) Lee-Mykland 統計量の形式自体は単に平均分散モデルの規格化であるが, 特に局所ボラティ リティにプラグインする統計量として, Wi におけるジャンプの影響を受けないように BPV 型のものを採用した点が本質的である. Lee-Mykland の Theorem 1.1 および 2 の証明から, {Ti (γ)}i≤n の n → ∞ での漸近挙動 について, 各 i ≤ n において { ( Ti (γ) − 1 Ui − 1 c2 K −1 i−1 ∑ ) Uj j=i−K+1 } ∆i Z √ = op (1) + c2 σti−K h (2.5) が成り立つことが従う. ここで c2 := 2/π である. ウィンドウ Wi 分だけ立ち戻った区間 での近似をしたことにより, (2.3) と比較すると, ∆i Z の分母に入る瞬間ボラティリティは σti−1 でなく σti−K となっている. K を決めれば Ti (γ) は直ちに計算できる. さて, (2.5) の帰結として, 各 Ii において以下が従う: • ∆i Z = 0 であれば Ti (γ) は近似的に正規分布に従う; • ∆i Z 6= 0 であれば Ti (γ) は漸近的に非常に大きい値をとる (±∞ のいずれかに発散す る). 即ち, 十分大きい n に対し, 各 i について, Ti (γ) が大きければ Ii で 1 回ジャンプが生じた とみなし, そうでなければ Ii ではジャンプなしとみなす方法が考えられる. 実装容易なジャ ンプ検出方式を定式化するに際し, 「(高頻度) 収益率変動がどの程度大きければそこにジャ ンプが生じたとみなすか」が実用上の問題となるが, Lee-Mykland は定常正規時系列に関 する極値分布論の観点から一つの処方箋を与えた. (2.5) により, もし I 全域でジャンプがなければ, 十分大きい n に対して各 Ti (γ) は Ti0 (γ) ( 1 1 := Ui − c2 K −1 i−1 ∑ j=i−K+1 ) Uj 40 日本統計学会誌 第39巻 第1号 2009 で近似される. {Ti0 (γ)} が定常正規確率変数列を成すことに注意し, Galambos (1978, The- orem 3.8.2) を適用して以下の分布近似を得る: ) ] [ ( ∀x ∈ R : lim Pr bn max |Ti0 (γ, 2)| − an ≤ x = exp(−e−x ). n→∞ i≤n (2.6) ここで an と bn は以下の通り: √ 2 log n log π + log log n √ , − c2 2c2 2 log n √ bn = c2 2 log n. an = 以下では Jn = {i ≤ n : X が Ii においてジャンプを持つ } と表記する. 2.3.2 ジャンプが生じた微小期間列 (Ii )i∈Jn の検出の処方箋 (2.6) を踏まえ, 拡散項から生じた大きな (符号付) 異常値の度合い α ∈ (0, 1) を事前に小 さく設定することで, ジャンプが生じた微小区間 (Ii )i∈Jn の検出方式を「I で 1 回もジャ ンプがない場合に対応する確率変数列 {|Ti0 (γ)|}i≤n の最大値の分布を考え, 各 i に対して, |Ti (γ)| がその分布における上側 α 点よりも大きかったら Ii でジャンプが生じたとみなす」 と定式化できる. この α は通常の仮説検定における有意水準に対応する. より明確には以 下の通りである. 1. α := 1 − exp(−e−x ) を (十分小さい値に) 設定し, それに対応する x の値を β := − log{− log(1 − α)} で定める: この β がジャンプの有無を判断する “閾値” となる. 2. 収益率系列 (∆i X)i≤n に対し, 各 i 毎に (2.4) から Ti (γ) を求め, 統計量の列 {Ti (γ)}K≤i≤n を計算する: 最初の K 期間はジャンプ検出の対象外となるが, そこでもジャンプの有 無を判断したい場合には, より以前の収益率データを用いればよい. 3. (2.6) に基づき, 各 i ≤ n について, bn (|Ti (γ)| − an ) > β であれば期間 Ii においてジャ ンプが一回生じたと判断し, また bn (|Ti (γ)| − an ) ≤ β であれば Ii ではジャンプなし と判断する: 本稿のモデル設定においては I 上のジャンプ回数は有限なので, 観測幅 h が十分小さい場合には Ii におけるジャンプ生起数は高々 1 であるとしてよい. 例えば α = 0.0001 の場合には exp(−e−β ) = 1 − α = 0.9999 であり, 閾値は β = − log(− log(0.9999)) = 9.21 となる. このとき bn (|Ti (γ)| − an ) > β となれば, 区間 Ii においてジャンプが生じたと判断することになる. ウィンドウ・サイズ K を選ぶ際にある種のトレードオフが生じることに注意したい. つ まり, より大きな K を選択することはより大きな計算上の負荷が発生させるが, K はジャ 高頻度データ系列におけるジャンプ検出の実証分析 41 ンプに頑健な推定量としての BV の利点を保持できるほど十分に大きくする必要がある. Lee-Mykland は, より大きなウィンドウを選択することは単に計算上の負荷を増やす一方 でジャンプ検出精度の著しい向上は見られないというシミュレーションの結果に基づいて, 各 n に対して, γ ∈ (1/2, 1) に対応する許容範囲内での最小の自然数 K を推奨している: 具 体的には, 1 週, 1 日, 1 時間, 30 分, 15 分, 5 分という標本頻度に対して, 各々 7, 16, 78, 110, 156, 270 というウィンドウ・サイズを設けることが推奨されている (Lee-Mykland Section 1.3 参照). 本稿の実証分析においてもこの最小の K を採用した. 1 年あたりのデータ数を N とした場合, K = dN 1/2 e (2.7) ととることになる. ここで dN 1/2 e は N 1/2 の整数部分である. Lee-Mykland 統計量に関して更に二点注意しておく. • Lee-Mykland のジャンプの検出方法は, ジャンプがない場合の統計量列の最大値の分 布を見ていることから保守的であると言えよう; ある程度小さいジャンプ変動は連続 部分による変動に組み込んでしまおう, という考え方が背後にある. とは言え, 第 3. 節において合理的な実証分析結果が得られたため, Lee-Mykland のジャンプ検出法は 十分な威力を持っていると言える. • 全期間 I でジャンプが (一回以上) あったか否かのみしか判定できない BarndorffNielsen and Shephard の統計量や Aı̈t-Sahalia and Jacod の統計量と異なり, 同じサ ンプル数で比較する場合, Lee-Mykland 統計量はジャンプの生起時点および符号の検 出まで一度に考慮できる点において優れている. 本稿では Lee-Mykland に倣い, BPV を介して定義される {Ti (γ)} を扱っているが, より 一般に, BPV の代わりに m (≥ 3) 次の multipower variation (MPV) を適用することも可 能であり, ジャンプ検出の処方箋は BPV を適用した場合と全く同様である. MPV に関す る理論の詳細については, 例えば Barndorff-Nielsen et al. (2006) とその参考文献を参照さ れたい. 理論上, QVc の推定量としての BPV は有限標本においてはジャンプによる正のバ イアスを持つが, 3 次以上の高次 MPV を用いることでこのバイアスを緩和できる. しかし ながら, 最近 Corsi et al. (2008) において, 高頻度実データで観測される「ジャンプ時点の クラスタリング現象」は高次 MPV のバイアスを増加させる傾向があることが報告されて いる. また, 詳細は略すが, ジャンプ検出に関しては次節の数値実験において高次の MPV を介した Lee-Mykland 統計量を用いても, ジャンプ検出成功頻度に有意義な変化は見られ なかった. これらの観点から, 本稿では Lee-Mykland と同様に BPV による規格化に基づ いた統計量を適用する. 42 2.3.3 日本統計学会誌 第39巻 第1号 2009 数値実験例 ここでは簡単な幾何ブラウン運動 (Black-Scholes モデル) の対数過程にジャンプ摂動を 加えたものを X とし, 数値実験を通じて Lee-Mykland 統計量のジャンプ検出精度を観察す る. X は以下の形で与えられる: Xt = −0.2t + wt + Zt . (2.8) ここで Z は w と独立な複合ポアソン過程であり, ジャンプの分布は正規分布 N (0, δ 2 ) と とった (δ 2 は以下で明示的に設定する). 固定期間 I = [0, 1] 上の i/n (i ≤ n) において X を観測する状況を対象とし, 独立な 1000 本のサンプルパスを生成して (2.7) の K で N を n に代えたものに対応する Lee-Mykland 統計量を介してジャンプ検出の成功頻度を算出し た; 便宜上, (0, K] で生じたジャンプはジャンプ検出頻度の計算から排除した. 本数値実験では I でのジャンプ生起回数を事前に 100 回と設定した: この場合, 各パス毎 にジャンプ時点 0 < u1 < u2 < · · · < u100 < 1 を 100 個の独立な U (0, 1)-乱数の成す順序統 計量で擬似生成できる. Lee-Mykland の数値実験では一貫して α = 0.05 とされているが, ここでは α の値として 0.05, 0.01, 0.001, 0.0001 の四通りを対象とし, 各々の場合について 数値実験結果を報告する. この場合, α とそれに対応する閾値 β の値の組み合わせは以下の 通りである: (α, β) = (0.05, 2.97), (0.01, 4.60), (0.001, 6.91), (0.0001, 9.21). (2.9) このように α によって β の値はかなり大幅に変動する. α が小さいほど, より大きい変動 のみをジャンプと捉えることになり, 有限標本においてジャンプ検出頻度が小さくなるこ とに注意されたい. ジャンプ検出精度を測るため, 第 l 番目のパスにおいて, Lee-Mykland 統計量で検出さ れたジャンプ回数 ]Jl をカウントし, ジャンプ検出の頻度を ]Jl /100 で算出した. こうして 1000 本の独立なパスに基づいて (]Jl )1000 l=1 を得る. この際に, 擬似生成された真のジャンプ 時点のいずれとも異なる時点においてジャンプを検出した場合には “虚偽のジャンプ検出” ということになるが, このような場合は全試行を通じて一度も生じなかったので以下の表 には示さなかった: これは, ここでの Lee-Mykland 検定のサイズは無視できることに対応 する. 即ち, 本数値実験においては ]Jl /100 は l 本目のパスにおけるジャンプ検出の “成功” 頻度である. 一般には α をより大きくとれば虚偽のジャンプを検出してしまう頻度は 0 で はなくなる可能性が出てくることに注意されたい. (2.8) の設定に対し, δ 2 = 0.5, 0.25 の場合を観察した. 各場合において, 1000 本のジャン 43 高頻度データ系列におけるジャンプ検出の実証分析 表 1 (α, β) = (0.0001, 9.21) の場合の 1000 本のサンプルパスに基づいた Lee-Mykland 統計量によるジャンプ検 出の平均成功頻度 mean(J) と検出成功頻度の標準偏差 s.d.(J), および (2.12) で定義される mRV の推定精度. α = 0.0001 δ 2 = 0.5 n K mean(J) s.d.(J) mean(mRV ) 5000 70 0.8051 0.0393 1.4558 10000 100 0.8762 0.0310 1.1104 15000 122 0.9021 0.0297 1.0484 20000 141 0.9186 0.0266 1.0272 δ 2 = 0.25 n K mean(J) s.d.(J) mean(mRV ) 5000 70 0.7521 0.0406 1.3362 10000 100 0.8353 0.0362 1.0898 15000 122 0.8724 0.0318 1.0362 20000 141 0.8915 0.0305 1.0213 1 P1000 ]J /100 mean(J) := 1000 l l=1 q 1 P1000 2 s.d.(J) := l=1 {]Jl /100 − mean(J)} 1000 s.d.(mRV ) 0.4356 0.1934 0.1072 0.0836 s.d.(mRV ) 0.2314 0.0863 0.0447 0.0337 表 2 (α, β) = (0.001, 6.91) の場合の 1000 本のサンプルパスに基づいた Lee-Mykland 統計量によるジャンプ検出 の平均成功頻度 mean(J) と検出成功頻度の標準偏差 s.d.(J), および (2.12) で定義される mRV の推定精度. n 5000 10000 15000 20000 K 70 100 122 141 mean(J) 0.8220 0.8857 0.9095 0.9245 α = 0.001 δ 2 = 0.5 s.d.(J) 0.0364 0.0317 0.0273 0.0258 δ 2 = 0.25 s.d.(J) 0.0394 0.0348 0.0318 0.0297 mean(mRV ) 1.3499 1.0800 1.0362 1.0201 s.d.(mRV ) 0.3566 0.1177 0.0732 0.0258 n K mean(J) mean(mRV ) 5000 70 0.7737 1.2538 10000 100 0.8504 1.0678 15000 122 0.8831 1.0256 20000 141 0.9004 1.0156 1 P1000 ]J /100 mean(J) := 1000 l l=1 q 1 P1000 2 s.d.(J) := l=1 {]Jl /100 − mean(J)} 1000 s.d.(mRV ) 0.1770 0.0751 0.0452 0.0371 プ検出頻度の標本平均および標本標準偏差を 1 ∑ ]Jl /100, 1000 l=1 v u 1000 u 1 ∑ s.d.(J) := t {]Jl /100 − mean(J)}2 , 1000 1000 mean(J) := (2.10) (2.11) l=1 で算出し, それらをまとめたものを, (2.9) の四通りの (α, β) の値で分けて表 1∼4 に示す. 44 日本統計学会誌 第39巻 第1号 2009 表 3 (α, β) = (0.01, 4.60) の場合の 1000 本のサンプルパスに基づいた Lee-Mykland 統計量によるジャンプ検出 の平均成功頻度 mean(J) と検出成功頻度の標準偏差 s.d.(J), および (2.12) で定義される mRV の推定精度. n 5000 10000 15000 20000 K 70 100 122 141 mean(J) 0.8400 0.8978 0.9202 0.9315 α = 0.01 δ 2 = 0.5 s.d.(J) 0.0349 0.0293 0.0266 0.0242 δ 2 = 0.25 s.d.(J) 0.0399 0.0328 0.0304 0.0280 mean(mRV ) 1.2657 1.0675 1.0248 1.0137 s.d.(mRV ) 0.3238 0.1240 0.0635 0.0506 n K mean(J) mean(mRV ) 5000 70 0.7949 1.1941 10000 100 0.8652 1.0488 15000 122 0.8941 1.0188 20000 141 0.9100 1.0082 1 P1000 ]J /100 mean(J) := 1000 l l=1 q 1 P1000 2 s.d.(J) := l=1 {]Jl /100 − mean(J)} 1000 s.d.(mRV ) 0.1704 0.0746 0.0393 0.0232 表 4 (α, β) = (0.05, 2.97) の場合の 1000 本のサンプルパスに基づいた Lee-Mykland 統計量によるジャンプ検出 の平均成功頻度 mean(J) と検出成功頻度の標準偏差 s.d.(J), および (2.12) で定義される mRV の推定精度. n 5000 10000 15000 20000 K 70 100 122 141 mean(J) 0.8521 0.9038 0.9233 0.9355 α = 0.05 δ 2 = 0.5 s.d.(J) 0.0342 0.0297 0.0252 0.0240 δ 2 = 0.25 s.d.(J) 0.0380 0.0334 0.0303 0.0268 mean(mRV ) 1.2191 1.0524 1.0204 1.0077 s.d.(mRV ) 0.2850 0.1257 0.0613 0.0354 n K mean(J) mean(mRV ) 5000 70 0.8145 1.1373 10000 100 0.8757 1.0355 15000 122 0.9020 1.0136 20000 141 0.9162 1.0049 1 P1000 ]Jl /100 mean(J) := 1000 l=1 q 1 P1000 2 s.d.(J) := l=1 {]Jl /100 − mean(J)} 1000 s.d.(mRV ) 0.1237 0.0552 0.0338 0.0220 以下にこれらの表に関する注意事項を述べておく. • Lee-Mykland の数値実験では, 例えば I をある一年間とみなす場合, 観測頻度を 1 時 間, 30 分, 15 分, 5 分ととれば, サンプル数はそれぞれ約 n = 6000, 12000, 24000, 72000 と対応する. 本数値実験においては, n = 5000, 10000, 15000, 20000 の 4 通り を対象とした. mean(J) をここでの Lee-Mykland 検定の検出力とみなせば, δ 2 = 0.5, 0.25 いずれの場合においても, 全ての α の場合において n の増加と共に検出力が増 高頻度データ系列におけるジャンプ検出の実証分析 45 加していくことが分かる. δ 2 = 0.25 の場合の方が小さいジャンプが多くなり, それ だけジャンプ検出が難しくなるため, δ 2 = 0.5 の場合と比較して検出力が小さくなっ ていることも見て取れる. 表 1∼4 を比較すると, ここで対象としているモデル設定に おいては, α の値によって mean(J) および s.d.(J) が大きく変動する様子はないこと が分かる. これは言い換えれば, α が非常に小さい値であっても標本数が十分大きけ ればジャンプ検出の成功頻度に影響はないということを意味する. しかしながら, 前 述した通り, α が小さいほど小さいジャンプを検出しにくくなる (即ち α が小さいほ ど mean(J) は小さくなる) という直感に見合った現象が明確に現れていることに注 意されたい.3) • 更に表 1∼4 においては, 以下で定義される RV の変形版による累積ボラティリティ (ここでは 1 が真値に相当) の推定に関する結果も併せて載せておいた. Lee-Mykland 統計量によってジャンプが検出された微小区間 Ii = ((i − 1)/n, i/n] の増分を除いた 収益率の二乗和として定義される mRVn := n n − ]Jˆn ∑ (∆j X)2 (2.12) j≤n,j ∈ / Jˆn は, I での累積ボラティリティの連続部分の自然な推定量である. ここで Jˆn は Lee- Mykland 統計量によってジャンプ検出された部分区間 Ii に対応する i の集合を表し, ]Jˆn は Jˆn の個数を表す. これは RV の一種の変形版である (mRV の m は modified を表す). (2.8) の連続部分ボラティリティレベルは 1 であり, mRV が 1 を推定できて いるのが望ましいわけだが, n が大きい場合には精度良く推定できていることが見て 取れる. ここで, mRV による推定値が一貫して 1 よりも大きいのは, Lee-Mykland 統 計量で検出できなかった小さいジャンプが mRV の計算に寄与してしまっていること を意味する. α を操作して連続部分のボラティリティの推定とジャンプ検出の双方を何らかの意味で 最適に同時に行うことも考えられようが, ジャンプ検出の実証分析を主眼とする本稿では これ以上立ち入らないことにする. 実用上は, 例えば図 4 のようにまず Lee-Mykland 統計 量の系列をプロットしてから, どの程度の割合で連続変動とジャンプ変動を区切るかを主 観的に決定する方法も考えられよう. 3) 実データを用いた累積ボラティリティの推定においては α の選択には不可避的に実装者の恣意性が入ること になるが, 累積ボラティリティの過大評価を避けたい場合には α = 0.5, 0.1 などの値を, 他方過小評価を避け たい場合には α = 0.001, 0.0001 などの値を選択するのが妥当と言える. 46 日本統計学会誌 第39巻 第1号 2009 実証分析 3. 3.1 ジャンプの記述統計的特性 この小節では, 先述の Lee-Mykland 統計量を用いることにより, 収益率過程に内在する ジャンプの成分を捉え, 各資産系列におけるジャンプの実証的特徴を概観する. ここでは, 以下の二種類の計 502 系列の高頻度データを対象として分析を行う: • TOPIX 株価指数 (TOPIX) と 2007 年 1 月時点での TOPIX 500 (TOPIX500) 選出 の個別銘柄の, 2004 年 1 月—2006 年 12 月の 3 年間での標本; • 米国ドルに対する日本円の為替レート (USD/JPY) の, 1991 年 5 月—2006 年 8 月の 15 年 4 ヶ月での標本. ここで, USD/JPY は bid と ask の平均値 (mid-quote) をその価格として用いている. 標 本頻度に関しては, マーケット・マイクロストラクチャー・ノイズの影響を考慮して, 5 分 間隔のデータを用いる4) . 一日当たりの標本数は, TOPIX と TOPIX500 は東京証券取引所 (東証) の取引時間が夜間と昼休みに休止するため一日に市場が開いている時間は 4.5 時間 なので 4.5 × (60/5) = 54 であり, 他方 USD/JPY は 24 時間取引なので 24 × (60/5) = 288 である. 通常の研究では, 東証の夜間と昼休みに取引が無い期間に対しては, その間の価格差の 2 乗をそこでのボラティリティとして分析していることが多いが, この収益率は極端に大きな 値を取る場合が多く, 日内の Lee-Mykland 統計量に影響を与える可能性が大きいため, 本 稿では夜間と昼休み間で生じる収益率は無視して分析を進める. 各日内の時間は, それぞれ USD/JPY は世界標準時 (UTC) , TOPIX と TOPIX500 は日本時間である. また, ここで は Lahaye et al. (2007) と同様に非常に希にしか発生し得ない大きな価格変動をジャンプ とみなしたいというスタンスで, 有意水準を小さく α = 0.0001 と設けて Lee-Mykland 検 定でジャンプ検出を行う. 実装に際しては, T を対象データ系列の年数とした下で, K を (2.7) のようにとった. 次に, 上述の TOPIX, TOPIX500, 及び USD/JPY の計 502 系列に対して, Lee-Mykland 検定の分析を行った結果を示す. • まず, 表 5 はジャンプが少なくとも 1 回は発生した日数の頻度が高かった 10 銘 柄と低かった 10 銘柄を表している: N (days), N (jump days), JF (jump day) = N (jump days)/N (days) は, それぞれ標本期間内での全日数, ジャンプが発生した 4) 一般的に RV の研究論文では, 5 分間隔程度のデータを用いるとマーケット・マイクロストラクチャー・ノイ ズの影響を軽減できる, とされている. 詳しくは Bandi and Russell (2006) 等を見よ. 47 高頻度データ系列におけるジャンプ検出の実証分析 表5 銘柄 USD/JPY セイノーホールディングス ニトリ ポイント SFCG サンドラッグ イオンモール レオパレス21 カルチュア・コンビニエンス・クラブ フタバ産業 銘柄 エヌ・ティ・ティ・ドコモ 国際石油開発帝石ホールディングス 新日本製鐵 川崎重工業 東洋紡績 富士フイルムホールディングス 東京電力 吉野家ディー・アンド・シー キヤノン ミレアホールディングス ジャンプの発生した日の頻度 N (days) 5396 733 734 733 733 730 732 677 733 733 N (jump days) 1417 92 92 83 83 82 82 74 76 75 JF (jump day) 0.2626 0.1255 0.1253 0.1132 0.1132 0.1123 0.1120 0.1093 0.1037 0.1023 N (days) 734 181 734 734 734 734 734 733 734 730 N (jump days) 3 1 5 6 6 7 7 7 8 8 JF (jump day) 0.0041 0.0055 0.0068 0.0082 0.0082 0.0095 0.0095 0.0095 0.0109 0.0110 N (days) = (標本期間内での全日数), N (jump days) = (ジャンプが発生した日の数), JF (jump day) = N (jump days)/N (days). 日の数, そしてジャンプ発生する観測された相対的な頻度 (Jump-Frequency) を表 す. ここで, USD/JPY が他より頻度が高い要因としては, USD/JPY のみ 24 時間 観測されるため, その間に少なくとも 1 回ジャンプが観測される可能性が TOPIX と TOPIX500 より相対的に高くなることが考えられよう. • 次に, 表 6 はより時間スケールを縮め, 5 分間隔で観測された場合にジャンプが生じ たと判断された微小区間の頻度が高かった 10 銘柄と低かった 10 銘柄を表している. 表 2 と表 3 を比較すると, 上位と下位の銘柄に変化が見られ, またジャンプの生起割 合は全体的に非常に小さくなっている. このように, 対象とする収益率データの時間 スケールによって大きく異なる結果となることは注意すべき点である. • そして, 表 7 は 5 分間隔観測の場合に, ジャンプを含んでいると判断された収益率変 動自体を仮にジャンプとみなし, それらの符号付サイズの平均値 µ̂ (jumps) が高かっ た 10 銘柄と低かった 10 銘柄を表している. 更に, 上述の 5 分間隔で観測されたジャンプの頻度と平均値をまとめたものが図 1 である. 48 日本統計学会誌 第39巻 第1号 2009 図1 ジャンプ頻度とジャンプ平均の散布図 49 高頻度データ系列におけるジャンプ検出の実証分析 表6 5 分間隔で観測されたジャンプの頻度 銘柄 船井電機 住友林業 京阪電気鉄道 ニトリ ポイント サンドラッグ セイノーホールディングス イオンモール 東京都民銀行 丸一鋼管 カルチュア・コンビニエンス・クラブ 銘柄 エヌ・ティ・ティ・ドコモ 国際石油開発帝石ホールディングス 東洋紡績 富士フイルムホールディングス 川崎重工業 キヤノン 新日本製鐵 吉野家ディー・アンド・シー 中部電力 ミレアホールディングス N 13717 8768 2543 37097 34242 33047 35429 35457 32780 29546 36230 N (jumps) 55 29 8 115 106 100 105 102 93 82 100 JF (jumps) 0.0040 0.0033 0.0031 0.0031 0.0031 0.0030 0.0030 0.0029 0.0028 0.0028 0.0028 N 38269 9468 37428 38063 38062 38267 38259 37672 38193 37742 N (jumps) 3 1 6 7 7 8 8 8 9 9 JF (jumps) 0.0001 0.0001 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 N = (観測値の数), N (jumps) = (観測されたジャンプの数), JF (jumps) = N (jumps)/N . これは, y 軸にジャンプの頻度を取り, x 軸にジャンプの大きさの平均値を取る散布図であ る. まず, 2 つのうち上の図はジャンプの頻度が最大あるいは最小の値を取る銘柄 (FUNAI ELECTRICS と NTT DoCoMo) とジャンプの平均が最大あるいは最小の値を取る銘柄 (Monex Beans と KINDEN) をそれぞれ太い○で表し, USD/JPY を△, TOPIX を□, そ の他 TOPIX500 を細い○で表している. ここで, この図からポートフォリオ選択問題を考 えた場合, リスク回避的な投資家はどの銘柄を選択すべきであろうか? 一般的な投資家の 場合, リターン (ここではジャンプの平均) を最大化し, リスク (ここではジャンプの頻度) を最小化すべきなので, 下の図のように左上方に位置する銘柄は避けるべきであり, 右下方 に位置する銘柄 (例えば Seven & I など) を保有すべきである, ということになる. ただし, ここではジャンプ以外の要素, つまり拡散項の平均, 分散 (通常のリスクとリターン) は全 く考慮に入れていないため, 実際の収益率に対するポートフォリオとは異なる結果である ことは言うまでもない. また, ジャンプの平均が正であれば, ジャンプの頻度が高い方が良 いと考えることも合理的であるため, 右上方の銘柄 (例えば Sumitomo Forestry など) を選 ぶことも可能であろう. いずれにせよ, ジャンプを含む原資産過程のリスク・モデルの厳密 50 日本統計学会誌 第39巻 第1号 2009 表7 5 分間隔で観測されたジャンプの平均 銘柄 マネックス・ビーンズ・ホールディングス セブン&アイ・ホールディングス 第一三共 パシフィックマネジメント 三洋電機 トランス・コスモス ヤフー ダイエー 大日本インキ化学工業 ミサワホームホールディングス 銘柄 きんでん 吉野家ディー・アンド・シー 国際石油開発帝石ホールディングス 新日本製鐵 ミレアホールディングス 山口フィナンシャルグループ ジェイ エフ イー ホールディングス 東京電力 丸紅 三井金属鉱業 N 30495 16567 15726 34351 38226 36451 38112 37578 37075 36432 N (jumps) 31 6 13 56 24 65 24 90 36 90 µ̂ (jumps) 0.0139 0.0131 0.0122 0.0103 0.0101 0.0100 0.0099 0.0097 0.0094 0.0093 N 6138 37672 9468 38259 37742 2538 38251 38274 38226 38003 N (jumps) 13 8 1 8 9 4 19 10 15 30 µ̂ (jumps) −0.0128 −0.0124 −0.0111 −0.0109 −0.0090 −0.0082 −0.0072 −0.0067 −0.0064 −0.0063 N = (観測値の数), N (jumps) = (観測されたジャンプの数), µ̂ (jumps) = (観測されたジャンプの標本平均). な解析は通常の拡散モデルと比較してより複雑であり, 本稿ではこれ以上立ち入らない. 一般的に, 資産市場の高頻度データから計算された RV およびボリュームは, ある種の日 内パターンを持つことが知られている. これらの特徴としては, 市場が開く時間と市場が閉 じる時間の前後では取引が相対的に活発になることである. 例えば, ニューヨーク証券取 引所 (New York Stock Exchange, NYSE) などの市場が閉じる時間帯が夜間のみの市場で は, x 軸に時刻, y 軸に RV あるいはボリュームの値を取るグラフを描くと U 字型になるこ とが知られている. 東京証券取引所 (Tokyo Stock Exchange, TSE) のように昼休みを持つ 日本の資産市場では, 昼休みの前後でも取引が活発になるので, そのグラフは山を 4 つ持つ W 字に近い型となる. では, ジャンプの日内での動き, いわゆるジャンプの日内パターンは どのようになっているのだろうか? 図 2 および 3 は, 各系列のジャンプの日内パターンを示している: 図 2 は, USD/JPY の 標本期間でのジャンプが一日のうちどの時刻に発生したかを累積的に数え, その数を 5 分 間隔のヒストグラムとして表している; 図 3 は, 同様にして, TOPIX と TOPIX500 に対し て描いたジャンプの 5 分間隔でのヒストグラムである. 高頻度データ系列におけるジャンプ検出の実証分析 図2 ジャンプの日内パターン (USD/JPY) 図3 ジャンプの日内パターン (TSE) 51 52 日本統計学会誌 第39巻 第1号 2009 • 図 2 を見ると, USD/JPY では 12:30, 13:30, および 24:00 ごろ特にジャンプが多く発 生していることになる. これは UTC 表示なので, 米国東部標準時 (Eastern Standard Time, EST) に変換すると, 12:30 から 5 時間引くことにより午前 7:30, 夏時間だと 4 時間遅れとなるので午前 8:30 となる. 同様に, 13:30 は 8:30 (EST) あるいは 9:30 (EST), 24:00 は 19:30 (EST) あるいは 20:30 (EST) となる. さらに, 日本標準時 (Japan Standard Time, JST) に変換すると, JST は UTC より 9 時間進んでいるの で, 12:30 は 21:30 (JST), 13:30 は 22:30 (JST), そして 24:00 は 9:00 (JST) となる. ここで面白いのは, これらのジャンプが多く発生している時刻に, NYSE の市場が開 く時刻 9:30 (EST) と TSE が開く時刻 9:00 (JST) を含んでいることである. これは 例えば, ちょうど朝方に多くの資産市場が開き, そこでのニュースが USD/JPY の為 替市場に影響を与えていると捉えることができよう. ただし, USD/JPY は世界中で 取引されているため, その他の時刻でも頻繁にジャンプが観測されていることに注意 すべきである. • 次に, 図 3 であるが, これは上の図とは対照的に明確な日内パターンが見て取れる. つ まり, 市場が開いた直後, 昼休みの前後, 市場が閉じる直前に多くのジャンプが発生し ていることになる. このことは, 上で述べた日本の資産市場におけるボラティリティ あるいはボリュームの日内パターンと整合的な結果となっている. 3.2 個別ニュースとの対応 前節では, TOPIX, TOPIX500, および USD/JPY の 5 分間収益率において発生したジャ ンプの特徴を観察したが, これらは当然, ジャンプを引き起こす何らかのニュース (市場へ の情報の突発的な流入) に起因すると考えられる. そこで本節では, (もちろんジャンプを発 生させる要因は無数に存在していると考えられるが) いくつかの具体的なニュースを取り 上げ, それがどのようにジャンプを発生させているのかを観察する. なお, ここではニュー スと対応できるジャンプの標本数が十分に得られることを考慮して, データは標本期間が 15 年 4 ヶ月分ある USD/JPY に限って分析を進める. ここでは Lahaye et al. (2007) に従い, 便宜上以下のように二種類のニュースを定義し, ジャンプとニュースの関係を見ていくことにする. 「予期せぬニュース (Suprises) 」: 一般投資家にとって, その発生時期とそれが価格変化 に与える影響は全く予想できない. 特定の関係者 (公的情報機関や警察等) は「予期 し得た」かもしれないが, あくまで一般投資家には予期できない. 「予期したニュース (Scheduled news) 」: 一般投資家は, ある程度その発生を予想して いたが, それがどのくらい価格変化に影響を与えるかまでは予想できない. つまり 高頻度データ系列におけるジャンプ検出の実証分析 53 ジャンプの変動額はなお確定値ではなく確率変数である. このような便宜的な定義を用いるのは, ジャンプに関しては前節まで述べてきたように, Lee-Mykland 統計量を使って統計的に定義できるが, ニュースの場合, それを定量的, 定性 的に定義付けることは困難だからである. もちろん, すべてのニュース (市場への情報流入) が上記 2 つに分類でき, それらのみがジャンプを発生させるとは思えない. しかし, 時間的, 質的にも予想し得るような「確定的な」ニュースが存在したとしても, その情報は事前に市 場に織り込まれるため, 価格過程モデルにおけるいわゆるジャンプ項 (jump term) ではな く拡散項 (diffusion term) での変化として捉えてもよいはずである. また, 当然ながら「予 期せぬニュース」は元来予測不可能であり, これをモデルへ取り込んだ上での分析はどの程 度有意義であるかは分からない. 他方,「予期したニュース」については, それを上手く定量 的に定式化すればボラティリティの予測精度向上へつながることが期待されると言えよう. では, 上で定義した 2 つのニュースが実際にジャンプへどのように影響を与えるのか見 ていくことしよう. ただ残念ながら, 表 5 を見ても分かる通り, 観測された USD/JPY に おいてはジャンプが少なくとも一回検出された日の数が 1417 もあるため, 全てのニュース とジャンプの対応関係を調べることは合理的でない. そこで, 標本期間中には大きな政治 的, 経済的, 更には文化的なニュースが発生し市場に影響を与えているとも考えられるが, ここでは USD/JPY に極めて大きなジャンプをもたらした個別ニュースとして, 「予期せ ぬニュース」としては「米国同時多発テロ事件」, 「予期したニュース」としては「米連邦 準備制度理事会 (FOMC) の公開市場操作」と「日銀による外国為替平衡操作」の, 計 3 つ の事例を取り上げる. まず, 一番目の事例として「予期せぬニュース (suprises) : 米国同時多発テロ事件」を取 り上げる. 周知の通りこの事件は, 2001 年 9 月 11 日の EST で朝, UTC では午後に連続的 に発生したテロ事件である5) . この事件を時系列的に見ると以下の通りとなる. (1) アメリカン航空 11 便テロ事件 (世界貿易センタービル北棟): 12:46:30 (UTC), 8:46:30 (EST) (2) ユナイテッド航空 175 便テロ事件 (世界貿易センタービル南棟): 13:02:59 (UTC), 9:02:59 (EST) (3) アメリカン航空 77 便テロ事件 (アメリカ国防総省本庁舎): 13:37:46 (UTC), 9:37:46 (EST) 5) この事件の詳細は http://www.9-11commission.gov/に詳しい. 54 日本統計学会誌 第39巻 第1号 2009 図4 2001 年 9 月 10-12 日 (USD/JPY) それでは, これらの突発的なニュースがジャンプの発生にどのような影響を与えたかを見 てみよう. 図 4 は, 2001 年 9 月 10 日から 12 日までの USD/JPY の Lee-Mykland 統計量を表して いる. ここで, y 軸で目盛り 9.21 にある太い点線は有意水準 α = 0.0001 での閾値であり, 目盛り 4.60 にある点線は有意水準 α = 0.01 での閾値である. つまり我々は, 各有意水準に おいてこれらの点線を越えた Lee-Mykland 統計量に対応する時点でジャンプが生じたと判 断する. この図を見ると, α = 0.01 と α = 0.001 いずれの場合も 9 月 11 日正午直後に大き なジャンプが発生していることが分かる. 更に, 図 5 では, 11 日のみに着目し Lee-Mykland 統計量をプロットしている. α = 0.01 と α = 0.001 ではほぼ同様の結果であるが, 15 時のジャンプが α = 0.01 で有 意となっていることに違いがある. ここで, この図における 3 本の縦に走る点線は, 上の 3 つのテロ事件に対応している. これを見ると, (1) が発生した直後には, 小さな山が見られ るがそれ程大きくはない. そして, 次の (2) では極めて大きい有意なジャンプが見られ, (3) でも比較的大きいジャンプが見られる.6) 断定することは難しいが, これらの結果から, (1) が発生した時点では偶発的な事故と考えられていたが, (2) の発生によりこれが政治的意図 6) 図ではニュースとジャンプが重なってほぼ同時的に発生しているように見えるが, 実際には用いているデー タが 5 分間収益率であるため, ニュースが入った瞬間にジャンプが発生している訳ではなく, その 5 分内のど こかでジャンプが発生したと考える方が合理的であろう. 高頻度データ系列におけるジャンプ検出の実証分析 図5 55 2001 年 9 月 11 日 (USD/JPY) を持つテロ行為であることが明らかになり, 市場に大きな衝撃が走ったと予想できる.7) 次に「予期したニュース」として,「米連邦準備制度理事会の公開市場操作 (以後 Federal Open Market Committee, FOMC と略) 」と「日銀による外国為替平衡操作 (以後 Foreign Exchange Intervention Operations, FXIO と略) 」という 2 つ事例をとりあげる8) . この 2 つを「予期したニュース」として選んだ理由の一つは, こういったマクロ経済ニュースで あるならば, 分析対象のデータに依存せずジャンプの観測がなされることを期待できるこ とである. なお, 日本の政策金利は 2001 年 9 月 19 日から 2006 年 7 月 14 日までの長期間 0.10% と固定され, 今回の標本期間での標本数が 14 しか得られなかったため, 本研究の分 析対象から除外した. それでは, まず FOMC と FXIO がどの程度の頻度, 大きさで各市場に介入しているか見 ていくことにする. 図 6 は, USD/JPY の標本期間 1991 年 5 月—2006 年 8 月に対応した 年度別の FOMC 及び FXIO による市場への介入回数を示している. これを見ると, FOMC 7) なお (1)-(3) の後, 14:03:11 (UTC) にユナイテッド航空 93 便テロ事件が発生しているが, 場所がペンシルヴァ ニア州, ピッツバーグ郊外シャンクスヴィルということもあり, その情報が市場に伝わった正確な時刻を特定 することは困難なため, ここでは取り上げていない. 8) FOMC の詳細に関しては FOMC のホームページ http://www.federalreserve.gov/monetarypolicy/fomc.htm を, FXIO に 関 し て は 日 銀 ホ ー ム ペ ー ジ「 日 本 銀 行 に お け る 外 国 為 替 市 場 介 入 事 務 の 概 要 」 http://www.boj.or.jp/type/exp/seisaku/expkainyu.htm を参照していただきたい. また FXIO に関して は, ここでは分析対象が USD/JPY であるので, 円ドルレートへの市場介入データのみを利用している. 56 日本統計学会誌 第39巻 第1号 2009 図6 表8 年度別 FOMC 及び FXIO による市場への介入回数 ニュースに条件付けられたジャンプの観測された相対的な頻度とその統計量 N (news) N (no news) N (jumps|news) N (jumps|no news) JF (jumps) JF (jumps|news) JF (jumps|no news) µ̂ (jumps|news) µ̂ (jumps|no news) σ̂ 2 (jumps|news) σ̂ 2 (jumps|no news) 注: N 以外すべて単位は%. FOMC 16307 1115486 48 2101 0.1899 0.2944 0.1884 −0.0166 −0.0162 0.0010 0.0015 FXIO 93202 1038591 286 1863 0.1899 0.3069 0.1794 0.1174 −0.0367 0.0017 0.0014 は各年度を通じて介入が行われているが FXIO は 1994 年前後と 2003 年, 2004 年に非常に 多く, 2005 年以降は一度も介入が行われていない. 次に, これらニュースとジャンプがどの ように関係しているかを知るために, 表 8 にこれらの形式的な条件付き統計量をまとめた: ここでは, N (·|·), N (·), JF (·|·), JF (·), µ̂ (·|·), 及び σ̂ 2 (·|·) は, それぞれ条件付きと無条件 での, 観測値の数, ジャンプが観測された相対的な頻度, 標本平均, 及び標本分散を表して いる. この表で目を引くこととして, 次の二点が挙げられる: 高頻度データ系列におけるジャンプ検出の実証分析 57 • FOMC, FXIO どちらの場合においても JF (jumps|news) の方が JF (jumps|no news) より大きな値を取っている; • FOMC の µ̂ (jumps|news) と µ̂ (jumps|no news) はほぼ同じ値を取っているが, FXIO では符号とその絶対値もかなり異なっている. そこで上記の 2 つの点を確認するため, 次の統計的仮説検定を行う. まず, JF (jumps|news) と JF (jumps|no news) が有意に等しいかを調べるために, ニュースが有る日のジャンプの 頻度とニュースが無い日のジャンプの頻度が等しいという帰無仮説の下で, いわゆる二群 の比率の差の検定を行う. 表 8 の記号を用いると, JF (jumps|news) − JF (jumps|no news) Z0 := √ JF (jumps) × (1 − JF (jumps)) × (1/N (news) + 1/N (no news)) は正規分布に従う. そこで p 値 P = 2 × Pr (Z ≥ |Z0 |) を求めることにより仮説検定ができ, P ≤ α0 のとき帰無仮説を棄却する. 検定結果を簡単に述べると, FOMC では Z0 = 3.0870, P = 0.0020, FXIO では Z0 = 8.5641, P = 0.0000 となり, 有意水準 α0 = 0.05 および 0.01 のいずれもにおいても帰無仮説は棄却された. つまり, ニュースが有った日の方がジャンプ はより頻繁に発生するということになる. 次に, µ̂ (jumps|news) と µ̂ (jumps|no news) が有意に等しいかを調べるために, ニュース が有る日のジャンプの平均値とニュースが無い日のジャンプの平均値に差が無いという帰 無仮説の下で, いわゆる二群の平均値の差の検定 (Welch の検定) を行う. 再び, 表 8 の記 号を用いれば, µ̂ (jumps|news) − µ̂ (jumps|no news) t0 = √ σ̂ 2 (jumps|news)/N (jumps|news) + σ̂ 2 (jumps|no news)/N (jumps|no news) は自由度 ν の t 分布に従う. ここで ν は以下で与えられる: ν= (A1 + A0 )2 , B1 + B0 A0 = σ̂ 2 (jumps|news)/N (jumps|news), A1 = σ̂ 2 (jumps|no news)/N (jumps|no news), B0 = {σ̂ 2 (jumps|news)/N (jumps|news)}2 /{N (jumps|news) − 1}, B1 = {σ̂ 2 (jumps|no news)/N (jumps|no news)}2 /{N (jumps|no news) − 1}. そこで上と同様に p 値 P を求めることにより仮説検定ができ, P ≤ α0 のとき帰無仮説を 棄却する. 検定結果を簡単に述べると, FOMC では t0 = 0.0090, P = 0.9928, FXIO では t0 = 5.8847, P = 0.0000 となり, 有意水準 α0 = 0.05 および 0.01 のいずれもにおいても FOMC では帰無仮説は棄却できず, 逆に FXIO では帰無仮説は棄却された. つまり, FOMC 58 日本統計学会誌 第39巻 第1号 2009 ではニュースの有無にかかわらずジャンプの大きさには差が無いこととなる. なお, 詳細に は触れないが収益率の絶対値に対してもほぼ同様の検定結果となったことを記しておく. 以上の結果は, 実は興味深いことに, 種々の資産市場に対して本研究とは異なるマクロ経 済ニュースの影響を Lee-Mykland 検定を用いて分析した Lahaye et al. (2007) の, ほぼすべ ての市場で「ニュース発表がある期間においてジャンプはより頻繁に発生」するが「ジャン プがニュースの発表日に, より大きいということは言えない」という結果と整合的である. 3.3 日次データへの応用例 最後に, 日次データのジャンプに対する Lee-Mykland 統計量の応用例を述べる. 例えば, 10 年 20 年といった長い期間で考えれば, 日次データであっても相対的には十分な高頻度 データと成り得るのである. Lee-Mykland 統計量の適用に関しても当然このことは該当 し, 十分な系列標本の数があれば, 使用するデータが分刻みあるいは秒刻みといったいわ ゆる現実時間スケールで言う高頻度データでなくても, ジャンプの検出を行う事は可能で ある. そこで, ここでは長期間のデータが比較的入手しやすい原油先物価格系列を用いて, Lee-Mykland 統計量の日次データへの応用を試みる. 使用した原油先物価格系列は, ウェスト・テキサス・インターミディエイト (West Texas Intermediate futures contract deliverable at Cushing, Oklahoma, 以下 WTI と略) であ る. 標本期間は 1983 年 4 月 27 日から 2008 年 2 月 29 日までの 24 年 10 ヶ月分の日次デー タであり, 価格の単位はすべて 1 バレル当たりのドル表示である. 図 7 はその価格系列と Lee-Mykland 統計量を図示しており, そこでは, 標本数 N = 6483 に対し, α = 0.0001 での ジャンプの数は 16 となっている. α = 0.01 では, α = 0.001 では 20 年間で有意なジャンプは数回に過ぎないのに対し, 20 回以上有意なジャンプが観測されており, 特に 1983 年には年間 10 回以上が観測され ている. このことは, あまり α の値を緩めてしまうと小さなジャンプも捉えてしまい, 一 つ一つのジャンプに対する経済的な意味付けが難しくなってしまうことを示唆している. α = 0.0001 と非常に小さいということにも多かれ少なかれ依存するが, 25 年弱の期間に ジャンプが僅か 16 回しか観測されていないことは, WTI の系列においてジャンプが極めて 希にしか起こらないと思うかもしれない. しかし, 頻度で見ると JF (jumps) = 0.0025 とな り, 先に分析した 5 分間データで最もジャンプの頻度が高かった FUNAI ELECTRIC でも JF (jumps) = 0.0040 であったことを踏まえると, 一概に WTI のジャンプの頻度が極端に 低いとは言えない: 分析に用いるデータ系列の長さ, 観測頻度等の特性の影響もあるといえ よう. また, 図 7 から分かることとしては, ジャンプにクラスタリング現象が見て取れるこ とである. つまり, ほぼ全てのジャンプは 1983 年から 1986 年にかけて, 1988 年, 1991 年, 1996 年から 1998 年にかけ, そして 2002 年に発生し, 2002 年以降は (価格は急激に上昇し 高頻度データ系列におけるジャンプ検出の実証分析 図7 59 原油先物価格の日次データ (1983-2008 年) ているにもかかわらず) ジャンプは全く発生していない. 次に, WTI データにおけるニュースとジャンプの関係はどうなっているだろうか? それ を調べるために, ここでは 1991 年に発生したジャンプに着目し分析を進める. 図 8 は, 1991 年 1 月から 12 月までの WTI 価格と Lee-Mykland 統計量を図示している. ここでは α = 0.01 でも α = 0.001 とほぼ同様の結果となっている. この図を見ると, こ の年の有意なジャンプは 1 月 17 日と 8 月 19 日と二回観測されており, 特に 1 月 17 日では 原油価格が大きく下落している. それでは, このジャンプが発生した両日に, 一体どのよう なニュースが市場に飛び込んできたのであろうか? そこで, 原油価格に影響を与えそうな 1991 年のニュースを確認したところ, 次のような事件が発生していた: (a) 湾岸戦争が勃発 (1 月 17 日): 米国を中心とする多国籍軍によりイラクへの爆撃が開始 された (「砂漠の嵐」作戦); (b) 旧ソ連にて反ゴルバチョフ・クーデターが発生 (8 月 19 日): 共産党保守派によりゴル バチョフ大統領が軟禁された (8 月クーデター). これら 2 つの大きなニュースの発生日は, 図 8 における 2 本の縦に走る点線 (a) と (b) に対 応している. つまり大きなニュースには大きなジャンプが対応し, 市場の価格変化に影響を 与えていることが見て取れる. 60 日本統計学会誌 第39巻 第1号 2009 図8 原油先物価格の日次データ (1991 年) 以上のように, 実際 Lee-Mykland 統計量は, ある程度十分な標本数がありさえすれば日 内の高頻度データよりも低頻度な日次データに対しても直接的に適用でき, 日次データに おけるジャンプとニュースを対応させることにより, それらニュースが市場にどのような 影響をもたらすかを分析する為の便利なツールとなる. これは, 高頻度データよりも入手し やすく, データの種類も豊富な日次, 週次, あるいは月次データを用いて, より広範な種類 のデータ系列を対象に突発的変動の分析を行える事を意味する. 4. おわりに 本稿では Lee-Mykland 統計量に基づいて, 東証の株価指数, 個別銘柄, 円ドル為替レート の 5 分間隔の高頻度収益率データ, そして原油先物価格の日次データを用い, Lee-Mykland 統計量による収益率過程におけるジャンプの実証分析を行った. 具体的には, まずジャンプの頻度, ジャンプの大きさを調べ, さらにはニュースとジャン プの関連性について検証した. まず, ジャンプの頻度に関しては, 1 万分の 1 回程度と非常 に低い銘柄が存在するが, 反面, 少なくとも 10 日に 1 回はジャンプが発生する銘柄も存在 するという結果となった. また, ジャンプの大きさも平均で正値の銘柄, 負値の銘柄が両方 見られた. ニュースとジャンプの関連については, 「予期せぬニュース」の一例として米 国同時多発テロ事件, 「予期したニュース」の例として FOMC と FXIO を取り上げた. そ して「予期したニュース」が発表された日のジャンプの発生する観測された相対的な頻度 高頻度データ系列におけるジャンプ検出の実証分析 61 は, 有意にニュースが発表された日の方が高かった. しかし, ジャンプの大きさは FOMC ではニュースの有無に関係なく, FXIO では有意に差があるという結果となった. 最後に, 原油先物価格の日次データを用い分析を行い, 標本数が十分大きければ, 日次のジャンプを も Lee-Mykland 統計量により検出できること示した. 連続時間確率過程によるモデリングを想定する際に, “モデルにおける時間スケール” と “実データ系列における時間スケール” に絶対的な関係はないことに注意したい. 本稿の実 証分析では, 原則として期間 I の長さ T を, 対象とするデータ系列の年数にとった. Lee- Mykland は理論上, 連続変動過程とポアソン型のような希ジャンプ過程の和として表現さ れる価格過程を対象とするものなので, 実証分析においては, 連続過程に見えない日内高 頻度データというよりは, T が大きい (例えば数年間といった) 状況を対象にする方が妥当 である. 例えば, 期間 I の長さが一日程度の短いものであるときは X を無限ジャンプ過程 でモデリングする方が妥当であるというのはよく知られた経験的事実であり, 従ってジャ ンプとして検出される高頻度収益率の頻度は大きくなるはずである. このような場合には, Woerner (2007) のように, 不連続 (非正規) レヴィ過程を駆動ノイズとしてモデルへ取り込 む方法が考えられよう. 予期せぬニュースはその名の通り原則予測不可能であり, それをモデルへ取り込んだ上 で有用なボラティリティ予測を実装することは実質不可能と思われる. Andersen et al. (2007a) は, RV の連続部分のボラティリティはジャンプ部分のそれと比較して, よりクラ スタリング現象を呈する傾向にあるという実証結果を報告しており, 安定したボラティリ ティ予測に関しては大きな価格変動の処理に関して注意を払うべきであるとしている. と は言え, 比較的頻度が高い「小さいジャンプ」はボラティリティ予測に関与するはずであ る. 現状では, 累積ボラティリティの連続部分の推定のみに焦点を当てた論文が圧倒的多数 派であるが, 近年では, ジャンプ変動自身もボラティリティ予測に大きく関与する可能性も 無視できないという実証結果が報告されてきている. 例えば, 最近 Corsi et al. (2008) は, ボラティリティ予測におけるジャンプの影響の有用性を示唆する分析を行った. ジャンプ 部分と連続部分の同時推定に関する先行研究としては, 例えば Fan and Wang (2007) が挙 げられる. しかしながら, 既述したように, 希な大きいジャンプ変動は推定および予測の安 定性を低下させるため, これを取り込んだ有意義な統計分析手法の構築は非常に困難なも のとなるであろう. ボラティリティへの小さい (累積) ジャンプの寄与に注意の払い方に関 する最近の研究としては, 例えば Tauchen and Zhou (2007) を参照されたい. ジャンプの符号付サイズを上手く取り込んだ予測方式を定式化し, ボラティリティ予測 の精度向上を図るというのが今後の課題である. 62 日本統計学会誌 第39巻 第1号 2009 謝辞 有益なコメントをいただいた査読者に感謝いたします. また, 本研究の一部は, 日本学術 振興会科学研究費補助金基盤研究 (B)(18330041), 文部科学省科学研究費補助金若手研究 (B)(19730159), および同 (20740061) の援助を受けたものである. 参 考 文 献 Aı̈t-Sahalia, Y. (2004). Disentangling diffusion from jumps, J. Financial Econ., 74, 487–528. Aı̈t-Sahalia, Y. and Jacod, J. (2009). Testing for jumps in a discretely observed process, Ann. Statist., 37, 184–222. Andersen, T. G., Bollerslev, T., Diebold, F. X. and Vega, C. (2003). Micro effects of macro announcements: Real-time price discovery in foreign exchange, The Amer. Econ. Rev., 93, 38–62. Andersen, T. G., Bollerslev, T. and Diebold, F. X. (2007a). Roughing it up: Including jump components in the measurement, modeling, and forecasting of return volatility, Rev. Econ. Statist., 89, 701–720. Andersen, T. G., Bollerslev, T., Diebold, F. X. and Vega, C. (2007b). Real-time price discovery in global stock, bond and foreign exchange markets, J. Int. Econ., 73, 251–277. Ball, C. A. and Torous, W. N. (1983). A simplified jump process for common stock returns, J. Financial Quant. Anal., 18, 53–65. Bandi, F. M. and Russell, J. R. (2006). Separating microstructure noise from volatility, J. Financial Econ., 79, 655–692. Barndorff-Nielsen, O. E. and Shephard, N. (2004). Power and bipower variation with stochastic volatility and jumps. (with discussion) J. Financial Econ., 2, 1–48. Barndorff-Nielsen, O. E. and Shephard, N. (2006). Econometrics of testing jumps in financial economics using bipower variation, J. Financial Econ., 4, 1–30. Barndorff-Nielsen, O. E., Shephard, N. and Winkel, M. (2006). Limit theorems for multipower variation in the presence of jumps, Stochastic Process. Appl., 116, 796–806. Beckers, S. (1981). A note on estimating the parameters of the diffusion-jump model of stock returns, J. Financial Quant. Anal., 16, 127–140. Beine, M. A. R., Lahaye, J., Laurent, S., Neely, C. J. and Palm, F. C. (2006). Central bank intervention and exchange rate volatility, its continuous and jump components. FRB of St. Louis Working Paper No. 2006-031C. Chernov, M., Gallant, A. R., Ghysels, E. and Tauchen, G. T. (2003). Alternative models of stock price dynamics, J. Econ., 116, 225–257. Corsi, F., Pirino, D. and Reno, R. (2008). Volatility forecasting: The jumps do matter. Preprint. Dungey, M., McKenzie, M. and Smith, V. (2007). News, no-news and jumps in the U.S. treasury market. Mimeo. Eraker, B., Johannes, M. S. and Polson, N. (2003). The impact of jumps in equity index volatility and returns, J. Finance, 58, 1269–1300. Fan, J. and Wang, Y. (2007). Multi-scale jump and volatility analysis for high-frequency financial data, J. Amer. Statist. Assoc., 102, 1349–1362. Galambos, J. (1978), The Asymptotic Theory of Extreme Order Statistics, John Wiley & Sons, New YorkChichester-Brisbane. Huang, X. (2006). Macroeconomic news announcements, financial market volatility and jumps. Unpublished manuscript. Huang, X. and Tauchen, G. (2005). The relative contribution of jumps to total price variance, J. Financial Econ., 3, 456–499. Jiang, G. and Oomen, R. (2008). Testing for jumps when asset prices are observed with noise - a “swap variance” approach, J. Econ., 144, 352–370. Lahaye, J., Laurent, S. and Neely, C. J. (2007). Jumps, cojumps, and macro announcements. Preprint. 高頻度データ系列におけるジャンプ検出の実証分析 63 Lee, S. and Mykland, P. A. (2008). Jumps in financial markets: A new nonparametric test and jump dynamics, Rev. Financial Studies, 21, 2535–2563. Merton, R. C. (1976). Option pricing when underlying stock returns are discontinuous, J. Financial Econ., 3, 125–144. Press, S. J. (1967). A compound events model for security prices, J. Business, 40, 317–335. Tauchen, G. and Zhou, H. (2007). Realized jumps on financial markets and predicting credit spreads. Preprint. Woerner, J. H. C. (2007). Inference in Lévy-type stochastic volatility models, Adv. in Appl. Probab., 39, 531– 549.