Comments
Description
Transcript
HMM って僕にも分かりますか?
HMM って僕にも分かりますか? HMM って僕にも分かりますか? 篠崎隆宏 東工大 日本音響学会ビギナ ズセミナ 2013秋 日本音響学会ビギナーズセミナー2013秋 1 はじめに(確率の復習) • 確率 – 事象の起こり易さを0から1の数値で表したもの • 確率変数 – 試行によってランダムに値が決まる変数 試行 ダ 値が決まる変数 • ベイズの定理 P( X | Y )P(Y ) P(Y | X ) = P( X ) 2 Example • サイコロの目 – 確率変数X : サイコロを振った時に出る目 – 確率分布 X=1 X=2 X=3 X=4 X=5 Pr(X=x) 1/6 1/6 1/6 1/6 1/6 X=6 1/6 • ピーナッツの重さ 確 確率密度 度 – 確率変数X: ピ 確率変数X: ピーナッツ1粒の重さ ナッツ1粒の重さ – 確率密度分布 3 2 1 0 0 0.2 0.4 0.6 0.8 ピーナツの重さX (g) 1 1.2 3 HMMとは? Hidden Markov Model Hidden Markov Model (隠れマルコフモデル) (隠れマルコフモデル) の略です 4 では、Markov Modelとは? では、Markov Modelとは? • 時間と共に確率分布が変化する確率変数の 系列(X1,X2,X3, …)のモデルで、各時刻の確率 分布がその直前の変数値によって決まるもの P( X t | X t −1 , X t − 2 , X t −3 , L) = P( X t | X t −1 ) 値 与 れれ 、 Xt‐1 t 1の値が与えられれば、 他の変数は関係ない Andrey Markov 1856‐1922 5 図で描くと P( X 1 , X 2 , X 3 , L , X T ) ベイズの定理(入れ子で使用) = P( X 1 )P( X 2 | X 1 )P( X 3 | X 1 , X 2 )L P( X T | X 1 , X 2 , L , X T −1 ) Markovモデルの仮定 = P( X 1 )P( X 2 | X 1 )P( X 3 | X 2 )L P( X T | X T −1 ) X1 X2 X3 XT 変数をノード、依存関係を枝で表すと、 線形なグラフになる 6 変数値が有限離散の場合 オートマトンや行列 オ トマトンや行列 として表現可能 P(1|1) 1 1 P(1|N) P(N|N) N 2 P(N|1) N P(2|1) P(N|2) P(1|2) とすると X t = {1,2, L N } とすると.. 2 P(2|N) P(Xt|Xt‐1) Xt=1 Xt=2 Xt‐1=1 1 P(1|1) P(2|1) P(N|1) Xtt‐11=2 P(1|2) ( | ) P(2|2) ( | ) P(N|2) ( | ) P(1|N) P(2|N) P(N|N) …. Xt=N : Xt‐1=N P(2|2) Xtが単語の場合はN‐gramと呼ばれる 7 状態が観測できない(Hiddenな)場合 P(1|1) どの状態 にいるのか 見れない P(1|N) P(N|N) 1 P(N|1) N P(2|1) P(N|2) P(1|2) 2 P(2|N) P(2|2) これだけでは余りどうしようもない。。。 8 隠れマルコフモデル (HMM) P(1|1) pS1 (o) ? o P(1|2) pS2 (o) P(N|1) P(N|N) pSN (o) ? P(2|1) P(N|2) ? o 出力 信号列 P(1|N) o P(2|N) P(2|2) 状態遷移に伴う 出力信号が観測可 時刻 9 状態遷移の推定 前提 •初期状態はS0、最終状態はSNで、既知とする •T回の状態遷移を行い、遷移のたびに遷移先状態の出力確率 回の状態遷移を行 、遷移のたびに遷移先状態の出力確率 分布に従い信号を出力した t=0 t=1 t=T N 0 観測信号O o1 o2 最大事後確率状態系列 K (= K (0 ), K (1), L , K (T ) ) oT = arg max P ( K | O, HMM ) K T = arg max ∏ {P (K (t − 1) → K (t ) | 遷移分布[ K (t − 1)])P (ot | 出力分布[ K (t )])} K t =1 = S 0 , S 2 , S1 , S1 , S5 , S 2 , S 3 , L , S N 10 音声認識での利用 音素/a/ のHMM 08 0.8 10 1.0 s 07 0.7 02 0.2 s 03 0.3 2 1 s 0.1 06 0.6 s 04 0.4 4 3 pS 2 (o ) pS1 (o ) 09 0.9 pS4 (o ) pS3 (o ) 音響尤度 o o o o 特徴量 音声信号 時刻 11 まとめ • マルコフモデル – 確率変数の系列のモデルで、各時刻の状態遷移 確率分布がそ 直前 時刻 変数 値 確率分布がその直前の時刻の変数の値のみに よって決まると仮定したもの • 隠れマルコフモデル – 状態を表す確率変数を外部から直接観測すること は出来ない(隠されている)とした、マルコフモデル – 状態により決まる確率分布に従った出力信号の 状態により決まる確率分布に従 た出力信号の 観測は可 – 音声認識では隠された状態変数を音素や単語、 出力信号を音声に対応させる 12