Comments
Description
Transcript
ペナルティ付加PSOによる複数音源追尾
平成 25 年度電子情報通信学会東京支部学生会研究発表会 講演番号: 46 ペナルティ付加 PSO による複数音源追尾 A-4 Multiple Sound Source Tracking by Penalty–Added PSO 平川真里 Masato Hirakawa 陶山健仁 Kenji Suyama 東京電機大学 工学部 電気電子工学科 School of Engineering, Tokyo Denki University 1 まえがき 本研究では,2 マイクロホンによる複数音源追尾につ いて検討する.提案手法では,音声のスパース性を利用 した MUSIC (MUltiple SIgnal Classification) [1] スペク トルのピークサーチに PSO (Particle Swarm Optimization)[2] を用いる.PSO の評価関数にペナルティを付加 し,同一ピークへの収束および空間エイリアシングによ る偽りのピークへの収束を回避する.実環境実験より提 案手法の有効性を示す. 2 問題設定 時刻 n で方向 θi (n),i = 1,2 の音源信号 s1 (n),s2 (n) を,間隔 d で並べた 2 個のマイクロホンで受音する.マ イクロホン間には到達時間差 τi (n) = d sin θi (n)/c が生 じる.ここで c は音速である.複数移動音源追尾問題は, 受音信号から θi (n) を推定する問題である. 4 実環境実験 提案手法の有効性を示すために実環境実験を行った. 実験は 9.0[m]×26.0[m]×2.5[m],残響時間 0.51[s],騒音 レベル 38.4[dB] の部屋で行った.サンプリング周波数は 8[kHz],DFT サイズは 512,オーバーラップ長は 50%,使 用周波数は 0.6[kHz]∼ 4[kHz] とした.事前実験より,ペ ナルティ関数に用いたピークサーチ間隔は 5[◦ ],MUSIC の忘却係数を 0.90,PSO の w = 0.6,c1 = 1.0,c2 = 1.3 とした.実験には,8 つの信号パターンについて試行し た.追尾精度の検証には正解率を用いた.正解率の基準 には誤差の絶対値が 10[◦ ] 以下であれば正解とみなした. また,演算時間の検証として 1[s] 当りの演算時間 (RTF) を用いた.表 1 に実験結果を示す. 表 1 The results of Correct–Ratio(CR) and RTFs moving speech CR[%] pattern pattern 1 89.6 2 92.4 1 3 90.9 4 93.8 1 82.0 2 81.6 2 3 83.6 4 78.8 3 提案手法 提案手法は MUSIC に基づく手法である.MUSIC で は MUSIC スペクトル PM U (θ, t, k) のピーク点より音源 方向を推定する.ただし t は時間フレーム番号,k は周 波数帯域番号である.PM U (θ, t, k) は次式となる. PM U (θ, t, k) = aH k (θ)ak (θ) H ak (θ)QN (t, k)QH N (t, k)ak (θ) (1) 一般に MUSIC で方向推定可能な音源数はマイクロホン 数未満である.提案手法では音声のスパース性を仮定 し,複数の音源方向にピークをもつ MUSIC スペクトル PM U (θ, t) = k PM U (θ, t, k) を得る. しかし,PM U (θ, t) は雑音や,複数音源信号が含まれる 周波数帯域の影響により,音源方向以外にも多数のピー クをもつ.さらに高周波数帯域では空間エイリアシング の影響による偽りのピークが生じるため,音源方向に対 応するピークの探索は困難である. そこで,ピーク探索に PSO を用いる.PSO では式 (1) にペナルティを与えれば探索空間の設定が可能であ る.提案手法では,ペナルティ関数を設定するのため に次のような 3 段階の処理を行う.まず,低周波数帯 域の PM U (θ, t, k) の分母項をおおまかに走査し,すべ てのピーク点 Plow を得る.次に,すべての k に対する PM U (θ, t, k) の分母項を加算し,Plow 付近のピーク点 Pall を算出する.最後に Pall から大きいピーク P1 ,P2 を算出し,P1 ,P2 を平均値とするガウス関数 Fg1 ,Fg2 を PSO のペナルティ関数として用いる. RTF 0.0995 0.0995 0.0990 0.0995 0.0995 0.0995 0.0995 0.0995 これより,提案手法が実時間で音源追尾に成功してい ることが確認できた. 5 まとめ 本研究では 2 マイクロホンによる複数音源追尾を提案 した.スパース性を仮定し複数音源に対応する MUSIC スペクトルを用いた.PSO により MUSIC スペクトル のピーク探索を行い,ペナルティ関数に MUSIC スペク トルの分母項を利用した.実環境実験より,提案手法が 実時間で複数音源追尾可能であることを示した. 参考文献 [1] R.O. Schmidt, “Multiple emitter location and signal parameter estimation,” IEEE Trans. AP., Vol.34, No.3, pp.276–280, 1986. -46- [2] J. Kennedy and R.C. Eberhart, “Particle Swarm Optimization,” Proc. of Int. Conf. Neural Networks, pp.1942–1948, 1995. Copyright © 2014 IEICE