Comments
Description
Transcript
ノイズマスキング信号対雑音比を用いた 逐次雑音推定型スペクトル
講演番号: 73 A-4 平成 23 年度電子情報通信学会東京支部学生会研究発表会 ノイズマスキング信号対雑音比を用いた 逐次雑音推定型スペクトルサブトラクション法 Speech Enhancement Based on Noise Masking Property with Sequential Noise Estimate 内海 雄貴*1 Yuki UCHIUMI 林 誠治*2 Seiji HAYASHI *1 拓殖大学大学院 工学研究科 Graduate School of Engineering, Takushoku University 杉本 公弘*2 Masahiro SUGUIMOTO *2 拓殖大学 工学部 Faculty of Engineering, Takushoku University 回帰直線を用いたα の算出 1. はじめに 3.2 携帯電話等による背景雑音の代表的な除去法としてス ペクトルサブトラクション法(以降 SS 法)がある.しかし,従 来型の SS 法を用いて雑音が除去された信号は背景雑音 の変化に追従できない問題や,スペクトルの引き過ぎによ り音声信号が劣化する問題がある.これについて逐次的 に推定雑音の更新を図る方法,および聴覚特性にみられ るマスキング効果を利用する方法の上記 2 つの手法を組 み合わせることで,背景雑音の変化の追従に対応しつつ 話者発声区間における雑音感の低減を図った[1].さらに, マスキング効果を利用した音声成分の強調法において,ノ イズマスキング信号対雑音比を用いた回帰直線による音 声抽出のための利得フィルタの適応制御を行う方法を提 案し,更なる雑音除去性能の向上を目指す. 3.1 節で求めたNMSNR の最大値と最小値,設定したα の最大値と最小値から図1 に示す回帰直線を用いて α を算出する.ここで,m とb はそれぞれ傾きと切片で ある. 図1 NMSNR とαの回帰直線 ! ! " 2. 逐次雑音推定 ! #・ α$ ω ・ +" 式(1)~(4)に1フレームにおける逐次雑音推定のアルゴ リズムを示す[2]. および は指数平滑法を 用いた推定スペクトルとして算出され,λBおよび λXは現在 のフレームを何%推定雑音振幅スペクトルに加えるかを決 める忘却係数である.式(3)は に掛けることによっ て音声信号成分を取り出すための利得フィルターである. はフレーム番号であり,は周波数のインデックス番号であ る. (6) (7) (8) 4. シミュレーション 原音声を4種類と背景雑音を5種類を使用して,SN比を 10dBから0dBと0dBから10dBと変化させたときの(本手法の CD )-(従来法のCD 値)を図2に示す.CDはケプストラム距 離であり,スペクトルの形状を与えるひずみ尺度である。 (1) (2) (3) (4) 3. ノイズマスキングによる音声強調 5. まとめ 人間の聴覚尺度とされるBark スケール,Spreading function を用いてノイズマスキング信号NMS として算 出する[3].その後,NMS を用いて推定雑音との比に よりフレーム毎に推定雑音を適応的にスケーリングする関 数α を算出する.本研究では,ノイズマスキング信号 対雑音NMSNR を用いた回帰直線によりα の算 出を行った. 3.1 本研究では,ノイズマスキング SN 比を用いた回帰直線 によるスケーリング関数% の適応制御を行う方法を提 案した.その結果,フレーム毎に雑音除去が制御でき,CD 値において良好な結果が得られた.今後の課題としては, さらなる改善量向上のためα を求める際の各種パラメ ータの最適値を探索する必要がある. 参考文献 [1] 内海 雄貴,林 誠治,杉本 公弘,電子情報通信学会 東京支部学生会研究発表会,p.221,2011-3. [2] P. Lockwood and J. Boudy, Speech Commun., vol. 11, pp.215-228 , 1992. [3] N. Virag, IEEE Trans. Speech and Audio Processing, vol. 7, no. 2, pp.126-137, 1999. ノイズマスキング信号対雑音比の算出 NMSNR は式(5)より算出する. 図2 CD値の改善量(左図:SN比10dBから0DB に変化, 右図:0dBから10dBに変化) (5) -73- Copyright © 2012 IEICE