Comments
Description
Transcript
小型機器で快適なハンズフリー通話 を可能にする非線形エコー消去技術
イメージ/音声処理コンポーネントソリューション 小型機器で快適なハンズフリー通話 を可能にする非線形エコー消去技術 宝珠山 治・杉山 昭彦 要 旨 本稿では、ノートPC、携帯電話などの小型機器で、ヘッドセットを用いずにハンズフリー通話を行うための非 線形エコー消去技術を紹介します。エコー(スピーカからマイクへの音声回り込み)の消去において、小型ス ピーカや筐体振動が発生した歪んだ成分を消去することは従来きわめて困難でしたが、新開発の周波数領域処 理技術により、快適に会話を行える十分なエコー消去が可能となります。 キーワード ●携帯機器 ●ハンズフリー通話 ●エコーキャンセラ ●歪 ●非線形 1. まえがき 近年、企業における遠隔会議、PC上のVoIP電話、携帯電話 によるテレビ電話などの普及や、運転中の携帯電話利用の法 的な禁止により、ヘッドセットやハンドセットを用いないハ ンズフリー通話の需要が増加しています。現在、これらのハ ンズフリー通話には、通話音質の向上のため、線形適応フィ ルタに基づく線形エコーキャンセラが用いられています。し かし、この技術は、小型スピーカの非線形特性やスピーカと マイクが固定された筐体などを伝搬する振動によって生じる 非線形エコーを消去できないという問題点があります 1) 。 この非線形エコーを消去するために、非線形適応フィルタ やニューラルネットワークによって非線形エコーを消去する 手法も開発されていますが、線形エコーキャンセラの10倍以 上に達する莫大な演算量が必要となり、現実的な解決にはな りません。そのため、少ない演算量で非線形エコーを消去で きる技術の開発が求められていました。 提案する非線形エコーキャンセラは、こうした課題を克服 し、少ない演算量で非線形エコーの消去を可能とするもので す。提案法を用いることで、ノートPCや携帯電話などの小型 機器で、高音質テレビ会議システムと同等の快適な双方向通 話を行うことができます 3,4) 。 2. 非線形エコー発生の原理 図1(a) のように、東京でハンズフリー通話をしている場合 に、大阪からどう聞こえるかを考えてみます。大阪での「モ 図1 (a) エコー発生の原理、(b) エコーキャンセラの原理 シモシ」という発声は、通信回線を通って、東京でのスピー カから「モシモシ」と再生されます。ハンズフリー通話では、 スピーカでの再生音量が大きいため、「モシモシ」という声 がマイクに回りこみ、遅れて大阪に戻ってきます。大阪で しゃべっている人には、自分の声が山びこ、すなわちエコー のように聞こえます。このエコーがあると、発声が困難にな るだけでなく、最悪の場合「キーン」というハウリングが発 生し、会話になりません。 エコーの問題は古くからあり、エコーキャンセラという技 術で解決されています。 図1(b) に示すように、スピーカから マイクへの回り込み経路をフィルタとみなし、線形適応フィ ルタという技術で、マイクに回り込むエコーにそっくり NEC技報 Vol.60 No.2/2007 33 イメージ/音声処理コンポーネントソリューション 小型機器で快適なハンズフリー通話を可能にする非線形エコー消去技術 非線形エコーを消去するために、理論的にどんな非線形性 でも表すことが可能な、ボルテラフィルタやニューラルネッ トワークなどの非線形適応フィルタを用いた構成が提案され ています。しかしこれらの構成では、線形エコーキャンセラ の10倍以上に達する大きな演算量が必要であり、かつ、演算 量の増加に見合う十分なエコー消去性能は得られていません。 4. 提案法 2) 図2 非線形エコー発生の原理 な信号を擬似的に生成してマイクの信号からキャンセルしま す。線形適応フィルタは、擬似エコーを生成するために、ス ピーカに送られた再生信号から、線形演算(遅延、定数倍、 およびこれらを組み合わせた演算)により、回り込み経路を 模擬します。この線形エコーキャンセラは、ビデオ会議シス テムなどでは必須の技術として広く用いられています。 ノートPCや携帯電話などの小型機器では、このエコーの問 題がさらに困難になります。非線形エコー発生の原理を 図2 に示します。相手側音声を、小型筐体にとりつけたスピーカ で大音量再生すると、スピーカや筐体内の部品が大きく振動 し、「ジージー」「ビリビリ」という歪音を発生します。こ の歪を伴ったエコーは、スピーカ再生信号の線形演算では表 すことができないため、非線形エコーと呼ばれます。線形エ コーキャンセラでは非線形エコーを完全に消去することがで きず、残留したエコーが通話を阻害します。この問題は、安 価なスピーカを用いた場合や小型機器において顕著です。 提案する非線形エコーキャンセラの構成を、 図3 に示しま す。この非線形エコーキャンセラでは、線形エコーキャンセ ラによって線形エコーを消去した後の信号をFFT(高速フー リエ変換)により周波数スペクトルに変換して処理を行い、 IFFT(逆高速フーリエ変換)により、通話相手に送る音声波 形に再合成します。この周波数スペクトル処理は、新たに発 見した「非線形エコーと線形擬似エコー間のスペクトル振幅 相関」に基づいています。 図4 にスペクトル振幅相関の例を示します。線形エコーと 非線形エコーは全く違う波形ですが、周波数ごとにスペクト ル振幅を見ると、図4のように、線形擬似エコーが大きい時は 非線形エコーも大きくなる傾向、すなわち振幅の相関がある 図3 非線形エコーキャンセラの構成 3. 従来の非線形エコー対策 ハンズフリー通話機能を有するノートPCや携帯電話、自動 車用ハンズフリーキットの多くでは、非線形エコーを消去す るために、ボイススイッチと呼ばれる手法が採用されていま す。この手法は、会話においてどちらか一方だけが発声して いる場合が多いことを利用し、一方で発声しているときに、 もう一方からの音声の再生音量を小さくします。しかし、双 方が発声、あるいは周囲騒音が大きい場合には音声が途切れ がちになり、快適な双方向通話は不可能となります。 34 図4 非線形エコーと線形擬似エコーのスペクトル振幅相関 (2.2kHzの例) 組込みソフトウェア・ソリューション特集 ことが、いくつもの小型機器の調査により確認されました。 この相関の発見により、非線形エコーの量を効率的に推定す ることが可能となります。図3のスペクトル推定部では、推定 した非線形エコーの量に基づいて、所望の音声信号のスペク トル振幅を推定します。 この相関関係は厳密ではないので、推定された音声信号の スペクトル振幅には誤差があります。この推定誤差が主観的 に不快にならないような対策を開発することにより、実用レ ベルの非線形エコー消去を実現しました。音声信号の推定ス ペクトル振幅が過剰に小さく、背景雑音のスペクトル振幅を 下回る場合、エコーの有無で信号レベルが変動し、違和感を 生じさせます。その対策として図3のスペクトルフロアリング では、背景雑音レベルを推定して、推定スペクトル振幅の下 限とすることにより、レベル変動を低減しています。一方、 推定誤差により推定スペクトル振幅にエコーが大きく残留し てしまった場合、残留したエコーは断続的かつ急激に変化す るため、ミュージカルノイズと呼ばれる、人工的な付加音が 聞こえます。その対策として図3の利得計算部では、エコーを 消去するために、推定した非線形エコーを減算するのではな く、減算された程度の振幅になるように利得を乗じています。 利得の急激な変化を防止する平滑化を行うことにより、残留 エコーの断続的変化を抑えます。 以上のような技術の積み重ねにより、ノートPCや携帯電話 などの小型機器でも、快適な双方向通話が可能となりました。 この非線形エコーキャンセラは、周波数スペクトルにおいて 定数倍や平滑化など簡単な演算で実現されます。その演算量 増加は、線形エコーキャンセラと比較して20%から100%程度 であり、問題なく実用化できます 3) 。 5. シミュレーションによる評価 筐体およびスピーカが最も小さい携帯電話でのシミュレー ションによる評価例を図5に示します。 図5(a) はスピーカで再 生された相手側音声信号、 図5(b) はマイクで得られたエコー の信号波形です。 図5(c) では、線形エコーキャンセラのみで エコーを消去していますが、まだ非線形エコーが残留してお り、発声の内容が聞き取れます。一方、 図5(d) に示される提 案法の出力波形では、非線形エコーも含めて、エコーが聞き 取れない程度まで消去されています。 図5 シミュレーションによる評価結果の例 6. むすび ノートPCや携帯電話などの小型機器において、快適にハン ズフリー通話を行うための非線形エコー消去技術について紹 介しました。提案法は、PC・ソフトフォン・VoIPハンドセッ ト・携帯電話など様々な機器における快適な双方向ハンズフ リー通話の実現に貢献すると考えています。今後、早期の商 品化をめざして研究開発を加速していく計画です。 参考文献 1) A. N. Birkett and R. A. Goubran; “Limitations of Hands-free Acous‐ tic Echo Cancellers Due to Nonlinear Loudspeaker Distortion and Enclosure Vibration Effects,” IEEE Proc. WASPAA'95, pp. 13-16, 1995. 2) O. Hoshuyama and A. Sugiyama; “An Acoustic Echo Suppressor Based on a Frequency-Domain Model of Highly Nonlinear Residual Echo,” IEEE Proc. ICASSP2006, pp. V-269-272, 2006. 3) 宝珠山治、杉山昭彦; 「非線形残留エコーの周波数領域モデルを用い た非線形エコーサプレッサの評価」、電子情報通信学会、第21回信号 処理シンポジウム講演論文集、C8-4、2006年11月. 執筆者プロフィール 宝珠山 治 杉山 昭彦 主任研究員 IEEE、電子情報通信学会、日本音響学会各会員 主席研究員 IEEE Senior Member、電子情報通信学会会員 共通基盤ソフトウェア研究所 共通基盤ソフトウェア研究所 NEC技報 Vol.60 No.2/2007 35