Comments
Description
Transcript
PCSシリーズの高音質化技術について
PCSseries_J.qxd 07.9.11 4:52 PM ページ 1 VIDEO COMMUNICATION SYSTEM -TECHNICAL DOCUMENTATION PCSシリーズの高音質化技術 について PCS-1 Ver.3.31 – 3.4 PCS-G50 Ver.2.4 – 2.6 PCS-G70 Ver.2.4 – 2.6 PCS-TL30 Ver.1.3 – 2.0 PCS-TL33 Ver.2.0 PCS-TL50 Ver.2.32 – 2.4 PCSseries_J.qxd 07.9.11 4:52 PM ページ 2 PCSシリーズの高音質化技術について VIDEO COMMUNICATION SYSTEM-TECHNICAL DOCUMENTATION はじめに ソニーのPCSシリーズ *1 ・ビジュアルコミュニケーションシステムは、標準機能としてMPEG-4 AACによる高音質な双方向通信を実現しています。加えて、広帯域(サンプリング周波数 32kHz)エコーキャンセラーを搭載しています。 さらに最新バージョンでは、エコーキャンセラーのアルゴリズム、アーキテクチャーを刷新する ことにより、大幅な性能向上に成功しました。本資料では、最新エコーキャンセラーの技術につ いて説明します。 音響エコーキャンセラーとは ビデオ会議の例で説明しますと、双方向でハンズフリー通話の場合、会議参加者が発声すると その音声は通話相手へ送られます。相手側ではスピーカーから音声が出力され、その音声が相 手側マイクに拾われ、再びこちら側のスピーカーから出力されます。すなわち、マイクに向か って発声すると、こだまの様にスピーカーから自分の声が聞こえてくる現象が音響エコーです。 これはとても耳障りなため通話を妨げます。ひどい場合にはハウリング現象を引き起こし、通 話不能な状態へ陥ることもあります。そのため、このような双方向の拡声通話系で全二重通話 を実現するためには、スピーカーからの音声を消去し、再び相手へ送られることを防ぐ「音響 エコーキャンセラー技術」が不可欠となります。 PCSシリーズの新エコーキャンセラー 最新バージョンに実装された新エコーキャンセラーでは、限られたハードウェア・リソースの 中で、HDビジュアルコミュニケーションシステムPCS-HG90で実現した技術を可能な限り 生かし、自然な音質を実現しました *2。 *1:PCS-1/G50/G70/TL30/TL33/TL50 (「PCS-G70」は、PCS-G70SおよびPCS-G70Nの総称です。) *2:外部エコーキャンセラーやPCSA-A7P4などの外部エコーキャンセラー内蔵マイクを使用した場合は、 外部エコーキャンセラーの性能が優先されます。 c 2007 Sony Corporation ○ September, 2007 / Ver 1.2 2 PCSseries_J.qxd 07.9.11 4:52 PM ページ 3 PCSシリーズの高音質化技術について VIDEO COMMUNICATION SYSTEM-TECHNICAL DOCUMENTATION PCSシリーズの新エコーキャンセラー技術 自然な音質の実現のために ― マルチレート信号処理技術 計算量削減の手法の一つとしてマルチレート信号処理技術があります。この手法を使うと周波 数帯域を分割して処理することで低いサンプリング周波数へダウンサンプリングすることがで きます。例えば半分のサンプリング周波数へダウンサンプリングすると、適応フィルタの処理 は半分に減ることになります。 このダウンサンプリングの際に、エリアシングを起こすと適応フィルターの性能が劣化するこ とが知られています。このエリアシングを防ぐために、ダウンサンプリングを行う前にアンチ エリアシングフィルターをかけますが、その特性によって音質も影響を受けます。計算量を最 も削減できる「最大間引き」を行う場合のフィルター特性では、阻止帯域が帯域分割で隣り合 う帯域の境界からとなり、阻止帯域で十分な減衰を得るために通過帯域の一部も犠牲となって しまいます。そのため帯域分割/合成を行うと、隣り合う帯域との境界にノッチが形成され、 音質に悪影響を与えます。 PCSシリーズの新エコーキャンセラーでも、この問題に対して音質を損なわない設計がなさ れました。PCS-HG90と同様、最大間引きに対する問題を、2倍オーバーサンプリング方式 で解決しています。(図1参照) この方式では適応フィルターの計算には2倍のコストがかかりますが、阻止帯域を2倍の周波 数にすることができるので、隣り合う帯域との境界をよりフラットにすることができます。ま たエリアシングの発生も防ぐため、最大間引き方式に比べ、歪み成分の少ないクリアで自然な 音質を実現することができました。 c 2007 Sony Corporation ○ September, 2007 / Ver 1.2 3 PCSseries_J.qxd 07.9.11 4:52 PM ページ 4 PCSシリーズの高音質化技術について VIDEO COMMUNICATION SYSTEM-TECHNICAL DOCUMENTATION 図1:最大間引き方式との比較 最大間引き方式 帯域ごとの特性 プロトタイプフィルター 1帯域分の帯域幅 プロトタイプフィルター 1帯域分の帯域幅 レベル エリアシング防止のため 深いノッチが形成されて しまう 周波数 歪みを生じさせる エリアシング成分が残る 全帯域特性 レベル 深いノッチ (不自然な音感) 歪み 周波数 2倍オーバーサンプリング方式 帯域ごとの特性 プロトタイプフィルター 1帯域分の帯域幅 プロトタイプフィルター 1帯域分の帯域幅 レベル 隣り合う帯域とは フラットに接合 周波数 2つ隣の帯域との間に重なりがなければ エリアシングは生じない 全帯域特性 レベル ノッチは見られない(自然な音感) 歪みは見られない(クリアな音質) 周波数 c 2007 Sony Corporation ○ September, 2007 / Ver 1.2 4 PCSseries_J.qxd 07.9.11 4:52 PM ページ 5 PCSシリーズの高音質化技術について VIDEO COMMUNICATION SYSTEM-TECHNICAL DOCUMENTATION エコー消去性能の向上 エコーキャンセラーは、スピーカーから出た音をマイクで拾うことで逐次学習し、それにより マイクとスピーカーの位置関係や、部屋の音場を推定します。 最新のエコーキャンセラーでは、学習アルゴリズムの制御方法の変更や、従来より高次数での 演算により、音場の推定精度を高めました。 また残留エコー抑圧技術の改善ともあいまって、従来よりも速く、より深くエコーを消去する ことができます。 ダブルトーク耐性の強化 相手側と自分側の両方が同時に発声することを「ダブルトーク」と言います。従来は、ダブル トークすると相手の音声が非常に小さくなり、会話に支障をきたすことがありました。 最新のエコーキャンセラーでは、学習の高精度化に加え、新しい音場学習制御の導入により、 双方向性が大きく改善されました。 騒音除去性能の向上 ノイズリダクションアルゴリズムの改善により、さまざまな騒音の環境下で、音声の品質を劣 化させることなく、騒音を効果的に低減します。これにより、騒音の中に埋もれていた音声が、 一層クリアに聞こえるようになりました。 音質補正機能による、音声の明瞭度向上 デジタル・イコライジング技術による音質補正機能を新たに搭載。音声の周波数帯域を強調す ることにより、音の中で、声が「前に出る」効果を演出します。 エコーだけを抑圧し、残留した騒音を安定化 学習が進んでいない状況で、残留するエコーを抑圧する際、騒音も一緒に抑圧されてしまいま す。しかし、発言する時としない時とで、騒音の大きさが頻繁に変化するのは、聞いている人 にとっては不快なものです。 最新のエコーキャンセラーでは、エコーだけを低減し、騒音の量を一定にする技術を導入する ことで、学習が進んでいない時にエコーを抑圧しても、自然で快適な会話ができるようになり ました。 オートゲインコントロールの変更 従来のエコーキャンセラーでは、遠くの話者の発言が聞こえにくいことがありました。 最新のエコーキャンセラーでは、大きすぎる音を適正な音量にする「コンプレッサー」をかけ ることで、近くの話者でも遠くの話者でも、自然な音量で明瞭な音声とすることができました。 c 2007 Sony Corporation ○ September, 2007 / Ver 1.2 5 PCSseries_J.qxd 07.9.11 4:52 PM ページ 6