Comments
Description
Transcript
論文紹介 - NHKオンライン
論文紹介 無機エレクトレットを用いた電荷蓄積型シリコンマイクロホン 電気学会論文誌E, Vol.132, No.9, pp.309315(2012) 後藤正英,萩原 啓,田島利文※1,安野功修※2,児玉秀和※2,樹所賢一※3,井口義則 ※1 NHKES ※2(財) 小林理学研究所 ※3 リオン (株) 次世代の超小型・高性能マイクロホン(以下,マイク)の実現を目指して,電荷蓄積型シリコンマイクの研究を進めている。 従来のシリコンマイクでは48Vの直流電圧(バイアス電圧)を印加して動作させる必要があったが,マイクの内部にエレクト レット(電荷を蓄積した誘電体)を形成した電荷蓄積型では,バイアス電圧の印加が不要で,検出回路に必要な数Vの電圧だ けで動作が可能となる。今回,背面電極にシリコン酸化膜(SiO2)と窒化膜(Si3N4)の誘電体を形成し,耐湿性を高めるた めのヘキサメチルジシラザン(HMDS)を塗布した後,コロナ放電を行って負電荷を蓄積して誘電体をエレクトレット化した。 その結果,試作したマイクでは,動作電圧3Vで感度−44.6 dB(0dB=1V/Pa) ,周波数帯域20 Hz∼20 kHzという優れた音 響特性が得られた。また,試作したエレクトレットが高い耐熱性・耐湿性を示すことを確認し,放送用途だけでなく補聴器な どの民生用途にも適用可能な,低電圧動作のシリコンマイクの実用化に見通しを得た。 マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション 電子情報通信学会論文誌,D, Vol.J95D, No.9, pp.17491758(2012) 奥 貴裕,佐藤庄衛,小林彰夫,本間真一,今井 亨 話者ダイアライゼーションとは,音声から「いつ,誰が発話しているのか」を推定する技術である。話者を推定することがで きれば,音声認識をする際に音響モデルを話者適応できるので,認識率が改善されると期待できる。提案手法では,対談番組 のような複数の話者が連続して発話する状況において,話者交代点を逐次検出し,低遅延で話者の判定を行う。このとき,性 質の似た音素をまとめて「マルチ音素クラス」を構成し,クラスごとの音響特徴量の分布を逐次比較することで,従来より短 い遅延時間で話者ダイアライゼーションの精度を向上することができた。報道系の情報番組の対談部分を対象として実験を行っ た結果,遅延時間2秒の話者判定において,話者ダイアライゼーションの誤り率を20.0%削減できることが分かった。話者判 定結果を利用したオンライン音声認識実験では,話者交代点前後の発話の認識率の誤りを7.8%削減でき,話者ダイアライゼー ションの精度の向上が音声認識の精度の向上につながることが確認できた。 Spin Transfer Switching of Current−Perpendicular−to−Plane GMR with Various Gd−Fe Free Layer Compositions Journal of Applied Physics, Vol.111, pp.07C911.107C911.3(2012) 青島賢一,橋本佑介,船橋信彦,町田賢司,久我 淳,菊池 宏,清水直樹,石橋隆幸※ ※ 長岡技術科学大学 広視域の動画の立体像をホログラフィーで再生するために,超高密度の表示素子であるスピン注入型空間光変調器(スピンSLM: SpinSpatial Light Modulator)の研究を進めている。スピンSLMはスピン注入磁化反転と磁気光学効果を利用した独創的な デバイスで,画素ピッチ1μm以下の超高精細表示と高速動作が可能である。このスピンSLMを開発するためには,光変調層 の磁気光学カー効果の向上と駆動電流の低減を実現する必要がある。そこで,光変調層としてガドリニウム鉄合金(GdFe) に着目し,Fe組成比を72.5%∼80.2%にしたGdFe光変調層を作製した。カー回転角を測定した結果,カー回転角はFe組成比 の増加とともに大きくなり,Fe組成比が80.3%のときは72.5%のときより8%増加し,約0.14° となった。また,Fe組成比の異 なる光変調層を用いた巨大磁気抵抗素子の磁化反転駆動電流密度を測定した結果,Fe組成比を72.5%から80.3%にすることで 磁化反転駆動電流密度は急激に減少し,80.3%のときは72.5%のときの1/10以下となり,14.1MA/cm2となった。 Spectral Features for Perceptually Natural Phoneme Replacement by Another Speaker’s Speech IEICE Trans. Fundamentals, Vol.E95A, No.4, pp.751759(2012) 田高礼子,世木寛之,都木 徹,清山信正 波形接続型の音声合成においては,波形データを作成したときの話者(オリジナル話者)が全ての音声を発声しているわけで はないので,合成に必要な音声素片が不足することがある。その音声素片を他の話者が発声した音声素片で補うためには,声 質が知覚的に類似・連続している必要がある。そこで,声質の知覚的な類似性・連続性を物理的に推定するための尺度として, 周波数帯域とスペクトル特徴量を検討した。まず,オリジナル話者が発話した文章中の母音または長母音の1つを他の話者の もので置き換え,その部分の自然性を知覚実験で評価した。次に,評価スコアとスペクトル特徴量の距離との相関分析を行い, 物理的な尺度として,低域または高域のスペクトル重心(COG:Spectral Center of Gravity)とメル周波数ケプストラム係 数(MFCC:Melfrequency Cepstrum Coefficient)が有効であることを見いだした。更に,COGとMFCCを使って,合成 に必要な置き換え用の音声素片を適切に選択できることを示した。 NHK技研 R&D/No.138/2013.3 63