音声認識長文聞き取りのためのキー・テクノロジ!

by user

on 28 марта 2017

Category: Documents

>> Downloads: 6

views

Report

Comments

Description

Download 音声認識長文聞き取りのためのキー・テクノロジ!

Transcript

音声認識長文聞き取りのためのキー・テクノロジ!

ダウンロード・サービスあり
My アルゴリズムで聞き分け率アップ! ボイス制御マシンにも使える!?
ラズベリー・パイでトライ!
音声認識
第
お試しプログラムも用意!
「走れメロス」用データベースをなんとオンボードで!
3回
長文聞きとりのためのキー・テクノロジ言語モデルをつくる
安藤章悟
Raspberry Pi
スタンドアロン版AmiVoice
USB
サウンド・
カード
マイク
音声を入力
音声認識
デコーダ
USB
ハブ
キーボード
操作
USB
音響
分析
セルフ・
パワー
音響モデル
HDMI
ディスプレイ
言語モデル
辞書
結果を出力
今回は「走れメロス」のテキスト・
データから言語モデルと辞書を生成
マウス
電源供給
図 1　走れメロス対応の言語モデルでメロス語を認識…今回の実験
音声認識ソフトウェア AmiVoice を Raspberry Pi で試す
前回（第 2 回，2013 年 12 月号）は Raspberry Pi で音
声認識ソフトウェア AmiVoice を使って定型文の認識
と長文の認識を試しました．定型文の認識は文法定義
型のルール，長文の認識は統計的言語モデルのディク
テーションで行い，ルールについては記述法を解説し
ました．
前回の実験では，長文の認識にサーバを使いました
が，今回は，図 1 に示すように実験として「走れメロ
ス」を題材として言語モデルを作成して Raspberry Pi
上で試します．そのうえで，ディクテーションで使用
する統計的言語モデルと辞書について解説します．
作成した言語モデル
●「メロスは激怒した」を一字一句違わず認識で
きる
（1）の文章を使って実際に
今回は「走れメロス」
AmiVoice 用の統計的言語モデルを作ってみました．
http://www.cqpub.co.jp/interface/
download/contents.htm からダウンロードで
きます．
前回紹介したサーバ版では，口語表現も含めた長文
の聞き取りができるように言語モデルのデータ量が膨
2014 年 1 月号
大です．そのためサーバで音声認識処理をしていまし
たが，今回の言語モデルは軽量なものなので
Raspberry Pi 上で動かしてみましょう．
▶試す手順
ダウンロードしたファイルを解凍するとAmiVoice
RPiというディレクトリができるので，Raspberry Piの
任意の場所に置いてください（ここでは /home/pi/
に置く）
．前回のファイルも同梱していますので，すで
にダウンロードしている方は上書きしてください．
以下のコマンドで実行できます．
cd /home/pi/AmiVoiceRPi/samples/
melos/make test
▶メロス語以外は認識できない
今回の言語モデルは純粋に走れメロスの文章のみか
ら作っているので，走れメロスの文中に出現しない単
語は認識できません．図 2 に示すように「めろすわげ
きどした」としゃべれば「メロスは激怒した」と正しく
認識できます．しかし，
「ひさしぶりきょーのみにい
こーよ」などの走れメロスに関係のない文章は認識で
きません．試しにしゃべってみたところ図 3 のように
「久しく力をの御子よ（ひさしくりきをのみこよ）
」と
走れメロスに出現する単語だけを使って強引に発音の
近いものに置き換えられてしまいました．
第1回　最初のステップ! 音声の波形表示＆解析（2013年11月号）
第2回　なんと話し言葉もOK ! サーバ・アシストで高性能音声認識ソフトAmiVoiceをためす（2013年12月号）
131