...

手書きひらがな文字認識の精度向上 のための濁点,半濁点の抽出と判別

by user

on
Category: Documents
7

views

Report

Comments

Transcript

手書きひらがな文字認識の精度向上 のための濁点,半濁点の抽出と判別
修士論文
手書きひらがな文字認識の精度向上
のための濁点,半濁点の抽出と判別
平成 27 年度修了
三重大学大学院工学研究科
電気電子工学専攻
藤井 功武
三重大学大学院
工学研究科
目次
第1章
はじめに .......................................................................... 1
第2章
手書きひらがな文字認識 ................................................. 3
2.1
2.2
2.3
2.4
2.5
第3章
3.2.1
3.2.2
3.2.3
3.3.1
3.3.2
第4章
類似筆記者を利用した手書きひらがな文字認識................................. 3
類似筆記者の選択 ............................................................................... 6
平均ベクトルの算出 ........................................................................... 6
文字認識結果の導出法 ........................................................................ 7
従来手法の問題点 ............................................................................... 7
提案手法 .......................................................................... 8
連結成分の抽出(ラベリング)................................. 9
画素数による判別 .......................................... 9
中心位置の確認 ........................................... 10
ユークリッド距離とマハラノビス距離による判別 ............. 11
輪郭線の本数による判別処理 ............................... 11
付加記号抽出実験 .......................................................... 15
4.1
実験に使用した文字画像 .................................................................. 15
4.2
距離と次元数における比較 ............................................................... 18
4.2.1 4 次元のユークリッド距離による分類 ....................... 19
4.2.2 2 次元のユークリッド距離による分類 ....................... 19
4.2.3 4 次元のマハラノビス距離 ................................. 22
4.2.4 2 次元のマハラノビス距離 ................................. 24
4.2.5 4 種類の距離における分類結果のまとめ ..................... 26
4.3
付加記号以外の分類 ......................................................................... 28
4.4
輪郭線の本数による比較の検証........................................................ 30
第5章
考察 ............................................................................... 33
5.1
誤読の原因分析................................................................................. 33
5.2
結果の比較 ........................................................................................ 34
5.3
濁点の分類結果................................................................................. 35
5.4
付加記号以外の分類 ......................................................................... 35
5.5
輪郭線の本数の変化を考慮した判別との比較 .................................. 35
5.6
濁点の方向指数の分散の偏り ........................................................... 36
5.6.1. 適切な大きさの正規化の模索 ........................................................ 37
5.7
日本語以外の付加記号と本研究の有意性 ......................................... 39
i
第6章
6.1
6.2
まとめと今後の課題 ...................................................... 40
実験結果のまとめ ................................................................................ 40
従来の文字認識手法との合成 .............................................................. 40
謝辞 ............................................................................................... 41
参考文献 ........................................................................................ 42
論文目録 ........................................................................................ 44
ii
図一覧
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
類似筆記者の認識用辞書を利用した文字認識手法
使用者の字形と類似筆記者の字形
提案手法のフローチャート
輪郭線の本数による分類を追加したフローチャート
入力画像の各連結成分の画素数としきい値の一例
各連結成分の中心位置
拡大プログラムの改良画像
付加記号の候補画像の判別法
入力画像からの方向指数ヒストグラム作成手順
次元数の特徴を使用した半濁点の有無の判別法
付加記号判別のイメージ
4 次元の方向指数から導出したユークリッド距離の相違度
2 次元の方向指数から導出したユークリッド距離の相違度
4 次元の方向指数から導出したマハラノビス距離の相違度
2 次元の方向指数から導出したマハラノビス距離の相違度
全字種に対する付加記号の分類結果
輪郭線の本数の変化を考慮した付加記号の分類結果
アラビア文字の一例
表一覧
表1
表2
表3
表4
表5
表6
表7
表8
表9
表10
表11
表12
表13
表14
表15
濁点,半濁点を含む字種の正読率(%)
ひらがなの正読率(%)
多様な付加記号(濁点,半濁点)の位置
半濁点の入力画像,抽出画像、輪郭線画像
濁点の入力画像,抽出画像、輪郭線画像
4 次元ユークリッド距離における分類結果(%)
2 次元ユークリッド距離における分類結果(%)
4 次元マハラノビス距離における分類結果(%)
2 次元マハラノビス距離における分類結果(%)
ユークリッド距離とマハラノビス距離における分類結果(%)
4 次元,2 次元のユークリッド距離の濁点,半濁点との相違度
4 次元,2 次元のマハラノビス距離の濁点,半濁点との相違度
付加記号以外を含む全ての文字に対するユークリッド距離と
マハラノビス距離における分類精度(%)
4 次元マハラノビス距離の分類結果のコンフュージョン
マトリクス
2 次元マハラノビス距離の分類結果のコンフュージョン
iii
表16
表17
表18
表19
表20
表21
表22
表23
表24
マトリクス
正規化前後での濁点、半濁点の輪画線の本数の変化
輪郭線の本数の変化を考慮した分類結果(%)
輪郭線の本数の変を考慮した 4 次元マハラノビス距離の
分類結果のコンフュージョンマトリクス
輪郭線の本数の変を考慮した 2 次元マハラノビス距離の
分類結果のコンフュージョンマトリクス
付加記号の抽出例と判別例
半濁点と濁点の方向指数の平均と分散
正規化の大きさを 72 から 52 まで変化させた場合の
方向指数の平均と分散
正規化の大きさを 42 から 22 まで変化させた場合の
方向指数の平均と分散
正規化の大きさを 32 へ変化させた場合の分類結果(%)
iv
第1章
はじめに
近年,スマートフォンやタブレット端末を始め,手書き文字認識を利用した個人
用情報処理システムが増加してきている.
手書き文字認識システムは,書き順などから文字をリアルタイムで判別するオ
ンライン文字認識と,一度書き終わった文字を認識するオフライン文字認識に分
別される.オフラインでの文字認識システムにおいては,紙に書かれた文字[1]や
黒板上に書かれた文字[2,3,4]を認識するシステムが挙げられる.また,本研究で対
象とする文字認識はオフラインに分類される.
一般的に,日本語の手書き文字認識においては,多人数の筆記者の文字から作成
した「汎用辞書」が利用されている.筆者の研究室では,汎用辞書は,通商産業省電
子技術総合研究所(現在、経済産業省産業総合研究所)が作成した手書き文字デ
ータベース ETL9B[5](筆記者 4,000 人,JIS 第 1 水準漢字とひらがな計 3,036 字
種,200 画像/字種)を用いて作成された文字認識用辞書(以下、汎用辞書)を使用
している.汎用辞書による手書き文字認識の正読率は 82.4%であり[6],より高い正
読率が多くの使用者から要望されている.
そこで,認識精度を向上させるために, 筆記者個人の手書き文字から文字平均
ベクトル(筆記者固有の平均ベクトル)を算出し,字種ごとの変数成分(汎用変
動成分は汎用辞書の作成文字)を使用する「混合辞書」が提案された[6].しかし,
混合辞書を利用するためには,事前に使用者の文字を字種ごとに学習させる必要
があり,使用者の負担が大きくなる.服部,木村ら[7,8,9,10]は,この問題を解決する
ために,使用者と似た文字を筆記する類似筆記者の文字を利用した文字認識手法
を提案した.また,熊澤ら[9,10]は,類似筆記者の選択に特定の 4 字種を用いること
で,正読率が 82.4%から 94.3%へ向上することを示した.そして,この研究では,字
種全体の平均正読率に対して濁点,半濁点を含む文字の認識率が 86.8%と低く,大
きな問題となっている(表 1,2).
そこで本稿では,筆記者ごとに,濁点,半濁点の位置が大きく異なることに注目
し(表 3),濁点,半濁点を基底文字(濁点,半濁点のつかない文字)と分離し,分離し
た基底文字と濁点,半濁点を判別する方法を検討し,さらなる文字認識率の向上
を目指す.
本研究では,文字の輪郭線について、4 つの方向指数を使用した 4 次元の成分
と 4 つの方向成分の差を使用した 2 次元の成分からそれぞれユークリッド距離
とマハラノビス距離を算出し,さらに文字の正規化前後の輪郭線数の個数の変化
による判別を考慮した結果との比較を行った. 本研究の結果,濁点,半濁点の分類
1
において,4 次元のマハラノビス距離かつ,輪郭線の本数の変化を考慮した結果が
98.2%となり.また,濁点,半濁点以外を含む全字種の分類では 2 次元のマハラノビ
ス距離かつ,輪郭線の本数の変化を考慮した結果が 96.3%となり,最も高い精度を
示した.
表1
濁点,半濁点を含む字種の正読率(%)
引用元:熊澤健人:複数字種より選んだ類似筆記者の利用によるひらがな文字認
識,平成 24 年度 三重大学工学部電気電子工学科卒業論文(2013)
表2
表3
ひらがなの正読率(%)
多様な付加記号(濁点,半濁点)の位置
2
第2章
2.1
手書きひらがな文字認識
類似筆記者を利用した手書きひらがな文字認識
文字認識のフローチャートを図 1 に示す.手書きひらがな文字認識システムで
は, 文字認識の特徴量として,文字の輪郭線に対する加重方向指数ヒストグラム
(図 2)を用い[10,11,12], 4×4 領域で 4 方向の輪郭点の数を特徴とする 64 次元の
特徴ベクトルを使用して文字認識を行う.加重方向指数ヒストグラム法を用いた
理由は,郵政省郵政研究所の研究によると,実際の郵便番号として書かれた手書
き文字データについての比較研究により,17 種類の特徴量と 11 種類の識別関数
の中で最良の性能を示すからである[13].またこの方法は、現在、文字認識の代
表的な研究書[14]に紹介され、中国科学技術院における大規模認識実験の結果、
手書き中国文字についても他の手法に比べ、高い認識率を示すことが紹介され
ており、アジアの文字を中心に世界的に幅広く使用されている標準的な文字認
識となっている[15,16].
学習処理では,多数の筆記者により筆記されたひらがな 71 種類の特徴を抽出
し,抽出したひらがな文字の特徴により,字種ごとに平均ベクトル,特徴ベクトル
の共分散行列の固有値及び固有ベクトルを算出し,文字認識用辞書の作成を行う.
その後,認識処理で使用者の筆記した文字が持つ特徴と,作成した文字認識用辞
書が学習している文字の特徴について相違度(擬似ベイズ識別関数[12])を計算し,
最も相違度の小さい字種を文字認識結果とする.
前章で挙げた汎用辞書は,多数の筆記者として手書き文字データベース ETL9B
を用いて作成される.また,混合辞書は,ETL9B に加えて使用者の文字を用いて
作成される.汎用辞書に比べ,混合辞書の認識精度は高い.
本研究室では、混合辞書の高い認識精度をそのままに,使用者の負担を軽減さ
せた,類似筆記者の文字を利用した手書きひらがな文字認識手法の研究[8,9]が行
われてきた(図 1).類似筆記者とは使用者と似た特徴を持つ文字を筆記する登録
筆記者を指す(図 2).従来研究の一つである熊澤の研究[9]は,特定の字種が似て
いれば,他の字種も似ているという仮定のもと,使用者の筆記した 4 字種より
類似筆記者を選択し,辞書を作成した.その結果,混合辞書と同程度の高い認識
精度を得ることに成功し,正読率は 94.3%となった.
熊澤の研究では,使用者が記入する特定字種は,木村の研究[8]で正読率が低か
った「が」,「ぎ」,「ぱ」,「ぷ」の 4 種を使用した.
3
図1
類似筆記者の認識用辞書を利用した文字認識手法
4
図2
使用者の字形と類似筆記者の字形
引用元:熊澤健人:複数字種より選んだ類似筆記者の利用によるひらがな
文字認識,平成 24 年度 三重大学工学部電気電子工学科卒業論文(2013)
5
2.2
類似筆記者の選択
辞書作成過程では,加重方向指数ヒストグラム法を用いて使用者の筆記した特
定字種の文字画像 4 文字から特徴ベクトルを算出する.
その後,疑似ベイズ識別関数を用いて,使用者の特定字種の特徴ベクトルと,本
研究室であらかじめ登録しておいた登録筆記者の文字画像の特徴ベクトルの相
違度を計算する.
k 1
l
g ( x)  
i 1

l
t
i
x l  
2
l
i
n


i k
l
t
i
x l  
2
l
k


 ln   l i   l k 
i k
 i1

k 1
(1)
n
ここで, n は特徴ベクトルの次元数( n =64), k は学習サンプル数の不足による
推定誤差を少なくするために、相違度計算に使用する固有値と固有ベクトルの
組数を指定する数値で、共分散行列の固有値の相対的な大きさにより、定める整
数( 1  k  n )である.また,x は使用者の特徴字種 l の特徴ベクトルとし l  ,l i ,
l
 i はそれぞれ登録筆記者の文字画像の特徴ベクトルの平均,固有値,固有ベク
トルを表す.
その後,各特定字種において,相違度が最も小さい登録筆記者を類似筆記者と
して選択する.
2.3
平均ベクトルの算出
使用者の特定字種の特徴ベクトル,複数人の類似筆記者より算出した合成特
徴ベクトルより、平均ベクトルを算出する.(式(2),式(3))
特定字種の場合,
M
1 N



x

x


l c
l si  l ci 
N  M  i 1
i 1

特定字種以外の字種の場合,
6
(2)
1
l c 
M
M

i 1
l
xci
(3)
以上の式を使用する.
ここで N ,M はそれぞれ使用者,類似筆記者が筆記した字種の文字数とする.
また, l xs は使用者が筆記した字種の特徴ベクトル, l xc は類似筆記者による特徴
合成ベクトルとする.
2.4
文字認識結果の導出法
2.2 で示した擬似ベイズ識別関数[12]を使用し,使用者記入文字の特徴ベクトル
と,使用者専用の文字認識用辞書の文字画像の特徴ベクトルの相違度を計算し,
相違度が最も小さい字種を認識結果として選択する.
2.5
従来手法の問題点
熊澤の研究手法の問題点として, 字種全体の平均正読率に対して濁点,半濁点
の認識率が 86.8%と低く,大きな問題となっていることがわかる(表 1,2).正読率の
低くなる原因として,濁点,半濁点の位置が筆記者によって大きく変動すること
が考えられる(表 3).そこで本稿では,濁点,半濁点を分離する方法と,濁点,半濁点
の判別方法を検討した.濁点,半濁点の分離法と判別法は次章へ示す.本研究では,
比較を行うために判別法にはユークリッド距離とマハラノビス距離を使用する.
7
第3章
提案手法
3.1 付加記号の判別法の提案
本研究では,「ぱ」のような濁点や半濁点を含む文字については,「は」に「゜」
が付加した字種と考え,それぞれを基底文字,付加記号と呼ぶ.
また,本研究では,従来研究で正読率を下げる要因となっていた濁点,半濁点の
付く字種の正読率を向上させるために, 付加記号の部分と基底文字の部分を画
像処理の手法を使用して分割する方法を考察し,分割した付加記号の画像に関し
て,濁点,半濁点だけの判別法を提案する.提案手法のフローチャートを図 3 に示
す. また,輪郭線の本数による判別を加えたフローチャートを図 4 へ示す.輪郭線
の本数による判別は 5 章にて後述する.
文字画像入力
付加記号の分割
距離による付加記号分類
判別結果
図3
提案手法のフローチャート
8
文字画像入力
付加記号の分割
輪郭線の本数による分類
距離による付加記号分類
判別結果
図4
輪郭線の本数による分類を追加したフローチャート
3.2 付加記号の分割
入力された文字について,付加記号部分の分割を行い,入力文字を基底文字と
付加記号へ分割する.分割処理の流れを以下に示す.
3.2.1 連結成分の抽出(ラベリング)
入力された文字を,ラベリング処理を用いて連結成分ごとに分解し,それぞれの
連結成分ごとに画素数を算出する. ラベリングについては,4 連結の処理を行う.
3.2.2 画素数による判別
付加記号は,基底文字の各成分よりも画素数が少ないため,画素数がしきい値以
下になった連結成分を付加記号候補とする.3.2.1, 3.2.2 の処理後の,各連結成分の
9
画像と画素数の例を図 5 に示す.例に示すように,今回与えたしきい値では半濁点
が付加記号の候補となる.
3.2.3 中心位置の確認
付加記号は,位置・大きさの正規化したひらがな文字全体に対し,中心を軸に 4
分割した右上の領域に存在し,かつ連結成分の画素数が小さな特徴がある(図 6).
それらの特徴から,連結成分の中心位置と画素数により,ひらがな文字画像か
ら付加記号を抽出し,基底文字と付加記号を分離する.
図5
図6
入力文字の各連結成分の画素数としきい値の一例
各連結成分の中心位置
10
3.3 付加記号候補の判別
3.2.2,3.2.3 より得られた付加記号候補から「濁点」「
, 半濁点」「
, 付加記号以外」
の判別を行う. 付加記号候補の判別処理のフローチャートを図 7 に示す.まず,
「半濁点の有無」においてユークリッド距離,マハラノビス距離を使用して半濁
点が存在するかを判別し,存在すれば結果が「半濁点」となり終了する.存在しな
かった場合,付加記号候補の各成分の数が 2 つ以上あれば「濁点」,1 つ以下であ
れば「付加記号以外」という結果となる.
本研究では「半濁点の有無」を確認する方法として,方向指数の差を用いる.方
向指数は,0 から 3 の計 4 方向から構成され,入力画像に対しそれぞれ方向指数ヒ
ストグラムを作成する(図 8).算出した各方向指数の画素数の合計から,それぞれ
ユークリッド距離とマハラノビス距離を算出し,半濁点の有無を判別する処理と
する.それぞれの距離については後述する.
3.3.1 ユークリッド距離とマハラノビス距離による判別
半濁点の有無を判別する処理において使用する 2 種類の距離について示す.
本研究では,4 方向の方向指数ヒストグラムから算出した 4 次元のユークリッド
距離とマハラノビス距離の他,0 と 2 方向の差と,1 と 3 の方向の差から算出した
2 次元のユークリッド距離とマハラノビス距離の計 4 種類の特徴量(図 10)から計
算し,相違度の小さいものを判別結果として,濁点,半濁点の分類精度を比較し,よ
り適当な特徴量を考察する.ユークリッド距離とマハラノビス距離の具体的な式
については 4 章で後述する.
3.3.2 輪郭線の本数による判別処理
半濁点の有無を判別する処理において,正規化前後の輪郭線の本数の変化によ
る条件を追加する.これは,半濁点に注目した場合,正規化前後で輪郭線の本数が
変化(増加)することを利用したものである.この処理を付加したフローチャート
を図 4 に示す。3.3.1 の処理を行う前にこの処理を行い,判別結果に改善が見られ
るかどうかの確認を行う.
11
付加記号候補
有
半濁点の有無の判別
無
2 つ以上
成分の数
1つ以下
半濁点
付加記号以外
図7
付加記号の候補画像の判別法
12
濁点
図8
入力文字画像からの方向指数ヒストグラム作成手順
図9 次元数の特徴を使用した半濁点の有無の判別法
13
3.4 正規化処理の改良
本研究では,従来研究までに使用していたプログラムの一部を改良し,より適
切な方向指数の算出に成功した.
従来,入力文字の位置,大きさの正規化をする際,原画像の注目点のみを用いた
処理行っていたが,本研究では,原画像の注目点とその 9 近傍の画素値について,
浮動小数点演算により平均化し,二値化した値を使用した.また,正規化後にもフ
ィルターをかけ,平滑化を行うことで,従来のプログラムよりもなめらかな画像
となる位置,大きさの正規化を実現させることが出来た.改良画像を図 10 に示す.
図 10 (b)に示した画像が改良画像であり,なめらかになっていることがわかる.
(a)注目点の濃度のみを用いた
(b)9 近傍の画素の濃度との
拡大結果
平均を用いた拡大結果
図10 拡大プログラムの改良画像
14
第4章
4.1
付加記号抽出実験
実験に使用した文字画像
本手法で提案した付加記号抽出法の有効性を調査するため,付加記号の抽出と
分類実験を行った.
実験に用いた画像は,被験者(大学生)34 名に対し,ひらがな文字 71 字種につい
て 10 画像/字種の全 24140 字の手書き文字画像である.また,付加記号の付く文字
のみに着目すれば,25 字種について 10 画像/字種の手書き文字画像を用い,全 8500
字で調査を行った.
また,本研究で使用した半濁点と濁点の入力画像と,抽出した付加記号画像,正
規化後の輪郭線画像の例を人物ごとにそれぞれ図 11,12 に示す.
15
表4
半濁点の入力画像,抽出画像,輪郭線画像
16
表5
濁点の入力画像,抽出画像,輪郭線画像
17
4.2 距離と次元数における比較
先述した輪郭線の 4 つの方向指数を使用した 4 次元のユークリッド距離,マハ
ラノビス距離と 0 方向と 2 方向,1 方向と 3 方向の方向指数の差を使用した 2 次
元のユークリッド距離,マハラノビス距離における濁点,半濁点の分類手法と分
類結果を示す.マハラノビス距離は,ユークリッド距離とは違い分布の広がりを
表す分散を考慮しているため,精度が高くなることが予想される.
また,4 次元空間に対して 2 次元空間は特徴量が少なくなるが,0 方向と 2 方向,1
方向と 3 方向の方向成分の差が濁点と半濁点において差異が出ると考え,精度の
向上が期待できると判断し,2 次元空間での分類を行った.
付加記号判別処理は,入力された記号(入力ベクトル)と濁点,半濁点との相違度を
求め,相違度の小さいものを判別結果とする(図 11).
図11
付加記号判別のイメージ
18
4.2.1 4 次元のユークリッド距離による分類
輪郭線の 0 方向から 3 方向までの計 4 つの方向指数から導出した 4 次元のユ
ークリッド距離を使用して濁点と半濁点の分類を行った.4 次元のユークリッド
距離は以下の式で表される.
2
2
2
2
d  N 0  N1  N 2  N 3
(4)
ここで,Ni はそれぞれ 0 方向から 3 方向までの方向指数を表している.
4 次元のユークリッド距離から導出した相違度を図 12 へ示す. 横軸は半濁点,
濁点の入力された記号の番号であり,縦軸に相違度を示した.半濁点,濁点それぞ
れの特徴空間との相違度を求め,より小さい値を示す結果を判別結果とする.
付加記号の分類結果は半濁点が 98.6%,濁点が 98.0%,付加記号全体として見る
と 98.1%となった(表 6).
4.2.2 2 次元のユークリッド距離による分類
輪郭線の 4 つの方向指数の内,0 方向と 2 方向の垂直成分と水平成分の差と,1
方向と 3 方向の斜め成分の差から導出した 2 次元のユークリッド距離を使用し
て濁点と半濁点の分類を行った.2 次元のユークリッド距離は以下の式で表され
る.
d
( N 0  N 2)  ( N 1 N 3)
2
2
(5)
4.2.1 と同様に,Ni はそれぞれ 0 方向から 3 方向の方向指数を表している.
2 次元のユークリッド距離から導出した相違度を図 13 へ示す. 4.2.1 と同様に,
横軸は半濁点,濁点の入力された記号の番号であり,縦軸に相違度を示し,相違度
の小さいものを判別結果とした.
付加記号の分類結果は半濁点が 97.6%,濁点が 98.0%,付加記号全体として見る
と 97.9%となった(表 7).
19
図12
表6
4 次元の方向指数から導出したユークリッド距離の相違度
4 次元ユークリッド距離における分類結果(%)
判別結果
半濁点(1700)
98.6
濁点(6800)
98.0
半濁点+濁点(8500)
98.1
20
図13
表7
2 次元の方向指数から導出したユークリッド距離の相違度
2 次元ユークリッド距離における分類結果(%)
判別結果
半濁点(1700)
97.6
濁点(6800)
98.0
半濁点+濁点(8500)
97.9
表1
21
4.2.3 4 次元のマハラノビス距離
輪郭線の 4 つの方向指数から導出した 4 次元のマハラノビス距離を使用して
濁点と半濁点の分類を行った.マハラノビス距離はデータの相関を考慮するため,
ユークリッド距離とは異なる.4 次元のマハラノビス距離は以下の式で表される.
( N i μi)
d
σ
2
3
i 0
(6)
i
ここで,Ni, 𝜇𝑖, σiはそれぞれ 0 から 3 方向の方向指数,方向指数の平均,方向指
数の分散を表している.
多変量解析では、4 次元のマハラノビス距離 D は
𝐷 = [𝑁 − 𝜇]𝑡 𝛴 −1 [𝑁 − 𝜇]
(7)
が用いられているが,本論文では,計算量を減らすために,各変数を独立変数と
して仮定し,(6)式を使用して計算している.
4 次元のマハラノビス距離から導出した相違度を図 14 へ示す. 4.2.1 と同様に,
横軸は半濁点,濁点の入力された記号の番号であり,縦軸に相違度を示し,相違度
の小さいものを判別結果とした.
付加記号の分類結果は半濁点が 98.5%,濁点が 98.0%,付加記号全体として見る
と 98.0%となった(表 8).
分散を考慮したにも関わらず,4 次元のユークリッド距離を使用した結果と比
較してもあまり精度の向上は見られなかったが,図 14 の入力記号(半濁点)からの
相違度,入力記号(濁点)からの相違度に着目すると,それぞれユークリッド距離で
算出したものよりも相違度の差が顕著となっていることから,有効性が伺える.
22
図14
表8
4 次元の方向指数から導出したマハラノビス距離の相違度
4 次元マハラノビス距離における分類結果(%)
判別結果
半濁点(1700)
98.5
濁点(6800)
98.0
半濁点+濁点(8500)
98.0
23
4.2.4 2 次元のマハラノビス距離
輪郭線の 4 つの方向指数の内,0 方向と 2 方向の垂直成分と水平成分の差と,1
方向と 3 方向の斜め成分の差から導出した 2 次元のマハラノビス距離を使用し
て濁点と半濁点の分類を行った.2 次元のマハラノビス距離は以下の式で表され
る.
{( N 0  N 2) μ( N 0  N 2) }
2
d 
2
σ( N 0  N 2)
{( N 1 N 3) μ( N 1 N 3) }
2

2
(7)
σ( N 0  N 2)
ここで, Ni, 𝜇(N𝑖 − 𝑁𝑖′), σ(N𝑖 − 𝑁𝑖′),はそれぞれ方向指数の差,方向指数の差
の平均,方向指数の差の分散を表している.
2 次元のマハラノビス距離から導出した相違度を図 17 へ示す.4.2.1 と同様に,
横軸は半濁点,濁点の入力された記号の番号であり,縦軸に相違度を示し,相違度
の小さいものを判別結果とした.
付加記号の分類結果は半濁点が 83.3%,濁点が 98.0%,付加記号全体として見る
と 95.0%となり,半濁点の判別結果が他の 3 種類の結果よりも低くなった(表 9).
また,図 15 の入力記号(半濁点)からの相違度の差が小さくなっていることによ
り半濁点の分類精度が低くなったと考えられる.
24
図15
2 次元の方向指数から導出したマハラノビス距離の相違度
表9
2 次元マハラノビス距離における分類結果(%)
判別結果
半濁点(1700)
83.3
濁点(6800)
98.0
半濁点+濁点(8500)
95.0
25
4.2.5 4 種類の距離における分類結果のまとめ
本研究で導出した 4 種類の距離の分類結果の比較を表 10 へ,ユークリッド距
離とマハラノビス距離の実際に求めた相違度の例を表 11,12 へ示す.例として,表
11 において,相違度の小さいものを選択するため,入力された「ぎ」という文字は
4 次元ユークリッド距離においても 2 次元ユークリッド距離においても「濁点」
という判別結果となる.
表10
4 次元と 2 次元のユークリッド距離と
マハラノビス距離における分類結果(%)
使用した距離
ユークリッド距離
マハラノビス距離
次元数
4 次元
2 次元
4 次元
2 次元
半濁点(1700)
98.6
97.7
98.5
83.3
濁点(6800)
98.0
97.9
98.0
97.9
半濁点+濁点(8500)
98.1
97.9
98.0
95.0
26
表11
4 次元,2 次元のユークリッド距離の濁点,半濁点との相違度
表12
4 次元,2 次元のマハラノビス距離の濁点,半濁点との相違度
27
4.3 付加記号以外の分類
表 10 で示した分類結果に加え,濁点,半濁点以外の分類結果を加えたものを表
13,図 16 に示す.
また、半濁点,濁点の分類精度の高い 4 次元のマハラノビス距離の結果と,半濁
点,濁点以外の分類精度の高い 2 次元のマハラノビス距離の結果について,それぞ
れコンフュージョンマトリクスを表 14,15 に示す.コンフュージョンマトリクス
へは,半濁点,濁点とそれ以外の 3 種類における入力,出力結果数と精度を示して
いる.
表13
全ての文字に対する 4 次元と 2 次元のユークリッド距離と
マハラノビス距離における分類結果(%)
使用した距離
ユークリッド距離
マハラノビス距離
次元数
4 次元
2 次元
4 次元
2 次元
半濁点(1600)
98.6
97.7
98.5
83.3
濁点(6800)
98.0
97.9
98.0
97.9
半濁点,濁点以外(15460)
90.1
84.3
91.5
95.2
全て(24140)
93.4
89.2
93.8
95.1
図16
付加記号分類結果
28
表14
4 次元マハラノビス距離における判別結果の
コンフュージョンマトリクス
出力結果
半濁点
濁点
濁点,半濁
点以外
分類率(%)
半濁点(1700)
1616
0
84
98.6
濁点(6800)
8
6663
129
98.0
半濁点,濁点以外(15460)
2760
6671
14496
91.5
入力(字)
表15
2 次元マハラノビス距離における判別結果の
コンフュージョンマトリクス
出力結果
半濁点
濁点
濁点,半濁
点以外
分類率(%)
半濁点(1700)
1426
0
274
83.3
濁点(6800)
20
6663
117
98.0
半濁点,濁点以外(15460)
629
8
15003
95.2
入力(字)
29
4.4 輪郭線の本数による比較の検証
半濁点についての正規化前後の輪郭線数に着目すると,幅 1 ビットの線が,
数ビットの幅の線に拡大され,輪郭線の本数が 1 本から 2 本へ増加している
ことがわかる(表 16)また,濁点について同様に着目すると,正規化前後では輪
郭線の本数の増加は見られない.そこで,本研究で示した 4 次元,2 次元のユー
クリッド距離とマハラノビス距離での分類処理を行う前に,半濁点の特徴と
して考えられる正規化前後での輪郭線の本数の変化を考慮した処理フロー
を付加することで,処理結果に改善が見られるのかを確認した.輪郭線処理を
付加した処理フローを図 4,輪郭線処理を付加した処理の結果を表 17,図 17 へ
示す.
表16
正規化前後での濁点,半濁点の輪郭線数の変化
また,4.3 と同様に付加記号以外の分類精度を加えた結果を表 へ,4 次元マハラ
ノビス距離と 2 次元マハラノビス距離の分類結果のコンフュージョンマトリク
スを表 18,19 に示す.
付加記号の判別結果のみに着目すると,4 次元のマハラノビス距離を使用した
結果が最大で 98.2%の精度となったが,付加記号以外の文字を含めた全 24140 字
の結果に着目すると,2 次元のマハラノビス距離を使用した結果が最大で 96.3%
となった.
30
表17
輪郭線の本数の変化を考慮した処理による分類結果(%)
使用した距離
ユークリッド距離
マハラノビス距離
次元数
4 次元
2 次元
4 次元
2 次元
半濁点(1600)
98.9
98.8
99.0
95.0
濁点(6800)
98.0
98.0
98.0
98.0
半濁点,濁点以外(15460)
91.0
84.3
91.5
95.8
全て(24140)
93.4
89.2
93.9
96.3
図17
輪郭線数の本数の変化を考慮した付加記号分類結果
31
表18
輪郭線の本数変化を考慮した 4 次元マハラノビス距離の
判別結果のコンフュージョンマトリクス
出力結果
半濁点
濁点
濁点,半濁
点以外
分類率(%)
半濁点(1700)
1665
0
35
99.0
濁点(6800)
8
6663
129
98.0
半濁点,濁点以外(15460)
1139
5
14496
91.5
入力(字)
表19
輪郭線の本数変化を考慮した 2 次元マハラノビス距離の
判別結果のコンフュージョンマトリクス
出力結果
半濁点
濁点
濁点,半濁
点以外
分類率(%)
半濁点(1700)
1614
0
86
95.0
濁点(6800)
20
6663
117
98.0
半濁点,濁点以外(15460)
645
5
14990
95.8
入力(字)
32
第5章
5.1
考察
誤読の原因分析
本研究では被験者 34 名の付加記号の付く文字 8500 字に対して,4 次元と 2 次
元方向から導出したユークリッド距離とマハラノビス距離から付加記号の分類
実験を行い,認識率の変化を調査した,付加記号の認識率は輪郭線の本数の変化
を考慮し,かつ 4 次元のマハラノビス距離を使用した場合が最大で 8,344 字であ
り,認識率は 98.2%となった.また,付加記号以外も字種全てを含む全 24140 字に対
しての分類については,輪郭線の本数の変化を考慮し,かつ 2 次元のマハラノビス
距離を使用した場合が最大で 23267 字であり,認識率は 96.3%となった.
認識失敗の主な原因として,方向成分のみに起因しているだけでなく,付加記
号抽出の段階で理想的な付加記号候補の抽出に失敗している字種が存在し,分類
率を下げる要因となっている.このような字種の場合,本研究で提案した手法で
の分類では難しいため,付加記号の抽出処理の変更を行うか,付加記号の分類処
理の改善が必要であると考えられる.
さらに,半濁点字種 1700 字,濁点字種 6800 字の中で,認識結果に関わらず,付加
記号抽出に失敗し,抽出結果が白紙となっている半濁点と濁点がそれぞれ 10 字,8
字存在する.これらの割合としてはそれぞれ 0.5%,0.01%であるため,認識精度へ
の影響は低いが,こちらも改善する必要がある.
また,本研究での付加記号出成功例と失敗例を表 20 に示す.付加記号の抽出に
失敗した例として,濁点同士が重なっていたことや,濁点と基底文字に接触があ
ったことから,抽出に失敗したと考えられる.
基底文字と付加記号が接触している場合の認識失敗の対策への改善案として,
輪郭線の方向が急激に変化する折点などで分離する方法、二本の線を分離する
方法などを考察する必要がある。
33
表20
5.2
付加記号の抽出例と判別例
結果の比較
本研究では,4 つの方向指数から算出した 4 次元ベクトルを使用した距離と,0
と 2,1 と 3 方向の差から算出した 2 次元ベクトルを使用した距離の 計 4 種の結
果を比較した.
次元数による比較の結果,付加記号分類結果においては,ユークリッド距離,マ
ハラノビス距離どちらにおいても 4 次元ベクトルから求めた距離を使用した分
類結果の精度が高かった.これは,次元数を多く取ることでより精密な特徴空間
を作り出すことが出来たためであると考えられる.
分類結果より,4 次元ベクトルを使用した場合のユークリッド距離,マハラノビ
ス距離の結果に差異が見られなかった.本来,分布の広がりである分散を使用す
るマハラノビス距離の方が高い精度となることが予想されるが,今回使用したサ
ンプルは濁点の 2 方向と 3 方向の方向指数の分散が大きくなったことにより,精
度の向上が見られなかったと考えられる.
また,表 13,17 と図 16,17 より,2 次元マハラノビス距離において, 前述した 3 種
類の分類結果と比較すると半濁点の認識率が低いことがわかる.前述したように,
今回使用したサンプルでは濁点の 2 方向と 3 方向の方向指数の分散が大きくな
った影響で 0-2 方向と 1-3 方向の差の値の分散も大きくなり,表 12 に示すように
入力ベクトル(半濁点)の場合の半濁点,濁点との相違度の差が小さくなり,2 次元
マハラノビス距離の判別において分類精度が低くなったと考えられる.
34
また,方向指数について,0 方向と 2 方向という水平成分,垂直成分の値に対して
1 方向,3 方向の斜め成分の値が小さくなっている.これは正規化の手法について,
従来文字認識で使われていたものを流用しているため,文字が拡大されたことが
原因で垂直成分と水平成分の大きな正規化が行われたと考えられる.しかし,今
回認識処理として考えた輪郭線の本数の変化による半濁点の処理を行うために
は最も適切な正規化の大きさであると判断したため,正規化の大きさは変化させ
ず処理を行った.
5.3
濁点の分類結果
分類精度を比較すると,濁点の判別結果に差異がないことがわかる.これは,今
回使用した距離で分類しているのは 3 章で示した「半濁点の有無」の判別であ
り,濁点の判別は「成分の数」を使用して行っているためである.本研究で抽出し
た濁点 6800 字の内,成分の数が 2 つ以上抽出出来ている濁点の数は 6663 字種で
あり,全体の 98.1%であった.「半濁点の有無」における処理から外れた付加記号
候補は成分の数で比較されることから濁点の処理結果についてはほぼ理論通り
の結果となったと考えられる.
5.4
付加記号以外の分類
本研究では,付加記号候補を 3 種類へ分類する.前章までには濁点,半濁点であ
る「付加記号」の分類精度について示したが,実際には「付加記号以外」という
結果を含めた 3 値分類を行う必要がある.それらを考慮した比較の結果,輪郭線の
本数の変化を考慮し,かつ 2 次元マハラノビス距離を使用した結果が最も精度が
高い 96.3%となった.この結果では,半濁点の分類精度が他の 3 種の結果よりも低
いが,他の 3 種は「半濁点ではない」入力記号も「半濁点である」という判別を
しているためであり,結果として比較すると,2 次元のマハラノビス距離を使用し
た場合が全体として最もバランスの良い結果となったといえる.
5.5
輪郭線の本数の変化を考慮した判別との比較
本研究では,付加記号の判別を行う前に輪郭線の本数の変化を考慮した処理を
行うことを提案した.今回行った正規化は従来研究で使用されている文字認識用
のものを使用しており,本来入力文字と同じくらいを想定した大きさに設定され
ているものを流用したために,付加記号のみへの正規化と考えた場合,拡大処理
をしていることになる.メリットとしては半濁点について,本研究で使用した輪
郭線数の本数に変化が見られることが挙げられるが,デメリットとして,5.3 章で
示したように方向指数の分散が理想的な値ではなく,垂直成分,水平成分が偏っ
た値となることが挙げられる.しかし,これは拡大処理を行っているためだけが
原因ではなく,従来使用されていた正規化のプログラム自体に何らかの原因があ
35
ると考えられるため,方向成分が理想的な値として算出出来るプログラムの改良
もしくは方向指数へ重み付けを行う必要があると考えられる.
5.6
濁点の方向指数の分散の偏り
表 21 より,本研究で導出した濁点の 0 方向から 3 方向までの方向指数の内,2 方
向(垂直成分)と 3 方向(左斜め成分)の値の分散が他の値と比較して大きくなって
いることがわかる.本研究の中で,2 次元のマハラノビス距離においての付加記号
の分類を行っている際に使用するのは表 21 の「0-2 方向」と「1-3 方向」の 2 つ
の値であり,マハラノビス距離は分散の値を大きく受けるため,2 次元のマハラノ
ビス距離においての半濁点の判別結果が 83.3%と低くなったと考えられる.
また,分散の大きくなってしまう原因として,方向指数を計算する際に本研究
で使用した位置,大きさの正規化が従来文字認識を行う際に使用していた手法を
流用しており,[72*72]の正規化を行っているためであると考えられる.
本研究で対象となった文字の大きさはおおよそ[152*154]程度の文字が多数であ
り,それらの文字から抽出した付加記号の大きさは小さいにもかかわらず,正規
化として拡大処理を行っているために,輪郭線画像が表 1,2 で示したような元画
像よりも大きな画像となっている.また,正規化プログラムにおける拡大処理に
何らかの不備が存在したため,綺麗に拡大処理が行われず 0 方向と 2 方向の垂直
成分と水平成分の値が大きくなってしまうと考えられる.これは,表 1,2 や表 21 の
実際の方向指数からも見て取れ,特に半濁点に顕著に表れていることがわかる.
以下,これらの問題を改善するために試みた手法を示す.
表21
半濁点と濁点の方向指数の平均と分散
36
5.6.1.
適切な大きさの正規化の模索
濁点の方向指数の分散が大きくなる原因として,原画像に対して位置,大きさの
正規化(拡大)後の画像が大きすぎることが考えられる.そこで,従来行っていた位
置,大きさの正規化である[72*72]を変化させ,分散の小さくなる適切な大きさの
正規化を考察した.正規化の大きさを[72*72]から[22*22]まで変化させた際の付
加記号の方向指数を分散の大きさを表 22,23 へ示す.
表22
正規化の大きさを 72 から 52 まで変化させた場合の
方向指数の平均と分散
表23
正規化の大きさを 42 から 22 まで変化させた場合の
方向指数の平均と分散
37
表 22,23 より,正規化の大きさを[32*32]もしくは[22*22]へ変化させた場合の
分散が[72*72]よりも小さくなっていることがわかる.また,[22*22]まで小さくす
ると濁点の方向指数の値が極端に小さくなってしまうことで判別結果に支障を
きたすと判断したため,正規化の大きさを[32*32]へ固定した状態で追加実験を行
った.[32*32]の場合の判別結果を表 24 へ示す.ただし,正規化の大きさを変化させ
たことにより,4.4 章で示した「正規化前後で輪郭線の本数が変化する」特徴をも
つ半濁点が少なくなったが,それらを考慮した分類結果を示した.
表24
正規化の大きさを 32 へ変化させた場合の分類結果(%)
使用した距離
ユークリッド距離
マハラノビス距離
次元数
4 次元
2 次元
4 次元
2 次元
半濁点(1600)
97.2
94.9
94.5
88.5
濁点(6800)
98.0
98.0
98.0
98.0
半濁点,濁点以外(15460)
82.1
83.9
96.4
95.7
全て(24140)
87.6
88.7
96.7
95.6
表 24 より,正規化の大きさを変化させる前の結果である表 17 と比較すると,分
類精度に大きな低下が見られた.これは,濁点が 2 つ以上の点であるにも関わらず,
本研究での正規化では濁点 2 つをまとめて正規化していたことで,半濁点よりも
正規化後の大きさが小さくなり方向指数とそれらの差が適切に算出できなかっ
たことが原因であると考えられる.
また,本研究で使用した輪郭線の方向指数にうまく重み付けを行えなかったこ
とで方向指数や方向指数の差が適当な値として算出できなかったと考えられる
ため,適当な重み付けの計算,もしくは加重方向指数を使用することで改善を行
う必要がある.
38
5.7
日本語以外の付加記号と本研究の有意性
日本語における濁点,半濁点記号のような付加記号は,ドイツ語,フランス語,
アラビア語などの日本語以外でも類似した記号が使用されている. ペルシャ語
やアラビア語等の手書き認識に関する研究[17,18,19]はすでに行われているが,
それらの研究では本研究での付加記号に当てはまる”diacritical marks”(ド
ットマーク)(図 18)の存在のみを判別して認識を行っており,本研究のような付
加記号の形状についての考察は行われていない.日本語の濁点や半濁点は、ドッ
トではなく,短い斜め 2 本の線や丸(円形)であり,記載する位置も異なるため,海
外の研究対象とは異なり,独自のアプローチが必要であると考えている.そこで,
本研究では従来情報処理研究室で研究している手書きひらがな文字認識のアル
ゴリズムを発展させた新しい認識手法を提案した.
また,単語認識の段階で濁点,半濁点を含む文字の間違い(ぱ→ば やその逆
等)においては、単語の使用頻度が高い場合には、言語モデルによる後処理によ
り修正することが可能であるが,助詞として使用された場合の「か」と「が」の
違いや,擬態語,擬音語,人名や固有名詞など言語モデルによる修正が困難な間
違いは多数存在する.また,「パグ」と「バグ」のような単語辞書に両方存在する
文字もあり,言語モデルによって認識結果が正しく修正されるとは限らない.そ
こで,認識段階での高精度認知の可能性を追求していくことを一つの目標とし,
本研究の手法を提案した.
図18 アラビア文字の一例
39
第6章
まとめと今後の課題
6.1 実験結果のまとめ
本研究では,従来研究で正読率の低下の要因となっていた濁点や半濁点を含む
字種に注目し, 付加記号(濁点と半濁点)を分離し,分離した基底文字と付加記号
を別々に識別する方法を検討した.付加記号の筆記位置による抽出法と,輪郭線
の方向指数ヒストグラムを使用したユークリッド距離とマハラノビス距離計 4
種類の判別方法を提案し,濁点と半濁点のみの分類精度として 4 次元のマハラノ
ビス距離を使用し,かつ輪郭線の本数の変化を考慮した判別方法により 98.2%の
分類精度を得た.また,付加記号以外等の字種全てを含む全 24140 字に対しての分
類については,2 次元のマハラノビス距離を使用し,かつ輪郭線の本数の変化を考
慮した判別方法により,96.3%の分類精度を得た.
6.2 従来の文字認識手法との合成
今後の課題として,本研究での付加記号検出結果と従来の認識辞書との併用を
兼ねて,付加記号の付く字種の平均正読率 86.8%を全字種の平均である 94.3%程
度にまで向上させることを目標とし,全体としての正読率の向上を目指す.本研
究で付加記号が検出された場合,分割処理によって分離された基底文字について
文字認識を行った後,付加記号と合成することで,文字認識結果とする.文字認識
については,付加記号の検出結果にかかわらず,熊澤らの研究で利用した文字認
識手法[4]を使用する.また,濁点が付いても半濁点の付加しない,か行やさ行など
のひらがなが存在するため,本体文字の認識結果に対応した適切な付加記号の選
択を行うプログラムを作成する必要がある.
本研究では,濁点や半濁点を含む字種に注目し,基底文字と付加記号を分離し,
濁点,半濁点の判別法を使用した文字認識法を提案し,98.2%の認識率を確認した.
今後の課題として,
(1)付加記号(濁点,半濁点)の基底文字との分離率の向上
(2) 濁点と半濁点を判別する輪郭線の円形度や対称性などの別の特徴量を付
加した高精度化法がある.
40
謝辞
本研究の遂行及び修士論文の作成にあたり,日ごろ丁寧なご指導とご助言を
頂きました本学大学院工学研究科電気電子工学専攻の鶴岡信治教授,ならびに
高瀬治彦准教授,川中普晴助教,そして本学の三宅康二名誉教授に感謝いたし
ます.また,貴重な時間を割いて論文を査読して頂いた本学工学研究科情報工
学専攻の大山航助教に深く感謝いたします.最後に,日ごろお世話になった本
学情報処理研究室の皆様に感謝いたします.
41
参考文献
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
平光功明,三ツ谷祐介,渡辺哲雄 : 郵便区分機の高速取り出し技術, 東芝レビ
ュー vol.63 No.1, pp.7-70, (2008)
Daisuke Yoshida, Shinji Tsuruoka, Hiroharu Kawanaka and Tsuyoshi Shinogi :
Keywords Recognition of Hand written Character String on Whiteboard Using Word
Dictionary for e-Learning, Proc. of 11th International Conference on Hybrid
Information Technology (ICHIT), pp.140-145, (2006)
奥山翔平, :講義映像の板書画像を対象としたキーワード抽出と能動学習へ
の利用,平成 25 年度 三重大学大学院 工学研究科 電気電子工学専攻 修士論
文, (2014)
Shinji Tsuruoka, Masahiro Hattori, Yasuji Miyake, Haruhiko Takase, Hiroharu
Kawanaka: Usefulness of Only One User’s Handwritten character on Offline
Personal Character Recognition,(Xiaqing Ding, Advances in Character
Recognition,) INTECH, pp.211-232, (2012)
国立研究開発法人産業技術総合研究所,手書き JIS 第1水準漢字データベー
ス ELT9B: http://projects.itri.aist.go.jp/etlcdb/etln/etl9/etl9.htm
鶴岡信治: 森田裕之,木村文隆,三宅康二:筆記者に対して適応機能をもった
自由手書き文字認識,電子情報通信学会論文誌 D,vol.j70-D-Ⅱ,No.10,pp.19531960(1987)
服部正寛: 少量の学習文字から抽出された筆記者の書き癖を用いる手書き
ひらがな文字認識,平成 21 年度 三重大学大学院 工学研究科 電気電子工学
専攻 修士論文(2009)
木村拓也: 複数人の類似筆記者の文字特徴を利用したひらがな文字認識,平
成 23 年度 三重大学大学院 地域イノベーション学研究科 地域イノベーシ
ョン学専攻 修士論文(2011)
熊澤健人: 複数字種より選んだ類似筆記者の利用によるひらがな文字認識,
平成 24 年度 三重大学工学部電気電子工学専攻 卒業論文(2013)
鶴岡信治,栗田昌徳,原田智夫,木村文隆,三宅康二: 加重方向指数ヒストグラ
ム法による手書き漢字・ひらがな認識,電子情報通信学会論文 D,vol.J70D,No.7,pp.1390-1397,(1987)
栗田昌徳,鶴岡信治、横井茂樹,三宅康二: 加重方向指数ヒストグラムと擬似
マハラノビス距離を用いた手書き漢字・ひらがな認識、 電子情報通信学会
技術報告, PRL-82-79, pp.105-112, (1983)
原田智夫, 鶴岡信治, 木村文隆, 三宅康二: 加重方向ヒストグラムと擬似ベ
イズ識別法を用いた手書き漢字・ひらがな認識, 情報処理学会全国大会講演
集, VoL.27-2, pp.889-890, (1983)
堤田,城戸,太田,木村,岩田: 文字認識の新たな展開に向けて―郵便番号
データにみる手書き数字認識の現状―,電子情報通信学会技術報告, パター
ン認識とメディア理解研究会, PRMU96-190,pp.73-78,(1997-03)
42
[14]
[15]
[16]
[17]
[18]
Mohamed Cheriet, Nawwaf Kharma, Cheng-Lin Liu, Ching Y.Suen: Character
Recognition Systems A Guide for Students and Practitioners, WILEYINTERSCIENCE, pp.292-301, (2007)
Shinji Tsuruoka, Hiroki Morita, Fumitaka Kimura, Yasuji Miyake: Handwritten
Character Recognition Adaptable to the Writer, Proc. of IAPR Workshop on
Computer Vision(CV) -Special Hardware and Industrial Applications-, pp.179181(1988)
Alireza Alaei, P.Nagabhushan, Umapada Pal : A New Two-stage Scheme for the
Recognition of Persian Handwritten characters, Proc. of Frontiers in Handwriting
Recognition (ICFHR), IEEE, pp120-135, (2010)
Liana M. Lorigo, Venu Govindaraju: "Offline Arabic Handwriting Recognition: A
Survey", IEEE Transactions on Pattern Analysis & Machine Intelligence, vol.28, no.
5, pp. 712-724, May 2006, doi:10.1109/TPAMI.2006.102
Dr.Firoj Parwej,: An Empirical Evaluation of Off-line Arabic Handwriting And
Printed Characters Recognition System, IJCSI International Journal of Computer
Science Issues, Vol. 9, Issue 6, No 1,pp.29-35, November 2012
[19] Muhammad Imran Razzak , Syed Afaq Husain, Abdulrahman A. Mirza, and Abdel
Bela¨ıd,: Fuzzy Based Preprocessing Using Fusion Of Online and Offline Trait for
Online Urdu Script Based Languages character Recognition, ICIC International c
2012 ISSN 1349-4198, pp.3149-3161, May 2012
43
論文目録
[1]
藤井功武, 川中普晴, 高瀬治彦, 八神寿徳, 鶴岡信治, 筆記者に適応する
手書きひらがな文字認識のための濁点,半濁点の抽出と判別, パターン認識,
メディア理解研究会(PRMU2015), pp167-171, 2015
[2]
Isamu Fujii, Hiroharu Kawanaka, Haruhiko Takase, Hisanori Yagami, and Shinji
Tsuruoka, Segmentation and Classification of the Added Marks ( Dakuten: ゛and
Han-dakuten: ゜) for Personal Hiragana Character Recognition, Proc of the Sixth
International Workshop on the Regional Innovation Studies (IWRIS2014), pp71-74,
2014
[3]
Isamu Fujii, Hiroharu Kawanaka, Haruhiko Takase, Hisanori Yagami, and Shinji
Tsuruoka, Segmentation and Classification of the Added Marks for Handwritten
Hiragana Character Recognition, Proc. of the 5th Intl. Symposium for Sustainability
by Engineering at Mie Univ. (Research Area C) (IS2EMU2015-C), A-9, 2015
44
Fly UP