...

文字画像の修復による低解像度印刷漢字の認識

by user

on
Category: Documents
19

views

Report

Comments

Transcript

文字画像の修復による低解像度印刷漢字の認識
NAOSITE: Nagasaki University's Academic Output SITE
Title
文字画像の修復による低解像度印刷漢字の認識
Author(s)
胡, 彦; 松山, 繁史; 松田, 和生
Citation
長崎大学工学部研究報告 Vol.32(59) p.79-84, 2002
Issue Date
2002-07
URL
http://hdl.handle.net/10069/5214
Right
This document is downloaded at: 2017-03-30T18:22:22Z
http://naosite.lb.nagasaki-u.ac.jp
長崎大学工学部研 究報告
第3
2巻
第59号
平成 1
4年 7月
79
文字画像 の修復 によ る低解 像度 印刷漢字 の認識
彦*・松 山
中村
胡
繁史 **・松 田
千秋***・宮原
和生*
末治*
Lo
wRe
s
o
l
ut
i
o
nKa
n
j
iPr
i
n
t
e
dCha
r
a
c
t
e
rRe
c
og
nl
t
l
On
by Re
s
t
o
r
a
t
i
o
nofCha
r
a
c
t
e
rI
ma
ge
b
y
Ya
nHU*
,S
h
i
g
e
f
u
miMATS
UYAMA*
*
, Ka
z
u
oMATS
UDA*
,S
u
e
h
a
u MI
r
YAHARA*
Ch
i
a
k
iNAKAMURA*
*
*
Ar
es
t
or
a
t
i
onme
t
hodi
spr
es
ent
e
df
orl
owr
es
ol
ut
i
onpr
int
e
dka
n
j
ic
ha
ra
c
t
e
rr
e
c
ognl
t
1
0n・Fi
r
s
t
,c
ha
r
a
c
t
e
ri
ma
gesa
r
e
c
onve
r
t
e
di
nt
obi
na
r
yc
ha
r
a
c
t
erpa
t
t
e
r
nsa
f
t
e
re
xpa
ndi
nga
ndbl
umng.Ne
xt
,t
hebi
na
r
yc
ha
r
a
c
t
e
rpa
t
t
e
msa
remodi
f
i
e
d
byt
hes
ys
t
e
m us
l
ngr
idgepol
nta
ndr
a
vi
neone・Thef
e
a
t
ur
eve
c
t
or
soft
hemodi
f
i
e
dc
ha
r
a
c
t
e
rpa
t
t
e
mswhi
c
hi
nc
l
ude
t
hei
nf
or
ma
t
i
onofs
pa
t
i
a
ls
t
uc
r
t
ur
ea
r
ee
xt
r
a
c
t
e
dbyphr
a
s
ef
e
a
t
ur
edi
s
t
ibut
r
i
onme
t
hoda
ndt
he
ya
r
ef
e
di
na
nc
l
as
s
i
f
i
e
r
.
I
ti
sve
if
r
i
e
dbye
xpe
iment
r
sus
l
ngt
heda
t
a
bas
eETL2t
ha
tpr
opos
e
dme
t
hodi
mpr
ove
dr
e
c
ognl
t
1
0na
c
c
ur
a
c
yf
r
om 89.
1
%
t
o99.
4%.
1. は じめに
デ ィジ タル カメラや デ ィジ タル ビデ オな どの普及 に
ル タを用 いた画素 間の補 間 と凸判定 に よ り品質の よい
文字パ ター ンを得 る 2値化法4
'
な どが提 案 されて きた.
伴 い, カメラ画像 か らの文字認識 の要求が高 まってい
これ らの手法 は低解像度 の画像 を修復 し,読 みやす い
る川2̀
'
. しか しなが ら, 現 在 実 用 化 され て い るOCR
文字パ ター ンを得 る方法 と して一定 の効果 を上 げてい
(
opt
i
c
a
lCha
r
a
c
t
e
rRea
de
r
) は , ス キ ャナか ら取 り込
るが,汎用性 や認識精度 の点 で は十分 であ る と言 えな
んだ高解像 度 の文字 画像 を読取対 象 と してい るため,
い.
既存 の認識技術 をその まま適用す る こ とは困難 と思 わ
本稿 では, デ ィジ タル カメラやデ ィジ タル ビデ オ画
れ る.その主 な原 因 は, よ り多 くの情報 を読 み取 ろ う
像 か らの文字認識 を目的 と し,低解像度文字画像 の修
と して, カメラか らの入力画像 の視野 を広 く取 ろ うと
復 を多段 に行 うこ とに よ り文字画像 の画 質 を改善 し,
す るため,文字部分が低解像 度 の画像 になるこ とに起
それ を用 いて高精度 に文字認識す る方法 につ いて提案
因す る もの と考 え られ る.低解像度 の画像 は,文字 パ
す る.提案手法では,低解像度 の入力文字画像 に対 し,
ター ンの文字縁 に段差 が生 じた り,細 か な部分 がつぶ
文字 パ ター ンの拡大 とぼか しの処理 を行 い, さらに 2
れ た り,かす れた りす るため, これ らの画像 をその ま
倍 化 の際 に尾根 点 ・谷点 の検 出 に よ り文字パ ター ンに
ま使 って認識 させ る と,高 い認識精度 を実現 で きない
補 正 を施 し5̀
'
,修復 した文字パ ター ンに対 して位 相特
こ とが多 い.
徴 分布法6̀
'に よ り文字線縁 の局所 的 な傾斜特徴 に位 置
これ らの問題 に対 して, これ まで に文字パ ター ンを
情報 を付与 して特徴 ベ ク トル を形成 し,識別 を行 う.
わず か に移動 させ , それ らの差分 を とる こ とで文字線
実験 デ ー タ と して,産総研 (
旧 電総研 ) が公 開 し
縁 の傾 きを精度 よ く検 出す る移動差分法 3̀
や ,線形 フ イ
'を擬 似 的
て い る多債 の印刷 漢字 デ ー タベ ー スETL27̀
4年 4月 1
9日受理
平成 1
*大学 院生産科学研 究科 (
Gr
a
dua
t
eSc
hoolorSci
enc
ea
ndTe
c
hnol
ogy)
**富士 ソフ トABC(
秩) (
Fu
j
i
s
of
tABC I
nc.
)
***教育学部 (
Fa
c
ul
t
yofEduc
a
t
i
on)
8
0
胡
彦 ・松 山 紫史 ・松 田 和生 ・中村
千秋 ・宮原
末治
に解像度 を落 として 1
6×1
6画素の低解像度文字 デー タ
として使用 した.以下 , 2章では修復手法 , 3章では
特徴抽 出 と識別 ,4章では評価実験 と考察 について報
告す る.
il
i d
(
a)
2.修復手法
カメラな どで入力 された画像 は一般 に濃淡画像であ
(
b)
原画像
(
C)
拡大 した画像
ぼか し処理後
図 2 文字パ ター ンの拡大 とぼか し処理
り,文字認識ではそれ を 2倍化 して用いる.2億化処
理 は,各画素の濃度値が予め定め られた しきい値や,
3× 3の フィル タ (
m- 3) をかけた場合 を示す.す
自動的に求め られた しきい値 との大小関係 を比較 して
a)は,拡大の処理 によ り
なわち 2× 2画素の原画像 (
行 われる. しか し, これ らの方法 を低解像度 の文字画
像 に対 して適用す る と,つぶれやかすれ,ジャギーな
6×6画素 の画像 (
b)になる.次 に拡大 した画像 の全
ての画素 に 3×3のマス クをかけ,そのマス ク内で濃
どが発生す る.そ こで本箱 では,2億化処理の前 に文
度値の平均 をとって中央画素の濃度値 を求める.処理
字 の拡大 とぼか し処理 を行い ,2倍化の際 に尾根点 ・
C)に示す.
結果 を図 2の (
谷点の検 出 と補正 によって ,2億化 される文字パ ター
以上の処理で原画像の濃度値 を保存 し,かつジャギー
ンに修復 を行 う方法 を提案する.本手法の処理の流れ
の除去 と同時 に原画像 よ り大 きさが縦横 3倍 になるほ
を図 1に示 し,画質改善のための修復 の処理 を破線 の
か しパ ター ンが生成 される.入力 された原画像が 1
6×
枠 内に表す.
1
6画素 な らば,3倍 に拡大 してぼか しをかけた文字パ
ター ンは48×48画素の大 きさになる.原画像 を大津の
手法 を用 いて 2倍化 した場合の一例 を図 3(
a)に,文
字パ ター ンを拡大 し (n=3), ぼか し処理 (m=3)
b)に示す.
を施 して 2億化 した文字パ ター ンを図 3(
l
r
q
原パ ター ン
憧
拡大 とほか し処理 した
文字パ ター ン
図 3 拡大 してほか し処理 を施 した後
2倍化 した文字パ ター ン
2
.
2 尾根点 ・谷点 による補正
かすれは文字線 の漉度 と同 じ濃度 になるはずの濃度
図 1 文字認識処理 における修復処理の手順
が本来の値 よ りも低 くなる事 によ り生 じ,つぶれは文
字線の間隙部分でかすれ と逆の現象が生 じたために起
2.
1 文字の拡大 とばか し処理 による補完
きる もの と考 えることがで きる. この ように文字線 に
ジャギーは,文字パ ター ンを少 ない画素で表現 しよ
つぶれやかすれが生 じた場合で も文字線部分では周囲
うとしたため に生 じた ものである.そこで文字パ ター
と比べ て濃度が高 くな り,文字線の間隙部分では周囲
ンの拡大 と,ぼか し処理 とを同時 に行い,見掛 け上の
より低 くなることか ら,文字画像の濃度値の凹凸 を調
解像度 を上げることで輪郭部の凹凸を除去 し,原画像
べ ることによ り,文字線や文字線 間隔部分 をその周辺
の文字縁 を滑 らかにす る. この処理 により擬似 的 に高
部分 と区別することがで きる.そ こで,本稿では大津
解像度文字画像 を得 ることがで きる.
の方法で求めた しきい値で 2倍化 を行 うと同時 に,各
処理では, まず入力 された濃淡画像の各画素 を mx
画素の 8近傍 の濃度 を調べ,濃度億の高い方 を尾根点
n画素 に拡大 し,次 にmXmの フィル タでほか し処理
と,低 い方 を谷点 として検 出 し,その検 出結果 に基づ
を行 う.図 2に例 として,3倍 に拡大 して (
n- 3),
いて 2億化の結果 に対 し補正 を行 う.
文字画像 の修復 による低解像度印刷漢字の認識
81
3.特徴抽 出 と識別
2.
2.
1 尾根点 ・谷点の積 出
尾根点,谷点 の抽 出 には図 4 に示す ような 3× 3画
本手法の評価のため に,低解像度文字パ ター ンを識
素 のマ ス クを用 い る. 中心 点Ⅹ。
が尾根 点 か谷 点 かの
別す るための特徴 と しては,文献<
3
'
で文字線 の傾 き特
判定 は, Ⅹ。とその 8近傍 ,す なわ ち Ⅹ.
- Ⅹ 8の濃淡
徴が有効 な特徴であることが示 されているので,本稿
値 の分布の状態 によって決定す る.
で も同様 な文字線縁 の傾 き特徴 をマス ク処理で容易 に
抽 出で きる方法 として,印刷漢字 の認識 に実績のある
位相特徴分布法(
6
'
を使用す ることに した.
X4 X3x2
XSXoX1
X6X
7 X
C
図 4 8近傍
3.
1 特徴抽 出
認識実験 に使用す る特徴 としては,文字線縁の傾 き
に着 目 した傾斜特徴 と黒点量 を用 いる.
図 5 4方向
3.
1
.
1 傾斜特徴 の抽 出
修復処理が施 された文字パ ター ンに対 し,文字線 の
図 5の ように,縦 ,横 ,左斜 め,右斜 めの 4方向 を
縁 の部分 に 3× 3のマス クを当てはめ,周囲の黒画素
考 え, 各 々の方 向で 中央 の Ⅹ。
の濃 淡値 が ,両側 の 2
の状 態 を調べ , 文字線縁 の局所 的 な傾斜 を示 す特 徴
点の濃淡値 よ りも大 きい時,その方向で中央極大であ
(
記号 と して表 した H,V,L,R点の中の一つの特徴 )
る とす る. また, X。
の濃淡値 が両側 の 2点 の濃淡値
を付与す る. この処理 によ り,文字線縁 のすべ ての黒
よ り小 さい時,その方向で中央極小 である とす る.
点 には水平 (
H),垂直 (
Ⅴ),左斜 (
L),右斜 (
R)の 4種
以上の ような中央極大 となる ような方向が 2つ以上
の特徴 のいずれかが付与 され傾斜特徴が形成 される.
あ る点 を尾根点,中央極小 となる方向が 2つ以上ある
識別 では この 4つの特徴 に加 え,黒点量 (
B)も求め,
点 を谷点 とす る.ただ し,中央極大,中央極小 となる
5
`
っの特徴 を用 いる.
方 向がそれぞれ 2つ な らば尾根点で も谷点で もない も
の とす る.
3.
1.
2 スムージング
さらに,文字背景 の部分 にノイズによる尾根点が生
L または Rの傾 斜符号 を有 す る黒点 にお いて,料
じることや,文字線上 に, ノイズに よる谷点が生 じる
め前後 に H と V の傾斜符号 を有 す る黒点が存在 す る
ことがある. これ らを防 ぐため,明 らか に文字背景の
場 合, その黒点 に H と V の傾斜符号 を付加 し,一つ
濃度値 の時 は,尾根点 とは しない とす る尾根点 しきい
の点 に 3種類 の特徴 を持 たせ る. この処理 に よって文
値 OTHを設 け る. また明 らか に文字線 部分 の濃度値
字線 の交差 に よって生 じる不安定 な特徴 の影響が低減
の ときは谷点 としない とす る谷点 しきい値m
される.
を設 け,
この しきい値 による処理 を行 い, ノイズの混入 を防い
でいる.
3.
1.
3 ブロ ック分割
文字線 部 に抽 出 された特徴 に位置情 報 を付加するた
2.
2.
2 文字パ ター ンの補正
めに,文字パ ターンの外接枠 を基準 にして,文字パ ター
大津 の手 法で求めた しきい値 を用 いて 2億 化 した文
ンを rx sの領域に分割 して扱 う.この分割により,各々
字パ ターンに対 し,尾根点が 白になっているものを尾根
の傾斜特徴 の存在する位 置が,文字パ ターン上の配置
点エラー,谷点が黒 になっているものを谷点エラーとす
として表現 されるようになり,特徴相互の関連付 けとそ
る.このエラーを検 出 して反転 させ,尾根点 を黒 に,谷
の分布の状態 を知 ることがで きる. ここで分割数 を多 く
点 を白に強制 的に変更する.その一例 を図 6に示す.
すると文字パ ターンの位置情報が より詳細 に表現で きる
が,文字パ ターンが変形 した り,劣化 した場合,あるい
は文字パ ターンの周辺部が欠けた りした場合 にその影響
竺
原画像
胆 竺l
担
2倍化画像
補正画像
図 6 原画像 と修復画像 の比較
を受 けやす くなる.図 7に示す ように r- S- 8の場 合
を例 とすると,特徴抽 出によって32
0次元 (8× 8× 5)
の特徴ベク トルが得 られる.得 られた特徴 は正規化のた
めに,傾斜特徴量 (
H,V,L,良) は分割領域の周 囲
長で,黒点量 (
B)は分割領域の面積で正規化する.
8
2
彦 ・松 山
胡
〆
.
-S
=
.
冒}
:
+
.
・
,
日
脚
三
,
8
-了8
繁史 ・松 田 和生 ・中村
末治
正 を施 した文字パ ター ンである.デー タ 6はデー タ 3
∼
も
-
千秋 ・宮原
に尾根点 ・谷点 による補正 を施 した文字パ ター ンであ
一
一
.
.
4-
る.表 2の右端 に文字パ ター ンの大 きさを画素数で表
している. また,それ と同 じ箇所 に認識結果 と対応 を
!
とるために,学習デー タをA ・Bとし,テス トデー タ
を C・D と区別 して,デー タ番号 と実験状態 との関係
至
.
鷲.
:
:
弓
ヽ
、
.
を示 している.図 8に1
6×1
6画素の文字画像の例 を示
図 7 ブ ロ ック分割
す.比較のために,図 8の1
6×1
6画素の文字画像 を大
津の手法で 2億化 した文字パ ター ンの例 を図 9に示す.
3.
2 弘
また,本手法で修復 した48×48画素の文字パ ター ンを
別
実験では,ユー クリッ ド距離 を用 い,距離値の近い
縮小 した例 を図1
0に示す.
ものか ら順 に答 え として出力 した.
表 2 実験 デー タの種類
4.評価実験 と考察
1
6×1
6画素で表れされた低解像度の印刷文字 と本手
番
号
データ
修練の内容
学習/
大 きさ(
テス
画素)
ト
1
原 画像 に大津 の手 法で 2倍
化 した文字パターン
1
6×1
6
l
A,
l
B/
l
C,
1
D
2
原画像 を2倍に拡大 し,ほか
し処理を施 した文字パターン
32×32
2A/2C
3
原画像 を3倍に拡大 し,ぽカ、
し処理 を施 した文字パターン
48×48
3
A/3
C
4
データ 1に尾根点 .谷点によ
る補正を施 した文字パターン
1
6×1
6
4B/4D
5
テし 夕2に尾板点 .谷点によ
る補正を施 した文字パターン
32×32
5B/5D
6
データ3に尾根点 .谷点によ
48×48
法によって修復 された印刷 漢字 とに対 し,認識実験の正
解率によって,修復の改善効果を調べる方法を採用 した.
4.
1 実験データ
実験 デー タ と して, 産総研 印刷 漢字 デー タベ ース
ETL2の中か ら明朝体 の印刷漢字21
36カテゴリーを使
用 した.評価実験では表 1に示す ように, カテゴリー
あた り1
0パ ター ンであ り,前半 6パ ター ンを学習デー
タとし,後半 4パ ター ンをテス トデー タとした.
低解像度画像の作成 は,元 の解像度が60×60画素の
ETL2の文字画像 に対 し,中央の48×48画素 を有効 な
部分 と して取 り出 し, この部分 に 3× 3画素 を 1画素
に変換す る処理で1
6×1
6画素 に落 とした.以後 この画
像 を原画像 と呼ぶ.
表 1の原画像 を もとに して,評価実験 のために表 之
に示す 6種の画像 を用意 した.デー タ 1は原画像 を大
津の手法で 2億化 した文字パ ター ンである. デー タ 2
は原画像 を 2倍 に拡大 し,ほか し処理 を施 した文字パ
椀
巌
撞
賂
感
懲
還
洛
愚
幕
愚 憂
愁
監
扱
悔
蟹
督
鰹
惜
図 8 多億の文字画像 (
1
6×1
6画素)
ター ンである.デー タ 3は原画像 を 3倍 に拡大 し,ほ
か し処理 を施 した文字パ ターンである.データ4はデー
タ 1に尾根点 ・谷点 による補正 を施 した文字パ ター ン
である.デー タ 5はデー タ 2に尾根点 ・谷点 による補
峡嵐削 島循岳 悪患店蕗
愚憂愁忙悦悔他 l
E
i
・
悼慌
デー タ 1
図 9 大津の手法 を用いた文字パ ター ン (
1
6×1
6画素)
表 1 実験 デー タ仕様
項
目
カテ ゴリ一致
パ ター ン数/カテゴ リー
漉
度
原画像 の画素数
内
容
21
3
6
6(
学習),4 (
テス ト)
25
6階調
1
6×1
6画素 (
6
0×60画素
峡嵐嵩嶋塘忌忍愚意慈
愚憂思忙悦悔恨悼 悼惜
デー タ 6
図1
0 本手法 を用いた文字パ ター ン (
48×48画素)
83
文字画像の修復 による低解像度印刷漢字の認識
る.
デー タに対す る認識結果 を示 している.両者
を比較す
4.
2 実験結果
評価実験 は表 2に示 した仝 6種類の実験 デー タに対
し,3章で述べ た特徴抽 出 と識別処理 を行 った.特徴
る と,正解率 はテス トデー タの方が全体的 に低 い こと
が分か る.
1
項 に示 したマス ク
抽 出では文字 パ ター ンに対 し, 3.
テス トデー タの実験結果では,図 1
3に示す ように,
を用 いてすべ での黒画素 に傾斜符号 を付与 した後,文
本手法 を用 いる こ とに よ り第 1位 の正解率が89.
1
%か
字パ ター ンの外接枠 を基準 として 8× 8にブロ ック分
ら99.
1
%へ , 5位 候 補 までの累積正解 率 が95.
1
%か ら
割 して特徴 を計 数 した.その結果,識別 に用 いる特徴
99.
8%-改善 してい る. また, 図 1
4に示す ように第 1
ベ ク トルは,320 (8× 8× 5)次元 となった.
位 の正解率が 89.
1
%か ら99.
4%へ約 1
0%,5位候補 まで
識別結果 を第 1位正解率 と候補 5位 までの累積正解
の累積正解率が95.
1
%か ら99.
9%へ,約 5%向上 してい
率 とに分 けて,図 11か ら図 1
4に示す . 縦 軸 は正解率
を,横軸 は文字パ ター ンの修復 の状態 を示すデー タ番
号 を表 してい る. 第 1位 の正解 率 を実線 で ,候 補 5
位 までの累積正解率 を破線 で示す.図 11と図 1
2は学習
3と図 1
4はテス ト
デー タに対す る認識結果であ り,国 1
4.
3 考
察
本手法 を低解像度の文字パ ター ンに適用 した場合,
図 9の文字パ ター ンと図 1
0の比較か ら視覚 的 に も画質
≡
≡
:
.
;
㌻
:
::
三
.
;
=
:
≡
:
;
:
≡
こ
;
.
= ≡
I こ
■
I
:
.:
I
:
I1
.
:
L
.
= :
:
≡
I
:
.
:
I
≡
:
9
8
.
0 ≡
.
p
・
;
:
≡
≡
:
「
・
:
:
I
ノ二
:
:
:
p
l・
二
:
:
-
:
.
I
∫
A
;
二
:
:
:
=
t
:
:
L
f
:
:
:
.
(
a
J
て
こ
∴-.∴
:
.
:
.
・
-..
.
:
・
l
i
.
I
.
.
:
:
:
:
≡
I
:
I
:
/
A
.
-
・
:
.
ノ
p
. .
I
::
:
i
・
.
:
.
:
.
:
.
:
∴ I
:
:
A
1
.
.
:
:
i
.
> :
.
こ
;
.
:
こ
p
:
.:
I
I
;
・
三
■
・
∴
:
.
:
.
■
≡
;
I■
:
こ
:
:
.
:
I
.
:
;
:
.
i
:
p
≡
-
-●-
- ●・
兼5
第1
i
第5
事1
候補
侯at
・
嶋
#
8
舟
)
(
控
r
J
t
9
t
一
l
-8
9
0
4
2
8
6
.
0
データ1
データ2
データ3
図 11 学習デー タの認識結果 A
(
拡大 ,ほか し処理)
データ1
データ2
デ-タ3
1
6×1
6
32×32
48×48
図 13
写
-
テ ス トデ ー タ の 認 識 結 果 C
(拡 大 , ば か し 処 理 )
.
>
¥
:
.
,
.
_
_
袷
I
.
3
p
=
完訳≡
害
監監慧慧書
芸至
芸≡
≡
欝農
■
…
…
■
ミ
リ
一一一ト
-- -.
ー一幕
事5
1
侯禰
線檎
′
.
:
#9
#
#
畔
也
肖
■一
9
8
0
8
4
2
6
.
0
デ-タ一
T
--タ5
デ-タ6
図1
2 学習デー タの認識結果 B
(
尾根点 ・谷点 による補正)
データ1
図 14
データ4
7t
′
▲
>
・
第5
1
侯樽
候補
■-
I
:
,
一
記
-
#
称
欝
l
輩
H
t
推
t
l
8
90
4
8
2.
0
#
■
亡
9
6
.
0
T
--タ1
I
H一
.1
データ5
*l ●
'
データ6
テ ス トデ ー タ の 認 識 結 果 D
(尾 根 点 ・谷 点 に よ る 補 正 )
8
4
胡
彦 ・松 山
繁史 ・松 田 和生 ・中村
千秋 ・宮原
末治
の改善効果が確認で きる.定量的な評価のために行 っ
た文字認識実験の結果か ら,次の ようなことが分かっ
た.
同
(
1)詩織精度の比較 :
1
6×1
6画素の学習デー タとテス トデー タとの比較で
は,図11と図1
3,お よび図1
2と図1
4に見 られるように,
正解率 に大 きな差が生 じた. これは学習デー タ数が少
園
な くて,入力デー タのバ ラツキを十分吸収することが
(
a) 原画像
(
b) 修復 した文字パターン
で きなかったため と考 え られる.
1
6×1
6画素
48×48画素
(
2) 拡大 とぼか し処理の効果 :
図1
5 誤認識の文字パ ター ンの例
図1
3に示す ように,拡大 とぼか し処理で第 1位正解
率 は,8
9.
1
% (lC) か ら99.
1
% (3C)へ大幅 に改善
解像度 を60×60画素か ら1
6×1
6画素 に落 として,擬似
された. この原因は,① これ まで不安定であ った斜め
的な低解像度の印刷漢字 を作成 して使用 した.認識実
成分の特徴 (Lお よびRの特徴)が安定化 されたこと,
験では位相特徴分布法 を用い,正解率 による評価 を行 っ
②1
6×1
6画素の文字パ ター ンでは,文字線の帽が 1画
た.その結果,本稿で提案 した文字パ ター ンの修復法
素の場合が多 く生 じ,文字線縁 の特徴が不安定であっ
に よって, テス トデー タで正解率 が8
9.
1
%の もの を
た ものが拡大の処理で文字線の幅が常 に 2画素以上 と
99.
4%まで,約 1
0%向上 させ ることがで きた.また第 5
なったこと,(
影文字パ ター ンが拡大 されたことによ り
位 までの累積正解率 で は,95.
1
%の もの を9
9.
9%まで
ブロ ック分割 によ.
る特徴の変動が少な くなったこと,
向上 させ ることがで き,本手法の有効性 を確認す るこ
などが考 え られる.
とがで きた.
(
3
)尾根点 ・合点 による補正の効果 :
図1
4に示す ように,尾根点 ・谷点 による補正で1
6×
1
6画素の原画像 の正解率 が89.
1
%か ら91
.
6%に向上 し
今後はマルチ フォン ト文字 に対す る本手法の適用効
果,文字線のつぶれやかすれの影響 をさらに少 な くす
る方法 な どについて検討す る予定である.
た. なお, (
2)の手法 と併用 した場合 に99.
4%まで向
上 させ ることがで きた. これは尾根点 ・谷点 による補
参考文献
正が漉淡画像の文字線の漉度分布 を反映 してお り,大
(
1
)蘇,挿木 :低品質文字の認識手法 とその応用 に関
津の 2億化の手法で得 られた文字パ ター ンをさらに改
す るサーベ イ,信学技報 ,pRMU2
01
275,p.
2
5-
善 して くれた もの と考 えられる.
40(
2
0 2)
.
ka,K.Ya
ma
da:Doc
ume
nt
(
2)N.Na
ka
j
i
ma,N.Tana
識別実験 の結果 に,候補 5位 までに出現せず に誤認
識 になった文字パ ター ンの例 を図1
5に示す.その主 な
Re
c
ons
t
uc
r
t
i
on a
nd Re
c
ogm
it
ion 丘.
om a
nI
ma
ge
Se
que
nc
e,I
CPR,p.
922925(
1
9
98).
原因は,つぶれやかすれが多 く存在 し,特徴が大 きく
(
3)小佐井,山本,他 :低解像度 における文字認識手
変化 した ものか と考 え られる.
法の提案,MI
RU98-7,p.
257262(
1
998).
(
4) 鈴木,窪田 :補 間 と凸判定 に基づ くス トローク抽
5.まとめ
デ ィジタルカメラやデ ィジタル ビデオカメラな どか
ら入力 された低解像度の印刷漢字 を精度 よ く認識す る
ために,劣化 した文字パ ター ンの修復法,す なわち
(
1
)大 きさが1
6×1
6画素の多値の低解像度文字画像 に
対 し,2億化の際 に拡大 とほか し処理 を施 して文
字パ ター ンの ジャギーを少な くす る方法,
(
2)文字画像の局所的な尾根点や谷点の検出を行 って,
注 目画素の周囲の状況 を見 なが ら,黒画素,白画
素 を補正する文字パ ター ンの修復方法,
について検討 した.
修復方法の評価 では,産総研 デー タETL2に対 し,
)
年信
出を用いた低解像度文書画像の二値化 , 2∝X
X氾).
学総合大,No.D1
23
4,p.
2
糾(
2(
(
5)岡田,坂井,他 :尾根点 ・
谷点方式 に よる文書画
像の前処理付入力装置,EC825,p.
455
4(
1
98
2).
(
6)宮原,川谷,他 :位相特徴分布法 による印刷漢字
認識,昭和57年債学稔全大,No.
1
33
4,p.
5(
1
98
2).
(
7)ETL2:ht
t
p:
/
/
www.
e
t
l
.
go.
j
p
/
∼e
t
l
c
db/
i
n
de
x.
ht
m
Fly UP