Comments
Description
Transcript
文字画像の修復による低解像度印刷漢字の認識
NAOSITE: Nagasaki University's Academic Output SITE Title 文字画像の修復による低解像度印刷漢字の認識 Author(s) 胡, 彦; 松山, 繁史; 松田, 和生 Citation 長崎大学工学部研究報告 Vol.32(59) p.79-84, 2002 Issue Date 2002-07 URL http://hdl.handle.net/10069/5214 Right This document is downloaded at: 2017-03-30T18:22:22Z http://naosite.lb.nagasaki-u.ac.jp 長崎大学工学部研 究報告 第3 2巻 第59号 平成 1 4年 7月 79 文字画像 の修復 によ る低解 像度 印刷漢字 の認識 彦*・松 山 中村 胡 繁史 **・松 田 千秋***・宮原 和生* 末治* Lo wRe s o l ut i o nKa n j iPr i n t e dCha r a c t e rRe c og nl t l On by Re s t o r a t i o nofCha r a c t e rI ma ge b y Ya nHU* ,S h i g e f u miMATS UYAMA* * , Ka z u oMATS UDA* ,S u e h a u MI r YAHARA* Ch i a k iNAKAMURA* * * Ar es t or a t i onme t hodi spr es ent e df orl owr es ol ut i onpr int e dka n j ic ha ra c t e rr e c ognl t 1 0n・Fi r s t ,c ha r a c t e ri ma gesa r e c onve r t e di nt obi na r yc ha r a c t erpa t t e r nsa f t e re xpa ndi nga ndbl umng.Ne xt ,t hebi na r yc ha r a c t e rpa t t e msa remodi f i e d byt hes ys t e m us l ngr idgepol nta ndr a vi neone・Thef e a t ur eve c t or soft hemodi f i e dc ha r a c t e rpa t t e mswhi c hi nc l ude t hei nf or ma t i onofs pa t i a ls t uc r t ur ea r ee xt r a c t e dbyphr a s ef e a t ur edi s t ibut r i onme t hoda ndt he ya r ef e di na nc l as s i f i e r . I ti sve if r i e dbye xpe iment r sus l ngt heda t a bas eETL2t ha tpr opos e dme t hodi mpr ove dr e c ognl t 1 0na c c ur a c yf r om 89. 1 % t o99. 4%. 1. は じめに デ ィジ タル カメラや デ ィジ タル ビデ オな どの普及 に ル タを用 いた画素 間の補 間 と凸判定 に よ り品質の よい 文字パ ター ンを得 る 2値化法4 ' な どが提 案 されて きた. 伴 い, カメラ画像 か らの文字認識 の要求が高 まってい これ らの手法 は低解像度 の画像 を修復 し,読 みやす い る川2̀ ' . しか しなが ら, 現 在 実 用 化 され て い るOCR 文字パ ター ンを得 る方法 と して一定 の効果 を上 げてい ( opt i c a lCha r a c t e rRea de r ) は , ス キ ャナか ら取 り込 るが,汎用性 や認識精度 の点 で は十分 であ る と言 えな んだ高解像 度 の文字 画像 を読取対 象 と してい るため, い. 既存 の認識技術 をその まま適用す る こ とは困難 と思 わ 本稿 では, デ ィジ タル カメラやデ ィジ タル ビデ オ画 れ る.その主 な原 因 は, よ り多 くの情報 を読 み取 ろ う 像 か らの文字認識 を目的 と し,低解像度文字画像 の修 と して, カメラか らの入力画像 の視野 を広 く取 ろ うと 復 を多段 に行 うこ とに よ り文字画像 の画 質 を改善 し, す るため,文字部分が低解像 度 の画像 になるこ とに起 それ を用 いて高精度 に文字認識す る方法 につ いて提案 因す る もの と考 え られ る.低解像度 の画像 は,文字 パ す る.提案手法では,低解像度 の入力文字画像 に対 し, ター ンの文字縁 に段差 が生 じた り,細 か な部分 がつぶ 文字 パ ター ンの拡大 とぼか しの処理 を行 い, さらに 2 れ た り,かす れた りす るため, これ らの画像 をその ま 倍 化 の際 に尾根 点 ・谷点 の検 出 に よ り文字パ ター ンに ま使 って認識 させ る と,高 い認識精度 を実現 で きない 補 正 を施 し5̀ ' ,修復 した文字パ ター ンに対 して位 相特 こ とが多 い. 徴 分布法6̀ 'に よ り文字線縁 の局所 的 な傾斜特徴 に位 置 これ らの問題 に対 して, これ まで に文字パ ター ンを 情報 を付与 して特徴 ベ ク トル を形成 し,識別 を行 う. わず か に移動 させ , それ らの差分 を とる こ とで文字線 実験 デ ー タ と して,産総研 ( 旧 電総研 ) が公 開 し 縁 の傾 きを精度 よ く検 出す る移動差分法 3̀ や ,線形 フ イ 'を擬 似 的 て い る多債 の印刷 漢字 デ ー タベ ー スETL27̀ 4年 4月 1 9日受理 平成 1 *大学 院生産科学研 究科 ( Gr a dua t eSc hoolorSci enc ea ndTe c hnol ogy) **富士 ソフ トABC( 秩) ( Fu j i s of tABC I nc. ) ***教育学部 ( Fa c ul t yofEduc a t i on) 8 0 胡 彦 ・松 山 紫史 ・松 田 和生 ・中村 千秋 ・宮原 末治 に解像度 を落 として 1 6×1 6画素の低解像度文字 デー タ として使用 した.以下 , 2章では修復手法 , 3章では 特徴抽 出 と識別 ,4章では評価実験 と考察 について報 告す る. il i d ( a) 2.修復手法 カメラな どで入力 された画像 は一般 に濃淡画像であ ( b) 原画像 ( C) 拡大 した画像 ぼか し処理後 図 2 文字パ ター ンの拡大 とぼか し処理 り,文字認識ではそれ を 2倍化 して用いる.2億化処 理 は,各画素の濃度値が予め定め られた しきい値や, 3× 3の フィル タ ( m- 3) をかけた場合 を示す.す 自動的に求め られた しきい値 との大小関係 を比較 して a)は,拡大の処理 によ り なわち 2× 2画素の原画像 ( 行 われる. しか し, これ らの方法 を低解像度 の文字画 像 に対 して適用す る と,つぶれやかすれ,ジャギーな 6×6画素 の画像 ( b)になる.次 に拡大 した画像 の全 ての画素 に 3×3のマス クをかけ,そのマス ク内で濃 どが発生す る.そ こで本箱 では,2億化処理の前 に文 度値の平均 をとって中央画素の濃度値 を求める.処理 字 の拡大 とぼか し処理 を行い ,2倍化の際 に尾根点 ・ C)に示す. 結果 を図 2の ( 谷点の検 出 と補正 によって ,2億化 される文字パ ター 以上の処理で原画像の濃度値 を保存 し,かつジャギー ンに修復 を行 う方法 を提案する.本手法の処理の流れ の除去 と同時 に原画像 よ り大 きさが縦横 3倍 になるほ を図 1に示 し,画質改善のための修復 の処理 を破線 の か しパ ター ンが生成 される.入力 された原画像が 1 6× 枠 内に表す. 1 6画素 な らば,3倍 に拡大 してぼか しをかけた文字パ ター ンは48×48画素の大 きさになる.原画像 を大津の 手法 を用 いて 2倍化 した場合の一例 を図 3( a)に,文 字パ ター ンを拡大 し (n=3), ぼか し処理 (m=3) b)に示す. を施 して 2億化 した文字パ ター ンを図 3( l r q 原パ ター ン 憧 拡大 とほか し処理 した 文字パ ター ン 図 3 拡大 してほか し処理 を施 した後 2倍化 した文字パ ター ン 2 . 2 尾根点 ・谷点 による補正 かすれは文字線 の漉度 と同 じ濃度 になるはずの濃度 図 1 文字認識処理 における修復処理の手順 が本来の値 よ りも低 くなる事 によ り生 じ,つぶれは文 字線の間隙部分でかすれ と逆の現象が生 じたために起 2. 1 文字の拡大 とばか し処理 による補完 きる もの と考 えることがで きる. この ように文字線 に ジャギーは,文字パ ター ンを少 ない画素で表現 しよ つぶれやかすれが生 じた場合で も文字線部分では周囲 うとしたため に生 じた ものである.そこで文字パ ター と比べ て濃度が高 くな り,文字線の間隙部分では周囲 ンの拡大 と,ぼか し処理 とを同時 に行い,見掛 け上の より低 くなることか ら,文字画像の濃度値の凹凸 を調 解像度 を上げることで輪郭部の凹凸を除去 し,原画像 べ ることによ り,文字線や文字線 間隔部分 をその周辺 の文字縁 を滑 らかにす る. この処理 により擬似 的 に高 部分 と区別することがで きる.そ こで,本稿では大津 解像度文字画像 を得 ることがで きる. の方法で求めた しきい値で 2倍化 を行 うと同時 に,各 処理では, まず入力 された濃淡画像の各画素 を mx 画素の 8近傍 の濃度 を調べ,濃度億の高い方 を尾根点 n画素 に拡大 し,次 にmXmの フィル タでほか し処理 と,低 い方 を谷点 として検 出 し,その検 出結果 に基づ を行 う.図 2に例 として,3倍 に拡大 して ( n- 3), いて 2億化の結果 に対 し補正 を行 う. 文字画像 の修復 による低解像度印刷漢字の認識 81 3.特徴抽 出 と識別 2. 2. 1 尾根点 ・谷点の積 出 尾根点,谷点 の抽 出 には図 4 に示す ような 3× 3画 本手法の評価のため に,低解像度文字パ ター ンを識 素 のマ ス クを用 い る. 中心 点Ⅹ。 が尾根 点 か谷 点 かの 別す るための特徴 と しては,文献< 3 ' で文字線 の傾 き特 判定 は, Ⅹ。とその 8近傍 ,す なわ ち Ⅹ. - Ⅹ 8の濃淡 徴が有効 な特徴であることが示 されているので,本稿 値 の分布の状態 によって決定す る. で も同様 な文字線縁 の傾 き特徴 をマス ク処理で容易 に 抽 出で きる方法 として,印刷漢字 の認識 に実績のある 位相特徴分布法( 6 ' を使用す ることに した. X4 X3x2 XSXoX1 X6X 7 X C 図 4 8近傍 3. 1 特徴抽 出 認識実験 に使用す る特徴 としては,文字線縁の傾 き に着 目 した傾斜特徴 と黒点量 を用 いる. 図 5 4方向 3. 1 . 1 傾斜特徴 の抽 出 修復処理が施 された文字パ ター ンに対 し,文字線 の 図 5の ように,縦 ,横 ,左斜 め,右斜 めの 4方向 を 縁 の部分 に 3× 3のマス クを当てはめ,周囲の黒画素 考 え, 各 々の方 向で 中央 の Ⅹ。 の濃 淡値 が ,両側 の 2 の状 態 を調べ , 文字線縁 の局所 的 な傾斜 を示 す特 徴 点の濃淡値 よ りも大 きい時,その方向で中央極大であ ( 記号 と して表 した H,V,L,R点の中の一つの特徴 ) る とす る. また, X。 の濃淡値 が両側 の 2点 の濃淡値 を付与す る. この処理 によ り,文字線縁 のすべ ての黒 よ り小 さい時,その方向で中央極小 である とす る. 点 には水平 ( H),垂直 ( Ⅴ),左斜 ( L),右斜 ( R)の 4種 以上の ような中央極大 となる ような方向が 2つ以上 の特徴 のいずれかが付与 され傾斜特徴が形成 される. あ る点 を尾根点,中央極小 となる方向が 2つ以上ある 識別 では この 4つの特徴 に加 え,黒点量 ( B)も求め, 点 を谷点 とす る.ただ し,中央極大,中央極小 となる 5 ` っの特徴 を用 いる. 方 向がそれぞれ 2つ な らば尾根点で も谷点で もない も の とす る. 3. 1. 2 スムージング さらに,文字背景 の部分 にノイズによる尾根点が生 L または Rの傾 斜符号 を有 す る黒点 にお いて,料 じることや,文字線上 に, ノイズに よる谷点が生 じる め前後 に H と V の傾斜符号 を有 す る黒点が存在 す る ことがある. これ らを防 ぐため,明 らか に文字背景の 場 合, その黒点 に H と V の傾斜符号 を付加 し,一つ 濃度値 の時 は,尾根点 とは しない とす る尾根点 しきい の点 に 3種類 の特徴 を持 たせ る. この処理 に よって文 値 OTHを設 け る. また明 らか に文字線 部分 の濃度値 字線 の交差 に よって生 じる不安定 な特徴 の影響が低減 の ときは谷点 としない とす る谷点 しきい値m される. を設 け, この しきい値 による処理 を行 い, ノイズの混入 を防い でいる. 3. 1. 3 ブロ ック分割 文字線 部 に抽 出 された特徴 に位置情 報 を付加するた 2. 2. 2 文字パ ター ンの補正 めに,文字パ ターンの外接枠 を基準 にして,文字パ ター 大津 の手 法で求めた しきい値 を用 いて 2億 化 した文 ンを rx sの領域に分割 して扱 う.この分割により,各々 字パ ターンに対 し,尾根点が 白になっているものを尾根 の傾斜特徴 の存在する位 置が,文字パ ターン上の配置 点エラー,谷点が黒 になっているものを谷点エラーとす として表現 されるようになり,特徴相互の関連付 けとそ る.このエラーを検 出 して反転 させ,尾根点 を黒 に,谷 の分布の状態 を知 ることがで きる. ここで分割数 を多 く 点 を白に強制 的に変更する.その一例 を図 6に示す. すると文字パ ターンの位置情報が より詳細 に表現で きる が,文字パ ターンが変形 した り,劣化 した場合,あるい は文字パ ターンの周辺部が欠けた りした場合 にその影響 竺 原画像 胆 竺l 担 2倍化画像 補正画像 図 6 原画像 と修復画像 の比較 を受 けやす くなる.図 7に示す ように r- S- 8の場 合 を例 とすると,特徴抽 出によって32 0次元 (8× 8× 5) の特徴ベク トルが得 られる.得 られた特徴 は正規化のた めに,傾斜特徴量 ( H,V,L,良) は分割領域の周 囲 長で,黒点量 ( B)は分割領域の面積で正規化する. 8 2 彦 ・松 山 胡 〆 . -S = . 冒} : + . ・ , 日 脚 三 , 8 -了8 繁史 ・松 田 和生 ・中村 末治 正 を施 した文字パ ター ンである.デー タ 6はデー タ 3 ∼ も - 千秋 ・宮原 に尾根点 ・谷点 による補正 を施 した文字パ ター ンであ 一 一 . . 4- る.表 2の右端 に文字パ ター ンの大 きさを画素数で表 している. また,それ と同 じ箇所 に認識結果 と対応 を ! とるために,学習デー タをA ・Bとし,テス トデー タ を C・D と区別 して,デー タ番号 と実験状態 との関係 至 . 鷲. : : 弓 ヽ 、 . を示 している.図 8に1 6×1 6画素の文字画像の例 を示 図 7 ブ ロ ック分割 す.比較のために,図 8の1 6×1 6画素の文字画像 を大 津の手法で 2億化 した文字パ ター ンの例 を図 9に示す. 3. 2 弘 また,本手法で修復 した48×48画素の文字パ ター ンを 別 実験では,ユー クリッ ド距離 を用 い,距離値の近い 縮小 した例 を図1 0に示す. ものか ら順 に答 え として出力 した. 表 2 実験 デー タの種類 4.評価実験 と考察 1 6×1 6画素で表れされた低解像度の印刷文字 と本手 番 号 データ 修練の内容 学習/ 大 きさ( テス 画素) ト 1 原 画像 に大津 の手 法で 2倍 化 した文字パターン 1 6×1 6 l A, l B/ l C, 1 D 2 原画像 を2倍に拡大 し,ほか し処理を施 した文字パターン 32×32 2A/2C 3 原画像 を3倍に拡大 し,ぽカ、 し処理 を施 した文字パターン 48×48 3 A/3 C 4 データ 1に尾根点 .谷点によ る補正を施 した文字パターン 1 6×1 6 4B/4D 5 テし 夕2に尾板点 .谷点によ る補正を施 した文字パターン 32×32 5B/5D 6 データ3に尾根点 .谷点によ 48×48 法によって修復 された印刷 漢字 とに対 し,認識実験の正 解率によって,修復の改善効果を調べる方法を採用 した. 4. 1 実験データ 実験 デー タ と して, 産総研 印刷 漢字 デー タベ ース ETL2の中か ら明朝体 の印刷漢字21 36カテゴリーを使 用 した.評価実験では表 1に示す ように, カテゴリー あた り1 0パ ター ンであ り,前半 6パ ター ンを学習デー タとし,後半 4パ ター ンをテス トデー タとした. 低解像度画像の作成 は,元 の解像度が60×60画素の ETL2の文字画像 に対 し,中央の48×48画素 を有効 な 部分 と して取 り出 し, この部分 に 3× 3画素 を 1画素 に変換す る処理で1 6×1 6画素 に落 とした.以後 この画 像 を原画像 と呼ぶ. 表 1の原画像 を もとに して,評価実験 のために表 之 に示す 6種の画像 を用意 した.デー タ 1は原画像 を大 津の手法で 2億化 した文字パ ター ンである. デー タ 2 は原画像 を 2倍 に拡大 し,ほか し処理 を施 した文字パ 椀 巌 撞 賂 感 懲 還 洛 愚 幕 愚 憂 愁 監 扱 悔 蟹 督 鰹 惜 図 8 多億の文字画像 ( 1 6×1 6画素) ター ンである.デー タ 3は原画像 を 3倍 に拡大 し,ほ か し処理 を施 した文字パ ターンである.データ4はデー タ 1に尾根点 ・谷点 による補正 を施 した文字パ ター ン である.デー タ 5はデー タ 2に尾根点 ・谷点 による補 峡嵐削 島循岳 悪患店蕗 愚憂愁忙悦悔他 l E i ・ 悼慌 デー タ 1 図 9 大津の手法 を用いた文字パ ター ン ( 1 6×1 6画素) 表 1 実験 デー タ仕様 項 目 カテ ゴリ一致 パ ター ン数/カテゴ リー 漉 度 原画像 の画素数 内 容 21 3 6 6( 学習),4 ( テス ト) 25 6階調 1 6×1 6画素 ( 6 0×60画素 峡嵐嵩嶋塘忌忍愚意慈 愚憂思忙悦悔恨悼 悼惜 デー タ 6 図1 0 本手法 を用いた文字パ ター ン ( 48×48画素) 83 文字画像の修復 による低解像度印刷漢字の認識 る. デー タに対す る認識結果 を示 している.両者 を比較す 4. 2 実験結果 評価実験 は表 2に示 した仝 6種類の実験 デー タに対 し,3章で述べ た特徴抽 出 と識別処理 を行 った.特徴 る と,正解率 はテス トデー タの方が全体的 に低 い こと が分か る. 1 項 に示 したマス ク 抽 出では文字 パ ター ンに対 し, 3. テス トデー タの実験結果では,図 1 3に示す ように, を用 いてすべ での黒画素 に傾斜符号 を付与 した後,文 本手法 を用 いる こ とに よ り第 1位 の正解率が89. 1 %か 字パ ター ンの外接枠 を基準 として 8× 8にブロ ック分 ら99. 1 %へ , 5位 候 補 までの累積正解 率 が95. 1 %か ら 割 して特徴 を計 数 した.その結果,識別 に用 いる特徴 99. 8%-改善 してい る. また, 図 1 4に示す ように第 1 ベ ク トルは,320 (8× 8× 5)次元 となった. 位 の正解率が 89. 1 %か ら99. 4%へ約 1 0%,5位候補 まで 識別結果 を第 1位正解率 と候補 5位 までの累積正解 の累積正解率が95. 1 %か ら99. 9%へ,約 5%向上 してい 率 とに分 けて,図 11か ら図 1 4に示す . 縦 軸 は正解率 を,横軸 は文字パ ター ンの修復 の状態 を示すデー タ番 号 を表 してい る. 第 1位 の正解 率 を実線 で ,候 補 5 位 までの累積正解率 を破線 で示す.図 11と図 1 2は学習 3と図 1 4はテス ト デー タに対す る認識結果であ り,国 1 4. 3 考 察 本手法 を低解像度の文字パ ター ンに適用 した場合, 図 9の文字パ ター ンと図 1 0の比較か ら視覚 的 に も画質 ≡ ≡ : . ; ㌻ : :: 三 . ; = : ≡ : ; : ≡ こ ; . = ≡ I こ ■ I : .: I : I1 . : L . = : : ≡ I : . : I ≡ : 9 8 . 0 ≡ . p ・ ; : ≡ ≡ : 「 ・ : : I ノ二 : : : p l・ 二 : : - : . I ∫ A ; 二 : : : = t : : L f : : : . ( a J て こ ∴-.∴ : . : . ・ -.. . : ・ l i . I . . : : : : ≡ I : I : / A . - ・ : . ノ p . . I :: : i ・ . : . : . : . : ∴ I : : A 1 . . : : i . > : . こ ; . : こ p : .: I I ; ・ 三 ■ ・ ∴ : . : . ■ ≡ ; I■ : こ : : . : I . : ; : . i : p ≡ - -●- - ●・ 兼5 第1 i 第5 事1 候補 侯at ・ 嶋 # 8 舟 ) ( 控 r J t 9 t 一 l -8 9 0 4 2 8 6 . 0 データ1 データ2 データ3 図 11 学習デー タの認識結果 A ( 拡大 ,ほか し処理) データ1 データ2 デ-タ3 1 6×1 6 32×32 48×48 図 13 写 - テ ス トデ ー タ の 認 識 結 果 C (拡 大 , ば か し 処 理 ) . > ¥ : . , . _ _ 袷 I . 3 p = 完訳≡ 害 監監慧慧書 芸至 芸≡ ≡ 欝農 ■ … … ■ ミ リ 一一一ト -- -. ー一幕 事5 1 侯禰 線檎 ′ . : #9 # # 畔 也 肖 ■一 9 8 0 8 4 2 6 . 0 デ-タ一 T --タ5 デ-タ6 図1 2 学習デー タの認識結果 B ( 尾根点 ・谷点 による補正) データ1 図 14 データ4 7t ′ ▲ > ・ 第5 1 侯樽 候補 ■- I : , 一 記 - # 称 欝 l 輩 H t 推 t l 8 90 4 8 2. 0 # ■ 亡 9 6 . 0 T --タ1 I H一 .1 データ5 *l ● ' データ6 テ ス トデ ー タ の 認 識 結 果 D (尾 根 点 ・谷 点 に よ る 補 正 ) 8 4 胡 彦 ・松 山 繁史 ・松 田 和生 ・中村 千秋 ・宮原 末治 の改善効果が確認で きる.定量的な評価のために行 っ た文字認識実験の結果か ら,次の ようなことが分かっ た. 同 ( 1)詩織精度の比較 : 1 6×1 6画素の学習デー タとテス トデー タとの比較で は,図11と図1 3,お よび図1 2と図1 4に見 られるように, 正解率 に大 きな差が生 じた. これは学習デー タ数が少 園 な くて,入力デー タのバ ラツキを十分吸収することが ( a) 原画像 ( b) 修復 した文字パターン で きなかったため と考 え られる. 1 6×1 6画素 48×48画素 ( 2) 拡大 とぼか し処理の効果 : 図1 5 誤認識の文字パ ター ンの例 図1 3に示す ように,拡大 とぼか し処理で第 1位正解 率 は,8 9. 1 % (lC) か ら99. 1 % (3C)へ大幅 に改善 解像度 を60×60画素か ら1 6×1 6画素 に落 として,擬似 された. この原因は,① これ まで不安定であ った斜め 的な低解像度の印刷漢字 を作成 して使用 した.認識実 成分の特徴 (Lお よびRの特徴)が安定化 されたこと, 験では位相特徴分布法 を用い,正解率 による評価 を行 っ ②1 6×1 6画素の文字パ ター ンでは,文字線の帽が 1画 た.その結果,本稿で提案 した文字パ ター ンの修復法 素の場合が多 く生 じ,文字線縁 の特徴が不安定であっ に よって, テス トデー タで正解率 が8 9. 1 %の もの を た ものが拡大の処理で文字線の幅が常 に 2画素以上 と 99. 4%まで,約 1 0%向上 させ ることがで きた.また第 5 なったこと,( 影文字パ ター ンが拡大 されたことによ り 位 までの累積正解率 で は,95. 1 %の もの を9 9. 9%まで ブロ ック分割 によ. る特徴の変動が少な くなったこと, 向上 させ ることがで き,本手法の有効性 を確認す るこ などが考 え られる. とがで きた. ( 3 )尾根点 ・合点 による補正の効果 : 図1 4に示す ように,尾根点 ・谷点 による補正で1 6× 1 6画素の原画像 の正解率 が89. 1 %か ら91 . 6%に向上 し 今後はマルチ フォン ト文字 に対す る本手法の適用効 果,文字線のつぶれやかすれの影響 をさらに少 な くす る方法 な どについて検討す る予定である. た. なお, ( 2)の手法 と併用 した場合 に99. 4%まで向 上 させ ることがで きた. これは尾根点 ・谷点 による補 参考文献 正が漉淡画像の文字線の漉度分布 を反映 してお り,大 ( 1 )蘇,挿木 :低品質文字の認識手法 とその応用 に関 津の 2億化の手法で得 られた文字パ ター ンをさらに改 す るサーベ イ,信学技報 ,pRMU2 01 275,p. 2 5- 善 して くれた もの と考 えられる. 40( 2 0 2) . ka,K.Ya ma da:Doc ume nt ( 2)N.Na ka j i ma,N.Tana 識別実験 の結果 に,候補 5位 までに出現せず に誤認 識 になった文字パ ター ンの例 を図1 5に示す.その主 な Re c ons t uc r t i on a nd Re c ogm it ion 丘. om a nI ma ge Se que nc e,I CPR,p. 922925( 1 9 98). 原因は,つぶれやかすれが多 く存在 し,特徴が大 きく ( 3)小佐井,山本,他 :低解像度 における文字認識手 変化 した ものか と考 え られる. 法の提案,MI RU98-7,p. 257262( 1 998). ( 4) 鈴木,窪田 :補 間 と凸判定 に基づ くス トローク抽 5.まとめ デ ィジタルカメラやデ ィジタル ビデオカメラな どか ら入力 された低解像度の印刷漢字 を精度 よ く認識す る ために,劣化 した文字パ ター ンの修復法,す なわち ( 1 )大 きさが1 6×1 6画素の多値の低解像度文字画像 に 対 し,2億化の際 に拡大 とほか し処理 を施 して文 字パ ター ンの ジャギーを少な くす る方法, ( 2)文字画像の局所的な尾根点や谷点の検出を行 って, 注 目画素の周囲の状況 を見 なが ら,黒画素,白画 素 を補正する文字パ ター ンの修復方法, について検討 した. 修復方法の評価 では,産総研 デー タETL2に対 し, ) 年信 出を用いた低解像度文書画像の二値化 , 2∝X X氾). 学総合大,No.D1 23 4,p. 2 糾( 2( ( 5)岡田,坂井,他 :尾根点 ・ 谷点方式 に よる文書画 像の前処理付入力装置,EC825,p. 455 4( 1 98 2). ( 6)宮原,川谷,他 :位相特徴分布法 による印刷漢字 認識,昭和57年債学稔全大,No. 1 33 4,p. 5( 1 98 2). ( 7)ETL2:ht t p: / / www. e t l . go. j p / ∼e t l c db/ i n de x. ht m