Comments
Description
Transcript
手書き文字認識のための前処理法
鹿児島工業高等専門学校 5( 2 0 0 0 ) 研究報告 3 5 3 5 7 手書き文字認識のための前処理法 榎園茂 A P r e t r e a t m e n t Method f o rH a n d p r i n t e dC h a r a c t e r Re c o g n i t i o n S h i g e r u ENOKIZONO I nt h i sa r t i c l eap r e t 陀 a t m e n tmethodf o rh a n d p r i n t e dc h a r a c t e rr e c o g n i t i o ni sp r o p ω e d . 明記 p r e t r e a t m e n t methodo fah a n d p r i n t e dc h a r a c t e rお veηimportanti npa 枕e r nr e ∞g n i t i o n .Asあr It h i sm a t t e rmanyp r o p o s a l s i g u r eu s i n gt h eantero fg r a v i t yo fb l a c kp i x e l a r eb e i n gd o n e .I no u rmethodwen o r m a l i z eac h a r a c t e rf d i s t r i b u t i o n . 百1 ep r e t r e a t m e n tprωdurei sa sf o l l o w s:( l ) c u to u tt h ec h a r a c t e rf i g u r ea r e a .( 2 ) m o 鋤 t h e i r r e g u l 泣 i t yo fc h a r a c t e rs I Z e .( 3 ) m o v et h ec e n t e ro fg r a v i t yt ot h ec e n t e ro fb a c k g r o u n d .Thev a l i d i t yo ft h e p r o c e s si se x a m i n e dbyt h ee 却e r i m e n t sw h i c hu s et h eE札 -8B2d a t a b a s eo fh a n d p r i n t dKANJIc h a r a c t e r s d e v e l o p e da tE l e c t r o t e c h n i c a lL a b o r a t o r y . Key w o r d s 1. r e t r e a t m e n t ,c e n t e ro fg r a v i t y , ETL-8B2 c h a r a c t e rr e c o g n i t i o n ,p まえがき 手書き文字は書き手が文字を習ってから繰り返し 書く練習を積み重ねることにより、書き手の頭脳の ) 慎などが記憶 中にその文字の図形的なイメージ、筆1 される。文字を書く場面では自分の頭脳の中に記憶 るものである。他方は文字図形を分解することなく、 全体として取り扱い、その画素情報を利用して認識 を行おうとする手法である。これをここでは一括処 指の筋肉の滑らかな動きを通して紙面に表現される 理法と呼ぶことにする。 構造解析的な手法は、認識対象とする文字の集合 に安定的に出現する原図形を見出せる場合には、精 密な分析が行え、数字、カタカナなど、の文字につい ことになる。我々は多くの場合印刷された活字を通 てその有効性が示されている。しかしこの手法の開 してその文字の図形としてのイメージを学習してい 発に必要な原図形と、それらを用いた認識過程を構 されたこれらの記憶を引き出し、筆記具を握った手 るが、手書き文字は細かく見れば千差万別であり百 成するのに必要な原図形の属性値やその相互関係な 人いれば百通りの変形が見られる。このような個人 どの構造パラメータの選択は認識対象となる文字に が書く文字の差異に着目したものが手書き文字(筆 依存し設計者の直感に頼る面が強く、原図形の抽出 跡)による個人識別である。 法も複雑で一般的な方法は見出されていない。 手書き文字認識はこれとは異なり、書かれた文字 図形の細かな差異はできるだけ削ぎ落として、各文 一括処理法は文字図形を構成する画素情報を全体 として用いて処理する方法であり マッチングによ 字カテゴリーが固有に持っている必要最小限の情報 る認識法と統計的決定理論による認識法がその主な を抽出し、それを辞書として蓄えておく。認識の過 程では未知図形と、辞書との間で何らかの比較を行 ものである。マッチングによる認識法では単純に重 ね合わせて、その重なりの程度で、マッチングの度合 い、最も類似した文字カテゴリーを探し出し、認識 いを算出する。これに対して統計的決定理論による 結果として出力する。 従来から開発されてきた多くの文字認識手法は、 認識はマッチングの過程に画素情報の確率的な傾向 文字図形を何らかの原図形の構造物とみなしている かどうかによって、大きく二つに分類することがで きる。すなわち、一つは文字図形をある原図形の集 合に分解し構造ノミラメータの値に基づいて認識を行 推定しようとするものである。従って、統計的決定 理論では膨大な学習データから各文字カテゴリーが 持つ確率的な情報を抽出しておき認識に利用する。 を埋め込み未知図形が属するカテゴリーを確率的に いずれの方法をとるにしても認識を行う前に手書 き文字が持っさまざまな変形(歪み)を修正し、ま う方法であり、いわゆる構造解析的な手法と呼ばれ 5 3 茂 榎園 置ベクトルを rとすると変換した後の位置ベクト ノ レr 'は とまりを良くした上で特徴の抽出を行うことが認識 率を向上させることにつながると考えられる。一般 的に手書きの文字は、 1)大きさの不揃い、 2 )平 r'=Ar+a 行位置ずれ、 3) 縦横長の比率の歪み、 4) 回転な 1i GG ぺ L 寸Illi-﹂ 十 11111111・﹂ ﹁ ﹁111111114 xy ﹂ ﹁11111111 ﹁Billi--J 一 一 んん ﹁Ill--L ﹃ 正する方法を用いた前処理法を構成して、各文字カ ﹁Ill11114 ﹁ IIlli--EI﹂ の重心に着目しつつ上記 1、 ) 2)、 3) の変形を修 xy どの変形を含んでいる。そこで今回新たに黒点分布 ムん で表される 。 また行列で表せば テゴリーの各画素が黒く塗りつぶされる確率を求め となる 。この関係を平方位置ずれ、大きさの不揃い、 たところ良好な結果を得たので報告する。 縦横長の比率の不揃い、回転ずれなどに適用する。 移 て し ﹂ ル AU'I ﹁lili--llJ 'IAり が認識率の向上につながると考えられる 。 ここで本 ﹂ ﹁1111111 修正して文字図形のまとまりを良くしておいてから、 特徴抽出や標準ノミターンとのマッチングを行うこと E A 手書き文字がもっ前述のようなさまざまな変形を 動= 文字図形の切り出しと正規化 戸行= 平 ti 2. [~]=[日] [~] +[ : l 実験で、 行った前処理法について述べる o 実験で使用 した手書き文字のデータベースは電子技術総合研究 =[~] + [ : l 所が収集した「手書教育漢字データベース」 ( E T L 8 B 2 ) である。本データベースは平仮名 7 5 種類、漢字 8 8 1種類、合計 9 5 6種類の文字カテゴリ ーについて、それぞれ 1 60サンプルが集められたも x ' =x+a } 動 移 る す= a O 行コ 平か α 向。 寸 ,Il1111J ﹁Illi--L ﹂ 寸Ill111 xy Illi-﹂ o λ 1 1 1川﹂ x y 〆 ﹁ 1111L λobb λ ﹃ 文字図形が存在すると判断して切り出しを終る。 方> ぺ ん 11111111J するか調べて行き、始めて黒点が存在した列の聞に Y ¥﹁ L 部へ向かつて各列をスキャンしながら、黒点が存在 ﹁ I l l﹂ ドト﹂ l﹁ 一一一一一一 て行き、始めて黒点が存在した行の聞に文字図形が 存在すると判断する。同様に左端右端方向から中心 ﹁ t1111111J ﹁│││ーl﹂ をスキャンしながら、黒点(1)が存在するか調べ t, y として 出すには、上端下端方向から中心部へ向かつて各行 V 0λ ロ -λ0. 4 百μritIlli--L 4 2. 1 文字図形の切り出し 文字図形は 6 3行 X64列のメッシュ上に黒点を 1、 白点を 0として表されている。まず文字部分を切り 方小 市ー = して以下に述べる手法を用いて変形の除去を行った。 E ‘ , が o(白)で表現されている。この実験データに対 を大 形拡 図) 原 2 ターンで構成されており、文字部が 1 (黒)で背景 y ' =y+a2 。 のである。各サンプルは 6 3行 X64列のメッシュパ 2. 2 文字国形の修正 前述のように、手書き文字はさまざまな図形的歪 x'=Jx みを含んでいる。ここでこのような歪みを除去する y'=砂 方法について述べる。文字図形を 2次元平面に描か 原図形を x方向へ λ倍 、 れた黒点分布とみなせば、座標変換の手法により歪 る 。 みの除去ができる。記入枠内に描かれた文字図形(黒 (3) 伸縮歪み 点の集まり)に属する 1 点の座標を変換するには一 般的に次のような関係式を使えばよい。いま aを位 置ベクトル、 Aを座標変換行列、図形内の黒点の位 5 4 y 方向へ λ倍拡大縮小す 手書き文字認識のための前処理法 一 一 O a つ μ よ n u > μ 0 0 心を計算し、その重心が背景画面枠の中心 に来るように平行移動する。この過程を図 1 . に示す。 ﹁ ﹁ liti--J x y Ilili111L ﹁lili---- ﹁1111111﹂ μo 一 一 ﹁ lllJIBI Ill1Illi--J M1yt y 寸 一 一 一 μ ﹁Ill111111111L rillLml μ 。ν ' と ﹂て 1111111lit-J ﹁Illi----Ill-- 二し A 01 一 μ μ07 ぞれ拡大縮小する。 3 2 で得られた文字図形の黒点分布の重 一 ー μ 一 一 y x ' =μx (1)文字図形の切り出し 原図形を x方向へは μ倍し、 y方向へは μ の ム π ハ り く= く 一 一 0 1111111 ﹂ α 0θ 円、凶円レ 旧 onAv ﹂ 且 F 3 .F3 0 一 , 、 ﹁lIllit-- 転= A 回 る 4 かっ 1倍 す a=0 として (2)規定の枠の大きさに拡大縮小 [目立。ロ][~l x ' = XCOSθ+y S l n θ y ' =-xsinθ +y c o sf ) 原図形を原点の周りに Oだけ右回転する。 3. 3) (3)黒点分布の重心 (G) を求める 前処理実験 今回行った前処理法では文字図形の黒点分布の重 心を常に背景画面枠の中心に置くことに注意を払っ た。次のような手順で前処理を行う過程を C言語で 作成し平仮名 75文字カテゴリ一、漢字 245文字カ テゴリーを対象に実験を行った。 0 1 背景の画面枠の中から文字図形を切り出す。 0 2 切り出した文字図形部を背景画面枠の上下 ( 4 ) Gを背景画面枠の中心へ移動 左右にマージンをとった規定枠内に入るよ うに、横 ( x ) 方向、縦 ( y ) 方向に、それ . 前処理の過程 図1 5 5 0 0 本実験で得られた結果の一例を図 2 . に示す。比 ぬ 叩 日 ヲ う 一 一 i111LI﹃│一一 ヨ 1 f E H日 日 川 ヒ ト ト u ﹄ a zl E 旧 川 行 附 則 溝 曜 時 閣 町 田 ト - 4 aJ , z ¥ f 川町剛鷹鷹晦曝晴晴閣閣悶E 1 一 JU 1剖 HH朝 樹 園 帽 削 四 百 日 卜 H制 朝り 引f , -ous 1 1剣 1 1日 1 ifili-二 E 川 府 閣 は 何 回 m m m m何 回 府 樹 園 町 田 卜 一 2 U33dsJdou 乃︼ 3 2 2 2 - O z a -- m 府 間 m m E 1 1ト 卜 卜 卜 E E 町 四 回 目 印 FL - 一 一 1 王 E 回 何 回 王 fA U ' J C 3 2 2 合司 M 3 2 2 一 主 川 町 旧 王 王 1 一 4 0 3 一 一 一 E主田川町王十 3 2 2 3 3 3 3 3 J J -十 王 m w E五十一 3 9 - R 2 一王 国 m m E 1 3 33 、 3 J J d - 3 3 町沿一 卜 王 山 由 団 十 -十 王 町 王 王 t凹 町 田 十 一 一︼ Mニ o u J Z 3J 二 一 ザ 司 MJ -U3 4f じJ a e -ト E r土E 一 - uDU '一 司 ‘ 十 四 回 目 τムト aU3D 一 一 一 - J M 3 勺。 一 十 回 田 町 E 卜一 a - 4 3 3 一卜 E 卜 J 一 J- 一十 十 卜 一 一 一十十 一 2 9 二 一1 困 問 団 E 十 一 3 U D 2 0 ¥ 一 卜 │ 十-一 3一 一 一十 王 国 間 田 E 卜 一 2、,, 3 n 一一十 日 一 一玉王 E 卜 一一-一 1 E 田 町 四 回 問 王 一 一十 J 3 3 M 2 3 2 。 一 一 玉 田 王 卜 一 一 一 十 王 国 同 閣 閣 四 回 巨 十 一 3 3 ニヨ勺 ω2 ︼2一 十E 凹王 卜 一 一 一十 王 国 府 園 鷹 閣 官 凹 十 一 一 a n o a ロ'明、, J一ト E 回 目 玉 一 - 一 一 十 回 同 川 岡 山 鷹 閣 回 目 玉 → 一 一 ﹄ 司 z e、 J j d d 司 3 ω 3 0 一 一十 E 田 剛 鷹 甥 鷹 閣 悶 王 f 一 一 d , 4 2 ' n 4 2 3 3 J 一十 王 国 国 王 ト 一 一 二 一 王 国 国 王 十 一一-一 十 回 目 閣 鷹 鷹 閣 閣 町 一 ト 十 一 一 U F an U M 一 王 問 団 閣 闘 園 園 姻 何 回 王 十 一 一 。, 3 ‘、。, B J 3 P J 3 一 一 王 国 田 E 卜一 、一 一 一 一 3J23 9 3 d 一 一 サ 回 眉 国 王 一 ら 3 z 一1 王 将 町 府 間 眉 目 園 町 府 川 E 1 - 一 2 吋 一 十 旧 国 府 間 旧 山 官 官 同 刷 問 川 王 f 一 一--一一 4 a ら一 一 十 回 周 回 E 一 ' 3 3 乙 一一一 一 一 十 旧 周 回 回 一 一 “ , 一 卜 王 山 口 m m E 山 町 田 川 凶 行 自 川 E 王 十 十 │ 一 3 よ a -f l E 卜 E 凶 官 官 同 十 一 一 一 J一十 回 凶 田 川 町 則 山 間 川 町 閣 鷹 同 凶 山 川 山 田 E 卜一 3 王E 回唱団団居回卜十一 一 十 十 FL 一 十 回 目 w w q E m m m凶 閣 情 鷹 鷹 閣 閣 官 王 卜 一 J M 2 E m 田 町 田 岡 昭 鷹 鷹 園 町 田 凶 王 十 E E 田 町 閣 同 町 四 国 切 り 何 閣 閣 閣 鷹 晦 閣 屑 E 卜一 3 U 3 卜 玉 川 川 四 国 閣 海 鷹 鷹 閣 回 何 回 目 田 町 屑 閣 晦 鷹 鷹 剛 閣 閣 閣 閣 制 鷹 鷹 鷹 姻 間 期 旧 王 ト 一 aJ 一 十 回 問 眉 眉 間 幅晴 海 鷹 鷹 園 園 個 回 目 園 閣 鷹 鷹 鷹 圃暗躍晴間閣園同居何回底思回閣回世間i 一 e G r E王 山 居 間 鷹 鷹 園 園 閣 関 山 問 問 問 団 関 鷹 晴 晴 閣 国 円 周 回 E E 回目岡町四回世間 E 卜 o a 一 一 ' 一一一 卜 卜 王 悶 回 園 周 回 田 王 王 王 王 王 田 町 間 凶 閣 周 回 旧E ト ト ト 十 王 王 田 町 四 四 十 一 。 J 。一 一 一 十 十 王 回 目 眉 団 主 十 十 一ト 十 ト 王 同 四 問 問 田 王 十 十 守 - 一 十 十E 回 府 間 主 一 s 一 十 回回目王卜 一一 一卜E 田 町 川 凹 十 卜 - 一 一 十 十 王 国 間E 卜 a、 , BB 一 u n z J J一卜 王 凹 m 五 1 一 3 - 0 3 一l E m 川旧 E 1 4 3 2 一f t E m加十一 -卜 m 田 町 田 E 十一一 、 BMO一十王団四十十一 c u e 30υ 一 十 王 旧 国 王 一 一 。。 一 十 王 凶 沼 田 一 J o u J卜 王 王 国 王 十 一 ︼ 包 。 3 一王 主 旧 囚 旧 l l 一 一十 王 国 間 田 町 卜 } 一一一一 十 王 回 目 玉 十 一 王王王王十一 D 3 2 3 un ロ g O 2 -ト 王 十 王 十 一 白 内 , o一十 回 間 四 日 m 主 卜 十 一十 王 王 回 目 玉 十 十王国間旧田王王王王王国白田王一 n s J 3 一十 十 卜 王 十 一 0 ・ 。 。 。 一 一 33 。。一 十 岡 田 町 回 目 回 目 四 回 田 町 田 王 一 ηU23一十十十十 一 一十主間四回困層周回四明田十 J 3 0一一一十 一 勺 。 、 。 ョ 一 卜E 凶回眉層明困層凹王一 。 一 一一- 3 0 C e g o 。。。 。 3 0 3 3 一。一一 3 0 3 。 ano 十 王 回 目 国 田 王 卜 一 4 3 。。 a C 3 0 3 3 ,。 9 0 a 一 一十 十 十 十 一 4 0 2 J 一 33 2 3 0 c。3 3 3 0 3 J 。。。 一 3 U3 3 J h J J 3 2 3 2 3 図 2. 前処理結果の一例 5 6 + 較のために従来の前処理結果の一例を図 3 .に示す。 王 田 眉 園 鷹 得られた結果は 63行 X64列のマトリクス状の実数 データであるが、数字を印刷しでも全体像を把握し に くい。従ってここでは各画素の確率値を表 1 .に 示すように、 9段階に分けキャラクタモードで印字 した。つまり大きい確率値をとる画素ほど文字の画 印字文字 確率 ー+ -----一一ー一一一一一一一一一一一一一一一一一一一ーーー ーー一一一一一一一一一ーーーー +一一一一一一一一一一一一一一一一一一一一一一一一ーー . 確率と印字文字 表1 が黒く塗りつぶされる回数をカウントする。更に 140で、割った値を黒く塗りつぶされる確率とする。 。 一 0 . 0 . 1未満 0 . 0 を超え 0 0 . 1 以上 0 . 2未満 0 . 2 以上 0 . 3未満 0 . 3 以上 0 . 4未満 0.4以上 0 . 5未満 0 . 5 以上 0 . 6未満 0 . 6以上 0 . 7未満 0 . 7 以上 1 .0以下 実験結果と検討 4 . 数が多く、印字したとき濃く見える印字文字を割り 当てて印刷した。 各文字カテゴリー 1 60 サンプルのうち先頭から 140サンプルについて、前述の 1 . . _ , 3 の処理を 茂 榎圏 行った後、重ね合わせて各文字カテゴリーの各画素 手書き文字認識のための前処理法 L 占 コ J 一 匂 A 侃 マ J 内 司 吋 目 il--E王下九一LEE-tEEE卜1卜-4一 B 3 3 l rrL一IEfγ 仁 E E f m m 川 川 山 川 E E t L} │ 一-- e E H HH U H H H H H H H H 川 加 川 川 山 王 γ 仁 1 - 一 B ill--川川川川川川川川川川川川川川川川川川川出川i王1f1 1 E 一 上 川 川 川 川 川 山 川 川 王 E E E E E E f E E 川 凹 川 川川 王 │ │ 一 --Eドし正ドL川正-IE正一i卜EE卜lE﹁↑LEI - E E f 仁 E 川 川 川 川 E 1 1 4 -11王FLrtEFLE-fill卜卜卜!一1 1 卜 l i p E E 王 E L E E 山 一 上 玉 1 4 - │iEEEドL仁し正下しlili 一 一1卜111ICLEFしに土kE王Fし1 --A司 4 卜 十 卜 王 γ 仁 王 E ド し 正│ 一 l i l l - 4ill-ト一{しド¥LEE-ト1-a -- 一 4 一 一 -十 1ト 十卜王下LEft-tE 今 一 . 一 l i l- E E E 五 十 十 一 22 3凶 4 4 一ト│一トヒド仁王一LE十│一一 1 1 011ETtek-lj 3 4 a 4 -11ドLドLfドしドLEI--一 444一4→lEEE卜 0 2 - 一一- -一一vrf十tlvrll 441lr上どしド﹄ドしFLei t--LJ1jtt-一233 e' 4 ・河 一 一 一卜ELド仁 EEFLE-- - 4. 3 一 401じしドLト 卜ト一一 - - ↓ 4 一 - LHHドLE--ドしl し F -1411111-- e-- 一-一しlLlLlrEHU HU HH HH ドしドしELrヒilトl e, I l l Illi--一 一 ト ト 1 f 仁 王 川 円 N W W 川 川 川 ﹁ k e t 一 = l ト 卜 卜 1 卜 1 4 - - - FIllEHHHHH HけH iHe卜正││一-4 hHh hI 一 “ 一 7 CU 1卜Erk-十卜- 一 -e 一-卜EHHHHパ刺刺けけwwm-K11一 回 -2 u,S230r 1tEEFし仁Lil - - - f E E H U 1 円 剖 刺 判 制 H H H H E e l - - - 一 - A J2 }Il a-・233aJ3﹄ 卜1ドLEFFトf一 - 一 - - llドぃ川山川 町円川町閉山山川附円川川一ト11一 --一 1111EEEEEトIf--一4 一 一卜卜一LHHけHUけn11ηHHH汀汀HHHFLドLil-- 一-UU3、,Jas - - E E E E ト ト ト - 一 - - 一 - 1 王 H H H リHnけ何日HHHqHHH円行HHEll---1一 JJ,﹄ M2D J 一 lr川川川wmwwU旧別府川HW阿川N山EE卜1卜一1卜 一一一 -fドLEr上川EEl- 4 一 一 、' J ‘ - 一 - 一一一卜二4 E l l i n i - - l i l i - - 1日 I E f - - 卜 il卜ドLEHEE1トι14- 一 ー l z I H H H U P q H q ぃ q H H I υ 1 ぃ いE 日 サE U qo H r l i q i q e ! U ﹂ ・ト1卜EV仁川川川正ドト11ト - 一 一 一 今 一 1 E E - 上 川 町 W W 川 川 川 川 山 川 町 円 W W 円 山 川 川 │ 十 1 E 卜 ﹂ 11 - - 4 3D J -11卜lEm川川川山川EfKEf--4- a 1 1 1 E 川 川 川 M N 川 川 川 川 川 川 w w w 桐 刈 m w w w E E 一 K E E l - 一一 ps F 守lE正一上正Em旧山川町門川町川川F E E l 十 1 1 卜 l E - L 山 川 川 門 川 川 川 川 山 川 門 川 目 閣 剛 倒 閣 閣 閣 m H W 問 E E f E 卜 一 日一卜E-LE山ド工川口HHパバ剣汀HHH川EEγ仁王1Eγ仁EEHH川口町川UWNN川門川口目白川河副咽判判明制 n LEI -HnHH川﹁ト lFE-ト川川川川wmw閣制倒閣聞は山円川mEEEE川川川川川口州倒閣制wwwwm府川判明同行別問閣刷間同閉山川 町 川川正│一 ﹂ド仁川川山川凶mmU附問鷹鷹闘閣mH別府凶田mm川川wm回目引閣閣晦閣鷹同州門川UmumnU回目nwmN四回目mU同日間川川王イ│一ー i 正 川 川 川 川 川 W 閣 閣 鷹 鷹 閤 閣 畑 町 同 日 回 目別 間引山川WWN川口町附則削附則剛剛山川円り山川山川 川 川旧出山川町川川町門町WE1卜 4 - ' 卜 l F L EEEm川町円制組組制剖喧ロリけHHHHHH門川 剖1 割1 削1 相対 制1 nH H1 HH F1 ぃEHF EH H1 Hu 府H -L1一 1H1 1口 1け1 1岨 1判1 1H 1H1 1H 1E1 1H 1 11 'IE川川山川間山日目日目白川口問川 E FhEEE﹁川山川目NWN円閣削附則何回目mErKEF-EEFLE王山間川町四円川正一守 一 --1王王山何回悶別府川mmEFしEF卜一上rkヒE王川山川川刊行行川UW川川王FE1川旧川正1 -卜rkE羽田川田川王王王E王ト山川川川門川mEE卜→トE川mmEle 一1E川旧川EE卜卜トト一川川川山凹EEl--EE一トド上E1ト i聞 川 王 王 ト ト 一 十王王王E王十 -'一 IF 3一 卜 十 王 川 山 王 十 ト 1 十 一 十 王 王 E E E 1 -ト 一 a ' l ;下 a トlf1 一トト一 叩 今後はこの前処理法で、の結果を元に認識実験を行っ いる。 分かる 。 このことから、今回の手法は比較的簡単な .図3 . を比較してみると、図 2. の方が 図2 方法であるが良好な前処理が行えることが分かつた。 (1 )I あ」の第 1画目の横棒が濃く明確になって ていきたいと考えている。 (2) 左下の曲線部も明らかに濃くなっている。 参考文献 かったのが 46個の画素に大幅に増加した。 1)榎園茂,長田一興,日高達:“一括処理法に (4) 0 . 0を超え 0 . 1未満の画素がコンパクトにま 2)榎 園 茂 , 日 高 達 : “ 一 括 処 理 法 に よ る 手 書 き といったことがわかる。このような所見は他の多く 漢字の認識"九大工学集報,第 58巻,第 5号 , の文字カテゴリーに対しても同様に見られた。 とく 729・735 パターン認識理論 J森北出版, 1989, 3)飯島泰蔵:I 23・29 れた。これより今回の結果の方が従来行っていた前 に (3) (4)の所見は文字カテゴリーによらず見ら 処理法よりまとまりの良い確率データであることが 5 7 ーーーー一一一一一一一+ ー ーー一一一一一一一一一一一一一一一一一一一一 ー一ー一 一 一一 一 一 一ー一一一 勾 ー ー ー一一一一一一一一一 ・一 + 3 223 3 JJ 一 一十 一一一一一一一一ー 一 ー一ー一一一一一一 ー一一一一一ー一一 一ョ ー』一一一一一一一一一一一一一一一一一一一一一一一一ー一一一一一一一一一一+ ー一一ー一一一一一一一一ー今一一一一一一 一 一 一 一一一一一一一一 一 一一一一 】 図3 . 従来の前処理結果の一例 (3) 0 . 7以上の値を持つ画素が 6個の画素しかな . の方はまとまり とまっているのに対し、図 3 よる手書き漢字の認識実験"電子情報通信学会 無く広く分布している。 .J71-D,No.9, l 1883・1886 論文誌 D,Vo