Comments
Description
Transcript
目の特徴を用いた漫画キャラクタの認識
情報処理学会第 73 回全国大会 2T-3 目の特徴を用いた漫画キャラクタの認識 新井 里実† 荒井 正之† 帝京大学理工学部情報科学科† 1 はじめに 3 近年、インターネットの普及により容易に情報 を得たり発信したりできるようになってきた。多 くの人が自由に投稿、閲覧できるため、著作権を 侵害した動画、画像が投稿されている場合が多々 ある。投稿されている動画や画像の数は多く、そ の全てを人の手で確認していく作業は現実的では ない。そこで、作者同定の自動化が必要となる。 本研究の最終目標は、漫画作者を認識すること である。本論文では、作者認識の前処理となる可 能性の高いキャラクタの認識について検討を行っ た。認識には、キャラクタのごとに特徴が表れて いると思われる、目と瞳を用いた。 特徴抽出 本論文では、漫画キャラクタを同定するため、 以下に述べる 7 種類の特徴を抽出する。なお、す べての特徴値は、0.0~1.0 の範囲になるよう正規 化する。 3.1 外郭方向寄与度特徴 外郭方向寄与度(PDC)特徴[1]とは、文字認識に 用いられる手法で、線の伸びている方向を調べる ものである。 図 2 のように、2 値画像に対して、外側 8 方向 から走査線を走らせ、白い画素から黒い画素に変 わる点を探す。1 方向からの走査は、3 回黒い画 素にぶつかる(深度 3)まで行う。ぶつかった黒い画 素から更に図 3 のように 8 方向に走査し、得られ 2 前処理 本論文では、 後に続く処理をしやすくするため、 た ln(n=1,2,3, … ,8) を 使 っ て 、 方 向 寄 与 度 dm(m=1,2,3,4)を、式(1)を用いて算出する。m=1 次に示す前処理を行う。 (1) 雑音除去:目以外、瞳以外の部位の除去を行う。 は水平方向、m=2 は斜め方向(右下がり)、m=3 は 垂直方向、m=4 は斜め方向(右上がり)を示す。 (2) 大きさの正規化:100×100 画素とする。 (3) 2 値化:256 階調の濃淡画像に対して、しきい 値を 128 とし、しきい値以上なら白、それ以 外は黒とする。 この特徴の次元数は 96 となる。 ① ② ③ 図 1:前処理実行後の画像 ④ 図 1 は、前処理実行後の画像の例である。目に よる特徴抽出では、 ①のような目の画像を用いる。 瞳の特徴抽出では、特徴抽出法によって②~④の ように前処理を変える。②は、①から瞳以外を除 去したもので、面密度の抽出に用いる。③は、② の縦横比を変えずに 100×100 画素に収まる大き さに拡大したもので、外郭方向寄与度特徴の抽出 に用いる。④は、②の縦横比を無視して 100×100 画素に引き伸ばしたもので、重心と線密度の抽出 に用いる。 Cartoon Characters Recognition Using Eyes Features † Satomi ARAI, Masayuki ARAI Department of Information Sciences, School of Science and Engineering, Teikyo University. 図 2:走査線と深度 図 3:黒点からの走査線 3.2 重心 2 値画像に分布する黒い画素の重心を求める。 次元数は、x 座標、y 座標の 2 次元である。 3.3 線密度(大局的・局所的) 線密度[2]は、PDC 特徴と同じく文字認識に用い られる手法で、走査線上に線が何本あるかを示す ものである。大局的、局所的にみる。大局的の場 合は、図 4 のように縦、横、斜めの 4 方向で走査 し、線の本数を数える。局所的の場合は図 5 のよ 2-445 Copyright 2011 Information Processing Society of Japan. All Rights Reserved. 情報処理学会第 73 回全国大会 うに、1 つの画像を左上、左下、右上、右下に 4 等分した上で、それぞれについて大局的と同様に 線の本数を数える。次元数は、大局的が 4、局所 的が 16 となる。 図 4:大局的の場合 図 5:局所的の場合 3.4 面密度(全体・4 分割・9 分割) 面密度は、2 値画像に存在する黒い画素の割合 である。面密度は全体、4 分割、9 分割の 3 種類 でみる。4 分割、9 分割は、画像の縦横を 2×2、 3×3 で等分したものである。 次元数は、 全体が 1、 4 分割が 4、9 分割が 9 である。 4 の方が高くなった。ユークリッド距離では、1 位 分類率はコサイン類似度に比べて低いが、2 位累 積分類率が 86.3%、3 位累積分類率が 93.8%と上 がっていった。対して、コサイン類似度では、1 位分類率は高いが、2 位、3 位累積分類率はあま り上がらなかった。 ユークリッド距離、コサイン類似度ともに、3 位までに正分類されなかった画像の中には、図 6 に示すように同じキャラクタ同士でも似ていなか ったり、他のキャラクタと似ていたりして、人間 の目で見ても識別が難しいものが多くみられた。 実験結果と考察 4.1 識別実験の条件 異なる作者が描く 10 種類のキャラクタを用い た。各キャラクタの画像を 8 枚ずつ、合計 80 枚 のサンプル画像を用意した。3.1~3.4 節の方法で、 目全体と瞳に対してそれぞれ 7 種類の特徴抽出を 行い、全 264 次元のベクトルとした。 識別には leave-one-out を利用した。比較の結 果、ベクトルの距離が短い、ベクトルのなす角が 小さいデータが、同一のキャラクタであった場合 は正分類、異なるキャラクタであった場合は誤分 類とした。 ベクトルの距離の比較はユークリッド距離、ベ クトルのなす角の比較はコサイン類似度により行 った。各特徴の次元数の偏りをなくすために、次 元数に反比例した重みをつけた。 4.2 実験結果 特徴抽出を行い、識別実験を行った。1~3 位累 積分類率を表 1 に示す。n 位累積分類率とは、分 類結果の上位 n 位の候補の中に同じキャラクタの データが入っている確率のことである。 表 1:キャラクタ識別実験の結果 1位 2位 3位 距離(%) 77.5 86.3 93.8 類似度(%) 82.5 88.8 88.8 4.3 考察 表 1 に示す通り、1 位分類率はコサイン類似度 の方が高く、3 位累積分類率はユークリッド距離 図 6:同じキャラクタの画像 例 漫画の絵では、場面やキャラクタの表情によっ て、目全体の形や瞳の描き込みが大きく異なって しまっている。それが、分類率があまり高くなら ない原因になっていると考えられる。 今回は 10 種類のキャラクタを用いて実験を行 い、3 位累積分類率がユークリッド距離で 93.8% となった。漫画には多数のキャラクタが存在する ため、今回の 7 種類の特徴だけでキャラクタや作 者を同定することは難しいと思われる。 5 おわりに 本論文では、漫画キャラクタを識別するために、 主に特徴抽出法の検討を行った。実験を行った結 果、1 位分類率がコサイン類似度で 82.5%、3 位 累積分類率がユークリッド距離で 93.8%となった。 どちらの評価方法を用いても、今回の特徴抽出手 法だけでは、数多くのキャラクタを特定すること は難しいと思われる。 今後の課題としては、 新たな目の特徴の検討と、 人間が見ても同定が難しそうな目の画像があった ことから、目以外の部位についての特徴抽出が挙 げられる。 本論文で提案した手法では、類似キャラクタの 検索、キャラクタマップの作成等に利用できると 考えている。 6 参考文献 [1] 萩田 紀博,内藤 誠一郎,増田 功:“外郭方 向寄与度特徴による手書き漢字の識別”,信学論 D,Vol.66,No.10, pp.1185-1192 (1983). [2] 萩田 紀博,増田 功:“大局的・局所的線密度 を併用した手描き漢字の分類方式”,信学論 D, Vol.65,No.6,pp.734-741(1982). 2-446 Copyright 2011 Information Processing Society of Japan. All Rights Reserved.