目の特徴を用いた漫画キャラクタの認識

by user

on 28 марта 2017

Category: Documents

>> Downloads: 2

views

Report

Comments

Description

Download 目の特徴を用いた漫画キャラクタの認識

Transcript

目の特徴を用いた漫画キャラクタの認識

情報処理学会第 73 回全国大会
2T-3
目の特徴を用いた漫画キャラクタの認識
新井里実†
荒井正之†
帝京大学理工学部情報科学科†
1
はじめに
3
近年、インターネットの普及により容易に情報
を得たり発信したりできるようになってきた。多
くの人が自由に投稿、閲覧できるため、著作権を
侵害した動画、画像が投稿されている場合が多々
ある。投稿されている動画や画像の数は多く、そ
の全てを人の手で確認していく作業は現実的では
ない。そこで、作者同定の自動化が必要となる。
本研究の最終目標は、漫画作者を認識すること
である。本論文では、作者認識の前処理となる可
能性の高いキャラクタの認識について検討を行っ
た。認識には、キャラクタのごとに特徴が表れて
いると思われる、目と瞳を用いた。
特徴抽出
本論文では、漫画キャラクタを同定するため、
以下に述べる 7 種類の特徴を抽出する。なお、す
べての特徴値は、0.0～1.0 の範囲になるよう正規
化する。
3.1 外郭方向寄与度特徴
外郭方向寄与度(PDC)特徴[1]とは、文字認識に
用いられる手法で、線の伸びている方向を調べる
ものである。
図 2 のように、2 値画像に対して、外側 8 方向
から走査線を走らせ、白い画素から黒い画素に変
わる点を探す。1 方向からの走査は、3 回黒い画
素にぶつかる(深度 3)まで行う。ぶつかった黒い画
素から更に図 3 のように 8 方向に走査し、得られ
2 前処理
本論文では、
後に続く処理をしやすくするため、た ln(n=1,2,3, … ,8) を使って、方向寄与度
dm(m=1,2,3,4)を、式(1)を用いて算出する。m=1
次に示す前処理を行う。
(1) 雑音除去:目以外、瞳以外の部位の除去を行う。は水平方向、m=2 は斜め方向(右下がり)、m=3 は
垂直方向、m=4 は斜め方向(右上がり)を示す。
(2) 大きさの正規化:100×100 画素とする。
(3) 2 値化:256 階調の濃淡画像に対して、しきい
値を 128 とし、しきい値以上なら白、それ以
外は黒とする。
この特徴の次元数は 96 となる。
①
②
③
図 1:前処理実行後の画像
④
図 1 は、前処理実行後の画像の例である。目に
よる特徴抽出では、
①のような目の画像を用いる。
瞳の特徴抽出では、特徴抽出法によって②～④の
ように前処理を変える。②は、①から瞳以外を除
去したもので、面密度の抽出に用いる。③は、②
の縦横比を変えずに 100×100 画素に収まる大き
さに拡大したもので、外郭方向寄与度特徴の抽出
に用いる。④は、②の縦横比を無視して 100×100
画素に引き伸ばしたもので、重心と線密度の抽出
に用いる。
Cartoon Characters Recognition Using Eyes Features
† Satomi ARAI, Masayuki ARAI
Department of Information Sciences, School of Science
and Engineering, Teikyo University.
図 2:走査線と深度
図 3:黒点からの走査線
3.2 重心
2 値画像に分布する黒い画素の重心を求める。
次元数は、x 座標、y 座標の 2 次元である。
3.3 線密度(大局的・局所的)
線密度[2]は、PDC 特徴と同じく文字認識に用い
られる手法で、走査線上に線が何本あるかを示す
ものである。大局的、局所的にみる。大局的の場
合は、図 4 のように縦、横、斜めの 4 方向で走査
し、線の本数を数える。局所的の場合は図 5 のよ
2-445
Copyright 2011 Information Processing Society of Japan.
All Rights Reserved.
情報処理学会第 73 回全国大会
うに、1 つの画像を左上、左下、右上、右下に 4
等分した上で、それぞれについて大局的と同様に
線の本数を数える。次元数は、大局的が 4、局所
的が 16 となる。
図 4:大局的の場合
図 5:局所的の場合
3.4 面密度(全体・4 分割・9 分割)
面密度は、2 値画像に存在する黒い画素の割合
である。面密度は全体、4 分割、9 分割の 3 種類
でみる。4 分割、9 分割は、画像の縦横を 2×2、
3×3 で等分したものである。
次元数は、
全体が 1、
4 分割が 4、9 分割が 9 である。
4
の方が高くなった。ユークリッド距離では、1 位
分類率はコサイン類似度に比べて低いが、2 位累
積分類率が 86.3%、3 位累積分類率が 93.8%と上
がっていった。対して、コサイン類似度では、1
位分類率は高いが、2 位、3 位累積分類率はあま
り上がらなかった。
ユークリッド距離、コサイン類似度ともに、3
位までに正分類されなかった画像の中には、図 6
に示すように同じキャラクタ同士でも似ていなか
ったり、他のキャラクタと似ていたりして、人間
の目で見ても識別が難しいものが多くみられた。
実験結果と考察
4.1 識別実験の条件
異なる作者が描く 10 種類のキャラクタを用い
た。各キャラクタの画像を 8 枚ずつ、合計 80 枚
のサンプル画像を用意した。3.1～3.4 節の方法で、
目全体と瞳に対してそれぞれ 7 種類の特徴抽出を
行い、全 264 次元のベクトルとした。
識別には leave-one-out を利用した。比較の結
果、ベクトルの距離が短い、ベクトルのなす角が
小さいデータが、同一のキャラクタであった場合
は正分類、異なるキャラクタであった場合は誤分
類とした。
ベクトルの距離の比較はユークリッド距離、ベ
クトルのなす角の比較はコサイン類似度により行
った。各特徴の次元数の偏りをなくすために、次
元数に反比例した重みをつけた。
4.2 実験結果
特徴抽出を行い、識別実験を行った。1～3 位累
積分類率を表 1 に示す。n 位累積分類率とは、分
類結果の上位 n 位の候補の中に同じキャラクタの
データが入っている確率のことである。
表 1:キャラクタ識別実験の結果
1位
2位
3位
距離(%)
77.5
86.3
93.8
類似度(%)
82.5
88.8
88.8
4.3 考察
表 1 に示す通り、1 位分類率はコサイン類似度
の方が高く、3 位累積分類率はユークリッド距離
図 6:同じキャラクタの画像
例
漫画の絵では、場面やキャラクタの表情によっ
て、目全体の形や瞳の描き込みが大きく異なって
しまっている。それが、分類率があまり高くなら
ない原因になっていると考えられる。
今回は 10 種類のキャラクタを用いて実験を行
い、3 位累積分類率がユークリッド距離で 93.8%
となった。漫画には多数のキャラクタが存在する
ため、今回の 7 種類の特徴だけでキャラクタや作
者を同定することは難しいと思われる。
5
おわりに
本論文では、漫画キャラクタを識別するために、
主に特徴抽出法の検討を行った。実験を行った結
果、1 位分類率がコサイン類似度で 82.5%、3 位
累積分類率がユークリッド距離で 93.8%となった。
どちらの評価方法を用いても、今回の特徴抽出手
法だけでは、数多くのキャラクタを特定すること
は難しいと思われる。
今後の課題としては、
新たな目の特徴の検討と、
人間が見ても同定が難しそうな目の画像があった
ことから、目以外の部位についての特徴抽出が挙
げられる。
本論文で提案した手法では、類似キャラクタの
検索、キャラクタマップの作成等に利用できると
考えている。
6
参考文献
[1] 萩田紀博，内藤誠一郎，増田功：“外郭方
向寄与度特徴による手書き漢字の識別”，信学論
D，Vol.66，No.10, pp.1185-1192 (1983).
[2] 萩田紀博，増田功：“大局的・局所的線密度
を併用した手描き漢字の分類方式”，信学論 D，
Vol.65，No.6，pp.734-741(1982).
2-446
Copyright 2011 Information Processing Society of Japan.
All Rights Reserved.