Comments
Description
Transcript
OCR機能を搭載した 「iPhone」アプリの開発
2013年度 情報教育コース 卒業研究 構想発表 OCR機能を搭載した 「iPhone」アプリの開発 所 属 : 仲野研究室 指導教員: 仲野誠 発 表 者: 神夏子 目次 §1 開発動機 §2 OCR ■OCRとは ■日本語対応のOCRエンジン ■インストール ■テスト ■TesseractとNhocrの比較 §3 今後の課題とスケジュール ・開発環境 ・参考サイト §1 はじめに ■研究動機 OCR機能が搭載されたアプリをよく目にする… OCRについて 学びたい!!! OCR機能を使って 何か便利なアプリを 自分でつくってみたい! 名刺認識管理アプリ,手書きメモ認識アプリ, レシート認識家計簿アプリetc… ■アプリ内容について、、、 手書き文字認識のメモ帳アプリ 画像文字認識の家計簿アプリ ・既に同じ機能がついたアプリが存在していた ・OCRエンジンがどの程度認識するのかわからなかった OCRエンジンの テスト アプリ内容の決定 §2 OCR ■OCR( Optical Character Recognition )とは 画像情報 ・光学的に読み取り ・前もって記憶された パターンと照合 文字データ ※OCR(Optical Character Recognition)の機能を備えた装置 →OCR(Optical Character Reader) ■日本語対応のOCRエンジン Tesseract-OCR ・1984年~1994年Hewlerr Packardにて研究開発 ・2005年オープンソース化 ・現在はgoogleがスポンサー ・認識可能言語は日本語含む30カ国語以上 NHocr ・東北大学、サイバーサイエンスセンターの 後藤研究室にてweekend projectとして開発されてい るフリーのエンジン ■Tesseractのインストール パッケージ管理システム homebrew いくつかの エラー Tesseractをインストール 解決法 ・libtoolsをインストールしておく ・XcodeでCのコンパイラをインストールしておく ■NHocrのインストール nhocr Makecharフォルダ 一緒にインストール エラー O2-tools ■NHocrのインストール ・ファイル形式 .ppm .pgm .pbm ファイル形式 変換ソフトウェア .jpg Tesseract-OCR ■英文でのテスト 誤認識は赤下線の部分のみ 認識率は約98% NHocr ■英文でのテスト 日本語限定対応のため、 日本語が混ざる。 認識率は約70% ■日本語でのテスト 短い文章の ひらがな、カタカナ 長い文章の縦書き ■日本語でのテスト 認識は誤りだらけだが、 縦書きを自動で横書きに してくれる 認識率は約65% Tesseract-OCR 〜長い文章〜 ■日本語でのテスト NHocr 〜長い文章〜 縦書きはほぼ認識しない。 ■日本語でのテスト Tesseract-OCR 〜短い文章〜 認識率は約60% ■日本語でのテスト NHocr 〜短い文章〜 認識率は約82% ■日本語でのテスト Tesseract-OCR 〜レシート〜 (数字と文字の 組み合わせ) 認識率は約62% フォントや大きさが違っても 読み取る事ができる ■日本語でのテスト 認識 できない NHocr 〜レシート〜 (数字と文字の 組み合わせ) 認識率は約55% フォントや大きさが違うと認識しない。 数字を認識しにくい。 ■TesseractとNhocrの結果と比較 Tesseract NHocr 英 語 ・非常に高い認識率 日 本 語 ・長文、短文ともに認識率は低い ・文字の大きさやフォントが違うと 認識しにくい ・大きさやフォントが異なる画像 ・縦書きの認識はほぼできない でも認識できる ・長文の認識率は低い ・縦書きを横書きとして変換でき る ・短文の認識率は非常に高い OCRops ・認識率が低い ・英文を日本語として認識する場合 がある 認識率が上がる §3 今後の課題とスケジュール 7月 ・OCRopusの検討 ・アプリ内容の検討・決定 8月 ・Objective-Cの学習 ・OCRエンジンをiOS SDKで コンパイル 9月〜ドイツへ留学 ・Objective-Cの学習 ・Xcodeの学習 ・機能の検討 (留学先が情報分野に特化した 大学の為,引き続き学習を続け る。) ・開発環境 OS 使用言語 開発ツール OCRエンジン Mac OS X 10.7 Objective-C Xcode 4.6 未決定 ・参考サイト ・NHocr http://code.google.com/p/nhocr/ ・Tesseract-OCR http://code.google.com/p/tesseract-ocr/ ・拡張子辞典 http://www.7key.jp/data/ext_new/p/ppm.html ・画像 http://app-liv.jp/312391317/ http://app-liv.jp/338520753/ http://nochineta.net/weblog/archives/9591 http://www.jiyu-kobo.co.jp/ytl/ykyvm.html http://www.field-works.co.jp/ ・用語 http://www.sophia-it.com/content/OCR http://matome.naver.jp/odai/2130267984478087401 http://www-al.nii.ac.jp/~kameda/blog/cmlog/0910211714.htm