技術紹介

OCRとは?
~「OCR技術」と「AI-OCR技術」の違い~

公開日:2023 / 5 / 31更新日:2024 / 1 / 19

“ OCRとは? ”

Optical Character Recognition(光学式文字読取)の略で、活字や手書き文字などを画像データとして取り込み、編集可能なテキストデータ(文字コード)に変換する技術のことです。

本サイトでは、OCRに関するさまざまな疑問にお答えします。

これまでのOCR技術とは?

すべての工程を「AI」ではなく、「人」が設計します。
「人」が決めたルールの範囲内で認識結果を導き出すのが、これまでのOCR技術です。

【日本語活字・手書き文字認識エンジン】(1)文字特性解析技術で、文字の特徴を抽出 (2)パターンマッチング技術で、あらかじめ登録されている文字にどれだけ近いかを計算 (3)単語辞書による言語処置で、文字列の前後関係でより正確な文字認識を実施
(例)手書き文字の「島根県松江市」を認識する場合

新たなAI-OCR技術とは?

「人」が決めたルールの範囲外の文字にも対応できるため、これまで文字認識できなかったものが認識可能になります。「AI」が繰り返し学習した内容に基づいて、認識対象の特徴や識別するポイント・ルールを導き出すことで識字率が向上します。

【AI技術を活用したOCRエンジン】AI-OCRが自動で特徴を抽出・分類!人の手によるロジック設計は不要で、特徴が無数に存在する手書き文字の認識精度が向上
(例)手書き文字の「島根県松江市母衣町」と「島根県松江市学園南」を認識する場合
~教師データを学習したAI-OCRが自ら特徴を抽出し、文字・画像を認識~

「これまでのOCR技術」と
「新たなAI-OCR技術」の違いとは?

これまでのOCR技術では、「人」の癖が入る手書き文字など、無数に存在する文字の特徴すべてを登録しきれないため、正確な認識が困難です。新たなAI-OCR技術では、文字ごとに異なる特徴を自動で抽出するため、より正確な文字認識が可能になります。

【OCR技術】 (1)一文字ずつ切り出す (2)特徴抽出 (3)分類 (4)人間が設計したルール ※無数に存在する文字の特徴すべてをカバーしきれず正確な認識が困難…
【AI-OCR技術】 (1)大量の文字データを学習 (2)特徴抽出・分類 (3)AI-OCRの学習範囲 ※AI-OCRが文字ごとに異なる特徴を自動で抽出より正確な文字認識が可能!

(例)手書き文字の「島根県松江市母衣町」を認識する場合

「これまでのOCR技術」と「新たなAI-OCR技術」
それぞれの強みとは?

もちろん「これまでのOCR技術」にも強みがあります。認識対象となる文字のパターンが限られる活字や免許証、保険証などに強みを発揮します。「これまでのOCR技術」と「新たなAI-OCR技術」を適材適所で組み合わせることで、より効果を発揮すると言えます。

OCR技術の強み

  • 大量データが無くても
    一定レベルの認識が可能
  • GPUが無くても処理が可能
  • 多様な実行環境に対応

AI-OCR技術の強み

  • 未知のものにも対応可能
  • 大量の学習データがあれば
    より高精度の認識結果を得られる
  • 追加学習による認識精度向上

AI-OCRをもっと知りたい!

AI-OCRって、どんなふうに文字を認識しているのか、パナソニックが独自開発した技術をもとにご紹介します。

AI-OCRの技術  #

文字列の塊ではなく、文字を1つずつ取り出すことにより認識精度を上げています。

OCR技術

「文字列の塊」で認識され、意図した領域の検出が困難・・・

文字列の塊での認識イメージ

黒画素の塊を領域ごとにまとめて、文字・表・画像・図形などの領域に振り分けるため、領域のまとまりが意図しないものになってしまう。

AI-OCR技術

「文字列を1文字ずつ検出」、意図した領域の検出が可能!

文字列を1文字ずつ検出するイメージ

文字そのものを1文字ごとに検出することで、検出された文字を単語などのまとまった単位として成形することができる。

AI-OCRの技術  #

文字同士の境界を含めて「AI」に学習させることで、認識精度が大幅に向上します。

OCR技術

文字同士の境界があいまいな複数文字の認識が困難・・・

  • 1文字単位の認識
    「メールで送ってください」1文字単位での文字認識イメージ
  • 文字同士の境界が明確
  • 既存技術で認識が容易
  • 実際の帳票では珍しい
  • フリーピッチ認識
    「メールで送ってください」フリーピッチでの文字認識イメージ
  • 文字同士の境界があいまい
  • 既存技術で認識が困難
  • 実際の帳票でよく見られる

AI-OCR技術

未知の文字への対応でフリーピッチの文字列も高精度で認識!

  • 文字同士の境界を決定せず、画像全体を一括で認識
  • ニューラルネットワークを用いることで、想定外の文字の特徴を学習・認識が可能に
氏名の手書き文字イメージ

事前にルールを作ることが難しかった「手書き文字」や「フリーピッチの文字列」も、 AI技術を使うことで高い精度で認識が可能。
個人の書き癖にも対応できる。

AI-OCRの技術  #

AI-OCRで読み取り可能な手書き文字の画像例をご紹介します。

申込書や請求書、アンケート用紙などに記入された住所・氏名・会社名・電話番号などの手書き文字を認識します。

氏名・住所の手書き文字イメージ

(例1)領域からはみ出した文字列

領域からはみ出した手書き文字イメージ

(例2)上下の文字が領域内に入った文字列

上下の文字が領域内に入った手書き文字イメージ

(例3)下線付きの文字列

下線付きの手書き文字イメージ

AI-OCRの技術  #

AI-OCRで読み取り可能な情景内の文字認識技術をご紹介します。

従来のOCR技術では正確に認識することが困難だった、カメラ画像などの複雑な背景と一体化している文字や、白抜き文字・飾り文字などの特殊文字(情景内文字)を検出・認識します。

OCR技術

文字に背景があるものやロゴ文字は、文字の検出・認識が困難・・・

  • 背景無し、枠無しフォント
    天ぷらそば    唐揚げ
  • 文字の場所が明確
  • 既存技術で認識が容易
  • 文字同士が離れている
  • 背景有り、枠有りフォント
     
  • 文字の場所があいまい
  • 既存技術で認識が困難
  • 文字同士が接触
背景あり/枠ありの情景内文字イメージ(例:天ぷらそば、唐揚げのメニュー)

AI-OCR技術

背景ノイズの影響を受けずに文字検出が可能!

  • 背景と一体化している文字や、白抜き文字などのテキスト化が難しい文字認識に対応
  • テレビ番組・動画内のテロップのテキスト抽出に
    テレビ番組のテロップイメージ
  • 製品・梱包の印字不良チェックに
    段ボールの印字イメージ

※ すべての文字が認識できるわけではありません。ご導入に際し、「無料体験版」にてお手持ちの文書の認識精度をご確認ください。詳しくはお問い合わせください。

関連記事

パナソニック ソリューションテクノロジー株式会社では、注文書や請求書などの入力や転記作業に対応した「WisOCR for 注文書・請求書」と、申込書や作業報告書・検査表などのあらゆる紙帳票の入力や転記作業に対応した「WisOCR」という2つのAI-OCR製品をご用意しております。AI-OCRの導入を検討されている方は、ぜひ一度お問い合わせください。

AI-OCRのお役立ち資料

製品紹介事例紹介各種帳票 はじめてのAI-OCRでも安心!
AI帳票OCR「WisOCR」とは

製品紹介事例紹介注文書・請求書 5分でわかる!
WisOCR for 注文書・請求書

製品紹介事例紹介免許証 3分でわかる!OCRソフト用
開発キット「免許証認識ライブラリー」

OCRソフトをお探しの方、OCR機能の組み込み開発をご検討中の方
お気軽にお問い合わせください!