帳票のOCR認識
帳票をOCR認識するためには、まず帳票を画像データとして読み込みます。
「帳票OCR サーバー版」では、スキャナーや複合機からスキャンして、サーバー内のフォルダーに保存された画像ファイルを画像データとして読み込んでOCR認識します。
帳票の読み込み
■ 画像ファイルから読み込む
「帳票OCR サーバー版」に読み込める画像ファイル形式は、BMPファイル、TIFFファイル、JPEGファイル、およびPDFファイル※1 です。
※1 画像のみのPDFファイルに限り対応しています。 セキュリティを設定したPDFファイルやアウトライン化したPDFファイルは読み込みできません。その他、形式によっては読み込みできない場合があります。
読み込んだ帳票画像の編集
「帳票OCR サーバー版」では、文字認識精度の向上に役立つ画像編集機能をご用意しています。
■ 傾き補正
表示されている画像を対象に、自動的に傾斜角度を検出し、傾き補正を行います。スキャナーからの読み込みで、斜めに取り込んでしまった場合でも自動的に傾きを補正します。
■ ノイズ除去
読み込んだモノクロ画像(2値画像)を範囲指定して、ノイズ(黒点状の汚れ)を除去できます。画像データにノイズがある場合に使用します。ノイズ除去を行うと、認識率がアップします。
■ 回転
画像データを回転させて向きを変更します。縦のものを横に読み込んだり、逆さまに読み込んだ場合に、画像を回転できます。