AIRead (AI OCR) の機能
AIRead の処理の流れ
AIRead は、以下の流れで帳票のデータ化からシステムへの連携までを行います。

AIRead の OCR 機能
AIRead は、画像データ(PDF, PNG, JPEG, TIFF)に書かれた文字画像を読み取りOCR(データ化)します。
読取精度:
活字 ~ 99%
手書き数字 ~ 99%
手書き日本語 ~ 88.2%※
※AIの文字学習機能により99%まで向上させることが可能です
日本語、英語のほか、中国語(簡体字、繁体字)、タイ語、ベトナム語などの東南アジア圏や、ロシア語などの文字の読み取りが可能です。また、海外(シンガポール)での利用実績もございます。
AIRead ができること
AIReadには、OCRに必要な以下のさまざまな機能があります。
- AIによる帳票の仕分け
- 傾き・回転補正
- 拡大・縮小
- 色の強調・除去
- 画像全文の読取
- 罫線抽出・除去
- 項目の座標補正
- ルールでの抽出
- CSV作成 etc…
また AIRead が読み取った項目名、値、信頼度、座標情報をCSVデータに出力することができます。

AIRead の画像処理機能
回転、傾き補正機能
帳票に合わせて向きや傾きを自動補正します。

回転補正 90 / 180 / 270 度
傾き補正 ± 1 ~ 45 度
色の強調・除去機能
特定の色の除去・強調(色を残す)ができます。

(例)
印影(赤色)のみを除去
帳票の拡大、縮小機能
FAXやスキャナなど、解像度が異なる画像サイズを一致させることができます。

FAXとスキャンした画像で解像度が異なっていても、画像を拡大・縮小しOCRが可能です。
帳票の仕分け機能
画像イメージで帳票仕分けを行います。

あらかじめ登録した画像と比較し、一致する画像に仕分けしOCRを行います。
画像内の文字(キーワード)で帳票仕分けを行います。

画像内の文字(キーワード)をもとに仕分けし、定められた形式のCSVファイルを出力します。
AIRead Form Editor
座標指定データ抽出機能
専用のエディタを用いてデータ化したい位置や型を指定します。
データ化したい項目を事前に“座標指定”で定義します。
同一の書式で大量のOCR(データ化)に適しています。
FAXでありがちなOCRの課題に対応する機能を備えています。(天地補正、傾き補正、ノイズ除去、低解像度画像の拡大機能など)
手書き、活字のどちらの読み取りに対応しています。

読取位置ずれの自動調整機能

AIが座標指定の定義と実際の帳票で読取位置のずれが発生したとき自動調整します。
・パターン1
当初の読取位置内に最も多くかかる文字列を読み取むよう位置と大きさを補正します。
・パターン2
当初の読取位置から最も近い矩形を検知し読取位置を補正します。
OCRに向いている帳票種類
見積書、注文書(自社指定書式)、納品書、請求書(自社指定書式)、売上伝票、申込書、申請書、作業報告書(日報、月報)、勤怠管理表、届出書、応募はがき ほか
AIRead Rule Editor
ルール指定データ抽出機能
専用のエディタを用いてデータ化したいルールを指定します。
同一種類だがレイアウトが異なる帳票のOCR(読取処理)に適しています。
可変の明細行など、座標では定義しきれない帳票のOCR(読取可能)です。
活字の読み取りを前提としています。

データ自動抽出機能

① 項目名(キーワード)との位置関係を意識した抽出ができます。
② 可変の明細をデータがある分だけ抽出できます。
③ 必須項目を設定することで行の読み飛ばしができます。
OCRに向いている帳票種類
見積書・注文書(相手先書式)、納品書・請求書(相手先書式)、通関書類(Invoice、Packing List、船荷証券(B/L))、決算書(B/S、P/L)、勘定科目内訳明細書、知財関連資料、契約書、覚書など、住民票などの公文書 ほか
AIRead Viewer
スタンドアロン型で利用する場合、専用のビューワ(AIRead Viewer)で実行結果を確認、修正することができます。

Web型で利用する場合、OCR(読取)結果をWebブラウザから閲覧・編集可能です。
閲覧・編集画面の設計機能(AIRead Screen Designer)をオプションでご提供します。
AIRead Train Studio
手書き文字の学習機能
誤読した文字は、その文字画像と正解データを教師データとしAIへ追加学習させることで精度を向上させることができます。
AIRead Train Studio HW(GUI)を用いて、直感的に教師データを追加学習させることが可能です。
※本機能は、手書き画像のみの対応となります
※自動学習を実現するには、閲覧・編集画面と連携し、NG画像と正解データの取得ができる前提です

活字文字の学習機能

書類に頻出する単語(業界専門用語・製品名など)や書類に使用されている特殊なフォントは、AIReadで追加学習することでAIの精度を向上させることができます。
AIRead Train Studio(GUI)で頻出単語やフォントデータを追加学習させることが可能です。
※本機能により単語を学習させることで、別の単語の読取精度が落ちる可能性があります
※本機能は手動での学習のみとなります
必要動作環境
クライアント実行型(AIRead Stand-alone)
O S | Windows 8.1(64bit) / 10 |
CPU | 2 core(推奨 4 core)以上 |
メモリ | 4 GB(推奨 16 GB)以上 |
HDD | 50 GB 以上の空き領域 |
サーバ実行型(AIRead Standard / Trial / Light / Enterprise)
O S | Windows Server 2012 R2 / 2016 |
CPU | 2 core(推奨 4 core)以上 |
メモリ | 4 GB(推奨 16 GB)以上 |
HDD | 50 GB 以上の空き領域 |
プラットフォーム
オンプレミス / AWS / Azure |
■入出力ファイル
形式 | ファイル種類 |
入力ファイル | PDF, JPEG, PNG, TIFF |
出力ファイル | CSV, XML |