AIRead (AI OCR) の機能

AIRead は、画像データ(PDF, PNG, JPEG, TIFF)に書かれた文字画像を読み取りOCR(データ化)します。
継続的なバージョンアップで読み取り精度の向上や、より手軽な読み取りを実現する機能を提供しています。

日本語、英語のほか、中国語（簡体字、繁体字）、タイ語、ベトナム語などの東南アジア圏や、ロシア語などの文字の読み取りが可能です。
また、海外（シンガポール）での利用実績もございます。

OCRに向いている帳票種類

見積書・注文書、納品書・請求書、通関書類（Invoice、Packing List、船荷証券(B/L)）、決算書（B/S、P/L）、
勘定科目内訳明細書、知財関連資料、契約書、覚書、住民票などの公文書　ほか

お持ちの帳票が対応できるか、試読も可能ですのでご気軽にお問い合わせください。

処理の流れとそれぞれの機能

AIRead は、以下の流れで帳票のデータ化からシステムへの連携までを行います。

１．定義作成（AIRead Form Editor）

「AIRead Form Editor※」を使用して定義を作成します。
手動での設定はもちろん、自動設定や位置ずれ補正などの機能で定義の作成を支援します。
※AIReadの機能の一部です。

また、AIRead on Cloudでは、領収書やレシートを定義設定をせずに読取りできる定義レスOCRに対応しています。

座標指定データ抽出機能

専用のエディタを用いてデータ化したい項目を事前に“座標指定”で定義します。同一の書式で大量のOCR(データ化)に適しています。
FAXでありがちなOCRの課題に対応する機能を備えています。
（天地補正、傾き補正、ノイズ除去、低解像度画像の拡大機能など）

手書き、活字のどちらの読み取りにも対応しています。

ルール指定データ抽出機能

専用エディタを用いて、データ化する箇所のルールを指定します。

同一種類ではあるが明細行の増減など帳簿毎にレイアウトが異なる、座標では
定義しきれない帳票のOCR(読取処理)に適しています。

手書き、活字のどちらの読み取りにも対応しています。

定型帳票定義自動生成機能

未記入の帳票と記入済みの帳票を取り込むことで、二つの帳票画像の差分や
矩形・文字の種類を判定し、差表指定の定型帳票定義を自動生成します。

データ自動抽出機能（ルール指定データ抽出機能）

「ルール指定データ抽出機能」使用時には、キーワードを指定することでデータを自動抽出します。

① 項目名(キーワード)との位置関係を意識した抽出ができます。
② 可変の明細をデータがある分だけ抽出できます。
③ 必須項目を設定することで行の読み飛ばしができます。

定義レスOCR
※AIRead on Cloudのみ

事前の定義作成をすることなく、ブラウザ操作のみで読み取りが行えます。

領収書やレシートに特化した機能や、日本語入力のみで抽出設定ができるクラウド型生成AIを活用した機能で、帳票の種類を問わずに読み取りをすることが可能です。
詳細は、こちらのページをご覧ください。

読取位置ずれの自動調整機能

AIが座標指定の定義と実際の帳票で読取位置のずれが発生したときに
読み取り範囲を自動調整します。

・パターン１
当初の読取位置内に最も多くかかる文字列を読み取むよう位置と
大きさを補正します。

・パターン２
当初の読取位置から最も近い矩形を検知し読取位置を補正します。

2．画像処理

AIによる自動画像補正で、より高精度な読み取りを実現します。

回転、傾き補正機能

帳票に合わせて向きや傾きを自動補正します。

回転補正：　90 / 180 / 270 度
傾き補正：　± 1 ～ 35 度

帳票の拡大、縮小機能

テンプレート画像をもとに設定したフォーマット定義に合わせて画像を拡大・縮小し、位置ずれを補正します。

解像度が違う画像も、解像度を揃えて読み取りを行います。

色の強調・除去機能

特定の色の除去・強調（色を残す）ができます。
（例）印影（赤色）のみを除去

3．仕分け

AIが帳票を自動で仕分けし、読み取り作業をスムーズにします。

画像イメージ仕分け

あらかじめ登録した画像と比較し、一致する画像に仕分けしOCRを行います。

画像内文字（キーワード）仕分け

画像内の文字（キーワード）をもとに仕分けし、定められた形式のCSVファイルを出力します。

4．読み取り

高い読み取り精度とOCR機能で、さまざまな形式の帳票を正確に読み取ります。

フリーピッチ・複数行の手書き文字の読み取り

フリーピッチの手書き文字の読み取りが可能です。

チェックマーク、丸囲みの読み取り

true / false のほか、任意の文字を出力させることも可能です。

バーコード、QRコードの読み取り

バーコード(NW-7、Code128※)、QRコードの読み取りが可能です。
※その他のバーコードにも順次対応予定です

画像マッチング、抽出し読み取り

傾いて貼付されたシールの読み取りなどに有効です。

全文OCRでテキスト形式で出力

読み取り位置を指定しなくとも、画像全体から文字を抽出しテキストデータを
出力します。

罫線を区切りとしCSV形式で出力

読み取り位置を指定しなくとも、画像の矩形（罫線）をもとにCSVデータを出力します。

後処理変換機能

読み取り時の誤読結果を自動変換します。
変換データは正規表現で自由に追加・変更が可能です。

読み取り結果の加工機能
※AIRead on Cloud Claude3.5での読み取りのみ

読み取る行やその周辺の項目名に対し、特定の条件を設け、その条件を満たす行のデータを変換・移動・コピー、または行そのものを削除をすることが可能です。

ショートカット作成（AIRead ShortcutCreator）

FormEditor で作成した項目定義や仕分け設定、帳票を格納するフォルダ等を指定する事で、読取り実行ショートカットを作成できます。

複数の帳票をまとめて指定のフォルダに格納し、このショートカットをダブルクリックするだけで、一気に仕分けと読み取りを実行します。

5．確認・出力

読み取り結果を簡単に確認・修正することができます。

AIRead Viewer

スタンドアロン型で利用する場合、専用のビューワ（AIRead Viewer）で
実行結果を確認、修正することができます。

AIRead Screen Designer

Web型で利用する場合は、読取結果をブラウザで閲覧・編集可能です。
閲覧・編集画面の設計機能（AIRead Screen Designer）をオプションでご提供します。

6．システム連携

連携オプションを使用することで、読み取り結果のデータ整合性チェックやデータの加工／変換および他システムへの連携が可能です。

ETL連携ソリューション

国産のETLツール「Waha! Transformer：ユニリタ社」と連携し、データの加工、修正、既存システムとの連携を素早く実現させます。
既存のERP（SAP、OBIC、Oracle、Dynamicsなど）、メインフレームやオフコン、オープン系RDB（Oracle、MS-SQL、PostgreSQL、MySQLなど）との連携が可能です。
CSV、Excel、その他さまざまなファイル形式や文字コード（S-JIS、UTF-8）の変換が可能です。

詳細をみる

RPA連携ソリューション

国産のRPAツール「WinActor®：NTTアドバンステクノロジ社」と連携し、データ入力業務の自動化を実現します。
当社は WinActor® の代理店として、RPA (WinActor®) と AI OCR (AIRead) をワンストップで提供いたします。
このほかにも、様々なRPAとの連携実績がございます。

詳細を見る

動作環境

クライアント実行型
（AIRead Stand-alone）

O S	Windows 10 / 11
CPU*1	2 core（推奨 4 core）以上
メモリ*2	8 GB（推奨 16 GB）以上
ストレージ	50 GB 以上の空き領域

*1 Intel® CPU 第2世代以降のCoreプロセッサー以上
　v5.1.2以前：AVX2命令セットに対応したCPU
　v5.1.3以降：SSE2命令セットに対応したCPU
*2 仮想メモリを含む空き領域

サーバ実行型
（AIRead Standard / Trial / Lite / Enterprise）

O S	Windows Server 2016 / 2019 / 2022
CPU*1	2 core（推奨 4 core）以上
メモリ*2	16 GB（推奨 32 GB）以上
ストレージ	100 GB 以上の空き領域

プラットフォーム

オンプレミス / AWS / Azure

入出力ファイル

形式	ファイル種類
入力ファイル	PDF, JPEG, PNG, TIFF
出力ファイル	CSV, XML