AIRead (AI OCR) の機能
AIRead は、画像データ(PDF, PNG, JPEG, TIFF)に書かれた文字画像を読み取りOCR(データ化)します。
継続的なバージョンアップで読み取り精度の向上や、より手軽な読み取りを実現する機能を提供しています。
日本語、英語のほか、中国語(簡体字、繁体字)、タイ語、ベトナム語などの東南アジア圏や、ロシア語などの文字の読み取りが可能です。
また、海外(シンガポール)での利用実績もございます。
OCRに向いている帳票種類
見積書・注文書、納品書・請求書、通関書類(Invoice、Packing List、船荷証券(B/L))、決算書(B/S、P/L)、
勘定科目内訳明細書、知財関連資料、契約書、覚書、住民票などの公文書 ほか
お持ちの帳票が対応できるか、試読も可能ですのでご気軽にお問い合わせください。
処理の流れとそれぞれの機能
AIRead は、以下の流れで帳票のデータ化からシステムへの連携までを行います。
1.定義作成(AIRead Form Editor)
「AIRead Form Editor※」を使用して定義を作成します。
手動での設定はもちろん、自動設定や位置ずれ補正などの機能で定義の作成を支援します。
※AIReadの機能の一部です。
また、AIRead on Cloudでは、領収書やレシートを定義設定をせずに読取りできる定義レスOCRに対応しています。
座標指定データ抽出機能
専用のエディタを用いてデータ化したい項目を事前に“座標指定”で定義します。同一の書式で大量のOCR(データ化)に適しています。
FAXでありがちなOCRの課題に対応する機能を備えています。
(天地補正、傾き補正、ノイズ除去、低解像度画像の拡大機能など)
手書き、活字のどちらの読み取りにも対応しています。
ルール指定データ抽出機能
専用エディタを用いて、データ化する箇所のルールを指定します。
同一種類ではあるが明細行の増減など帳簿毎にレイアウトが異なる、座標では
定義しきれない帳票のOCR(読取処理)に適しています。
手書き、活字のどちらの読み取りにも対応しています。
定型帳票定義 自動生成機能
未記入の帳票と記入済みの帳票を取り込むことで、二つの帳票画像の差分や
矩形・文字の種類を判定し、差表指定の定型帳票定義を自動生成します。
データ自動抽出機能(ルール指定データ抽出機能)
「ルール指定データ抽出機能」使用時には、キーワードを指定することでデータを自動抽出します。
① 項目名(キーワード)との位置関係を意識した抽出ができます。
② 可変の明細をデータがある分だけ抽出できます。
③ 必須項目を設定することで行の読み飛ばしができます。
定義レスOCR
領収書/レシート/Claude3.5
※AIRead on Cloudのみ
事前の定義作成をすることなく、ブラウザ操作のみで読み取りが行えます。
領収書やレシートに特化した設定や、クラウド型生成AI Claude3.5を使った読み取りで帳票の種類を問わずに定義レスで読み取りをすることが可能です。
読取位置ずれの自動調整機能
AIが座標指定の定義と実際の帳票で読取位置のずれが発生したときに
読み取り範囲を自動調整します。
・パターン1
当初の読取位置内に最も多くかかる文字列を読み取むよう位置と
大きさを補正します。
・パターン2
当初の読取位置から最も近い矩形を検知し読取位置を補正します。
2.画像処理
AIによる自動画像補正で、より高精度な読み取りを実現します。
回転、傾き補正機能
帳票に合わせて向きや傾きを自動補正します。
回転補正: 90 / 180 / 270 度
傾き補正: ± 1 ~ 35 度
帳票の拡大、縮小機能
テンプレート画像をもとに設定したフォーマット定義に合わせて画像を拡大・縮小し、位置ずれを補正します。
解像度が違う画像も、解像度を揃えて読み取りを行います。
色の強調・除去機能
特定の色の除去・強調(色を残す)ができます。
(例)印影(赤色)のみを除去
3.仕分け
AIが帳票を自動で仕分けし、読み取り作業をスムーズにします。
画像イメージ仕分け
あらかじめ登録した画像と比較し、一致する画像に仕分けしOCRを行います。
画像内文字(キーワード)仕分け
画像内の文字(キーワード)をもとに仕分けし、定められた形式のCSVファイルを出力します。
4.読み取り
高い読み取り精度とOCR機能で、さまざまな形式の帳票を正確に読み取ります。
フリーピッチ・複数行の手書き文字の読み取り
フリーピッチの手書き文字の読み取りが可能です。
チェックマーク、丸囲みの読み取り
true / false のほか、任意の文字を出力させることも可能です。
バーコード、QRコードの読み取り
バーコード(NW-7、Code128※)、QRコードの読み取りが可能です。
※その他のバーコードにも順次対応予定です
画像マッチング、抽出し読み取り
傾いて貼付されたシールの読み取りなどに有効です。
全文OCRでテキスト形式で出力
読み取り位置を指定しなくとも、画像全体から文字を抽出しテキストデータを
出力します。
罫線を区切りとしCSV形式で出力
読み取り位置を指定しなくとも、画像の矩形(罫線)をもとにCSVデータを出力します。
後処理補正機能
読み取り時の誤読結果を自動補正します。
補正データは正規表現で自由に追加・変更が可能です。
ショートカット作成(AIRead ShortcutCreator)
FormEditor で作成した項目定義や仕分け設定、帳票を格納するフォルダ等を指定する事で、読取り実行ショートカットを作成できます。
複数の帳票をまとめて指定のフォルダに格納し、このショートカットをダブルクリックするだけで、一気に仕分けと読み取りを実行します。
5.確認・出力
読み取り結果を簡単に確認・修正することができます。
AIRead Viewer
スタンドアロン型で利用する場合、専用のビューワ(AIRead Viewer)で
実行結果を確認、修正することができます。
AIRead Screen Designer
Web型で利用する場合は、読取結果をブラウザで閲覧・編集可能です。
閲覧・編集画面の設計機能(AIRead Screen Designer)をオプションでご提供します。
6.システム連携
連携オプションを使用することで、読み取り結果のデータ整合性チェックやデータの加工/変換および他システムへの連携が可能です。
ETL連携ソリューション
国産のETLツール「Waha! Transformer:ユニリタ社」と連携し、データの加工、修正、既存システムとの連携を素早く実現させます。
既存のERP(SAP、OBIC、Oracle、Dynamicsなど)、メインフレームやオフコン、オープン系RDB(Oracle、MS-SQL、PostgreSQL、MySQLなど)との連携が可能です。
CSV、Excel、その他さまざまなファイル形式や文字コード(S-JIS、UTF-8)の変換が可能です。
RPA連携ソリューション
国産のRPAツール「WinActor®:NTTアドバンステクノロジ社」 と連携し、データ入力業務の自動化を実現します。
当社は WinActor® の代理店として、RPA (WinActor®) と AI OCR (AIRead) をワンストップで提供いたします。
このほかにも、様々なRPAとの連携実績がございます。
動作環境
クライアント実行型
(AIRead Stand-alone)
O S | Windows 10 / 11 |
CPU*1 | 2 core(推奨 4 core)以上 |
メモリ*2 | 8 GB(推奨 16 GB)以上 |
ストレージ | 50 GB 以上の空き領域 |
*2 仮想メモリを含む空き領域
サーバ実行型
(AIRead Standard / Trial / Lite / Enterprise)
O S | Windows Server 2016 / 2019 / 2022 |
CPU*1 | 2 core(推奨 4 core)以上 |
メモリ*2 | 16 GB(推奨 32 GB)以上 |
ストレージ | 100 GB 以上の空き領域 |
*2 仮想メモリを含む空き領域
プラットフォーム
オンプレミス / AWS / Azure |
入出力ファイル
形式 | ファイル種類 |
入力ファイル | PDF, JPEG, PNG, TIFF |
出力ファイル | CSV, XML |
AIRead をもっと知りたい
「AIRead」メジャーバージョンアップ!
~新機能紹介、デモンストレーションセミナー~
AIReadは、常に進化し続けるAI-OCRの先駆けとして、新たなる飛躍を遂げました。本セミナーでは、AIReadの最新メジャーバージョンアップに伴う新機能を紹介し、利便性の向上した機能などをデモンストレーションを通じてご紹介させていただきます。(約51分)
その他、セミナー情報やオンデマンドはメニューの「セミナー・動画」からご覧ください