2024年12月24日に、AI-OCRの新バージョン「AIRead on Cloud Ver. 2.3.0」をリリースいたしました。
本リリースの主な変更点は下記のとおりです。
・生成AIによる非定型帳票の読取り機能を強化
生成AIによる定義レスOCR機能を利用する際に、抽出項目の設定が可能になりました。
これにより、手書き・活字、定型・非定型を問わず、帳票内で同じ意味合いの項目が存在すれば、文字の場所や表記が異なっていても、
日本語で取得したい項目を指示するだけで、事前の学習をすることなくデータ化することができます。
設定からデータ化までの流れ
1.抽出項目の設定
どの項目をどのような条件でデータ化したいかの指示を、項目ごとに設定します。
日本語の文章のみで設定することができるため、従来のような座標・ルール指定といった専門的な知識は必要ありません。
2.帳票の読み取り
使用するモデルに「生成AI」を指定し、帳票をアップロードします。
生成AIが、登録された設定情報の中から帳票に最も適した設定を自動で判断しデータ化を行います。
帳票データは、紙をスキャンした画像データのほか、スマートフォン等で撮影した写真やWeb等から取得したPDFファイルなど、様々な形式に対応しています。
【領収書】と自動で判断されて読み取られた結果
例①:写真の領収書(タクシーのレシート)
例②:横長の領収書(飲食店の領収書)
例③:Webから取得したPDFの領収書(インターネット旅券発行サイトの領収書)
また、本内容はニュースリリースでもご紹介しております。
機能の詳細は製品サイトをご覧ください。
その他リリースの詳細はリリースノートをご確認下さい。