コラム

生成AI×OCR:読み取るだけじゃない、次世代のOCRとは?

多くの企業で業務効率化が進む中、効率化の手段の一つとしてAI-OCR技術の導入が大きな役割を果たしています。
今や単なるデータ化ツールを超え、生成AIを活用した次世代OCRが新たな可能性を開いています。本コラムでは、その革新的な機能と可能性について探ります。

従来のOCRの限界

従来のOCRの限界 従来のOCR技術は、主に文字認識の精度向上に焦点を当ててきました。現在では、多くのOCRサービスが活字・手書き共に認識率90%以上を誇り、AI-OCRの登場により、不定形な帳票などにも対応した柔軟な読み取りが実現されています。文字認識の精度に関してはどの製品も横並びになりつつあります。

しかし、現場では単なる文字認識では解決できない課題を抱えています。
これらの課題は、OCR導入時のネックや、導入後も完全な自動化を阻む要因となっています。

  1. 帳票毎の読み取り定義作成
    基本的なOCR機能では、多種多様な帳票形式に対し、複雑な読み取り定義を作成する必要があります。
    ある程度のOCRサービスの操作知識が必要になり、定義の作成が属人化しがちなどの問題も抱えています。
     
  2. 文脈の理解
    OCRは、指定された範囲に書かれている情報をそのままデータ化するため、文章の中からほしい情報だけを抜き出すといった抽出方法はできません。
     
  3. 読み取り後の人の手での確認・修正
    一般的なOCRでも、該当文字列と変換後文字列を指定すれば自動的に変換することが可能です。
    しかし、指定されていないものや、状況に応じた変換は出来ません。
    これもまた、人の手でのチェックと修正が必要になるでしょう

生成AI×OCRがもたらす革新

現場の課題を解決すべく進化を続けてきたOCRですが、生成AIを機能に取り込むことにより、その利便性は大きく飛躍しました。
生成AIを活用した機能により、人の手でのチェックや作業を大幅に削減することが可能になったのです。
生成AI×OCRによって実現されている具体的な機能例をご紹介します。

1. 定義レスOCR

生成AIに対し事前にプロンプトで該当する帳票の条件や、抽出条件が指定されたサービスを利用することで、ユーザーは複雑な定義を作製せずに様々な形式の帳票を読み取ることが可能です。
請求書や領収書など読み取りたい項目は決まっていて、フォーマットやデータ形式が様々になりがちな帳票の読み取りがスムーズになります。

2. テキストでの抽出条件・データ加工指定

上記の定義レスに加え、さらに項目ごとに抽出方法をテキストベースで指定することで、柔軟な読み取りをすることが出来ます。例えば、フリーピッチの枠に書かれた住所の、都道府県や番地などを項目を分けて抽出したり、特定の条件下でのみ読み取りを行うといった高度な処理が可能になります。

また、フリガナ付与、英語・ローマ字変換、市区町村から始まる住所に都道府県を追加する、自由記入欄内の文章に疑問文が含まれる場合は「質問」項目に記入するなど、後続の業務に最適化されたデータ加工が可能です。

AIRead on CloudのClaude3.5:次世代OCRの実現

生成AIとOCRの組み合わせは、業務改革の新たな可能性を開きます。
しかし、自社で生成AIをOCRに組み込むのは難しいため、生成AIを機能に組み込んだ商用AI₋OCRを利用するのが良いでしょう。

アライズイノベーション株式会社が提供する「AIRead on Cloud」は、生成AI(Claude3.5)を活用した定義レスOCRなど、帳票をよりスムーズにデータ化するための機能を従量課金型で小規模から利用できるクラウド型のサービスです。

フォーマットが決まっている帳票は、従来通りの細かな定義設定を作成し安定した精度で繰り返し読み取りを行い、スポット的な帳票やフォーマットが毎回変わるものなどは生成AI読みとりを活用するなど、用途に合わせて使い分ける事が可能です。

また、データ加工設定で細かく変換や行の移動・コピー・削除の指定も可能なため、読み取りデータを後続の業務に最適化することが出来ます。

活用ユースケース

  1. 領収書データ化
    「領収書」「レシート」のどちらかを選択するだけで、写真、PDF、紙(FAX)など様々な形式とフォーマットになる領収書を、定義を作成せずにすぐに読み取り。
    事前にフォルダ指定をしておけば、領収書をフォルダに格納するだけで、読み取りまで自動化が可能です。
     
  2. 注文書情報データ化
    形式が違っても、読み取りたい項目をセットした読み取り設定をすればそれらの情報を含む帳票を自動で認識し「注文書」として読み取りを行います。
    また、抽出やデータ加工に関する指定をすることで漢字やひらがなで書かれたものをカタカナに変換したり、特定の文字列を変換することも可能です。
     
  3. アンケート・ヒアリングシートデータ化
    一つの枠内に書かれた住所を、都道府県など項目を分けてデータ化したり、複数選択をカンマ区切にしたり、表記を統一するなど後の集計やデータ分析がしやすい読み取りを行うことが出来ます。

まとめ

生成AIとOCRの融合は、単なる文字認識からの飛躍をもたらします。
AIRead on Cloudは、この革新的な技術を実用レベルで提供し、企業の業務効率化と競争力強化に貢献します。
データ入力や文書管理に課題を感じている企業は、ぜひ新たなAI₋OCRの導入を検討してみてはいかがでしょうか。
きっと、これまで気づかなかった業務改善の可能性が見えてくるはずです。