コラム

AI OCRによる文字の自動認識ソリューション

アナログ(紙)のデジタル化でデータ入力業務の生産性向上と働き方改革を支援

2021年1月
アライズイノベーション株式会社
CEO 清水 真

はじめに

我が国では、人口減少から来る人材不足と、それに伴う高度なノウハウの継承問題が懸念されている。さらには新型コロナウイルス感染症(COVID-19)が全世界に拡大し、企業は大きな変化を強いられている。

生産性向上とコスト削減という喫緊の課題に直面している中で、「ニューノーマル」に向けてどのように業務変革を促進していくかが重要となっており、多くの業種・業界においては、IoT / AI / RPAなどのITを活用することで、これらの問題解決と将来の変革に取り組もうとしている。

当社は、人工知能(AI)技術を活用いた『企業向けAIサービス(Enterprise AI)』、システム開発において高い生産性を実現する『ローコード開発(LCD)』、そしてそれらのサービスの基盤となる『クラウド』を柱としたITソリューションで、お客様の新事業の立ち上げ(Arise)と既存事業の変革(Innovation)を実現すべく2016年に起業された。 お客様のDX(デジタルトランスフォーメーション)の実現と働き方改革を推進するソリューションを提供し続ける、IT系のスタートアップ企業である。

AI OCRとは

ここ数年で飛躍的な進歩を遂げているAI(人工知能)。様々な分野での活用が期待されているが、一般の事務作業で行われるデータ入力業務においてもAI OCRというかたちでAIの活用が始まっている。

OCR(Optical Character Reader)とは、画像データから文字部分を認識し、データに変換する光学文字認識機能だ。具体的には、紙文書をスキャナーで読み込み、書かれた文字を認識しデジタル化する技術である。

人間は、紙に書かれた文字を無意識に理解できるが、コンピューターは自動的に読み取ることができない。そのため、紙に書かれた文字をデータ化するには、一度、人間が読み取りパソコンでデータに入力する作業が必要となる。しかし、単純に文字を入力する作業は非常に効率が悪く時間がかかる。この作業を代わりに行ってくれるのがOCRである。

AI OCRとは、OCRにAIの技術を活用したものだ。AIの技術を用いることで、文字認識率の向上や、読み取りたい項目の指定をせずにデータ化ができるようになる。

次世代 OCR『AIRead』

人手によるデータ入力業務は、作業者の疲労の蓄積にともない、どうしても打ち間違いや入力漏れなどのミスが起こりやすくなる。そのため、場合によっては2名以上で確認・修正を行っているのが現状だ。AI OCRを用いることで、データ入力業務をゼロから人手で行っていた時と比べて手間が軽減され、ミスの削減につながる。

当社が開発・販売する『AIRead』もAI OCRの一つだ。枠の無い自由記入形式の手書き文字認識はもちろん、体裁が定まっていない、データの位置が可変の文書でも、AIが読み取りたい項目を見つけ出しデータ化することができる。

このほかにも、書類の自動回転・傾き補正、書類のイメージやキーワードによる仕分け、色の強調・除去機能など、OCRに必要な様々な機能を備えている。

AI OCRの特長

AI OCRは、これまでのOCRと比べ飛躍的に手書き文字の読取精度が向上している。だが、あらゆる手書きの文字を100%の精度で読み取れるわけではなく、100%を保証することは理論上不可能である。データ入力業務の自動化を進めるには、他の手段と組み合わせて、読み取り結果を保証することが肝要となる。例えば、以下のような明細において数値の読取結果を検証したい場合、計算式により確認することが可能である。

計算式:SUM(数量 × 単価) = 合計金額

これは、人間がデータ入力を行うとき電卓で計算結果が正しいことを確認することと同じ内容である。このように、データが正しいことを保証できる別の条件が存在する場合、OCR後の読み取り結果に対してデータ検証処理を行うことで、データ入力業務の効率化を図ることが可能となる。

AI OCRにおける「学習」

AIといえば「学習」することで性能が向上することが特徴である。AI OCRも「学習」は重要な要素であるが、AI OCRで文字を「読む」ことと「学習」することは同じではない。様々な手書きの文字を読み取ったとしても、それだけでは精度の向上がされることはない。具体的には、AI OCRは以下の手順で「学習」が行われる。

  1. AI OCRが文字を「読む」
  2. 読取結果を確認し誤り箇所を修正する
  3. 誤り文字の画像と正解データを紐づける
  4. 画像と正解データを用いて「学習」させる

このうち、現状は 2. と 3. のステップ(アノテーション)は人手による作業となるため、AI OCRが自動で「学習」し精度が向上されるということは難しい。

一方、2. はAI OCRを利用しデータ化を行う過程の作業でもあるため、③の自動化が実現出来ればAI OCRの「学習」の半自動化が実現可能となる。このためには、人手で行う修正作業のインターフェース(修正画面)と「学習」処理がフレームワークとして連携する必要がある。

当社が提供する『AIRead』は、利用者が自ら「学習」を実施できる機能を提供しており、利用者側の環境でこれらのフレームワークを構築することを可能にしている。また、同じくクラウド型のAI OCRサービス『AIRead on Cloud』では、これら「学習」の自動化フレームワークの開発を進めている。

AI OCRのこれから

このように、AI OCRはまだ発展途上の状態であるといえる。以下は当社が独自に作成したAI OCRのレベルを定義した表である。

現在、当社の『AIRead』もふくめた一般的なAI OCRは「レベル 2」であるといえる。当社は来年の前半を目途に「レベル 3」の達成を目指している。また、一般の利用者が期待するAI OCRは「レベル 4」であると考えられるため、継続した機能向上をはかっていく。

おわりに

このように、AI OCRは発展途上のソリューションではあるが、工夫して使用することでこれまで手作業で行っていた紙からの入力作業を効率化し、生産性を高めることが可能だ。『働き方改革』の手段として、AI OCRを検討してみてはいかがだろうか。

月刊自動認識 2021年1月号 向け 寄稿文より