OCRとは

「そもそもOCRって何だろう?」「業務に役立ちそうだということは何となく分かっているけれど、詳しいことは知らない」そんな風に思っている方も多いかもしれません。OCRとはどういった技術で、どんなことができるのでしょうか。

PDFや画像から文字を抽出する技術

OCR(オーシーアール)とは「Optical Character Recognition/Reader」の略で、光学式文字認識、または光学式文字読み取り装置のことです。
OCRを使えば、PDFやJPGなどの書類画像から文字を読み取り、コンピュータ用の文字コード(テキストデータ)に変換することができます。これまで目視によって手作業で入力していた文字情報も、わずかな時間で読み込みデジタル化できるため、大量のデータ処理に威力を発揮する技術です。
OCRは、近年の書類のペーパーレス化、情報の電子化のニーズの高まりとともに進歩・普及してきた技術なのです。

 

OCR導入のメリット

OCR導入による投資対効果を見極めるためにも、事前にメリットとデメリットをきちんと把握しておくことが大切です。まずはOCRのメリットについて解説します。

ペーパーレス化

OCRによって書類をデータ化することで、紙の状態での保管が不要になるため、保管スペースを大幅に縮小できます。

検索性の向上

文字情報をデータ化してPCに取り込むことで、検索機能が活用できるため、作業効率が大幅にアップします。これがもし紙媒体なら、膨大な資料から目視で特定の文字列を探す必要が生じるため、かなり手間のかかる作業と言えるでしょう。

データの活用

アナログの文字情報をデジタル化することで、エクセルのような表計算ソフトやワード、メモ帳など文章作成ソフトへのデータ活用がスムーズかつ効率的に行えるのも大きなメリットです。

OCR導入のデメリット

いいことづくしに思えますが、OCRにはデメリットもあります。どのようなデメリットがあるのでしょうか。

認識精度は100%ではない

OCRの文字認識精度は100%ではありません。全ての文字を正確に認識できるとは限らない、という弱点があります。特に以下のようなケースでは、OCRは文字を誤認識しやすいとされています。

  • 「ね」と「れ」のように形が似ている文字
  • カラーで印字された文字やかすれた文字
  • 文字間が詰まっている文字列
  • ㌘、㎨、≒、などの特殊文字
  • 紙に対して文字列が斜めに記載されている文書
  • 手書き文字
  • 日本語の中に外国語が混在している文章
    など

基幹システムとの連携

企業で活用している基幹システムとの連携も考慮しなくてはなりません。OCRが抽出した文字データを基幹システムに入力する場合は、どうしても人の手が必要となります。文字列が会社名なのか日付なのかといった項目を判別したり、OCRが苦手とする手書き文字をチェックし修正したりするには、人間の判断力が必要だからです。
ある企業では1日に数千枚ものデータ入力が必要となっており、数百名の社員が24時間3交代制で対応にあたるケースもあったといいます。

デメリットをカバーするには?

アナログ文字情報をデジタル化するのに非常に有用なツールであるOCR。積極的に取り入れたいところですが、そのデメリットをカバーするにはどうしたら良いのか、具体的な対策をご紹介します。

認識精度の高いAI-OCRの活用

ディープラーニング機能を搭載した認識精度の高いAI-OCRを導入すれば、従来のOCRの弱点をカバーすることができます。AIの学習機能により、使えば使うほど読み取り精度が向上するため、従来のOCRでは誤認識の多かった手書き文字や乱筆文字、文字の切れ目などの判別も可能になり、従来のOCRで不可欠だった目視によるチェックを大幅に削減することができます。

OCR×RPAの連携でデータ入力を自動化

OCRとRPAを連携させて抽出データの入力を自動化することで、人の手による入力の手間を省くことができます。RPAとは「Robotic Process Automation(ロボティック・プロセス・オートメーション)」の略です。データの抽出・入力など日々繰り返される定形作業をロボットに置き換えることで、業務効率を大幅に改善することができます。
このRPAとOCRを連携させ、「OCRが読み取ったデータをRPAが自動入力する」ことにより、今までデータ入力に割いていた時間や労働力を大幅に削減することができます。

〈OCRが抽出したデータをRPAで自動入力した場合の業務フロー〉

OCRが抽出したデータをRPAで自動入力した場合の業務フローの図

OCRとRPAでできる業務改善事例

OCRとRPAを組み合わせることによって、データ連携にかかる時間と人員を大幅に削減できることが分かりました。最後にそれがどんな業務改善に活用できるのか、具体例を紹介します。

経理処理を自動化

OCRで請求書の内容を読み取り、RPAがデータの入力、次の工程への申請までを行うことで、経理処理にかかる作業を大幅に削減することが期待できます。日々大量の請求書を手作業で入力・処理することは大変な手間ですから、こうした日常的に発生する業務を自動化することはコストの大幅な削減に役立ちます。

発注書・契約書の処理を自動化

発注書や契約書の読み取りと入力を自動化することで、作業コストが軽減されます。受注から納品までの業務フローがスムーズになることで、顧客満足度アップにもつながります。顧客ごとの注文履歴管理や注文数の推移などの情報分析も容易になり、業務への有効活用が期待できます。

名刺から顧客情報をデータベース化

OCRで読み取った名刺の情報をRPAで自動入力することで、顧客情報を容易にデータベース化することができます。データを一元管理することで社内での情報共有がスムーズになるといったメリットもあります。

まとめ

ペーパーレス化、データ活用に活躍が期待できるOCR。認識精度や基幹システムへの接続に課題がありましたが、進化したAI-OCRの登場や、業務自動化ロボットRPAと組み合わせることによって弱点の克服に成功、普及が進んでいます。大切な会社のデータを管理するためのシステムですから、OCRの導入はプロに相談することをおすすめします。