貿易業務でのOCR利用とは

 

貿易業務では、様々な書類が必要となる。その書類の管理や処理に手間やコストがかかってしまうこともしばしばあるだろう。ここで、OCRという技術を活用することは有効と言える。

 

そこで、OCRとは一体何か?について今回説明する。

 

 

f:id:kaseda_toshihiro:20171004110541j:plain

 

1.OCRとは

2.なぜ今OCRが有効か

3.情報をデータ化するメリット

4.OCRは何に利用されているか

5.実際の導入例

 

f:id:kaseda_toshihiro:20171004110855j:plain

 

1.OCRとは

OCR(Optical Character Recognition/Reader、オーシーアール、光学的文字認識)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術である。

 

人間は文字を無意識のうちに認識している一方で、実は様々な過程を経ている。そして、その過程の中には、現在のコンピュータが不得意とするものもある。

 

「文字の部分を見つけて、読む順序を決める」ことから「左右の線を上から下に移動しながら、この線が文字と交差する数をカウントして、すき間のところを文字と文字の区切りとして判断する」までの処理は、人間にとってまったく意識することなく瞬時に行える処理だ。また、「正規化、特徴抽出、マッチング、知識処理」という処理では、例えば「夕方」という字を見ればその「夕」がカタカナの「タ」ではないことを人間はすぐに判断できるが、コンピュータでは「夕方」という言語情報を持っていない限り判別が困難だ。

 

文脈が分からなければ、「大好き」の「大」の右上にシミがあったら「犬好き」と読んでしまうように、人間が簡単に行えることでも、コンピュータには大きな障害になることは多く存在する。それを理解し、あらかじめ最低限の障害を取り除くことで、OCRはずっと使いやすいものとなる。

 

f:id:kaseda_toshihiro:20171004111104j:plain

 

2.なぜ今OCRが有効か

社内の重要な情報は依然として紙上にあることが多く、その情報を全てキーボードから入力していたのでは到底追いつかない。いつでもどこでも必要な時に、必要とする人が容易に情報にアクセスできることは、業務の効率を向上させる大きな要因である。またそうすることにより、情報はいつも新鮮であり続けることができる。

 

しかし、この様な理想的な環境の前に立ちはだかるのが、情報のデジタル化に伴う処理の煩雑さだろう。これらをキーボードから入力していたのでは、時間がいくらあっても足りないうえ、この様な単純な作業は、時間とともに生産性が落ちてくる。

 

f:id:kaseda_toshihiro:20171004111125j:plain

 

3.情報をデータ化するメリット

情報をデータ化することによるメリットは大きく分けて2つあると言える。

 

まず、スペースの省スペース化だ。情報をテキストデータ化することにより、物理的な保管スペースを劇的に小さくすることができる。段ボール箱いっぱいの書類も数メガバイトに収まる。また、画像情報をテキストデータ化することにより、メモリ上の保管スペースを約700分の1にすることができる。

 

次に、検索の迅速性だ。情報をテキスト化することによって、文書をイメージで保管する場合に検索機能を使って、欲しい情報を素早く検索できる。

 

f:id:kaseda_toshihiro:20171004142140j:plain

 

4.OCRは何に利用されているか

OCRは、「データ入力」や「文書管理」など、様々な用途で活用されている。

 

<データ入力>

データ入力で用いられる原稿は、主に「伝票」や「帳票」と呼ばれます。OCRの利用面から「伝票(帳簿)処理用OCR」と分類される。特長は、読み取ったデータを業務ソフトウェアと連携して、データ処理することが目的となる。

 

<文書管理>

文書管理に用いられる原稿は、書籍、論文、契約書、新聞などあらかじめ形式の決まっていない文書が対象となり、OCRの利用面から「文書OCR」と分類される。特長は、キーワードで検索できるように全文のテキスト化を行ったり、読み取り結果を市販ソフトウェア(WordやExcel等)にて、再編集することに用いられる。

 

f:id:kaseda_toshihiro:20171004142234j:plain

 

5.実際の導入例

ビジネスシーンにおいての導入例として、レオパレス21は5月26日、賃貸契約書類などの入力業務にAIを活用した文字認識システム「Intelligent OCR」を導入すると発表した。これまで各種申込書や社内書類の大部分を手作業でPCへ入力していたが、Intelligent OCRの導入で、従業員の作業時間を年間で約2万900時間削減し、約4200万円のコスト削減を見込んでいる。

レオパレス21、AI×OCRで契約書類を自動入力 年間4200万円のコスト削減へ - ITmedia エンタープライズ

 

また、行政においてもOCRは活用されている。東京23区で最も人口の多い世田谷区では、住民税を処理するために120万件にものぼる関係書類の入力作業が必要であるため、これを高精度のOCRによってイメージ処理することで、大幅なコストダウンを実現した。それに付随してサービス向上をも成し遂げたという。

導入事例:紙とデジタルの橋渡し――OCR処理で住民サービスを向上した世田谷区 - ITmedia エンタープライズ