OCRとはOptical Character Readerの略で、日本語では「光学文字認識機能」などと訳します。画像の中のテキストを認識し、文字データに変換する機能、もしくは装置を指します。
紙の帳票に記載された内容をテキスト化するのにOCRが使われることがあります。社名や連絡先、数量、金額などを、手作業でシステムに入力するといった手間や誤入力を軽減できるのがメリットです。
もっともOCRを使えば、すべての画像からテキスト化できるわけではありません。文字が見えにくかったり、画像が粗かったりすれば文字を正しく認識できません。汚い手書き文字の読み取り精度も下がります。
最近はAIと組み合わせることで、OCRの読み取り精度を高めるソフトウエアが登場しています。RPAと組み合わせ、業務フローの自動化を支援するソリューションも登場しています。