OCRとは
OCRは、おおむね、画像から文字を認識するための技術のことです。
最近では機械学習などで精度が大分あがっているということではありますが
オンライン前提でのクラウドサービスだったりなど状況によっては使えないこともあります。
最近では、AI-OCRというような感じで言われることが多いですね。
オンラインサービス
ちょっと検索しただけでもいっぱいあるので、何とも言えませんが
Google検索した感じではPanasonicのクラウドOCRサービスか、RICOHのサービスが
強そうな感じです。
基本有料で法人向けのサービスが多い印象です。
オフラインでも使えるソフト
こちらになると、グッと使えるものが減っちゃうのですが
基本精度がいいとされているものは、Googleが開発支援しているらしい
Tesseractを使ったサービスが主のようですね。
バージョン4からは、ニューラルネットワークとか使われて精度が上がっているそうな。
Tesseract (ソフトウェア) – Wikipedia
バージョン4では、バージョン4.0からは、従来の認識エンジンに加えLSTMベースのニューラルネットワークによるOCRエンジンと、多くの追加言語およびスクリプト用のモデルが追加され、対応言語は合計で116言語となった[15]。
さらに、37言語のスクリプトがサポートされているため、言語が記述されているスクリプトを使用して言語を認識することができる。
Tesseractは基本的にコマンドライン使用のため、GUIのフロントエンドとしては別途いくつかあるようです。Windows用としては
- OCRFeeder
- FreeOCR
- Capture2Text
OCRFeederはWindows版がなく、FreeOCRはありますが日本語のOCRには対応してないようです。
日本語をしたい場合はCapture2Text一択になりそう。