最新Acrobatのテキスト認識の仕様は変更されていますか
業務概要:
1)紙資料をスキャナにてPDF出力し、Acrobatのテキスト認識にてバッチ処理
2)紙資料は活字、手書きの混在の資料(B5)
障害経緯:
1)昨年(2019年)7月頃のAcrobat(19.012.20035)では数百ファイルに数回、
Acrobatが無応答になっていました
2)アドビフォーラムへ以下を投稿し(2019/7/18)
当社ではAcrobat DC(Continuous Release 1バージョン 2019.012.20035)
をWindows10で使用して400程度の電子化した
マルチページPDFに対してテキスト認識させていますが、
場合によりますが、2つのエラーが発生します。
1つは「警告とエラー」ウィンドウに「原因不明のエラーが発生しました」
というメッセージと共に該当ファイルと
ページ数が表示、2つ目はAcrobat DC自身が応答なしになる件です。
問題は後者で夜間でバッチ処理させているときに停止してもリカバーできません。
何か解決案はありますか
ご回答は
PDFを作成したアプリケーションがアドビ製品でないと保証はできないという
ことでしたので、それ以上の質問は差し控えました
3)バージョン更新のため、今年の4月末まで無応答の頻度は極端に減少しました
4)今年(2020年)の5月のバージョン(20.009.20067)ではファイルのサイズ合計が
135MB程度(ファイル数にして数ファイル)で、テキスト認識は1時間以内で
停止して、その後、テキスト認識は続行しているように見えますが、正常に
テキスト認識されていません。なお、警告とエラー画面には「Paper Capture
認識サービスが見つかりません。正しくインストールされていない可能性があります」
というエラーメッセージが多数表示されていました。そのエラーメッセージについては、
アドビのFAQに対応が記載されていましたが、効果なしです
5)今年5月以前で問題なくテキスト認識できたファイルを最新バージョンで
テキスト認識させましたが、4)で述べました現象が発生しました。
よって、スキャン対象の紙資料の問題ではないようです。
環境:
1)スキャン要件は200dpi,カラー、片面
2)PC環境はWindows 10 Pro 64ビット、メモリー16GB
3)マイクロソフトのメモリー解放ソフト(empty.exe)で常に40%以下
今回の障害は致命的ですので再度質問させて頂きました。何か解決案が
あればお願いします。
==
追伸
1)テキスト認識のバッチ処理が正常終了した場合、
あるいはエラーで動作が停止した場合、外部の
アプリケーションからWindows API等を使用して
知ることは出来ますか
2)先程、12時40分にクラッシュレポートを送信しました
