OCR 検索可能にならない。

Question

Adobe Acrobat Pro DC 2015.008.20082 を macOS Sierra 10.12.5 にて英語環境で使っています。

このバージョンの Acrobat Pro では、OCR に 3 つのオプションがあります。

1. Searchable Image (日本語: 検索可能な画像)

2. Searchable Image (Exact) (日本語: 検索可能な画像 (非圧縮))

3. Editable Text and Images (日本語: ClearScan) (ちなみに英語では ClearScan という言葉は消滅した模様)

3 の Editable Text and Images では OCR 機能が働いて、処理後に日本語検索が可能なことは確かめました。

しかしながら、1, 2 に関しては処理後、日本語検索ができません。このとき、画像テキストは選択し、コピー&ペーストできるのですが、ペースト時に文字化けしています。

Acrobat そのものでの検索も不可能ですし、Mac の Preview.app でも不可能です。

・対策 (試すこと)

・レポートする場所の指摘

等ありましたら、お願いします。

assause · Accepted Answer

assause さま連投ですみません。 最初の assause さんの投稿で、「PDF を編集」メニューから、OCR を設定しているように見受けられます。しかし、こちらで試したところ、PDF を編集しようとした場合に、ClearScan モードでの OCR が自動的に行われるようです。一方で、こちらで行なっているのは、(Windows のメニューが分からずすみませんが、Mac では)「スキャン補正」→「テキスト認識」→「このファイル内」→(メニューバーみたいなのが現れる)「設定」→(テキスト認識というダイアログが出る)「設定」→「文書の言語→日本語」、「出力→検索可能な画像 (非圧縮)」→「テキスト認識」(ボタン)という流れです (多分 Windows でも同様のメニューがあるはずです)。設定で、検索可能な画像 (非圧縮) (または圧縮) を選ぶと、日本語がうまく OCR 処理されません。p.s.一度お名前を間違えていました、すみません。スキャン補正の設定でしたか。気づきませんでした。確かにこちらでは、いずれの場合でも「PDFを編集」でOCR処理をかけていました。そしてWindows/Macとも、あらためてスキャン補正からテキスト認識を行ってみました。設定としては「検索可能な画像」（600dpi）と「検索可能な画像（非圧縮）」の両方をそれぞれなので、環境差も含めて都合4回の変換をかけてみました。ただ結果としては、やはり正常に処理されたことが確認できいました。いずれも日本語UI+認識設定は日本語言語設定にて行っています。

assause · Answer

Acrobat DCのOCR処理は、基本的には設定言語に依存していたのではないかと思います。

他にある設定としては「PDFを編集」の中にある、「スキャンした文書」-「設定」を開き、

「次の言語でテキストを認識」で設定しなければならないはずです。

英語環境で使っている理由がわかりかねますが、

まずは該当設定やOSを含む言語設定を変更してみるところからではないでしょうか。

Sign up

To post, reply, or follow discussions, please sign in with your Adobe ID.

Sign in to Adobe Community

To post, reply, or follow discussions, please sign in with your Adobe ID.