OCR 検索可能にならない。

Question

Adobe Acrobat Pro DC 2015.008.20082 を macOS Sierra 10.12.5 にて英語環境で使っています。

このバージョンの Acrobat Pro では、OCR に 3 つのオプションがあります。

1. Searchable Image (日本語: 検索可能な画像)

2. Searchable Image (Exact) (日本語: 検索可能な画像 (非圧縮))

3. Editable Text and Images (日本語: ClearScan) (ちなみに英語では ClearScan という言葉は消滅した模様)

3 の Editable Text and Images では OCR 機能が働いて、処理後に日本語検索が可能なことは確かめました。

しかしながら、1, 2 に関しては処理後、日本語検索ができません。このとき、画像テキストは選択し、コピー&ペーストできるのですが、ペースト時に文字化けしています。

Acrobat そのものでの検索も不可能ですし、Mac の Preview.app でも不可能です。

・対策 (試すこと)

・レポートする場所の指摘

等ありましたら、お願いします。

assause · Accepted Answer

assause さま連投ですみません。 最初の assause さんの投稿で、「PDF を編集」メニューから、OCR を設定しているように見受けられます。しかし、こちらで試したところ、PDF を編集しようとした場合に、ClearScan モードでの OCR が自動的に行われるようです。一方で、こちらで行なっているのは、(Windows のメニューが分からずすみませんが、Mac では)「スキャン補正」→「テキスト認識」→「このファイル内」→(メニューバーみたいなのが現れる)「設定」→(テキスト認識というダイアログが出る)「設定」→「文書の言語→日本語」、「出力→検索可能な画像 (非圧縮)」→「テキスト認識」(ボタン)という流れです (多分 Windows でも同様のメニューがあるはずです)。設定で、検索可能な画像 (非圧縮) (または圧縮) を選ぶと、日本語がうまく OCR 処理されません。p.s.一度お名前を間違えていました、すみません。スキャン補正の設定でしたか。気づきませんでした。確かにこちらでは、いずれの場合でも「PDFを編集」でOCR処理をかけていました。そしてWindows/Macとも、あらためてスキャン補正からテキスト認識を行ってみました。設定としては「検索可能な画像」（600dpi）と「検索可能な画像（非圧縮）」の両方をそれぞれなので、環境差も含めて都合4回の変換をかけてみました。ただ結果としては、やはり正常に処理されたことが確認できいました。いずれも日本語UI+認識設定は日本語言語設定にて行っています。

assause · Answer

Acrobat DCのOCR処理は、基本的には設定言語に依存していたのではないかと思います。

他にある設定としては「PDFを編集」の中にある、「スキャンした文書」-「設定」を開き、

「次の言語でテキストを認識」で設定しなければならないはずです。

英語環境で使っている理由がわかりかねますが、

まずは該当設定やOSを含む言語設定を変更してみるところからではないでしょうか。

サインアップ

ソーシャルログイン

コミュニティへログイン

ソーシャルログイン

ファイルをウイルススキャンする。

このファイルはダウンロードできません