OCRが画像の中の文字をまったく認識しません

Question

文章と画像が混在するパワーポイントファイルをPDFにしましたが、貼ってある画像の中のテキストをまったく読み込んでくれません。

自動で読み取ってくれるものと思っていたのですが・・・・　言語は日本語と英語の混在です。

よろしくお願いいたします。

Subi Omu · Accepted Answer

ご回答どうもありがとうございます。有料登録したのは Creative Cloud ではなくAdobe Export PDFです。（「PDFをWORDに変換する」をクリックしたときに、「登録してください」、と出たのでそのまま有料登録しました。月額２００円のです。）Acrobat　DCは過去にいったんダウンロードしたのですが、そこから「その他の形式で保存」を選んでテキストファイルにすると、XIまではそのまま保存できたのに、なぜかスペースが全部なくなってしまう（単語と単語の間のスペースが全部なくなってしまう）ので、アンインストールしてXIに戻して使っています。これまではテキストファイルに保存した内容をもう一度空のWORDに貼り付けて文字数を数えていたので、PDFから直接WORDに変換できるのはありがたいのですが、画像化された部分が読み込まれないと、目視で全部タイピングすることになるので・・・・（PDFからWORDにするのは単に文字数を数えるためです。文字数数えるためだけに全部タイピングするのがどうも・・・・・そのためにわざわざCreative Cloud に登録するのもコスパ悪すぎます。）文字数を数えるだけなので何か良い方法があると良いのですが。なるほど…翻訳のお仕事でしょうか。Adobe Export PDFはOCR機能がありますね。https://helpx.adobe.com/jp/document-cloud/help/using-ocr-exportpdf.htmlこちらは文字データを一切含まない、画像から作成したPDFから文字を抽出する機能ですので、PowerPointやWordから作成したPDFには使えません。いきなりPDFでOCR機能が使えなかったのも同じ理由だと思います。面倒ですがPDFをいったん1ページずつ画像化すればAdobe Export PDFでもいきなりPDFでもテキスト認識できます。PowerPointからテキスト認識したいページを画像で書き出し→いきなりPDFでPDFにまとめて「囲んで読取」機能で必要なところだけOCR、が一番簡単そうですね。

assause · Answer

利用されているバージョンが不明ですが、下記のようなメッセージが出ませんでしょうか。

「次の理由により、このページのテキスト認識を実行できませんでした。

このページにはレンダリング可能なテキストが含まれています。」

（Acrobat DCの例）

AcrobatのOCR機能については、テキスト情報が含まれている場合には機能せず、

上記のようなメッセージが表示されるだけです。

OCRを使う場合は原則としてスキャンしたビットマップ画像に対してだけになります。

Sign up

To post, reply, or follow discussions, please sign in with your Adobe ID.

Sign in to Adobe Community

To post, reply, or follow discussions, please sign in with your Adobe ID.