OCRが画像の中の文字をまったく認識しません
文章と画像が混在するパワーポイントファイルをPDFにしましたが、貼ってある画像の中のテキストをまったく読み込んでくれません。
自動で読み取ってくれるものと思っていたのですが・・・・ 言語は日本語と英語の混在です。
よろしくお願いいたします。
文章と画像が混在するパワーポイントファイルをPDFにしましたが、貼ってある画像の中のテキストをまったく読み込んでくれません。
自動で読み取ってくれるものと思っていたのですが・・・・ 言語は日本語と英語の混在です。
よろしくお願いいたします。
ご回答どうもありがとうございます。
有料登録したのは Creative Cloud ではなくAdobe Export PDFです。
(「PDFをWORDに変換する」をクリックしたときに、「登録してください」、と出たのでそのまま有料登録しました。月額200円のです。)
Acrobat DCは過去にいったんダウンロードしたのですが、そこから「その他の形式で保存」を選んでテキストファイルにすると、XIまではそのまま保存できたのに、なぜかスペースが全部なくなってしまう(単語と単語の間のスペースが全部なくなってしまう)ので、アンインストールしてXIに戻して使っています。
これまではテキストファイルに保存した内容をもう一度空のWORDに貼り付けて文字数を数えていたので、PDFから直接WORDに変換できるのはありがたいのですが、画像化された部分が読み込まれないと、目視で全部タイピングすることになるので・・・・
(PDFからWORDにするのは単に文字数を数えるためです。文字数数えるためだけに全部タイピングするのがどうも・・・・・そのためにわざわざCreative Cloud に登録するのもコスパ悪すぎます。)
文字数を数えるだけなので何か良い方法があると良いのですが。
なるほど…翻訳のお仕事でしょうか。
Adobe Export PDFはOCR機能がありますね。
https://helpx.adobe.com/jp/document-cloud/help/using-ocr-exportpdf.html
こちらは文字データを一切含まない、画像から作成したPDFから文字を抽出する機能ですので、PowerPointやWordから作成したPDFには使えません。いきなりPDFでOCR機能が使えなかったのも同じ理由だと思います。
面倒ですがPDFをいったん1ページずつ画像化すればAdobe Export PDFでもいきなりPDFでもテキスト認識できます。
PowerPointからテキスト認識したいページを画像で書き出し→いきなりPDFでPDFにまとめて「囲んで読取」機能で必要なところだけOCR、が一番簡単そうですね。
Already have an account? Login
Enter your E-mail address. We'll send you an e-mail with instructions to reset your password.