Skip to main content
Participant
March 23, 2023
質問

日本語OCRが適用されない

  • March 23, 2023
  • 返信数 3.
  • 2458 ビュー

Windows11上でAcrobat Pro(Ver.2023.001.20093 | 64bit)とCreativeCloudを走らせています。

日本語OCRがおかしい(英語OCRはおそらく問題なし)ことに気付いたのは2週間ほど前(2023年3月初めころ)です。Web記事をChromeで表示したものをPDFファイルとして出力していたのですが、できあがったPDFでは文字が文字として認識されておらず、OCRを実行しても文字認識がされません。OCRを命じると一見作業しているように見えるのですが、通常より早く作業が終わり、そして文字認識は全くなされていないのです。

 <環境設定>→(分類から)<アップデーター>→<オプションも含めてアップデート>もやりましたし、CreativeCloudの前にAcrobat Readerをインストールしておくなどの方法も試しましたが、解決しませんでした。普段メインで使っているデスクトップ、それから同じくWindows11で動いているノートPCでもだめでした。Windwos10のPCでは問題なく機能しています。

Windows11に移行したのは昨秋ですが、この3月までは日本語OCRも問題ありませんでした。

このトピックへの返信は締め切られました。

返信数 3

Inspiring
June 5, 2023

確認させてください。
元々のご質問ではWindows11では駄目で、Windows10ならば問題ないとの
ことでしたが、Windows10で「Adobe PDF」でも問題ないのでしょうか。

 

こちらはWindows10とEdgeの組合せですが、「Adobe PDF」での変換では
PDFのフォントが「T1」「T2」「T3」となり、文字の選択はできません。
OCRは試していないですが、文字がアウトライン化されており、図形である
(画像ではない)ため、うまくいかないと思われます。
「Adobe PDF」は通常、Adobe PDFプリンタによるPDF出力のはずで、
他のアプリとの組合せでは起きない問題が起きる理由は分かりません。

 

ちなみに
「「Microsoft Print to PDF」を使用すると、Edgeで開いたPDFファイルを
アウトライン化することができます。」
という情報を見つけたのですが、関係あるかどうかは不明です。

assause
Community Expert
Community Expert
March 24, 2023

Windows 11+Acrobat Pro 64bit 23.001.20093の環境で、JPEG画像を読み込んだ後にスキャンとOCRで処理してみたのですが、その場合は正常に動作しました。

今回の場合、処理したいPDFがすでに一部でもテキスト情報のあるものではないでしょうか。

その場合は昔からOCR処理は出来なかったと記憶しています。

 

またChromeの印刷機能で、Chrome側が持つPDF保存機能を使った場合、原則としてはテキスト情報は生きたと記憶してますので、OCRする意味は本来はないのではと思うところです。

hyrax6678作成者
Participant
June 3, 2023

 だいぶ時間がかかってしまいましたが、ようやく(完全ではないものの)解決いたしました。

 添付の画像のように『PDFに保存』とはべつに『Adobe PDF』という選択肢がございまして、この後者、『Adobe PDF』を選択すると全く文字が認識されていない、かつOCRを拒否するPDFができあがってしまうことが判明しました。この『Adobe PDF』を削除できていないという点で「完全ではない」と記しましたが、これを無視すれば実用上は問題ないので「解決した」と考えました。

 その節はご忠告くださり、誠にありがとうございました。

IceFloe
Participating Frequently
March 24, 2023

最近Window利用者のPDFプリンタでの、フォントの埋め込み不具合の
相談が多いような…(何かあった?<<Windowsなみなさん)

WindowsのPDFプリンタの『文字化け回避』の推奨設定はWindowsなみなさんにお任せするとして…(他力本願)
ーー>検索でも結構出てくるから調べてみると良いですよ♪

私はMacな人なので
可能な範囲でアドバイスするとしたら
AcrobatのPDFプリンタを使わずに
ブラウザ組み込みの『PDFに保存』を使うと良いのではないか?と思います。
あとはPDFプリンタの設定次第だと思います。
お試しください。
参考まで

 

hyrax6678作成者
Participant
June 3, 2023

 だいぶ時間がかかってしまいましたが、ようやく(完全ではないものの)解決いたしました。

 添付の画像のように『PDFに保存』とは別に『Adobe PDF』という選択肢がございまして、この後者、『Adobe PDF』を選択すると全く文字が認識されていない、かつOCRを拒否するPDFができあがってしまうことが判明しました。この『Adobe PDF』を削除できていないという点で「完全ではない」と記しましたが、これを無視すれば実用上は問題ないので「解決した」と考えました。

 その節はご忠告くださり、誠にありがとうございました。