終了

OCRで認識した部分をテキストに置換

Community Beginner ,
Jun 04, 2024 Jun 04, 2024

リンクをクリップボードにコピー

コピー完了

pdf文書の一部に外字が画像で埋め込まれています.その外字部分をocr機能を用いると,検索可能なテキストとして認識されるのですが,その外字部分を認識したテキストに置換する方法はありますか?

キーワード
PDF の編集と変換 , ドキュメントをスキャンして OCR を実行する

表示

125

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
アドビスタッフ ,
Jun 10, 2024 Jun 10, 2024

リンクをクリップボードにコピー

コピー完了

Acrobat ProでOCRする際に、検索可能というオプションと編集可能というオプションがありますので、それを試していただくのも一つの方法です。すでに検索可能なテキストとして認識されている場合は、「印刷工程を使用」から「プリフライト」を選んでいただき、「OCRテキストを表示」を試していただくこともできるかと思います。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
Community Beginner ,
Jun 13, 2024 Jun 13, 2024

リンクをクリップボードにコピー

コピー完了

アドバイスありがとうございます.OCRする際に,「編集可能」というオプションを選択すると,「このページにはレンダリング可能なテキストが含まれています.」との理由でエラーが表示され,そのエラーの詳細を確認すると,tiffファイルに変換してからOCR「編集可能」を実施するようにアドバイスがありました.tiffファイルに変換してからOCRを行うと,まず,tiffファイルに変換する際に各ページ毎のファイルが生成されて1頁ごとに処理を行わなければならないこと,tiffファイルに変換した際に通常のテキスト部分もいったん画像化されて再度OCR処理されるので,精度が確保できない場合があること,などの問題が生じました.「このページにはレンダリング可能なテキストが含まれています.」とのエラー理由を解消するよい方法はありませんか?

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
アドビスタッフ ,
Jun 16, 2024 Jun 16, 2024

リンクをクリップボードにコピー

コピー完了

「このページにはレンダリング可能なテキストが含まれています」の対処法に関しましては、勉強不足な点もあり分からないのですが、英語のコミュニティーで調べましたところ、印刷メニューからPDFファイルに出力してからする方法を提案している方がいました。もしかしたらそれでしたらtiffに変換せずにできるかも知れませんので、ぜひお試しください。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
Community Beginner ,
Jun 16, 2024 Jun 16, 2024

リンクをクリップボードにコピー

コピー完了

アドバイスありがとうございます.印刷メニューからPDFファイルに出力してからする方法を試してみましたが,tiffファイルに変換する際に各ページ毎のファイルが作成されることはなく,1つのpdfファイルが作成されるのですが,全てのテキストがいったん画像化されて再度OCR処理されるようで,精度が確保できない場合(画数の多い漢字が化ける)が生じました.

なお,当初アドバイスいただいた『「印刷工程を使用」から「プリフライト」を選んでいただき、「OCRテキストを表示」を試していただくこともできるかと思います。』との操作は,その方法がよく分からないのでまだ試していません.補充のアドバイスがあればありがたいです.

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
アドビスタッフ ,
Jun 17, 2024 Jun 17, 2024

リンクをクリップボードにコピー

コピー完了

最新

すでにOCRが施されていて、検索が可能な状態になっているPDFをAcrobat Proで開きます。この状態で、「プリフライト」というツールを開きます。以下の画像のようにツールの検索で見つけることもできます。

Yosei5CC7_0-1718690958776.png

次にプリフライトの一覧から、「OCRテキストを表示」を選びます。もしかしたら中央上のプロファイルを選択する必要があるかも知れません。

Yosei5CC7_1-1718691120662.png

次に右下の「解析してフィックスアップ」をクリックしますと、新しく保存するファイルのダイアログが出るかと思いますので、適当に名前を付けて保存してください。プリフライトのメニューはもう閉じて大丈夫です。透明だった非表示のテキストが表示されるようになるかと思います。なおこのテキストは新しいレイヤーとして追加されていますので、必要に応じて表示・非表示など切り替えることも可能です。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines