Skip to main content
Participant
January 18, 2018
Question

OCR

  • January 18, 2018
  • 2 replies
  • 841 views

Acrobat 11 standardでスキャンした(300dpi)文章をOCR機能を使ってテキスト化しようとしているのですが出来ません。ソフトでファイルを読み込み、ツールのテキスト認識からこのファイル内を選び、編集ボタンを押して、OCRの言語を「日本語」、PDFの出力形式を「検索可能な画像」、ダウンサンプルを「600dpiもしくは300dpi」にしてOKを押します。その後確認のためにツールのテキストと画像の編集を選んでも、A4ファイル全体が1枚の画像ファイルのままです。何が間違っているのでしょうか?

    This topic has been closed for replies.

    2 replies

    assause
    Community Expert
    Community Expert
    August 27, 2018

    単純に「元々テキストが含まれるPDF」ということはないでしょうか。

    その場合はOCR処理が行われることがないためです。

    テキスト認識前に、部分的にでもテキスト認識している場所が内かの確認をしてみましょう。

    なお、今回とは直接関係ないですが、Acrobat XIは既にセキュリティサポートが終了しています。

    よって継続利用自体がリスクのある利用という点を踏まえておきましょう。

    katayanagi51
    Community Expert
    Community Expert
    January 18, 2018

    なんとなく「OCR機能を使ってテキスト化」が「画像を,画像と同じ見た目のフォントで自動組版させること」を指しているようにも読めてしまいますが,そうではなく,抽出されたはずのテキストデータに触れることができないということでしょうか。通常の選択ツールで全選択(Ctrl+A)するとテキストがない旨のアラートが出ますか?

    Participant
    January 18, 2018

    返信ありがとうございます。通常の選択ツールで全選択をするとファイル全体(A4全体)が選択されます。通常全選択すると文章全てがハイライトされるような状態ではありません。文章の一部にカーソルを文字だけを選択することも出来ません。全体を画像としてとらえているように思える状態です。

    katayanagi51
    Community Expert
    Community Expert
    January 18, 2018

    なるほど,失礼しました。

    OCRのテキスト認識を実行した後にエラーメッセージ等も出ないのですよね? で,完了もしていない。

    申し訳ないですけど,ちょっとわかりません。インストールの修復で改善すればいいのですけど…。

    おかしいなと思ったら(Acrobat XI)