Skip to main content
Participant
December 14, 2023
Question

Web画面を印刷(プリンタ=Adobe PDF)してPDF生成したのに透明テキスト化されない

  • December 14, 2023
  • 5 replies
  • 1128 views

Web画面を(プリンタ=Adobe PDF)印刷して、PDFファイルが生成されますが、透明テキスト化できません。
文字の範囲選択をして、コピー・アンド・ペーストをしたいのですが、adobe PDFの設定でそのような設定が見つかりません。
Windows10 (21H2)です。

わかる方いましたら、よろしくお願いします。

This topic has been closed for replies.

5 replies

assause
Community Expert
Community Expert
December 14, 2023

WebブラウザーのページをAdobe PDFプリンタードライバーでPDFにした場合、ブラウザーのほうでテキストとして範囲選択や検索などができるのであれば、通常のテキストとして処理される(PDF設定によってはフォントも埋め込まれる)ことになるのが一般論になるものの、今回は、その状態にならなかった、ということでしょうか。

ただその場合、もともとWebビットマップ画像だった部分はもともとテキストは含まれないので、そういうところは画像のままです。

処理を行ったWebページが公開されているものでしたら、出来ればそのページも示してもらったほうがいいようには思います。

 

もし「すべてのテキストとして見える部分を強制的に透明テキスト相当にする」ということだと、Acrobat Proの印刷工的に含まれる、プリフライト→フィックスアップにある「フォントをアウトラインに変換」ですべて図形にしたのちに、テキスト認識によるOCR処理を行えば、意図することは可能です。

ただ、OCR処理は完璧ではないので、表示と異なる文字列内容になってしまう可能性はあります。

Participant
December 14, 2023

ご丁寧にありがとうございました。

公開されていないページなので、そのページを出せないのです。

 

assause
Community Expert
Community Expert
December 22, 2023

一般的に公開されているWebページで問題がなく、その公開されていないページだけで起きる、となると、該当ページのデータ状態になってきます。

第三者が確認できないとなると、その推測にとどまってしまうところです。

Omachi
Legend
December 14, 2023

まず、Adobe PDFプリンタはPDFを作成するだけで、透明テキストを作成する機能はありません。

透明テキストを作成するのはAcrobat有償版(Pro/Standard)の機能で、開いたPDFファイルに画像が含まれていて文字が認識できそうな場合にOCR機能を呼び出してテキストを作成します。

 

ではAcrobatではどうなのか、ということになります。

「Adobeヘルプセンター」のトップページをAdobe PDFプリンタで印刷してPDFを作成してみました。

そのPDFファイルをIllustratorで開いたものが次の図になります。

これを見て分かるのは「文字はすべて図形化されている」ということです。

 

つまり「透明テキスト」を作成するためには[画像として認識]→[OCR機能でテキストを生成]→[生成されたテキストを画像の適切な位置に重ねて配置]という手順が必要なのですが、このPDFの場合はすべて図形で、画像がありません。そのためOCR機能が呼び出されなかったという状況かと思います。

 

Participant
December 14, 2023

Adobe PDFプリンタはPDFを作成するだけで、透明テキストを作成する機能はありません」

「透明テキストを作成するのはAcrobat有償版(Pro/Standard)の機能」

ありがとうございました。

一度保存して、さらに開いてOCR処理までしないと実現できないのですね。

Inspiring
December 14, 2023

[透明テキスト付きPDF]なるものちょっと検索してみました。
Acrobatの場合、OCRを用いて作成するようです。
スキャンとOCR > テキスト認識、という事かなぁ?

Participant
December 14, 2023

わざわざ検索していただき、ありがとうございました。

 

Participant
December 14, 2023
2023-12-14-補足.pdf
katayanagi51
Community Expert
Community Expert
December 14, 2023

透明テキスト化」とは何でしょうか。

また,「文字の範囲選択をして,コピー・アンド・ペースト」とAdobePDFは関係ないように思います。

 

いったいどういうことがしたいのかがよくわかりません。

もう少し具体的に書いていただくと,良いレスが付くのではないかと思います。