終了

フォント埋め込みするとテキスト検索ができない

New Here ,
Oct 14, 2021 Oct 14, 2021

リンクをクリップボードにコピー

コピー完了

PDFでフォント埋込をすると、テキスト検索ができなくなります。

全てのフォントが埋め込まれていて、且つテキスト検索ができる状態にする手順はありますか。

 

行った手順は下記の通りです。

①Adobe Acrobat Standard DCでひらく→プリンター「Adobe PDF」→プロパティのPDF設定「フォント埋込」→印刷実行

②「ファイル」→「プロパティ」→「フォント」表示されるすべてのフォントに(埋め込みサブセット)が付く。

③「編集」→「簡易検索」→一致するものがない、と表示されてしまう。

④「スキャンとOCR」→「テキスト認識」実行

⑤簡易検索→検索結果が表示される。

⑥②と同じ手順で確認すると、(埋め込みサブセット)が表示されないフォントが現れる。

 

以上です。

 

そもそも「フォント埋込」と「テキスト認識」は両立するものでしょうか?

提出する書類で両方求められ困っています・・・

 

キーワード
PDF の編集と変換 , ドキュメントをスキャンして OCR を実行する , 一般的なトラブルシューティング , 手順

表示

1.1K

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
Community Expert ,
Oct 14, 2021 Oct 14, 2021

リンクをクリップボードにコピー

コピー完了

テキスト認識の機能は画像をスキャンしたものをPDFにする際に自動的にテキストの認識を行い画像とテキストがリンクした状態を作るためのものです。元々フォントが埋め込まれている状態であればテキストの抽出は可能です。
他のアプリケーション、例えばMicrosoftWord等の別名で保存を行って作成されたPDF等では基本的に全てのフォントに対して埋め込みが行われます。その状態のものに対してテキスト認識を実行するのは意味のない行為ですが、その中にスキャン画像を配置しただけのページがある場合はそのページのみテキスト認識によってテキストを抽出できるようにする事はありえます。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
New Here ,
Oct 19, 2021 Oct 19, 2021

リンクをクリップボードにコピー

コピー完了

ご返信いただき誠にありがとうございます。

今回、対象のPDFはスキャン画像がほとんどです。MicrosoftWordなど元々のデータは当方持ち合わせておりません。このPDFに、テキスト検索できるように「スキャンとOCR」機能からテキスト認識を実行しました。添付しているPDFサンプルは、これと同じ状態になっています。

 

次に、「ファイル」→「プロパティ」→「フォント」を開くと、この文書で使用しているフォント一覧が表示されますが、どのフォント名の後にも埋め込みサブセット」や「埋め込み」と表示されません。今回はこれを表示させて提出するように、との先方からの要求なのですがやり方が分かりません。

 

フォント埋込やテキスト認識の仕組み自体に対しての理解が乏しいままでの質問になっているかと思い大変恐縮ですが、もしこういったことが可能なのであればご教示いただけると助かります。

 

 

 

 

 

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
Community Expert ,
Oct 19, 2021 Oct 19, 2021

リンクをクリップボードにコピー

コピー完了

最新
そもそもなんのためにフォントを埋め込むのかという所なのですが、フォントを埋め込むことによりそのフォントが存在しない端末においても表示を保つためだけのものです。
OCRされた情報というのは見た目は画像によって保持されます。そのためフォントのグリフを保持する必要がないのです。ただ、テキストとしての情報が必要なためにフォントの基本情報が記述されます。以上によりOCRした部分ではフォントは埋め込まれません。この挙動は仕様です。
対して、他のアプリケーションが書き出した部分というのは実際に利用されているグリフ(フォントのアウトラインデータ)を埋め込まないと元々デザインされた文書体裁が再現できません。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines