Skip to main content
Inspiring
July 26, 2023
Answered

テキストを認識させなくするには?

  • July 26, 2023
  • 2 replies
  • 1987 views

こんにちは。

前提としてインデザインでレイアウトを組み

Acrobat排出後の作業としてお聞きします。

 

カタログの参考誌面添付していますので、

そちらをご覧いただきながらお聞きください。

 

参考例、右ページの小口に「ハシラ」「ツメ」などととよばれる、

そのページが何者かを指す表現がよくあります。

このデータをPDFとして活用する際、「みかん」を探すために語句検索をすると

ハシラのある全てのページにヒットし、「みかん」が探せなくなります。

 

ハシラの部分だけテキストとして認識させないようにしたいです。

 

ただし、インデザイン(またはイラレ)側でアウトラインをトルのが

一番手っ取り早いのは承知していますが、できればしたくありません。

次回度へテキストとして残しておきたい、だとか

入稿前にハシラの内容が変わるだとか、編集上の理由からです。

 

現状、アウトラインをとって対応しているのですが、

PDF上の処理で、誌面の一部分のみ非テキスト化するようなことは

可能でしょうか?

 

よろしくお願いいたします。

This topic has been closed for replies.
Correct answer Omachi

Acrobatの操作ではなくInDesignの操作になってしまい申し訳ありません。参考までに書いておきます。一応希望の結果になっていると思うのですが。

 

添付PDFファイルおよびInDesignファイルは、上の行はテキストそのまま、下の行は効果の「光彩(内側)」を設定したものです。

私の環境では効果を掛けるとテキストとして認識されなくなるのですが、どうでしょう。なお、InDesignファイルはバージョン18.3で作成したものです。開けなかったらごめんなさい。

 

2 replies

Ten A
Community Expert
Community Expert
July 26, 2023

Omachiさんご指摘の光彩付きのテキストをPDF上で確認すると文字属性が消えていますね。書き出す際にアウトライン化されて効果の情報がExtentGstateとしてリンクされます。
これ、覚えておこう(^-^;

こちらのコマンドq以降の子階層になっているのが「あ」の部分で効果がかかっていた部分です。Tjコマンドがありませんのでテキストとして検索不可能です。

下方の(003M)Tjは「い」に該当する部分です。こちらは効果があたっていないので普通にテキストとしての構造が保持されています。

Omachi
OmachiCorrect answer
Legend
July 26, 2023

Acrobatの操作ではなくInDesignの操作になってしまい申し訳ありません。参考までに書いておきます。一応希望の結果になっていると思うのですが。

 

添付PDFファイルおよびInDesignファイルは、上の行はテキストそのまま、下の行は効果の「光彩(内側)」を設定したものです。

私の環境では効果を掛けるとテキストとして認識されなくなるのですが、どうでしょう。なお、InDesignファイルはバージョン18.3で作成したものです。開けなかったらごめんなさい。

 

Inspiring
July 27, 2023

すごいな・・・

コレ、インデザイン上のバグを逆手にとった裏技ってとこですかね。

実際の運用で、スミ文字以外に色が付いていたり、白抜きだったりして

都度検証が必要になるとおもいますが、Omachi様の手法で検討したいです。

ありがとうございました。

 

Inspiring
July 27, 2023

少しやってみたのですが、白文字の場合

テキストをBL100 、「光彩(内側)」で白を「乗算→通常」で被せると

機能しました。

 

逆にこの意図のない場合の光彩文字が、

テキスト認識されない場合は困るかもですね・・・・。