リンクをクリップボードにコピー
コピー完了
【使用製品】
Acrobat Distiller 15.0 (Windows)
【現象】
Acrobat Distillerを使用しPDFを再変換すると、画面の表示上は文字が正しく文表示されますが、
メモ帳などにコピー&ペーストすると「□□□」となり、正しくコピーできません。
【再現方法】
【補足】
PDFから変換した際に文字化けするフォントに共通する事項として、種類が「TrueType(CID)」、エンコードが「Identity-H」であることが挙げられます。
(ただし、wordから作成したPDFでは「Identity-H」でも文字化けしません)
上記のことから、DistillerでPDFを再変換すると、Cmapが欠落するのではと推測しています。(あまり詳しいことは存じ上げません)
【質問事項】
情報が不足していたらお知らせ頂ければと思います。
以上、どなたかご存知であればご回答頂ければ幸いです。
リンクをクリップボードにコピー
コピー完了
PDFからPSを経由して再度PDF化を行うということだと、
テキスト情報は多重化されてしまって元のコードポイントを保てるというものではない状態です。
また、PDF自体がもともとテキストの再利用を念頭に置いたデータフォーマットではありません。
確かに内部のマッピングテーブル次第ですが、それでも万全とはいえないところです。
いずれにしても今回の場合、再PDF化する理由もよくわからないところですし、
一度それでテキスト状態が実質的に破壊された場合、元に戻すのはまず不可能でしょう。
リンクをクリップボードにコピー
コピー完了
ご回答ありがとうございます。
説明が抜けておりましたが、PDFをDistillerで再変換する理由としては、
何らかの理由で破損したPDFを修復する為となります。
PDF自体がもともとテキストの再利用を念頭に置いた
データフォーマットでは無いというのはおっしゃる通りかと思いますが、
英数字では問題無いことを考えると、最低限検索が出来る程度の状態であってほしいところです。
この状態になったPDFを後から元に戻すのは難しいという旨、承知いたしました。
個人的にはDistillerのバグという認識なので、Adobeに問い合わせたいと思います。
リンクをクリップボードにコピー
コピー完了
PostScriptデータ経由で再PDF化した場合は破損ファイルの修復にはなりえないと思います。
破損してたらそもそも開けないと思いますし、開いて破損ということであれば
要素自体が欠落しているわけで、元のようにはならないはずです。
その場合はオリジナルデータから再生成するしかないだろうと思います。
あわせて、コードポイントの変化はどちらかというとDistillerだけではなく、
PostScriptにした時点での変化と考えたほうがいいでしょう。
Distillerは実質的にはコンバーターにしかすぎないと考えたほうが自然なところです。
リンクをクリップボードにコピー
コピー完了
PS経由での再PDF化が破損ファイルの修復にはなりえないというお話について、
仰っている事はよく分かるのですが、これで直る場合がある事や、
この方法をPDFの修正手段として提供しているAcrobatプラグインがあるので何とも言えない所です。
バグではなく仕様という回答になるとは思いますが、ひとまずAdobeのサポートに
問合せいたしましたので、回答があり次第こちらにも記載いたします。
リンクをクリップボードにコピー
コピー完了
本件についてAdobeに問い合わせた所、
バグではなく、以下に記載のある制限事項であるという回答がありました。
【PDF ファイルの再変換に関する制限事項(Acrobat)】
https://helpx.adobe.com/jp/acrobat/kb/cq10240010.html
残念ですが、仕様として理解いたします。
ご回答頂きました方々、ありがとうございました。
リンクをクリップボードにコピー
コピー完了
回答ではありませんが参考に。
PDFビューアを「Adobe Acrrobat Pro DC(2018)」「Foxit Reader」、
プリンタを「Adobe PDF」「Foxit Reader PDF Printer」「Microsoft Print to PDF」
の組み合わせで色々やってみましたが、
「Adobe Acrrobat Pro DC(2018)」「Adobe PDF」の組み合わせが
一番まともで、文字化けするものの、文字として認識しました。
他の組み合わせでは、そもそも文字として認識しない(画像化される)など
全く使えるものではありません。
assauseさんのおっしゃられるようにPDFはテキストの再利用を念頭には置いていないので
そもそも再度PDF化するということを考慮していませんし、することに意味がありません。
(単にデータサイズを増やすだけです)