Skip to main content
Participant
March 12, 2023
Question

編集モードでは認識される文字列が検索やコピーの対象とならない

  • March 12, 2023
  • 1 reply
  • 1518 views

例えとして以下のページからダウンロードできるPDFを扱う。

http://www.jga.or.jp/jga/html/rules/rules.html

 

ファイルは「2023ゴルフ規則」にリンクされている

http://www.jga.or.jp/jga/html/rules/image/Rules_2023.pdf

こちらとする。

 

PDFの18ページ目(ノンブルは11)を例にとる。

 

「PDFを編集」を選択した状態で最初の見出しと文節をハイライトしコピペしてみた結果がこちらの画像。

問題なくコピペできている。

しかし同ページからコピーした文字列で検索をかけるとヒットしない。

コピペしたテキストエディター上ではヒットすることが次の画像からも確認できると思う。

こちらが検証結果の画像。

次に編集モードを終了してコピペしてみる。

文字化けが確認され、先ほどとは異なり改行まで挿入されてしまっている。

なお、成り行き改行は表面的なもののため、手入力で成り行き改行を含む正常に認識されている文字列を検索すると正常に検索される。

検索の際の注意点としては、テキストエディター等から改行を伴う文字列をコピーしてきて検索ボックスに貼り付けると色々詰むのでしないように。

 

バグと思われますが、みなさんの環境ではどうでしょう?

可能であれば検査やコピーが簡単にできるようにしたいのですが、方法はありますでしょうか?

IllustratorでPDFとして保存しなおすと成り行き改行がすべて改行となり、検索ができなくなってしまいます。

This topic has been closed for replies.

1 reply

Quick Timer
Inspiring
March 12, 2023

全てのコード確認したわけではないで、Acrobatのバグの可能性は潰していませんが。

この件は多分こちらの問題です。

ちょっと難解かもしれませんが納得いただけるか?と思いますよ♪

読んでみてください。
https://www.slideshare.net/trueroad_jp/pdfcidgid

参考まで

 

Quick Timer
Inspiring
March 12, 2023

自己レス
確認しました、このPDFについては

『PDF文書』の問題で、Acrobatの問題では無いようです。
(しいて言うとPDF作った環境の問題かな)

例:『ゴルフ規則書の使い方』の『書』部分です。

 

対象のフォント情報を確認すると

 

 

 

拡大すると

 

文字コードが抜けて missingとなっています

 他のちゃんとコピーできる文字はこのように

文字コードが紐づいています。

 

 

 

 

 

 

 

上記のことから

Acrobatのバグではなく

PDF文書(作成した時の環境)の問題ですね。

文字コードが紐づいていないので、見た目の文字の通りには検索できないので

検索結果もアレだったって事になりますね。

参考まで
(人のフリ見てですね… 気をつけよう♪っと)