Copy link to clipboard
Copied
When I create PDF by Adobe Acrobat Distiller.
Acrobat changes KANJI 9AD8(高) to 2FBC(⾼) when Meiryo UI.
Then internet world, I can see many documents includes 2FBC(⾼).
Normally it is difficult to input character 2FBC(⾼) to documents.
This behavior is not convenient. We can not serch document include "高".
Could you teach Adobe company about this phenomenon.
Step1 Original Word document.
Step2 Acrobat PDF. I can not search Meiryo UI 6587.
Step3 Word PDF. I can search Meiryo UI 6587. No problem.
Copy link to clipboard
Copied
What is the original document created with before you convert to PDF?
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Distiller does not understand CJK remapping, it just takes its input and makes a PDF. So we need to look closely at all the steps and settings that you use on the way to the PDF. I checked the Meiryo UI font included with Windows 8.1, and it does include U+9AD8.
An interesting point is that Chrome shows both of your code points as identical
while some pages show different eg
(Key point for me: Is the low centre box detached?)
Copy link to clipboard
Copied
Thank you for Test_Screen_Name-san. Distiller does not have remapping to CJK, of course.
But, some application had the function that use first code than large code in KANJI code. Because KANJI code has simple(current) style code and difficult(old) style code. For example
4E80(亀) and 9F9C(龜). Two KANJI character has the same mean KAME=Turtle. This function select 4E80 than 9F9C, because user should chose current style code. But Meiryo has more more first code 2FD4(⿔), so this phenomenon occurs, If disttller application codes includes this function.
Copy link to clipboard
Copied
Step1. I make original documents by word of Office 365.
Copy link to clipboard
Copied
Step2. I change original data to PDF by Acrobat distiller.
I open Acrobat Reader.
I search "文"(6587).
Result
I can find the character of MS UI Gothic font.
I can not find the character of Meiryo UI font.
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Step3. I change original data to PDF by Word's save to PDF function, this PDF has no problem.
I open the PDF file by Acrobat Reader.
I search "文"(6587).
Result
I can search the "文” of MS UI Gothic, and Meiryo UI font.
Ther are no problem.
Copy link to clipboard
Copied
元のOSバージョン+作成アプリケーションと、Distillerのバージョン、そしてどのように変換を行ったのか、といった情報が必要にはなります。
ただ、Windows 10+Word 2016上で作成した「高い」という文字を含んだ文書を、Adobe PDFプリンタードライバー経由で標準設定で書き出したPDFからテキスト抽出したものをコード確認する限りは、u+9ad8となっていることを確認しました。
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Copy link to clipboard
Copied
CJK統合漢字が康煕部首側に変化する場合もある、ということでしょうか。
確かに提示されたWeb上のPDFは康煕部首側でしたが、これだけでは断言が難しいです。
ccc3141592さんも仰るように、基本、u+2fbcは入力することはまずありません。
そしてCJK統合→康煕部首への変化としたら問題だとは思うのですが、これは結果のPDFと変換エンジンだけ見て決めつけるのは拙速ではないかと思います。
よって、作成アプリケーションから前後関係をすべて明確にし、確実な再現方法を求めることが必要ですし、少なくともアプリケーション上のデータ状態と生成されたPSファイルの確認など、Distillerを通す前のデータ状態を確認することは欠かせないところです。
Copy link to clipboard
Copied
Copy link to clipboard
Copied
Ver.Xのみとした場合、それ自体はサポート終了品なので、現行バージョンに移行することが求められます。
ですからDCサブスクリプションと Officeのサポート品での組み合わせで発生するかどうかもあります。
Copy link to clipboard
Copied
はじめまして。現行バージョンである Acrobat Distiller 20.0 (Windows) でもこの問題が起きています。
フォントはMeiryo UIに限らず、メイリオや游明朝・游ゴシックなどで確認できます。
再現方法:Wordなどで "埼玉県日高市" と入力してフォントをメイリオなどにする。「印刷」でプリンターを「Adobe PDF」にして印刷(PDFファイルに出力)。そのPDFをAcrobatで開いてテキストを選択コピーしてその文字コードを調べると、"玉", "日", "高" だったはずの文字が次の文字に変わっています:
⽟ U+2F5F KANGXI RADICAL JADE
⽇ U+2F47 KANGXI RADICAL SUN
⾼ U+2FBC KANGXI RADICAL TALL
この問題はいろいろなところで問題になっているようです:
https://twitter.com/apricoton/status/771574863815249920
https://twitter.com/koedameiro/status/1107114209815326720
https://twitter.com/hal_sk/status/1281853581218336768
このためにAcrobat Distillerで生成されたPDFが、正常なテキストを取り出せない、検索ができない、音声読み上げができないなどアクセシビリティーの問題やデータの再利用が難しい問題があります。
ぜひAdobeさんには問題を認識して対策を講じていただきたいです。
Copy link to clipboard
Copied
Murakami-san
はじめまして。まだ治っていないんですね。私はあきらめて、Word、Excellなどから直接、PDF拡張子で保存することを、みなさんに勧めています。問題は起きません。
Distillerを使うと、Meiryoフォントに限らず、康煕字典部首コードにフォントを実際持っている新しいフォントは軒並み、この現象におちいるのではないかと推察します。
Murakamiさんの記事にあるとおり、困った問題です。早くAdobeが修正しないと、たくさんのゴミPDFファイルがWeb上にできて、消えません。検索、変換ができないのですから大変困った問題だと思います。
Adobeあるいは関係者からの方、どうか反応してください!