Question
濁点と半濁点が分離し、時には文字化けすることがあります。
PDFからコピーしたテキストをExcelなどに貼り付け、その後エクスポートしてデータ(CSVなど)として扱う場合、濁点と半濁点が分離し、時には文字化けすることがあります。
元のPDFがMac版のAdobe製品で作成されていると、「UTF-8-Mac」の文字コードが使われてしまうことが原因ではないか?と思っています。
「UTF-8-Mac」では、濁点・半濁点文字、例えば「プ」を「フ」と「゜」、「ブ」を「フ」と「゛」の二文字を合成して表現するようですが、制作物に「UTF-8-Mac」を使用しない方法はありますか?
