Skip to main content
Inspiring
December 19, 2016
Answered

EPS図中の翻訳漏れを見つける手段と簡体字の問題点

  • December 19, 2016
  • 1 reply
  • 1704 views

日本語から簡体字への翻訳時に、EPS図中の訳漏れチェックを以下の流れで行おうとしました。

(1) 納品されたEPS図(複数)を含むフォルダを右クリックし、[ファイルをAcrobatで結合]を選択

(2) 「ファイルを結合」ダイアログ内の[ファイルを結合]をクリック

(3) Acrobatのメニュー[ファイル]-[その他の形式で保存]-[その他のオプション]-[テキスト(プレーン)]を選択し、ファイル名を「訳漏れチェック.txt」にして保存

(4) 検索ツールを使用し、「訳漏れチェック.txt」にひらがな/カタカナが含まれていないかを検索

元々、欧州言語で同様のチェックを実施していました。

欧州言語の場合、ひらがな/カタカナの代わりに英単語を検索します。

欧州言語では特に問題は発生していません。

ところが、簡体字の場合は(3)で保存した「訳漏れチェック.txt」に簡体字のテキストが書き込まれません。

代わりに「.」になります。

(「....../ ..... C.....」のように簡体字の部分が「.」になります。)

テキストエディタ上での見栄えか確認しましたが、「.」はASCIIコードの「2E」でした。

原因や対策をご存じの方がおられましたらご教示いただけると助かります。

[使用アプリケーション]

・Acrobat XI Pro

・Illustrator CS3

・テキストエディタ:EmEditor

・検索ツール:HNXgrep

よろしくお願いします。

    This topic has been closed for replies.
    Correct answer assause

    完全に同じ環境ではないので参考までにですが、下記環境・状態で試してみました。

    • Windows 10環境+Illustrator CS3+Acrobat DC Continious 2015.020.20042(CS3は動作保証外環境)
    • 「Adobe Song Std L」と「Adobe Kaiti Std L」で「有后,今年没有一点两个星期。」を入力(2ファイル分)
      (ここで該当するのは「两」のみ)
    • EPSとして保存し、エクスプローラーで2ファイルを選択、右クリック→ファイルをAcrobatで結合を選択
    • Acrobatのダイアログで結合処理を指定
    • 表示されたPDFをコピーペーストでエディタ(UTF-8で準備)に貼り付け①
    • ファイルメニューより書き出し形式→テキスト(プレーン)で、マッピングテーブルのデフォルト②とUTF8-8③で保存
    • それぞれをエディタ(フリーのMery Build 2.4.6.5927)でコードポイントを確認

    この時、①③は「两」が表示されてu+4e24として示され、②は「.」で表示されてu+002eになりました。

    また、EPSからコピー&ペーストでエディタに貼りつけた場合も結果は①③と同様でした。

    となると、Illustrator時点の使用フォントや状態などが気になるところです。

    あわせて字形パネルで見たときのコードポイントもチェックが必要かもしれません。

    1 reply

    assause
    Community Expert
    Community Expert
    December 19, 2016

    Acrobatから書き出されたテキストのエンコーディングが気になるところです。

    デフォルトのままだと、Shift_JISになる可能性があり、そうなるとCJI統合漢字のすべては情報としては残らず、

    所謂文字化けになる可能性があるためです。

    もし設定を変更していない場合、UTF-8またはUTF-16にしてから書き出しなおしてはどうでしょうか。

    md1ntckAuthor
    Inspiring
    December 19, 2016

    早速の返信をありがとうございます。

    エンコーディングは全く気にしておらずデフォルトのまま運用していました。

    結論としてはまだ解決しておりませんが、以下の状況です。

    [デフォルトの場合 (「.」に化ける)]

    EmEditorで確認したところ、エンコーディングは日本語シフトJISでした。

    [UTF-8およびUTF-16の場合]

    EmEditorで確認したところ、エンコーディングは指定したとおりUTF-8およびUTF-16になりました。

    デフォルトのように簡体字部分が「.」になることはありませんが、UTF-8/UTF-16のいずれもASCIIコード以外は文字化けしています。

    参考になるかわかりませんが、UTF-8のテキストファイル上で文字コード値を確認してみました。

    例 「Z相」 ... 「相」の文字コードはU+76F8

    UTF-8のテキストファイルで文字コードは「U+005A」+「U+2D2E」でした。

    元データ(EPS)を開き、「Z相」をコピー&ペーストで新規テキスト書類へ貼り付けた場合は「U+005A」+「U+76F8」でした。

    また、PDF上で同じテキストをコピー&ペーストした場合は「U+005A」+「U+2D2E」でした。

    EPS→PDFへの変換で文字コードが変更されているような印象を受けました。

    assause
    Community Expert
    assauseCommunity ExpertCorrect answer
    Community Expert
    December 19, 2016

    完全に同じ環境ではないので参考までにですが、下記環境・状態で試してみました。

    • Windows 10環境+Illustrator CS3+Acrobat DC Continious 2015.020.20042(CS3は動作保証外環境)
    • 「Adobe Song Std L」と「Adobe Kaiti Std L」で「有后,今年没有一点两个星期。」を入力(2ファイル分)
      (ここで該当するのは「两」のみ)
    • EPSとして保存し、エクスプローラーで2ファイルを選択、右クリック→ファイルをAcrobatで結合を選択
    • Acrobatのダイアログで結合処理を指定
    • 表示されたPDFをコピーペーストでエディタ(UTF-8で準備)に貼り付け①
    • ファイルメニューより書き出し形式→テキスト(プレーン)で、マッピングテーブルのデフォルト②とUTF8-8③で保存
    • それぞれをエディタ(フリーのMery Build 2.4.6.5927)でコードポイントを確認

    この時、①③は「两」が表示されてu+4e24として示され、②は「.」で表示されてu+002eになりました。

    また、EPSからコピー&ペーストでエディタに貼りつけた場合も結果は①③と同様でした。

    となると、Illustrator時点の使用フォントや状態などが気になるところです。

    あわせて字形パネルで見たときのコードポイントもチェックが必要かもしれません。