Skip to main content
Participant
April 2, 2020
Question

修正前後でPDF比較を行うと、修正していない部分も差異があると比較結果に出る

  • April 2, 2020
  • 1 reply
  • 3406 views

ソフト:Acrobat Pro

OS:Windows10

やりたいこと:PDFを修正し、修正箇所以外が変わっていないことを確認すること。

やったこと:PDFを修正し、Acrobat proのファイル比較を用いた。

→修正以降のページは、1ページに収まる文字や表が変わり、比較する領域がページを跨ぐようになった。

結果:修正していない部分も差異があると比較結果に出る。

 

種類としては、

①PDFでは同じように見える文字列が異なる文字列として認識され、差異が出たパターン

②2つのPDFの異なる箇所を比較したために差異が出たパターン

③グラフィックが追加された、削除されたというパターン

 

これらの結果が、どういう仕様で出力されるか、または改善できる方法を

または、PDF比較でおすすめのソフトウェア(無料)を

ご存知の方教えていただけないでしょうか。

 

いかに、出力される例を記載します。

例)

①「テキストが変換されました」

[旧]:「を参」

[新]:「を 参」

→修正版に半角スペースが入っているように見える(実際にPDFをみると半角スペースは入っていない)

②「テキストが変換されました」

[旧]:○○

[新]:××

 

 

    This topic has been closed for replies.

    1 reply

    assause
    Community Expert
    Community Expert
    April 2, 2020

    PDFデータを編集することでファイル構造は変化する可能性はあります。

    よってその場合は比較すると構造の変化によって差異が出る可能性は否めません。

    この場合でいえば、どの比較ツールでも同じようになる可能性はあると思います。

     

    一応編集機能はありますが、本来、PDF自体は編集向きのデータとはいえません。

    編集を行う場合はオリジナルのアプリケーションと文書まで遡るのがベターです。

    どうしても、とした場合、編集が必要な該当ページだけ抽出、編集したのちに、ページ単位での差し替え編集を試みる方法は可能性としては挙げられます。

    Participant
    April 3, 2020

    回答ありがとうございます。

     

    やったこと:PDFを修正し、Acrobat proのファイル比較を用いた。

    と記述しましたが、正確には、

    word文書を編集→XMLに変換→PDFに変換

    をしています。

    出来上がったPDFをそこから編集することはないため、PDF全体での比較を行っています。

    【質問事項】

    ①この際に、比較結果で出てくるコメントに対して、どのように評価すればよいのかお聞きしたいです。

    また、

    例えば、修正していない箇所でも○○のコメントは出ることがあるので、その個所については最終的には目検が必要とか、

     

    ②比較結果に対して出力されるコメントに対して、ただしく評価すれば、差分を正しく評価できるか。

     

    以上の2点ご回答お願いします。

     

     

    assause
    Community Expert
    Community Expert
    April 5, 2020

    少々複雑なことをやっているので、それ自体をどうするべきか、というところも関わりそうには思います。

     

    ただ一般論だけでいえば、比較差分は機械チェックですから、何かの差異として検知した部分はリストアップされるのは仕方ないようには思います。

    そこは人の判断のほうが確実になるので、個別にチェックせざるを得ないとは思います。

     

    なおXMLからPDFの変換もどのようにしているのか不明瞭です。

    ただXML時点ですでに修正されているテキストであれば、個人的にはその時点でテキストおよびXMLの構造差分を出したほうがチェックが早い気がします。