Skip to main content
Participating Frequently
January 25, 2024
Answered

通常のPDFファイルとポートフォリオファイルの判別について

  • January 25, 2024
  • 4 replies
  • 944 views

PDFファイルをシステムで受信する際に、一般的なPDFファイルかポートフォリオファイルかを判別して、ポートフォリオファイルの場合は中に含まれるファイルを取り出すような方法はあるでしょうか。javaでもpythonでも良いんですが、方法があるならば知りたいです。

This topic has been closed for replies.
Correct answer Ten A

ファイルを添付できるのはポートフォリオだけじゃありませんのでポートフォリオ決め打ちだけではだめなんじゃないかなって思います。PDFに埋め込まれる添付ファイルには必ずチェックサムが含まれますのでPDFの生データを開いて「CheckSum」で検索すれば貼付部分は特定可能です。

4 replies

Ten A
Community Expert
Ten ACommunity ExpertCorrect answer
Community Expert
January 29, 2024

ファイルを添付できるのはポートフォリオだけじゃありませんのでポートフォリオ決め打ちだけではだめなんじゃないかなって思います。PDFに埋め込まれる添付ファイルには必ずチェックサムが含まれますのでPDFの生データを開いて「CheckSum」で検索すれば貼付部分は特定可能です。

Participating Frequently
February 1, 2024

なるほどですね。確かにそれなら判別できそうです!ありがとうございます‼︎

Ten A
Community Expert
Community Expert
January 27, 2024

構造は見れば判別可能かと思いますけど、データを抜くには多重エンコーディングされたストリームの処理が必須なんで、Acrobatで処理するのが楽だと思います。

Participating Frequently
January 29, 2024

ありがとうございます。webで受取って処理しようと思っているんですが、通常のpdfファイルかポートフォリオかを見分けたかったので。

Quick Timer
Inspiring
January 26, 2024

A:ポートフォリオ判定
B:ポートフォリオから内封PDFの取り出し で

A:判定

JavascriptAPIのCollectionで判定できるかな?…やった事ないけど…汗

 

自分だったらどうするか?と考えてみると

アイディア程度で申し訳ないけど…汗
Portfolioって要は『封筒』だから

1:ドキュメントのページ数は1ページである(たぶん)

2:ドキュメントに対してColorSpaceを持ってない『はず』(自信ないけど)

3:ポートフォリオ作成可能なアプリケーションは限られているからAcrobatやFoxit等以外のクリエーターは除外してもいい『かも』しれない。

 

なので

1ページで

exiftool等のメタデータ収集ツールを利用してメタ情報収集して

カラー情報取れなければ ポートフォリオって判断させるかな…

>>実際どうなのか?はご自身でご確認ください

ダメだったらごめんなさい… 

 

B:ポートフォリオから内封PDFの取り出し

できるのか?も含めて私は情報を持っていない ごめんなさい

参考まで

Participating Frequently
January 29, 2024

ポートフォリオ判定ができれば、目的はほぼ達成なんですが、見た目もそっくりで見分けつかないのです…

Quick Timer
Inspiring
January 29, 2024

python使える環境なら
exifreadとかPillowとかでメタ情報収集してみたら
判定材料ある『かも』しれない
参考まで

katayanagi51
Community Expert
Community Expert
January 26, 2024

PDFファイルをシステムで受信」がよくわからないですが,その際にAcrobatをコントロールするというお話でしょうか?

 

 
Participating Frequently
January 29, 2024

Webでpdfファイルを受取って処理しようと思ったんですが、そう言えばポートフォリオも拡張子がpdfだなぁって思ったので。ポートフォリオって実行ファイルも入れられるし、セキュリティ考えるとはじきたいな、と考えた次第です。