Skip to main content
5138 Posts
拡張子「.pdf」がないPDF形式ファイル印刷時の拡張子の付与について

お世話になっております。表題の件につきまして、お伺いと解決策のご教示お願いいたします。拡張子のないPDF形式のファイルを  プログラムから開く → 「Adobe Acrobat Reader DC」を選択して表示 → 印刷を実施した際に、進行状況のポップアップ画面、プリンタの小窓に出力されるファイル名を確認すると「.pdf」の拡張子が付与されており、Readerの処理で拡張子が自動的に付与されているように見えます。(ファイルを開いた際の、ウィンドウ左上やタブに表示されるファイル名には拡張子が表示されておりませんでした。)そこでお伺いしたいのは以下の内容となります。【お伺いしたい内容】   ① 拡張子のないPDF形式のファイルを印刷する際は、Readerの処理で「.pdf」の拡張子が自動的に付与されるものなのでしょうか。   ② ①で付与される場合、「.pdf」の拡張子を付与しない方法はございますでしょうか。【環境】   Windows10 Pro + Acrobat Reader DC 詳細な説明は出来ませんが、プリンタドライバ側の処理で特定のファイル名の印刷データを受け取った際に実施される処理があるのですが、「.pdf」の拡張子がついたファイル名ですとその特定処理が実施されない為伺った次第でございます。分かりづらい部分があるかもしれませんがご回答お待ちしております。よろしくお願いいたします。

PDFのテキストを取り出したいのですが文字化けします

PDFのテキストを取り出したいのですが文字化けしますクライアントから原稿として支給されたPDFからテキストを取り出したいのですが文字化けしてしまいます。Acrobatで開いたときは可読状態なのですが、テキストを選んでコピー → テキストエディタにペーストすると文字化けしてしまうのです。IllustratorでPDFを直接開く等いろいろ試してみたのですがどれも文字化けしてしまいお手上げ状態です。PDFにセキュリティは設定されておらず、テキストは制限なくコピーできるはずです。全てが文字化けするわけではありません。Acrobatのプロパティ → フォントで確認すると文字化けするのはHGMaruGothicMPRO(埋め込みサブセット)など種類:TureTypeエンコーディング:ビルトイン文字化けしないのはKozGoPro-Regular(埋め込みサブセット)など種類:Type 1(CID)エンコーディング:Identity-Hとなっています。このエンコーディングが「ビルトイン」がアヤシイと思いググってみたところ「ビルトイン」で同じように悩んでいる方がいらっしゃるようなのですが、「そういうPDFは文字化けするから注意しよう」とか「画像に変換してOCR認識させてしまおう」などの記事がヒットし、直接の解決方法を見つけることができませんでした。元データはIllustratorで作っているらしいのですが、諸般の事情で支給できないと言われてしまいました。何か良い方法をご存じの方、ご教示ください。または、解決方法なんて存在しないから諦めろというトドメでも結構です。【PDFのプロパティ】【当方の環境】Mac OS 10.6.8Acrobat X Pro(10.1.14)Illustrator CS3〜CS6Jedit X 1.47テキストエディット 1.6(264)プレビュー 5.0.3(504.1)FireFox(38.0.5)Safari 5.1.10(6534.59.10)【試して失敗した方法】Acrobatで開いてテキストを選択しコピー、Jeditにペースト。(Jeditのエンコーディングは日本語(Mac OS))OS付属のテキストエディットにペースト。プレビューで開いてコピー、Jeditとテキストエディットにペースト。PDFを直接Illustratorで開く。フォントがインスト