PDFファイルからしおりのタイトルをテキストで抽出

Forum|Forum|2 years ago
January 14, 2024
2 replies
5129 views

PDFファイルで作成したしおりの一覧をテキストで抽出する方法をご教示いただきたいです。
以前はPDFlibというプラグインを使っていたのですが、現在使用不可のため、代替方法を探しております。

PDF の編集と変換

This topic has been closed for replies.

Correct answer Quick Timer

お使いの環境がわからないのでアレですが

別名保存でXML 1.0で保存すれば、比較的簡単にテキスト情報にアクセスできます

お試しを

ワンポイントとしては

別名保存時の設定から

UTF-8を指定した方が

テキスト取得時の編集が楽かもしれません

業務で利用の場合で職場に情報処理担当の方がいる場合

出力されたXMLから正規表現等で『テキストのみ』に変換するのは比較的簡易ですので

『正規表現ってのでXMLをテキストのみにしたいんですが教えてください』的に相談してみると良いかもしれません

参考まで

Quick TimerCorrect answer

Inspiring

お使いの環境がわからないのでアレですが

別名保存でXML 1.0で保存すれば、比較的簡単にテキスト情報にアクセスできます

お試しを

ワンポイントとしては

別名保存時の設定から

UTF-8を指定した方が

テキスト取得時の編集が楽かもしれません

業務で利用の場合で職場に情報処理担当の方がいる場合

出力されたXMLから正規表現等で『テキストのみ』に変換するのは比較的簡易ですので

『正規表現ってのでXMLをテキストのみにしたいんですが教えてください』的に相談してみると良いかもしれません

参考まで

S

Sasaki-MusashinoAuthor

Participant

しおりのテキストを抽出することができました

"XMLから正規表現等で『テキストのみ』に変換する”が私の力でできなかったので、
XML1.0に書き出したファイルをメモ帳アプリで開き、bookmarktree の要素を抜き出す　方法にしました。
こちらは少し手間がかかってしまいました。次回は正規表現を使った方法に挑戦してみます。
ご教示いただき大変ありがとうございました。

Sign up

To post, reply, or follow discussions, please sign in with your Adobe ID.

Sign in to Adobe Community

To post, reply, or follow discussions, please sign in with your Adobe ID.