Skip to main content
Participant
January 14, 2024
解決済み

PDFファイルからしおりのタイトルをテキストで抽出

  • January 14, 2024
  • 返信数 1.
  • 4860 ビュー

PDFファイルで作成したしおりの一覧をテキストで抽出する方法をご教示いただきたいです。
以前はPDFlibというプラグインを使っていたのですが、現在使用不可のため、代替方法を探しております。

このトピックへの返信は締め切られました。
解決に役立った回答 Quick Timer

お使いの環境がわからないのでアレですが

別名保存でXML 1.0で保存すれば、比較的簡単にテキスト情報にアクセスできます

お試しを

 

ワンポイントとしては

別名保存時の設定から

UTF-8を指定した方が

テキスト取得時の編集が楽かもしれません

 

業務で利用の場合で職場に情報処理担当の方がいる場合

出力されたXMLから正規表現等で『テキストのみ』に変換するのは比較的簡易ですので

『正規表現ってのでXMLをテキストのみにしたいんですが教えてください』的に相談してみると良いかもしれません

 

参考まで

 

 

 

返信数 1

Quick Timer
Quick Timer解決!
Inspiring
January 15, 2024

お使いの環境がわからないのでアレですが

別名保存でXML 1.0で保存すれば、比較的簡単にテキスト情報にアクセスできます

お試しを

 

ワンポイントとしては

別名保存時の設定から

UTF-8を指定した方が

テキスト取得時の編集が楽かもしれません

 

業務で利用の場合で職場に情報処理担当の方がいる場合

出力されたXMLから正規表現等で『テキストのみ』に変換するのは比較的簡易ですので

『正規表現ってのでXMLをテキストのみにしたいんですが教えてください』的に相談してみると良いかもしれません

 

参考まで

 

 

 

Participant
January 25, 2024

しおりのテキストを抽出することができました

"XMLから正規表現等で『テキストのみ』に変換する”が私の力でできなかったので、
XML1.0に書き出したファイルをメモ帳アプリで開き、bookmarktree の要素を抜き出す 方法にしました。
こちらは少し手間がかかってしまいました。次回は正規表現を使った方法に挑戦してみます。
ご教示いただき大変ありがとうございました。