Skip to main content
Participant
May 5, 2017
Answered

Word 上での pdf データの文字検索

  • May 5, 2017
  • 2 replies
  • 1623 views

文字検索可能な pdf ファイルの一部またはすべてを 切り取って、文字検索可能な状態で Word 上に張り付ける方法があったら教えていただけますでしょうか。

    This topic has been closed for replies.
    Correct answer assause

    こちらの意図が伝わらないようで申し訳ございません。たとえば、添付のような CAD データ等から pdf に変換された回路図があったとします(この図はWeb上からとってきたもので実際のものとは異なります)。この図をWord に張り付けた後に、回路図内の文字、たとえば、R217 の文字を検索できる状態にしたいと考えております。もちろん回路図の pdf は文字が選択できる状態になっている”文字検索可能な pdf ファイル”とします。

    このような、文字が検索できる状態の回路図をWord に張り付けた後も文字検索できるようにすることは不可能でしょうか。

    よろしくお願いいたします。


    具体的な情報を記載いただいたので意図されることがなんとなくわかりました。

    どちらかというと「図面と同様の状態をWordに再現したい」ということではないでしょうか。

    そうなると、方法としては下記のいずれかになります。

    • 製品版AcrobatでWordデータに書き出し、必要に応じて修正
    • 文字以外の部分を削除して画像として書き出してWordに貼り付け、文字部分はWordのテキストボックスで作成

    確実性だけでいえば後者ですが、それだけ手間はかかります。

    ただしAcrobatから他形式への書き出しはベストエフォート型なので、書き出しだけで意図する結果が得られる保証はありません。

    2 replies

    Participant
    May 5, 2017

    説明不足で申し訳ありません。詳しく説明させていただきますと、文字検索可能な状態で作成された pdf の回路図(全部または一部)をWord に張り付けて、その回路図の中の文字を検索するようにしたいと思っております。通常のスナップショットでの貼り付けでは、文字の検索ができないので、何か良い方法があればと思い質問させていただきました。

    よろしくお願いいたします。

    assause
    Community Expert
    Community Expert
    May 5, 2017

    スナップショットはあくまでもスクリーンショットを撮影するための機能ですから、

    今回の目的には利用できません。

    あくまでも文字列選択の後にコピー&ペーストになるので、マウスポインターで

    ドラッグなどを行っての範囲選択をしたうえで。コピーができるかどうかになります。

    今回の場合は検索できるということなので問題はないとは思いますが、

    もし文字列の範囲選択ができなければそこは画像化されたものになっているので、

    製品版AcrobatでOCR処理を行う必要が出てきます。

    またその後にコピーができるかどうかは、先述のように、PDFファイルのセキュリティ設定に依存します。

    Participant
    May 5, 2017

    こちらの意図が伝わらないようで申し訳ございません。たとえば、添付のような CAD データ等から pdf に変換された回路図があったとします(この図はWeb上からとってきたもので実際のものとは異なります)。この図をWord に張り付けた後に、回路図内の文字、たとえば、R217 の文字を検索できる状態にしたいと考えております。もちろん回路図の pdf は文字が選択できる状態になっている”文字検索可能な pdf ファイル”とします。

    このような、文字が検索できる状態の回路図をWord に張り付けた後も文字検索できるようにすることは不可能でしょうか。

    よろしくお願いいたします。

    assause
    Community Expert
    Community Expert
    May 5, 2017

    文書自体にセキュリティが施されていなければ、コピー&ペーストで必要な文字列をWordにもってくることは可能なはずです。

    ただしコピー権限に関するセキュリティを施しているのであれば、PDF文書上で検索ができたとしても、

    文字列抽出自体ができないので、今回意図されていることはできないということになります。