終了

PDFデータのテキスト部分をコピーして、メモ帳貼り付けると、文章が逆転しまう現象

New Here ,
Sep 13, 2018 Sep 13, 2018

リンクをクリップボードにコピー

コピー完了

PDFデータのテキスト部分をコピーして、メモ帳に貼り付けて、編集作業をしています。

例えば「こんにちは、よろしくお願いします。」という文章をコピーして、

メモ帳に貼り付けたら、「よろしくお願いします。こんにちは、」となります。

これは何が原因で、どのように解決したらいいか教えていただきたいです。

よろしくお願いします。

表示

1.7K

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines

correct answers 1 件の正解

積極的な参加者 , Sep 13, 2018 Sep 13, 2018

そのPDFはどのようにして作られた物でしょうか?

データの形式(タテorヨコ組み・文書なのか表なのかなど)はどのような形でしょうか?

ご質問の件はタテ組の文章の場合に起こりやすい現象だと思います。

いずれにせよPDFからのテキスト取り出しはベストエフォート型(やれるだけやってみる)であり、予期せぬエラーが出る場合があります。

ふちのついている文字を二重で取ってしまう。画像認識(OCR)すると「一(漢字のいち)」を「ー(長音付)」と誤認してしまう。などが確認されています。

100%アテにされるのは危険と認識ください。

PDF ファイルからテキストおよび画像を抽出する方法(Acrobat DC)

こういう方法もあります。割と正確にできるみたいですよ。

投票

翻訳

翻訳
積極的な参加者 ,
Sep 13, 2018 Sep 13, 2018

リンクをクリップボードにコピー

コピー完了

そのPDFはどのようにして作られた物でしょうか?

データの形式(タテorヨコ組み・文書なのか表なのかなど)はどのような形でしょうか?

ご質問の件はタテ組の文章の場合に起こりやすい現象だと思います。

いずれにせよPDFからのテキスト取り出しはベストエフォート型(やれるだけやってみる)であり、予期せぬエラーが出る場合があります。

ふちのついている文字を二重で取ってしまう。画像認識(OCR)すると「一(漢字のいち)」を「ー(長音付)」と誤認してしまう。などが確認されています。

100%アテにされるのは危険と認識ください。

PDF ファイルからテキストおよび画像を抽出する方法(Acrobat DC)

こういう方法もあります。割と正確にできるみたいですよ。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines
New Here ,
Sep 14, 2018 Sep 14, 2018

リンクをクリップボードにコピー

コピー完了

最新

とても参考になりました。

投票

翻訳

翻訳

レポート

レポート
コミュニティガイドライン
他のユーザーへの思いやりを持ち、敬意を払いましょう。コンテンツの出典を明記し、投稿する前に内容が重複していないか検索してください。 さらに詳しく
community guidelines