Answered
OCRで認識した部分をテキストに置換
pdf文書の一部に外字が画像で埋め込まれています.その外字部分をocr機能を用いると,検索可能なテキストとして認識されるのですが,その外字部分を認識したテキストに置換する方法はありますか?
pdf文書の一部に外字が画像で埋め込まれています.その外字部分をocr機能を用いると,検索可能なテキストとして認識されるのですが,その外字部分を認識したテキストに置換する方法はありますか?
XObjectを含まないPDFに変換したいという事であれば、PDF 圧縮にある高度な最適化ツールで、以前の古いPDF (例えばAcrobat 4.0)などの設定を試してみてはいかがでしょうか?

XObjectを含まないPDFに変換した上,とりあえずの課題を解決することができました.ありがとうございました.また,壁にぶち当たったら相談させてください.
Already have an account? Login
Enter your E-mail address. We'll send you an e-mail with instructions to reset your password.