登录注册写文章

1226 - 搞定 iText 连续识别

1226 - 搞定 iText 连续识别

先上图：

主要要解决的是此类问题：比如，有时会需要识别 PDF 这种排版复杂的「图片」，如果直接把整张图拿去识别，结果肯定会有很多杂音；手动去除这些杂音，也是挺花时间的。

现阶段，更好的办法是「人机配合」；即，自己挑着选中有意义的区域进行文字识别，然后把分别得到的结果拼接出来。而为了实现这一目的，iText 的连续识别、自动拼接识别结果，就会显得很方便。

博客原文：1226 - 搞定 iText 连续识别

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

资料包2_2：3.3G的金融行业超级资料包（涵盖各种金融业务的研究方法和内部培训资料）【全87...
点此看前面内容八、8FOF研究专题它有五个子目录：研究篇选基篇配置篇风险篇其他 8.1 研究篇文件...
金石明镜阅读 11,271评论 9赞 17
有了 iText，你截图，腾讯、Google OCR 帮你识别文字
比如，在看类似上面的扫描版 PDF 时，想要复制其中的文字，怎么办？手打？太累。试试我新开发的工具 iText 吧...
ITJason阅读 5,317评论 7赞 7

萨提亚家庭治疗工作坊感悟（一）
早上冒着瓢泼大雨，趟着没过脚面的水，搭乘长时间的地铁来到课堂。一直到坐在座位上，心都游走在生活的琐事上。第一个冥...
幸福帮阅读 3,576评论 0赞 0
我不是教你做神仙——古人教我们调息
今天读《王阳明大传》，看到书中写到这么一个典故：王阳明在大婚之日突然离家出走，到了晚上都不回家。我第一时间...
吴奇波阅读 3,688评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文