批量扫描和识别
工商、税务、银行都有大量的票据,需要进行扫描和识别,企业也有大量标准化的制式合同,需要扫描和识别。现在常用的OCR全文识别的工具,不能自定义识别区域,快速抓取关键信息,通篇识别会产生大量的无用数据,而且速度慢效率低。
是否可以对标准化文档时行批量扫描识别?答案是肯定的。
现有一款免费的“简可信”模板OCR识别工具,用户可以自己定义编辑模板,用鼠标选出有效的数据区间,便可实现。模板操作完全使用鼠标,简单拖拽缩放,非常方便。
1.批量导入或扫描
(1)将图片、PDF文件批量导入,或者批量扫描。系统提供了一些常用的默认模板,用户也可自己编辑、创建模板。
(2)模板编辑非常简单,拖动鼠标,编辑识别区。如图:
2.使用模板,自动批量识别标注数据。
选择所对应的模板,系统将对标注的识别区内容,自动识别,如图:
识别的结果可以二次校对和编辑,保障关键数据的准确率,如图:
3.可以导出多种格式文件:
识别结果文字和原图可以为双层PDF文件(图在上,文字在图片后面)、图文逐行PDF文件,TIFF文件和OCR文本、JPG文件和OCR文本等,也可以导出JSON数据,导出文件可以设置边距,密码等多个导出条件。如图: