1. 使用说明
1.1 安装和初始化
从网上下载ABBYY FineReader 14的压缩包进行压缩安装并注册。
1.2 输入
一张图片或多张图片。
1.3 输出
被识别后的图片以及识别出的文字区域标注和文字内容。
2. 用户操作举例
1.打开ABBYY FineReader 14 首页,点击文件,新建ocr项目(自动处理版本) 。
2.当你新建一个ocr项目时,会弹出一个新的窗口,再次点击文件和打开图像 导入一张或着多张你需要做ocr的图片。
3.当你上传一张照片到ocr编辑器时,该软件会自动检测你的文本区域并进行识别,左上是待识别图片,下边是识别是进行的区域划分,右上是识别后的图片。
4.扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader,提供各种 自动和手动工具去除这些缺陷。禁用自动预处理功能或者想预处理特定页面,可以使用图像编辑器,手动编辑页面图像。
接下来是手动处理图片并开始识别
1.选择一张图片放到ocr编辑器中,当软件自动开始ocr时可点击取消按钮,然后进行手动处理并检测。
2.点击编辑图片,跳转页面。可进行手动图像预处理操作。
3.进行预处理后的照片与原图的对比。
4.点击识别按钮进行识别,识别结果。
3. 核心功能简述
3.1图像预处理方法以及功能描述
•1.建议的预处理(自动矫正)
根据您图像的类型,程序将自动确定和进行必要的校正。 可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。
•2.歪斜校正
校正图像歪斜。
•3. 矫直文本行
矫直图像上任何弯曲的文本行。
•4. 照片校正
此组中的工具可以让您矫直文本行、消除噪音和模糊,以及将文档背景色变成白色。
•5. 校正梯形失真
校正梯形失真和删除不包含任何有用数据的图像边缘。
选中此工具时,图像上将出现一个蓝色小框。拖动框角到图像相应角上,使小框的水平线与文本行平行。 单击“修正”按钮应用此变更。
•6.旋转与翻转
此组中的工具可以让您垂直或水平旋转和翻转图像,使图像上的文本面向正确的方向。
•7.分割
此组中的工具可以让您将图像拆分成几个部分。 当您扫描图书和需要拆分对页时,此工具非常有用。
•8.修剪
删除不包含任何有用信息的图像边缘。
•9. 反转
反转图像颜色。 如果您处理的文本呈非标准颜色(文本颜色浅而背景色深),该工具非常有用。
•10.分辨率
更改图像分辨率。
• 11.亮度与对比度
更改图像的亮度和对比度。
•12.等级
此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。
若要增加图像的对比度,可移动输入级别直方图上的左右滑块。 颜色范围从最浅到最深分为255个等级。 左滑块会将图像颜色设置成最黑,右滑块会将图像颜色设置成最白。 将中间的滑块向右移动会使图像颜色加深,向左移动会使之变浅。
调整输出级别滑块会降低图像的对比度。
• 13.橡皮擦
清除图像的某个部分。
•14. 删除颜色标记
清除用笔做出的任何彩色戳记和标记,以识别被这些标记遮住的文本。 该工具主要针对背景色为白色的扫描文档,不适合于数码照片和背景色为彩色的文档。
3.2图像识别原理
单字识别是体现OCR文字识别的核心技术。从扫描文本中分检出的文字图像,由计算机将其图形、图像转变成文字的标准代码,是让计算机“认字”的关键,也就是所谓的识别技术。就像人脑认识文字是因为在人脑中已经保存了文字的各种特征,如文字的结构、文字的笔画等。要想让计算机来识别文字,也需要先将文字的特征等信息储存到计算机里,但要储存什么样的信息及怎样来获取这些信息是一个很复杂的过程,而且要达到非常高的识别率才能符合要求。通常采用的做法是根据文字的笔画、特征点、投影信息、点的区域分布等进行分析。