1. 使用说明

1.1 安装和初始化
从网上下载ABBYY FineReader 14的压缩包进行压缩安装并注册。

1.2 输入
一张图片或多张图片。

1.3 输出
被识别后的图片以及识别出的文字区域标注和文字内容。

2. 用户操作举例

1.打开ABBYY FineReader 14 首页，点击文件，新建ocr项目(自动处理版本) 。

ABBYY截图1.png

2.当你新建一个ocr项目时，会弹出一个新的窗口，再次点击文件和打开图像导入一张或着多张你需要做ocr的图片。

ABBYY截图2.png

3.当你上传一张照片到ocr编辑器时，该软件会自动检测你的文本区域并进行识别，左上是待识别图片，下边是识别是进行的区域划分，右上是识别后的图片。

ABBYY截图3.png

4.扭曲的文本行、歪斜、噪声及扫描图像和数码照片中常见的其他缺陷可能会降低识别质量。ABBYY FineReader，提供各种自动和手动工具去除这些缺陷。禁用自动预处理功能或者想预处理特定页面，可以使用图像编辑器，手动编辑页面图像。

接下来是手动处理图片并开始识别

1.选择一张图片放到ocr编辑器中，当软件自动开始ocr时可点击取消按钮，然后进行手动处理并检测。

ABBYY截图5.png

2.点击编辑图片，跳转页面。可进行手动图像预处理操作。

ABBYY截图10.png

ABBYY截图7.png

3.进行预处理后的照片与原图的对比。

ABBYY截图8.png

4.点击识别按钮进行识别，识别结果。

ABBYY截图9.png

3. 核心功能简述

3.1图像预处理方法以及功能描述

•1.建议的预处理(自动矫正)
根据您图像的类型，程序将自动确定和进行必要的校正。可以进行的校正包括消除噪声和模糊、反转颜色以使背景色比文本颜色浅、校正歪斜、矫直文本行、校正梯形失真和修剪图像边缘。

•2.歪斜校正

校正图像歪斜。

•3. 矫直文本行

矫直图像上任何弯曲的文本行。

•4. 照片校正

此组中的工具可以让您矫直文本行、消除噪音和模糊，以及将文档背景色变成白色。

•5. 校正梯形失真

校正梯形失真和删除不包含任何有用数据的图像边缘。
选中此工具时，图像上将出现一个蓝色小框。拖动框角到图像相应角上，使小框的水平线与文本行平行。单击“修正”按钮应用此变更。

•6.旋转与翻转

此组中的工具可以让您垂直或水平旋转和翻转图像，使图像上的文本面向正确的方向。

•7.分割

此组中的工具可以让您将图像拆分成几个部分。当您扫描图书和需要拆分对页时，此工具非常有用。

•8.修剪

删除不包含任何有用信息的图像边缘。

•9. 反转

反转图像颜色。如果您处理的文本呈非标准颜色（文本颜色浅而背景色深），该工具非常有用。

•10.分辨率

更改图像分辨率。

• 11.亮度与对比度

更改图像的亮度和对比度。

•12.等级

此工具可以让您改变阴影、光和中间色的强度从而调整图像的色阶。
若要增加图像的对比度，可移动输入级别直方图上的左右滑块。颜色范围从最浅到最深分为255个等级。左滑块会将图像颜色设置成最黑，右滑块会将图像颜色设置成最白。将中间的滑块向右移动会使图像颜色加深，向左移动会使之变浅。
调整输出级别滑块会降低图像的对比度。

• 13.橡皮擦

清除图像的某个部分。

•14. 删除颜色标记

清除用笔做出的任何彩色戳记和标记，以识别被这些标记遮住的文本。该工具主要针对背景色为白色的扫描文档，不适合于数码照片和背景色为彩色的文档。

3.2图像识别原理

单字识别是体现OCR文字识别的核心技术。从扫描文本中分检出的文字图像，由计算机将其图形、图像转变成文字的标准代码，是让计算机“认字”的关键，也就是所谓的识别技术。就像人脑认识文字是因为在人脑中已经保存了文字的各种特征，如文字的结构、文字的笔画等。要想让计算机来识别文字，也需要先将文字的特征等信息储存到计算机里，但要储存什么样的信息及怎样来获取这些信息是一个很复杂的过程，而且要达到非常高的识别率才能符合要求。通常采用的做法是根据文字的笔画、特征点、投影信息、点的区域分布等进行分析。

ABBYY