一、文字识别接口产品概述:全面覆盖的OCR能力
API文档识别接口是基于深度学习算法的通用文字识别(Optical Character Recognition,
OCR)解决方案。其核心功能是识别各类图像中包含的印刷体、手写体、繁体、英文及阿拉伯文等多语种文字,适用于档案管理、学术研究、金融票据处理、合同数字化等多种业务场景。
功能优势:
高识别准确率:采用先进的深度神经网络模型,支持复杂背景与光照条件下的文字提取。
多语言支持:涵盖简体中文(印刷/手写)、繁体中文、英文、阿拉伯文等。
灵活部署方式:支持公有云API调用、私有化部署、离线SDK集成,满足不同安全与性能需求。
标准化接口:提供HTTP/HTTPS与WebService接口,便于系统快速集成。
多格式输出:支持返回XML或JSON格式结果,便于后续数据处理。

二:接口调用核心参数:
Base64编码图像上传接口
接口地址:https://XXX.com/api/recogliu.do
请求方法:POST
核心参数:
img:图像的Base64编码字符串(不含前缀如data:image/jpg;base64,)
key:用户授权的OCR Key
secret:用户密钥,用于身份验证
typeId:识别类型ID(如1993为简体中文印刷体)
format:返回格式(json或xml)
三:请求参数详解
参数名 类型 是否必填
说明
img String 是
图像Base64编码字符串
file MultipartFile 是
图像文件流(仅用于/recog.do)
key String 是
用户OCR Key,用于身份认证
secret String 是
用户密钥,增强安全性
typeId Integer 是
识别任务类型ID
format String 是
返回格式:json 或 xml
五:部署模式与安全策略
文档识别API支持多种部署模式,满足不同企业的安全与合规需求:
部署模式
特点
公有云API 快速接入,按需付费,适合中小型企业或试点项目
私有化部署 部署于企业本地服务器,保障数据隐私与合规性,支持国产化 操 作系统(如麒麟、统信UOS)与CPU/GPU环境
离线SDK
集成至移动端或客户端应用,无需联网,适用于高安全或无网络环境
六:图像输入建议与最佳实践
为获得最佳识别效果,建议遵循以下输入规范:
项目 推荐参数
图像大小 约200KB
位深度 24位以上(真彩色)
扫描分辨率 300 DPI
文件大小 小于3MB
图像质量 清晰、无模糊、无严重倾斜或遮挡