2021-09-07 ABBYY 在python中的接口调用中的相关问题


1.  样例代码错误:

wrong: requests.exceptions.HTTPError: 403 Client Error: Forbidden for url: http://cloud.ocrsdk.com/processImage?exportFormat=xml%2CpdfTextAndImages&language=English

code:

from ABBYY import CloudOCR

ocr = CloudOCR(application_id='ApplicationID', password='ApplicationPassword')

pdf = open('blah.pdf', 'rb')

file = {pdf.name: pdf}

result = ocr.process_and_download(

  file,

  exportFormat='xml,pdfTextAndImages',

  language='English'

)

print(result)

solution:

首先要确保你的ApplicationID和ApplicationPassword是正确的,如果仍然报错,则很很有可能是你在注册登记时选择的欧洲或美国注册,但是它们有不同的ServerUrl:

a. http://cloud-westus.ocrsdk.com

b. http://cloud-eu.ocrsdk.com

如果你在美国创建应用程序选择a,如果你在欧洲创建应用程序选择b,之后根据选择修改在CloudOCR类中的base_url。

2. 处理返回的数据格式为BytesIO ,无法直接使用需要转换:

  可通过修改内部函数process_and_download,返回urls可直接使用或下载。

3. process_and_download中的常用参数:

  exportFormat:返回数据的格式,可以是word,pdf等,最多一次返回三种格式,每种格式以逗号分隔;language:解析所用的语言,可以用多种,如简体中文ChinesePRC,英文English等,同样最多三种每种语言以逗号分隔,提醒中文简体与繁体共用可能导致解析错误。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,592评论 28 53
  • 人工智能是什么?什么是人工智能?人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗...
    ZLLZ阅读 3,850评论 0 5
  • 首先介绍下自己的背景: 我11年左右入市到现在,也差不多有4年时间,看过一些关于股票投资的书籍,对于巴菲特等股神的...
    瞎投资阅读 5,768评论 3 8
  • ![Flask](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAW...
    极客学院Wiki阅读 7,269评论 0 3