python中使用OCR 技术进行《文字识别》

安装tesseract-ocr-setup-3.02.02  并配置环境变量

链接:https://pan.baidu.com/s/1c3vIslq 密码:px5g

打开CMD 键入以下代码 安装依赖模块

pip install pytesseract

pip install pillow


安装 pytesseract 模块

附上python代码

# 导入组件

from uiautomatorimport deviceas d

import pytesseract

from PILimport Image

import os

import time

# 函数入口

def main():

print("脚本初始化")

dinfo=d.info#获取设备信息

    print(d.info)

print(dinfo.get("displayHeight"))

print("设备宽度{}".format(dinfo.get("displayWidth")))

print("设备宽度{}".format(dinfo.get("displayWidth")))

print("屏幕方向为{}".format(d.orientation))

d.click(143,462)

im=Image.open("QQ图片20180125224702.png")

tessdata_dir_config ='--tessdata-dir "C:\\my\develop\\ORC\\Tesseract-OCR\\tessdata"'

    code = pytesseract.image_to_string(im,lang='chi_sim',config=tessdata_dir_config)

print(code)

# or

# 执行代码

main()


注意!注意!注意

tesseract版本与其目录下的训库语言存在版本兼容性  

不同版本 tesseract 请下载  对应的训练库

点击进入最新语言库

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 我自己的理解 有可能绕过认证码尽量选择绕过去,请多尝试,绕过去爬取效率高不少; 先不考虑那些一天一套认证码的网站,...
    __混沌阅读 3,148评论 1 1
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,973评论 19 139
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 6,537评论 0 17
  • 前言 相信大家利用 Python 写的爬虫应该遇到过要输入验证码的尴尬局面,又或者写了个自动填充表单的小程序,结果...
    迦度蓝洛阅读 16,632评论 2 35
  • 1. remain unclear, food label, advocate e.g. The health e...
    Veronica小君君阅读 101评论 0 0