27、数字验证码识别

1、opencv外加上PIL和 pytesseract 两个包
2、安转tesserac还需要安转OCR引擎
sudo apt-get install tesseract-ocr

需要额外用的pil和tesseract
import cv2 as cv
from PIL import Image
import pytesseract as tess


def recongnize_text(image):
    blur = cv.GaussianBlur(image,(55,55),0)
    gray = cv.cvtColor(blur, cv.COLOR_BGR2GRAY)
    ret, binary= cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU)

    kernel = cv.getStructuringElement(cv.MORPH_RECT, (8, 8))
    bin = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)
    cv.imshow("binary_image", bin)

    cv.bitwise_not(bin, bin) #变成白色背景
    cv.imshow("binary_image2", bin)
    textImage = Image.fromarray(bin)
    text = tess.image_to_string(textImage)
    print("识别结果:%s" % text)

image.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1. 工具准备 Tesseract-OCR引擎该引擎由惠普公司开发,2005年开源,之后由Google开发维护。可...
    lossfunc阅读 5,327评论 1 4
  • 前言 相信大家利用 Python 写的爬虫应该遇到过要输入验证码的尴尬局面,又或者写了个自动填充表单的小程序,结果...
    迦度蓝洛阅读 16,666评论 2 35
  • 图形验证码识别技术: 阻碍我们爬虫的。有时候正是在登录或者请求一些数据时候的图形验证码。因此这里我们讲解一种能将图...
    久壑阅读 4,773评论 0 4
  • 我自己的理解 有可能绕过认证码尽量选择绕过去,请多尝试,绕过去爬取效率高不少; 先不考虑那些一天一套认证码的网站,...
    __混沌阅读 8,311评论 1 1
  • 本教程翻译自PyImageSearch英文原文 上周的博客内容,我们学习了如何安装Tesseract去做OCR识别...
    TimBao阅读 34,129评论 0 14

友情链接更多精彩内容