easyocr和paddleocr的简单使用与对比

这次有个OCR的需求,对比了一下easyocrpaddleocr的识别效果,最终选择了paddleocr。

这里记录一下使用过程和遇到的问题。

easyocr

github地址

安装

使用easyocr前,需要先安装torch和torchvision

如果使用GPU的话,还需要先安装CUDA(安装方式自行百度)

CUDA和pytorch安装好后,再pip install easyocr

简单使用

import easyocr
image = r"D:\tmp\test\1.PNG"
reader = easyocr.Reader(['ch_sim', 'en'])
result = reader.readtext(image, detail=0)
print(result)

遇到的问题

  • 安装torch的时候,使用conda安装比pip安装,快了不知道多少倍!!!一开始使用pip安装等得花儿都谢了
  • 对比了一下,同一张图片,使用GPU的识别速度比使用CPU快2.4倍左右
  • 如果报错ImportError: cannot import name 'model_urls' from 'torchvision.models.vgg',那就是easyocr和torchvision的版本差异问题(我当时使用的版本:easyocr=1.7.1,torch=2.2.1,torchvision=0.17.1)
  • 如果报错can't open/read file: check file path/integrity....AttributeError: 'NoneType' object has no attribute 'shape'那就是图片路径出现中文了,不要有中文路径

图片越大,OCR耗时越长,如果你只需要识别图片特定部分,可以先把图片裁剪了,减少识别区域,加快OCR识别速度(我当时的需求,只需要识别图片上半部分,于是就将上半张图片另存为新图。识别半张图比完整图快2.6倍)

将上半张图另存为新图的代码:

def split_image_vertically_get_upper_part(image_path) -> str:
    # 将图片分为上下2半,将上半张图片保存为新文件,并返回路径
    img = Image.open(image_path)
    width, height = img.size
    split_point_y = height // 2
    top_img = img.crop((0, 0, width, split_point_y))
    # 保存上半部分图片 保存到同级目录
    dir_path, filename_with_suffix = os.path.split(image_path)
    filename, suffix = os.path.splitext(filename_with_suffix)
    new_path = os.path.join(dir_path, f'{filename}_top{suffix}')
    top_img.save(new_path)
    return new_path

使用效果

英文图片识别:


中文图片识别:


目前看起来一切正常,挺满意的。但是,一旦图片变大一点,字体变小一点,中文识别就有问题了(大图小字英文图片 我没试过)。下图是这次要识别的图片,图大字小,为了数据脱敏,只截取了几个片段:


没办法,只能换一个OCR库,于是转向了paddleocr


paddleocr

github地址

安装

使用paddleocr,需要先安装paddlepaddle:
如果使用GPU 也需要先安装CUDA(安装方式见上文),然后pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
如果使用CPU:pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install "paddleocr>=2.0.1"

遇到的问题

我目前使用的版本:paddleocr=2.7.0.3, paddlepaddle-gpu=2.6.0。貌似这俩对CUDA的版本要求是<=11,而我在上面体验easyocr到时候已经安装了最新版的12.2,真是造化弄人啊。我不想卸载CUDA重新安装,太麻烦了,先直接运行看看能不能跑

结果一堆报错,说缺少动态连接文件,比如Could not locate cudnn_cnn_infer64_8.dll. Please make sure it is in your library path!

这种版本不匹配的情况,通常只能推倒重来,但我使用了另一种偏方:
我用everything搜索缺的那个动态链接库cudnn_cnn_infer64_8.dll,结果在上面easyocr的环境中找到了 笑哭.gif。于是它报缺什么dll,我就从anaconda\envs\torchocr2\Lib\site-packages\torch\lib easyocr的虚拟环境中找到复制到anaconda\envs\paddle_env\Lib\site-packages\paddle\libs 中去

最后还报了却一个cublas64_11.dll 但是我只在CUDA的安装目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.2\bin 中找到了cublas64_12.dll ,但是版本不匹配呀,怎么搞?我又用了个偏方把cublas64_12.dll 复制到anaconda\envs\paddle_env\Lib\site-packages\paddle\libs 把12改成11,骗一下它,看看行不行,结果还真骗过去了 再次笑哭.gif

简单使用

from paddleocr import PaddleOCR

image2 = r"D:\tmp\test\1.PNG"
ocr = PaddleOCR(use_angle_cls=False, lang="ch")
result = ocr.ocr(image2, cls=False)
content_list=[]
for idx in range(len(result)):
    res = result[idx]
    for line in res:
        content_list.append(line[-1][0])
content=''.join(content_list)
print(content)

使用效果

很好,超出预期,上面easyocr未识别出来的,paddleocr全部识别出来了,中文OCR还得是国产强。
我那大图小字的图片不好脱敏,就不贴图了。
唯一的缺点就是 i j l 0 o 这些识别可能不准确。但是情有可原,已经非常棒了。

2个OCR库该有的功能都有,比如识别出的文字坐标, 准确率 等.本文只是基于我的需求,测了文字提取,更多其他功能,各位自行去查阅官方文档

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,036评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,046评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,411评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,622评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,661评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,521评论 1 304
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,288评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,200评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,644评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,837评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,953评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,673评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,281评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,889评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,011评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,119评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,901评论 2 355

推荐阅读更多精彩内容