【验证码识别】使用pytesseract识别数字验证码
迪丽瓦拉
2025-05-29 20:49:37
0

文章目录

  • 前言
  • 一、pytesseract是什么?
  • 二、基本应用
  • 三、进阶应用(指定识别字符白名单提高识别正确率)
  • 总结
  • 备注


前言

验证码是最简单有效防止恶意登录的方法,但是验证码对于我们自动化控制又带来了挑战,对于验证码的识别除了调用网上的OCR API,有没有一个不花钱的方法?

有,本文就来介绍一下,我们如何在本地进行验证码的识别,尤其是数字验证码的识别。


提示:以下是本篇文章正文内容,下面案例可供参考

一、pytesseract是什么?

pytesseract是Google做的OCR库,可以识别图片中的文字。pytesseract需要安装并配置好Tesseract OCR引擎才能正常工作。如果没有安装,可以参考官方文档进行安装和配置:https://github.com/tesseract-ocr/tesseract。或者参考其它博主的文章:
pytesseract安装和基本使用_吨吨不打野的博客-CSDN博客 https://blog.csdn.net/Castlehe/article/details/118751833

二、基本应用

import pytesseract
from PIL import Image# 读取验证码图片
image = Image.open('captcha.png')# 将图片转为灰度图像
image = image.convert('L')# 对图像进行二值化处理
threshold = 127
table = []
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
image = image.point(table, '1')# 使用pytesseract进行识别
code = pytesseract.image_to_string(image)print(code)

在以上示例中,我们首先使用PIL库打开验证码图片,然后将其转换为灰度图像,并进行二值化处理。然后,我们再使用pytesseract库对图像进行识别,并将结果打印出来。

能做到这步,说明pytesseract环境已配置OK,并且已经就别基本的识别功能,但要准确的识别数字验证码。建议您往下看。

三、进阶应用(指定识别字符白名单提高识别正确率)

import pytesseractdef captcha_recognize(img_path):# --psm 7 单行识别 , --oem 3 使用 LSTM OCR 引擎 , -c tessedit_char_whitelist=0123456789 只识别数字字符,也可以设置英文字母哦。num = pytesseract.image_to_string(img_path,lang='eng', \config='--psm 7 --oem 3 -c tessedit_char_whitelist=0123456789')return numif __name__ == '__main__':# 测试num  = captcha_recognize(r'C:\yzm.png')print(num)

注:tesseract提供了OCR引擎模式。有如下四种:

  • 0 = 仅限原始Tesseract
  • 1 = 只有神经网络LSTM
  • 2 = Tesseract LSTM
  • 3 = 基于可用的默认值
    目前LSTM是无法支持白名单的

注:如下设置可聚焦识别数字和大小写字母:tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ


总结

本文的目的,旨在高效的识别数字验证码,当然pytesseract还有更多用途,感兴趣的朋友可以试试。


备注

在调用 tessarct 时,我们需要提供许多标志。三个最重要的是 -l 、 --oem 和 --psm 。

  • -l 参数控制输入文本的语言。我们将在此示例中使用 eng(英语),但您可以在此处查看 Tesseract 支持的所有语言:tesseract --list-langs

  • –oem 参数或 OCR 引擎模式控制 Tesseract 使用的算法类型。 您可以通过执行以下命令查看可用的 OCR 引擎模式:tesseract --help-oem

OCR Engine modes:0    Legacy engine only.1    Neural nets LSTM engine only.2    Legacy + LSTM engines.3    Default, based on what is available.

我们将使用 --oem 1 表示我们希望仅使用深度学习 LSTM 引擎。

  • –psm 参数控制 Tesseract 使用的自动页面分割模式:tesseract --help-psm
Page segmentation modes:0    Orientation and script detection (OSD) only.1    Automatic page segmentation with OSD.2    Automatic page segmentation, but no OSD, or OCR.3    Fully automatic page segmentation, but no OSD. (Default)4    Assume a single column of text of variable sizes.5    Assume a single uniform block of vertically aligned text.6    Assume a single uniform block of text.7    Treat the image as a single text line.8    Treat the image as a single word.9    Treat the image as a single word in a circle.10    Treat the image as a single character.11    Sparse text. Find as much text as possible in no particular order.12    Sparse text with OSD.13    Raw line. Treat the image as a single text line,bypassing hacks that are Tesseract-specific.

对于 OCR 文本,模式 6 和 7 运行良好,但如果需要 OCR 处理大块文本,可尝试 3,默认模式。 每当您发现自己获得不正确的 OCR 结果时,强烈建议您调整 --psm,因为它会对您的输出 OCR 结果产生巨大影响。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
A.机器学习入门算法(三):基... 机器学习算法(三):K近邻(k-nearest neigh...
数字温湿度传感器DHT11模块... 模块实例https://blog.csdn.net/qq_38393591/article/deta...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
Redis 所有支持的数据结构... Redis 是一种开源的基于键值对存储的 NoSQL 数据库,支持多种数据结构。以下是...
win下pytorch安装—c... 安装目录一、cuda安装1.1、cuda版本选择1.2、下载安装二、cudnn安装三、pytorch...
MySQL基础-多表查询 文章目录MySQL基础-多表查询一、案例及引入1、基础概念2、笛卡尔积的理解二、多表查询的分类1、等...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
MATLAB | 全网最详细网... 一篇超超超长,超超超全面网络图绘制教程,本篇基本能讲清楚所有绘制要点&#...
IHome主页 - 让你的浏览... 随着互联网的发展,人们越来越离不开浏览器了。每天上班、学习、娱乐,浏览器...
TCP 协议 一、TCP 协议概念 TCP即传输控制协议(Transmission Control ...
营业执照的经营范围有哪些 营业执照的经营范围有哪些 经营范围是指企业可以从事的生产经营与服务项目,是进行公司注册...
C++ 可变体(variant... 一、可变体(variant) 基础用法 Union的问题: 无法知道当前使用的类型是什...
血压计语音芯片,电子医疗设备声... 语音电子血压计是带有语音提示功能的电子血压计,测量前至测量结果全程语音播报࿰...
MySQL OCP888题解0... 文章目录1、原题1.1、英文原题1.2、答案2、题目解析2.1、题干解析2.2、选项解析3、知识点3...
【2023-Pytorch-检... (肆十二想说的一些话)Yolo这个系列我们已经更新了大概一年的时间,现在基本的流程也走走通了,包含数...
实战项目:保险行业用户分类 这里写目录标题1、项目介绍1.1 行业背景1.2 数据介绍2、代码实现导入数据探索数据处理列标签名异...
记录--我在前端干工地(thr... 这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 前段时间接触了Th...
43 openEuler搭建A... 文章目录43 openEuler搭建Apache服务器-配置文件说明和管理模块43.1 配置文件说明...