失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(

python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(

时间:2018-10-01 18:24:05

相关推荐

python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(

在编写自动化测试用例的时候,每次登录都需要输入验证码,后来想把让python自己识别图片里的验证码,不需要自己手动登陆,所以查了一下识别功能怎么实现,做一下笔记。

首选导入一些用到的库,re、Image、pytesseract、selenium、time

import re # 用于正则

from PIL import Image # 用于打开图片和对图片处理

import pytesseract # 用于图片转文字

from selenium import webdriver # 用于打开网站

import time # 代码运行停顿

首先需要获取验证码图片,才能进一步识别。

创建类,定义webdriver和find_element_by_selector方法,用来打开网页和定位验证码图片的元素

class VerificationCode:

def __init__(self):

self.driver = webdriver.Firefox()

self.find_element = self.driver.find_element_by_css_selector

然后打开浏览器截取验证码图片

def get_pictures(self):

self.driver.get('http://123.255.123.3') # 打开登陆页面

self.driver.save_screenshot('pictures.png') # 全屏截图

page_snap_obj = Image.open('pictures.png')

img = self.find_element('#pic') # 验证码元素位置

time.sleep(1)

location = img.location

size = img.size # 获取验证码的大小参数

left = location['x']

top = location['y']

right = left + size['width']

bottom = top + size['height']

image_obj = page_snap_obj.crop((left, top, right, bottom)) # 按照验证码的长宽,切割验证码

image_obj.show() # 打开切割后的完整验证码

self.driver.close() # 处理完验证码后关闭浏览器

return image_obj

未处理前的验证码图片如下:

未处理的验证码图片,对于python来说识别率较低,仔细看可以发现图片里有很对五颜六色扰乱识别的点,非常影响识别率。

下面对获取的验证码进行处理。

首先用convert把图片转成黑白色。设置threshold阈值,超过阈值的为黑色

def processing_image(self):

image_obj = self.get_pictures() # 获取验证码

img = image_obj.convert("L") # 转灰度

pixdata = img.load()

w, h = img.size

threshold = 160 # 该阈值不适合所有验证码,具体阈值请根据验证码情况设置

# 遍历所有像素,大于阈值的为黑色

for y in range(h):

for x in range(w):

if pixdata[x, y] < threshold:

pixdata[x, y] = 0

else:

pixdata[x, y] = 255

return img

经过灰度处理后的图片

然后删除一些扰乱识别的像素点。

def delete_spot(self):

images = self.processing_image()

data = images.getdata()

w, h = images.size

black_point = 0

for x in range(1, w - 1):

for y in range(1, h - 1):

mid_pixel = data[w * y + x] # 中央像素点像素值

if mid_pixel < 50: # 找出上下左右四个方向像素点像素值

top_pixel = data[w * (y - 1) + x]

left_pixel = data[w * y + (x - 1)]

down_pixel = data[w * (y + 1) + x]

right_pixel = data[w * y + (x + 1)]

# 判断上下左右的黑色像素点总个数

if top_pixel < 10:

black_point += 1

if left_pixel < 10:

black_point += 1

if down_pixel < 10:

black_point += 1

if right_pixel < 10:

black_point += 1

if black_point < 1:

images.putpixel((x, y), 255)

black_point = 0

# images.show()

return images

python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(完整代码)...

如果觉得《python 识别登陆验证码图片(完整代码)_python 识别登录验证码图片功能的实现代码(》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。