目录
- 环境配置
- 安装 pillow(PIL)库
- 识别过程
生活中,我们在登录微博,邮箱的时候,常常会碰到验证码。在工作时,如果想要爬取一些数据,也会碰到验证码的阻碍。本次试验将带领大家认识验证码的一些特性,并利用 Python 中的 pillow 库完成对验证码的破解。
环境配置
- Python 2.7
- Pillow 模块
有个问题就是python2.7目前只能让使用到2020年,现在再利用2.7下载好多东西都会报错,也该是时候更新到python3.7了,本文还是依赖于2.7的环境。
识别验证码的代码下载地址:python_captcha_jb51.rar
安装 pillow(PIL)库
?123sudo
apt-get update
sudo
apt-get
install
python-dev libtiff5-dev libjpeg8-dev zlib1g-dev libfreetype6-dev liblcms2-dev libwebp-dev tcl8.6-dev tk8.6-dev python-tk
sudo
pip2
install
pillow
识别过程
将验证码文件python_captcha下载到运行目录下,解压后,在 python_captcha 目录新建 crack.py 文件,进行编辑。
?123456789#-*- coding:utf8 -*-
from
PIL
import
Image
im
=
Image.
open
(
"captcha.webp"
)
#(将图片转换为8位像素模式)
im.convert(
"P"
)
# 打印颜色直方图
print
im.histogram()
输出:
颜色直方图的每一位数字都代表了在图片中含有对应位的颜色的像素的数量。
每个像素点可表现 256 种颜色,你会发现白点是最多(白色序号 255 的位置,也就是最后一位,可以看到,有 625 个白色像素)。红像素在序号 200 左右,我们可以通过排序,得到有用的颜色。
?12345678his
=
im.histogram()
values
=
{}
for
i
in
range
(
256
):
values[i]
=
his[i]
for
j,k
in
sorted
(values.items(),key
=
lambda
x:x[
1
],reverse
=
True
)[:
10
]:
print
j, k
输出:
我们得到了图片中最多的 10 种颜色,其中 220 与 227 才是我们需要的红色和灰色,可以通过这一讯息构造一种黑白二值图片。
?123456789101112131415#-*- coding:utf8 -*-
from
PIL
import
Image
im
=
Image.
open
(
"captcha.webp"
)
im.convert(
"P"
)
im2
=
Image.new(
"P"
,im.size,
255
)
for
x
in
range
(im.size[
1
]):
for
y
in
range
(im.size[
0
]):
pix
=
im.getpixel((y,x))
if
pix
=
=
220
or
pix
=
=
227
:
# these are the numbers to get
im2.putpixel((y,x),
0
)
im2.show()
输出:
局限及遇到的问题
?1#-*- coding:utf8 -*-
此行命令流在windows环境下运行会报错,具体原因可参考python(2)中文编码乱码问题;
该命令流有很大的局限性,识别的动态代买也只有此类:
到此这篇关于python通过pillow识别动态验证码的示例代码的文章就介绍到这了,更多相关python pillow识别动态验证码内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
您可能感兴趣的文章:- Python+selenium破解拼图验证码的脚本
- 利用Python生成随机验证码详解
- Python实现随机生成图片验证码详解
- Python+Selenium+Pytesseract实现图片验证码识别
- Python实现新版正方系统滑动验证码识别
- python调用文字识别OCR轻松搞定验证码
- 基于Python实现原生的登录验证码详情
- Python编程使用DRF实现一次性验证码OTP
- 详解Python结合Genetic Algorithm算法破解网易易盾拼图验证