博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
验证码操作
阅读量:5306 次
发布时间:2019-06-14

本文共 1367 字,大约阅读时间需要 4 分钟。

 

 

#下载验证码到本地import requestsfrom lxml import etreeimport urllib.requests = requests.session()url = 'https://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx'headers = {    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}page_content = s.get(url,headers=headers).texttree = etree.HTML(page_content)img_url = tree.xpath('//img[@id="imgCode"]/@src')[0]img_url = 'https://so.gushiwen.org' + img_url#urllib.request.urlretrieve(img_url,'./code.png')img_data = s.get(url=img_url,headers=headers).contentwith open('./code.png','wb') as fp:    fp.write(img_data) #解析form表单的令牌数据(反爬手段)key_1 = tree.xpath('//*[@id="__VIEWSTATE"]/@value')[0]key_2 = tree.xpath('//*[@id="__VIEWSTATEGENERATOR"]/@value')[0]#step 2:抓包获取登录urlcode = input('查看下验证码内容:')post_url = 'https://so.gushiwen.org/user/login.aspx?from=http%3a%2f%2fso.gushiwen.org%2fuser%2fcollect.aspx'data = {    "__VIEWSTATE":key_1,    "__VIEWSTATEGENERATOR":key_2,    "from":"http://so.gushiwen.org/user/collect.aspx",    "email":"www.zhangbowudi@qq.com",    "pwd":"123456",    "code":code,    "denglu":"登录"}page_content = s.post(url=post_url,headers=headers,data=data).textwith open('./second.html','w',encoding='utf-8') as fp:    fp.write(page_content)print('over')

 

转载于:https://www.cnblogs.com/xujinjin18/p/9716146.html

你可能感兴趣的文章
Altera DDR2 IP核学习总结2-----------DDR2 IP核的生成
查看>>
baidu patchrom项目 内存溢出解决方法
查看>>
简单的C#TCP协议收发数据示例
查看>>
labview图形和图表的类型
查看>>
Android 缓存
查看>>
[bzoj1910] [Ctsc2002] Award 颁奖典礼
查看>>
【科普】电池容量相同 为何笔记本电池的体积比手机大得多
查看>>
UEFI引导模式
查看>>
POJ3070 矩阵快速幂模板
查看>>
spring boot实现ssm(2)功能
查看>>
以最小代价解决同一apk不同资源定制共存问题
查看>>
第四代iPhone电池仍然不可以更换(转)
查看>>
ibatis中的符号#跟$区别
查看>>
QComboBox设置item height(行高)
查看>>
内存原理与PHP的执行过程
查看>>
P3175 [HAOI2015]按位或
查看>>
【HDU5909】Tree Cutting(FWT)
查看>>
多边形区域填充算法--扫描线填充算法(有序边表法) 有代码
查看>>
北京郊区房租面临下调压力 平均单位租金36.2元/平
查看>>
linux programing
查看>>