selenium用cookie登录 selenium的cookies怎么使用
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
前面爬虫系列我在介绍中谈到过Ja【【微信】】进行渲染的界面,普通的请求是无法获取关键代码块的。
selenium确实是个神器,但是越来越多的网站也对selenium进行了识别和通过登录方式进行了限制,在登录方面因selenium携带cookies的方式和用requests库请求所携带的方式有很大的不同,之前走过了不少的坑,所以在此作下登录的总结。以大麦网和淘宝网为例。
大麦网是一个用于演唱会购票的网站,如果想利用selenium进行抢票操作就必须进行登录。
我的思路是写两个脚本:1. selenium驱动在登录界面的时候进行手动微信扫码登录,然后获取cookies保存在本地。2. 利用selenium加载界面(此时是未登录状态),然后往浏览器从本地里添加cookies,刷新,登录成功!
1.1?脚本一 获取cookies并保存本地
代码运行时会出现二维码,扫码后登录成功,程序自动保存cookies至本地。
1.2?脚本二? 加载本地的cookies访问网页
结果如下图,出现的界面显示未登录,稍等几秒浏览器读取cookies后显示登录状态。
以上代码最难的部分就是往浏览器里面添加cookies的地方,我们怎么知道要改哪些参数并设置呢?原来获取下来的cookies是以列表的形式储存的,而列表里的元素是字典,每一个字典都是一个cookies,所以我们需要遍历列表,以字典形式往浏览器添加。我遍历了一遍本地保存的cookies,如下图。
所以我们只需按照上表里的字段方式往浏览器里修改并添加就好啦。
淘宝网是大家爬的比较多的,但是使用过requests库请求爬的人都知道,先不说Ajax的加密,就连进行登录界面与验证码都难住了好多人。今天我试着利用selenium携带cookies方式登录成功了,操作与上面的大麦大体相似。
淘宝网的厉害之处在于能在使用账号密码方式登录时识别出你的selenium,然后拒绝你登陆。不过我尝试使用了二维码方式登录然后保存cookies再进行免登陆,成功了!
2.1?脚本一 获取cookies并保存本地
因为打开淘宝任何网页都先是登录页面,只有登录了才能访问内容,所以log_url设置淘宝的任何网页都是可以的。
2.2?脚本二读取cookies登录目标网站
淘宝网的代码跟大麦的大致相同,唯一不同的就是大麦网在登录页面刷新操作后就显示已登录状态了,而淘宝网刷新没用,必须新打开网页才行。所以淘宝网必须先打开一次用于登录,然后再打开目标网页。
如图,登录成功。不要觉得这简单,以为直接进入目标网址就完事了,如果不进行登录操作,你打开图6页面时将会跳转图7页面并且你的selenium已经被检测到!无法进行账号密码登录。
..天猫互点怎么看次数,天猫互点怎么看次数,助力失败 当前参与人数过多,2023 天猫618 理想生活狂欢季的助力活动可以说是非常热门的,2023 618天猫理想生活狂欢季助力需要找人帮忙,可是朋友有限,又不想麻烦朋友的话,这个时候加入一个天猫狂欢盛典天猫群聊玩法是最合适不过的了。最新2023 淘宝618 狂欢盛典天猫互点怎么看次数现在已经建立完了,新人多,我们的新群码已经放出来,我们每天都会把最新的入群二维码呈现出来,大家获取了二维码之后扫码即可进入。