Day1:人人网登录第一种方式
#导入模块
from urllib import request,parse from http import cookiejar
#保存cookie,实例化cookie
cookie = cookiejar.CookieJar() handler = request.HTTPCookieProcessor(cookie) opener = request.build_opener(handler)url = ‘/PLogin.do’
#登录账号密码
data = { ‘email’ : ‘1074373992@’, ‘password’ : ‘8zhangheng8’, }
#转换格式
data = parse.urlencode(data)req = request.Request(url,data=bytes(data,encoding=’utf-8’))response = opener.open(req)print(response.read().decode(‘utf-8’))
Day2.人人网第二种登录方式
#导入模块
from urllib import request,parse from http import cookiejar import json
#通过对象保存cookie
cookie = cookiejar.CookieJar()
#######handeler对应着一个操作handler = request.HTTPCookieProcessor(cookie)#######opener 遇到有cookie的response的时候,#######调用handler内部的一个函数, 存储到cookieopener = request.build_opener(handler)#######登录时抓到的login URLurl = ‘/ajaxLogin/login?1=1&uniqueTimestamp=72207807’#######添加form表单form = { ‘email’: ‘1074373992@’, ‘icode’: ”, ‘origURL’: ‘/home‘, ‘domain’: ‘’, ‘key_id’: ‘1’, ‘captcha_type’: ‘web_login’, ‘password’: ‘5a81a817918e177dacc41d16e20ca9abb673e2a4346ff659e856fae44047dc9e’, ‘rkey’: ‘33043daf5d8c619cbafeaaf0907a8494’, ‘f’: ‘http%3A%2F%%2F562829037%2Fprofile’, }
#转换bytes类型
form_bytes = parse.urlencode(form).encode(‘utf-8’) print(form_str)
#opener.open代替request.urlopen
response = opener.open(url,form_bytes)html = response.read()print(html)#######json转换字典res_dict = json.loads(html.decode(‘utf-8’))
#获取home的url链接
home_url = res_dict[‘homeUrl’]print(home_url)
#打开网页
req = opener.open(home_url)print(req.read().decode(‘utf-8’))
1、json.dumps()和json.loads()是json格式处理函数(可以这么理解,json是字符串)
(1)json.dumps()函数是将一个Python数据类型列表进行json格式的编码(可以这么理解,json.dumps()函数是将字典转化为字符串)(2)json.loads()函数是将json格式数据转换为字典(可以这么理解,json.loads()函数是将字符串转化为字典)
2、json.dump()和json.load()主要用来读写json文件函数
如果觉得《python爬虫人人网登陆》对你有帮助,请点赞、收藏,并留下你的观点哦!