在写爬虫的时候,有时候会遇到非utf-8的网页,可能会造成中文乱码问题,比如说遇到的是gb2312的编码。直接打印中文就会变成乱码
1.查看网页编码
document.characterSet
2.正确解码
网页使用的是gb2312编码
str = requests.get("")# data = str.content.decode('utf-8') 指定编码data = str.text.encode('latin1').decode('gbk')
如果觉得《【python】解决网页gb2312编码中文乱码问题》对你有帮助,请点赞、收藏,并留下你的观点哦!