失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python第一天----爬取优美图库的图片

python第一天----爬取优美图库的图片

时间:2021-01-10 07:35:57

相关推荐

python第一天----爬取优美图库的图片

python第一天----爬取优美图库的图片

首先我们需要爬取的步骤:

1、选择爬取的网页,这里我选取的是/bizhitupian/,直接爬取的首页第一页的图片

2、查看网页源码,找到图片所在的部分,拿到每一张图片的链接。由于我这个直接得到的链接不可以直接访问,所以我选择了补全链接地址

3、进入具体的某一个图片,查看图片所在的部分

4、将图片的路径保存在本地,我设置的是保存成功一张图片返回一个okay,给我一个提示

以下为爬取图片的全部代码:

import requestsfrom bs4 import BeautifulSoup#操作步骤1、发送请求到服务器resp = requests.get("/bizhitupian/") #从服务器拿到网址,得到一个响应resp.encoding = 'UTF-8' #转码#解析htmlmain_page = BeautifulSoup(resp.text,"html.parser") #将上述得到的响应即网页代码打印出来#找到网页中图片所在的位置#find 找到一个#find_all 找到所有alist = main_page.find("div",attrs={"class":"TypeList"}).find_all("a",attrs={"class":"TypeBigPics"})n = 1for a in alist:href = "" + a.get("href") #/bizhitupian/diannaobizhi/233335.htm#获取图片的链接后进入图片所在的链接,即将此请求发送到服务器,然后再得到响应并进行相应的转码。resp1 = requests.get(href)resp1.encoding = 'utf-8'#解析图片所在的页面front_page = BeautifulSoup(resp1.text,"html.parser")#找到图片所在的路径src = front_page.find("div",attrs={"class":"ImageBody"}).find("img").get("src")#将图片信息保存到本地#新建文件f = open("pic_%s.jpg"% n ,mode="wb") ##将图片内容写入创建的文件中f.write(requests.get(src).content)print("Okay")n+=1

本次主要用到了以下内容,需要提前下载好

1、requests 发送请求,从服务器获取到数据

2、BeautifulSoup 解析页面的源码

如果觉得《python第一天----爬取优美图库的图片》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。