失眠网 > python第一天----爬取优美图库的图片

python第一天----爬取优美图库的图片

时间：2021-01-10 07:35:57

首先我们需要爬取的步骤：

1、选择爬取的网页，这里我选取的是/bizhitupian/，直接爬取的首页第一页的图片

2、查看网页源码，找到图片所在的部分，拿到每一张图片的链接。由于我这个直接得到的链接不可以直接访问，所以我选择了补全链接地址

3、进入具体的某一个图片，查看图片所在的部分

4、将图片的路径保存在本地，我设置的是保存成功一张图片返回一个okay，给我一个提示

以下为爬取图片的全部代码：

import requestsfrom bs4 import BeautifulSoup#操作步骤1、发送请求到服务器resp = requests.get("/bizhitupian/") #从服务器拿到网址，得到一个响应resp.encoding = 'UTF-8' #转码#解析htmlmain_page = BeautifulSoup(resp.text,"html.parser") #将上述得到的响应即网页代码打印出来#找到网页中图片所在的位置#find 找到一个#find_all 找到所有alist = main_page.find("div",attrs={"class":"TypeList"}).find_all("a",attrs={"class":"TypeBigPics"})n = 1for a in alist:href = "" + a.get("href") #/bizhitupian/diannaobizhi/233335.htm#获取图片的链接后进入图片所在的链接，即将此请求发送到服务器，然后再得到响应并进行相应的转码。resp1 = requests.get(href)resp1.encoding = 'utf-8'#解析图片所在的页面front_page = BeautifulSoup(resp1.text,"html.parser")#找到图片所在的路径src = front_page.find("div",attrs={"class":"ImageBody"}).find("img").get("src")#将图片信息保存到本地#新建文件f = open("pic_%s.jpg"% n ,mode="wb") ##将图片内容写入创建的文件中f.write(requests.get(src).content)print("Okay")n+=1

本次主要用到了以下内容，需要提前下载好

1、requests 发送请求，从服务器获取到数据

2、BeautifulSoup 解析页面的源码

如果觉得《python第一天----爬取优美图库的图片》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。