python第一天----爬取优美图库的图片
首先我们需要爬取的步骤:
1、选择爬取的网页,这里我选取的是/bizhitupian/,直接爬取的首页第一页的图片
2、查看网页源码,找到图片所在的部分,拿到每一张图片的链接。由于我这个直接得到的链接不可以直接访问,所以我选择了补全链接地址
3、进入具体的某一个图片,查看图片所在的部分
4、将图片的路径保存在本地,我设置的是保存成功一张图片返回一个okay,给我一个提示
以下为爬取图片的全部代码:
import requestsfrom bs4 import BeautifulSoup#操作步骤1、发送请求到服务器resp = requests.get("/bizhitupian/") #从服务器拿到网址,得到一个响应resp.encoding = 'UTF-8' #转码#解析htmlmain_page = BeautifulSoup(resp.text,"html.parser") #将上述得到的响应即网页代码打印出来#找到网页中图片所在的位置#find 找到一个#find_all 找到所有alist = main_page.find("div",attrs={"class":"TypeList"}).find_all("a",attrs={"class":"TypeBigPics"})n = 1for a in alist:href = "" + a.get("href") #/bizhitupian/diannaobizhi/233335.htm#获取图片的链接后进入图片所在的链接,即将此请求发送到服务器,然后再得到响应并进行相应的转码。resp1 = requests.get(href)resp1.encoding = 'utf-8'#解析图片所在的页面front_page = BeautifulSoup(resp1.text,"html.parser")#找到图片所在的路径src = front_page.find("div",attrs={"class":"ImageBody"}).find("img").get("src")#将图片信息保存到本地#新建文件f = open("pic_%s.jpg"% n ,mode="wb") ##将图片内容写入创建的文件中f.write(requests.get(src).content)print("Okay")n+=1
本次主要用到了以下内容,需要提前下载好
1、requests 发送请求,从服务器获取到数据
2、BeautifulSoup 解析页面的源码
如果觉得《python第一天----爬取优美图库的图片》对你有帮助,请点赞、收藏,并留下你的观点哦!