失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python 实现网站图片抓取小爬虫

python 实现网站图片抓取小爬虫

时间:2022-02-18 15:07:00

相关推荐

python 实现网站图片抓取小爬虫

初学python,自己实现的一个抓取网站图片的小爬虫。

import reimport urllib.requestdef getResouce(url):source = urllib.request.urlopen(url).read()return source#从源代码中匹配正则表达式,提取urldef getimg(source):#正则表达式reg = r'src="(.*?\.jpg)" width'#生成正则表达式对象regcompile = pile(reg)#匹配正则表达式,获取url 主要网页的编码方式 utf-8 、gb2312等#urls = regcompile.findall(source.decode('gb2312'))urls = regcompile.findall(source.decode('utf-8'))return urlsdef download(urls):num = input("picture编号:(a-)")number =1for url in urls[1:]:#下载数据,并写入文件,利用urlretrieveurllib.request.urlretrieve(url,'E:/picture/litter_picture/%s%s.jpg'% (num,number))number +=1def downloadbyurllib(url):#获取源代码source = getResouce(url)#获取urlsurls = getimg(source)#下载数据download(urls)print("finish the download!")if __name__ == '__main__':downloadbyurllib("/pc/8.html")

如果觉得《python 实现网站图片抓取小爬虫》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。