失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python趣图_【新手】使用Python爬取暴走漫画上的GIF趣图

python趣图_【新手】使用Python爬取暴走漫画上的GIF趣图

时间:2019-04-19 10:33:34

相关推荐

python趣图_【新手】使用Python爬取暴走漫画上的GIF趣图

1.[代码][Python]代码

# -*- coding: utf-8 -*-

#---------------------------------------

# 程序:暴走漫画的GIF趣图爬虫

# 版本: 0.1

# 作者:WuChong

# 日期:-01-27

# 语言:Python 3.3

# 说明:能自定义下载页数,默认全部下载,未加多线程功能

#---------------------------------------

import urllib.request

import bs4,os

page_sum = 1 #设置下载页数

path = os.getcwd()

path = os.path.join(path,'暴走GIF')

if not os.path.exists(path):

os.mkdir(path) #创建文件夹

url = "/gif/month/page/" #url地址

headers = { #伪装浏览器

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)'

' Chrome/32.0.1700.76 Safari/537.36'

}

for count in range(page_sum):

req = urllib.request.Request(

url = url+str(count+1),

headers = headers

)

print(req.full_url)

content = urllib.request.urlopen(req).read()

soup = bs4.BeautifulSoup(content) # BeautifulSoup

img_content = soup.findAll('img',attrs={'style':'width:460px'})

url_list = [img['src'] for img in img_content] #列表推导 url

title_list = [img['alt'] for img in img_content] #图片名称

for i in range(url_list.__len__()) :

imgurl = url_list[i]

filename = path + os.sep +title_list[i] + ".gif"

print(filename+":"+imgurl) #打印下载信息

urllib.request.urlretrieve(imgurl,filename) #下载图片

如果觉得《python趣图_【新手】使用Python爬取暴走漫画上的GIF趣图》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。