失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > python3 qq音乐爬取歌手名字 专辑 歌曲时间 播放链接

python3 qq音乐爬取歌手名字 专辑 歌曲时间 播放链接

时间:2020-09-11 14:14:27

相关推荐

python3   qq音乐爬取歌手名字 专辑 歌曲时间 播放链接

**爬取qq音乐的小案例**

1.寻找真正的客户端(client_search)(客户端搜索)

2.找到真正的url

瞧见是不是很头疼,别担心,你只需要这些(https://c./soso/fcgi-bin/client_search_cp),后面的都是参数(说法不是很准确)

3.写入参数

在这个位置下的所有参数复制过来,就像这样

我们不难发现,p代表的是页数(我这里使用了循环,详情看一下代码),w的话代表歌手名字(可以进行更改)

然后我们可以获取到歌手的名字,歌曲专辑,音频时间,播放链接(这一部分的代码在parse_page这个函数中)

然后就到了最要命的歌词环节,shit,头疼

1.点击歌词,Network

我们可以看到一页只有5首哥的歌词,然后我们进行爬取(在lyric_a代码中)

2.我们需要更改params参数,同样在最下面,与上面寻找一致

3.使用openyxl放入excel表格中

​ (1)导入openyxl模块

​ (2) 创建

​ (3)放入并命名excel

这是例图

这里不用csv是因为初学,技术太菜,出来全是逗号(真·逗号分隔符)

以下是完整代码模块:

import requests,openpyxlimport csvimport reHEADERS = {"Accept": "application/json, text/javascript, */*; q=0.01","User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36","Referer":"/portal/search.html","Origin":""}# 创建工作簿wb=openpyxl.Workbook()# 获取工作簿的活动表sheet=wb.active# 工作表重命名sheet.title='lyrics'sheet['A1'] ='歌曲名'# 加表头,给A1单元格赋值sheet['B1'] ='歌词' # 加表头,给B1单元格赋值def parse_page(url):"""获取歌手名字,专辑,歌曲时间,播放链接"""for x in range(5):# 将参数封装成字典params = {'ct': '24','qqmusic_ver': '1298','new_json': '1','remoteplace': 'sizer.yqq.song_next','searchid': '64405487069162918','t': '0','aggr': '1','cr': '1','catZhida': '1','lossless': '0','flag_qc': '0','p': str(x + 1),'n': '20','w': '周杰伦','g_tk': '5381','loginUin': '0','hostUin': '0','format': 'json','inCharset': 'utf8','outCharset': 'utf-8','notice': '0','platform': 'yqq.json','needNewCode': '0'}# 调用get方法,获取信息response = requests.get(url,headers=HEADERS,params=params)# 校验状态码#print(response.status_code)# 使用json方法,将response对象转为列表/字典json_music= response.json()# 获取歌单列表list_music = json_music["data"]["song"]["list"]a = []for music in list_music:name = music["name"] # 获取歌曲名zhuanji = music["album"]["name"] # 专辑video_time = str(music["interval"])+"秒" #播放时间viedo_url = '/n/yqq/song/'+music["mid"]+".html"a = [name,zhuanji,video_time,viedo_url]#print(a)def lyric_a(url):ii = 1for y in range(5):params = {'ct': '24','qqmusic_ver': '1298','remoteplace': 'txt.yqq.lyric','searchid': '90301270838393774','aggr': '0','catZhida': '1','lossless': '0','sem': '1','t': '7','p': str(y + 1),'n': '5','w': '周杰伦','g_tk_new_2003': '5381','g_tk': '5381','loginUin': '0','hostUin': '0','format': 'json','inCharset': 'utf8','outCharset': 'utf-8','notice': '0','platform': 'yqq.json','needNewCode': '0'}lyric_response = requests.get(url,headers=HEADERS,params=params)json_lyric = lyric_response.json()list_lyric = json_lyric['data']['lyric']['list']for music_lyric in list_lyric:name = music_lyric['songname'] # 名字ii += 1cc = music_lyric['content']# 歌词信息# 这里使歌词信息更加美观cc = re.sub(r"[\\n ]",",",cc)cc = re.sub(r",,,",",",cc)# 用append函数多行写入Excelsheet.append([name,cc])# 最后保存并命名这个Excel文件wb.save('Jay.xlsx')def main():url = "https://c./soso/fcgi-bin/client_search_cp"lyric_a(url)if __name__ == '__main__':main()

好的,结束了呢,青山不改,绿水长流,我们下篇见。

如果觉得《python3 qq音乐爬取歌手名字 专辑 歌曲时间 播放链接》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。