失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 如何获取微信公众号文章的阅读量和点赞数

如何获取微信公众号文章的阅读量和点赞数

时间:2019-02-10 03:51:37

相关推荐

如何获取微信公众号文章的阅读量和点赞数

微信采集的重点就是微信公众号相关的数据、主要是发布的文章、其他的话还有点赞阅读以及公众号的账号信息等。下面会大家一一说明如何采集、以及采集的一些限制。

首先是数据来源、主要分为两大块。客户端采集和搜狗微信采集。

搜狗微信采集相对来说比较简单,主要解决IP问题不断的去模拟搜文章和搜公号两个操作即可非常方便的采集到我们想要的文章。但是搜狗微信的局限也非常明显,1、信息不全面、据估算公号覆盖率应该只有百分之80左右。2、没有点赞阅读等信息。3、搜公号板块下所采集的文章链接为临时链接,超过一定时间或者到达一定点击次数就会失效,这个值需要具体论证。注:失效的链接通过微信客户端还是可以打开的、当然也有方法可以将临时链接转化成永久链接。

我们重点还是讲解客户端如何进行采集。首先我们看一下微信文章的永久链接的格式 :https://mp./s?__biz=MzAwMDE0OTU5Nw==&mid=2657482754&idx=2&sn=746d7c43acb057fd83bcc582fab19840&chksm=817c0930b60b8026cc32aee211e1d3bf044e43e8d323d30579835f80c182cb7319b2e8ea3dbd&scene=27#wechat_redirect

关键的几个参数,1、Biz就是微信公号的ID 。2、mid文章的id。3、idx文章在该组文章中的顺序。4、sn(加密值、暂时不知道如何生成)。

接下来我们通过在客户端打开链接、抓个包可以看到下面的链接明显比上面的长,多了好几个参数。这里主要需要关注的是uin和key。UIN你自己的微信号ID、key字面意思就是钥匙通过变化公号BIZ我们可以发现这个Key的使用范围仅仅当前的公号有效、即只能访问带有这个BIZ的链接。那么问题来了、当我们需要大量访问不同公号的时候我们如何去处理。接下来会引入一个万能Key的概念、顾名思义使用这个Key就可以访问任意的BIZ。通过上面的分析我们已经大概可以知道只要能够获取万能Key通过不断的变换BIZ就可以进行该公号的文章采集工作。那么现在的重点在于如何批量自动获取万能Key,以及测试万能Key的使用规则。

https://mp./s?__biz=MzAwMDE0OTU5Nw==&mid=2657482754&idx=2&sn=746d7c43acb057fd83bcc582fab19840&chksm=817c0930b60b8026cc32aee211e1d3bf044e43e8d323d30579835f80c182cb7319b2e8ea3dbd&scene=27&key=abfd51ca16a859156666f9c7c338fb2b4876c2febff465adf8c37c2e6b6eb728753d74db231ee460ea1eb93ee78b0686ca2f829146697189159e6b853278725ca32aca9cab0d19c307fa1b3c51c6356f&ascene=1&uin=MTk4MzAxNjUzMg%3D%3D&devicetype=Windows+7&version=62060619&lang=zh_CN&pass_ticket=MDrfvfr9bp1x7iCQWQ1tsjbc%2Bq4nDXrsrtj3afjg0vBfdOr9yOfHdIx8x4sXRlyM&winzoom=1

一、获取万能Key

万能Key目前只能通过客户端的方式进行获取、这意味着我们要获取万能Key就必须要采集设备(手机)+微信号。测试时我们可以使用安卓模拟器进行验证、(通过多开模拟器生产Key会很容易被封号、尤其是新注册的微信号)。我现在的做法是内嵌脚本到采集设备、同时安装安卓版抓包软件,脚本不断执行访问所产生的数据包会加密发送到web服务再最终入到数据库。接下来从库中取出调用即可。批量获取的话只能大量投入采集资源、手机+微信号。以万能Key的方式采集每天差不多有150W公号文章,搜狗的话就更多~

二、使用规则

1、采集一般的过程都是先访问列表、获取到列表中的文章链接再采集具体文章。微信公号采集这块也不例外。首先是列表页、微信公号的列表是通过访问公号的历史消息页面来进行的、这一块最早我们走的是香港的微信链接后面因为访问速度较慢限制也越来越多就弃用了、现在走的是大陆的链接目前对历史页的限制主要是每天每个微信号的访问总次数、速度不要太快、每天可以访问1300次左右。超过则会返回“操作频繁”24小时后自动解封。

2、采集文章的点赞阅读数时间间隔应该在2秒以上、反正也会返回异常。同时每天的总访问次数在6000次左右。

3、采集账号的主体信息、主要不要太快就行。大概在6到8S左右,注意这里不仅需要不同的万能Key,IP也有限制哦。不小心被封的话解封时间在2小时左右。

4、Key的有效期为2小时、超过2小时访问列表会返回 {ret:-3,no seesion}这样的字符串、采集主体信息会进入验证页面。所有生产更新万能Key的脚本一般设置为2小时以内。

主要规则应该就是上面这些、最近我们有参照其他微信采集工具开发一款应用工具可以实现自动采集微信公号永久链接的文章包括历史文章点赞阅读等。有需要的话都可以来当我的小白鼠联系找我免费试用哈~或是有啥疑问都欢迎骚扰一起交流~

具体交流可+weixin: crawler888

如果觉得《如何获取微信公众号文章的阅读量和点赞数》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。