抓包获取微信文章阅读数实战

2024年7月19日更新

距离写这篇文章已经过去了三年了,期间有不少朋友问我能不能提供一套封装好的api供大家使用. 其实这些年一直在做这个事情.有需求的朋友可以私信我. 交流交流

2020年12月24日更新

最近有读者反馈 获取不到评论数 

这个其实很简单,只需要在阅读数接口传入 comment_id 参数即可获取到,

comment_id获取方式在文章的html中



2020年7月8日更新

最近新写了一篇关于爬虫各种技术的科普 https://www.jianshu.com/p/21bfeacbc5d5


2020年 4月18日更新

最近有读者反馈最新的阅读数接口的参数增多

实际我测试了一下 目前文中的使用cookie方式依然可以使用,


想了解相关技术的可以私聊我,或者在下方评论


2019年6月27日更新

经过艰难险阻.. 目前api终于恢复了,可以使用的业务有

1. 搜狗链接转为永久

2. 获取公众号历史发文消息( 支持获取全部历史消息)

3. 获取文章阅读数



12月18日更新

目前API暂时不可用,如果有相关技术的朋友可以联系我,或者遇到问题的朋友也可以与我交流

待我研究出新方案之后 继续提供免费API 感谢各位的支持 

8月3日 更新

对于爬虫需求量较少的朋友 或者本身对爬虫技术不是很熟悉的朋友 可以私信我一下 我这里提供免费的爬虫API (API包含三个功能  1.获取公众号最近10条历史消息 , 2.获取文章阅读数/点赞数 3.获取搜狗永久链接) 


关于搜狗转永久链接 & 抓历史消息相关文章  近期会上线

有相关技术问题及批量化问题 请私信联系我 

之前写过几篇文章 貌似最近微信又改过一次验证规则 导致之前的不能用了



正文如下


首先需要获得一篇文章的地址

例如    https://mp.weixin.qq.com/s/S_g27h2KJPSb1NZ9DPM5Ig

我们在手机中访问 可以看到他的阅读数和点赞数 如下图


手机获取微信阅读数

如果在电脑浏览器中访问 是没有阅读数的  并且换了手机/微信的 user-agent 仍然不能获取到阅读数

为了解决这个问题 首先我们 配置好 抓包工具 看一下手机中访问这个页面的时候 究竟有哪些参数

首先配置好 类似 fiddler/charles之类的http/https抓包工具 如果不会配置 自行百度(不要忘记安装https证书   如果是ios10之后的设备 需要在设置中另外开启一个选项 切记!!!!!!!)


配置好抓包工具后 首先我们访问以下文章链接看一下请求


点击文章后的请求


如上图所示 出现了 很多很多的请求  第一个是文章的html连接 后面一次的还有 阅读数接口 和 评论信息接口 还有一个是公众号信息 还有几个不知道是做什么的接口

所以抓包后可以得出结论  阅读数是异步获取的  那就好办了 接下来我们继续看这个接口的参数就好了

https://mp.weixin.qq.com/mp/getappmsgext?f=json&mock=&uin=777&key=777&pass_ticket=QubwCfCA8tQmOKNy05WGE%25252FGdIeQ9xd5smXQdTUznrqfThf6SKZegV%25252BUoNtOHKXYT&wxtoken=777&devicetype=iOS12.0&clientversion=16070025&appmsg_token=966_UjA%252BvpGPcW4k3kPBneqR26gjfiQUlbb0tX_RWCeVBf7_ooOlyQYl1MfANvkqhiXnIy3JX4xFAhbfxM9j&x5=0&f=json

先来看一下这个链接   post传送的方式(我记得之前版本有一个 post参数  参数名为 is_read 值为 1 )

先拿到postman里访问一下尝试


尝试发送请求


结果如上图所示 竟然返回的是错误

继续看一下阅读数接口  发现除了 get的参数 和post的参数之外 还有cookie没做处理 


阅读数接口携带的cookie(部分)

那么这个cookie究竟是从哪里来的呢???

于是再往前翻一下 第一个接口 及文章的接口 

这个接口中 发现了 set-cookie


文章接口中的set-cookie(部分)

通过上图可以看出 微信的操作是 访问了文章接口 会set-cookie 给你 带这个cookie访问阅读数接口 才可以获得阅读数

那接下来我们手动处理一下cookie 再试试

最终成功请求后的结果如下图


阅读数接口

read_num 为阅读数 like_num为点赞数

另外经过我一番整理之后 我发现 cookie生成的方式 依赖于 文章接口中的 X-WECHAT-UIN 和 X-WECHAT-KEY这两个参数 这两个参数的的来源只能是点击文章获取   获取后来置换cookie 从而进行接下来的请求

这两个参数是微信那边生成的 目前不知道算法 而且存在过期时间

另外一个阅读数的关键参数 是 appmsg_token 

这个参数可以在文章页面的html中获取 用正则匹配一下即可

另外还有一点小发现 就是 一篇文章的 X-WECHAT-UIN 和 X-WECHAT-KEY 可以获取相同公众号下的文章的阅读数 

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容