收益3583万?我是如何快速统计「李子柒」YouTube频道视频累计播放量并计算收益的

一桩开心事

上一篇文章「年更博主冒个泡,或将开启可视化之旅」发布后,看到有人评论“催更催更,等下一篇”、“失踪人口回归”,还是挺开心的,没想看居然还有人看,不由感慨「终于等到我,还好你们没放弃」,doge。

这次重新开始更新也顺带建了个交流群,目前群里人还不多,但很惊喜的是,有位「在美可视化爱好者」对我上篇文章里涉及的 data viz 领域的创作者如 Nadieh Bremer/Shirley Wu/Amelia Wattenberger,以及 datasketch 等项目都很了解,而且他还告诉我 D3.js v6 出了,后来我也上推特看到了,并看了下 GitHub 更新说明:Changes in D3 6.0

国内搞D3.js可视化的人感觉并不多,没想到能这么快找到同好,也是桩开心事。

其实很简单,真的值得分享吗?

这回想分享的是之前学到的一个「骚操作」,可以快速的对网页数据进行处理计算。

对懂技术的人来说,自然很简单不值一提,不同技术背景的人可能也会有不同的实现方式。

要是搁以前,估计我也不会专门写这类文章......所以我就鸽了14个月没更新,doge,(这个自黑的梗倒是蛮好用)。


但最近自己的观念也发生了变化,毕竟关注我的人里应该还是很多人不会编程的,那么借这个机会让他们看看,我有某个小需求时是如何处理的;同时,我也好奇如果是他们会如何处理,有什么其他我不知道的高效方法,可以评论分享下。

当然这里并不会完全解释每一步的含义与代码为什么这么写,小白可以看看如何操作即可,这样以后找身边的「工具人」程序员小哥哥小姐姐时,也能门儿清的说出口 XXX,对你来说这个很简单几分钟就能搞定,帮我个忙呗,多么熟悉且悦耳的话语,doge。

扯了那么多,让我看看到底要讲啥

某一天,因为某些以后会讲的原因,我想统计下「李子柒」YouTube频道里所有视频的累计播放量和累计视频总长度。

假如没学 JavaScript 的话,我应该会用 Python 爬虫实现。但学过 JavaScript 并了解到 Chrome 开发者工具里用 $$() 就能直接获取页面元素后,就不需要写爬虫获取页面再抽取数据,而是直接抽取并处理计算即可。

于是将页面拖到最底部,加载出所有视频列表。右键选中「检查」/「审查元素」,或者 Mac 快捷键 Command+Shift+C 打开 Chrome 开发者工具,选中要抽取的元素,比如图中单个视频时长的 5:01

确定数据是在 span.ytd-thumbnail-overlay-time-status-renderer 标签里后,用 $$() 选中,然后遍历输出文本内容,确实就是要的数据。

$$('span.ytd-thumbnail-overlay-time-status-renderer').forEach(el => console.log(el.innerHTML.trim()))

接着用 JavaScript 数组遍历中的 reduce() 方法,将每项数据拆成分和秒,再统一以秒进行累加,即可得到视频总长度为 51742秒, 约 14.37小时

$$('span.ytd-thumbnail-overlay-time-status-renderer').reduce((sum, el) => {
    let item = el.innerHTML.trim()
    let min = +item.split(':')[0]
    let sec = +item.split(':')[1]
    return sum + min * 60 + sec
}, 0)

同样的方式,计算出累计播放量约 173833万次


$$('span.ytd-grid-video-renderer:first-child').forEach(el => console.log(el.innerHTML.trim()))

$$('span.ytd-grid-video-renderer:first-child').reduce((sum, el) => {
    let playNum = +el.innerHTML.replace('万次观看', '');
    return sum + playNum;
}, 0)

随便 Google 找个有对 YouTube 频道进行评估的网站,可以看到播放量也是在17.4亿次左右,和上述结果差不多。

按照不少人的说法,YouTube 视频100万次播放量收益3千美元计算的话,李子柒全部视频17.4亿播放量的收益折算成人民币大概3583万元

不算不知道,一算吓一跳,当然实际比这高还是低,大家可以发表看法。感觉只高不低。

以上就是想分享的一个不用写爬虫,也能很方便对一些网页进行处理计算的操作

会者不难,难者不会。

我也好奇不会编程的小伙伴平时要是遇上类似的问题或需求,会怎么解决,有其它好的方法的话,也可以分享下。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342