我分析67万字,提取广告营销圈最常用英文单词TOP500(文内附免费下载链接)

大家好,我是6C

一个学心理学的营销人

为了过上大数据指导下的新世纪斜杠青年的美(tou)好(lan)生活,6C又开始折腾了。这次是非常实用的广告营销圈超高频英文单词TOP500

为什么要折腾这一个项目呢?

在营销圈,英文好是一个加分项。这个加分项首先要求是够用的词汇量,而词汇量是最花时间的一个事情,有没有偷懒高效的方法呢?带着这个思考,便有了这个针对营销人的营销圈高频英文单词项目

这个项目利用爬虫获取海量的营销广告文章语料,然后通过词频分析提取高频英文单词

(心急的朋友可直接滑到文末获取资源)

获取足量合适的英文营销语料

网络上分散的英文营销资料很多,从营销文章细分行业覆盖度、文章的专业程度、文章的来源、文章更新的频率等方面综合考量,最终选择了digiperform和marketo两个站点作为爬取对象。通过Python爬虫技术,最终共获取1200+篇文章,文章字数670000+

https://digiperform.com 是第一个被称为“亚洲最被信任的Digital Marketing教育品牌,里面有超过2000位的专业作者

https://blog.marketo.com 是一个成立7年即完成纳斯达克上市,现被Adobe收购的一家以做自动化营销的公司

分析语料库,提取高频词汇

这部分比想象中的要复杂一点,英文单词的分析并非把词一分统计个词频就好了。我摸索后经过了三个处理步骤

Step1 单词清洗

众所周知,同一个英文单词会有多种变形,例如动词的分词形式、名词的单复数形式、形容词的比较级等等。这些词拼法不同,但把它们算作是独立单词显然是不准确的,会影响词频的准确性。因此,需要先进行进行单词清洗

经过一些时间的寻找,发现这已经是属于AI领域里最为困难的一个分支NLP(自然语言处理)了。(敢情一不小心还涉足了AI领域?)

NLP(Natural Language Processing)属于AI的一个分支,主要包括中文自动分词、词性标注、句法分析、机器翻译、文字蕴含等。比如那些做Social Listening的产品核心技术就是NLP

然而实际我们这需要解决的问题跟NLP也关联不大,一个nltk库就搞定了。经过一些时间的摸索和尝试,成功的完成了单词的清洗工作

Step2 去停用词

清洗完就能直接统计词频么?还不够

稍微思考一下我们就能猜到,这样统计出来最高频的一定是the、of、have 这样的介词,以及夹杂着很多的also、change、cost、easy、line这样即使是营销小白也耳熟能详的单词。这些词如果不做处理,那这些所谓的高频词也将意义不大

最终我选择去掉了英文中最常用的1000个词,基本相当于初中英语需要掌握的词汇量,是一个比较低的门槛了

1000个英文当中最常用的词

Step3 输出单词及词频

做好前2步的准备工作之后,终于可以统计词频输出了。最终输出的TOP500词都至少是出现60次以上的单词。

那剩下的词自然是出现的概率不到万分之一,以每篇文章500词计算,属于你读20篇文章都不会遇到一次的词,可以再实际碰到的时候再详细了解

营销圈TOP500单词词云图

增加单词发音和释义

为了使用起来更加方便,我最后还为这500单词增加了对应的发音和释义,排好版制作成了PDF文件共下载

释义词典选用的是韦氏英英词典

为什么选择英英词典呢,源自我个人在学英语的过程中的一个痛点:一个单词通常有多个中文释义记起来很累。但你如果看英英释义就能发现,其实核心都是一个意思,只不过是用在不同的场景中。英英释义能方便你理解这个单词核心的释义,容易记忆并且能够举一反三灵活运用

比如abandont这个单词,有道给的中文意思为:“遗弃;离开;放弃;终止;陷入”五个词义,而韦氏词典给的释义为“to give up completely;to withdraw from often in the face of danger;to withdraw protection, support, or help from”,可以看出这个词的核心意思是“退出某个状态”,退出直面危险的状态那是终止,退出保护的状态是陷入

下面是最终的成果,每个单词选用了最常用的三个释义(若有)。细心的你一定发现了,这里依旧有很多单词是你已经熟悉的。

但我提醒你再仔细的看一下对应的释义,是不是发现之前的理解不够彻底不够完整呢。希望你不要跳过你自认为熟悉的词,温故而知新。

营销英语TOP500及翻译

若你想要获得完整版的文件,可关注“6C的笔记”回复“英语”获取。创作不易,若文章对你有帮助,记得点赞评论赞赏一键三连哦

THE END.

往期精彩:
我分析了林夕近20万字的词作曲,告诉你林夕到底写的是什么
亚瑟王传奇 | 阿瓦隆角色背景介绍
5分钟学会怎么说服客户

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353