岗位要求词云制作

获取岗位要求数据

在任一招聘网站上搜索相关职位,比如“技术支持”,会得到一个职位列表。进入每一个职位,均会有相应的“岗位要求”,有的名称不一样,但含义一样,可能叫做“任职要求”、“任职资格”等。

新建一个文本文档,叫做 技术支持岗位要求.txt,将整段“岗位要求”的内容拷贝到该文档中。更换职位,重复同样的操作,将新职位的“岗位要求”添加到文档下方。获取越多的“岗位要求”数据越好。

最后,在 技术支持岗位要求.txt 中保存了我们搜集的原始素材。

制作词云

网上词云工具非常多,随便选择一个即可,操作都比较相似。我选择了一个词云叫做 图悦。将 技术支持岗位要求.txt 中的内容拷贝到左侧文本框中,点击“分析出图”,则自动生成词云:

图悦词云.jpg

词云原理

词云的输入是一段文字,输出是各种关键字,不同权重的关键字以不同的大小、颜色进行区分。

词云内部做了两件事,第一件是“分词”,目前市面上用得比较多的叫 结巴分词,将一大段文字变成多个词组。第二件事是统计每个词组出现的频率,频率高的用较大的字号显示,频率低的用较小的字号显示,词云中只显示排名前 N 位的关键词组。

通过词云,我们实际上完成了一次大数据统计。当样本足够多的时候,我们得到的关键词组越可靠,这些词组实际上代表了我们应当注重的技能。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 常用概念: 自然语言处理(NLP) 数据挖掘 推荐算法 用户画像 知识图谱 信息检索 文本分类 常用技术: 词级别...
    御风之星阅读 13,090评论 1 25
  • Solr&ElasticSearch原理及应用 一、综述 搜索 http://baike.baidu.com/it...
    楼外楼V阅读 12,119评论 1 17
  • 做淘宝真的要刷单么?那些所谓的七天螺旋,如果你一个新开的店,没权重没流量,不刷单哪来的螺旋给你? 淘宝大环境下,小...
    我是盼盼呢阅读 13,270评论 1 16
  • 今天是马克读书训练营第七十七天,九月十五日,晴。“我闭上眼睛,向后靠。两个男孩都打开了他们各自边上的窗户,一丝凉爽...
    兰浥尘阅读 1,118评论 0 0
  • 十二月的G市区,时间已然入冬两个月了,北方的大地裹上了银装,而这南方的小城锵锵渗透出一丝丝冬的气息。尽管晨起...
    有一个人阅读 2,778评论 0 1