1. 分析
构建词云需要具备:
原料即文章等内容
将内容进行分词
将分词后的内容利用构建词云的工具进行构建
保存成图片
2. 需要的主要模块
jieba 中文分词
wordcloud 构建词云
3. 模块原理
wordcloud的实现原理
文本预处理
词频统计
将高频词以图片形式进行彩色渲染
jieba的实现原理
进行中文分词(有多种模式)
4. 英文词云
英文分词和构建词云只需要wordcloud模块
Python学习资料或者需要代码、视频加Python学习群:960410445
具体实现如下:
5. 中文分词
具体实现如下:
import jieba
cut = jieba.cut(text) #text为你需要分词的字符串/句子
string = ' '.join(cut) #将分开的词用空格连接
6. 中文词云
中文词云需要jieba和wordcloud模块
具体实现如下:
7. 实现效果
英文词云实现效果如下:
中文词云实现效果如下: