教你用python 画词云

import matplotlib.pyplot as plt
import jieba
# from wordcloud import WordCloud
# f=open('text','r',encoding='utf8')
# text=f.read().replace("\n",'').replace("-",'').replace("        ",'')
# print(text)
# wordcloud = WordCloud().generate(text)
from wordcloud import WordCloud
import PIL.Image as image
import numpy as np
import jieba


# 分词
def trans_CN(text):
    # 接收分词的字符串
    word_list = jieba.cut(text)
    # 分词后在单独个体之间加上空格
    result = " ".join(word_list)
    return result


with open("text","r",encoding='utf8') as fp:
    text = fp.read()
    print(text)
    # 将读取的中文文档进行分词
    text = trans_CN(text)
    print(1)
    # mask = np.array(image.open("F:\wordcloud\image\love.jpg"))
    wordcloud = WordCloud(
        # 添加遮罩层
        # mask=mask,
        # 生成中文字的字体,必须要加,不然看不到中文
        font_path="C:\Anacoda\Lib\site-packages\wordcloud\STFANGSO.ttf"
    ).generate(text)

    image_produce = wordcloud.to_image()
    image_produce.show()

词云是挺有意思的一个库,但其默认不支持中文字体,一读中文就乱码 下面分享下从根本上解决乱码问题的方法。
解决中文词云乱码问题

image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 发现 关注 消息 iOS 第三方库、插件、知名博客总结 作者大灰狼的小绵羊哥哥关注 2017.06.26 09:4...
    肇东周阅读 12,305评论 4 61
  • 都说开始做一件事情很难,其实你真正开始了,也许更重要更难的是坚持. 几天前决定要做的事情,认真写好了计划,欣然决定...
    朝迎日出阅读 156评论 0 0
  • 要把天分当优势,而不是弥补你懒惰的的工具。
    harriet我不想文艺阅读 115评论 0 0
  • 前一阵的大会报告国内外备受关注。角色不同关注点不同,政府官员不用说是未来行动纲领,企业家关注是希望发现商机,作为跟...
    落落的萝卜糕阅读 159评论 0 0
  • 阿三,四川人,水瓶座。直男175,微胖,性情随和。 D先生好友之一,属于那种可以随便睡的关系。 阿三最好玩的特点就...
    了下阅读 419评论 0 0