Python数据分析系列04-豆瓣影评、歌词词云分析

序言

哈佛大学的校训之一:你所浪费的今天,是逝去的人所奢望的明天;你所厌恶的现在,是未来的你回不去的曾经。

数据

image.png

image.png

展示

from wordcloud import WordCloud
import jieba
import numpy
import PIL.Image as Image 


def cut(text):
    wordlist_jieba = jieba.cut(text)
    space_wordlist = " ".join(wordlist_jieba)
    return space_wordlist


with open("我不是药神.txt", encoding="utf-8")as file:
    text = file.read()
    # 分词
    text = cut(text)
    mask_pic = numpy.array(Image.open("地图.png"))
    wordcloud = WordCloud(font_path="STHeiti-Light.ttc",
                          collocations=False,
                          background_color="white",
                          max_words=1000,
                          #stopwords=["的", "电影", "也", "了", "是", "都"],  
                          mask=mask_pic
     ).generate(text)
    image = wordcloud.to_image()
    wordcloud.to_file('词云_03.png')

词云_03.png

词云_02.png

如果本文对你学习有所帮助-可以点赞👍+ 关注!将持续更新更多新的文章。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容