Python -- wordCloud构造词云图

Python -- wordCloud构造词云图


最近在看python,发现python是在是太好玩了,今天来介绍一下 wordClud.

什么是词云图

词云又叫文字云,是对网络文本中出现频率较高的"关键词"予以视觉上的突出,形成"关键词云层"或"关键词渲染",从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。看了这段是不是觉得"哎呦,不错呦"

具体是什么样式的如下图:

timg.jpeg
u=2919868850,587623811&fm=23&gp=0.jpg

wordCloud 安装


pip install wordcloud

如果还没有安装 pip的读者,可以去安装一下.[安装pip][1]

词云小试

新建一个 名字.py的文件,内容如下


import os

from os import path

import matplotlib.pyplot as plt

from  wordcloud import WordCloud

import jieba

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

text_from_file_with_apath = open('文本路径').read().decode('utf-8')

wordlist_after_jieba = jieba.cut(text_fro
![timg.jpeg](http://upload-images.jianshu.io/upload_images/1043684-248928cde540bb25.jpeg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
m_file_with_apath, cut_all = True)

wl_space_split = " ".join(wordlist_after_jieba)

font=os.path.join(os.path.dirname(__file__), "DroidSansFallbackFull.ttf")

my_wordcloud = WordCloud(font_path=font,max_font_size=40).generate(text_from_file_with_apath)

assert isinstance(my_wordcloud, object)

plt.imshow(my_wordcloud)

plt.axis("off")

plt.show()

当然上面是我改进之后的,在学习的过程中遇到了很多问题,如果读者把代码假如之后还是运行不成功,继续向下看,一定会有收获.

如果成功之后就是这个样子的..

温馨提示:示例文本是我在文本的路径.这里面放读者自己的就可以了.还有DroidSansFallbackFull.ttf字体也是,大家可以去下载,如果想要可以留言给我哦.

遇到的坑

  • PIL 安装失败
  • 中文编码

PIL安装失败

如果有 pip工具其实就是一句命令行

sudo pip install PIL

如果安装失败我报的错误是

could not find a version that satisfies the requirement PIL.(form versions:)
No matching distribution found for PIL.

上网查资料,说按照终端提示添加即可,可是我的终端没有提示,后来终于找到原因了,大概是因为 Mac下的 python 是2.7版本的,安装的 pip 也是也是较高版本,用 pip 安装PIL的时候就会报这个错误,这个错误的大概意思就是找不到 PIL,最后发现其实是现在已经用Pillow代替了PIL,在使用方面没有不同,API都是相同的。
既然如此,咱们就直接安装Pillow模块吧,执行

sudo pip install Pillow

安装这个模块时,发现它会依赖另外一个模块:multiprocessing
只能先把multiprocessing模块安装好再执行上面的命令了,

sudo pip install

multiprocessing即可正常安装,非常小的一个模块

中文编码问题

上段代码中的展示英文字体是没有任何错误的,但是展示中文字体会出现

WechatIMG10803.jpeg

最后是这样的:


WechatIMG10757.jpeg

解决办法就是引入了 sys库,话不多说了,如果还是有问题可以给我评论呦.大家互相交流.一起进步.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容