分析lianjia房源数据(一)——Python数据清洗
分析lianjia房源数据(二)——SPSS数据清洗
分析lianjia房源数据(三)——SPSS数据分析
分析lianjia房源数据(四)——PowerBI可视化展示效果
分析lianjia房源数据(五)——生成词云图
基本思路如下
- 遍历excel中“标签”列所有值,放置于一个变量words中
- 对words使用jieba分词处理为splitWords
- 对分词后的spiltWords可以使用wordcloud库绘制词云图
代码如下
import pandas as pd
import numpy as np
from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt
dfershou=pd.DataFrame(pd.read_csv(r'D:/LianjiaDatas/lianjia.csv',header=0,encoding='gbk'))
dflabels=dfershou['标签']
#print(dflabels)
words='';
for i in dflabels.index:
words+=dflabels[i]+" "
spiltWords="".join(jieba.cut(words))
wordcloud = WordCloud(font_path="C:/Windows/Fonts/simhei.ttf",background_color="white",width=1920,height=1080).generate(spiltWords)
wordcloud.to_file('pic.jpg')
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis('off')
plt.show()
最终输出的图片如下所示。