我用python学习了党的十九大报告

       最近在自学python,经过前期的基础知识学习后,便开始用简单的代码完成自己喜欢的小项目,聊以自娱。

      党的十九大是我们党在关键时期召开的一次关键会议,标志着我国社会主义事业进入了新时代,那么党的十九大报告,到底强调了那些呢。我用python学习了十九大报告告诉你:

       我们政协网上找到了十九大报告全文,网址(http://www.china.com.cn/cppcc/2017-10/18/content_41752399.htm)。


接下来,我们就是要爬取这份干货满满的报告,并对它进行简单文本分析。

抓取文本,提取关键词的代码实现如下:

from lxmlimport etree

import jieba,jieba.analyse

v_sorce = pd(url='http://www.china.com.cn/cppcc/2017-10/18/content_41752399.htm',encoding ='utf-8')

for iin v_sorce('p'):

with open('sjd.txt','a+',encoding='utf-8')as f:

f.write(pd(i).text())

f.close()

with open('sjd.txt','r',encoding='utf-8')as t:

text = t.read()

t.close()

keyword = jieba.analyse.extract_tags(text,topK=50,withWeight=False)

print(keyword)

运行结果:

十九大提的最多的词汇(50个):

['社会主义', '人民', '坚持', '发展', '建设', '特色', '中国', '全面', '推进', '制度', '政治', '伟大', '体系', '实现', '加强', '国家', '社会', '时代', '中华民族', '文化', '现代化', '民主', '完善', '必须', '法治', '安全', '创新', '深化', '复兴', '推动', '我国', '治理', '生态', '更加', '改革', '依法治国', '增强', '全党', '文明', '我们', '经济', '坚决', '战略', '加快', '领导', '健全', '构建', '不断', '工作', '思想']

我们可以看出,近些年我们党重点的工作领域都一涵盖在内,所有关键词get.

文字展示还是不太直观,于是想到了python 的wordcloud库:

conment_text= codecs.open('sjd.txt','r',encoding='utf-8').read()

cut_text =" ".join(jieba.cut(conment_text))

n = jieba.analyse.extract_tags(conment_text)

print(n)

color_mask = imread("timg.jpg")

d = path.dirname(__file__)

cloud = WordCloud(font_path=path.join(d,'simsun.ttc'),

                      background_color='white',

                      mask=color_mask,

                      max_words=2000,

                      max_font_size=40)

word_cloud = cloud.generate(cut_text)

word_cloud.to_file('sjd.jpg')

plt.imshow(word_cloud)

plt.axis('off')

plt.show()

这就生成了十九大报告的词云图,形状为党徽:之前抓取的关键词,都清晰罗列,字体越大说明报告提到的次数就越多。这样看起来就更加直观方便。


十九大关键词都已呈现在词云图中,这张图展现了我们党未来的工作方向,也是党治理国家的美好蓝图。

这是自学python 以来第一次写分享文章,水平有限,如有不足,请一笑了之。。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354