Python jieba分词、词云、文件读取、函数调用、匿名函数

词云的生成

使用wordcloud 库生成词云

  • 安装wordcloud
pip install wordcloud

调用wordcloud类,生成词云对象

词云格式:WordCloud().genrate.to_file()

from wordcloud import WordCloud
 txt = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都很好莱坞爆米花,不功不过;从头打到尾是真拼,虽然镜头也有略乱时;因为没啥期望值,所以被吴京的野心吓了一跳;吴刚、于谦和丁海峰老三位像炖烂熟的牛筋,嚼着就舒服。"""
wc = WordCloud(
    background_color='white',
    font_path='msyh.ttc',
    width=800,
    height=600).generate(txt)
wc.to_file('ccc.png')
ccc

使用结巴分词对中文词进行分割

import jieba
text = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都很好莱坞爆米花,不功不过;从头打到尾是真拼,虽然镜头也有略乱时;因为没啥期望值,所以被吴京的野心吓了一跳;吴刚、于谦和丁海峰老三位像炖烂熟的牛筋,嚼着就舒服。"""
#中文分词处理
txt_list = jieba.lcut(text)
#将列表转化成字符串,用空格隔开
txt = " ".join(txt_list)
#调用wordcloud类,生成词云对象
from wordcloud import WordCloud
#txt = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都很好莱坞爆米花,不功不过;从头打到尾是真拼,虽然镜头也有略乱时;因为没啥期望值,所以被吴京的野心吓了一跳;吴刚、于谦和丁海峰老三位像炖烂熟的牛筋,嚼着就舒服。"""
wc = WordCloud(
    background_color='white',
    font_path='msyh.ttc',
    width=800,
    height=600).generate(txt)
wc.to_file('aaa.png')
aaa

python中的文件操作

  1. 读取文件
    1)open()内置函数可以读取指定路径的文件
    格式:open(file,mode,buffering,encoding)
    file是文件的路径 mode = 'r' 是以只读方式打开
  • 读取名为text,txt
f = open(file='text.txt', mode='r',encoding='UTF-8')
txt = f.read()
f.close()
print(txt)

2)使用with 上下文管理器进行文件读取

with open('text.txt','r',encoding='UTF-8')as f:
    print(f.read())

读取三国演义小说,并且绘制该小说整篇词云

import jieba
with open('novel/threekingdom.txt', 'r', encoding='UTF-8')as f:
    data = f.read()
 #   print(data)

#分词
word_list = jieba.lcut(data)
#print(len(word_list))
words = " ".join(word_list)
#词云
from wordcloud import WordCloud
wc = WordCloud(
    background_color='white',
    font_path='msyh.ttc',
    width = 800,
   height=600).generate(words)
wc.to_file('aaa.png')
三国词云

绘制指定形状图片的词云

  • 安装imageio库
pip install imageio

读取三国演义小说,并且绘制该小说特定形状词云

import jieba
#通过imageio模块读取指定形状的图片
import imageio
mask = imageio.imread('china.jpg')
with open('novel/threekingdom.txt', 'r', encoding='UTF-8')as f:
    data = f.read()
 #   print(data)

#分词
word_list = jieba.lcut(data)
#print(len(word_list))
words = " ".join(word_list)
#词云
from wordcloud import WordCloud
#txt1 = words
wc = WordCloud(
    background_color='white',
    font_path='msyh.ttc',
    width = 800,
   height=600,
    mask=mask
    # #词云中词的最大数
    # max_words=40,
    # #最小字体的大小
    # min_font_size=80
).generate(words)
wc.to_file('a.png')
特定形状

列表的排序

  • 生成一个列表
li = []
for i in range(10):
    li.append(i)
print('生成的li:', li)
  1. 随机打乱顺序
from random import shuffle
shuffle(li)
print('打乱后的li:', li)

2.对列表重新排序
(1)使用list对象的sort方法

li.sort()
print('使用sort后的li:', li)
  • reverse=Ture 倒序排序
li.sort(reverse=True)
print('使用sort方法,指定reverse进行排序后:', li)

(2)使用内置函数sorted

li = sorted(li)
print('使用sorted函数排序之后',li)
li = sorted(li,reverse=True)
print('使用sorted函数,reverse=Ture排序之后',li)
  • 总结:sorted和sort的区别
    1.sort仅针对列表进行排序,无返回值,会在原来列表基础上修改
    2.sorted 是Python中单独的内置函数,可以对可迭代(iteratble)对象对象进行排序,
    不局限于list,它不改表原生数据,重新生成一个新的队列

稍微复杂的列表排序

stu_info_list = [
    {"name": "zhangsan","age": 8, "addr": "浑南区"},
    {"name": "lisi","age": 58, "addr": "浑南区"},
    {"name": "wuwusan","age": 28, "addr": "浑南区"},
    {"name": "zhanxiixan","age": 11, "addr": "浑南区"},
]
print("排序前", stu_info_list)
def sort_by_age(x):
    return x["age"]

#对学生信息进行排序   key是指定按照什么排序,它接受的是一个自定义函数的名字
stu_info_list.sort(key=sort_by_age)
print("排序后", stu_info_list)
函数:

将反复使用的代码封装起来,进行调用
格式:

def 函数名():
    pass
#调用
函数名(参数1,....)

编写一个1 ~ 任意整数累加和的函数

def caculateNum(num):
    sum = 0
    for i in range(1, num +1):
        sum += i
    return sum
# print(caculateNum(100))
num = int(input('请输入任意整数'))
print('1到{}之间的累加和为{}'.format(num, caculateNum(num)))

匿名函数:

lambda 表达式
格式:

lambda 参数1, 参数2,...:表达式      #参数可以有多个,但是返回的表达式只允许有一个
  • 两个数相加
sum_two_num = lambda x,  y: x+y
print(sum_two_num(1, 5))

使用带有匿名函数的表达式排序

stu_info_list = [
    {"name": "zhangsan","age": 8, "addr": "浑南区"},
    {"name": "lisi","age": 58, "addr": "浑南区"},
    {"name": "wuwusan","age": 28, "addr": "浑南区"},
    {"name": "zhanxiixan","age": 11, "addr": "浑南区"},
]
stu_info_list = sorted(stu_info_list, key=lambda items:items['age'],reverse=True)
print(stu_info_list)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容