python学习的第二天

一、导入

1.python库中的turtle(海龟绘图)

Python标准库中有个turtle模块，可以生成标准的应用程序窗口进行图形绘制。turtle的绘图方式非常简单直观——想象有一只尾巴上蘸着颜料的小海龟在电脑屏幕上爬行，随着它的移动就能画出线条来，turtle程序窗口的绘图区域使用直角坐标系，海龟初始位置在窗口绘图区正中的(0,0)点，头朝x轴的正方向。
利用turtle我们可以绘制小猪佩奇，如下图所示：

下面我们先学习简单的利用海龟绘图绘制”NEUSOFT“，如下图所示：

1.首先，导入turtle 并使用as 给turtle起一个别名t，取了别名之后，就只能使用t来绘图

# 设置画笔的大小  10px
t.pensize(10)
#设置画笔颜色为蓝色
t.color('blue')

因为初始画笔的位置是在画布的中心位置（0，0），把画布分为四个象限，所以我们要把画笔的位置向左平移,移动画笔时我们要将画笔抬起，利用penup()函数抬起画笔（可以简写为pu()），利用pendown()函数落下画笔（可以简写为pd()），goto(x,y)函数让画笔移动到指定位置,x代表x轴，y表示y轴

t.penup()
t.goto(-260, 0)
t.pd()

2.首先绘制字母N，字母N是由两根竖线和一根斜线组成，初始画笔的笔头朝x轴的正方向，我们要把笔头的方向改为向上，使用left()函数，让画笔向左转90度，使画笔朝上，然后使用forward()函数画长度为80px的线条，这样一条竖线就画好了。接下来我们绘制斜线，首先使画笔向右转145度，使画笔朝向东南方向，画一笔，然后使画笔向左转145度，使画笔朝上，画一笔，N就画好了。

# 绘制 N
t.left(90)
t.forward(80)
t.right(145)
# 简写
t.fd(100)
t.lt(145)
t.fd(80)

3.绘制字母E，字母E是由三横一竖组成

# 绘制E
t.penup()
t.goto(-130, 0)
t.pd()

t.left(90)
t.forward(40)
t.right(90)
t.forward(80)

t.penup()
t.goto(-130,40)
t.pd()
t.left(90)
t.forward(40)

t.penup()
t.goto(-130,80)
t.pd()
t.forward(40)

4.绘制U，我们可以把U看作由两根竖线和一个半圆组成。使用circle(25,180)函数来绘制半圆，25表示半径，180表示旋转的度数，360度就是画一个圆

t.penup()
t.goto(-100, 80)
t.pd()
t.left(90)
t.forward(60)

t.penup()
t.goto(-50, 80)
t.pd()
t.forward(60)

t.penup()
t.goto(-100, 20)
t.pd()

t.circle(25,180)

5.绘制S，我们可以把S看出由2个四分之三的圆组成。

t.penup()
t.goto(20, 60)
t.pd()
t.circle(22,270)
t.circle(-22,270)

6.绘制O，

t.penup()
t.goto(100, 60)
t.pd()

t.circle(22, 180)
t.fd(40)
t.penup()
t.goto(100, 20)
t.pd()
t.circle(-22, 180)

t.penup()
t.goto(100, 20)
t.pd()
t.fd(40)

7.绘制F，

t.penup()
t.goto(140, 0)
t.pd()

t.forward(80)

t.penup()
t.goto(180,40)
t.pd()
t.left(90)
t.forward(40)

t.penup()
t.goto(180,80)
t.pd()
t.forward(40)

8.绘制T，

t.penup()
t.goto(230, 0)
t.pd()

t.right(90)
t.forward(80)

t.penup()
t.goto(255,80)
t.pd()
t.lt(90)
t.forward(50)
t.done()

最后要让gui界面一直显示, 所有执行的代码要写在done()函数之前。这样我们的NEUSOFT就绘制成功了。

二、python常用数据类型

1.Python 列表(List)

序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置，或索引，第一个索引是0，第二个索引是1，依此类推。

Python有6个序列的内置类型，但最常见的是列表和元组。

序列都可以进行的操作包括索引，切片，加，乘，检查成员。

此外，Python已经内置确定序列的长度以及确定最大和最小的元素的方法。

列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现。列表的数据项不需要具有相同的类型，创建一个列表，只要用逗号分隔不同的数据项使用方括号括起来即可。如下所示：

list1 = ['physics', 'chemistry', 1997, 2000]
list2 = [1, 2, 3, 4, 5 ]
list3 = ["a", "b", "c", "d"]

列表的输出与遍历，如下图所示：

#定义方式  []
#定义一个空列表
list=[]
hero_name = ['鲁班七号', '安琪拉', '李白', '刘备']
#输出
print(hero_name)
#遍历
for hero in hero_name:
    print(hero)

列表的常见操作

#1.列表的访问
列表名[索引]
print(hero_name[2])

# 2.添加 append
hero_name.append('后羿')
print('添加后的列表', hero_name)

#3.修改
hero_name[1] = 1000
print('修改后的列表',hero_name)

#4.删除
del hero_name[1]
print('删除后的列表',hero_name)

列表: 与c语言中的数组很相似，只不过可以存储不同类型的数据
优点：灵活，缺点：效率低

练习

创建 [1, 2, 3......10] 这样的一个数字列表
1.创建空列表
2.使用for 循环，在循环中添加元素值

li = []
   for i in range(1, 11):
li.append(i)
print(li)

2. 字符串

定义形式 '' " "

切片对序列截取一部分的操作，适用于列表

 name = 'abcdefg'
 name[1]

[起始位置:终止位置：步长] 左闭右开

print(name[1:4])

print(name[0:7:2])

输出为：a c e g
全切片的时候可以省略初始和终止位置

print(name[::2])

常用方法

a.去两端空格

name = '    abcdefg     '
# 查看序列内元素的个数  len（）
print(len(name))
name = name.strip()
print('去空格之后', len(name))

b. 替换

 price = '$999'
 price = price.replace('$','')
 print(price)

c.列表变成字符串的方法 join

# li = ['a', 'b', 'c', 'd']
# a = '_'.join(li)
# print(a)
# print(type(a))

3.元组 tuple

元组和列表很像只不过元组不可以修改

a.定义 ()

 a = ('zhangsan', 'lisi', 'wangwu',1000)
 print(a)
 print(type(a))

b.访问

# print(a[1])

c.修改

a[3] = 'zhaoliu'

元组需要注意的, 只有一个元素的元组

b = ('lisi') #不是元组
b1 = ('lisi',) #是元组
c = (1000) #不是元组
c1 = (1000,) #是元组
print(type(b))
print(type(b1))
print(type(c))
print(type(c1))

4.字典 dict

key-value数据结构

定义形式 {}

info = {'name':'李四', 'age':34, 'addr':'重庆市渝北区'}
print(len(info))
print(info)

a.字典的访问

print(info['name'])

b.修改

info['addr'] = '北京市朝阳区'
print('修改后字典',info)

c.增加

info['sex'] = 'female'
print('增加后字典',info)

获取字典中所有的键

print(info.keys())

获取字典中所有的值

print(info.values())

获取字典中所有的key-value

print(info.items())

把由元组组成的列表，转换为字典

d = [('name', '李四'), ('age', 34), ('addr', '北京市朝阳区'), ('sex', 'female')]
d1 = dict(d)
print(d1)

遍历字典

for k, v in info.items():
    print(k, v)

5. 集合

无序，不重复

set1 = {'zhangsan', 'lisi', 222}
print(type(set1))

遍历

for x in set1:
    print(x)

6.掌握python常用数据类型和语法

a. 列表的排序

 li = []
 for i in range(10):
     li.append(i)
 print(li)
 from random import shuffle
 shuffle(li)
 print('随机打乱的列表', li)
 li.sort(reverse=True)
 print('排序后的列表', li)

stu_info = [
    {"name":'zhangsan', "age":18},
    {"name":'lisi', "age":30},
    {"name":'wangwu', "age":99},
    {"name":'tiaqi', "age":3},

]
print('排序前', stu_info)

b.python函数的定义

# def 函数名(参数):
#     函数体
def sort_by_age(x):
    return x['age']

# key= 函数名    ---  按照什么进行排序
# 根据年龄大小进行正序排序
stu_info.sort(key=sort_by_age, reverse=True)
print('排序后', stu_info)

c.练习

name_info_list = [
    ('张三',4500),
    ('李四',9900),
    ('王五',2000),
    ('赵六',5500),
]

def sort_by_grade(i):
    return i[1]

# 根据元组第二个元素进行正序排序

name_info_list.sort(key=sort_by_grade)
print(name_info_list)

d.本地文件读取

# python中使用open内置函数进行文件读取
 f = open(file='./novel/threekingdom.txt', mode='r', encoding='utf-8')
 data = f.read()
 f.close()
 data = open(file='./novel/threekingdom.txt', mode='r', encoding='utf-8').read()
 print(data)

# with as 上下文管理器  不用手动关闭流
 with open('./novel/threekingdom.txt', 'r', encoding='utf-8') as f:
     data = f.read()
     print(data)

写入

 txt = 'i like python'
 with open('python.txt','w', encoding='utf-8') as f:
     f.write(txt)

text = """<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
<h1>重庆师范欢迎你</h1>
</body>
</html>"""
print(text)
with open('chongqingshifan.html','w', encoding='utf-8') as f:
    f.write(text)

三、中文分词 jieba

导入jieba分词

import jieba

三种分词模式

seg = "我来到北京清华大学"
# 精确模式  精确分词
seg_list = jieba.lcut(seg)
print(seg_list)
# 全模式  找出所有可能的分词结果    冗余性大
seg_list1 = jieba.lcut(seg,cut_all=True)
print(seg_list1)
#  搜索引擎模式
seg_list2 = jieba.lcut_for_search(seg)
print(seg_list2)

例子

text = '小明硕士毕业于中国科学院计算所，后在日本京都大学深造'
seg_list4 = jieba.lcut(text,cut_all=True)
print(seg_list4)
#  搜索引擎模式  先执行精确模式，在对其中的长词进行处理
seg_list5 = jieba.lcut_for_search(text)
print(seg_list5)

三国演义小说分词

import jieba
# 三国演义小说分词
# 读取三国演义小说
with open('./novel/threekingdom.txt','r', encoding='utf-8') as f:
    words = f.read()
    print(len(words)) # 字数  55万
    words_list = jieba.lcut(words)
    print(len(words_list)) # 分词后的词语数  35万
    print(words_list)

四、词云word could

导入词云 WordCloud类

from wordcloud import WordCloud
import jieba
import imageio

绘制词云

 text = 'He was an old man who fished alone in a skiff in the Gulf Stream and he had gone eighty-four days now without taking a fish. In the first forty days a boy had been with him. But after forty days without a fish the boy’s parents had told him that the old man was now definitely and finally salao, which is the worst form of unlucky, and the boy had gone at their orders in another boat which caught three good fish the first week. It made the boy sad to see the old man come in each day with his skiff empty and he always went down to help him carry either the coiled lines or the gaff and harpoon and the sail that was furled around the mast. The sail was patched with flour sacks and, furled, it looked like the flag of permanent defeat.'
 wc = WordCloud().generate(text)
 wc.to_file('老人与海.png')

结果：

三国演义小说词云绘制，以中国地图的形状绘制

# 三国演义小说分词
# 读取三国演义小说
mask = imageio.imread('./china.jpg')
with open('./novel/threekingdom.txt','r', encoding='utf-8') as f:
    words = f.read()
    # print(len(words)) # 字数  55万
    words_list = jieba.lcut(words)
    # print(len(words_list)) # 分词后的词语数  35万
    print(words_list)
    # 将words_list转化成字符串
    novel_words = " ".join(words_list)
    print(novel_words)
    # WordCloud()里面设置参数
    wc = WordCloud(
        font_path='msyh.ttc',
        background_color='white',
        width=800,
        height=600,
        mask=mask
    ).generate(novel_words)
    wc.to_file('三国词云.png')

结果: