数训营第一课笔记:Python基础知识

1.help()和dir()函数

help()函数与dir()函数都是帮助函数:
help()函数能够提供详细的帮助信息,dir()函数仅是简单的罗列可用的方法。

2.基础数据结构

基础数据类型:数值型、布尔型和字符串型。

2.1 数值型数据有整型(int)和浮点型(float)两种。

数值型数据的计算方法:
加 x+y
减 x-y
乘 x*y
除 x/y
幂次方 x**3
加等 x += 2 在x原有值的基础上再加2
减等 x -= 2 在x原有值的基础上减2

2.2 布尔型数据只有两种类型:True 和 False

2.3 字符串类型

字符串类型用单引号或双引号引起,引号内的内容即为字符串类型(str)。

s1 = 'hello world'
    
s2= "hello world"

len(s1) = 11 # 字符串计数包含空格

long_str = '     I am a teacher.     '

# 去掉字符串左右两边的空格
long_str.strip() -> 'I am a teacher.'

# 去掉字符串左边的空格
long_str.lstrip() -> 'I am a teacher.    '

# 去掉字符串右边的空格
long_str.rstrip() -> '     I am a teacher.'

# 将字符串中的teacher替换为student
long_str.strip().replace('teacher', 'student') 
->I am a student.

num_str = '123456'
num_str.isdigit() # 判断变量是否为数值型变量

字符串切片

str = 'hello'
# str    01234
# str    -5-4-3-2-1
str[1:4] -> 'ell' # 序数从0开始,右区间为开区间
str[1:] -> 'ello'
str[:3] -> 'hel'

# 逆序数
s[-5:] -> 'hello'
s[-4:-1] -> 'ell'

格式化输出

num_s = 100
num_t = 3
test_str = 'hello'
text = 'there are %d students in the classroom and %s' %(num_s, test_str)
text
-> 'there are 100 students in the classroom and hello'
# %d格式化输出数字,%s格式化输出字符串, 括号内的参数按语句中对应的顺序排列。
s = 'hello world hello bigdata hello China'

s.split(' ')

-> ['hello', 'world', 'hello', 'bigdata', 'hello', 'China']
# 以空格作为分隔符将文本拆分为列表

3.判断语句

3.1 if判断

score = 59
if score > 90:
    print 'very good.'
elif score > 85:
    print 'good.'
elif socre > 70:
    print 'just so so.'
else:
    print 'not so good'

# if--elif--else
# 每个判断语句写完后记得加冒号":"

3.2 逻辑操作:与(and)或(or)非(not)

A = True
B = False

A and B = False
A or B = True
(not A) or B = False

4.容器

4.1 列表/list

string_list = ['this', 'is', 'a', 'string']

len(string_list) = 4 # len()函数计算列表中元素的个数

string_list[1:3] -> ['is', 'a'] # 列表的切片,同字符串的切片操作类似

列表中的元素没有类型限制,不同数据类型可以添加到同一个列表中。

mass = ['this', 'is', 'good', 3.14, 10]

# 用for循环输出list元素的数据类型
for item in mass:
    print type(item)

# 用索引号index输出个性化结果
for index in range(5)
    if index % 2 == 0:  # 索引号为偶数
        print mass[index]

# 用while循环(注重于结束的条件)
index = 0
while index < 2:
    print mass[index]
    index += 1

append与extend的区别

append可将任何对象添加到list中,甚至包括list。
extend只会将list中的元素添加进去。

sort与sorted的区别

sort()函数改变列表本身的顺序
sorted()函数不改变列表本身的顺序

高级排序

num_list = [1, 2, 3, 4, 5, 6, 7]
print sorted(num_list, reverse = True) # 逆序排列
->[7, 6, 5, 4, 3, 2, 1]

a = ['aa', 'bbbbb', 'ccc', 'dddd']
print sorted(a, key = len) # 按字符串长度排列
->['bbbbb', 'dddd', 'ccc', 'aa']

4.2 字典/dict

字典的查找速度较列表要快很多,原因是字典采用哈希算法(hash),即一个key对应一个value,使用花括号"{}"表示。
Dict = {key1: value1, key2: value2, key3: value3}

pets = {'dogs':3, 'cats':2, 'birds':4}
    print pets['dogs'] # 查找键值时使用中括号"[]"
->3

if 'cats' in pets:
    print 'I have ' + str(pets['cats']) +'cats.' # 只有字符串才能用"+"号连接,所以pets['cats']返回的值必须用str()函数转换为字符串。
->I have 2 cats. 

# for循环遍历字典
for pet in pets:
    print 'I have ' + str(pets[pet]) + pet
-> I have 3 dogs
     I have 2 cats
     I have 4 birds

# 只想取出key
pets.keys() # 会得到由键值组成的列表对象

sum(pets.keys()) # 会得到列表中所有数字的加总和

# 从字典中成对取出数据
for (pet, num) in pets.items(): # 字典中的每一个元素都是一对键值对。
    print pet, '=' , num
->dogs = 3
    cats = 2
    birds = 4

# 字典添加新的键值对
pets['ducks'] = 5

# 字典删除键值对
del pets['ducks']

4.3 文件的读写

in_file = 'shanghai.txt'
for line in open(in_file):
    print line.strip().splite(" ")

# 使用"for line in open(file):"这种方式打开的文件不需要关闭句柄。
# strip()函数去除了每个段落前后的空格
# splite(" ")函数将每个段落中的单词以空格作为分隔符拆分为单个的列表元素。
#最后的拆分结果,每个段落组成一个列表,每个段落中的单词成为对应列表中的一个元素

4.4 统计文件中每个单词出现的频次

# 选用字典作为容器

words_count = {} # 创建一个空字典
for line in open('shanghai.txt'):
    words = line.strip().splite(" ") # 对文本做处理,去掉段落前后的空格,并以空格作为分隔符拆分段落中的单词,构建列表。
    for word in words:
        if word in words_count:
            words_count[word] += 1 # 如果字典中存在该单词,对应的值+1
        else:
            words_count[word] = 1 # 如果字典中不存在该单词,在字典中添加一对新的键值对。
            
#字典里存储的是词和词频
for word in words_count:
    print word, words_count[word] # 使用for循环遍历并输出字典中的单词和词频

4.5 定义函数

定义函数要用下面的形式:

def  函数名(函数参数):
    函数内容

例如:

def add_num(x,y):
    return x+y
add_num(3, 4)
->7

def my_func(list_x):
    new_list = []
    for item in list_x:
        new_list.append(item**3)
    return new_list
my_test = [1, 2, 3, 4, 5]
my_func(my_test)
->[1, 8, 27, 64, 125]

# 定义函数自动读取文件并输出文件中的单词和词频
def count_words(in_file, out_file):
    words_count = {}
    # 对每一行去前后两端的空格,用单词间的空格作为分隔符分拆单词,采用字典记录
    for line in open(in_file):
        for word in line.strip().rstrip('.').splite(" "):
            if word in words_count:
                words_count[word] += 1
            else:
                words_count[word] = 1
    # 打开文件并写入结果
    out = open(out_file, 'w') # 'w' 代表 'w'riting,这种打开文件的方式最后需要关闭句柄。
    for word in words_count:
        out.write(word + "#" + str(words_count[word]) + "\n") # 将单词和词频用一定的格式写入文件
        out.close # 关闭句柄

# 调用函数
count_words('shanghai.txt', 'words_count.txt')

4.6 list comprehension

当需要对于列表中的每一个元素做相同的操作时,可以采用list comprehension方法。
[需要对item做的操作 for item in list (可选部分:对item的限制条件)]

test_list = [1, 2, 3, 4]

[item**3 for item in test_list]
->[1, 8, 27, 64]

['num_' + str(item) for item in test_list]
->['num_1', 'num_2', 'num_3', 'num_4']

[item**3 for item in test_list if item % 2 == 0] # 对列表中为偶数的元素做立方处理,并输出新的列表
->[8, 64]

[item**4 for item in test_list if item % 2 == 0 and item > 3] # 对列表中为偶数且大于3的元素乘4次方,并输出新的列表。
->[256]
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容