一、数据类型
1、变量名:
命名规则:(1)由大小写字母,下划线组成,首字母不能是数字和下划线
(2)大小写敏感,变量a和变量A是不同的变量
(3)变量名不能是Python中的保留字,如class,def,continue
等
2、数据类型:
(1)逻辑型,即布尔型,只有0和1,True和False;(2)数值型:实数、包括负数、0、正数;(3)字符型:所有可定义的字符,使用' '," ",''' '''
单引号,双引号,三引号包含起来。字符串前面加上r,表示字符串是原始的字符串,不需要使用转义字符,使用 '''... '''
可以在字符串中输入多行字符。
3、运算规则:
(1)&(与),|(或),not(非)
,用于逻辑型数据类型的运算;(2)加减乘除,(+ , - , * , /)
用于数值型数据类型的运算
取整运算://
,求余运算:%
, 乘方:**
,Decimal对浮点数进行封装运算。
二、数据结构
1、Series系列(列,一维)
存储一列数据以及相应的索引,序列的索引从0开始。
访问:
x[1]
访问序列中的第二个位置的元素。x['second']
可以通过索引来访问,second是x序列中的第二个索引,取出来的元素与x[1]的值一样。不能越界访问
切片:
x[2:4]
,取出序列中第三、四位置的元素。大于等于第一个值,小于第二个值。还可以指定索引位置来获取x[[0,2,1]]
,按照指定索引位置获取元素。
添加元素:
x.append(n)
,n是序列而不是单个元素,不能够添加单个元素。
判断某个值是否在序列中,用'2' in x.values
删除元素:
x.drop(1)
,根据索引删除; x.drop(x.index[2])
,根据位置删除;x['2' != x.values]
,根据值删除,将不是删除的元素保留下来。
2、DataFrame数据框(表,二维)
存储多行和多列的数据集合,索引从0开始。
访问:
按列访问df['age']
,df[['age','name']]
按行访问df[1:2]
,按行索引访问df.loc[['first','second']]
,行列好切片访问 df.iloc['0:1','0:1']
,按行索引,列名访问,df.at['first','name']
修改列名:
`df.columns=['age2', 'name2']`
修改行索引 :
`df.index=range=(1,4)`
删除:
df.drop('first',axis=0)
axis=0是删除行,axis=1是删除列df.drop('age',axis=1)
增加:
添加行df.loc[len(df)] = [24,'Kevin']
,添加列df['newcolumn'] = [2,4,6]