df.read_xxx
df.dtype
df.loc[row0:row1] #标签定位,包含始末
df.iloc[m:n] #位置定位,不含末位
df.loc[:,column0:column1] #缺省行索引的值即为列
df.iloc[:,m:n] #缺省行索引的值即为列
df.loc[row0:row1,column0:column1]
df.iloc[m:n,m:n]
df.loc[row0,column0:column1] #行降维
df.loc[row0,column0] #行列降维
df.iloc[m,m:n] #行降维
df.iloc[m,m] #行列降维
- 以上行列选择和降维,另有切片[ ],at等处理方式
- 筛选
df.loc[cloumn > n] #cloumn通过loc或iloc选择
df.loc[cloumn.isin(list1)] #list1 = [m,n,...]
df.loc['yyyy-mm-dd':'yyyy-mm-dd'] #日期筛选
df.loc[condition1 & condition2 & ...] #多条件筛选'AND'
df.loc[condition1 | condition2 & ...] #多条件筛选'OR'
df.set_index(cloumn) #设置某列为索引
df.set_index(drop = True) #取消索引
df.shape[0] #获取行数
df.shape[1] #获取列数
df.drop_duplicates('column0') #标签定位
df.loc[column.duplicates() == False] #位置定位
df.sort_index() #排序
df.sort_values() #排序
df.sort_values([column0,column1], ascending=[False,True]) #多条件排序
df.loc[:,'column_date'] = pd.to_datetime(s.loc[:,'column_date']) #将'column_date'列变为日期时间格式
df.rename(index = {}, columns = {}) #重命名index和column