输入文件
import pandas as pd
pd.read_excel(io='./data.xls')
pd.read_excel(io='/LH_data_3/worklab/data.xls')
pd.read_excel('/LH_data_3/worklab/data.xls')
io
:可以使用相对或者绝对路径,read_excel
可以读取xls/xlsx格式文件。
读取sheet
pd.read_excel(io='./data.xlsx',sheet_name=1)
pd.read_excel(io='./data.xlsx',sheet_name=None)
sheet_name
:可以指定读取excel的sheet。sheet_name默认值是0,表示读取第一个sheet。可以根据sheet的名字或者位置设置参数。设置sheet_name=None,可以读取全部的sheet,返回字典,key为sheet名字,value为sheet表内容。
读取列名
pd.read_excel(io='./title.xlsx',header=1)
data = pd.read_excel(io='./data.xlsx', sheet_name = 0, header = [0,1])
设置header参数,可以指定目标行的数据为列标签。header默认值是0,表示第0行为列标签。 设置header为i(整数),表示设置i行为列标签,i行之前的数据会被舍弃。header:指定哪几行做列名
默认header为0,如果设置为[0,1],则表示将前两行作为多重索引。
df=pd.read_table(io='./data.xlsx',header=None,names=['queryid','subjectid']
names
:自定义列名
如果缺少列名,可以使用names指定列名字,会替代原来的列表头。
但是要注意的是,长度必须和excel的列大小相同。
设置索引
data = pd.read_excel(io='./data.xlsx', index_col='月份')
data = pd.read_excel(io='./data.xlsx', index_col=0)
index_col
设置索引列。可以是某列的名字
,如index_col=‘月份’;也可以是整型数字或列表,如index_col=0或index_col=[0,1]