1. Excel文件的载入:pd.read_excel()
pandas.read_excel(io, sheet_name=0, header=0, names=None,
index_col=None, usecols=None, squeeze=False, dtype=None,
engine=None, converters=None, true_values=None, false_values=None,
skiprows=None, nrows=None, na_values=None, parse_dates=False,
date_parser=None, thousands=None, comment=None, skipfooter=0,
convert_float=True, **kwds)
- io:读取文件的目录,比如'excel_name.xlsx'
- sheet_name:指定读取文件的哪个sheet
- 默认值为0,表示读取文件的第一个sheet
- 1,表示读取文件的第二个sheet
- 'Sheet1',表示读取名为Sheet1的sheet
- [0,1,'Sheet5'],表示读取文件的第一个、第二个以及名为Sheet5的 sheet
- None,表示读取所有sheet
- header
- 默认值为0,表示将第一行作为列名
- None,表示源数据没有标题
- names
- 默认值为None,但是当你的源数据没有标题时(header =None),你可以使用此参数设定列名
- index_col
- usecols
- 指定读取哪些列,默认为None,表示读取所有列
- [0,1,2],表示读取一、二、三 列
- ['column_name1','column_name2'],表示读取列名为column_name1、column_name2的列
2. Excel文件的存储:Dataframe.to_excel()
DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
float_format=None, columns=None, header=True,
index=True, index_label=None, startrow=0, startcol=0,
engine=None, merge_cells=True, encoding=None,
inf_rep='inf', verbose=True, freeze_panes=None)
- excel_writer
- 表示存放的路径,举例:df.to_excel('excel_name.xlsx')
- Sheet_name
- na_rep
-表示将缺失值导出为何值,默认空白即 ' '
- columns
- header
- 指定作为列名的行,默认为0,即第一行为列名,若数据没有列名,则为None
- index
- 表示是否将索引输出到Excel文件中去,默认为True,False表示不输出
- index_label
3. csv文件的载入:pd.read_csv()
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None,
header='infer', names=None, index_col=None,
usecols=None, squeeze=False, prefix=None,
mangle_dupe_cols=True, dtype=None, engine=None,
converters=None, true_values=None,
false_values=None, skipinitialspace=False,
skiprows=None, nrows=None, na_values=None,
keep_default_na=True, na_filter=True, verbose=False,
skip_blank_lines=True, parse_dates=False,
infer_datetime_format=False, keep_date_col=False,
date_parser=None, dayfirst=False, iterator=False,
chunksize=None, compression='infer',
thousands=None, decimal=b'.', lineterminator=None,
quotechar='"', quoting=0, escapechar=None,
comment=None, encoding=None, dialect=None,
tupleize_cols=None, error_bad_lines=True,
warn_bad_lines=True, skipfooter=0, doublequote=True,
delim_whitespace=False, low_memory=True,
memory_map=False, float_precision=None)
- filepath_or_buffer
- sep
- header
- names
- index_col
- usecols
4. csv文件的存储
DataFrame.to_csv(path_or_buf=None, sep=', ', na_rep='',
float_format=None, columns=None, header=True,
index=True, index_label=None, mode='w',
encoding=None, compression=None, quoting=None,
quotechar='"', line_terminator='\n', chunksize=None,
tupleize_cols=None, date_format=None,
doublequote=True, escapechar=None, decimal='.'
- path_or_buf
- sep
- na_rep
- columns
- header
- index
- index_label
- encoding