索引
读取csv文件的同时设置索引
df = pd.read_csv('test.csv', index_col='mmsi') # 设置mmsi这一列为索引
给一个pd.DataFrame设置索引,并根据索引读取数据
nodes = pd.read_csv('../../data/BoHaiDataForClassification/global_all_ship_type.csv')
nodes = nodes.set_index('mmsi')
# 索引一个值
print(nodes.loc[100000020]['type_of_shipxy'])
# output: 捕捞
# 索引多个值
print(nodes.loc[[100000020, 100800717], ['type_of_shipxy']])
print(nodes.loc[[100000020, 100800717]]['type_of_shipxy'])
# output
# type_of_shipxy
# mmsi
# 100000020 捕捞
# 100800717 捕捞
print(nodes.loc[[100000020, 100800717]]['type_of_shipxy'].values)
# output: ['捕捞' '捕捞']
增删查改
给pd.DataFrame对象添加一列
df['test_col'] = ['test'] * len(df)
将两个模式相同的DataFrame对象合并成一个
df1 = df1.append(df2)
数据类型
更改数据类型
# 将df的col1和col2两列数据转为int类型
new_df = df[['col1', 'col2']].astype(int)
将数据转成数值类型
df = pd.to_numeric(df) # lst 只能是类似一维数组的数据
df = df.apply(pd.to_numeric) # df可以是二维及以上的DataFrame对象