Python中pandas的使用(长期更新ing)

索引


读取csv文件的同时设置索引

df = pd.read_csv('test.csv', index_col='mmsi')   # 设置mmsi这一列为索引

给一个pd.DataFrame设置索引,并根据索引读取数据

nodes = pd.read_csv('../../data/BoHaiDataForClassification/global_all_ship_type.csv')
nodes = nodes.set_index('mmsi')

# 索引一个值
print(nodes.loc[100000020]['type_of_shipxy'])
# output: 捕捞

# 索引多个值
print(nodes.loc[[100000020, 100800717], ['type_of_shipxy']])
print(nodes.loc[[100000020, 100800717]]['type_of_shipxy'])
# output
#           type_of_shipxy
# mmsi                    
# 100000020             捕捞
# 100800717             捕捞

print(nodes.loc[[100000020, 100800717]]['type_of_shipxy'].values)
# output: ['捕捞' '捕捞']

增删查改


给pd.DataFrame对象添加一列

df['test_col'] = ['test'] * len(df)

将两个模式相同的DataFrame对象合并成一个

df1 = df1.append(df2)

数据类型


更改数据类型

# 将df的col1和col2两列数据转为int类型
new_df = df[['col1', 'col2']].astype(int)

将数据转成数值类型

df = pd.to_numeric(df)  # lst 只能是类似一维数组的数据
df = df.apply(pd.to_numeric)  # df可以是二维及以上的DataFrame对象

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容