pandas中读取csv文件的一些小技巧

前言:

pandas中读取csv文件通常使用pd.read_csv()函数,正常情况下给出文件路径即可读取数据,不过在某些特殊情况下,需要一些小技巧才能读取正确的内容

文本型和浮点数的混淆及处理

在处理股票交割单中遇到一个典型的问题,交割单中的原始数据如下:


image.png
df=pd.read_csv(file_address)

使用默认函数读取数据后并非我们预想的结果,把510300读取成了510300.0,即文本型数据转换成浮点数


image.png

强制某列按照某种类型进行读取,需要调用read_csv中的dtype参数,文档说明如下:
dtype : Type name or dict of column -> type, default None
Data type for data or columns. E.g. {‘a’: np.float64, ‘b’: np.int32} Use str or object together with suitable na_values settings to preserve and not interpret dtype. If converters are specified, they will be applied INSTEAD of dtype conversion.

即添加一个字典型参数,将需要强制转换类型的列和相应的类型标明即可,注意np.int32需要引入相关定义

import numpy as np
df=pd.read_csv(file_address,dtype={'证券代码': np.str})
image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • $$\mathrm{《Python科学计算》学习笔记}$$ [TOC] Numpy 数组入门 数组创建 np.ar...
    篁竹水声阅读 4,059评论 0 0
  • 说明 读取一个CSV 文件 例子 最全的 一个简化版本 参数 filepath_or_buffer : str,p...
    喵_十八阅读 8,078评论 0 0
  • Numpy的组成与功能 Numpy(Numeric Python)可以被理解为一个用python实现的科学计算包,...
    不做大哥好多年阅读 9,872评论 0 10
  • 昏暗的天空渐渐亮了起来,一个少女睁开了朦胧的双眼,光照在了她那美丽的面孔上。她就是:黎若曦。 “妈!我...
    白璃墨阅读 1,865评论 0 1
  • by王雨欣 呃!从何说起呢? 其实在分班以后我都没有妄想过会在课堂上看到你讲课,还会听到你那柔柔的声音,还会听到你...
    莫莫queen阅读 1,885评论 0 0