DataFrame

DataFrame

DataFrame表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值,字符串,布尔值)。在DataFrame中,数据被存储为一个以上的二维块。


1.DataFrame创建

pd.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)
• data:创建数组的数据,可为ndarray, dict
• index:指定索引
• dtype:数组数据类型
• copy:是否拷贝

1.data 为 ndarray

# data为ndarray
d1 = pd.DataFrame(np.random.randint(1,100,size=(3,3)))
d1

打印值及行索引和列索引



指定index为名字["mm", "xd", "sm"] 指定columns为课程名["java", "python", "go"]

d2 = pd.DataFrame(np.random.randint(60.100,size=(3,3)),index=["mm", "xd", "sm"], columns=["java", "python", "go"])
d2

2.data为dict

-key:列索引
-index:不指定则为默认
-value:对应为值

# data为dict
# -key:列索引
# -index:不指定则为默认
# -value:对应为值
data = {
        "name": ["mm", "xd", "sm"],
        "age":[18,20,30],
        "lesson":["java", "python", "go"]
        }
d3 = pd.DataFrame(data)
d3

指定列索引



指定的列索引少于字典的键值数据时,以传入的为主



指定的列索引多于字典的键值数据时,以NAN填充

当字典的数据结构完全不一样的时候,确实的不饿分会用NAN填充
image.png

重置索引
如果 重置的索引 与 df中指定的index没有关系 则全部填充NAN
如果重置的索引与 df中指定完全一致 但乱序 则根据重置索引


如果 重置的索引多df中指定的索引,多出的以NAN填充



重置列索引 需要指定columns=



同时指定行列索引
若有不一致的 则填充nan 但可以通过fill_value指定填充

DataFrame基础操作

• df.shape # 查看数组形状,返回值为元组
• df.dtypes # 查看列数据类型
• df.ndim # 数据维度,返回为整数
• df.index # 行索引
• df.columns # 列索引
• df.values # 值
• d.head(n) # 显示头部几行,默认前5行
• d.tail(n) # 显示末尾几行,默认后5行
• d.info() # 相关信息概述



DataFrame查数据(索引与切片)

直接使用索引与标签:


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容