Series结构

在Pandas中有除了主要的DataFrame结构外还有个Series结构

在DataFrame中一行或者一列就是Series结构

titanic = pd.read_csv("E:/Anaconda/MachineLearningData/Titanic/test.csv")   #获取数据集

titanic_age = titanic["Age"]

print (type(titanic_age))

结果

从结果中可以看到titanic_age是一个Series类型

再进行以下操作

titanic_age_value = titanic_age.values

print type(titanic_age_value)

结果

可以看到pandas中的titanic_age.values返回的是一个numpy中的ndarray结构。


用Series()构造函数来创建新的series类型的变量:

ndarray_age = titanic_age.values    #获取特征age的ndarray值

ndarray_name = titanic["Name"].values    #获取特征name的ndarray值

#Series()中前一个参数为特征,参数index作为序号,在这里名字作为了序号,

series_custon = Series(ndarray_age,index=ndarray_name)   

print type(series_custon)

print series_custon

新定义了index后依旧可以用原来的0 1 2 等数字来进行索引

结果

DataFrame类型也可以重新定义index:

来自API文档

若新定义的index为String时也可以对其进行切片造作

df.loc["string1":"string2"]


输出这两个名字的人的年龄:

print series_custon[['Kelly, Mr. James','Wilkes, Mrs. James (Ellen Needs)']]  #按名字索引

print series_custon[0:3]   #按序号索引

结果

从结果可以看到是序号(名字)和特征值一起得到

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容