Series结构

在Pandas中有除了主要的DataFrame结构外还有个Series结构

在DataFrame中一行或者一列就是Series结构

titanic = pd.read_csv("E:/Anaconda/MachineLearningData/Titanic/test.csv") #获取数据集

titanic_age = titanic["Age"]

print (type(titanic_age))

结果

从结果中可以看到titanic_age是一个Series类型

再进行以下操作

titanic_age_value = titanic_age.values

print type(titanic_age_value)

结果

可以看到pandas中的titanic_age.values返回的是一个numpy中的ndarray结构。

用Series()构造函数来创建新的series类型的变量：

ndarray_age = titanic_age.values #获取特征age的ndarray值

ndarray_name = titanic["Name"].values #获取特征name的ndarray值

#Series()中前一个参数为特征，参数index作为序号，在这里名字作为了序号，

series_custon = Series(ndarray_age,index=ndarray_name)

print type(series_custon)

print series_custon

新定义了index后依旧可以用原来的0 1 2 等数字来进行索引

结果

DataFrame类型也可以重新定义index:

来自API文档

若新定义的index为String时也可以对其进行切片造作

df.loc["string1":"string2"]

输出这两个名字的人的年龄：

print series_custon[['Kelly, Mr. James','Wilkes, Mrs. James (Ellen Needs)']] #按名字索引

print series_custon[0:3] #按序号索引

结果

从结果可以看到是序号（名字）和特征值一起得到

最后编辑于：2019.03.01 00:05:06

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。