前几章重点讲解了不同类型的数据规整工作流以及NumPy、pandas和其他库的特性。随着时间的推移,pandas为高级用户开发了更具深度的特性。本章将深入讲解几个更高级的特性...
前几章重点讲解了不同类型的数据规整工作流以及NumPy、pandas和其他库的特性。随着时间的推移,pandas为高级用户开发了更具深度的特性。本章将深入讲解几个更高级的特性...
7.2.5 离散化和进行分箱 Discretization and Binning 连续数据常常被离散化或被分成“箱”(bin)进行分析。假设你有一项研究中一组人的数据,而且...
翻译原因 买了官方第2版徐敬一翻译的纸质书,翻译水平让我想骂人,尤其是“第11章 时间序列”简直让人摸不着头脑。另外,原版英文书中也有些许错误,不方便理解,特自行修订翻译第1...
之前为了插入代码,看了好几篇简书,感觉不择要领,方法其实很简单,在这里记录并分享! 1.选择MarkDomn编辑器 简书有两种编辑器,缺省的是富文本编辑器,还有一种是Mark...
11.6节中的降采样有错误
“传入的频率将会以“5分钟”的增量定义面元边界。默认情况下,面元的右边界是包含的,因此00:00到00:05的区间中是包含00:05的。传入closed='left'会让区间以左边界闭合:”
默认情况应该是包含面元的左边界,因此00:00到00:05的区间是包含00:00.
原文是:The frequency you pass defines bin edges in five-minute increments. By default,
the let bin edge is inclusive, so the 00:00 value is included in the 00:00 to 00:05
interval. Passing closed='right' changes the interval to be closed on the right:
第1章 准备工作[https://www.jianshu.com/p/04d180d90a3f]第2章 Python语法基础,IPython和Jupyter[https://...