240 发简信
IP属地:北京
  • pandas 将“字符类型的日期列”转化成“时间戳索引(DatetimeIndex)”

    假设目前已经引入了 pandas,同时也拥有 pandas 的 DataFrame 类型数据。 数据集如下 查看每一列的类型 从结果的第四排可以看见 date 这一列类型是"...

  • 抽样分布基础

    抽样分布与概率分布比较 相同点:都是概率分布 不同点:分类角度不同,常见的概率分布是从分布形态角度出发进行分类的,而抽样分布则是从参数角度进行分类抽样分布一般表现为分布族,随...

  • Pandas数据处理(二):缺失值处理

    引子:大数据下,缺失值处理往往会被数据分析师忽略,比如自己。极端值的处理往往会得到比较多的重视,因为极端值直接改变整体的均值;受限于数据生产链路问题,极端值出现也非常高频。但...

  • Pandas数据处理(一):基础功能了解

    引子:pansas描述性统计可参考前篇https://www.jianshu.com/p/4730784baeb1而pandas在数据处理上,有更多的操作技巧,在此文重新整理...

  • 描述性统计(下篇)——代码参考

    利用pandas实现描述性统计 Python的pandas库已经内置了描述性统计的常用函数,在使用pandas对数据集进行描述性统计时,读取数据后,直接调用函数即可。常用代码如下:

  • 描述性统计(上篇)——概念参考

    集中趋势(central tendency):算数平均数、中位数、众数  如果需要使用平均数,聚合时排除离群值(outlier)是必须的 离散趋势(dispersion te...