240 发简信
IP属地:上海
  • Resize,w 360,h 240
    从零开始AB测试

    1. AB测试简介 1.1 什么是AB测试 A/B测试[https://zh.wikipedia.org/wiki/A/B%E6%B8%AC%...

  • Resize,w 360,h 240
    正则表达式教程

    1. 简介 正则表达式[https://zh.wikipedia.org/wiki/%E6%AD%A3%E5%88%99%E8%A1%A8%E8...

  • Hive SQL - 复制最后一个非空值 The Last non-NULL Puzzle

    1. 启发 在业务上,我们常常会碰到这样的需求例如原始表如下: uidstatetimea10anull1anull2a33bnull4b25b...

  • Resize,w 360,h 240
    机器学习[1.1] - Mann-Whitney U Test与ROC、AUC

    在了解U统计量与AUC之间的关系前,先复习一下Mann-Whitney U Test首先放上AUC在统计上的意义: 随机选取一个正例和一个负例,...

  • Resize,w 360,h 240
    机器学习[3] - 监督模型之树模型

    1. 基本概念 决策树模型为非参数监督模型,该模型为根据一系列的if-else逻辑组合而成。树可以看作是一个分段函数,并且树的层数越深,就会更贴...

  • 机器学习[1] - 模型评估与选择

    评估方法 留出法 Hold-out“留出法”将两个数据集拆分为两个互斥的集,一般训练集为70%,测试集为30%。这样使用测试集得出的测试误差(t...

  • Resize,w 360,h 240
    机器学习[2] - 监督模型之线性模型

    关于机器学习整体的概念,例如监督模型与无监督模型的概念,见笔者的之前的一篇文章机器学习入门[https://www.jianshu.com/p/...

  • plydata包 - Python中的dplyr Pipe(管道)数据处理方式

    Hassan Kibirige[https://github.com/has2k1]开发的plydata[https://github.com/...

  • Resize,w 360,h 240
    Python数据分析[4] - 数据整理 Data Wrangling

    多维Index Columns和Rows都可以创建多层Index 每层的index也可以拥有自己的名字 Index排序 根据Level聚合 表连...

个人介绍
个人主页见 lifanyiran.com
喜欢哲学和唱歌的数据分析师