240 发简信
IP属地:北京
  • pyspark进阶版-分类问题实战

    看到了一篇不错的实战文章,link: https://docs.microsoft.com/en-us/azure/machine-learni...

  • 写给小白的pySpark入门

    1. 创建键值对RDD ( Pair RDD) RDD中可以包含任何类型的对象。其中,键值对是一种比较常见的RDD元素类型,在分组和聚合中经常会...

  • Resize,w 360,h 240
    如何利用SAS EM建立决策树?【14.1版本】

    背景:利用SAS EM建立决策树,制定差异化的运营策略。 前期准备:在SAS中准备好数据集,对缺失值进行预设和处理,设定目标变量,导入SAS E...

  • Resize,w 360,h 240
    【统计学习方法读书笔记与算法实现】2-KNN算法

    KNN算法的基本思路: 给定一个训练数据集,对于新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把这个输...

  • Resize,w 360,h 240
  • 如何在SAS中利用数据的分位数等统计量实现自动分组?

    背景:有时我们要观察各个分数区间的用户,在各个特征上的表现有无差异。在进行分组时,除了使用PROC FORMAT手工定义区间之外,也可以使用PR...