黑猴子的家:sample 随机抽样

1、Code

val samplerdd = sc.makeRDD(Array(
     "spark1","spark2","spark3","spark4","spark5",
     "hadoop1","hadoop2","hadoop3","java4","java5"
))

samplerdd.sample(false,0.3).foreach(println)

2、结果

spark4
hadoop2
java5

3、sample

sample(withReplacement:Boolean,fraction:Double,seed:Long)
            withReplacement  是否放回抽样
                   true 代表如果抽中A元素,之后还可以抽取A元素
                   false 代表如果抽中A元素,之后不可以抽取A元素
             fraction  抽样比例
             seed  抽样算法的初始化值
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前言 最先接触编程的知识是在大学里面,大学里面学了一些基础的知识,c语言,java语言,单片机的汇编语言等;大学毕...
    oceanfive阅读 3,151评论 0 7
  • error code(错误代码)=0是操作成功完成。error code(错误代码)=1是功能错误。error c...
    Heikki_阅读 3,457评论 1 9
  • 首页 资讯 文章 资源 小组 相亲 登录 注册 首页 最新文章 IT 职场 前端 后端 移动端 数据库 运维 其他...
    Helen_Cat阅读 3,931评论 1 10
  • 清风摇醒了红叶的梦 红叶生气了 唦唦地嗔斥 轻飘飘地追赶着清风 却安静地投入大地的怀抱 呵 好一个多情的秋
    啊那个胖子阅读 119评论 0 0
  • 近期,大部分的荷花已经进入盛花期,今年多长势喜人,满池的荷花已经亭亭玉立,白的粉的,单瓣的重瓣的,各种姿...
    傲气菇凉阅读 615评论 6 15