用scala实现wordcount的三种方式

声明一个数组

val arr = Array("hello fandf fandf angelbaby yangmi hello")

第一种

arr.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).map(t=>(t._1,t._2.size)).toList.sortBy(_._2).reverse

第二种

arr.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.size)

第三种

arr.flatMap(_.split(" ")).map((_, 1)).groupBy(_._1).mapValues(_.foldLeft(0)(_+_._2))

建议使用第三种,因为前两种都是用的size,但是如果里面的值不是1呢?

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1.需求 统计每个单词出现的字数 2. 读文件 用换行符分割读文件,得到如下内容 3. 用scala实现wordC...
    谁动了MyWorld阅读 5,004评论 0 0
  • Scala的集合类可以从三个维度进行切分: 可变与不可变集合(Immutable and mutable coll...
    时待吾阅读 11,096评论 0 4
  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 13,214评论 0 13
  • 学习之前需要了解几个内容: 1.Scala目前的地位 大数据而生 2.Scala可以做什么 spark底层代码是s...
    任嘉平生愿阅读 2,532评论 0 0
  • 首页 资讯 文章 资源 小组 相亲 登录 注册 首页 最新文章 IT 职场 前端 后端 移动端 数据库 运维 其他...
    Helen_Cat阅读 9,420评论 1 10

友情链接更多精彩内容