DataFrame的常用操作

Java版本

​//打印DataFrame中所有的数据(select * from ...)
​​df.show();

​​//打印DataFrame的元数据(schema)
​​df.printSchema();

//查询某列所有数据
​​df.select("name").show();

//查询某几个列所有数据并对列进行计算
​​df.select(df.col("name"),df.col("age").plus(1)).show();

//过滤
​​df.filter(df.col("age").gt(18)).show();

//按照组进行统计
df.groupBy(df.col("age")).count().show();

Scala版本

df.select("name").show() 

df.select(df("name"), df("age") + 1).show() 

df.filter(df("age") > 21).show() 

df.groupBy("age").count().show() 
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容