1. 比rdd更省内存 2. 执行效率更高 3.接口友好,使用方便mark: https://databricks.com/blog/2016/01/04/introducing-apache-spark-datasets.html