20-SparkSQL01

Spark SQL

IOE

SQL:schema + file

select ... from xxx where.....

SQL on Hadoop

Hive

Impala

Presto

Shark

Drill

Phoenix

Spark SQL

Hive on Spark

MapReduce

Tez

Spark

Spark API

SQL

DataFrame/Dataset

start-thriftserver.sh

Spark SQL is not about SQL

Spark SQL is about more then SQL

===>

ETL  : DataSource API 

V1

V2

Frontend

Catalyst Spark SQL的核心

Backend

create table dept(

deptno int, dname string, loc string

)row format delimited fields terminated by '\t';

load data local inpath '/home/hadoop/data/dept.txt' overwrite into table dept;

select e.empno,e.ename,d.dname from emp e join dept d on e.deptno=d.deptno;

create tablerpgone_test(key string,value string);

explain extended select a.key*(5+6), b.value 

from ruoze_test a join ruoze_test b

on a.key=b.key and a.key>10; 

大数据数据最简单的方式就是:忽略它

thriftserver和spark-sql或者spark-shell的区别在哪?

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容