本人工作五年,现在每天都在使用sql,虽然是开发出身,但是之前用的并不多,现在作为数据pm,讲一下这两年使用sql或者说hql的心得。
现在的企业中,作为数据产品通常使用的是hql,也就是大家说的hive,和sql语言相似度极高,除一些函数使用外并无大的差别,所以说学好sql就可以。
首先,在使用前,你应该要了解清楚你要查询的表之间的关系,一对一、多对一、多对多,也就是要数据数据,逻辑关系搞清楚了,你才能保证sql语言写的是正确无误的,否则就算可以执行出来,语法没有问题,但是逻辑关系错了你写的sql还是错的。逻辑关系距离: 学生 班主任 校长,学生和班主任的对应关系就是一对一,一个学生只对应一个班主任,班主任对应校长就是多对一,多个班主任对应一个校长。
其次,保证sql语法没有问题,具体可见w3cschool mysql 教程,http://www.w3school.com.cn/sql/index.asp,这里不过多讲述,常用的语句在上面都有,还可以执行简单的测试。
最后,配合excel进行分析,适当的聚合数据。数据量过大,excel处理起来就会吃不消,但是在hive中用函数处理数据便可充分的使用集群的计算能力,得到相应的结果后再用excel进行数据分析才能得心应手。
欢迎大家加我微信沟通:
alien777_