Python
- Python中要注意代码的可复用性。能够提取出来的公共部分尽量写成一个函数或者一个类,注意代码之间的耦合性尽量降低;
- join函数用来把list转换成字符串是一个很好的方式,多加应用;
- 构建类似映射的对应关系时,要多应用map函数和lambda函数;
- 加深对不同数据容器和数据结构的理解;例如对于list/tuple/string/set类型要加强理解;对于dataframe和series要加深理解;
- 善于使用type函数,要分清研究的是什么东西,然后再来进一步编写代码;
- 匿名函数的使用会净化代码命名空间,要多使用,精简代码;
hive
- hive中的COALESCE要多熟悉,对于join之后进行列的合并非常有用;同时要与AS连用;
sql
- 对join之后形成的table要加深理解;
- 对去重要加深理解;