1、linux系统操作
2.随机森林、GBDT、SVM、LR等算法原理和基础理论
3.熟练使用SQL
4.OpenCV算法库
5.分类、聚类、关联分析、预测等(LR/CART/SVM/NN/Bayesian/PCA/LDA/CNN/RNN/LSTM/Word2Vex/HMM/Maxent/CRF)
6.熟悉深度神经网络RBM/CNN/DBN/Sparsecoding/RNN
7.对Caffe/Theano/ConvNet/MXNet/tensorflow等有实践经验
8.熟悉大规模并行计算的基本原理并具有实现并行计算算法的基本能力
9.熟悉主流大数据资源管理框架及分布式计算引擎,Hadoop/Spark/yarn/mesos/kubernetes/Hive等架构
10.熟悉分布式、高性能计算系统