学习计划

今天列下具体的学习计划以及知识点汇总

推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,LSTM,RL

数据挖掘:分类,聚类,回归,降维,特征选择,模型评价

数学:微积分,统计学,线性代数

周边学科:信息论基础

(数学和周边学科可以顺带巩固)

以上是理论知识。

—————————————————————————————————

以下是实践验证或者工程化具备技能:

编程语言:Python/R, Java/C++/C,sql,shell

RPC框架:thrift, Dubbo,gRPC

web服务:tornado, django, flask

数据存储:redis, hbase, cassandra, mongodb, mysql, hdfs,hive, kafka, elasticsearch

机器学习/深度学习:Spark MLib,GraphLab/GraphCHI,Angel,MXNet,TensorFlow,Caffe, Xgboost,VW,libxxx

文本处理:Word2vec,Fasttext,Gensim,NLTK

矩阵分解:Spark ALS,GraphCHI,implicit,qmf,libfm

相似计算:kgraph, annoy,nmslib, GraphCHI, columnSimilarities(spark.RowMatrix)

实时计算:Spark Streaming, Storm,Samza

————————————————————————————

工程中检验标准学习:

熟悉常见离线效果指标:准确率,召回率,AUC,基尼系数

能够定义产品效果指标:点击率,留存率,转换率,观看完整率

会做对比试验并分析实验结果:指标数据可视化

知道常见推荐产品的区别:Feed流推荐,相关推荐,TopN推荐,个性化推送

————————————————————————————————

软实力:

英文阅读;读顶级会议的论文、一流公司和行业前辈的经典论文和技术博客,在Quora和Stack Overflow上和人交流探讨;

代码阅读;能阅读开源代码,从中学习优秀项目对经典算法的实现;

沟通表达;能够和其他岗位的人员沟通交流,讲明白所负责模块的原理和方法,能听懂非技术人员的要求和思维,能分别真需求和伪需求并且能达成一致。

________________________________

所以基本学习思路是:理论基础+开源库(经典算法实现)+效果指标+软实力(需求沟通+分解技术)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容