学习计划

学习计划

今天列下具体的学习计划以及知识点汇总

推荐算法：CF，LR，SVM，FM，FTRL，GBDT，RF，SVD，RBM，RNN，LSTM，RL

数据挖掘：分类，聚类，回归，降维，特征选择，模型评价

数学：微积分，统计学，线性代数

周边学科：信息论基础

（数学和周边学科可以顺带巩固）

以上是理论知识。

—————————————————————————————————

以下是实践验证或者工程化具备技能：

编程语言：Python/R， Java/C++/C，sql，shell

RPC框架：thrift， Dubbo，gRPC

web服务：tornado, django, flask

数据存储：redis, hbase, cassandra, mongodb, mysql, hdfs，hive, kafka, elasticsearch

机器学习/深度学习：Spark MLib，GraphLab/GraphCHI，Angel，MXNet，TensorFlow，Caffe, Xgboost，VW，libxxx

文本处理：Word2vec，Fasttext，Gensim，NLTK

矩阵分解：Spark ALS，GraphCHI，implicit，qmf，libfm

相似计算：kgraph, annoy，nmslib, GraphCHI, columnSimilarities(spark.RowMatrix)

实时计算：Spark Streaming, Storm，Samza

————————————————————————————

工程中检验标准学习：

熟悉常见离线效果指标：准确率，召回率，AUC，基尼系数

能够定义产品效果指标：点击率，留存率，转换率，观看完整率

会做对比试验并分析实验结果：指标数据可视化

知道常见推荐产品的区别：Feed流推荐，相关推荐，TopN推荐，个性化推送

————————————————————————————————

软实力：

英文阅读；读顶级会议的论文、一流公司和行业前辈的经典论文和技术博客，在Quora和Stack Overflow上和人交流探讨；

代码阅读；能阅读开源代码，从中学习优秀项目对经典算法的实现；

沟通表达；能够和其他岗位的人员沟通交流，讲明白所负责模块的原理和方法，能听懂非技术人员的要求和思维，能分别真需求和伪需求并且能达成一致。

________________________________

所以基本学习思路是：理论基础+开源库（经典算法实现）+效果指标+软实力（需求沟通+分解技术）

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。