从去年(2017)起,由于工作涉及到OCR的项目, 以及销售预测,采购和库存优化。开始接触相关新知识。
之后,主导公司业务流程自动化的实施,涉及到其它一些新的技术。
现罗列如下新技术和新知识:
1. tesseract OCR - pytesseract, Pdfminer, python pandas.
2. OpenCV
3. Apache Zeppelin,
4. 预测相关的算法: traditional: EWMA, ARIMA. Deep Learning: RNN-LSTM
5. HDP/HDFS, HIVE, HAWQ, SPARK/Scala
6. NiFi/HDF
7. Metabase(BI tool)
8. Python Flask Service Framework
9. NLP
10.TensorFlow
11. PaddlePaddle
我觉得有必要把近一年以来做的事情和一些干货做一个总结,希望也能做些思路梳理的工作。
接下来,我会结合所做的项目和实际的一些例子来展开!
2018-06-05