前阵子和导师聊到我喜欢数据挖掘的资料,说来惭愧,还没有真正开始学习,今天开始记录自己学到的喜欢的东西
机器学习和数据挖掘的区别最开始没想明白,现在看到:
- 机器学习关注从训练数据中学到已知属性进行预测
数据挖掘侧重从数据中发现未知属性
相比之下还是对数据挖掘更感兴趣。
数据挖掘是一个用烂了的词,现在只要适合在处理数据都管自己叫数据挖掘,顺着自己的行业方向,学习到的第一个数据挖掘资料是关于运维可视化
运维可视化的就是使用现有的elk套件,去挖掘日志,可视化展示。
作者的文章并没有太多高明的地方,只是给出了以下ip访问的热点图,提出了分析的三个步骤:拿到数据,统计,精细化分析。
不过,作者最后的思路很有启发性:运维工程师不应该太过局限了,运维掌握了太多的资源。
这篇运维可视化的文章发布在紫数上,意外找到了一个很好地数据分析网站:紫数:http://www.zishu010.com/z/report.html
意外找到了上周末参加容器大会的全部ppt:
http://pan.baidu.com/s/1i4nN2Qh
csdn推出了知识图谱,可以使学习更系统化,说白了,一切以降低学习成本为目的:
http://lib.csdn.net/
并没有找到数据挖掘的知识路线图,比较遗憾,不过发现数据可视化是一个很有意思的方向。