对于大数据处理命题来说,apache无疑是做得最好的。因此产生一个计划是“全面地”了解apache的每一个项目。全面不是意味着对每一个项目都要深入了解,甚至是源码阅读,更加倾向的是了解该项目的动机,能够完成什么事情即可。自认为这是一件比较大的,持续性的事情,所以必须预先定一些规则:
1、apache 顶级项目优先;最活跃的项目优先;相似动机的项目以最活跃的优先;
2、只需要了解项目动机,可以完成什么事情,活跃度,当前哪些大公司在大规模使用,搭建试运行(增强体感)即可;暂时无需深入到阅读源码的过程;
未来规划
- 能够自己攒一个大数据平台,当然大规模集群可能会有成本,或许可以购买树莓派、回收电信盒子来充当服务器
- 相信未来是数据驱动的世界