[2015年技术沙龙分享]
中小企业应如何做
我们不是BAT,不是大公司,没有雄厚的实力,没有大量的数据,我们应如何巧借力,让大数据在企业落地,我们如何应用大数据技术,充分发挥数据的价值?
两点建议:
- 思维的转变
- 打造自己的“小”大数据系统
思维的转变
理解大数据的特点
(1)大量:互联网时代,社交网络、电子商务与移动通信把人类带入了一个以“PB”为单位的新时代;
(2)多样:传统的结构化数据以及互联网多样的非结构化数据;
(3)高速:及时把握市场动态,并能快速制定出适当的运营策略,成为企业提高竞争力的关键,所以数据采集、应用和处理需要快速响应;
(4)价值:价值密度低,价值稀疏,挖掘有用信息可谓“大海捞针”。
认识云计算的发展
(1)软硬件技术的变革;
(2)存储廉价、光纤、虚拟化软件等;
(3)互联网的发展和随之而来的大规模数据;
(4)更多的中小企业应更专注于自身业务的发展。
知道数据的重要性
(1)重视数据的作用
认识到现在这个时代靠个人经验和能力已经难以进行实时决策,我们必须借助数据的力量,让数据帮助判断和预测
(2)知道管理和积累数据
利用数据思维来管理及分析自己的一些日常工作、客户、产品等数据,可以利用一些巨头公司 提供的和自身企业相关的数据服务
设计数据的应用目标和价值衡量
利用数据创造商业价值, 以数据说话,重视数据,决策依赖于真实的数据
有了大数据的思维或者说意识之后,相信会让我们彻底摆脱以往的个人经验,一切以数据说话,以数据决策,以数据创新,以数据驱动业务的发展,更好的服务于客户。
打造自己的“小”大数据系统
面临的困难
- 没有财力、物力
- 没有技术团队(开发、运维、运营)
- 没有数据
没有数据,其实更多的是不重视数据,个人认为数据无处不在,如果我们是做SAAS服务的,通过用户的访问日志数据便可轻松了解用户的体验、甚至来源分类,建立初步的用户画像,再比如公司的日常管理、员工日常工作方面的数据,这些数据都可以指导我们如何更高的提升员工工作效率、管理过程中的问题。
技术上怎么做?
(1)分析自己的业务需求特征
- 数据类型,是结构化、半结构化还是非结构化为主;
- 数据大小,内部数据级别是GB级别、TB级别或者PB以上的级别;
- 读写量级,比如每小时写入的数据达到GB级别,或者每天写入达到TB级别等;
- 读写比例,是写为主还是以读为主;
- 并发数,大致的每秒并发数;
- 一致性,只接受强一致性还是可以接受最终一致性和弱一致性;
- 延迟度,最高能容忍的延迟度是多少,是毫秒还是秒或者更延迟;
- 分析的复杂度,需不需要引入较复杂的数据挖掘算法等。
以上这些都会充分影响我们的大数据系统建设成本。
(2)要有选择性使用开源工具和技术,不要闭门造车 - 要学会借力,不是从头开始构建,云计算快速发展,阿里云、百度云、腾讯云等有提供了有力的云计算、大数据技术的基础,帮助我们专注于业务的构建,而非基础的搭建。
- 不要走大而全的通用性平台路线
应以具体的应用和场景为主,因为建一个平台有很多附加的成本和设计,我们要做的就是要能产生价值的事情 - 找一个快速体现价值的业务点
最好是找到一个技术难度小,并且有一定的商业价值的场景来做大数据[注]技术落地的试点,并不断地进行测试和迭代来验证,而不是一味求复杂、求大,这样比较容易说服企业管理层来进行长期的投入和支持;
每一层都要学会借力
总结
- 以业务驱动技术
- 要学会借力
- 格局要“大”,入手要“小”
- 快速迭代、验证