提起“大数据”这个词,很多人第一印象可能是:高科技、遥不可及。但是,我们生活中,很多传统的数据服务已经或多或少地被大数据所赋能,通过不同的形式走进了我们生活。
因为从业于大数据相关领域,所以对身边数据服务的变化非常敏感,而近年来也的确颇为深刻地感受到了身边数据服务形式的变迁,以及带给我们生活的变化。数据服务的形式经历了:结果型数据服务、灵活型数据服务、个性化数据服务,未来也必将发展为智能化数据服务。下面就以我们看天气预报为例。展示三十年来数据怎样一步步改变我们的生活方式。
一、结果型数据服务
还记得我们90后这一代小的时候,每天晚上七点半新闻联播之后,家人们会准时蹲守在电视机前看天气预报,甚至哪天不看天气预报,总感觉生活少了点什么。而因为央视的天气预报不可能将全国所有地区的天气都报道出来,只能报道一些省会城市的天气。所以,如果你待在一个小县城里,就只能看距你最近的城市的天气。这个准确度可想而知。
其实国家气象局在每个地区都有气象观测站。也就是说,每天全国所有的气象数据都是有的,但是受限于数据传输的限制。普通大众获取这些数据其实是有时间和地点限制的。
这就属于结果型数据服务。这些数据中心化极高。数据由权威人士加工,不能精确地满足每个人的需求,普通大众只能学会适应这些数据。
二、灵活型数据服务
进入PC互联网时代,当人们想知道天气时,更多人选择打开网页,输入当前城市以及天气预报的关键词来获取当前城市的天气信息,每天准点去电视前看天气预报的人越来越少。你可以根据你的搜索、条件筛选等方式主动获取数据,网页根据不同人的需求来展现不同的结果。
这就是PC时代典型的灵活型数据服务方式,这种服务方式破除了空间的限制。做到了半定制化甚至全定制化。可以从你想看的各种维度展示数据。
目前商业上也在努力推动这种灵活的数据化服务,BI(商业数据)服务平台也如雨后春笋般冒了出来。他们可以提供海量数据实时在线分析服务,通过拖拽式的操作完成一些简单的数据分析、业务数据探查、报表制作等工作。比如微软的Power BI,阿里的Quick BI等。
三、个性化数据服务
现在的人们获取天气预报就更简单了,移动互联网时代刚兴起那会儿,红极一时的天气预报软件:“墨迹天气”就是个典型的例子。时至今日,我们甚至不用下载多余的app,任何一个智能手机的主页面都会根据你的位置信息展示当前城市的天气。
这就是个性化的数据服务,你的设备可以自动根据你当前的状态,来帮你从海量的数据中筛选出来可能对你有用的数据。类似这样的数据服务已经铺开,悄悄走入每个人的生活。比如现在打开饿了么、美团等外卖软件,软件已经根据你的位置将周围的外卖商家展示出来供你随意挑选。如果你在北京,绝不会展示出上海的外卖商家来浪费你的挑选时间。甚至如果你在朝阳区,就不可能给你展示大兴区的美食商家。
四、智能化数据服务
未来获取天气预报的形式我们不得而知,但是可以肯定的是,天气预报数据也会变得越来越懂你。不仅仅是在明天有暴雨的时候提醒你出门带伞,降温的时候提醒你多穿衣物。可能结合其他维度的数据或者智能化设备提供更加个性化的服务。比如根据当前温度、空气污染指数湿度等状况自动开窗通风,打开空调等,让你无感地享受数据带来的服务。
通过天气预报这个例子你有没有发现一个规律:天气数据三十年来一直在那里,不来不去,而其之所以能够越来越好地服务我们的生活,很大程度上取决于数据传播的效率、范围、以及与其他数据(地理位置)的结合。
数据放在那里只是一堆杂乱的编码,但是用起来就是无价之宝。
智能化的数据服务就是以数据为驱动的模式。充分发挥数据的作用,让数据形成一个闭环,让产品更智能、更懂你,而且不断自我进化。这才是真正的大数据,也是目前无数机器学习算法工程师和数据分析师努力探索的方向。
现在的很多APP以及具备了一定这种能力。抖音正是基于智能推荐算法,让无数用户刷视频成瘾。还有淘宝的个性化推荐,根据你的点击自动推荐商品,提高你的购买欲望。
五、再谈数据
回顾当前的疫情,数据对疫情防控也做了很大的贡献。单靠人力是没有办法掌控全国这么多人的行程的。而且单靠人们的主动申报,由于记忆偏差,或者因为各种原因谎报,是没有办法做到精确防控的,目前盛行的健康码根据你的铁路行程、手机基站信号来获取你是否接触过确诊人员的信息。虽然现在这些形形色色的健康码目前做得还不是很完善,给大家带来很多困扰。但是的确一定程度上减轻了基层人员的防控压力。
目前,各大公司也开始注重自己数据资产的建设。2020年3月发布的《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》文件中,首次将“数据”作为一种新型生产要素,与土地、劳动力、资本、技术等其他传统要素相提并论。为什么国家对数据的重视?因为其确实能够产生不小的价值。
如果银行能够分析出更愿意办信用卡的用户群体画像数据,那么在设计信用卡产品的时候,可以把有限的资金预算投入更吸引目标用户的权益中,节省推销卡的成本。比如,如果你的目标用户更喜欢看电影,那么就可以跟电影院合作,推出每月六元看电影权益,那么会有更多用户喜欢办理和使用你的信用卡。
如果电商平台能够从用户的购物行为数据中分析出购物偏好,那么会给用户推荐适合你的产品。增加电商的营收。
当然,用数据之前收效要先梳理好数据。对于企业,政府来说,一方面是尽可能地搜集和梳理业务用到的数据,搭建基础的数据平台供员工方便地提取和使用数据,甚至可以与其他公司协商互相引入多维度的数据。另一方面,就是培养能够用数据,懂数据的人才,让手里的数据发挥出更大的价值。这对一些毕业生们来说也是一个不小的机会。
大数据的时代进程无法避免。但还是希望各大公司在合理使用这些数据的同时,做好对用户数据隐私的保护。因为,每个人都渴望获得更好的数据服务,但绝对不是以自己被裸奔作为代价。