最近几年一直在说大数据,我最近研究了一下区块链,我认为,真正的大数据或许会在区块链时代达到不一样的高度。
区块链有几个广为人知的特性:去中心化(意味着参与者的对等)、全历史性(意味着所有发生的事情都被记录下来了)、不可篡改(意味着所记录的数据几乎可被完全信任)、可查询(意味着谁都可以去查看该链创始以来的数据)。当这些特性与“数据”结合起来,碰撞出来的火花就相当精彩了。
一、真正的大数据
所谓大数据,这个“大”体现在量大且维度广,甚至时效也高。由于区块链的全历史性,所有链上的数据都会被几乎实时地记录下来,从而真正有条件实现全量取代样本。
又由于公有链对所有人都是开放的,加上必然会有人去做跨链的各类服务,那么各个公有链上的数据可以实现全面的获取,从而前文的“有条件”之“条件”可以被真正解决。
二、这意味着什么
前两年有一个词曾经很火,叫作“互联网思维”。对于所谓的互联网思维,我认为最重要的有两条,一是去除各类中间环节提升效率,二是依据数据快速决策迭代。跟今天的主题比较相关的事第二条。
那么,“依据数据快速决策迭代”到底重要到什么程度?
商业的本质就是买和卖,赚钱是因为实现了低买高卖,即,不断进行新的资源流通分配。在这个过程中,卖什么、卖给谁、谁会以什么样的价格买,这些信息是最终实现低买高卖的依据。也在这样的商业流程中,整个社会完成了让所有人满意度提升的一轮资源流转(如果不是更满意就不会去做这一轮的互相交易);所以我一直认为,商业让世界更美好。
在前互联网时代,这其中每一环的信息都很难量化,更难追踪沉淀二次利用,决策少凭数据多凭直觉+推理。但在互联网时代,每一环节都有数据可以落表,然后作为后续决策的依据,然后继续调整,然后继续可以依据数据反馈进行下一步决策。这种精准度和颗粒度是传统行业很难具备的。举例来说,营销和广告就在这样的数据机制下改变了太多,再也不是那个一半预算有用、一半预算没用但不知道哪一半有用的时代了。
然而,即使在互联网时代,组织与组织之间的数据并不流通。整条供应链有各种数据机制的不完善;如果是大公司,甚至整个公司层面各部门都不一定能做到数据共享。事实上,如谷歌所拥有的用户数据到底是属于谷歌还是属于整个社会,这本身就是值得讨论的问题。同时,数据的正确性也受到了质疑,比如上文所说营销为例,刷数据也并不少见。
可是,区块链就不一样了。即使不在同一条公链,那么综合各链的信息,或者通过跨链,数据依然可以最大范围地为全社会所共享,这个数据的量、维度、甚至时效鲜活性和历史周全性可以带来多少如同互联网对于传统行业一般的变革,已经可以想象。这真的是一件非常有想象空间的事情。
至于篡改数据、造假数据,数据库层面的篡改造假就别想了罢;汇报一些假数据的事倒是拦不住,只不过你发布的这些不诚实的信息随着时间戳被永远记在了区块链上,真假是非,背的也都是你的名号,也别再想抹去这种黑历史——那么,你还敢肆无忌惮地造假吗?