本调研项目仅为自己锻炼项目评测方法的习作,认知难免浅薄,不作为投资建议。
中文白皮书地址:https://s3.amazonaws.com/streamr-public/streamr-datacoin-whitepaper-2017-05-25-v0.7_CHINESE.pdf
项目的战略与规划
近几年,大数据这一个词越来越火了,各行各业的人都在说自己在做大数据。但大数据究竟是什么呢?很多人恐怕一下子还说不清楚。上周和同事拼车回家,司机师傅是做金融的,很好奇地问我们,“大数据和数据仓库有什么区别?”,同事给出了一个很简洁的回答,“大数据就是从海量无规则的数据中提取有价值的信息的过程”。
其实,现在大数据已经在方方面面影响我们的生活了,你在淘宝上的购物兴趣,你在微信朋友圈的订阅习惯,你在今日头条上喜欢看什么花边新闻。这些都是大数据分析出来的,而数据源就是你在这些网站和其他网站上的每一次点击,观看,搜索等行为。
但是现在在大数据行业中有一个非常严重的问题,就是数据的所有权掌握在大公司手里,如Google/Amazon/Baidu/Alibaba/Tencent,它们手中有海量的重要的用户数据,然而该数据都是作为机密数据存在的。外部的小公司,以及科研机构,是无法拿到这些数据的,这也是小公司和科研机构做大数据研究的痛点。
同样地,也有很多小数据主,他们生产数据,但因为数据价值不高,所以无法找到买家。
所以,在这个市场上,现在存在一种很难受的情况,就是小数据厂商找不到人去买他们的数据,同时小数据用户,又找不到可以买的数据。这种情况下,就需要一个中介来给买卖双方拉线了。
Streamr就是这样一个为数据买卖牵线搭桥的中介平台。它采用去中心化的区块链技术,准备搭建一个数据买卖平台,并发行token作为买卖时的货币。
但我们知道,在很多公司内部,每天TB级的数据生产和消费,需要耗费大量的机器资源,无论是存储还是交换过程中,机器资源永远是不足的。
Streamr是一个P2P网络,也就决定了每个节点可以完成独立的功能,所以在这个项目中,很难完成全部数据的存储,而仅能支持基本的买卖功能的完成,以及数据的正确性的完整性检验。大量有价值的数据的存储,只能存储于卖家自己的数据仓库中,那么在这种情况下,数据的通讯的及时性将是一个很大的考验。在很多场景下,数据的延迟,将是该项目下不可容忍,但又很难规避的现实问题。
同时,每一个数据的卖家,对数据的需求带来的机器资源的填充也不一定能达到很好的及时稳定,这也将是分布式的数据平台的一大挑战。
所以去中心化的数据交易平台,是否一定比基于中心化大公司统一存储的平台更易用,更有价值,是有一定的技术疑问的。
团队的组成与剖析
团队成员
顾问团队
团队成员中,并没有看到海量数据的长期从业经验,可能是一个短板。但很多人有金融背景,对怎么理解这个市场,如何架构一个交易市场有一定的人脉资源和帮助。
社区建设情况
官方Reddit 1344人,公共聊天室3093人,twitter关注数约1万,推文共204篇,热度一般,不过该项目关心的人往往是大数据从业者,关注度一般也正常。
项目进度与风险
从项目白皮书中可以看到,整体项目规划分三个阶段,共9个大的迭代(Work Package)
其中第一个阶段发布激励数据传输网络的第一版和底层智能合约。
第二个阶段推出了第一版数据市场,以及底层网络层所需的功能。
第三个阶段完成Streamr的所有愿景。
整个项目,其实前两个阶段和一般性的区块链项目工作内容差不多,第三个阶段才是真正的难点,如何推广,以及数据市场搭建后,随着流量上涨,如何解决存储和实时数据传递的问题,将是最棘手的,团队将怎么提供解决方案,是个风险,也很值得期待。
项目远期展望
该项目所翘动的,是一个巨大的市场,类比的例子可以关注下程序化广告类数据对Google/Baidu/FB等公司的市值的影响就可以大致了解。之前注意力币BAT做了一个区块链版的程序化广告交易中心,Streamr将完成的是一个更基础的数据交易平台,如果项目可以有办法很好地解决在交易之后,数据本身是怎么尽可能及时的数据存储和传递的话,该项目的前景很大。但就目前公布的资料和个人浅薄的工作经验判断,该问题技术难度很大。而且,区块链技术和去中心化是否一定适合于数据传递,本身也是值得起疑的。