最近和朋友聊,一些科普和误区纠正:
1,场内的交易所数据的话语权越来越回到交易所,而不是数据商。以前基础设施成本高,交易所依赖数据商。现在IT基础设施成熟了,交易所开始把触手直接神向交易参与者,绕开了数据商这个数据二道贩子。数据商在这部分的价值更多在于提供多来源数据的整合服务等优势,搬砖优势已无。
2,OTC市场,比如外汇、非交易所债券,由于是“社群交易”,这里的客户粘性来源于报价和交易数据的丰富度、可靠度。谁报价和成交多,成交便利度高,我就用谁。这和哪里人多就去哪摆摊卖菜没有本质区别,所以把菜场做大做强就是王道。
3,除了交易,对于投研,这部分需求很杂,大小数据品牌有机会各显神通,但由于市场效率原因,一定会有单一寡头或双寡头垄断绝大部分市场,然后有各种小品牌占据细分市场(即便短期内没有形成细分市场,长期一定会形成)。客户粘性的建立成本非常高,但一旦建立则形成深护城河。
4,虽然用非结构化数据寻找阿尔法的做法听上去很酷,最终还是得处理成结构化才可以最终应用到投资决策过程,不管是阿尔法因子还是交易信号。比如新闻、社媒数据。这个处理过程的成本会随着数据复杂程度的上升而急剧上升,所以善用白盒的第三方数据会事半功倍。
5,不管是交易、投研还是风控,数据应用化,应用数据化将是大势所趋。原始和浅层数据的堆积已经完全无法满足用户的迅速决策需要。
6,对于交易流程管理,听上去已经偏离了数据业务,但这是以前的想法,因为以前做好数据就足够了,但今后数据和流程的整合将是大势所趋,企业级、总部级的数据应用,一定会越来越和流程嵌套。原因很简单:你不懂交易数据就做不出交易流程管理,而不懂流程也做不出“多考虑一步”的优质数据(即数据商越来越不能孤芳自赏),这在今天基础设施越来越成熟的大背景下犹为如此。
7,如何理解“历史数据越来越不值钱,生产历史数据的能力降越来越值钱”?市场越来越瞬息万变,一堆不再更新历史数据,其应用价值将迅速贬值,但正是因为如此,客户对于每天新生产出来的细颗粒度、高丰富度的历史数据将越来越依赖,因为投资者越来越耽误不起哪怕一天的市场新动向。这也引出我一直以来的论断:数据越来越不是数据企业的核心资产,生产数据的能力才是。
对于第六点,很有意思,历史上出现过反复。曾经数据商是考虑流程的,因为这是很自然的一步。但是那时基础设施不完善,流程产品搭建成本高,投入产出比不高,所以有些数据商开始把流程产品砍掉,只做数据产品。十年后,基础设施很成熟完善了,用户对流程的需求越来越强烈,数据商必须考虑流程了,不然你的数据很难嵌入客户的工作流。举个例子,为什么外汇、债券交易领域,路透和彭博能双寡头各领风骚(注:路透的Tradeweb开始在债券的电子化交易领跑彭博),而投研领域却面临各种小品牌的激烈厮杀?本质上还是因为这外汇债券两个市场没有场内交易所(国内沪深交易所债另说),你建个足够大的“交易社群”就已经足够成功了,这和建赌场建菜场的道理是一样的,这就是从第一步就嵌入了客户的工作流,一旦护城河形成,用户几乎是不可能迁移的。但投研就不同了。研究需求五花八门,少林武当崆峒峨眉各成一派,各种需求杂而广,几乎人人都有机会搞一份“独而精”的投研数据,在嵌入工作流这件事上,大小品牌都能插一脚,所以垄断并不明显。虽然万得在二级投研领域目前是垄断的,由此推广到一般性经济金融数据库应用,但长期它受的威胁是很大的,目前一级市场数据的投中清科已经把市场切割,CEIC切走了宏观数据,同花顺也开始切割二级投研数据领域,它的压力其实是很大的,这和海外市场中dealogic切割并购数据,epfr切割资金流数据,Haver切割宏观数据,IHS,Euromonitor切割行业数据,Markit切割PMI数据是一个道理。
所以万得这几年注重债券交易市场,搞iWind,和QB分天下,这是嵌入交易流程、建护城河的好入口。不管将来QB是卖掉还是坚持自己做,债市交易像今天万得QB双寡头这样的局面将持续下去,这和彭博路透在债市交易的双寡头是一个道理。