本期是蓝莓群访,我们邀请到了北京大学营销模型专业博士、百分点集团数据科学总监杜晓梦来与莓果们分享——如何让“大数据营销”成为企业的掘金神器?
|本期嘉宾:
杜晓梦
北京大学营销模型专业博士,百分点集团数据科学总监
|本期主持:
章茜 蓝莓会副秘书长
以下是群访实录
▼
章茜:
晓梦先给大家介绍一下你过往在大数据方面的经历和背景吧。
杜晓梦:
大家好,我是百分点数据科学部负责人杜晓梦。我本科在北大读管理信息系统专业,然后在北大光华读的营销模型的博士。
“毕业前在一家广告技术公司做了一年的数据分析、数据建模方面的工作,建立了对营销领域大数据挖掘方向的兴趣。
现在我在百分点主要做量化分析、数据挖掘相关的工作。营销其实是大数据技术应用的很广泛的领域之一,也是和消费者的行为分析结合得比较紧密,各行业、各企业都非常关注的领域。
我今天非常高兴能跟大家分享一些利用大数据在营销上做过的实践,从数据科学的角度或从大数据应用的角度谈一些我自己的看法。
企业数据建设不是一蹴而就
`Q1---
章茜:
您曾经帮过华为、万科这些知名企业做过大数据项目,横跨地产、汽车、金融、通讯、快消等领域。对于身处不同行业的这些企业,大数据在企业发展的不同阶段能为他们提供什么样的帮助?企业一般应该在什么阶段开始自己的数据建设呢?
杜晓梦:
我们接触的企业粗略地可以分成2B和2C企业。
对于2B企业,大数据更集中于帮他们发现销售的线索,我们可以从社交网络、移动互联网上爬取相关的内容,从中发现销售的线索,包括销售线索的评级、培育、管理等都有大数据的技术做支撑。
对于2C企业,大数据更重要的是在于客户的经营,包括会员的运营。对于营销,可分为新用户的获取和老用户的经营两部分。
大数据不光用在企业营销的领域,在销售方面,包括销量预测、个性化定价、物流规划、库存优化、产品设计,客服售后都是可以有大数据技术做支撑的。
企业对于大数据的利用取决于企业自身的业务需求以及自身数据的积累。初创企业主要是为了生存下来,规划好核心竞争力是什么。随着企业的业务发展,数据量包括数据触点、数据渠道,接触消费者的渠道不断扩张,这时候企业就要开始规划自己的数据建设。如何打通不同的渠道,线上线下消费者的数据,也是企业开始要考虑的问题了。
当企业发展到比较大的规模时,数据建设会面临性价比的问题。闭源的商业数据库软件成本就会比较高。很多企业开始用一些开源的组件、底层框架做数据库的搭建,做数据的分析和上层的应用以及可视化的展示。
企业在不同的阶段都会有数据的建设,包括应用底层的架构、上层数据的分析、积累数据的能力,都不太一样。我们建议企业从一开始就考虑自己发展的规模,到后期数据有哪些可以获取的,提前要做预估。
`Q2---
章茜:
但不是所有的企业都有实力构建自己的大数据中心,中小型企业该如何应对?
杜晓梦:
企业的大数据中心不是一蹴而就的,而是随着自己业务发展,数据的积累,逐渐调整过来的。淘宝、京东、百度等在开始的时候也用过如SQL Server、My SQL等小量的数据库。但是当数据量随着业务量提升而提升的时候,他们都会做架构的重构和升级。
如果企业属于小数据的阶段,每天的PV或者数据量只有几十万、几百万的时,建议在底层的数据库就使用SQL Server、My SQL这样的数据库,效率会比较高。
当PV每天超过了五千万或者数据量已经膨胀到每天要处理几百G、TB级的数据时,就需要更强大的数据库,比如刚刚开源的Greenplum数据库也是非常强大的,适合处理中型的数据。
到这个阶段,企业不管在营销运营还是销售,都需要深入的分析,可能需要统计的模型,比如时间序列模型、因子分析等等。这时候企业就会用SPSS、SAS这样的分析软件去支持稍微大规模数据的分析和统计,利用机器学习算法进行一些分析。
当数据量继续扩张,比如现在已经到了每天要处理几十亿数据的时候,就需要把数据架构做更大的调整,开始考虑上分布式的架构,比如hadoop,分布式计算的框架能便利分析实时流式的数据,比如日志的数据。
企业通常都会有专门的数据分析team帮助企业处理日常的数据的分析,通常Python、R是用的比较多的。在可视化方面,在小数据时可以用Tableau这样的传统可视化商业软件,在数据量比较大的时候,都是自主研发比较多。
所以企业该如何去构建自己的数据中心、数据架构,应该选择什么样的分析软件,可视化等等完全取决于它的数据量,以及它的业务需要多大量的数据进行支撑。
一些开源的组件,开源的框架使我们能够分析很多以前在小数据领域分析不了的数据,比如消费者点击流数据,日志的数据,语音数据,甚至一些图片和视频的解析,现在都是大数据技术可以支撑的。
随着企业的数据不断的扩张,底层数据存储、计算结构也在慢慢的变复杂。我见过一个企业虽然数据量总量不是很大,但是因为结构比较复杂,可能有三、五十个数据系统,存储不同的数据。这时候需要提醒大家一定要做主数据的梳理,即要建立数据库之间拉通体系。比如一个消费者的数据到底是以哪个数据库为主,主数据库的梳理以及元数据库是一定要做的,即数据的数据,我改了哪些表,存了哪些主键,元数据的梳理也是非常重要的。
章茜:
不同的流量阶段,不同的解决方案。
核心:主数据的梳理。
什么时候不再说大数据了
就是大数据时代真正来临的那一天
`Q3---
章茜:
移动互联网时代,许多行业都希望通过大数据达到精准营销,哪些行业对大数据的应用走在最前沿?这对其他行业如地产有怎样的指导意义?
杜晓梦:
肯定是互联网的企业是最前沿的。比如BAT,做个性化的推荐,搜索、地图导航、量化分析等等。
在传统的非互联网的企业里,各行各业都看到很前沿的企业,大致的规律就是各行业的龙头企业对大数据的应用都是比较前沿的。
原因:一是资金比较雄厚,二是龙头企业数据量很大,三是管理层非常关注新技术。
比如消费类的3C企业,做手机、电脑的企业,对大数据的应用都是比较早,这跟他们的主营业务与大数据技术稍微有点关联性是有关系的。
拥有大量数据的行业也是应用比较早的,如金融领域。被互联网挤压得比较严重的行业如零售行业要寻求转型,所以对大数据的应用也是比较早的。
这对其他行业有怎样的指导意义呢?大数据迟早是会被普及的,美国一位大数据的学者说,未来所有的生意都是数据生意,所有的企业都将拥抱大数据,就像互联网一样。现在基本上没有太多的人提互联网了,是因为所有的企业都已经是互联网企业了,以后所有的企业也都会是数据型的企业,不会再有非数据企业和数据企业的差异,而是对大数据技术利用的深度以及拥抱程度的区别。
大数据的技术在方方面面都是有应用的,大家要结合自身业务的特征,找到自己的突破点,不要盲从,要找准自己的核心定位以及自己的业务壁垒,核心竞争力,这是非常重要的。
总之,结合行业业务点找到自己的法门。
`Q4---
章茜:
人人都在说大数据,那大数据跟我们的日常生活有什么样的密切联系?对媒体传播又有什么影响?
杜晓梦:
大数据渗入到大家的日常生活里,结合地已经非常紧密了,我们的衣食住行都已经离不开大数据,购物用淘宝,出行用uber、滴滴、易道,社交用微信、微博,餐饮会用大众点评,投资理财用雪球。在教育、医疗行业都会看到基因组测绘等等,都是大数据技术的应用。
我觉得对传播的影响,媒体的传播会越来越碎片化。
从纸媒体,到收音机,到电视、互联网、移动互联网,现在有了如今日头条这样的APP,这使得媒体的传播变得越来越碎片化。现在新兴的一些现象如直播平台、网红、自媒体、公众号等等,媒体传播变得越来越个性化,越来越软。
随着大数据技术、物联网技术的进一步发展,我们可能会看到很多现在我们都没有看到的媒体的渠道。比如早上起来的时候镜子上也可能会有新闻、广告的互动,例如天气预报、提醒我昨天的新闻、时政有哪些内容,这些都是以后可能会出现的新的媒体渠道。
任何一项新技术刚刚诞生的时候,都会有人质疑、恐慌、害怕,下一个阶段,就会有人冷静下来认清技术的应用点、做新的拓展、新的应用。当这个技术已经运用到日常生活中来的时候,我们就已经感觉不到这个技术的存在了。
什么时候我们不再说大数据了,就是大数据时代真正来临的那一天。
Data Driven
永远是营销未来发展趋势
`Q5---
章茜:
大数据时代正在来临,莓果们大多是营销精英人,最关心大数据怎样应用于营销?例如做效果监测如何提升营销活动的有效性?
杜晓梦:
目前看到大数据技术在两个领域的发展都非常好,一个就是个性化推荐,一个是精准广告,这两个领域都是属于营销的领域。
营销中非常关键的三个因素:人群、场景、内容,都是由大数据以及大数据技术可以做支撑的,
但是核心前提要具备从各种渠道收集数据的能力。线下的数据采集以及线上线下数据的打通串联,如何去分析挖掘,如何去洞察结果也是非常重要的。
如何评价不同的渠道给我的官网或者我的商城带来的引流效果,我如何做站内的分析,不同渠道带来的人群停留时长、跳出率、转化率都是怎样的,这些都需要一些数据做为支撑。我们也看到越来越多的CMO开始关心数据,也有一些CIO和CMP身份开始做一些融合。伊美尔现在的CIO就是兼任CMO,因为越来越多的会是数据驱动运营、数据驱动营销,Data Driven永远是营销未来发展的一个趋势。
营销其实是科学和艺术的结合体。科学部分有数据,有数据技术进行支撑。在艺术部分,有各位营销人员的创造力、想象力进行支持。
打动消费者:建立强链接
`Q6---
章茜:
营销是科学和艺术的结合体,我们都是营销手艺人。创意群有莓果问:大数据营销是怎么跟消费者建立关系呢?
杜晓梦:
互联网大数据的时代,消费者的触点越来越多,越来越碎片化。渠道是非常丰富的,核心就是能否通过某一个渠道或者某一个触电打动这个人,这是非常重要的。
怎么去打动一个消费者呢?我们要建立跟她内心的强连接,
非常深入的了解他,了解他的特征、偏好,建立一个统一的完整的消费者的画像,去给他提供个性化的内容和服务。
现在的消费者变得越来越个性,他们越来越关注自己的内心和价值观,比较标新立异。尤其当90后、00后成为主流消费者的时候,也许提供统一的产品或者统一的沟通方式都是无法打动消费者的。
所以也看到更多的企业开始转变从以往的以产品为中心的营销方式,变成以消费者为中心的组织方式,甚至会根据不同的消费者群体组建自己的营销team,专门的做定制化的个性化服务。
这就是为什么在现在网红、比较火爆公众号的营销效果非常好,因为他抓住了一群铁粉的内心,所以他们随便推销任何的产品都是会有很多人追捧的。
还有一点非常重要的就是及时的响应,非常及时的响应,不是秒级的也应该是分钟级的响应和回复。
回复包括营销自动化系统触达的一些规则,比如生日到了是否自动给他触发优惠券,各种节日到了是否自动触发短信等等,也包括人工主动去触发的互动。比如在微博、微信上面的及时的回复,都是对维护消费者关系非常重要的。这也是大数据技术可以去做支撑的部分。
`Q7---
章茜:
作为消费者大家可能都有过这样的体验,已经购买过并且短时间内不会再次购买的商品也会频繁出现在网页推荐上,重复推荐是对广告资源的浪费,如何优化?
杜晓梦:
出现这样的情况是因为推荐以前或者推荐算法做得不够好。
因为百分点是向两千多家电商和媒体提供集全网的推荐服务,这是一个非常好解决的问题,就是你在买了这个商品以后我们的推荐引擎就会自动关闭这个品类,在短期之内不会再去推荐同样的商品了。
跨界重要的是数据的打通和整合
`Q8---
章茜:
近来我们经常看到像新浪+阿里、腾讯+京东这样的社交媒体平台跟电商平台之间的跨界合作,社交媒数据和电商数据的整合,会有什么样的化学反应?
杜晓梦:
营销媒体和电商的跨界,最重要的就是数据的打通和整合,可以做一些数据的共享。比如新浪调取了我在淘宝的浏览记录帮我做微博精准广告。这是一个典型的数据和流量共享,使得阿里、新浪能够提升在分析的消费者维度的能力,可以把广告位基于个人消费者的购买记录做一个更精准的投放。这是很好的基于数据共享的个性化应用的整合。
以后,社交媒体和电商的界限会越来越模糊,会有很多兼具社交功能和电商功能的新媒体、平台或者渠道出现。
随着商家的服务意识提高,更多的品牌会跟消费者成为朋友。
现在很多小众的文化在崛起,包括个人的设计师、独立的艺人,他们一边积累了一群粉丝跟他们进行社交互动,同时又可以在自己的社交平台做一些周边的销售。所以社交和电商的界限真的会越来越模糊。
章茜:
京腾计划,品效合一在2016成为BAT的重点。已经有很多品牌懂得和用户“谈恋爱”,文化和价值感的认同让品牌和用户走在了一起。未来,这是主流。
大数据需要坚守
`Q9---
章茜:
目前,像长虹、速8酒店这样的传统企业开始部署自己的大数据项目,但一旦面对项目的前期投入,却让一些企业望而怯步,不知您怎么看待大数据项目的投入产出比和回报率呢?
杜晓梦:
基础建设是非常重要的。就像盖一个酒店,地基是非常重要的,然后才是装修,买家具,才能把酒店搭起来。但是在打地基的时候,基本上就决定了酒店最后的价值能多大。就像我们的一个客户提出的,平台先行,应用跟上,分期分批去实现一个大数据项目落地。
一期的基础平台的搭建期确实看不到直接的应用上的产出,因为更多的是去衡量底层的数据平台是否是稳定的,是否是健壮的、兼容性高的,是否支持多源异构数据的接入和打通,这是非常重要的基本功。
随着底层平台的不断稳健,数据的接入,比如消费者在各个渠道的触点都被打通的时候,我们就可以建立了一个完整的应用化体系。那么在上层就可以搭建各种各样大数据的应用,比如营销的应用,个性化推荐,精准营销,包括消费者的深入挖掘,价值度的衡量,流失概率的预测等等,这些都是能直接看到投入产出的。
应用部分是不断迭代的过程,我们在做大数据项目的时候总结出来3D的模型:
第一个D是Datafy---数据化,第二个D,Discover---发现洞见,第三个D---Design,重构应用体系,这三个D不是一蹴而就,而是不断的迭代循环的。
Datafy部分,我们把消费者、商品、库存、物流等等都数据化,把不同的数据接入到底层平台上。
在对这些数据做很深入的分析和挖掘大数据建模之上后,我会发现很多的洞察,比如什么样的消费群体喜欢买A款产品,什么样的消费群体喜欢买B款产品,他们在社交媒体上都说些什么,这些都是Discover的部分。
基于Discover,会重新Design,比如产品的设计,包括营销Campaign的流程。通过应用的投入又能采集到新一轮的消费者的数据,这些数据又迭代到Datafy部分,形成数据的闭环。所以3D的模型是不断的往复循环迭代的过程。
所以我们在做一个完整的大数据项目的时候一定要有远见,前期的投入是磨刀不误砍柴工,把底层的数据基础做好,做到平台是可扩容的,那么我们现在想象不到的多源异构的新渠道数据在未来都可以进入到现有构建的大数据平台上来。
我们的另外一个经验就是一般的大企业和大集团,通常都是IT部或者科技部发起大数据底层平台的项目,到一期尾声或者二期开始的时候就会有业务部门介入,包括互联网营销的部门,包括线下销售的部门,客服部等等。我们就会结合业务的需求,去看看大数据底层平台收集的数据该如何去满足业务的需求。这是分阶段的项目。
章茜:
大数据中心的基础建设期都不短,而且看不到即时的回报,但这个时期才更要坚守。
`Q10---
章茜:
市场上也有很多专注于提供大数据产品的第三方机构,企业应该怎样挑选这些大数据机构和产品?什么样的数据解决方案对于企业才是最合适的呢?
杜晓梦:
在这方面建议企业根据自身的需求,主要是自己的核心业务来选择合适的,因为选择确实是非常多的,所以还是结合企业的业务来选择最合适的数据。
`Q11---
章茜:
有些企业开始设置首席数据官这个职位,您是如何看待这个问题的?
杜晓梦:
这还是要看企业的发展阶段以及数据量有多大。中小企业、数据量不大的企业,负责数据的人通常会在运营或者IT的team里,一般不会独立出来。
企业发展到比较大的阶段或者企业的数据对于业务驱动非常重要的时候,首席数据官还是非常重要的,他会担任起来整个公司的数据治理,包括数据资产的盘点,尤其是DMP平台的管控。比如各自的业务部门都有数据,这些数据接入到DMP平台的准则是什么,做什么处理,输出的标准是什么,这些都是CDO需要考虑的问题。
如何利用数据3D模型,形成数据驱动业务的闭环,这时CDO就非常重要的了。一些大的美国公司如Linkedin、Airbnb,都会有专门的数据科学team及CDO做整个公司的数据治理和资产盘点,数据化等工作。
当企业数据积累到一定程度的时候,CDO也会去做数据的变现,这就是DaaS模式,Data as aService模式。比如在百分点,我们有一个非常大的消费者用户画像数据库,我们现在能覆盖到中国5.5亿消费者人群的数据,每天的增量数据是在15T左右。我们的CDO就会考虑这些数据应该怎么去服务外部的企业,能否去做数据的变现等等,这些都是能直接给公司带来利润的。这时候CDO的职位是非常非常的重要的
数据驱动、技术驱动、渠道多样化
`Q12---
章茜:
在您看来,大数据营销应用未来的核心是什么?
杜晓梦:
有几点我是能看到的。
比如一定是越来越数据驱动,一定是大数据和小数据的融合。
因为大数据更注重人的行为分析,比如你的浏览,你的点击,你的购买收藏等等行为体现出来的偏好。小数据永远不会被取代,比如从消费者的访谈,问卷里收集的消费者的态度,对于品牌的爱,这些都是营销也是未来非常需要的。所以大小数据融合的数据驱动会是未来的方向。
越来越多的技术驱动一定也是一个趋势。
现在很多新的科技,包括黑科技,比如人脸识别,瞳孔识别,生物技术,人工智能,都是会可能驱动未来营销应用的发展方向。
渠道的分散化也是一种趋势,包括自媒体会出现,软性营销渠道的增加,如网红、直播等等,营销会变得越来越让你觉得不是在卖东西,不是在做营销,体会不到这是一个广告。
营销的永恒就是核心受众、价值观和场景,这三个因素是缺一不可的。
`Q13---
英子-中海达-品牌总监:
我想问一下,基于大数据的营销,我印象中广州有一个互动派,时趣跟互动派之间的差异体现在哪些地方?
杜晓梦:
互动派了解不多,但是对时趣互动还是了解比较多的。他们主要是基于社交去做的营销的Campaign,消费者的分析,营销活动的监测这些方案。
社交营销更多的是人的参与。比如之前在微博营销上,一个非常流行的案例就是博圣云峰给杜蕾斯做的形象的维护和设计,其中非常重要的一点就是实时的回复。在杜蕾斯的官方微博下面发任何一个问题,都会有一个人工运营在两分钟之内跟你做互动。
`Q14---
章茜:
百分点目前大数据除了应用在营销,还主要应用在哪些方面?经营业绩占比中数据业务占了多少?
杜晓梦:
对于百分点大数据,营销只是其中的一个部分。我们应用在其他的方面,比如帮助金融公司如消费金融、P2P等做大数据的风控分析,基于消费者的购买行为做偿还力、消费能力的判断。
我们的业务服务模式可以大体分为TaaS、SaaS、DaaS三部分,技术服务部分主要帮助企业构建大数据的平台,数据仓库,上层的数据应用。SaaS部分我们线上的产品,包括个性化推荐,包括运营分析,包括舆情监测,这些都是SaaS的服务。
在DaaS服务方面,我们会做一些数据的补充,标签的输出,包括一些数据报告的输出给营销公司去做全案的包装,帮助营销部门洞察他的用户等等。
`Q15---
章茜:
有位传统广电广告的莓果问:他各种硬广都有,在互联网时代,如何收集、利用好大数据,开展营销?
杜晓梦:
硬广的数据收集还是比较难的,如果不去做调研收集,广告效果是比较难测绘的。但现在我们也可以用一些包括二维码、条形码采集数据。
在互联网时代,如何收集利用好大数据,比较重要的一点就是珍惜任何一个跟消费者接触的触点,去做消费者ID的拉通。
消费者的触点,消费者行为非常碎片化导致的结果就是一个人的ID可能有十几个甚至几十个。如果你不去做拉通,就很难把一个人的行为做一个完整描述。
当一个消费者用他的电脑上了官网的时候,就鼓励他用他的邮箱去注册账号,或者用手机号去注册,这就是为了把他的手机号和他的浏览器cookie和ID做一个打通。
当一个人又去了线下门店的时候,鼓励销售人员让他先连上店里的wifi,他买东西的时候又会让他填上他的地址,这样就试图去把这个人的手机号、地址,甚至他的信用卡卡号和他连wifi时候的Mac地址做一个拉通。
所有的数据或者ID都被拉通之后,作为商家的自由度就会比较大。就可以跟各种的DP去做数据的匹配,提取数据。