数据分析流程
一个典型的数据平台,对于数据的处理,是由如下的5个步骤组成的:
数据采集--〉数据传输--〉数据建模--〉数据统计--〉数据可视化展示
其中,我们认为,第一个步骤,也即数据采集是最核心的问题。数据采集是否丰富,采集的数据是否准确,采集是否及时,都直接影响整个数据平台的应用的效果。
埋点
埋点是对用户行为数据进行采集的方法,通常包括以下几种埋点方式:
1. 手动埋点(代码埋点)
代码埋点出现的时间很早了,在 Google Analytics 年代,就已经出现了类似的方案了。目前,国内的主要第三方数据分析服务商,如百度统计、友盟、TalkingData 等都提供了这一方案。
它的技术原理也很简单,在APP或者界面初始化的时候,初始化第三方数据分析服务商的SDK,然后在某个事件发生时就调用SDK里面相应的数据发送接口发送数据。
代码埋点也有一些劣势。
1. 首先,埋点代价比较大,每一个控件的埋点都需要添加相应的代码,不仅工作量大,而且限定了必须是技术人员才能完成。
2. 其次是更新的代价比较大,每一次更新埋点方案,都必须改代码,然后通过各个应用市场进行分发,并且总会有相当多数量的用户不喜欢更新APP,这样埋点代码也就得不到更新了。
3. 再次,埋点行为比较容易犯错,漏埋,错埋,经常发生,并且不方便测试。
4. 最后,业务人员经常会在app上线后提出采集需求,这时候需要重新发布app版本才能添加代码埋点。
2. 全埋点
全埋点的埋点事件全部由sdk自动捕获,相对手动埋点节省了很大的工作量。
全埋点主要包括页面自动埋点和点击事件的自动埋点。
全埋点事件的唯一标识一般是以触发事件的类名,按钮的title,按钮在页面子控件中的编号,按钮的类型,按钮所属控制器的类名等组合生成。但这种方式会随着页面调整造成一些统计错误,并且全埋点无法覆盖带有特殊业务属性的埋点事件(比如点击购买商品需要带上商品sku)。
3.埋点可视化圈选
埋点圈选一般是基于全埋点,也有通过配置文件下发埋点的方式。埋点的圈选操作是在app的可视化界面下完成,即使是不懂技术的业务角色也可以轻松按照自己的业务分析需求,设置不同埋点,从而避免了因为与技术的沟通失误造成的错埋与漏埋。并且即埋即见数据,更有助于依赖数据实现产品的快速迭代与运营策略指定。