如何保证数据埋点的准确性?

一、埋点数据上报基本流程

埋点数据从收集到处理、存储,最终服务于业务逻辑和运营优化,大体上分为以下几个步骤:

埋点数据采集和上报基本流程

其中数据上报关键步骤在于数据收集和数据存储两步,经过基本处理和转译的数据存储在数据仓库和数据报表中,帮助进行业务分析和运营决策。

埋点数据流转示意图

二、产品的数据上报链路

2.1 数据上报方式

1. 前端触发上报

时机埋点采集时最常用的一种方式,用户在前端进行相应操作时即进行数据上报,主要目的为了解用户在前端的交互行为。

2. 前端获取后端结果上报

此种上报方式的主要目的在于,除单纯获得用户前端交互操作行为本身,还要获得用户操作结果,包括操作行为成功、失败,成功须同时传输操作结果,失败须上传失败原因、系统报错内容等。

3. 后端触发上报

此种方式在后端处理结果出来后即上报,数据及时性高,基本不会出现漏报情况,但由于是后端数据来源,因此对用户使用时的设备终端及软硬件环境等缺乏属性记录,附带参考信息少。

4. 后端获取前端属性触发上报

集合了前端触发上报和后端触发上报的优点,数据完备性、准确性最高,但开发成本也较高,须综合考虑业务需要和数据属性要求后采用。

2.2 数据上报时机

1. 实时上报

埋点数据获取时即上报,此种方式数据及时性高,但如果埋点在客户端或前端,过于频繁的数据上报可能造成客户使用体验受到影响。

2. 延时上报

如批量打包上报,为了保证用户单个功能的使用体验,避免因过度上报对正常访问造成影响,无论单个埋点的数据量多少,减少上报的请求数,在累积到特定数据量时进行上报。

2.3 以营销活动主要数据埋点上报链路为例

关键营销事件埋点上报链路

三、常见的埋点问题及其产生原因

1. 数据源错误

采集的页面埋点错误,或数据处理时数据解析方式错误造成转义失败。

2. 数据丢失

多产生于批量打包上报时数据遗失,或是网络中断时数据上报失败造成的日志缺失。

3. 数据不准确

统计口径不一致、埋点定义差异、采集方式误差均有可能造成这一结果。

四、如何提升埋点质量

4.1 建立埋点规范

包含埋点命名规范、Key-Value字典、标准流程等操作层面约束。

4.2 埋点测试和验收

本阶段要对埋点数据的正确性、顺序性、完整性进行测试和验收。

(1)正确性主要检验埋点是否触发、埋点数据上报方式和上报时机是否符合埋点需求设计;(2)顺序性主要检验埋点采集和上报前后顺序是否正确;(3)完整性主要检验各埋点场景是否开发完毕,上报数据是否完整无损。

4.3 全流程埋点管理

包含埋点需求提出、埋点需求评审、规范化埋点开发、埋点自测、埋点验收、埋点上线、关键决策人员、版本更新、版本管理、埋点数据可视化等。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容