【用户行为采集】(二)建立采集规范

用户行为数据采集──埋点,是用户行为分析中非常重要的环节,直接决定数据广度、深度、质量,影响后续所有的环节。就埋点本身来说,技术实现的难度并不高,但是整个埋点的过程可以说十分的复杂繁琐,有非常多细节和流程需要考虑,不同类型客户端如何采集,数据如何统一,哪些信息需要在客户端采集,哪些信息需要在后端采集,如何减少数据上报的延时和漏报,如何对成千上万个埋点进行统一的管理?
这一系列文章基于用户行为分析数据平台一年的工作经验,会对埋点的全过程进行思考和讨论,涉及对埋点基础知识的介绍,讨论如何从 0 到 1 开始用户行为数据采集工作,分享负责项目的埋点方案,介绍埋点管理系统,梳理整个埋点协作流程等方面。
系列文章的第二篇,讨论用户行为数据采集工作的第一步──建立采集规范。上篇文章介绍了目前常见的三种埋点方式:代码埋点、全埋点、可视化埋点,点击查看

用户行为分析从 0 到 1

要进行用户行为分析,需要考虑四个方面:「数据采集规范」、「数据采集」、「数据处理和计算」、「用户行为分析平台」。

  • 数据采集规范:规定采集的数据字段、格式、采集时机、上报策略等,通常由埋点团队和数据团队一起负责给出。项目初期或小团队一般以共享文档的方式约束,成熟的团队以系统的形式做线上化、自动化的管理。
  • 数据采集:实施具体的采集动作,通常研发团队会开发埋点 SDK 工具,提供给有埋点需求方的业务方调用。
  • 数据处理和计算:基于业务分析需求,对采集上来的数据进行ETL、加工计算,由数据团队负责。
  • 用户行为分析平台:通常由数据团队开发,提供给业务方查询用户行为数据。
    用户行为数据采集主要关注前两个方面:「数据采集规范」(以下简称规范),「数据采集」(以下简称采集)。这两个方面,前者决定了数据应该按怎样的标准采集,后者实施具体的采集工作。规范一方面会规定要采集哪些字段,以什么样的格式,什么时候采集,采集后数据上报到哪里;另一方面会规定埋点需求处理协作流程的规范。相应的支持平台需要包括这些功能:埋点申请、埋点注册、埋点管理。

建立数据采集规范

论规范的重要性

埋点规范的建立,是用户行为分析中,我认为最重要的事项。在开始埋点前,必须把规范建立起来,让所有参与方都按照这个标准采集数据。三个原因:1)如果各个业务线、团队都按照各自的想法进行数据采集,这些数据只会是一个个孤岛,很难融合在一起发挥大数据的价值;2)数据分析要在统计口径一致的情况下讨论才有意义,采集需要保证一致性,比如做推荐系统的时候,希望知道推荐物品的曝光率,这时就需要对曝光制定一个标准。如果业务线 A 把出现一点产品图片的边缘就算曝光,而业务线 B 把出现了整个产品图片才叫曝光,那么这样的统计结果就有很大的差异,所以需要做一个统一的规定;3)规范不仅是约束,也是指导,可以让团队所有成员都快速上手。

规范的建立有两部分:数据规范、过程规范。

数据规范

数据规范,主要是明确埋点要采集哪些字段,以什么样的格式,什么样的采集时机,输出物可以是一份共享的文档,也可以是线上的系统。
要采集哪些字段?确定采集哪些字段,需要分析来自业务线的数据需求。比如,要分析不同手机型号访问客户端的情况,就需要采集手机型号这个字段;再比如,想要知道点击某个按钮时完成实名认证的用户有多少,就需要采集是否完成实名认证这个字段。一般是由数据团队对接业务线运营产品人员,对数据需求进行梳理,拆解成具体要采集的字段(其中应包括字段、采集时机、取值说明等内容),之后给到埋点团队,确认可行性以及数据的上报格式、上报策略、上报地址。这样一份埋点数据规范就形成了,接下来可以将其输出成文档在团队直接共享,或是做到线上的系统上。


埋点方案设计示例.png

过程规范

过程规范规定标准工作流,定义参与埋点各方的诉求和职责,明确协作的流程,以及各个环节的交付产物。
从埋点需求梳理、埋点设计到实施、测试、部署的整个过程中,至少会涉及以下三类角色/团队:有埋点需求的业务方(以下简称业务方)、埋点研发测试团队、数据团队。各自的职责:

  • 业务方:业务方产生埋点需求,通常是业务线的营运人员、产品经理、数据分析师,他们根据业务,提埋点需求,埋点完成之后做数据分析。他们需要输入原始需要、注册/维护埋点信息、上线前验收埋点。
  • 埋点研发测试团队:负责埋点开发、测试、上线。由埋点研发团队负责,具体需要参与埋点需求评审,确认埋点可行性和排期、具体开发/上线部署埋点。
  • 数据团队:负责埋点设计(满足业务需求需要采集那些字段、属性)、组织埋点需求评审、数据可视化。

完整的埋点工作流如下:


埋点过程规范

主要环节如下:

  1. 埋点需求提交
    该环节由业务方发起。通常是业务方的营运人员、产品经理、数据分析师 根据业务数据分析需要,提出埋点需求。
  2. 需求评审
    该环节由数据团队主导,埋点研发测试团队参与,业务方确认。数据团队根据业务⽅需求进行埋点方案设计,输出《埋点方案设计⽂档》,组织需求评审。在需求评审会上,埋点研发测试团队确认需求可行性,业务⽅确认事件设计方案符合业务需求。如一次评审没有达成一致,将多次组织需求 review,直到三个团队达成一致。
  3. 埋点开发
    在埋点开发之前,业务⽅需要到线上注册埋点信息(在用户行为分析平台的埋点管理模块中完成,埋点模块管理是用来跟踪埋点生命周期的,一个埋点才需求提出,到开发上线,到最后的上报监控都在该模块中管理。后面有机会详细介绍。),信息的内容须和最终确认的《埋点⽅方案设计文档》保持⼀致。研发团队确认埋点注册信息后, 开始具体的开发⼯工作。
  4. 埋点测试&验收&上线
    埋点数据测试由测试人员完成,测试完成后由数据团队、业务方验收后,由研发人员部署上线。
  5. 数据分析和上报监控
    埋点上线后,业务方可登录用户行为分析平台进⾏数据分析,并对上报的埋点数据进行监控。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容