反作弊理解与思考
image
(一)背景:为什么需要反作弊?
反作弊作为一种通过违反规则获取不正当利益的手段,严重影响了广告行业生态良好运作,其中作弊带来的虚假流量会影响广告主投放收益,进而对投放不满意的广告主对广告代理以及投放渠道效果期望也会大打折扣,影响后续两者的付费转化率。而像百度等互联网大厂,在广告行业产业链中,所处角色往往为平台方与内部媒体,对于流量把控需求更强,所以需要反作弊甚至是风控作为其中的解决手段。
(二)目标:反作弊的理想态应该是怎样的?
反作弊的理想态,不是单纯地将作弊行为杜绝,除了其本身可能存在层出不穷地作弊手段导致反作弊跟进延迟,其次反作弊带来的高成本产研,对其他普通用户的误伤,也会影响最终广告投放效果。所以我认为,反作弊要做到通过以较高ROI将严重影响投放效果的作弊手段禁止,保证系统或生态能够以良好的态势运作。
(三)行动:怎么做好反作弊?
1.实现思路
作弊作为人的一种行为,离不开做这件事的动机,做这件事的能力,做这件事的时机(BJFogg模型 行为=动力+能力+触发时机),并且不同的人有着不一样的行为结果。根据用户与行为分层,以事件流转即“事前预防、事中解决、事后优化”为优化思路,设计对应策略进行反作弊。
- 不同角色作弊动机
image
- 常见作弊手段
- 人工手段:雇佣真人完成对应作弊策略,但成本较高,一般不使用;
- 机器手段:使用机器或程序来模拟广告行为,或者通过木马和肉鸡模拟用户的广告行为。为了使点击行为不被规则类发现还会控制ip分布和时间。机器作弊有如下的方法:模拟器、Proxy(网关,修改ISP,IP,UA,设备类型等)、爬虫(各家搜索引擎大量爬取着整个网络,依然会消耗巨大的广告预算)
- 附:详细作弊手段 只知道dsp、ssp?互联网广告营销里的作弊与反作弊
2.具体实现方式
(1)定义作弊行为
由于作弊行为导致的收益下降,同时无效点击也会导致收益下降,那么需要团队内沟通确定什么样的行为算作作弊行为,其行为边界是什么。否则每个人对边界的认知不清晰,目标方向不一致,所设计策略也存在差异;(预计作弊行为即旧作弊行为)
(2)识别作弊行为
数据存在异常峰值,且后续转化差
相同操作多次重复(同一用户、同一时间段、同一网络)
(3)设定反作弊策略
-
事前预防:
- 从动机出发:根据业务场景,判别作弊收益大小,重点预防对应可能作弊业务;设定预期上限收益,减少对应作弊可能;
从能力出发:在保证一定的用户体验与收益的情况下,提高作弊门槛,如设定同一用户行为频率;
-
事中解决:
- 设定反作弊规则:采取最优先使用最简单最有效的规则进行识别打压;
-
事后优化:
- 离线训练识别模型,将新作弊手段数据进行学习,使得模型更新进步;
反作弊规则优化,复盘更新为更有效手段;
(4)效果验证
- 效果验证:根据业务与自身KPI,通过ABtest对比、时间环比对比等进行效果验证;