阿里kdd论文《Optimized Cost per Click in Taobao Display Advertising》
ocpc 特性:
- 针对流量价值对bid进行调整
- 设计了一个混合score,能反映用户体验,广告主利益和平台收益
- 保持ecpm排序机制不变(pctr*bid排序,使千次展现收入最大)
针对一个特定的pv 请求,假设有个符合要求的广告集合A, 对于A里的一个广告a都有一个预先设定好的bid, ocpc的作用是调整该bid,来满足预先设定好的各项优化目标
ROI 限制
定义特定用户和特定广告的交易转化率为
如果定义一次成交费用为, 一次点击费用为
那么对于一次点击来说,
若在一段时间内,对于一个用户u该广告有 次点击,那么这段时间内,该广告的roi为:
(对于特定人群和广告位,可以认为保持不变)
由上可见,一个广告主的整体roi由三部分影响:出价,收费 ,以及关于的期望。
可以认为关于转化率的期望是平稳的,我们bid optimization的目标就是要使上 面这个保持不变或者提高,这是在做bid optimization的限制条件之一
bid优化区间
由ROI限制中的公式,我们不难推出,对于某广告,要想使单次成交的roi,不降低整体的,则该次出价应满足:
对于bid的优化,当时,对于这些低质流量,应当降低bid。当时,应当抬高bid以充分竞争这些高质流量。
对于这两种情况,论文为它们设定了出价bid的上下限,具体范围由一个系数控制。具体公式如下:
在=0.4时,其出价范围如下图所示
参数我理解,是为了容错和业务考虑。值得一提的是,论文指出,如果广告主有其他诉求,上述公式中的 也可以替换成其他优化目标,同样适用。如果广告主没有开通ocpc的话,对应的上限和下限是
排序
在明确广告的优化bid出价范围后,计算一个具体bid值,对相应广告排序,满足各方利益,是这篇论文的核心所在。
在bid优化区间中进行出价可以优化广告主的roi,但是在该范围内的不同取值会得到不同的结果。为此论文提出了一个综合指标函数,这里定义了是一个关于的单调递增 函数。优化目标是,在ecpm排序机制下,优选出来的广告,其综合指标函数也是最优。如下图所示:
对于这个综合指标函数,论文给出了两种例子:
可以看出是考虑到成交总额gmv, 同时还将广告收入考虑进去
在bid调整中,给出了bid调整的上下限,和。对应的rank score上下限:,
需要根据对这些广告进行排序(之所以选择rank score上限排序,因为论文假定是关于 的单调递增函数。然后从排好序的广告中选出第一个满足rank score上限不能低于其他广告rank score的下限的广告(为了满足上图ocpc条件的(7)式)。
在选出广告后,需要更新候选广告中的和,以保证在ocpc bid optimization之后选出的第一个广告满足ecpm最大(因为通常计费按照ecpm排序)。选出所有广告后,需要更新所有广告的bid。
通过这样的rank策略,保证了f(b)最大的同时,ecpm最大。
算法细节
在实践中发现,在实际cvr较大的时候,pcvr和后验cvr差距较大。需要对此做calibration,把pcvr变小。calibration threshold =0.012
指标定义
模型特征:user feature,context feature,campaign feature,以及相应组合特征。在cvr模型中,把ctr模型的输出作为输入,取得了显著的效果。
auc提高,在工业应用中,表现不一定变好。auc没有考虑到用户和广告位的因素。
论文提出gauc。将样本按照user,ad spot分类,计算每个分类里的auc(如果一个分类里都是正类或者负类,把这个分类group从数据中移除),然后按照展现占比或点击占比加权。公式如下:
式子中的w可以是展现次数或者点击次数
结果发现,cvr模型的效果要把ctr模型好。因为cvr模型数据中噪声更少。ctr模型的的输出一般要比后验ctr高,不过重要的是,在提出的ocpc策略中,不同预测ctr之间的序要准确。
实验结果
offline 实验结果
论文搭建了一个线下模拟系统。
- str0 对出价不做任何调整。
- str1 只考虑客户成本。
仅应用bid优化策略:,其中 是一个单调递增函数,值域在(-1,1)里 - str2 就是本文的ocpc策略。
按照 ,其中 可以促进gmv - str3 单纯按pctr ∗ pcvr ∗ bid排序
从实验结果来看,str1提高roi,不能保证cpm。str3提高gmv,但不能提高cpm(acp,ctr都跌)。只有应用ocpc策略的str2能带来gmv,cpm,roi的提升。
论文针对str2中的参数还做了实验。实验结果证明越大,效果越好。gpm(gmv)的增大幅度要大于cpm。
还针对头部广告位应用str2做了实验。大部分pv下降的同时roi增长。一小部分roi下降因为pv增长了。
online 实验结果
线上效果显示,在广告收入,平台收入,广告主roi实现了三赢。
因为调整了bid,广告主对bid的变化也保持关注。统计了 的分布。发现超过一半的bid没有变。这也是符合预期的。因为对于低质流量,其bid optimize上限就是原始bid,而本文的ocpc ranking策略倾向于使用bid上限。
拓展性
该ocpc策略可以拓展到其他场景。比如双十一前,广告主比较关注加入购物车的商品。
用pasr表示加入购物车的预测概率:
, 同样带来了加入购物车量的提升