OCPC拍卖

阿里kdd论文《Optimized Cost per Click in Taobao Display Advertising》

ocpc 特性:

  1. 针对流量价值对bid进行调整
  2. 设计了一个混合score,能反映用户体验,广告主利益和平台收益
  3. 保持ecpm排序机制不变(pctr*bid排序,使千次展现收入最大)

针对一个特定的pv 请求,假设有个符合要求的广告集合A, 对于A里的一个广告a都有一个预先设定好的bid, ocpc的作用是调整该bid,来满足预先设定好的各项优化目标

ROI 限制

定义特定用户和特定广告的交易转化率为p(c | u, a)
如果定义一次成交费用为v_a, 一次点击费用为b_a
那么对于一次点击来说,
roi_(u,a) = \frac{p(c | u, a) * v_a} {b_a}
若在一段时间内,对于一个用户u该广告有n_u 次点击,那么这段时间内,该广告的roi为:
roi_a = \frac{v_a* \sum_{u} n_u * p(c | u, a)} {b_a * \sum_{u} n_u} = \frac{v_a* E_u[ p(c | u, a)]} {b_a }
(对于特定人群和广告位,可以认为b_a保持不变)

由上可见,一个广告主的整体roi由三部分影响:出价b_a,收费v_a ,以及关于p(c | u, a)的期望。
可以认为关于转化率的期望是平稳的,我们bid optimization的目标就是要使上 面这个roi_a保持不变或者提高,这是在做bid optimization的限制条件之一

bid优化区间

由ROI限制中的公式,我们不难推出,对于某广告,要想使单次成交的roi,不降低整体的roi_a,则该次出价bid_a^*应满足:
\frac {bid_a^*} {b_a} <= \frac {p(c | u, a)} {E_u[ p(c | u, a)]}

对于bid的优化,当\frac {p(c | u, a)} {E_u[ p(c | u, a)]} <=1时,对于这些低质流量,应当降低bid。当\frac {p(c | u, a)} {E_u[ p(c | u, a)]} >=1时,应当抬高bid以充分竞争这些高质流量。

对于这两种情况,论文为它们设定了出价bid的上下限,具体范围由一个系数r_a控制。具体公式如下:

下限公式

r_a=0.4时,其出价范围如下图所示

上限公式

参数r_a我理解,是为了容错和业务考虑。值得一提的是,论文指出,如果广告主有其他诉求,上述公式中的p(c | u, a) 也可以替换成其他优化目标,同样适用。如果广告主没有开通ocpc的话,对应的上限和下限是b_a

排序

在明确广告的优化bid出价范围后,计算一个具体bid值,对相应广告排序,满足各方利益,是这篇论文的核心所在。
在bid优化区间中进行出价可以优化广告主的roi,但是在该范围内的不同取值会得到不同的结果。为此论文提出了一个综合指标函数f(.),这里定义了f(i, b_i^*)是一个关于b_i^*的单调递增 函数。优化目标是,在ecpm排序机制下,优选出来的广告,其综合指标函数f(.)也是最优。如下图所示:

ocpc优化条件

对于这个综合指标函数,论文给出了两种例子:
f_1(k, b_k^*) = pctr_k * pcvr_k * v_k
f_2(k, b_k^*) = pctr_k * pcvr_k * v_k + \alpha * pctr_k * b_k^*
可以看出f_1是考虑到成交总额gmv, f_2同时还将广告收入考虑进去

在bid调整中,给出了bid调整的上下限,l({b_a}^{*})u({b_a}^{*})。对应的rank score上下限:l({s_a}^{*}) = pctr_a * l({b_a}^{*}), u({s_a}^{*}) = pctr_a * u({b_}^{*})
需要根据u({b_a}^{*})对这些广告进行f(u({b_a}^{*}))排序(之所以选择rank score上限排序,因为论文假定f(b_i)是关于 {b_a}^{*}的单调递增函数。然后从排好序的广告中选出第一个满足rank score上限不能低于其他广告rank score的下限的广告(为了满足上图ocpc条件的(7)式)。

整个算法过程如下图所示
论文的ranking算法

在选出广告后,需要更新候选广告中的u({b_i}^{*})s({b_i}^{*},以保证在ocpc bid optimization之后选出的第一个广告满足ecpm最大(因为通常计费按照ecpm排序)。选出所有广告后,需要更新所有广告的bid。

通过这样的rank策略,保证了f(b)最大的同时,ecpm最大。

算法细节

在实践中发现,在实际cvr较大的时候,pcvr和后验cvr差距较大。需要对此做calibration,把pcvr变小。calibration threshold t_c =0.012

calibration公式

指标定义

模型特征:user feature,context feature,campaign feature,以及相应组合特征。在cvr模型中,把ctr模型的输出作为输入,取得了显著的效果。

auc提高,在工业应用中,表现不一定变好。auc没有考虑到用户和广告位的因素。
论文提出gauc。将样本按照user,ad spot分类,计算每个分类里的auc(如果一个分类里都是正类或者负类,把这个分类group从数据中移除),然后按照展现占比或点击占比加权。公式如下:
GAUC = \frac{\sum_{(u, p)}w_{(u,p)} * AUC_{(u,p)}} {\sum_{(u, p)}w_{(u,p)}} 式子中的w可以是展现次数或者点击次数

结果发现,cvr模型的效果要把ctr模型好。因为cvr模型数据中噪声更少。ctr模型的的输出一般要比后验ctr高,不过重要的是,在提出的ocpc策略中,不同预测ctr之间的序要准确。

实验结果

offline 实验结果

论文搭建了一个线下模拟系统。

  • str0 对出价不做任何调整。
  • str1 只考虑客户成本。
    仅应用bid优化策略:{b_a}^{*} = b_a * (1+σ(\frac{p(c|u,a)}{E_u[p(c|u,a)},w)∗r_a),其中σ(x,w) = \frac{x_w-1}{x_w+1} 是一个单调递增函数,值域在(-1,1)里
  • str2 就是本文的ocpc策略。
    按照f({b_k}^{*})=pctr_k*b_k* (1+σ(\frac{pcvr_k*v_k*||A||}{\sum_{i \in A} pcvr_i * v_i},w)∗r_a) ,其中 pcvr_k*v_k可以促进gmv
  • str3 单纯按pctr ∗ pcvr ∗ bid排序

从实验结果来看,str1提高roi,不能保证cpm。str3提高gmv,但不能提高cpm(acp,ctr都跌)。只有应用ocpc策略的str2能带来gmv,cpm,roi的提升。
论文针对str2中的r_a参数还做了实验。实验结果证明r_a越大,效果越好。gpm(gmv)的增大幅度要大于cpm。
还针对头部广告位应用str2做了实验。大部分pv下降的同时roi增长。一小部分roi下降因为pv增长了。

online 实验结果

线上效果显示,在广告收入,平台收入,广告主roi实现了三赢。
因为调整了bid,广告主对bid的变化也保持关注。统计了 \frac{{b_a}^{*} }{{b_a}}的分布。发现超过一半的bid没有变。这也是符合预期的。因为对于低质流量,其bid optimize上限就是原始bid,而本文的ocpc ranking策略倾向于使用bid上限。

拓展性

该ocpc策略可以拓展到其他场景。比如双十一前,广告主比较关注加入购物车的商品。
用pasr表示加入购物车的预测概率:
f({k, b_k}^{*})=pctr_k*b_k* (1+σ(\frac{pasr_k*||A||}{\sum_{i \in A} pasr_k},w)∗r_a) , 同样带来了加入购物车量的提升

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容