先探索、后利用——怎么了解用户需求?

1、为什么要做需求端的运营管理?

在本节课开始之前,除了课前思考问题,还有几个类似的问题希望你能思考一下:

1.Rue LaLa是美国著名的电商品牌, 出售各大时尚品牌的限时折扣服装、鞋子和护肤品等等。假设你是RueLaLa的一位运营主管, 你有权限可以随时调整裙子的售价, 也需要要为这条裙子最终的销售收入和利润负责。那么到底你该如何设定价格,才能确保这条裙子的利润最大化呢?

2.假设你是一个互联网公司的产品经理, 公司要推出一款新APP, 在设计产品的时候, 到底是把按钮放左边还是右边?用圆形按钮还是方形按钮?要怎么设计界面,才能让用户活跃度最高呢?

3.一家提供共享电动汽车服务的企业,要如何确定汽车的投放点和充电桩位置,才能让整体效率更高,为企业带来更多收益呢?

听完这类问题,你可能会发现它们和新款蛋糕定价一样,都需要为目标匹配最优决策,也就是说,为了达成目标,你需要从多个不同的解决方案中做出选择,但你事先却并不知道每一种可能的方案,到底会带来什么样的结果。

这类匹配最优决策的问题其实都能用一种叫做“先探索, 后利用”的方法来解决, 英语叫做”explore first, then exploit”。现在我们经常听到的机器学习(Machine Learning) 和强化学习(Reinforcement Learning) 技术, 核心逻辑就是这种“先探索, 后利用”的方法。

这节课我会为你介绍这种方法,帮你找到实现目标的最优决策。通过本节课的学习,你将会掌握“机器学习”强大的决策思维,并且知道如何把他们应用到实际的商业问题中去。

2、什么是“先探索,后利用”?

image.png

“先探索,后利用”的方法,简单概括就是先尝试不同的方案,了解每个方案会带来什么样的结果然后再利用探索到的结果找到最优的决策方案,从而帮助你实现目标。

我们来具体结合Rue LaLa销售新款裙子的例子来看,还记得嘛,作为运营主管,你的目标是让这款裙子带来的利润最大化。

应用“先探索,后利用”方法的基本思路主要分两步:

  • 第一步“先探索”,你需要探索尝试不同的零售价格,收集每种价格下的销售量,计算在每种价格下,你能够获得多少利润,从而得到价格和利润之间的关系。
  • 第二步,你“利用”第一步得到的关系,得出哪种价格能为你带来的最大的利润,并且把价定在这个数值上面,实现长期的利润最大化。

接下来我就利用这个例子,具体教你怎么应用“先探索,后利用”这种方法。

3、“先探索,后利用”的操作步骤

要应用“先探索,后利用”的方法,第一步就是要“探索”。

3.1 第一步:“先探索”

在这一步里,你需要做以下三件事情。

第一件事情是尝试所有可能的方案。

你要给这款裙子尝试设定不同的零售价格,让每一种价格保持一段时间,并记录下在这段时间里这个价格对应的销售数量。这样你就能得到价格和单位时间内需求量之间的关联。

你要在线上销售一款新裙子。根据你的经验,像这类裙子的零售价一般在50到100元之间,由此你设定了二种价格:100元,80元和50元。对每一种价格我们利用24小时探索对应的需求量。

你可以有以下方案:

  • 探索尝试一:从第一天0点新款裙子上线到24点,把零售价定在100元;
  • 探索尝试二:从第二天0点到24点,把零售价定在80元;
  • 探索尝试三:从第三天0点到24点,把零售价定在50元。
image.png
第二件事情是收集数据。

你需要记录在每个定价方案下裙子的销量。比如说,你获得了如下数据。

  • 第一天,当零售价为100元时,24小时内你卖了24件。
  • 第二天,当零售价为80元时,24小时内你卖了96件。
  • 第三天,当零售价为50元时,24小时内你卖了120件。
image.png
第三件事情是通过数据找到关联。

你通过价格和销量的数据计算出每种价格下平均每小时的需求量。根据刚才列举的数据,你可以计算出:

  • 当零售价为100元的时候,平均每小时的需求是1件;
  • 当零售价为80元的时候,平均每小时的需求是4件;
  • 当零售价为50元的时候,平均每小时的需求是5件。

通过做上面三件事情,你就探索出了每种零售价和该价格下每小时需求量之间的关系。到此为止,我们就完成了“先探索,后利用”方法的第一步,也就是“先探索”。

接下来我带你利用第一步探索出的结果,进入第二步“后利用”去教你如何做出最优决策。

image.png

3.2 第二步:“后利用”

第二个步骤“后利用”就是利用第一步得出的价格与单位时间需求量的关联,计算中使得单位时间利润最大化的价格,然后在销售过程中把零售价始终保持在这个价格上。

在这一步里,你需要做以下三件事情。

第一件事情是计算单位时间所获得的利润。

根据第一步探索出的结果,你可以发现,如果零售价是100元,我们在第一步计算的每小时需求是1件,每小时的收入是100*1=100元。这款裙子的成本是30元一件。所以利润等于100-30=70元。

如果零售价是80元,我们第一步计算的每小时需求是4件,每小时的收入是804=320元。因为这款裙子的成本是30元一件,所以利润等于320-304=200元。

如果零售价是50元,我们第一步计算的每小时需求是5件,每小时的收益就是50x5=250元所以利润等于250-30*5=100元。

image.png
第二件事情是根据刚才的计算结果去找到最优定价方案。

现在你已经计算出了在不同价格下、单位时间能够获得的利润。接下来可以根据你的利润最大化的目标来找最优方案啦。你可以很清楚地看到,定价在80元能够让你获得最多的利润。

第三件事情是去执行最优定价方案。

在找出最优方案后,你在销售过程中应该把零售价长期保持在80元,从而让利润最大化。

通过刚才给裙子定价的这个问题,我对“先探索,后利用”的方法做了阐述。你可能会说,刚才举的例子是抽象的,这种方法在现实当中究竟能不能应用呢?

事实上我们刚才讲的Rue LaLa这个例子, 就是一个真实的商业案例, 这个案例由哈佛和MIT教授联合研究, 一共测试了6000多种商品, 并最终为Rue LaLa带来了总利润9.7%的增长, 可以说是非常有效的。

当然,我们对案例进行了简化,来方便你理解“先探索,后利用”的核心逻辑。

如果你对Rue LaLa这个例子很感兴趣, 可以参考我们在延伸学习中提供的论文,了解更多的细节。

在使用“先探索,后利用"的方法时,其实存在一个隐藏的难点,那就是在第一步“先探索"中,确定每种决策方案到底该探索多长时间。

比如刚才Rue LaLa的例子里, 我们对每种零售价进行了24小时的需求探索, 零售价为50元时得到平均每小时的需求是5件。之所以用24小时的数据, 是因为我们可以一定程度上消除不确定性带来的误差,而假如你把探索时间缩短到仅仅1个小时,那么这短短一个小时得到的数据就很容易出现很大的波动,比如说这一个小时正好是网购的高峰时间,卖出了10件,那你对需求的估计就是一小时10件,可能会严重偏离真实的平均需求值。

所以每种方案的探索时间不能太短,如果太短,我们估计出的单位时间需求量会有很大的波动性,可能跟客观真实的需求值有很大的偏差。

那是不是探索时间越长,波动性越小,得到的数据越稳定,就越好呢?

其实不然,理论上来说,探索时间太长,越接近真实需求量,但很多产品的生命周期是很短暂的,如果我们为了找到需求量跟各种方案的关联所花费的时间过长,由于,造成的后果可能就是挤压了最优决策所能保持的时间,从而最终影响了收益。

比如一款裙子,真正销售时间可能也就一两个月,如果你花费了好几周去尝试各种定价方案,造成的后果就是你没有足够的时间在最优的价格下销售这款裙子,也就无法使利润最大化。

那你可能会问了,既然每种方案的探索时间不能太短或者太长,那到底多久才合适呢?

这其实是由你所在行业的性质和产品本身的特性等因素来决定的。不同行业不同产品对应的答案可能会有非常大的差别。

但是一般来讲,你要保证在每种决策方案中设定的探索时间内你能够获得最少20个数据,这样你得到的结果才比较准确。这背后的理论基础是统计学里面的中心极限定理。但是这个统计理论已经远远超过了我们这门课的范畴,所以我在这里就不进行深入的讲解了,你如果感兴趣的话具体可以参考本节课的延伸阅读部分。

通过Rue LaLa的案例, 你已经了解了“先探索, 后利用"的方法。

接下来,我再带你学习,如何用这种方法,去解决这类问题中的其他具体应用。

4、“先探索、后利用”的拓展应用

下面我们来看互联网产品这个案例。

假设你是这个互联网公司的产品经理, 你们新推出了一款手机APP, 你需要做的是设计出能够获得更高用户活跃度的应用界面。但是,当该款软件刚推出时,你没有任何历史数据,你不知道每一种可能的设计界面会带来多少的用户使用需求。

在这种情况下,你也可以使用“先探索,后利用”的方法去快速找到二者的关联,并利用这个关联找到最优的界面设计。
我们来看看“先探索,后利用”的方法在这个案例中的具体操作。

第一步,“先探索”。

  • 第一,你需要探索尝试各种可能的界面设计,比如说图标是圆的还是方的、是红色的还是绿色的、是以闪烁还是滑动的形式出现在屏幕上、出现在屏幕的左边还是右边等等。

  • 第二,每种可能的界面设计需要持续一段时间,然后记录在这段时间内这种界面设计能够吸引多少用户。

  • 接下来,互联网公司可以计算出每款界面对应的单位时间的用户使用数量。

请注意,在测试方法上,互联网公司在第一步的操作可以跟刚才讲的电商定价决策的例子有所不同。在之前讲的零售定价的问题中,因为涉及到消费者价格歧视等问题,有可能法律或者市场和舆论不允许在同一时刻、同一件产品,给不同的价格卖给不同的消费者。因此,商家只能在一段时间内针对所有消费者尝试单一价格。

但是,互联网行业行业是允许不同用户看到不同的产品界面的,这在现实中也是广泛存在的。因此,为了节约时间,你可以在同一时间段尝试向不同的用户提供不同的设计界面,也就是我们常听到的A/B测试。

  • 最后,你就可以利用第一步探索出的关联性去做出最优决策了。

如果你的目标是希望吸引尽可能多的用户去使用,那么,我们直接利用第一步得到的每款界面在单位时间内的用户使用数量选择数据最好的那款界面就可以了。

我们课前思考中提到的, 在你开的咖啡店中, 如何给漫威英雄主题蛋糕定价的问题, 实际上跟刚才我们讲的Rue LaLa如何给新款裙子定价的问题是一样的,所以我就不重复阐述了,你可以在课后作业中分享你的思路。

通过上面的讲述,你可以看到,我们讲的“先探索,后利用”的方法在很多领域都可以很好地应用。

在本节的最后,我对这种方法再做一些拔高深入的说明。

虽然"先探索,后利用"的方法在现实中被广泛有效的应用,但是这种方法也存在一定的局限性。这种方法要求在探索阶段对每一种方案都要持续固定的时间。

但是在现实中,可能有些方案,可能不需要探索,或者只需要短暂探索,就能知道不合适。比如说,在本节课讲的对新款裙子的定价的例子里,假如你打算探索尝试第四种价格,即200元的零售价。在“先探索,后利用"的方法中,你需要对这个价格持续探索24小时。当你探索了8小时却只卖出了1件的时候,你利用这个数据其实可以马上意识到,这个定价不可能让你的利润最大化。

在这种情况下,你可以考虑对这节课讲的“先探索,后利用"的方法进行改进,就是当你意识到你正在探索的方案,完全不可能实现你的目标,就要果断停止继续尝试,把节省出的时间用于探索其他方案上。

这个方法本质上是把原本分两步走的“先探索,后利用”,改进为同时进行。

在过去数年里, 很多企业和学术界的人们利用这种思想提出了很多相关的算法, 比较经典的有上置信界算法(英语叫做Upper conf dence bound algor thm) , 汤普森采样算法(英语叫做Thompson sampling algorithm) 。如果你有兴趣深入了解这两种算法, 你可以参考本节课的延伸阅读材料。

很多大公司都采用了这类探索和利用同时进行的算法,并且取得了巨大的成功。

一个例子就是Netflix。Net flx利用这类算法, 向不同用户推荐不同的电影。

具体来说, 当你在Net fx网站注册账号的时候, 你首先需要告诉Net fx你喜好的电影类型是什么。这个基本讯息事实上是被Net x用来先探索你的电影偏好。在有了这个初始探索之后, Netflix会利用刚才讲过的一系列算法, 为你尝试推荐一些你可能感兴趣的电影。

接下来, Net f不断根据你对这些推荐给你的电影的反应, 比如说有的你观看了, 有的你观看一半就不看了, 有的你根本不看, 然后去进一步深入探索你究竟喜欢什么样类型的电影,并利用进一步探索出的结果持续不断给你推荐更加适合你的电影。

另一个例子就是沃尔玛公司的线上销售平台。当你在沃尔玛线上销售平台购买了产品并准备结账的时候,平台会给你推荐一些你没有购买的产品让你购买。这些给你推荐的产品是因人而异的。

比如说你购买了很多蔬菜水果,那么你在结账的时候沃尔玛平台可能给你推荐其他一些水果建议你购买。比如说另一个人购买了一些图书,那么那个人在结账的时候沃尔玛平台可能会再推荐几本同一个类型的图书。

沃尔玛这种因人而异的差异化推荐模式背后的机理就是这节课讲的“探索,利用”的算法。你放在购物车里的产品被沃尔玛用来探索你本次购物的主题和想买的东西,然后利用探索出的结果,给你推荐其他一些你没有购买,但是经过平台提醒以后你非常有可能购买的东西,从而提高单个用户带来的收入和利润。

我要强调的是,虽然你可能经常会听到一些诸如机器学习、强化学习之类的大词,但是说到底本质上就是“先探索,后利用”的方法。

因此下一次当你再听到别人谈论这些新潮的、高大上的词时,不要焦虑和恐慌,你只需要联系到本节课的内容,就会发现这些看似很深奥的东西本质上是很朴素易懂的,甚至你可以和大家分享你从本节中学到的内容,让别人对你刮目相看,觉得你能把这么复杂的问题理解得如此透彻。

5、总结

image.png

亲爱的同学,这就是本节的全部内容。现在,你已经掌握了复杂算法的决策逻辑,知道当当你面对多种可能时,应该如何找到实现目的的最优决策。

我们介绍了一种叫做“先探索,后利用”的方法。分两步骤进行。第一步是“先探索”,需要你探索尝试不同的决策方案,然后找出每种决策方案会带来什么样的结果。第二步是“后利用”。你利用在第一步探索出的关联找到能够实现你目的的最优决策,并一直执行下去。

到目前为止,你已经对需求端的运营决策有了比较深入的了解,那么下一步我们就需要进一步了解如何做好供给端的最优决策,咱们下节课不见不散。

<<<圈外商科学习笔记

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,084评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,623评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,450评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,322评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,370评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,274评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,126评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,980评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,414评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,599评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,773评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,470评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,080评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,713评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,852评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,865评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,689评论 2 354

推荐阅读更多精彩内容