数据挖掘之陈列的艺术

image.png

陈列空间是线下门店与线上电商的核心差异之一,这个几乎贯穿了商品全链条的迷之问题大大增加了线下零售运营的复杂度,同时它的规律又是如此的难以捉摸,从本质上来说,我们会关心两个问题:

  1. 最小陈列量 - 至少要多少陈列量才能产生有效销售?
  2. 销量衰减规律 - 如果拉大陈列排面,销售肯定会相应增加,但是销量的增加肯定会随着陈列的增加呈现一个递减效应,那么陈列量的变化和销售量的变化之间是一个什么函数呢?

这个场景很容易联想到微观经济学中的两个话题: 量价关系的价格弹性曲线和生产函数的三个阶段。

价格弹性曲线理论很完美但是我一直对实操性心存疑惑,很多商品的生命周期不长,而且历史价格变动也不多,对于大多数商品来说可能我们没有足够的数据来拟合出那根弹性曲线,自然也就找不到最佳平衡点在哪里。而每个商品库存与销量却有海量数据可以挖掘,对于指定商品,每个门店每天的库存和销量都在变化,将指定商品的相同店存数据聚合起来就能绘制出库存与销量的函数曲线了。

生产函数

The law of diminishing marginal returns states that, at some point, adding an additional factor of production results in smaller increases in output
上面这段生产函数中关于边际产量递减规则定义正好对应我们关心的第二个问题,库存和商品正如产能函数中的成本和收益,可以把它当做一个生产函数来理解:Q=f(L, K), 因为只研究库存变化对销售的影响,我们关心的是只有一个生产要素的短期生产函数Q=f(L)

短期生产函数定义了三个核心指标

  1. 总产量:TP=f(L)
  2. 平均产量:AP=TP/L=f(L)/L
  3. 边际产量:MP=△TP/△L
    MP就是TP对L求导,也就是TP的斜率
    说明:生产函数里的L指的是Labor, 在陈列场景中这个生产要素就是库存了,但是我依然继续沿用L这个符号

结合下图的三个生产阶段来回顾一下理论知识

Production Stages

图中有三个特殊的点ABC
A点是TP斜率最大的地方,也就是MP的最大值
B点是AP最大值,也是AP与MP的交汇点(对AP求导就可以推出AP=MP时AP最大)
C点是TP最大点,也是MP等于零的点

根据这些点把生产过程划分成三个阶段(颜色标记)

第一阶段 - 横轴B点之前是平均产量递增阶段
B点之前AP一直处于增长

第二阶段 - B点与C点之间是平均产量递减阶段
AP达到最大值并开始下降,同时TP升幅变缓。

第三阶段 - C点之后是边际产量为负阶段
MP为零,TP达到最大值并开始下降
这个阶段的意思大概就是说三个和尚没水吃,不过我们这个场景中基本不会到达这个阶段,随着陈列量的增加,销量最多持平。

对于生产函数而言第一阶段和第三阶段都是不合理的,我们要找寻的是合理的第二阶段区间范围,即起点为when MP=AP, 终点为when MP=0.

数据可视化

现在回到现实世界中,抽了100个商品的几千万条数据聚合可视化,生成TP, AP, MP曲线
观察B商品的AP和MP, 似乎和理想中的模型不一样,两者多次交叉,当库存为6时MP最大


b-ap-tp

再观察B商品的TP和AP, 当库存为7时出现第一个TP峰值,而AP也从此开始一路下滑


b-ap-mp

拟合函数

从上图看出总产量TP受库存数量的随机影响比较强,随着库存的增加有时销量反而会下滑。
所以可以考虑把总产量曲线用多项式拟合一下得到稳定平滑的曲线,再重新计算对应的AP和MP,最后绘制图表呈现结果,绘制曲线时虚线为实际TP, 实线为拟合TP, 加号为AP, 星号为MP.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_excel("d:/dev/stock-sale-b.xlsx", nrows=30)

x = df.loc[:,'stock']
y = df.loc[:,'sale']
z = np.polyfit(x, y, 4) #四阶系数

p = np.poly1d(z) #拟合函数
      
ap = p(x)/x # 平均产量

def f(x, z): # 求导函数
    return z[0]*(x**3)*4 + z[1]*(x**2)*3 + z[2]*x*2 + z[3]

mp = f(x, z) #边际产量
print(mp) 

plt.plot(x, y, '.', x, p(x), '-', x, y, '--', x, ap, '+', x, mp, '*')
plt.ylim(0, np.max(y))
plt.show()

这段代码中多项式的选择和nrows的选取都会对结果带来影响,尤其是nrows的条数应该根据商品的实际平均销量动态设置,效果会更好。

观察B商品,现在能看到库存为22时MP到达波谷,库存为4时AP与MP交汇(对应B点),而肉眼观察实际产量感觉库存为7应该是最小库存,这是因为前期的局部拟合函数与实际TP差异较大,所以所以在寻找最小库存的时候应该把nrows设置的更小一些,如果设为15再运行一次代码[如图b-polyfit-2]就会看到AP和MP在库存为7时交叉了,所以7和22之间可能就是B商品库存陈列的合理范围,小于下限则销量大幅下滑,大于上限对销量提升也不大。


b-polyfit-1
b-polyfit-2

再抽取一个销量比较低的X商品观察,将nrows降为20,区间范围是在2(交叉点)到12(MP波谷)之间,因为前期的局部拟合函数已经偏差很小了,所以也不用改变nrows来再次计算最小库存。


x-polyfit
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,816评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,729评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,300评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,780评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,890评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,084评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,151评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,912评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,355评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,666评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,809评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,504评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,150评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,121评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,628评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,724评论 2 351