一、先导入小费数据,分析数据主要有以下列:
小费值、帐单总值、顾客性别、是否吸烟、星期、时间段(午餐、晚餐)、人数
我们分析影响小费的因素,以小费占帐单总值的比值做为衡量指标。
二、分析各列与小费占比之间的关系
1、小费占比与帐单总值之间的关系
汇总数据后发现,账单最高50.81元,最低3.07元,在此区间分成10等份,算法如下:
汇总数据如下:
range tips
0.0 0.284394
1.0 0.175264
2.0 0.166640
3.0 0.160345
4.0 0.149290
5.0 0.134842
6.0 0.128517
7.0 0.109552
8.0 0.083198
9.0 0.143148
10.0 0.196812
range表示3.07到50.81之间按照10等份分类后的数据,如0代表帐单总值在3.07到3.07 + (50.81 - 3.07) /10这个区间的帐单数据
从数据中可以看到,小费占比从帐单最低值开始是逐渐下降的,直到41.262(3.07 + (50.81 - 3.07) * 8 / 10)这个区间 ,然后小费占比开始提升,但占比并未超过最低区间,如图所示:
2、分析费用与性别之间的关系
统计数据如下:
帐单总值 小费总值 总人数 次数
Female 1570.95 246.51 214 87
Male 3256.82 485.07 413 157
消费费用中,女性的帐单总消费值明显低于男性,且参与的次数也低于男性,但平均来看,女性每次带来的同伴数比男性的要稍微多一点,小费占比也比男性稍微多一点点
3、分析费用与是否抽烟的关系
smoker 帐单总值 小费总值 总人数 次数
No 2897.43 451.77 403 151
Yes 1930.34 279.81 224 93
不吸烟的帐单总数明显高于吸烟的顾客,且消费次数也高与吸烟的顾客
平均来看,不吸烟的顾客,小费占比要略高
4、分析费用与星期之间的关系
total_bill tip size percentage
day
Fri 325.88 51.96 40 3.228348
Sat 1778.40 260.40 219 13.324199
Sun 1627.16 247.39 216 12.684194
Thur 1096.33 171.83 152 9.999089
所有数据仅涉及到周四、周五、周六、周日四天,其中周六的小费和帐单收入都是最高的,percentage列表明小费占据总帐单的比例,这里周六也是最高
5、分析费用在午餐和晚餐上的区别
time total_bill tip size percentage times
Dinner 3660.30 546.07 463 28.075131 176
Lunch 1167.47 185.51 164 11.160699 68
可以看到,牛餐的进餐次数、帐单费用和小费、小费占比都是远远低于晚餐的
6、分析费用与来客次数之间的关系
total_bill tip percentage
size
1 28.97 5.75 0.869168
2 2565.89 402.84 25.852194
3 884.55 128.94 5.781960
4 1058.70 153.01 5.400113
5 150.34 20.14 0.707477
6 139.32 20.90 0.624917
从数据中可看到,当只有2名顾客来时,小费给的最多,占比最高(25%,比第二名的三人聚会高5倍),总帐单值也最高
综上所述,单个维度上看,小费给的多的情况应该是在晚餐、周六、 两个人聚会、帐单费用在偏低时占比最多,吸烟对小费的影响并不大