对于一般的业务客流量就是简单sum(person)
但是在酒店,住宿的问题上就陷入了困难,一般的酒店订单会包含预定房间数,人数
问题1:如果使用sum(person),直接统计,可能的情况是用户预定的房间数只能住2个人,但是事实上就会出现超过2个人的情况,其实这个问题也不大,一般的统计酒店是使用间夜量的(一天的实际房间数总和),但是如果我们要统计客流量的化,就要与产品/业务方达成一致
问题2:入住的离店那天算不算人次(入住多天的情况,如果只有一天那肯定算),这个问题就有点复杂了
如果不算,站在用户付费的角度,用户并没有为离店这一天付费,但是站在自然人到达这个城市的角度来说应该是算的;我们考虑一种情形,用户到某城市来旅游,有如下交易,购买一张门票,来和去的火车票各一张,酒店入住一晚,我们统计的范围不是按照真实的去重用户活动角度来考虑的,只要发生的交易我们就要统计,所以虽然这个用户只在这个城市两天的时间,但是却产生了度量为5的客流量,以单纯的酒店角度来说离店确实应该记录一个人次,但是站在所有的bu的角度来说,不应该记录
如果算,那么就要修改酒店的逻辑了(对于多天入住的情形),对于如何修改也是一个复杂的问题,因为会对之前的度量口径产生深远的影响
主要要考虑的问题就是离店那天的人次,间夜量,平均下来的金额应该怎么处理
统一交易额和自然人的角度,离店那天是不算间夜量的,算人次的(统一口径),金额是不算的(null)
但是照上面的修改,会对统计的口径产生影响,比如最直接的均价的处理,由于离店的条数出现的数仓表中,度量的人次就变多了,导致均价变小,同时年龄分布,性别分布可会遭遇问题(如何解决修改所带来的影响)