一 题目
客户分层:按总销售额划分客户等级
-- 大客户(前 20%)
-- 中客户(中间 60%)
-- 小客户(后 20%)
二 数据表结构:
数据表 orders 是基于 Kaggle 网站的 Superstore 销售数据整理得到,本次涉及的列:
1. customer_id:客户ID
2. sale:销售额
三 解答1: NTILE()
代码:
运行结果:
四 解答2: PERCENT_RANK()
代码:
运行结果:
五 对比
1. NTILE():
本题用法:分5份,标签通过rnk值映射
精度:整体均分,但不保证精确比例
使用场景:快速粗分层、样本量适中
2. PERCENT_RANK()
本题用法:百分比分层,再用范围映射
精度:更细腻准确,可严格按照百分比控制
使用场景:对分层比例有严格要求、大样本
— END —
数据分析,一起努力。
Thryze|数据分析 × AI能力成长 × 效率工具探索