思维导图

Q1：简述AB测试。

1.AB测试

2.AB测试整体过程

Q2：介绍常用的AB测试的分组方法。

1.基于设备号、用户唯一标识的尾号或者其他指标进行分组

2.基于唯一标识，通过一个固定的Hash函数对用户唯一标识进行Hash取模、分桶，将用户均匀地分配至若干个试验桶中

Q3：面对多个试验并行的情况，如何保证分组的合理性？

1.对于所有的用户，需要在所有的试验开始前将其划分为不同的域，不同域之间的用户相互独立，交集为空

2.对于一些比较重要的试验，可以专门为其划分出一部分用户，在该试验进行期间，不会针对这些用户进行其他试验，称为“独占域”。

3.针对域中的用户会同时进行多组AB测试，此时在分组的时候需要考虑分层，称为“共享域”

Q4：如何充分证明AB测试分组的随机性？

Q5：简述AB测试背后的理论支撑。

AB测试所运用的核心原理：中心极限定理

Q6：如何通过AB测试证明新版本用户的转化率高于老版本用户的转化率？

1.中心极限定理

2.原假设和备择假设

3.后续测验

Q5：当x的样本均值大于y的样本均值时，在什么条件下可以推翻原假设？

Q6：为了规避第二类错误，样本量要达到什么程度？

Q7：简述AB测试的优缺点。

1.优点

2.缺点

参考文献

1.《拿下Offer 数据分析师求职面试指南》徐麟著

实战技能（五）基于大数据的应用——AB测试

Q1：简述AB测试。

1.AB测试

2.AB测试整体过程

Q2：介绍常用的AB测试的分组方法。

1.基于设备号、用户唯一标识的尾号或者其他指标进行分组

2.基于唯一标识，通过一个固定的Hash函数对用户唯一标识进行Hash取模、分桶，将用户均匀地分配至若干个试验桶中

Q3：面对多个试验并行的情况，如何保证分组的合理性？

1.对于所有的用户，需要在所有的试验开始前将其划分为不同的域，不同域之间的用户相互独立，交集为空

2.对于一些比较重要的试验，可以专门为其划分出一部分用户，在该试验进行期间，不会针对这些用户进行其他试验，称为“独占域”。

3.针对域中的用户会同时进行多组AB测试，此时在分组的时候需要考虑分层，称为“共享域”

Q4：如何充分证明AB测试分组的随机性？

Q5：简述AB测试背后的理论支撑。

AB测试所运用的核心原理：中心极限定理

Q6：如何通过AB测试证明新版本用户的转化率高于老版本用户的转化率？

1.中心极限定理

2.原假设和备择假设

3.后续测验

Q5：当x的样本均值大于y的样本均值时，在什么条件下可以推翻原假设？

Q6：为了规避第二类错误，样本量要达到什么程度？

Q7：简述AB测试的优缺点。

1.优点

2.缺点

参考文献