识别一个唯一的Android客户端常用的方法是: IMEI,由于Android系统的开放性,可以通过修改系统参数来动态改变这个值,即使是用其他替代的所谓唯一值,例如蓝牙地址,mac地址,也很容易被篡改。一个不懂技术的人都可以轻易做到,淘宝上充斥着这些作弊的方案:
https://item.taobao.com/item.htm?spm=a230r.1.14.1.7uAFxs&id=521866245606&ns=1&abbucket=12#detail
在这样的环境下,怎么样识别出一个作弊的用户呢?我觉得与其寻找一个难以被修改的所谓唯一值,不如换个思路,识别出作弊用户的特征。这个特征我认为有一个很关键,就是设备的硬件参数,例如屏幕像素尺寸(Displayer Resolution),屏幕像素密度(DIP),CPU主频,内存大小等等。这些参数不能作为一个设备唯一值,但是作弊用户的数据集在这些维度上的聚类密度
非常高。可以认为一个设备参数聚类密度
非常高的用户,就是系统里所谓的不受欢迎用户
。
在做数理分析的时候,要做的是:
建立合适的维度
选取核心指标(这些核心指标是通过维度的数据用数学公式计算得到的)
去伪存真,过滤掉异常值(某些额外数据的采集,就是为了识别这些异常值;例如我今天想采集通过这一个路口的所有车的品牌,如果我只记录品牌信息,我可能会发现这一个路口通过的车很多是丰田车,如果我同时记录车牌信息,我就会发现这特么有一个神经病来来回回兜圈)
运用到实际环境中解释指标(指标只是建模的数学工具,要用合理的模型来解释指标)
产品经理要有基本的数学常识。BTW,我是一个高等数学的学渣,不过我线性代数是92分(前10%),高数和线代用到的是不同方式的思维。最后想说的是:
对自己的不足的认识与日俱增,然而并没有接受就这副样子的自己。我的心态比去年又年轻一岁。那大概是因为,也发现了自己的一点点优秀的地方。