大数据是最近最火的几个名词之一,而大数据的应用里大众接受程度最广的一项就是个性化推荐。打开网易云音乐评论区,多少人觉得终于找到了那个最懂你的“它”,淘宝和亚马逊总能推送一些我想买的东西,咦,微博怎么知道我想关注这个大V?仿佛现在的推荐越来越准了,越来越“个性”了。
其实仔细想想,这些推荐算法并不是在找“个性”,而是在找“相似”。你之所以收到那些推荐,是因为有千千万万个和你相似的人曾经做出类似的选择,喜欢过同样的东西。你觉得推荐越准,其实说明你和某类群体越相似,反而是“不个性”的体现。
不过我并不想抨击个不个性这件事情,因为人本身就是在追求相似与不同的螺旋中前进的,但大数据给我们带来了另一个隐患,那就是stereotype,即一种对某一类人群的刻板印象,这种东西很可怕。
美国的汽车保险金额计算方法是不透明的,保险公司各自都有自己的计算方法,选取一些客户的feature根据某些模型来计算保费。人们会发现男性的保费比女性要高,原因就是“数据分析”显示,男性事故概率比女性高。这乍一看好像没什么,但是细细想想就会很不舒服,为什么我要被其他男性“代表”?为什么我的个体差异性就要这样被抹杀?以前我们批判某些刻板印象的言论总会说:“你怎么知道这些特征是普遍存在的,你做过数据调查么?”。好了,现在我们真的有了数据支撑这些观点,然后呢?就可以光明正大的给所有人按照模型贴上标签了么?我们就可以根据大数据的结果多征收黑人“治安管理费”,或是在企业招聘的时候直接过滤某些大学毕业的学生?
大数据实际上是人类利用现代科技继续向“效率”端狂奔的手段,这些数据对企业、政府甚至个人来说很诱人,因为可以极大的提高它们的效率,但是另一方面,对个体特征的忽略也极大地抑制了公平。我希望我们发展大数据的同时,也能时常思考一下这些问题。
我本人也从事着大数据相关的工作,我也会希望我的模型很准,但是我更希望,我们每个人,终究不会被数据所刻画。“无法预测”,将是人类头顶闪耀着的最美的光。所以,比起“你真懂我”,我更愿意听见的是
“你懂个蛋”