读当我点击时,算法在想什么?03算法在监视我们(下)

读当我点击时,算法在想什么?03算法在监视我们(下).png

1. 没有公平,只有悖论

1.1. 这个世界上不存在公平的方程式

1.2. 公平只是人类的美好愿望,它是我们的一种感觉

1.3. 数学的美妙之处在于我们可以通过它证明普适的结论

  • 1.3.1. 每当我们为了做正确的事情而向数学求助的时候,它给我们的答案始终如一:公平不止源于逻辑

1.4. 肯尼斯·阿罗(Kenneth Arrow)的“不可能性定理”(impossibility theorem)告诉我们,不存在一个制度能够让人们在三个政治候选人之间进行选择时,又公平地反映所有投票者的喜好

1.5. “不作恶”(Don’tbe evil),但现在谷歌公司却不怎么提它

1.6. 我们可以全力以赴,但永远无法确定我们所做的事情就是正确的

1.7. 算法中的偏见与歧视

  • 1.7.1. 不太担心算法会对我们做出精确得可怕的预测,而是更担心人们推销算法的方法

  • 1.7.2. 误报

    • 1.7.2.1. False Positive,也称假阳性
  • 1.7.3. 漏报

    • 1.7.3.1. False Negative,也称假阴性
  • 1.7.4. 当我们生活在一个方方面面都不公平的世界中时,我们就不能指望我们的算法完全公平

2. COMPAS算法

2.1. COMPAS是一个黑箱,这意味着人们很难,甚至无法对其内部一探究竟

2.2. COMPAS算法的发明人蒂姆·布伦南(Tim Brennan)是该算法的供应商Northpointe公司的董事

2.3. 首先使用主成分分析法旋转和降维数据,然后使用根据过往记录做出的回归模型来预测某个犯人是否会再次犯罪

2.4. 差异本身并不意味着该算法存在偏见,因为在黑人和白人犯人中,再次犯罪的比例有所不同

  • 2.4.1. 52.6%的黑人罪犯在两年内因另一项罪行被逮捕

  • 2.4.2. 仅有 39.4%的白人罪犯因另一项罪行被抓

2.5. 误报指的是一个不会在未来犯罪的人被列为高风险罪犯的情况,也就是说模型做出了肯定却错误的预测

  • 2.5.1. 误报却意味着你可能被拒绝假释或者被判比应得刑期更长的监禁时间

2.6. 误报率指那些没有再次犯罪却被列为高风险罪犯的人数除以未再犯的总人数

2.7. 真阳性(True Positive)的判断是公平的:算法预测你存在犯罪风险,而你也确实如此

2.8. 发生在白人罪犯身上的则更多的是漏报,即某个人被归入了低风险人群,但他却再次犯罪

  • 2.8.1. 白人罪犯的漏报率是461/966≈47.7%

  • 2.8.2. 黑人罪犯则是 532/1 901≈28.0%

2.9. 高漏报率意味着很多本应被拘留的人却重新获得自由并犯下了罪行,这对于社会来说是一个严重问题

  • 2.9.1. 几乎有一半再次犯罪的白人在评估中被算法贴上了低风险的标签

2.10. 黑人有可能因为它被无辜地判以更久的刑期,而会犯下更多罪行的白人则被释放

2.11. 任何其他结果都表明这个算法对这两个种族做了不公平的校准,因为那意味着它必须对白人和黑人罪犯使用不同的评估方法

3. 数据炼金术士

3.1. 算法在数以百计的维度中“思考”,处理海量数据,并了解我们的行为

3.2. 当需要理解这个世界的时候,数学模型通常战胜不了人类

3.3. 主观属性可以通过听歌环节进行量化,在这个过程中人类实验对象会聆听成组的歌曲,并说出他们认为最悲伤或最适合跳舞的一首歌

3.4. 数据炼金术这个概念完美地体现了现代数字营销的运作方式

3.5. 最简单的方法往往就是最好的

3.6. 关于公司滥用私人信息的阴谋论不太可能站得住脚

  • 3.6.1. 更合理的解释是,数据炼金术士们发现了我们行为中的统计关系,并帮助这些公司向我们推送定向广告

3.7. “阴魂不散”的广告还有另一个主要来源,那就是重定向

  • 3.7.1. 我们搜索过阿尔加维的旅行,只是忘记了

  • 3.7.2. 但是网络浏览器却已经记住这些信息并反馈给了XY集团,于是后者根据这些信息为我们推荐最好的酒店房间

3.8. 我们长时间盯着我们的手机和屏幕,这使得广告似乎能够不时地读懂我们的想法

3.9. 真正聪明的并不是算法

  • 3.9.1. 这些才智来自数据炼金术士,他们把数据和自己对客户的理解相结合

  • 3.9.2. 由于算法的预测依赖于点“赞”的数据,它对我们行为的预测,在精确性上不及我们身边的人

  • 3.9.3. 只有被了解其局限性的人使用,算法才能发挥它最大的作用

4. 业余人士打败了算法

4.1. 人类总是理所当然地认为技术是客观公正的,所以那些技术未能带来公正的时候往往是最危险的时候

4.2. 一个被广泛用于预测再犯的大型商业软件,并不比那些几乎没有刑事审判经验的人根据在线调查问卷结果所做的预测更准确、更公平

4.3. 结论并不意味着算法毫无用武之地

  • 4.3.1. 如果算法的表现与人类的水平相同,那么计算机就会获胜,因为它们处理数据的速度远非人类可比

  • 4.3.2. 模型虽然远远不够完美,但确实非常有用

4.4. 对许多犯人来说,接受面谈和评估是一个有损人格的过程,然而这个过程似乎并没有提高再犯率预测的水平

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容