第20章 推荐算法里的深渊

林哲是在凌晨四点发现那个问题的。

他已经在机房里连续待了第五个晚上,桌上的泡面盒摞了三层,咖啡机的水箱见了底。这一周他做的事情很简单——把那一百一十七个高频沉默用户的全部行为日志一条一条地人工阅读。不是跑脚本,不是用算法分析,是用自己的眼睛一行一行地看。每条日志记录着时间戳、操作类型和停留时长。枯燥到连他自己都觉得这不像一个工程师该做的事。

但他看到了算法没看到的东西。

用户#0331,女,十七岁,高二。系统记录显示,九月十二日她第一次做测评,分数是73分。系统弹出了标准反馈:“您的情绪稳定性略低于同龄人平均水平,建议定期关注。”她点掉了弹窗,继续浏览。然后她点开了系统推荐板块——“你可能想了解”。

推荐算法给她推送的第一篇文章是:《如何判断自己是否有社交焦虑》。她看了六分钟。第二篇是:《为什么你总觉得别人不喜欢你》。她看了十一分钟。第三篇是:《高敏感人群生存指南》。她看了二十三分钟,从头到尾,退出之后又点进去看第二遍。

从那以后,她每天的测评分数持续下移——68、64、59、55。算法捕捉到了这个趋势,并根据她的低分调整了推荐内容的类型。更多焦虑相关的文章,更多抑郁自测的引导,更多“你可能有以下心理问题”的清单。

林哲把她的日志从头划到尾。他发现了一个可怕的循环:测评分数下降→算法推荐更多负面内容→她阅读负面内容后自我标签化加重→下一次测评分数继续下降→算法推送更密集的心理问题内容。这个循环持续了整整五周。

没有一次,算法给她推送过《如何建立健康的人际关系》。没有一次推送过《运动对情绪的积极影响》。没有一次在推荐栏里出现“你可能只是想太多了,这很正常”。

林哲在纸上飞快地记下几行小字:“算法没有恶意。它只是把‘她关注什么’翻译成‘她需要什么’,然后加倍投喂。如果她点击的是焦虑,它就给她更多焦虑。如果她搜索的是孤独,它就告诉她——你确实是孤独的。”

他推开键盘,用手指揉了揉眉心。他想起自己设计推荐算法的那一周。产品需求文档写得很清楚——根据用户测评分数和浏览行为,推送个性化心理健康内容,提高用户参与度和留存率。参与度、留存率。标准的互联网产品指标。他当时没有觉得任何不妥。他觉得自己在做一件善意的事——让需要帮助的人更快地找到相关内容。

但他没有想过,一个在凌晨浏览“抑郁症状”的十七岁女孩,需要的不是更多关于抑郁的内容。她需要的是一条跳出那个深渊的绳子。而算法递给她一把铲子,说:你往下挖,这里还有更多。

机房的窗户外面透进一点点青灰色的光,天快亮了。林哲关掉电脑屏幕,趴在桌上闭了十分钟眼睛,脑子里还在滚那些数据。他想起赵小雅跟他说过一句话:“系统说的是科学。”她把算法的话当成科学,把科学当成真理,把真理当成自己活着的坐标。

他坐起来,重新打开屏幕,调出推荐算法的底层代码。他在核心逻辑里找到了一行注释,是自己当年写的——“基于用户兴趣画像进行内容匹配,最大化用户时长。”他盯着那行字看了很久,然后用红色标记把它整段划掉。

下午,他把修改方案带到了辅导室。苏晓晨正在整理程立雪事件的访谈录音,周明远在给绿萝修剪枯叶。林哲把笔记本放在旧茶几上,页面上是一个树状图,分支层层展开,像某种复杂的根系。他指着图上一个不起眼的节点说:“系统不是只给了标签。它还给了内容。而且它给的内容,正在验证它自己贴的标签。”

他讲了那个#0331用户的案例。从73分掉到55分,五周之内,系统让她相信了“我就是不正常”。而触发这个过程的,不是测评本身,是测评之后那句看似无害的“你可能想了解”。

“问题出在推荐算法。”林哲说,“它没有害人的意图,但它有一个害人的循环。我当年写它的时候唯一的目标是匹配用户兴趣,提高内容点击率——标准的互联网产品逻辑。但我忘了,对于一群正在试图理解自己的青少年,‘你感兴趣的内容’不该等同于‘你正在痛苦的内容’。”

苏晓晨放下手里的录音笔,她的表情不是愤怒,是某种被印证了预感的沉重。“所以那些孩子们在系统上‘参与度’越高,就越容易被困在同一个信息茧房里——一个由自己最初的低落情绪搭建起来的茧房。”

“对。你测出焦虑,它就给你看焦虑。你测出社交回避,它就给你看社交回避。然后你越来越确定——我就是焦虑,我就是回避。这就是全部的我。”他停了一下,“程立雪的纸条上写着‘老师说我不正常’。现在不需要老师了——算法替所有人说了。而且说得比老师更精准、更频繁、更让你无法反驳。”

辅导室安静了一瞬。窗外的梧桐树有只鸟叫了两声飞走了。

周明远放下剪刀,把剪下来的枯叶拢进垃圾桶里。他转过身来,看着林哲的笔记本上那条被红色标记划掉的注释——“最大化用户时长”。他摘下老花镜,慢慢开口,声音不大但很稳:“所以你当年写的那个逻辑,它不是在匹配需求。它是在创造需求——创造一种让学生更长时间停留在负面情绪里的需求。而你管这个叫‘参与度’。”

林哲没有辩解。他把笔记本翻到下一页,上面是连夜写出来的一份修改草案。内容推荐不再基于单一的兴趣匹配,而是引入一个他暂时命名为“情绪多样性”的干预策略——当一个学生连续浏览某一类负面心理内容超过阈值时,系统不再推送更多同类内容,而是推送完全不同方向的东西:运动、手工、宠物、一段安静的音乐、一本十六岁少年写给未来自己的信。

“它不再是单纯推荐她点开什么。它会问她——你愿不愿意试试看不点开的那个。”林哲说。

苏晓晨拿过那份草案从头读到尾。读到最后一页时,她忽然想起什么:“赵小雅之前跟我说过,她每次做完测评之后都会刷很久的推荐内容,越刷越觉得自己真的有问题。我那时候以为她说的‘问题’是指测出来的分数。现在才知道,她说的‘问题’是刷完之后对自己的判断。”

“她还在刷吗?”

“最近少了。”苏晓晨合上草案,“她开始每天下午来辅导室,跟周老师聊半个小时,然后去美术室画一幅画。她说画画的时候脑子里没有分数。”

周明远拿起他的旧茶杯,吹了吹浮在上面的茶叶,看着林哲:“你记不记得你在晨会上展示过一条曲线,全校情绪整体稳中向好?那时候你觉得那是成绩。现在你想怎么说?”

“现在我想说——”林哲合上笔记本,“那条曲线每上升一点,可能是有人更愿意说自己真实的状态,但也可能仅仅是有更多用户学会了怎样在选项里做出提高分数的选择。我不知道哪个比例更高。算法也不知道。这才是最可怕的地方。”

辅导室里一片灰蒙蒙的秋日光。绿萝刚被剪掉枯叶的伤口还在渗着透明的汁液。周明远拿起窗台上的水壶,慢慢把水浇进花盆,然后放下水壶,在自己的旧笔记本上写下一行字:

“人类对数据最大的误解,是以为数据会说实话。数据只说它被问到的话。而那些我们忘了问的问题,才是深渊本身。”

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容