% 的忒修斯之船:当 AI 把 GPL 代码「洗」成 MIT,开源的「灵魂」还在吗?

不足1.3%的忒修斯之船:当AI把GPL代码「洗」成MIT,开源的「灵魂」还在吗?

一个maintainer的「魔法」

Dan Blanchard决定重写chardet。

这个Python编码检测库,每月被约1.3亿个项目依赖(据维护者称)。它的7.0版本发布于2026年3月初,速度提升了48倍,支持多核并行,从底层彻底重构。Anthropic的Claude被列为贡献者。

许可证从LGPL变成了MIT。

据Blanchard自述,他从未直接查看过原有源代码。他只把API和测试套件喂给Claude,要求它从零重新实现。JPlag检测结果显示:新代码与任何历史版本的相似度低于1.3%。他的结论很明确——这是独立的新作品,无需继承LGPL的约束。

Mark Pilgrim,chardet的原作者,在GitHub上开了issue反对。LGPL要求修改版必须以相同许可证分发,而Pilgrim认为,一个充分暴露于原代码库的AI重实现,不可能算作洁净室成果。

争议迅速分裂了开源社区。

Flask作者Armin Ronacher公开欢迎这次重新许可。Redis作者Salvatore Sanfilippo(antirez)发表长文,从版权法和GNU历史中为AI重写辩护。两人殊途同归:Blanchard的行为是合法的。但素材1作者对此提出伦理质疑——

Law sets a floor; clearing it does not mean the conduct is right.

正如评论者所言:合法,等于正当吗?


法律上的「干净」,伦理上的「灰色」

antirez的辩护很有力。他搬出历史:GNU项目当年重写UNIX用户空间,合法。Linux的诞生,合法。版权法禁止复制「受保护的表达」——实际代码、结构、具体机制——但不保护思想或行为。AI辅助重写占据同样的法律地带。

这个法律分析大致正确。但antirez的下一步操作,让论证变了味。

他把法律结论直接当作社会结论,用的历史类比,细究起来反而反驳了他自己。

GNU重写UNIX时,向量是从专有到自由。Stallman利用版权法的边界,把专有软件转化为自由软件。那个项目的伦理力量,不来自法律许可性——而来自方向,来自它在扩张公地的事实。

chardet案的向量完全相反。

一份copyleft许可证保护的软件——保证用户有权研究、修改、以相同条款再分发衍生作品——被重写成宽松许可,不再携带这种保证。这不是扩张公地的重实现,这是拆除保护公地的围栏

基于chardet 7.0的衍生作品,没有义务共享源代码。这份义务,原本覆盖每月1.3亿次下载,现在消失了。

antirez没有处理这个方向差异。他援引GNU先例,但那个先例是他的反例,而非支撑。


当「规格」成为新的知识产权

AI时代暴露了一个被忽视的现实。

If source code can now be generated from a specification, the specification is where the essential intellectual content resides.

如果源代码可从规格生成,规格才是核心知识产权所在。

这颠覆了GPL的设计假设。Copyleft的「传染性」建立在代码衍生关系上——你修改了我的代码,你的修改就是我的代码的衍生,因此必须共享。但AI重写切断了这条链条。输入的是规格(API、测试套件、文档),输出的是「全新」代码,相似度低到检测工具都认不出来。

传统法律框架正在失效。

据Open Future委托阿姆斯特丹大学信息法研究所的研究,Share Alike/CopyLeft条款在AI训练中面临设计层面的挑战。关键概念——「改编作品」「技术修改」——在AI工作流中基本缺席。多数SA/CL许可证不适用于版权例外(如欧洲的TDM例外或美国的合理使用)。结果是:SA/CL许可证在AI模型训练场景下基本失效

我们保护的是代码表达,而非思想。但当思想可以一键转化为表达,这条界限还站得住吗?


不足1.3%的忒修斯悖论

古希腊的忒修斯之船:如果所有木板都被替换,还是同一艘船吗?

AI重写提出了2.0版本——这提出了一个变体问题:如果替换过程由黑箱完成,且原船的「使用条款」被一并移除?

低于1.3%是技术事实。但功能等价、API兼容、测试通过——这三重叠加,意味着实质同一性。JPlag测量的是代码表面相似度,它不测量架构知识从何而来,不测量设计决策的继承关系,不测量「重写」本身是否构成对原作的系统性依赖。

测量方式本身是有选择性的。

我们得到了一个悖论:法律上全新的作品,技术上彻底的替代,伦理上却可能是精心设计的逃逸。不是剽窃,而是「许可证转换」——用AI的随机性作为漂白剂,把copyleft的粘性洗掉。


谁将收割这个漏洞?

乐观派看到了希望。

「我们的先辈争取过重写企业软件的权利,即使所谓的所有者不喜欢。」AI让个人开发者获得对抗大公司的武器,可以自由重写专有软件,打破垄断。

但悲观派的警告更刺耳。

The implications will not end up being anti-large-corporation or pro-sharing. If you can prevent someone from re-implementing a spec... it will be the large corporations that exercise this power as usual.

大公司拥有算力和法律资源。它们能规模化利用这个「合法漏洞」,而社区不能。GPL的天才之处,在于利用版权法——专有企业不敢dismantle的东西——为公众锁定永久公共品。现在,同样的机制可能被反向利用:用AI重写绕过copyleft,把公地圈回私有领地

结构性不对称是真实的。个人开发者用Claude重写一个库,是新闻。Google用内部模型批量「净化」copyleft代码库,只是成本核算。


没有答案,但必须提问

技术社区需要新的社会契约。

Blanchard在技术层面无可挑剔。他遵循了流程,尊重了检测,清除了法律障碍。但在共同体伦理层面,他打开了潘多拉魔盒——不是因为他做错了什么,而是因为我们还没有共识来判断什么是对的

据Open Future的研究,社区面临两条政策路径:维持版权例外的优先性,或探索新的治理机制。但无论哪条路,都需要主动选择,而非被动接受「合法即正当」的默认逻辑。

每个使用AI重写的开发者,都在参与定义「什么是同一艘船」。

你的选择,你的测量方式,你的沉默或发声——都在塑造下一个时代的开源伦理。不是作为法律条文的执行者,而是作为共同体的成员。

你站在哪一边?

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容