不足1.3%的忒修斯之船：当AI把GPL代码「洗」成MIT，开源的「灵魂」还在吗？

一个maintainer的「魔法」

Dan Blanchard决定重写chardet。

这个Python编码检测库，每月被约1.3亿个项目依赖（据维护者称）。它的7.0版本发布于2026年3月初，速度提升了48倍，支持多核并行，从底层彻底重构。Anthropic的Claude被列为贡献者。

许可证从LGPL变成了MIT。

据Blanchard自述，他从未直接查看过原有源代码。他只把API和测试套件喂给Claude，要求它从零重新实现。JPlag检测结果显示：新代码与任何历史版本的相似度低于1.3%。他的结论很明确——这是独立的新作品，无需继承LGPL的约束。

Mark Pilgrim，chardet的原作者，在GitHub上开了issue反对。LGPL要求修改版必须以相同许可证分发，而Pilgrim认为，一个充分暴露于原代码库的AI重实现，不可能算作洁净室成果。

争议迅速分裂了开源社区。

Flask作者Armin Ronacher公开欢迎这次重新许可。Redis作者Salvatore Sanfilippo（antirez）发表长文，从版权法和GNU历史中为AI重写辩护。两人殊途同归：Blanchard的行为是合法的。但素材1作者对此提出伦理质疑——

Law sets a floor; clearing it does not mean the conduct is right.

正如评论者所言：合法，等于正当吗？

法律上的「干净」，伦理上的「灰色」

antirez的辩护很有力。他搬出历史：GNU项目当年重写UNIX用户空间，合法。Linux的诞生，合法。版权法禁止复制「受保护的表达」——实际代码、结构、具体机制——但不保护思想或行为。AI辅助重写占据同样的法律地带。

这个法律分析大致正确。但antirez的下一步操作，让论证变了味。

他把法律结论直接当作社会结论，用的历史类比，细究起来反而反驳了他自己。

GNU重写UNIX时，向量是从专有到自由。Stallman利用版权法的边界，把专有软件转化为自由软件。那个项目的伦理力量，不来自法律许可性——而来自方向，来自它在扩张公地的事实。

chardet案的向量完全相反。

一份copyleft许可证保护的软件——保证用户有权研究、修改、以相同条款再分发衍生作品——被重写成宽松许可，不再携带这种保证。这不是扩张公地的重实现，这是拆除保护公地的围栏。

基于chardet 7.0的衍生作品，没有义务共享源代码。这份义务，原本覆盖每月1.3亿次下载，现在消失了。

antirez没有处理这个方向差异。他援引GNU先例，但那个先例是他的反例，而非支撑。

当「规格」成为新的知识产权

AI时代暴露了一个被忽视的现实。

If source code can now be generated from a specification, the specification is where the essential intellectual content resides.

如果源代码可从规格生成，规格才是核心知识产权所在。

这颠覆了GPL的设计假设。Copyleft的「传染性」建立在代码衍生关系上——你修改了我的代码，你的修改就是我的代码的衍生，因此必须共享。但AI重写切断了这条链条。输入的是规格（API、测试套件、文档），输出的是「全新」代码，相似度低到检测工具都认不出来。

传统法律框架正在失效。

据Open Future委托阿姆斯特丹大学信息法研究所的研究，Share Alike/CopyLeft条款在AI训练中面临设计层面的挑战。关键概念——「改编作品」「技术修改」——在AI工作流中基本缺席。多数SA/CL许可证不适用于版权例外（如欧洲的TDM例外或美国的合理使用）。结果是：SA/CL许可证在AI模型训练场景下基本失效。

我们保护的是代码表达，而非思想。但当思想可以一键转化为表达，这条界限还站得住吗？

不足1.3%的忒修斯悖论

古希腊的忒修斯之船：如果所有木板都被替换，还是同一艘船吗？

AI重写提出了2.0版本——这提出了一个变体问题：如果替换过程由黑箱完成，且原船的「使用条款」被一并移除？

低于1.3%是技术事实。但功能等价、API兼容、测试通过——这三重叠加，意味着实质同一性。JPlag测量的是代码表面相似度，它不测量架构知识从何而来，不测量设计决策的继承关系，不测量「重写」本身是否构成对原作的系统性依赖。

测量方式本身是有选择性的。

我们得到了一个悖论：法律上全新的作品，技术上彻底的替代，伦理上却可能是精心设计的逃逸。不是剽窃，而是「许可证转换」——用AI的随机性作为漂白剂，把copyleft的粘性洗掉。

谁将收割这个漏洞？

乐观派看到了希望。

「我们的先辈争取过重写企业软件的权利，即使所谓的所有者不喜欢。」AI让个人开发者获得对抗大公司的武器，可以自由重写专有软件，打破垄断。

但悲观派的警告更刺耳。

The implications will not end up being anti-large-corporation or pro-sharing. If you can prevent someone from re-implementing a spec... it will be the large corporations that exercise this power as usual.

大公司拥有算力和法律资源。它们能规模化利用这个「合法漏洞」，而社区不能。GPL的天才之处，在于利用版权法——专有企业不敢dismantle的东西——为公众锁定永久公共品。现在，同样的机制可能被反向利用：用AI重写绕过copyleft，把公地圈回私有领地。

结构性不对称是真实的。个人开发者用Claude重写一个库，是新闻。Google用内部模型批量「净化」copyleft代码库，只是成本核算。

没有答案，但必须提问

技术社区需要新的社会契约。

Blanchard在技术层面无可挑剔。他遵循了流程，尊重了检测，清除了法律障碍。但在共同体伦理层面，他打开了潘多拉魔盒——不是因为他做错了什么，而是因为我们还没有共识来判断什么是对的。

据Open Future的研究，社区面临两条政策路径：维持版权例外的优先性，或探索新的治理机制。但无论哪条路，都需要主动选择，而非被动接受「合法即正当」的默认逻辑。

每个使用AI重写的开发者，都在参与定义「什么是同一艘船」。

你的选择，你的测量方式，你的沉默或发声——都在塑造下一个时代的开源伦理。不是作为法律条文的执行者，而是作为共同体的成员。

你站在哪一边？

% 的忒修斯之船：当 AI 把 GPL 代码「洗」成 MIT，开源的「灵魂」还在吗？