近日,两位畅销小说作家对 OpenAI 提起诉讼,声称其旗下的 AI 聊天机器人 ChatGPT 侵犯了他们的著作权。这是继上周一群匿名人士集体起诉 OpenAI 窃取个人信息后,该公司在一周内遭遇的第二起官司。这些案件不仅反映了 AI 技术的飞速发展,同时也暴露了现有法律体系在应对新技术挑战时的滞后和困境。
ChatGPT 是一款基于 GPT-3 模型的 AI 聊天机器人,能够与用户进行自然语言交流,生成各种类型的文本内容,包括新闻、故事、诗歌、歌词等。ChatGPT 的强大能力源于其庞大的训练数据集,据估计,GPT-3 模型使用了超过3000亿字的文本数据,其中包括大量的书籍、文章、网站和帖子。然而,这些数据中有多少内容是经过授权,合法引用,或者是属实的呢?OpenAI 从未公开透露过这些信息,也没有向数据来源方支付任何费用或补偿。
这就引发了两个方面的争议:一是版权问题,二是隐私问题。对于版权问题,两位作家发现 ChatGPT 能够生成他们作品的非常准确的摘要,因此怀疑自己的作品被用作训练数据,而他们并没有授权或因此获得补偿。他们认为,这种行为侵犯了他们的著作权,并要求 OpenAI 停止使用他们的作品,并赔偿相应损失。对于隐私问题,一群匿名人士指控 OpenAI 从互联网上秘密抓取了大量包含个人信息的数据,用于训练 ChatGPT,而这些数据并没有经过他们用户的同意或知情。他们认为,这种行为侵犯了他们的隐私权,并要求 OpenAI 删除这些数据,并赔偿损失。
这些案件给现有法律体系带来了巨大的挑战。在传统的法律框架下,针对网络爬虫、复制他人作品等行为,权利人可以依据反不正当竞争法和著作权法维权;使用他人作品的个人或企业也可以提出基于“合理使用”原则的抗辩,声称自己是为了学习和研究的目的使用他人作品,因而不构成侵权。但是,在 AI 技术的推动下,这些行为发生了量变和质变。一方面,AI 技术可以利用海量的数据进行训练和生成,涉及到数以万计甚至百万计的权利人和用户,如果每一个都要进行授权或补偿,将会产生巨大的成本,并引发相当显著的难题;另一方面,AI 技术可以产生出高度相似甚至完全相同的内容,涉及到创意、表达、风格等多个层面的模仿和借鉴,如果每一个都要进行判断或注明来源,将会引起一定程度的混乱。
因此,我们需要对现有的法律体系进行修订和完善,以适应 AI 技术的发展。一方面,我们需要明确 AI 技术使用数据的合法性、合理性和必要性,建立数据的来源、归属、使用、共享等方面的规范和监管,保护数据权利人和用户的合法权益;另一方面,我们需要明确 AI 技术生成内容的创新性、原创性和责任性,建立内容的评估、认定、归属等方面的标准和机制,保护内容创作者和使用者的合法权益。同时,我们也需要鼓励 AI 技术的创新和发展,为人类社会带来更多的便利和价值,而不是成为法律纠纷和道德争议的源头。
AI 技术,就是一把双刃剑,既有利也有弊。我们不能因噎废食,也不能纵容无度。我们需要在法律与技术之间寻找特定的平衡点,既保护权利人和用户的利益,又促进创作者和开发者的创新自由。这是一个不容回避的问题,也是一个亟待解决的问题。我们期待着法院对这些案件的审理和裁决,也期待着立法机关对这些问题的研究和审定。只有这样,我们才能让 AI 技术成为人类社会的良友,而不是敌人。