Grok-1与伊隆·马斯克说干就干
近日,伊隆·马斯克宣布将开源他的AI聊天机器人Grok,这意味着任何人都可以免费下载和使用该技术。这一决策被视为马斯克对OpenAI的挑战,后者曾经被他指控变得太封闭。这一消息引起了行业和社会的广泛关注和争议,也为AI技术的发展带来了新的机遇和挑战。
人工智能技术日新月异,从 AlphaGo 击败世界冠军,到 ChatGPT 颠覆传统客服,AI 在各个领域都展现出了强大的实力。今天,我要给大家介绍一个名为 Grok 的 AI 助手,它是 xAI 团队开发的新一代语言模型,具有强大的数学和编码能力,并且能够实时了解世界的知识。那么,Grok 到底有什么特点和优势呢?接下来,我们一起来探索一下。
截至目前,Grok 已经在 GitHub 上获得了 18k 颗 Star。
开源地址:https://github.com/xai-org/grok-1
什么是 Grok?
Grok 是一个 AI 助手,旨在回答各种问题,并为用户提供帮助。它是由 xAI 团队开发的先进语言模型(LLM),名字来源于《星际漫游指南》中的概念“Grok”,意为“深刻理解”。Grok 不仅能够回答问题,还能够主动推荐问题,并且具有一定的幽默感和反抗精神。
Grok-1 的模型细节
基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;
3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;
2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。
xAI 遵守 Apache 2.0 许可证来开源 Grok-1 的权重和架构。Apache 2.0 许可证允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。项目发布短短四个小时,已经揽获 3.4k 星标,热度还在持续增加。
在 X 用户 Andrew Kean Gao 分享的图表中,您可以看到 Grok 的规模与其竞争对手相比有多大。
Grok 的目的和动机
xAI 团队希望通过 Grok 来帮助人类获得知识和理解。他们认为,AI 技术应该服务于人类,而不是替代人类。因此,他们希望收集反馈、推动研究和创新,并最终为人类的追求提供助力。Grok 的目标是成为一个强大的研究助手,帮助用户快速获得信息、处理数据和产生新想法。
Grok-1 的发展历程
Grok-1 是 Grok 背后的引擎,经过四个月的开发和多次迭代。在最初的 Grok-0 模型基础上,xAI 团队不断改进和优化,使 Grok-1 在数学和编码方面的能力得到了显著提高。Grok-1 在 GSM8k、MMLU、HumanEval 和 MATH 等多个机器学习基准测试中表现出色,超过了同级别的其他模型,并仅次于使用更多训练数据和计算资源的模型,如 GPT-4。
基准测试结果
Grok-1 在机器学习基准测试中的表现,充分证明了其在自然语言处理和推理方面的优越性。在 GSM8k 测试中,Grok-1 的得分高于同级别的其他模型,达到了 62.9%,仅次于使用更多训练数据和计算资源的 GPT-4。在 MMLU 测试中,Grok-1 的得分为 73%,也超过了同级别的其他模型。在 HumanEval 测试中,Grok-1 的得分为 63.2%,高于同级别的其他模型,并且在 MATH 测试中,Grok-1 的得分为 23.9%,也仅次于使用更多训练数据和计算资源的模型。
这些基准测试结果表明,Grok-1 在自然语言处理和推理方面具有非常强大的能力,并且在处理复杂问题方面也表现出色。这些能力使得 Grok-1 成为一个非常有用的工具,可以用于各种应用场景,例如问答系统、语言翻译、文本摘要等。
此外,Grok-1 还具有实时了解世界知识的能力,这使它成为一个非常强大的研究助手。通过结合 Grok-1 的自然语言处理和推理能力以及实时知识获取能力,用户可以快速地获得他们需要的信息,并进行深入的分析和研究。
总的来说,Grok-1 的表现非常出色,并且具有非常强大的实际应用价值。作为一名 AI 爱好者,我非常期待 Grok-1 在未来的发展和应用中取得更大的成功。
人工评估
在 2023 年匈牙利国家高中数学比赛中,Grok 获得了 59% 的成绩,而 Claude-2 获得了 55%,GPT-4 获得了 68%。这是一个“实际生活”中的测试,证明了 Grok 在未经特殊调整的情况下也具有强大的数学推理能力。此外,xAI 团队还在 Grok 上进行了人工评估,并得出了一些有趣的结论。例如,Grok 能够正确回答 80% 的中等难度数学问题,并且能够解释其中的推理过程。
xAI 的基础设施
xAI 团队构建了一个可靠的基础设施,包括自定义的训练和推理栈、Kubernetes、Rust 和 JAX。他们专注于最大化每瓦特的有用计算量,并尽可能减少停机时间。在 Grok 的训练过程中,xAI 团队使用了数千个 GPU,并且通过自动化工具和分布式系统来处理各种硬件故障和错误。
xAI 的研究方向
xAI 团队正在探索可靠推理、可扩展的监督、形式验证、长上下文理解和检索、对抗性健壮性和多模态能力等方面的研究,以进一步提高 Grok 的能力。他们认为,AI 技术应该具备可解释性、安全性和公正性等特征,并且应该服务于人类的利益。因此,他们希望通过技术创新和社会协调来实现这些目标。
Grok 的早期访问
xAI 团队计划在美国为有限的用户提供 Grok 的早期访问权限,以收集反馈并改进其能力。用户可以通过加入 Grok 等待名单来尝试该产品。目前,Grok 已经受到了许多用户的关注和好评,并且在不断改进和迭代中。
OpenAI不改名“CloseAI”惹怒伊隆·马斯克
为什么马斯克要开源Grok?
马斯克决定开源Grok的原因有多种。一方面,他希望展示自己对AI技术的开放和分享的态度,与OpenAI的封闭和垄断形成对比。他认为,AI技术应该服务于人类,而不是被某些企业或组织垄断和利用。另一方面,他也希望通过开源Grok来吸引更多的开发者和用户,共同促进AI技术的进步和应用。他认为,开源可以提高AI模型的透明度和可靠性,也可以刺激该领域的创新和竞争。
这个时候,马斯克当然不会忘了嘲讽 OpenAI 一番,“我们想了解更多 OpenAI 的开放部分”。
开源Grok带来什么影响?
开源Grok对AI行业和社会的影响可能会很大。首先,它可能会打破OpenAI在AI聊天机器人方面的垄断地位,提供更多的选择和机会 для用户和开发者。其次,它可能会促进AI技术的开放和共享,推动行业的标准化和协同。再次,它也可能会引发更多的安全和伦理问题,例如AI模型可能被滥用或歪曲,产生虚假信息或危险行为。因此,如何平衡AI技术的开放和安全,是一个值得深思的问题。
Grok和ChatGPT有什么区别?
Grok和ChatGPT都是AI聊天机器人,但它们有一些区别。首先,它们的开发者不同,Grok是由马斯克的xAI开发的,ChatGPT是由OpenAI开发的。其次,它们的开源策略不同,Grok是完全开源的,ChatGPT则只提供部分接口和服务。再次,它们的对话风格和能力也有所不同,Grok更加真实求是和有个性,ChatGPT则更加保守和中立。最后,它们的应用场景和用户群也可能有所不同,Grok可能更适合于需要更加真实和有趣的对话的用户,ChatGPT则更适合于需要更加准确和可靠的回答的用户。
如何使用Grok?
使用Grok很简单,只需要下载它的代码和模型,然后在自己的设备上运行即可。用户可以通过文本或语音的方式与Grok进行对话,也可以自定义Grok的对话风格和能力。Grok还支持多种语言和平台,用户可以根据自己的需求进行选择和调整。需要注意的是,使用Grok需要遵循一定的伦理和法律规范,不得用于任何违法或不正当的目的。
如何安装 Grok?
有关加载和运行 Grok-1 的说明,请参阅此 GitHub 存储库。将存储库克隆到本地。
从 HuggingFace 或 Academic Torrents 下载权重并将它们放在“checkpoints”目录中。
别质疑为什么通过 Bittorrent 磁力链接发布权重。随着模型变得越来越大,它可能会成为未来的常态。此外,通过 torrent 分发 300 GB 数据比直接分发便宜。
打开 CLI 并运行以下命令以测试代码:
pipinstall-rrequirements.txt
pythonrun.py
该脚本在测试输入上加载检查点和模型中的样本。
需要注意的是,由于 Grok-1 模型的庞大尺寸(包含 3140 亿个参数),因此需要具有足够 GPU 内存的机器才能使用提供的示例代码测试模型。
不幸的是,我目前无法访问能够在本地运行 Grok 的硬件,因此我无法提供该模型的第一手示例。
xAI 存储库中专家混合 (MoE) 层的当前实现未针对效率进行优化。特意选择此实现是为了优先考虑模型正确性验证,并避免开发自定义内核的需要。
如何尝试Grok
如果您只是对 Grok 的功能感到好奇,它目前可在 X 上使用,但仅供 Premium+ 用户访问,价格为每月 16 美元。
Grok-1 许可
此版本中的代码和关联的 Grok-1 权重在 Apache 2.0 许可证下获得许可。
Apache 2.0 许可证是一个宽松的自由软件许可证。该许可证允许将软件用于任何目的,用户可以分发、修改和分发软件的修改版本。
该许可证仅适用于此存储库中的源文件和 Grok-1 的模型权重。
Grok的未来前景如何?
Grok的未来前景有待观察和探索。由于它还处于早期阶段,其技术和应用还需要进一步完善和扩展。但是,随着AI技术的快速发展和应用,Grok也有可能成为一个非常有影响力和价值的AI产品。它可能会在各种场景和领域中发挥作用,例如教育、娱乐、医疗、金融等。它也可能会成为一个新的AI生态系统的核心和引擎,吸引更多的开发者和用户加入其中。因此,Grok的未来值得我们关注和期待。
Grok 作为一款下一代 AI 助手,具有强大的数学和编码能力,并且能够实时了解世界的知识。它的发展和应用将会带来巨大的社会影响和商业价值。作为一名科技爱好者,我对 Grok 的发展非常感兴趣,并且希望能够在未来的某个日子里使用它来帮助我的工作和生活。如果您也对 Grok 感兴趣,欢迎关注 xAI 团队的动态,并尝试使用 Grok 的早期访问版本。
本文来自微信公众号“AI潮流圈(ID:AiWatchtower)”