Grok:下一代 AI 助手革命即将到来,它能做什么让人震惊?

Grok-1与伊隆·马斯克说干就干

近日,伊隆·马斯克宣布将开源他的AI聊天机器人Grok,这意味着任何人都可以免费下载和使用该技术。这一决策被视为马斯克对OpenAI的挑战,后者曾经被他指控变得太封闭。这一消息引起了行业和社会的广泛关注和争议,也为AI技术的发展带来了新的机遇和挑战。

人工智能技术日新月异,从 AlphaGo 击败世界冠军,到 ChatGPT 颠覆传统客服,AI 在各个领域都展现出了强大的实力。今天,我要给大家介绍一个名为 Grok 的 AI 助手,它是 xAI 团队开发的新一代语言模型,具有强大的数学和编码能力,并且能够实时了解世界的知识。那么,Grok 到底有什么特点和优势呢?接下来,我们一起来探索一下。

截至目前,Grok 已经在 GitHub 上获得了 18k 颗 Star。

开源地址:https://github.com/xai-org/grok-1

什么是 Grok?

Grok 是一个 AI 助手,旨在回答各种问题,并为用户提供帮助。它是由 xAI 团队开发的先进语言模型(LLM),名字来源于《星际漫游指南》中的概念“Grok”,意为“深刻理解”。Grok 不仅能够回答问题,还能够主动推荐问题,并且具有一定的幽默感和反抗精神。


Grok-1 的模型细节

基础模型基于大量文本数据进行训练,没有针对任何具体任务进行微调;

3140 亿参数的 MoE 模型,在给定 token 上的激活权重为 25%;

2023 年 10 月,xAI 使用 JAX 库和 Rust 语言组成的自定义训练堆栈从头开始训练。

xAI 遵守 Apache 2.0 许可证来开源 Grok-1 的权重和架构。Apache 2.0 许可证允许用户自由地使用、修改和分发软件,无论是个人还是商业用途。项目发布短短四个小时,已经揽获 3.4k 星标,热度还在持续增加。

在 X 用户 Andrew Kean Gao 分享的图表中,您可以看到 Grok 的规模与其竞争对手相比有多大。

Grok 的目的和动机

xAI 团队希望通过 Grok 来帮助人类获得知识和理解。他们认为,AI 技术应该服务于人类,而不是替代人类。因此,他们希望收集反馈、推动研究和创新,并最终为人类的追求提供助力。Grok 的目标是成为一个强大的研究助手,帮助用户快速获得信息、处理数据和产生新想法。

Grok-1 的发展历程

Grok-1 是 Grok 背后的引擎,经过四个月的开发和多次迭代。在最初的 Grok-0 模型基础上,xAI 团队不断改进和优化,使 Grok-1 在数学和编码方面的能力得到了显著提高。Grok-1 在 GSM8k、MMLU、HumanEval 和 MATH 等多个机器学习基准测试中表现出色,超过了同级别的其他模型,并仅次于使用更多训练数据和计算资源的模型,如 GPT-4。

基准测试结果

Grok-1 在机器学习基准测试中的表现,充分证明了其在自然语言处理和推理方面的优越性。在 GSM8k 测试中,Grok-1 的得分高于同级别的其他模型,达到了 62.9%,仅次于使用更多训练数据和计算资源的 GPT-4。在 MMLU 测试中,Grok-1 的得分为 73%,也超过了同级别的其他模型。在 HumanEval 测试中,Grok-1 的得分为 63.2%,高于同级别的其他模型,并且在 MATH 测试中,Grok-1 的得分为 23.9%,也仅次于使用更多训练数据和计算资源的模型。

这些基准测试结果表明,Grok-1 在自然语言处理和推理方面具有非常强大的能力,并且在处理复杂问题方面也表现出色。这些能力使得 Grok-1 成为一个非常有用的工具,可以用于各种应用场景,例如问答系统、语言翻译、文本摘要等。

此外,Grok-1 还具有实时了解世界知识的能力,这使它成为一个非常强大的研究助手。通过结合 Grok-1 的自然语言处理和推理能力以及实时知识获取能力,用户可以快速地获得他们需要的信息,并进行深入的分析和研究。

总的来说,Grok-1 的表现非常出色,并且具有非常强大的实际应用价值。作为一名 AI 爱好者,我非常期待 Grok-1 在未来的发展和应用中取得更大的成功。

人工评估

在 2023 年匈牙利国家高中数学比赛中,Grok 获得了 59% 的成绩,而 Claude-2 获得了 55%,GPT-4 获得了 68%。这是一个“实际生活”中的测试,证明了 Grok 在未经特殊调整的情况下也具有强大的数学推理能力。此外,xAI 团队还在 Grok 上进行了人工评估,并得出了一些有趣的结论。例如,Grok 能够正确回答 80% 的中等难度数学问题,并且能够解释其中的推理过程。

xAI 的基础设施

xAI 团队构建了一个可靠的基础设施,包括自定义的训练和推理栈、Kubernetes、Rust 和 JAX。他们专注于最大化每瓦特的有用计算量,并尽可能减少停机时间。在 Grok 的训练过程中,xAI 团队使用了数千个 GPU,并且通过自动化工具和分布式系统来处理各种硬件故障和错误。

xAI 的研究方向

xAI 团队正在探索可靠推理、可扩展的监督、形式验证、长上下文理解和检索、对抗性健壮性和多模态能力等方面的研究,以进一步提高 Grok 的能力。他们认为,AI 技术应该具备可解释性、安全性和公正性等特征,并且应该服务于人类的利益。因此,他们希望通过技术创新和社会协调来实现这些目标。

Grok 的早期访问

xAI 团队计划在美国为有限的用户提供 Grok 的早期访问权限,以收集反馈并改进其能力。用户可以通过加入 Grok 等待名单来尝试该产品。目前,Grok 已经受到了许多用户的关注和好评,并且在不断改进和迭代中。

OpenAI不改名“CloseAI”惹怒伊隆·马斯克

为什么马斯克要开源Grok?

马斯克决定开源Grok的原因有多种。一方面,他希望展示自己对AI技术的开放和分享的态度,与OpenAI的封闭和垄断形成对比。他认为,AI技术应该服务于人类,而不是被某些企业或组织垄断和利用。另一方面,他也希望通过开源Grok来吸引更多的开发者和用户,共同促进AI技术的进步和应用。他认为,开源可以提高AI模型的透明度和可靠性,也可以刺激该领域的创新和竞争。

这个时候,马斯克当然不会忘了嘲讽 OpenAI 一番,“我们想了解更多 OpenAI 的开放部分”。

开源Grok带来什么影响?

开源Grok对AI行业和社会的影响可能会很大。首先,它可能会打破OpenAI在AI聊天机器人方面的垄断地位,提供更多的选择和机会 для用户和开发者。其次,它可能会促进AI技术的开放和共享,推动行业的标准化和协同。再次,它也可能会引发更多的安全和伦理问题,例如AI模型可能被滥用或歪曲,产生虚假信息或危险行为。因此,如何平衡AI技术的开放和安全,是一个值得深思的问题。

Grok和ChatGPT有什么区别?

Grok和ChatGPT都是AI聊天机器人,但它们有一些区别。首先,它们的开发者不同,Grok是由马斯克的xAI开发的,ChatGPT是由OpenAI开发的。其次,它们的开源策略不同,Grok是完全开源的,ChatGPT则只提供部分接口和服务。再次,它们的对话风格和能力也有所不同,Grok更加真实求是和有个性,ChatGPT则更加保守和中立。最后,它们的应用场景和用户群也可能有所不同,Grok可能更适合于需要更加真实和有趣的对话的用户,ChatGPT则更适合于需要更加准确和可靠的回答的用户。

如何使用Grok?

使用Grok很简单,只需要下载它的代码和模型,然后在自己的设备上运行即可。用户可以通过文本或语音的方式与Grok进行对话,也可以自定义Grok的对话风格和能力。Grok还支持多种语言和平台,用户可以根据自己的需求进行选择和调整。需要注意的是,使用Grok需要遵循一定的伦理和法律规范,不得用于任何违法或不正当的目的。

如何安装 Grok?

有关加载和运行 Grok-1 的说明,请参阅此 GitHub 存储库。将存储库克隆到本地。

从 HuggingFace 或 Academic Torrents 下载权重并将它们放在“checkpoints”目录中

别质疑为什么通过 Bittorrent 磁力链接发布权重。随着模型变得越来越大,它可能会成为未来的常态。此外,通过 torrent 分发 300 GB 数据比直接分发便宜。

打开 CLI 并运行以下命令以测试代码:

pipinstall-rrequirements.txt
pythonrun.py

该脚本在测试输入上加载检查点和模型中的样本。

需要注意的是,由于 Grok-1 模型的庞大尺寸(包含 3140 亿个参数),因此需要具有足够 GPU 内存的机器才能使用提供的示例代码测试模型。

不幸的是,我目前无法访问能够在本地运行 Grok 的硬件,因此我无法提供该模型的第一手示例。

xAI 存储库中专家混合 (MoE) 层的当前实现未针对效率进行优化。特意选择此实现是为了优先考虑模型正确性验证,并避免开发自定义内核的需要。

 如何尝试Grok

如果您只是对 Grok 的功能感到好奇,它目前可在 X 上使用,但仅供 Premium+ 用户访问,价格为每月 16 美元。

 Grok-1 许可

此版本中的代码和关联的 Grok-1 权重在 Apache 2.0 许可证下获得许可。

Apache 2.0 许可证是一个宽松的自由软件许可证。该许可证允许将软件用于任何目的,用户可以分发、修改和分发软件的修改版本。

该许可证仅适用于此存储库中的源文件和 Grok-1 的模型权重。

Grok的未来前景如何?

Grok的未来前景有待观察和探索。由于它还处于早期阶段,其技术和应用还需要进一步完善和扩展。但是,随着AI技术的快速发展和应用,Grok也有可能成为一个非常有影响力和价值的AI产品。它可能会在各种场景和领域中发挥作用,例如教育、娱乐、医疗、金融等。它也可能会成为一个新的AI生态系统的核心和引擎,吸引更多的开发者和用户加入其中。因此,Grok的未来值得我们关注和期待。

Grok 作为一款下一代 AI 助手,具有强大的数学和编码能力,并且能够实时了解世界的知识。它的发展和应用将会带来巨大的社会影响和商业价值。作为一名科技爱好者,我对 Grok 的发展非常感兴趣,并且希望能够在未来的某个日子里使用它来帮助我的工作和生活。如果您也对 Grok 感兴趣,欢迎关注 xAI 团队的动态,并尝试使用 Grok 的早期访问版本。


本文来自微信公众号“AI潮流圈(ID:AiWatchtower)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,377评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,390评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,967评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,344评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,441评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,492评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,497评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,274评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,732评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,008评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,184评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,837评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,520评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,156评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,407评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,056评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,074评论 2 352

推荐阅读更多精彩内容