2025-01-03 简讯 : o3 “ARC AGI”事后分析超长帖

头条

o3 “ARC AGI”事后分析超长帖

https://garymarcus.substack.com/p/c39

OpenAI最近的人工智能演示因误导性图表和不清晰的预训练细节，被指给人造成已实现通用人工智能（AGI）的误导性印象。包括来自DeepMind和Hugging Face的许多专家指出，该人工智能并非像人类那样参加测试，而是经过了大量预训练。测试结果以及缺乏透明度使得无法直接与人类能力进行比较，这表明此次突破并不像所宣称的那么重大。

Cerebras展示在单个CS - 3系统上进行万亿参数模型训练

https://cerebras.ai/press-release/cerebras-demonstrates-trillion-parameter-model-training-on-a-single-cs-3-system

赛瑞巴斯系统公司和桑迪亚国家实验室利用赛瑞巴斯的晶圆级集群技术，在单个CS - 3系统上训练了一个拥有1万亿参数的人工智能模型。与传统方法（需要数千个GPU）相比，这一成果简化了部署过程。该模型能无缝扩展到16个CS - 3系统，显示出显著的线性可扩展性。

xAI正在为其Grok聊天机器人测试一款独立的iOS应用程序

https://techcrunch.com/2024/12/22/xai-is-testing-a-standalone-ios-app-for-its-grok-chatbot/

马斯克的xAI正在测试其聊天机器人Grok的独立iOS应用程序，现在已向X平台以外的更多用户开放。该应用在部分国家上线，提供实时数据访问、生成式人工智能功能以及逼真的图像生成功能。xAI计划推出Grok.com，以扩大网络访问渠道。

研究

秀一秀：一个Transformer统一多模态理解与生成

https://arxiv.org/abs/2408.12528

一个多模态模型，通过使用一组新颖的自回归和离散扩散模块，来统一图像和文本的生成与理解。

维泽尔高斯过程强盗算法

https://arxiv.org/abs/2408.11527

谷歌有一个超厉害的内部工具，最近开源了。谷歌在各类产品的超参数优化和研究中都会用到它。其底层算法以前有点保密。不过现在谷歌发布了一篇论文，展示了该底层算法的强大之处和决策能力。

一个强大的多语言大型语言模型（LLM）

https://arxiv.org/abs/2411.10083v1

Xmodel-1.5是一个强大的、有10亿参数的语言模型，在2万亿个语料上训练而成，擅长多种语言，包括泰语、阿拉伯语、法语、中文和英语。

工程

精度提升的车辆检测（GitHub仓库）

https://github.com/Event-AHU/VFM-Det

VFM-Det是一种车辆检测方法，它将预训练的车辆模型（VehicleMAE）与大型语言模型（T5）结合起来。

花样滑冰裁判打分新数据集（GitHub仓库）

https://github.com/ryota-skating/fs-jump3d

FS-Jump3D数据集改进了花样滑冰中的时间动作分割（TAS），这是评判滑冰选手表现的一个关键方面。

SCUDA：基于IP的GPU（GitHub仓库）

https://github.com/kevmo314/scuda

SCUDA是一种基于IP的GPU桥接技术，能让只有CPU的机器访问远程GPU，优化分布式GPU的使用。它允许开发者通过TCP路由PyTorch CUDA调用，进行本地测试、远程模型训练和推理。尽管可能存在延迟问题，但SCUDA旨在简化GPU资源管理，提高远程工作效率。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355

2025-01-03 简讯 : o3 “ARC AGI”事后分析超长帖

2025-01-03 简讯 : o3 “ARC AGI”事后分析超长帖

头条

o3 “ARC AGI”事后分析超长帖

Cerebras展示在单个CS - 3系统上进行万亿参数模型训练

xAI正在为其Grok聊天机器人测试一款独立的iOS应用程序

研究

秀一秀：一个Transformer统一多模态理解与生成

维泽尔高斯过程强盗算法

一个强大的多语言大型语言模型（LLM）

工程

精度提升的车辆检测（GitHub仓库）

花样滑冰裁判打分新数据集（GitHub仓库）

SCUDA：基于IP的GPU（GitHub仓库）

其他

迈向可信自主：机器人技术、人工智能与区块链

人工智能将越来越多地搞些鬼把戏

o1系统卡并非关于o1

快讯

OpenAI称目前暂无推出索拉应用程序编程接口的计划

特斯拉最终广泛发布v13“自动驾驶”系统

比亚迪正式进军人形机器人领域，全球人才招募同步启动

推荐阅读更多精彩内容