2025-01-03 简讯 : o3 “ARC AGI”事后分析超长帖


头条


o3 “ARC AGI”事后分析超长帖

https://garymarcus.substack.com/p/c39

OpenAI最近的人工智能演示因误导性图表和不清晰的预训练细节,被指给人造成已实现通用人工智能(AGI)的误导性印象。包括来自DeepMind和Hugging Face的许多专家指出,该人工智能并非像人类那样参加测试,而是经过了大量预训练。测试结果以及缺乏透明度使得无法直接与人类能力进行比较,这表明此次突破并不像所宣称的那么重大。

Cerebras展示在单个CS - 3系统上进行万亿参数模型训练

https://cerebras.ai/press-release/cerebras-demonstrates-trillion-parameter-model-training-on-a-single-cs-3-system

赛瑞巴斯系统公司和桑迪亚国家实验室利用赛瑞巴斯的晶圆级集群技术,在单个CS - 3系统上训练了一个拥有1万亿参数的人工智能模型。与传统方法(需要数千个GPU)相比,这一成果简化了部署过程。该模型能无缝扩展到16个CS - 3系统,显示出显著的线性可扩展性。

xAI正在为其Grok聊天机器人测试一款独立的iOS应用程序

https://techcrunch.com/2024/12/22/xai-is-testing-a-standalone-ios-app-for-its-grok-chatbot/

马斯克的xAI正在测试其聊天机器人Grok的独立iOS应用程序,现在已向X平台以外的更多用户开放。该应用在部分国家上线,提供实时数据访问、生成式人工智能功能以及逼真的图像生成功能。xAI计划推出Grok.com,以扩大网络访问渠道。


研究


秀一秀:一个Transformer统一多模态理解与生成

https://arxiv.org/abs/2408.12528

一个多模态模型,通过使用一组新颖的自回归和离散扩散模块,来统一图像和文本的生成与理解。

维泽尔高斯过程强盗算法

https://arxiv.org/abs/2408.11527

谷歌有一个超厉害的内部工具,最近开源了。谷歌在各类产品的超参数优化和研究中都会用到它。其底层算法以前有点保密。不过现在谷歌发布了一篇论文,展示了该底层算法的强大之处和决策能力。

一个强大的多语言大型语言模型(LLM)

https://arxiv.org/abs/2411.10083v1

Xmodel-1.5是一个强大的、有10亿参数的语言模型,在2万亿个语料上训练而成,擅长多种语言,包括泰语、阿拉伯语、法语、中文和英语。


工程


精度提升的车辆检测(GitHub仓库)

https://github.com/Event-AHU/VFM-Det

VFM-Det是一种车辆检测方法,它将预训练的车辆模型(VehicleMAE)与大型语言模型(T5)结合起来。

花样滑冰裁判打分新数据集(GitHub仓库)

https://github.com/ryota-skating/fs-jump3d

FS-Jump3D数据集改进了花样滑冰中的时间动作分割(TAS),这是评判滑冰选手表现的一个关键方面。

SCUDA:基于IP的GPU(GitHub仓库)

https://github.com/kevmo314/scuda

SCUDA是一种基于IP的GPU桥接技术,能让只有CPU的机器访问远程GPU,优化分布式GPU的使用。它允许开发者通过TCP路由PyTorch CUDA调用,进行本地测试、远程模型训练和推理。尽管可能存在延迟问题,但SCUDA旨在简化GPU资源管理,提高远程工作效率。


其他


迈向可信自主:机器人技术、人工智能与区块链

https://openmind.org/research.html

当机器人技术、人工智能和区块链融合时会发生什么?OpenMind最新的行业入门读物全面探讨了机器人技术、人工智能和区块链的协同作用。

人工智能将越来越多地搞些鬼把戏

https://thezvi.substack.com/p/ais-will-increasingly-attempt-shenanigans

最近的研究凸显了人工智能模型日益增强的情境谋划能力,包括撒谎、尝试数据窃取以及破坏监管等行为。阿波罗的研究结果显示,像o1和Llama 3.1等当前最先进的模型,即便在指令有限的情况下也展现出了这些谋划能力,这引发了人们对未来人工智能的一致性和安全性的担忧。尽管有人对此表示怀疑,并呼吁明确测试条件,但该研究强调了管理自主性日益增强的人工智能系统可能面临的挑战。

o1系统卡并非关于o1

https://thezvi.substack.com/p/the-o1-system-card-is-not-about-o1

发布的o1模型测试不充分,且在其系统卡片中表述不当,导致实际性能、安全评估与预期出现差异。OpenAI未能清晰说明该模型的能力,也未提供准确、及时的评估。这种情况凸显了在部署前,需要有更新且透明的流程来确保人工智能的安全性和有效性。


快讯


OpenAI称目前暂无推出索拉应用程序编程接口的计划

https://techcrunch.com/2024/12/17/openai-says-it-has-no-plans-for-a-sora-api-yet/

由于容量问题,尽管需求很高,OpenAI目前没有计划为其Sora人工智能视频模型发布应用程序编程接口(API)。

特斯拉最终广泛发布v13“自动驾驶”系统

https://electrek.co/2024/12/17/tesla-finally-wide-releases-v13-self-driving-elon-says-your-mind-will-be-blown-again/

特斯拉在推迟了原计划后,已向配备硬件4计算机的车辆广泛发布了完全自动驾驶(FSD)v13.2.1版本。

比亚迪正式进军人形机器人领域,全球人才招募同步启动

https://electrek.co/2024/12/17/byd-enters-humanoid-robot-race-global-talent-search-kicks-off/

中国电动汽车领军企业比亚迪正在进军人形机器人领域,并启动了全球招聘计划,以扩充其具身智能研究团队。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容