2024-11-06 简讯 : AMD 的新语言模型


头条


AMD 的新语言模型

https://www.amd.com/en/developer/resources/technical-articles/introducing-the-first-amd-1b-language-model.html?utm_source=tldrai

AMD 使用 OLMO 代码库来训练和发布在其加速器上训练的语言模型。

Etched & Decart 的 Oasis

https://www.etched.com/blog-posts/oasis

Etched 和 Decart 的 Oasis 是一种 AI 模型,可根据用户输入逐帧生成开放世界游戏,展现出先进的物理理解和实时交互能力。Oasis 采用针对即将推出的搜狐芯片优化的 Diffusion Transformer 架构,可实现大规模、低延迟的 4K 视频模型。该模型集成了定制硬件,可大规模提高性能,代表着向交互式 AI 生成内容的转变。

OpenAI 将开始使用 AMD 芯片,并可能在 2026 年制造自己的 AI 硬件

https://www.theverge.com/2024/10/29/24282843/openai-custom-hardware-amd-nvidia-ai-chips

OpenAI 正在与 Broadcom 和 TSMC 合作开发定制 AI 芯片,预计将于 2026 年开始生产。与此同时,OpenAI 正在将 AMD 的 MI300 芯片集成到其 Microsoft Azure 基础设施中。尽管在定制芯片战略上与其他科技巨头保持一致,但 OpenAI 在硬件开发方面仍落后于谷歌、微软和亚马逊。


研究


无相机姿势的 3D 场景重建

https://noposplat.github.io/

NoPoSplat 是一种前馈模型,可以从稀疏的多视图图像重建 3D 场景,而无需精确的相机姿势。

改进语言模型的推理

https://arxiv.org/abs/2410.23856v1

这项研究解决了 LLM 中的一个独特挑战:它们如何处理包含不相关或不正确的理由片段的推理提示。

语言模型中的长上下文评估

https://arxiv.org/abs/2410.23771v1

这项研究确定了使用困惑度 (PPL) 评估 LLM 的长上下文能力的一个关键缺陷 - PPL 对所有标记进行平均,并忽略了理解扩展输入所需的关键标记。为了改进这一点,作者引入了 LongPPL,这是一种突出显示这些基本标记的指标,可以更清楚地衡量长上下文性能。


工程


语言模型中的快速思维与慢速思维

https://github.com/mingliiii/layer_gradient

该项目探索了不同的“思维”方法——快速(简洁)与慢速(详细,如思维链推理)——如何影响 LLM 中的分层梯度和稳定性。

仅使用 2D 图像进行 3D 物体检测

https://github.com/yangtiming/imov3d

ImOV3D 是一个框架,它利用 2D 图像来克服 3D 注释的稀缺性,从而推进开放词汇 3D 物体检测 (OV-3Det)。

文本到视频生成中的真实运动

https://pr-ryan.github.io/DEMO-project/

DEMO 是一个将文本和条件分为内容和运动组件的框架。通过对静态内容和动态运动使用不同的编码器和条件,DEMO 可以更好地从文本提示中解释和生成运动。


杂七杂八


Project Sid

https://threadreaderapp.com/thread/1852397383939960926.html

Project Sid 展示了文明进步、专业化、治理以及模因和宗教的发明和传播。这些都得益于 Altera 的新认知架构:PIANO。

我们正在分叉 Flutter, 原因如下

https://flutterfoundation.dev/blog/posts/we-are-forking-flutter-this-is-why/

Google 将公司重点转向人工智能,降低了 Flutter 桌面平台的优先级,导致这个曾经迅速扩张的 UI 工具包出现劳动力短缺。作为回应,一个名为 Flock 的分支正在开发中,其中包含 Flutter 团队无法解决的重要错误修复和功能,旨在通过社区参与加速 Flutter 的发展。Flock 计划改进贡献流程并简化 PR 审核,弥补 Flutter 主团队在支持和开发速度方面留下的差距。

使用强化学习和 4.80 美元的 GPU 时间找到有史以来最好的 HN 帖子

https://openpipe.ai/blog/hacker-news-rlhf-part-1

本文讨论了使用强化学习从人类反馈 (RLHF) 开发一个奖励模型,该模型可以预测 Hacker News 故事的点赞数。利用全面的数据集和 4.80 美元的 GPU 时间,对奖励模型进行了标题、作者和内容等特征的训练,以优化帖子质量,最终目标是利用 RLHF 技术来增强高价值内容的创作。由此产生的模型虽然并不完美,但可以成功识别未被重视的故事并预测潜在的头版点击量。

Google 的 AI 搜索摘要正在推广到 100 多个国家

https://www.theverge.com/2024/10/28/24281860/google-ai-search-summaries-expand-more-countries

Google 的 AI 概览正在扩展到 100 多个国家,提供多种语言的 AI 生成的搜索摘要。

埃隆·马斯克终于承认特斯拉的 HW3 可能不支持完全自动驾驶

https://electrek.co/2024/10/23/elon-musk-finally-admits-teslas-hw3-might-not-support-full-self-driving/

埃隆·马斯克承认特斯拉的 HW3 可能不支持完全自动驾驶,而 HW4 的功能要强大得多。

NVIDIA 以太网网络加速由 xAI 打造的全球最大 AI 超级计算机

https://nvidianews.nvidia.com/news/spectrum-x-ethernet-networking-xai-colossus

xAI 的 Colossus 由 NVIDIA 的 Spectrum-X 以太网网络平台提供支持。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容