2024-11-13 简讯 : 世界上最大的开源模型


头条


世界上最大的开源模型

https://cointelegraph.com/news/near-plans-to-create-world-s-largest-1-4-t-parameter-open-source-ai-model

Near Protocol 宣布计划创建一个拥有 1.4 万亿参数的庞大开源 AI 模型。它旨在超越 Meta 的 Llama 等现有模型。

Modal 收购 Tidbyt

https://modal.com/blog/tidbyt-is-joining-modal

这是弹性扩展 GPU 公司首次收购。Modal 收购了位于纽约的硬件公司 Tidbyt,以吸引该团队在基础设施和容器化方面的内部人才。

OpenAI 面临 AI 改进放缓

https://techcrunch.com/2024/11/09/openai-reportedly-developing-new-strategies-to-deal-with-ai-improvement-slowdown/

据报道,OpenAI 的下一个主要模型代号为“Orion”,与之前的模型相比改进较少,这表明 AI 进步放缓。为了解决这个问题,OpenAI 成立了一个基础团队,专注于使用替代方法(例如合成数据训练和训练后调整)来增强模型,因为新数据的可用性已经减少。


研究


Frontier Math Benchmark

https://epoch.ai/frontiermath

Epoch AI 发布了一项新的具有挑战性的数学基准。大多数前沿模型无法解决超过 2% 的问题。

BitNet a4.8:1 位 LLM 的 4 位激活

https://arxiv.org/abs/2411.04965

1.58 位 LLM 面临的一个关键挑战是缺乏硬件加速支持。这项工作提出了 4.8 位激活,以利用新硬件中的 INT4/FP4 内核。它没有运行时成本。

使用 LLM 增强 CLIP

https://microsoft.github.io/LLM2CLIP/

LLM2CLIP 将 CLIP 的视觉和文本对齐与 LLM 的高级语言理解相结合。


工程


Torch 兼容 Muon 优化器

https://github.com/KellerJordan/Muon

Muon 是用于 GPT-2 训练记录的优化器。它是一种动量适应的 SGD 样式方法。此存储库包含一个可以放入 AdamW 的实现。

具有优化推理的 Mochi 视频模型

https://github.com/xdit-project/mochi-xdit

Mochi 是最好的开源文本转视频模型。在发布时,它需要 8 个 H100 才能运行。现在,感谢社区,它可以在单个 48GB L40 上运行,不会损失质量。

可训练的 AlphaFold3 PyTorch 复刻版

https://github.com/bytedance/Protenix

Protenix 是 DeepMind 蛋白质折叠项目 AlphaFold3 的可运行、可训练复刻版。它由字节跳动的“AI for Science”团队编写。


杂七杂八


LlamaPReview

https://github.com/marketplace/llamapreview

LlamaPReview 是 GitHub 的 AI 助手,提供一键安装和自动审查拉取请求的功能,并具有上下文感知分析功能。它支持多种编程语言,并与 GitHub Actions 集成,可直接在 PR 上提供有见地的反馈。它目前免费提供,通过识别问题和建议优化来提高代码质量。

SmolLM2

https://simonwillison.net/2024/Nov/2/smollm2/

Hugging Face 的 SmolLM2 是一个紧凑的语言模型系列,其参数大小从 135M 到 1.7B 不等,在 11 万亿个 token 上进行训练。这些模型可在设备上高效运行并支持各种任务,权重可在 Apache 2 许可下使用。量化模型(如 1.7GB 和 138MB 版本)为不同的计算需求提供了不同的灵活性。

嵌入被低估了

https://technicalwriting.dev/data/embeddings.html

机器学习嵌入可以通过对任意文本进行数学比较来改变技术写作,从而改进具有语义相似性的推荐系统等功能。它们将文本置于多维空间中,提供直观的语义关系,这对于识别相关内容等任务很有用。为其内容提供嵌入的文档站点所有者可以从他们的社区中培养创新应用程序。

三星推出人工智能“下一代 Bixby”,但目前还不能使用

https://9to5google.com/2024/11/06/samsung-next-generation-bixby-china/

三星在中国的 Galaxy W25 和 W25 Flip 上推出了具有增强人工智能功能的“下一代 Bixby”。

现在就连微软记事本也开始使用人工智能文本编辑

https://www.theverge.com/2024/11/6/24289707/microsoft-notepad-ai-text-editing-rewrite

微软正在将人工智能文本编辑功能集成到记事本中,使用户能够通过一项名为“重写”的功能重新措辞、调整语气和修改文本长度。

用于实时聚变等离子体行为预测和操控的人工智能

https://control.princeton.edu/machine-learning-for-rt-profile-control-in-tokamaks/

一种新的多模态机器学习方法增强了超分辨率数据,以便更好地分析复杂的聚变等离子体现象,例如边缘局部模式 (ELM),从而有助于稳定未来的聚变反应堆。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,080评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,422评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,630评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,554评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,662评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,856评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,014评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,752评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,212评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,541评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,687评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,347评论 4 331
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,973评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,777评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,006评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,406评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,576评论 2 349

推荐阅读更多精彩内容