头条
Qwen 2.5
https://qwenlm.github.io/blog/qwen2.5/
一系列令人印象深刻的开放模型,接近当前性能的前沿。具体来说,它们在代码、数学、结构化输出和推理方面都表现出色。Qwen 团队还发布了一套适用于各种用例的尺寸套件。
Salesforce 的新 AI 战略承认 AI 将取代就业
https://finance.yahoo.com/news/salesforce-ai-strategy-acknowledges-ai-120000175.html
Salesforce 正在彻底改革其 AI 战略,引入无需人工监督即可完成任务的生成式 AI 工具,并将其定价模式修改为每次 AI 驱动对话 2 美元。这一转变旨在解决投资者对 AI 导致的失业影响订阅收入的担忧。与传统的Copilot 和聊天机器人相比,新的 AI 工具提供了更高的效率和自主性。
使用 LlamaCoder 创建完整的 Web 应用程序
https://ai.meta.com/blog/together-ai-llamacoder/
Together AI 和 Meta 合作开发了一款工具,让用户只需在 LlamaCoder 平台上发出提示即可构建整个应用程序。它类似于 Claude Artifacts,但纯粹是为了展示 Together AI 推理引擎的速度而创建的。
研究
无需重新训练的 BitNet
https://huggingface.co/blog/1_58_llm_extreme_quantization
Hugging Face 团队使用一种称为量化预热的新技术,对 Llama 3 8B 进行了微调,并在将其量化为使用每个参数 1.58 位的同时保持了 Llama 1 的性能。
1x 世界模型
https://www.1x.tech/discover/1x-world-model
机器人公司 1x 训练了一个视频生成模型,可用于模拟机器人活动的第一人称视角。这对离线数据生成和机器人训练很有帮助。
思维图:语言模型中的迭代推理
https://arxiv.org/abs/2409.10038v1
思维图 (DoT) 框架通过将思想组织成有向无环图 (DAG),为大型语言模型引入了一种新的推理方式。这种方法允许模型提出、批评、改进和验证想法,从而提高逻辑一致性。
工程
ZML 推理
https://github.com/zml/zml
ZML 是一个用 Zig 编写的闪电般快速的推理引擎,设计时考虑到了性能。它可以用于各种模型,尽管它需要一些定制才能在新的架构上工作。
对导航代理的对抗性攻击
https://github.com/chen37058/physical-attacks-in-embodied-navigation
此存储库引入了一种针对具身导航代理的新攻击方法,该方法将具有可学习纹理的透明补丁附加到目标对象上。
图异常检测:一项调查
https://arxiv.org/abs/2409.09957v1
本文深入回顾了用于检测图数据异常的深度学习方法,特别是图神经网络 (GNN)。研究人员介绍了一种新颖的方法分类法,分析了 GNN 设计、代理任务和异常度量。
杂七杂八
SocialAI 提供类似 Twitter 的日记,其中 AI 机器人会回复人们的帖子
SocialAI 是一款新的 iOS 应用,它提供完全由 AI 驱动的机器人填充的社交媒体体验,消除了人机交互。用户可以分享想法并收到无数量身定制的 AI 生成的回复,从“支持者”或“批评者”等类别中进行选择。创始人 Michael Sayman 旨在提供一个私人的互动空间,利用大型语言模型来获得多样化的反馈。
学术文本解析
https://github.com/JHW5981/AceParse
AceParse 是一个数据集,旨在改进学术论文中结构化文本的解析,包括公式、表格和复杂句子。
跨越人工智能的恐怖谷
https://every.to/p/jumping-over-ai-s-uncanny-valley-4b1c3436-b424-4a62-b563-50e1469bba6c
本文探讨了“恐怖谷”理论,该理论认为,对类人人工智能的不适可能会阻碍其采用。它研究了人工智能领域最近的进展,这些进展聚焦于这种心理现象,并质疑其对人工智能未来的潜在影响。文章最后指出,人工智能的最佳用途可能是充当补充角色,而不是替代人类。
Mercor 的 3000 万美元 A 轮融资
https://threadreaderapp.com/thread/1836435248592376149.html
Mercor 从 Benchmark 筹集了 3000 万美元,用于打造 AI 招聘人员。
癌症检测
https://github.com/zs1314/skinmamba
SkinMamba 是一种混合模型,结合了 CNN 和 Transformer 技术,可改善皮肤病变分割,从而实现早期癌症检测。
Amazon Alexa 现在仅靠思想即可控制肢体
Synchron 已使 ALS 患者能够通过大脑植入物控制 Amazon 的 Alexa,而无需使用语音或触摸。