头条
Nvidia 为中国市场准备了新旗舰 AI 芯片版本
Nvidia 正在开发一款新的 AI 芯片 B20,该芯片专为符合美国出口管制而量身定制,可满足中国市场的需要,并利用其与分销商浪潮的合作伙伴关系。据报道,其先进的 H20 芯片在中国的销量迅速增长,预计今年的销量将超过 100 万台,价值 120 亿美元。美国对半导体出口的压力仍在继续,可能会对 AI 模型开发采取进一步的限制和控制措施。
Artificial Agency 筹集 1600 万美元,利用人工智能让视频游戏中的 NPC 感觉更真实
https://techcrunch.com/2024/07/18/artificial-agency-raises-video-game-npcs-ai/
Artificial Agency 的前谷歌 DeepMind 科学家推出了一款用于视频游戏中动态 NPC 的人工智能行为引擎。他们已经筹集了 1600 万美元来增强游戏内互动。他们正在与知名的 AAA 工作室合作,预计到 2025 年将得到广泛采用,尽管可能会产生成本影响。他们的引擎提供了更逼真、反应更灵敏的游戏角色,而无需预定义的脚本。
联合国的人工智能政策
联合国旨在创建一个集中的人工智能论坛,以解决人工智能治理中分散的全球努力。
研究
Apple DCLM
https://huggingface.co/apple/DCLM-7B
Apple 已发布其 7B 参数模型的所有内容,包括代码和数据,该模型可与 Mistral 相媲美。
词汇量缩放定律
https://arxiv.org/abs/2407.13623
根据这项研究词汇量缩放定律的新研究,更大的模型需要更大的词汇量。
使用 MoME 增强多模态语言模型
https://arxiv.org/abs/2407.12709v1
研究人员提出了多模态专家混合 (MoME) 来解决通用多模态大型语言模型 (MLLM) 中的任务干扰问题。
工程
Mojo 中的科学计算
https://github.com/endia-org/Endia
Endia 是一个基于数组的 Mojo 编程库,旨在协助完成各种科学和机器学习任务。
Txtai
https://neuml.github.io/txtai/
Txtai 是一个用于语义搜索、LLM 编排和语言模型工作流的一体化嵌入数据库。
文本检测和识别的统一基准
https://github.com/topdu/openocr
OpenOCR 是场景文本检测和识别算法的统一训练和评估基准。
杂七杂八
使用 LLM 的转换代码库
https://blog.withmantle.com/code-conversion-using-ai/
Mantle 使用具有一百万个令牌窗口的 Gemini 1.0 Pro LLM 将原型项目转换为可用于生产的代码库,通过处理样板代码和重复模式减少了工作量。这种方法利用了广泛的上下文和迭代代码生成,通过让团队专注于完善项目的关键 20%,节省了数月的开发人员时间。
用广告付费的 AI
https://batchmon.com/blog/ai-cheaper-than-ads/
OpenAI 的新 gpt-4o mini 模型提供极低的成本,使广告支持的 AI 生成内容在经济上可行。通过以每篇 0.00051525 美元的价格生成动态博客文章,每则广告展示可赚取约 0.0026 美元,发布商每页浏览可实现 0.002 美元的净利润。这可能会导致在响应用户查询时转向 AI 生成的内容。
用于对象检测的多头模型
https://arxiv.org/abs/2407.12632v1
新的 CerberusDet 框架通过在基于 YOLO 架构的单个模型中组合多个任务头,为对象检测提供了灵活的解决方案。
AI 编码实习生
https://github.com/hrishioa/mandark
这个非常简单的 CLI 使用 Claude Sonnet 3.5,可用于建议代码编辑以改进现有代码库。
Taylor & Francis 将作者研究成果出售给微软 AI 后,学术作者“震惊”
Taylor & Francis 将其作者研究成果的访问权出售给微软用于 AI,但没有通知作者或提供退出选项,这引发了人们对作者权利的担忧。