头条
7 位新闻受众总监对 Google 的 AI 概览的看法
Google 的 AI 概览由 Gemini 语言模型提供支持,在美国推出后因不准确和危险建议而受到严厉批评。尽管遭到强烈反对,但 Google 仍将该功能扩展到另外六个国家,这引起了出版商对流量减少和内容失实的担忧。人工智能战略家和 SEO 专家强调需要透明度和更好的引用实践来保持信任和流量。
什么是 Apple Intelligence,它什么时候推出,谁会得到它?
https://techcrunch.com/2024/09/09/what-is-apple-intelligence-when-is-coming-and-who-will-get-it/
AApple 在 WWDC 2024 上推出了 Apple Intelligence,重点是将 AI 功能集成到 Mail、Messages 和 Siri 等现有应用中。该平台使用大型语言模型执行文本摘要和图像生成等任务,旨在实现无缝的用户体验。测试版将于今年 10 月在美国推出,并计划于 2025 年提供更广泛的国际支持。
新开源 AI 领导者 Reflection 70B 的性能受到质疑
HyperWrite 的 Reflection 70B 是 Meta 的 Llama 3.1 LLM 的一个变体,由于第三方评估人员无法复现其声称的性能,因此面临审查。问题归因于模型权重在上传到 Hugging Face 期间被破坏,从而导致差异。AI 社区正在等待进一步的回应和更新,以澄清该模型的实际能力。
研究
通过可扩展逆强化学习模仿语言
https://arxiv.org/abs/2409.01369
许多现代语言建模都是模仿学习的一个具体案例。幸运的是,该领域有广泛的深入研究。本文探讨了如何使用逆强化学习来模仿整个序列而不仅仅是标记。结果很有希望,并指出了语言模型训练管道中继续强化学习的方向。
使用代理标记扩散变换器进行视觉生成
https://arxiv.org/abs/2409.04005v1
代理标记扩散变换器通过使用更少的代表性标记来减少扩散变换器中的冗余计算。
室内环境的 3D 物体检测
https://arxiv.org/abs/2409.04234v1
UniDet3D 是一个强大的 3D 物体检测模型,在多个室内数据集上进行训练。
工程
从多幅图像快速重建 3D
https://github.com/phuang1024/Starst3r
一款出色的工具,使用 Mast3r 和一些巧妙的优化从几幅 2D 图像重建 3D 场景。
实验性 GPU 元编程
https://github.com/kuterd/opal_ptx/blob/master/notebooks/simple_tma.ipynb
可在 GPU 上运行的图像处理和裁剪。
3D 场景理解
https://yunzeman.github.io/lexicon3d/
研究人员进行了一项研究,比较了七种不同的 3D 场景理解视觉编码模型,发现最佳模型取决于任务。DINOv2 总体表现最佳。视频模型在对象级任务中表现出色,扩散模型最适合几何任务。语言预训练模型具有令人惊讶的局限性。
杂七杂八
使用单个样本生成手写文本
https://github.com/dailenson/one-dm
One-DM 模型仅使用单个样本即可生成模仿任何风格的手写文本。
扩散是谱自回归
https://sander.ai/2024/09/02/spectral-autoregression.html
扩散模型和自回归模型本质上相似,都使用迭代细化过程。本文作者使用傅里叶变换技术展示了扩散模型如何在频域中像近似自回归一样运行,尤其是对于视觉数据。这一见解强调了统一不同数据类型的生成建模方法的潜在方向。
为什么我们害怕人工智能等多元化智能
https://www.noemamag.com/why-we-fear-diverse-intelligence-like-ai
人工智能和多元化智能的兴起挑战了“真实存在”与机器之间过时的区别。人们不应该只关注人工智能,而应该理解和道德地参与多元化的认知系统,包括生物工程、机器人和混合实体。扩大我们对智力和同情心的定义将有助于驾驭新兴技术的道德格局。
人工智能可能会面试你的下一份工作——关于在招聘中负责任地使用人工智能
人工智能很可能不仅会写职位描述,而且在不久的将来还会面试候选人。埃默里大学法学教授 Ifeoma Ajunwa 讨论了公司在招聘中使用人工智能的潜在风险和可能性。阅读 Specialist Staffing Group 的文章
新的 Shortwave AI 助手
https://www.shortwave.com/blog/new-shortwave-ai-email-assistant/
Shortwave 对其 AI 助手进行了重大升级,使其能够执行复杂的多步骤任务,例如高级搜索、日历查找和电子邮件分析。
OpenAI 可能会使用 Apple 的 TSMC 芯片
https://www.computerworld.com/article/3502761/openai-might-use-apples-tsmc-for-chips.html
OpenAI 可以通过采用更高效的芯片来显著降低运营成本,尤其是在其用户群不断增长的情况下。
苹果在新的以人工智能为重点的 Mac 促销活动中直接瞄准微软的 Copilot+ PC
https://9to5mac.com/2024/09/06/microsoft-copilot-pcs-apple-mac/
苹果大力宣传 Mac 是“最好的人工智能 PC”,并直接瞄准微软的 Copilot+ PC。