头条
微软称 OpenAI 现在是人工智能和搜索领域的竞争对手
https://www.cnbc.com/2024/07/31/microsoft-says-openai-is-now-a-competitor-in-ai-and-search.html
尽管微软是 OpenAI 最大的投资者和长期合作伙伴,但微软在其最新年度报告中将 OpenAI 列为竞争对手,这标志着双方关系的转变。
Character 联合创始人重返谷歌
https://techcrunch.com/2024/08/02/character-ai-ceo-noam-shazeer-returns-to-google/
Noam Shazeer 是 Transformer 原始论文的作者之一,在 Character.AI 以上次融资估值的 2 倍获得其技术许可后,他重返谷歌。
Gemma 2 的三个新成员
谷歌正在为 Gemma 2 系列添加一个新的 2B 参数模型、安全内容分类器模型和模型可解释性工具。
研究
通过重复采样扩展推理计算
https://arxiv.org/abs/2407.21787
一组科学家发现,如果反复从小模型中采样,并有足够的覆盖范围和验证工具,则可以显著提高基准性能,同时成本仍比使用较大的模型低 3 倍。
视频中的视听问答
https://arxiv.org/abs/2407.20693v1
研究人员开发了一种时空感知模型 (TSPM),以提高回答与视频中的视觉和音频提示相关的问题的能力。
实时高质量手部头像渲染
https://agnjason.github.io/XHand-page/
XHand 是一种新的手部头像,专为虚拟环境和游戏中的实时渲染而设计。与之前的模型不同,XHand 专注于生成详细的手形、外观和变形。
工程
Prompt Poet
https://research.character.ai/prompt-design-at-character-ai/
Character AI 已开源其提示构造库,该库在生产中用于服务数百万次对话。
JAX 中的 Minigrid
https://github.com/epignatelli/navix
JAX 中加速了 RL 的流行测试平台。
视觉模型的图像-文本对生成
https://github.com/starriver030515/synthvlm
SynthVLM 是视觉大型语言模型 (VLLM) 的新型数据合成管道。SynthVLM 不是从图像生成字幕,而是使用高级扩散模型从字幕创建高分辨率图像。
杂七杂八
Genies 虚拟形象的 LLM 未来发展
https://genies.com/blog/future-of-llm-and-implementation-as-it-relates-to-avatars-and-genies
Genies 正在利用 LLM 进行用户分析,通过将行为映射到基础特征来实现个性化体验。其在游戏中不断进步的聊天机器人和 NPC 创造了身临其境的对话场景。通过将对话数据与传统的个性化技术相结合,Genies 正在提升用户参与度,并通过自然语言处理为游戏开发者提供直观的数据分析。
人工智能生存风险概率太不可靠,无法为政策提供信息
https://www.aisnakeoil.com/p/ai-existential-risk-probabilities
本文批评了使用人工智能生存风险概率估计来制定政策,认为它们太不可靠,缺乏坚实的归纳或演绎基础,通常类似于有根据的猜测,而不是基于证据的预测。作者质疑这些预测在指导公共政策方面的合法性,尤其是当它们与代价高昂或限制自由的行动相关时,并提倡采用基于证据的方法,承认人工智能发展中的不确定性。他们建议将重点放在可定义的人工智能里程碑上,以做出更有意义的政策决策,同时警告不要在影响重大的决策中利用推测性的存在风险概率。
人工智能是在评判体操的未来,还是仅仅是一种监视工具?
https://www.theverge.com/c/24182327/olympics-gymnastics-ai-judging-fujitsu-jss-fig
国际体操联合会 (FIG) 与富士通合作,在世界体操锦标赛上推出了一个人工智能辅助评判支持系统,旨在实现更公平、更透明的评分。评判支持系统 (JSS) 不会取代裁判,而是在困难案件和调查纠纷中提供基于 3D 模型的第二意见,并具有未来改进和更广泛应用的空间。尽管有人担心会取代人类判断,但 JSS 可能会提高得分的准确性和一致性,这对于一项得分差异很小但会极大地影响排名和运动员职业生涯的运动来说至关重要。
自我压缩的网络
https://github.com/geohot/ai-notebooks/blob/master/mnist_self_compression.ipynb
通过将网络的大小包含在损失函数中,可以训练一个提高准确性并自我量化为更小的模型。
GitHub 模型
https://github.blog/news-insights/product-news/introducing-github-models/
GitHub 宣布了 Hugging Face 模型托管服务的竞争对手。
Reddit 首席执行官表示,微软需要付费才能搜索该网站
https://www.theverge.com/2024/7/31/24210565/reddit-microsoft-anthropic-perplexity-pay-ai-search
Reddit 首席执行官史蒂夫·霍夫曼 (Steve Huffman) 呼吁微软等科技巨头就 Reddit 数据在 AI 模型中的使用条款进行谈判,理由是未经授权的抓取和滥用。