2025-03-18 简讯 : OpenAI在特朗普执政下推动更宽松的人工智能监管


头条


OpenAI在特朗普执政下推动更宽松的人工智能监管

https://www.cnbc.com/2025/03/13/openai-lobbies-trump-admin-to-focus-ai-on-speed-light-regulation.html

OpenAI正在游说特朗普政府对人工智能进行最低限度监管,强调快速创新的必要性,同时对来自中国的人工智能竞争表示担忧。该公司旨在影响政府起草的即将出台的人工智能行动计划。

Anthropic API 新版本可以节约 Token

https://www.anthropic.com/news/token-saving-updates

Anthropic为其API引入了高效使用令牌的改进措施,包括缓存感知速率限制以及针对Claude 3.7 Sonnet增强提示缓存,最多可减少90%的令牌使用量。

Gemini 变得个性化,借助谷歌应用提供定制化能力

https://blog.google/products/gemini/gemini-personalization/

谷歌的Gemini现在通过其试验性的Gemini 2.0快速思考模型提供个性化服务。它能与你的谷歌应用集成,首先是搜索,可根据你过去的搜索调整回应。未来扩展将包括在相册和YouTube上实现个性化,通过了解用户偏好来提升人工智能协助水平。


研究


Cohere Command一款模型

https://cohere.com/blog/command-a

Cohere训练并发布了一个有1.11万亿参数的开放权重模型。它在智能体、多语言和编码应用场景中表现出色。它还针对检索等企业任务进行了专门优化。

为任意角色生成动作

https://kwanyun.github.io/AnyMoLe_page/

AnyMoLe利用视频扩散模型为任意角色生成帧间动作,无需特定角色的数据集。

多模态表征学习

https://arxiv.org/abs/2503.08497v1

MMRL通过引入共享表征空间来增强视觉语言模型的少样本适应性,该空间能在保持泛化能力的同时改善多模态交互。


工程


音频火烈鸟2(GitHub代码库)

https://github.com/NVIDIA/audio-flamingo

一个基于通义千问打造的、几乎完全使用合成数据的全新先进音频理解模型。

AGENT S(GitHub 仓库)

https://github.com/simular-ai/Agent-S

Agent S是一个强大的开放式计算机使用系统。它在浏览器、系统甚至移动任务方面都实现了顶尖性能。

统一视觉解码(GitHub 仓库)

https://github.com/MacavityT/REF-VLM

REF-VLM利用基于结构化三元组的表示,统一了多模态大语言模型(LLMs)中的视觉解码任务。


其他


借助精灵公司的AIGC驱动系统变革游戏资产创建

https://genies.com/blog/transforming-game-asset-creation-with-genies-aigc-powered-system

游戏艺术铸造公司(Game Art Forge)推出了人工智能生成的模板,以简化游戏资产创建流程,为开发者提高速度、增强可扩展性并提升创意把控能力。它在保持一致性的同时允许定制,既支持独立开发者,也支持大型团队。通过将人工智能的效率与人类的创造力相结合,它确保了高质量、适应性强的游戏开发工作流程。

Open Sora发布(GitHub仓库)

https://github.com/hpcaitech/Open-Sora

Open Sora项目自模型首次推出就已启动,它用不到20万美元训练出了一个颇具竞争力的模型。该项目发布了所有用于重现结果的代码和权重。这些成果很有吸引力,尽管并非完全最先进。

Nous Research刚刚推出一款API,让开发者能使用OpenAI和Anthropic不会打造的人工智能模型 。

https://links.tldrnewsletter.com/EGyX8r

Nous Research推出了一款推理应用程序编程接口(API),开发者和研究人员可以使用其个性化、无限制的语言模型。该API支持两款模型,即Hermes 3 Llama 70B和DeepHermes-3 8B Preview,通过等待名单系统来管理需求并增加排他性。此次发布标志着Nous Research从开源发布转向商业产品。该公司旨在不违背其核心原则的前提下创建一种可持续的商业模式。

谷歌DeepMind推出用于控制机器人的新人工智能模型

https://techcrunch.com/2025/03/12/google-deepmind-unveils-new-ai-models-for-controlling-robots/

谷歌DeepMind的Gemini Robotics是一套人工智能模型,能让机器人与物体及环境互动。

Snapchat正在推出人工智能驱动的视频滤镜。

https://www.theverge.com/news/628354/snap-snapchat-ai-video-lenses

Snapchat白金会员现在可以使用由人工智能生成的视频滤镜,里面有动画狐狸、浣熊和花朵。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容