登录注册写文章

2025-03-18 简讯 : OpenAI在特朗普执政下推动更宽松的人工智能监管

2025-03-18 简讯 : OpenAI在特朗普执政下推动更宽松的人工智能监管

头条

OpenAI在特朗普执政下推动更宽松的人工智能监管

https://www.cnbc.com/2025/03/13/openai-lobbies-trump-admin-to-focus-ai-on-speed-light-regulation.html

OpenAI正在游说特朗普政府对人工智能进行最低限度监管，强调快速创新的必要性，同时对来自中国的人工智能竞争表示担忧。该公司旨在影响政府起草的即将出台的人工智能行动计划。

Anthropic API 新版本可以节约 Token

https://www.anthropic.com/news/token-saving-updates

Anthropic为其API引入了高效使用令牌的改进措施，包括缓存感知速率限制以及针对Claude 3.7 Sonnet增强提示缓存，最多可减少90%的令牌使用量。

Gemini 变得个性化，借助谷歌应用提供定制化能力

https://blog.google/products/gemini/gemini-personalization/

谷歌的Gemini现在通过其试验性的Gemini 2.0快速思考模型提供个性化服务。它能与你的谷歌应用集成，首先是搜索，可根据你过去的搜索调整回应。未来扩展将包括在相册和YouTube上实现个性化，通过了解用户偏好来提升人工智能协助水平。

研究

Cohere Command一款模型

https://cohere.com/blog/command-a

Cohere训练并发布了一个有1.11万亿参数的开放权重模型。它在智能体、多语言和编码应用场景中表现出色。它还针对检索等企业任务进行了专门优化。

为任意角色生成动作

https://kwanyun.github.io/AnyMoLe_page/

AnyMoLe利用视频扩散模型为任意角色生成帧间动作，无需特定角色的数据集。

多模态表征学习

https://arxiv.org/abs/2503.08497v1

MMRL通过引入共享表征空间来增强视觉语言模型的少样本适应性，该空间能在保持泛化能力的同时改善多模态交互。

工程

音频火烈鸟2（GitHub代码库）

https://github.com/NVIDIA/audio-flamingo

一个基于通义千问打造的、几乎完全使用合成数据的全新先进音频理解模型。

AGENT S（GitHub 仓库）

https://github.com/simular-ai/Agent-S

Agent S是一个强大的开放式计算机使用系统。它在浏览器、系统甚至移动任务方面都实现了顶尖性能。

统一视觉解码（GitHub 仓库）

https://github.com/MacavityT/REF-VLM

REF-VLM利用基于结构化三元组的表示，统一了多模态大语言模型（LLMs）中的视觉解码任务。

其他

借助精灵公司的AIGC驱动系统变革游戏资产创建

https://genies.com/blog/transforming-game-asset-creation-with-genies-aigc-powered-system

游戏艺术铸造公司（Game Art Forge）推出了人工智能生成的模板，以简化游戏资产创建流程，为开发者提高速度、增强可扩展性并提升创意把控能力。它在保持一致性的同时允许定制，既支持独立开发者，也支持大型团队。通过将人工智能的效率与人类的创造力相结合，它确保了高质量、适应性强的游戏开发工作流程。

Open Sora发布（GitHub仓库）

https://github.com/hpcaitech/Open-Sora

Open Sora项目自模型首次推出就已启动，它用不到20万美元训练出了一个颇具竞争力的模型。该项目发布了所有用于重现结果的代码和权重。这些成果很有吸引力，尽管并非完全最先进。

Nous Research刚刚推出一款API，让开发者能使用OpenAI和Anthropic不会打造的人工智能模型。

https://links.tldrnewsletter.com/EGyX8r

Nous Research推出了一款推理应用程序编程接口（API），开发者和研究人员可以使用其个性化、无限制的语言模型。该API支持两款模型，即Hermes 3 Llama 70B和DeepHermes-3 8B Preview，通过等待名单系统来管理需求并增加排他性。此次发布标志着Nous Research从开源发布转向商业产品。该公司旨在不违背其核心原则的前提下创建一种可持续的商业模式。

谷歌DeepMind推出用于控制机器人的新人工智能模型

https://techcrunch.com/2025/03/12/google-deepmind-unveils-new-ai-models-for-controlling-robots/

谷歌DeepMind的Gemini Robotics是一套人工智能模型，能让机器人与物体及环境互动。

Snapchat正在推出人工智能驱动的视频滤镜。

https://www.theverge.com/news/628354/snap-snapchat-ai-video-lenses

Snapchat白金会员现在可以使用由人工智能生成的视频滤镜，里面有动画狐狸、浣熊和花朵。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

2024-04-28 简讯 : Apple 发布 OpenELM
头条 Apple 发布 OpenELM[https://venturebeat.com/ai/apple-rele...
数科每日阅读 1,118评论 0赞 0
2024-08-06 简讯 : 微软称 OpenAI 现在是人工智能和搜索领域的竞争对手
头条微软称 OpenAI 现在是人工智能和搜索领域的竞争对手[https://www.cnbc.com/2024...
数科每日阅读 734评论 0赞 0

2025-02-17 简讯 : AI 短视频《VEO 2》即将登陆 YouTube
头条 AI 短视频《VEO 2》即将登陆 YouTube [https://blog.youtube/news-a...
数科每日阅读 1,326评论 0赞 0
2024-08-06 简讯 : 埃隆·马斯克起诉 OpenAI 和萨姆·奥特曼
头条埃隆·马斯克起诉 OpenAI 和萨姆·奥特曼，指控他们“愚弄”了他[https://arstechnica...
数科每日阅读 936评论 0赞 0
2025-01-26 简讯 : OpenAI 的运营智能体
头条 OpenAI 的运营智能体[https://links.tldrnewsletter.com/rrge8y]...
数科每日阅读 806评论 0赞 0

赞1赞

赞赏

手机看全文