2025-06-05 简讯 : 微软推出由Sora支持的免费AI视频生成器


头条


微软推出由Sora支持的免费AI视频生成器

https://blogs.bing.com/search/June-2025/Introducing-Bing-Video-Creator

必应视频创建器可免费生成5秒视频,一开始有10次快速生成机会,之后就会切换到标准速度,或者需要微软奖励积分。

CHARACTER.AI多模态创作工具

https://blog.character.ai/character-ai-unveils-new-ways-to-create/

Character.AI 推出新工具,不再局限于聊天。像 Scenes 可用于交互式故事创作,AvatarFX 能实现图像到视频的头像动画制作。这些功能旨在助力创作者利用视频、图像和动画打造更丰富、更沉浸式的体验。

Salesforce收购Moonhub

https://www.moonhub.ai/moonhub-team-joins-salesforce

以人工智能招聘代理闻名的Moonhub加入了Salesforce,助力其更广泛的人工智能战略,包括Agentforce平台。


深度分析


《Claude Code:一项分析》

https://southbridge-research.notion.site/claude-code-an-agentic-cleanroom-analysis

这是一份关于Claude Code的报告,由Claude Opus 4在几乎所有主流旗舰模型的帮助下生成。Claude Code是一款智能编码工具,有一些新组件。它有能处理实时模型响应、工具执行和用户界面更新的流架构,能在不干扰工作流程的情况下提供安全保障的安全系统,能连接人工智能推理和系统执行的工具设计,以及能可靠控制复杂模型行为的提示工程。该报告涵盖Claude Code的架构基础、数据结构和信息架构、控制流和编排引擎、工具和执行引擎等诸多方面。

为什么通用人工智能(AGI)的时间表差异如此之大?

https://bluedot.org/blog/agi-timelines

许多实验室首席执行官预测,2到5年内会出现通用人工智能(AGI),而外部专家则预计需要几十年,甚至认为以目前的方法不可能实现通用人工智能。短期论支持者指出,基准测试已趋于饱和,人工智能任务完成能力每7个月就会翻一番,而且自动化人工智能研究有可能引发智能爆炸。长期论怀疑者反驳称,基准测试只能衡量定义明确的简单任务,莫拉维克悖论表明我们首先实现自动化的是 “简单” 的认知工作,而且单靠纯粹的智能并不能推动科学突破。


工程


OpenAI为初创公司提供的大语言模型A/B测试指南

https://cookbook.openai.com/examples/stripe_model_eval/selecting_a_model_based_on_stripe_conversion

HyperWrite的案例研究展示了基于实际支付转化率而非离线基准分数的A/B测试模型性能。其实际测试显示,GPT-4.1在降低成本的同时,转化率与Claude 3.5 Sonnet相当,这证明较低价格下 “足够好” 的性能可能比基准领先者更有价值。该指南包含用于统计测试的Python代码,并警告要避免诸如数据窥探和过早查看结果等常见陷阱 。

语言模型能记住多少东西?

https://arxiv.org/abs/2505.24832

研究人员开发出一种方法,通过在不可能进行泛化的随机数据和真实文本上训练模型,来区分真正的记忆和泛化。他们发现,模型会记忆训练数据,直至达到容量极限,然后转而学习通用模式,GPT 式的 Transformer 每个参数能存储约 3.6 比特的信息。这就解释了为什么从现代大语言模型(LLMs)中提取特定训练数据的尝试往往失败——其训练数据集的规模远大于它们的记忆容量。

视觉语言动作模型的新权重和数据

https://impromptu-vla.c7w.tech/

即兴VLA推出一个新数据集,包含8万个精心挑选的驾驶视频片段,以提升视觉语言动作模型在非结构化场景中的性能。它有以规划为重点的问答注释,在现有基准测试的预测和安全指标方面已展现出显著提升。


其他


美国食品药品监督管理局推出AI 工具,加速药物审批与检查

https://www.fda.gov/news-events/press-announcements/fda-launches-agency-wide-ai-tool-optimize-performance-american-people

“艾尔莎”可供美国食品药品监督管理局(FDA)所有员工使用,能加快临床方案审查、缩短科学评估时间,还能更好地确定高优先级检查目标。有一次,原本需要2到3天的审查,仅用6分钟就完成了。

AI 数据库大战 : Snowflake以2.5亿美元收购Crunchy Data,Databricks以10亿美元收购Neon

https://www.saastr.com/snowflake-buys-crunchy-data-for-250m-databricks-buys-neon-for-1b-the-new-ai-database-battle/

Snowflake和Databricks正进行战略布局,以引领人工智能数据库市场。Snowflake斥资2.5亿美元收购专注于PostgreSQL的公司Crunchy Data,Databricks则以10亿美元收购Neon。这些收购凸显了强大数据库基础设施对支持自主人工智能代理日益重要,也显示出行业整合趋势渐强。两家公司策略有别,Snowflake注重企业合规,Databricks则强调无服务器、人工智能优化架构。

XAI 寻求通过招标收购筹集3亿美元

https://techcrunch.com/2025/06/02/elon-musks-xai-reportedly-looks-to-raise-300m-in-tender-offer/

此次出售将允许员工以1130亿美元的估值向新投资者出售股份。

中国科技公司在没有英伟达的情况下为人工智能未来做准备

https://finance.yahoo.com/news/chinese-tech-companies-prepare-ai-012546092.html

由于英伟达处理器短缺,美国出口管制更严,阿里巴巴、腾讯和百度等中国科技巨头正转向使用国产芯片。

这不是你的错觉:人工智能正在加快变革步伐

https://techcrunch.com/2025/05/30/its-not-your-imagination-ai-is-speeding-up-the-pace-of-change/

与以往的科技革命相比,人工智能的迅速应用和发展是前所未有的,其对用户和成本规模的快速影响就凸显了这一点。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容