登录注册写文章

2025-04-30 简讯 : DeepSeek-R2

2025-04-30 简讯 : DeepSeek-R2

头条

DeepSeek-R2

https://deepseek.ai/blog/deepseek-r2-ai-model-launch-2025

DeepSeek推出了DeepSeek-R2，这是一款多语言且资源利用高效的模型，旨在挑战全球人工智能领域的领军者。

XAI筹集200亿美元资金

https://techcrunch.com/2025/04/25/musks-xai-holdings-is-reportedly-raising-the-second-largest-private-funding-round-ever/

马斯克旗下的xAI控股公司，目标是成为历史上最大的私人投资科技企业之一，据悉正寻求200亿美元资金。

极简 MCP 驱动智能体实现方案

https://huggingface.co/blog/tiny-agents

一份操作指南，教你如何仅用50行TypeScript代码构建一个紧凑的由MCP驱动的智能体。

如何更快地调试机器学习部署

https://decodingml.substack.com/p/how-to-debug-ml-deployments-20x-faster

本指南展示了一种高效的本地测试流程，旨在加快模型部署调试速度。

大语言模型竞技场帕累托前沿

https://winston-bosan.github.io/llm-pareto-frontier/

该图表对大语言模型（LLMs）的性能和成本进行了比较。性价比最高的模型有亚马逊Nova Micro、亚马逊Nova Lite、Gemini 2.0 Flash Lite、Gemini 2.0 Flash 001、Gemini 2.5 Flash和Gemini 2.5 Pro 。

工程

轻量级神经应用程序控制

https://arxiv.org/abs/2410.17883

华为提出一种有趣方法，能让视觉语言模型（VLMs）在安卓设备上只需极少额外系统设置就能控制应用程序。

认知诊断

https://arxiv.org/abs/2410.17564v1

DisenGCD是一种认知诊断模型，它通过使用解耦图学习框架，改进学生、练习和概念表征的学习。

PIPPO：从单张图像中生成高分辨率多视角人体（GitHub 仓库）

https://github.com/facebookresearch/pippo

虚拟人类创建训练系统（无预训练模型），可将图像作为输入，并输出高质量的人物3D模型。

其他

弹性人工智能基础设施

https://www.harvey.ai/blog/resilient-ai-infrastructure

哈维使用一个集中式Python库来管理人工智能模型交互，通过主动负载均衡和实时监控确保可靠部署。它实现了一个分布式速率限制系统，以处理突发流量并在实现无缝模型升级的同时保持性能。该设置增强了安全性，优化了资源利用，并支持快速部署、性能跟踪和故障检测，以提供一致的用户体验。

Character.AI推出AvatarFX，一款用于创建逼真聊天机器人的人工智能视频模型

https://techcrunch.com/2025/04/22/character-ai-unveils-avatarfx-an-ai-video-model-to-create-lifelike-chatbots

Character.AI的AvatarFX是一个视频生成模型，能让人工智能生成的角色动起来，还能根据现有图像创作视频。这项技术虽前景可期，但引发了对潜在滥用的担忧，尤其是在制作深度伪造内容方面。Character.AI的平台已面临安全问题，有诉讼称其聊天机器人助长了有害行为。

高中生的人工智能设备可防止酒驾

https://spectrum.ieee.org/students-device-deters-drunk-driving

北卡罗来纳州的高中生为防止酒驾，打造了SoberRide。这是一款由人工智能驱动的设备，利用摄像头、传感器和机器学习技术，检测司机的酒精影响迹象。该团队已获得美国专利，还与“母亲反对酒驾”等组织合作，在国际消费电子展上也引起了各大汽车制造商的关注。他们正倡导立法强制汽车安装酒驾检测系统，目标是让车队运营商和家长率先采用。

英国DeepMind工会化

https://links.tldrnewsletter.com/EvTUi1

约300名伦敦的DeepMind员工因对道德承诺以及与军事组织的合作感到担忧，正着手组建工会。

OpenAI为开发者推出图像生成API

https://links.tldrnewsletter.com/QG0vBx

OpenAI推出了一个API，可将DALL·E图像生成功能集成到应用程序和工作流程中。

这个人工智能模型能惊恐地疯狂尖叫。

https://decrypt.co/316008/ai-model-scream-hysterically-terror

纳里实验室的Dia-1.6B是一款小型开源人工智能，号称在情感语音合成方面超越了ElevenLabs和芝麻。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

2025-02-29 简讯 : GROK 3似乎曾短暂屏蔽对特朗普和马斯克不利的言论
头条 GROK 3似乎曾短暂屏蔽对特朗普和马斯克不利的言论 [https://techcrunch.com/20...
数科每日阅读 73评论 0赞 0
2025-03-07 简讯 : 亚马逊的人工智能推理模型
头条亚马逊的人工智能推理模型[https://techcrunch.com/2025/03/04/amazon-...
数科每日阅读 186评论 0赞 0

2025-01-06 简讯 : xAI的Grok模型推迟发布
头条 xAI的Grok模型推迟发布 [https://techcrunch.com/2025/01/02/xais...
数科每日阅读 240评论 0赞 0
2025-01-22 简讯 : Perplexity AI 出价欲与抖音合并
头条 Perplexity AI 出价欲与抖音合并 [https://techcrunch.com/2025/0...
数科每日阅读 229评论 0赞 0
2025-01-13 简讯 : 独立应用Grok在美国iOS系统上发布
头条独立应用Grok在美国iOS系统上发布 [https://www.tomsguide.com/ai/xais...
数科每日阅读 246评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文