2025-04-30 简讯 : DeepSeek-R2


头条


DeepSeek-R2

https://deepseek.ai/blog/deepseek-r2-ai-model-launch-2025

DeepSeek推出了DeepSeek-R2,这是一款多语言且资源利用高效的模型,旨在挑战全球人工智能领域的领军者。

XAI筹集200亿美元资金

https://techcrunch.com/2025/04/25/musks-xai-holdings-is-reportedly-raising-the-second-largest-private-funding-round-ever/

马斯克旗下的xAI控股公司,目标是成为历史上最大的私人投资科技企业之一,据悉正寻求200亿美元资金。

极简 MCP 驱动智能体实现方案

https://huggingface.co/blog/tiny-agents

一份操作指南,教你如何仅用50行TypeScript代码构建一个紧凑的由MCP驱动的智能体。

如何更快地调试机器学习部署

https://decodingml.substack.com/p/how-to-debug-ml-deployments-20x-faster

本指南展示了一种高效的本地测试流程,旨在加快模型部署调试速度。

大语言模型竞技场帕累托前沿

https://winston-bosan.github.io/llm-pareto-frontier/

该图表对大语言模型(LLMs)的性能和成本进行了比较。性价比最高的模型有亚马逊Nova Micro、亚马逊Nova Lite、Gemini 2.0 Flash Lite、Gemini 2.0 Flash 001、Gemini 2.5 Flash和Gemini 2.5 Pro 。


工程


轻量级神经应用程序控制

https://arxiv.org/abs/2410.17883

华为提出一种有趣方法,能让视觉语言模型(VLMs)在安卓设备上只需极少额外系统设置就能控制应用程序 。

认知诊断

https://arxiv.org/abs/2410.17564v1

DisenGCD是一种认知诊断模型,它通过使用解耦图学习框架,改进学生、练习和概念表征的学习。

PIPPO:从单张图像中生成高分辨率多视角人体(GitHub 仓库)

https://github.com/facebookresearch/pippo

虚拟人类创建训练系统(无预训练模型),可将图像作为输入,并输出高质量的人物3D模型。


其他


弹性人工智能基础设施

https://www.harvey.ai/blog/resilient-ai-infrastructure

哈维使用一个集中式Python库来管理人工智能模型交互,通过主动负载均衡和实时监控确保可靠部署。它实现了一个分布式速率限制系统,以处理突发流量并在实现无缝模型升级的同时保持性能。该设置增强了安全性,优化了资源利用,并支持快速部署、性能跟踪和故障检测,以提供一致的用户体验。

Character.AI推出AvatarFX,一款用于创建逼真聊天机器人的人工智能视频模型

https://techcrunch.com/2025/04/22/character-ai-unveils-avatarfx-an-ai-video-model-to-create-lifelike-chatbots

Character.AI的AvatarFX是一个视频生成模型,能让人工智能生成的角色动起来,还能根据现有图像创作视频。这项技术虽前景可期,但引发了对潜在滥用的担忧,尤其是在制作深度伪造内容方面。Character.AI的平台已面临安全问题,有诉讼称其聊天机器人助长了有害行为。

高中生的人工智能设备可防止酒驾

https://spectrum.ieee.org/students-device-deters-drunk-driving

北卡罗来纳州的高中生为防止酒驾,打造了SoberRide。这是一款由人工智能驱动的设备,利用摄像头、传感器和机器学习技术,检测司机的酒精影响迹象。该团队已获得美国专利,还与“母亲反对酒驾”等组织合作,在国际消费电子展上也引起了各大汽车制造商的关注。他们正倡导立法强制汽车安装酒驾检测系统,目标是让车队运营商和家长率先采用。

英国DeepMind工会化

https://links.tldrnewsletter.com/EvTUi1

约300名伦敦的DeepMind员工因对道德承诺以及与军事组织的合作感到担忧,正着手组建工会。

OpenAI为开发者推出图像生成API

https://links.tldrnewsletter.com/QG0vBx

OpenAI推出了一个API,可将DALL·E图像生成功能集成到应用程序和工作流程中。

这个人工智能模型能惊恐地疯狂尖叫。

https://decrypt.co/316008/ai-model-scream-hysterically-terror

纳里实验室的Dia-1.6B是一款小型开源人工智能,号称在情感语音合成方面超越了ElevenLabs和芝麻。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容