2025-04-07 简讯 : DeepMind的通用人工智能安全策略


头条


DeepMind的通用人工智能安全策略

https://deepmind.google/discover/blog/taking-a-responsible-path-to-agi/

谷歌DeepMind阐述了其在构建安全可靠通用人工智能方面的观点,强调随着通用人工智能能力的发展,要做好监督和技术保障工作 。

OpenAI 进行了首笔网络安全投资

https://techcrunch.com/2025/04/03/openai-just-made-its-first-cybersecurity-investment/

OpenAI对Adaptive Security进行了投资,这是一家利用人工智能模拟并培训员工防范社会工程攻击的初创公司。Adaptive Security获得了4300万美元的A轮融资,打算在人工智能威胁日益增加的情况下加强其平台。该初创公司由资深企业家布莱恩·朗联合创立,自2023年成立以来已迅速积累了超100个客户。

OpenAI非营利指导委员会

https://links.tldrnewsletter.com/P98uoF

OpenAI正组建一个新的专家委员会,以规划其慈善部门如何支持使用人工智能的社区,旨在让人工智能创新与现实世界的非营利需求相契合。


研究


从视频扩散模型中提取关节运动学

https://research.nvidia.com/labs/dir/akd/

这项研究引入了关节运动学蒸馏(AKD)框架,该框架利用基于骨骼的动画和生成式扩散模型,以较低的复杂度生成高保真、符合物理原理的角色动作。它通过分数蒸馏采样来引导关节层面的控制,确保结构一致性,在3D连贯性和富有表现力的动作质量方面优于现有方法。

基于LoRA的强化微调

https://arxiv.org/abs/2504.00460

MetaLoRA利用元学习原理引入动态参数生成,增强了基于LoRA的微调策略的灵活性和任务感知能力。

CLIP 中的后门攻击

https://arxiv.org/abs/2502.01385v1

CLIP模型极易受到投毒后门攻击,只需极少的投毒数据就能让攻击成功率接近100%。一种有效的检测方法是利用局部异常值检测来发现现有数据集中无意产生的后门。


工程


大中小网络(GitHub 仓库)

https://github.com/THU-MIG/lsnet

受人类视觉系统“见大、聚焦小”动态异尺度能力启发,一个全新的轻量级视觉模型家族诞生。LSNet在各种视觉任务中实现了顶尖的性能与效率平衡。它还引入了一种新型卷积核。

PPLX CUDA内核(GitHub仓库)

https://github.com/ppl-ai/pplx-kernels

Perplexity发布了一些混合专家(MoE)内核,这些内核在规模上比DeepSeek表现更优,同时在混合专家架构方面更灵活,限制也更少。

用于评估仇恨言论的HateBench

https://huggingface.co/datasets/TrustAIRLab/HateBenchSet

HateBench提供了一个框架,用于评估基于大语言模型生成内容的仇恨言论检测模型,还附带人工标注数据集以及用于分析对抗性和隐蔽性仇恨活动的代码。


其他


佐诺斯文本转语音技术

https://www.zyphra.com/post/beta-release-of-zonos-v0-1

一款出色的用于语音生成和语音克隆的Apache 2.0模型。它支持多语言,能进行富有表现力的实时生成。

Hugging Face的人工智能智能体课程

https://huggingface.co/learn/agents-course/en/unit0/introduction

Hugging Face今天推出了一门人工智能智能体课程。这门免费课程将带你踏上从新手到专家的旅程,助你理解、使用并构建人工智能智能体。

谷歌推出双子座模型的速度比其人工智能安全报告的发布速度还快

https://techcrunch.com/2025/04/03/google-is-shipping-gemini-models-faster-than-its-ai-safety-reports/

谷歌推出了人工智能推理模型Gemini 2.5 Pro。该模型在编码和数学能力方面领先,但谷歌尚未发布安全报告。谷歌计划在收集实验版反馈后发布这些报告,不过这种做法引发了对透明度的担忧。尽管承诺保持透明度,但谷歌在模型部署上似乎更看重速度,这与负责任的人工智能实践的行业规范有所不同。

克劳德编程开发者大会

https://links.tldrnewsletter.com/eHBjx3

Anthropic宣布举办其首场开发者活动,重点是围绕Claude进行实践环节和分享最佳开发经验。活动定于5月在旧金山举行。

Hugging Face的大语言模型(LLM)课程

https://huggingface.co/blog/llm-course

Hugging Face将其广受欢迎的自然语言处理课程改版为更全面的大语言模型课程,增加了关于微调、推理模型和现代人工智能智能体工作流程的章节。

热门编程人工智能代理德文推出新的随用随付计划

http://finance.yahoo.com/news/devin-viral-coding-ai-agent-194633884.html

Cognition为其人工智能编程工具Devin推出了一项20美元的入门级计划。Devin经过改进,能更好地处理复杂编码任务。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容