2024-11-19 简讯 : 马斯克的起诉曝光了 OpenAI 的早期 drama 内幕


头条


马斯克的起诉曝光了 OpenAI 的早期 drama 内幕

https://techcrunch.com/2024/11/15/openais-tumultuous-early-years-revealed-in-emails-from-musk-altman-and-others/

埃隆·马斯克 (Elon Musk) 对 OpenAI 提起的诉讼导致该初创公司早期的电子邮件被曝光,揭示了内部紧张局势。

Spotify CEO Gustav 透露其计划开发 AI 生成的音乐、播客和推荐

https://www.bigtechnology.com/p/spotifys-plans-for-ai-generated-music

Spotify 正在拥抱 AI 驱动的内容创作,使用 Suno 和 NotebookLM 等生成 AI 工具制作音乐和播客,同时利用 LLM 来增强用户推荐。联席总裁 Gustav Söderström 表示,AI 是一种增强创造力的工具,而不是替代创造力,并且 AI 有潜力促进更深入的用户参与和个性化体验。Spotify 仍致力于支持其平台上的创作者,确保法律合规,同时探索动态 AI 驱动的创新。

Anthropic 聘请首位“AI 福利”研究员

https://arstechnica.com/ai/2024/11/anthropic-hires-its-first-ai-welfare-researcher/

Anthropic 聘请 Kyle Fish 作为首位“AI 福利”研究员,探索围绕潜在 AI 意识和道德权利的道德考量。这标志着 AI 公司在解决与 AI 系统意识和代理相关的道德问题方面的潜在转变。Fish 最近的论文讨论了如何提高对 AI 福利的理解,以避免在 AI 道德考量方面做出错误决策。


研究


Llama Mesh

https://research.nvidia.com/labs/toronto-ai/LLaMA-Mesh/

Nvidia 基于 LlaMA 的微调模型,可以根据文本输入为 3D 模型生成顶点。

语义感知水印

https://arxiv.org/abs/2411.09359v1

研究人员引入了语义扰动攻击来对抗现有的水印方案攻击。

解决旅行商问题

https://arxiv.org/abs/2411.09238v1

这项研究揭示了“热图 + 蒙特卡洛树搜索 (MCTS)”方法被忽视的重要性,表明仔细调整和简单的热图可以胜过复杂模型。


工程


视频转换器的运行长度标记化

https://github.com/rccchoudhury/rlt

通过自适应地缓存未随帧发生变化的视频标记,您可以大幅加快运行时间,且性能不会降低,无需额外训练。

区域感知文本到图像生成

https://github.com/NJU-PCALab/RAG-Diffusion

一种基于选定区域生成具有改进控制的图像的改进技术。

精确图像匹配

https://github.com/fb82/miho

MOP+MiHo+NCC 是一种非深度模块化方法,通过结合三种技术来细化图像匹配。多重重叠平面 (MOP) 聚类内点匹配并使用 RANSAC 过滤异常值。中间单应性 (MiHo) 减少平面重投影中的失真。归一化互相关 (NCC) 在变换后细化关键点位置。


杂七杂八


基于图形的人工智能模型描绘创新的未来

https://news.mit.edu/2024/graph-based-ai-model-maps-future-innovation-1112

麻省理工学院的研究人员开发了一种人工智能模型,利用生成知识提取和图形推理来揭示连接生物学和音乐等不同领域的复杂模式。该模型有效地从科学论文中创建知识图谱,识别联系并提出受艺术启发的创新材料。这种方法增强了跨学科研究,揭示了材料设计的隐藏见解和新概念。

视觉提示注入初学者指南

https://www.lakera.ai/blog/visual-prompt-injections

视觉提示注入通过在图像中嵌入恶意指令,导致意外的模型行为,对 GPT-4V 等 LLM 构成安全风险。这些漏洞可以操纵输出,例如忽略图像中的个人或更改描述的上下文。随着 GenAI 的采用率不断提高,公司需要采取强大的安全措施来缓解这些威胁。

如果人工智能不能永远变得更好怎么办?

https://arstechnica.com/ai/2024/11/what-if-ai-doesnt-just-keep-getting-better-forever/

报告显示,传统的 LLM 培训可能正在遭遇收益递减,因为像 OpenAI 的 Orion 这样的新模型并没有显著优于前辈。专家们担心 LLM 培训的优质文本数据会耗尽,从而促使人们转向合成数据和专门的 AI 模型。未来的进步可能会侧重于推理改进和特定于任务的模型,而不是一般的扩展。

自动创建 Python 包

https://github.com/GitsSaikat/Pygen

Pygen 将想法转化为 Python 包。

UltraVox 音频语言模型

https://huggingface.co/collections/reach-vb/ultravox-audio-language-model-release-67373b602af0a52b2a88ae71

一套开放权重模型,可以将文本和音频作为输入模式。

AI 使技术债务更加昂贵

https://www.gauge.sh/blog/ai-makes-tech-debt-more-expensive

AI 通过扩大低债务和高债务代码库之间的速度差距来增加技术债务的成本。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容