头条
我从 900 种最流行的开源AI工具中学到了什么
https://huyenchip.com/2024/03/14/ai-oss.html
这篇关于开源人工智能资源库的评论旨在让读者从大处着眼,了解看似铺天盖地的人工智能生态系统。
对先进AI发出警告的权利
一群人工智能公司的现任和前任员工呼吁先进的人工智能公司遵守相关原则,确保透明度并保护提出风险相关问题的员工。他们强调,公司需要避免执行非贬损协议,为匿名举报程序提供便利,支持公开批评,并防止对举报人进行报复。
Scaling 能解决机器人问题吗?
https://spectrum.ieee.org/solve-robotics
900 多人参加了去年的机器人学习大会,大会共举办了 11 场研讨会,收到近 200 篇论文。会上最大的争论之一是,在超大数据集上训练大型神经网络是否是解决机器人问题的可行方法。这篇文章介绍了争论的不同方面,以加深人们对争论的理解。扩展在其他类似领域也行之有效。然而,这并不现实,因为机器人数据并不多,也没有明确的获取途径。即使缩放在其他领域同样有效,也很可能无法解决机器人问题。
不透明的投资帝国让 OpenAI 的 Sam Altman 暴富
https://wallstreetsights.com/business/openais-sam-altman-get-rich/4975/
萨姆-奥特曼(Sam Altman)是硅谷最多产、最激进的个人投资者之一。截至今年年初,他管理的投资帝国至少拥有 28 亿美元的资产。其中大部分投资组合并不广为人知。本文将带读者了解阿尔特曼的投资情况。
研究
MMLU Pro
https://arxiv.org/abs/2406.01574
MMLU 是推理任务的常用基准。它通常既被认为是黄金标准,也被认为是模型过度拟合的结果。MMLU Pro 是衡量语言模型推理的一个全新、更难、更简洁的基准。
Tree Diffusion: Diffusion Models For Code
https://tree-diffusion.github.io/
很棒的扩散模型论文,可以扩散图像代码。它可以直接在扩散过程中进行编辑。它很慢,但可以轻松与搜索结合,从而显著提高推理能力。
LLM 的越狱方法
https://arxiv.org/abs/2405.21018v1
研究人员在贪婪坐标梯度(GCG)攻击的基础上,推出了基于优化的大型语言模型越狱改进方法。
工程
What is RAG? - A Neo4j Blog
https://neo4j.com/blog/what-is-retrieval-augmented-generation-rag/
聊天机器人可以来更像人类,并能提供详细、准确的回答。 Neo4j 的这篇博客,了解检索增强生成(RAG)如何改善LLM的回答。
Omost Image Synthesis
https://github.com/lllyasviel/Omost
Omost 来自 ControlNet 的创造者,是一种控制图像生成的方法。它首先将提示改写为一组描述性代码。然后,它使用这些代码来渲染最终图像。重要的是,人们可以在生成之前或之后编辑代码,对模型输出稍作修改。
改进的视频超分辨率
https://ssyang2020.github.io/zerosmooth.github.io/
研究人员为生成式视频扩散模型开发了一种无需训练的视频插值方法。这种新方法与各种模型兼容,无需大量训练或大型数据集即可提高帧频。
图像压缩
https://github.com/lianqi1008/Control-GIC
Control-GIC 是一种用于生成式图像压缩的新框架,可在保持高质量结果的同时进行细粒度比特率调整。
杂七杂八
LLM 光速推理
https://zeux.io/2024/03/15/llm-inference-sol/
使用理论光速建模作为基础,对于计算量和内存访问量先验已知的问题非常重要,因为它有助于验证实现的质量和预测架构变化的影响。
人工智能时代的高薪工作
https://www.noahpinion.blog/p/plentiful-high-paying-jobs-in-the
由于比较优势,无论人工智能在这些工作上做得多好,人类今天所做的许多工作都有可能无限期地继续由人类完成。
Facia
利用先进的面部识别技术防止欺诈和欺骗攻击。
树莓派也开始涉足人工智能
https://www.theverge.com/2024/6/4/24170818/raspberry-pi-ai-chip-hailo-devices
树莓派(Raspberry Pi)将推出一款与其相机软件集成的人工智能芯片,使聊天机器人等人工智能应用能够在微型计算机上原生运行。
Using AI To Decode Doc Vocalizations
https://news.umich.edu/using-ai-to-decode-dog-vocalizations/
密歇根大学的研究人员与墨西哥的 INAOE 合作开发了人工智能工具,通过分析狗叫声来判断狗是否贪玩或具有攻击性,并识别狗的品种、年龄和性别。