头条
Instagram 创始人推出个性化新闻应用
Artifact 是 Instagram 联合创始人打造的个性化新闻阅读器,现已向公众开放,无需注册。 Artifact 的核心是算法和机器学习技术,用于根据每个用户与应用程序内容的互动方式为他们创建一组精选的新闻文章。创始人暗示使用Transformer作为其 AI 背后的核心技术。
Tome 为人工智能讲故事筹集了 4300 万美元的 B 轮融资
powerpoint、figma 和 docs 的混合体——Tome 是一种由生成技术提供支持的创意工具。它一直在快速发展,看起来像是过去几个月社区中出现的几个想法的潜在有趣组合。这使他们筹集的资金总额超过 7500 万美元。
API 是聊天机器人的未来
使用聊天机器人作为演示来销售生成式 AI 工具的势头越来越大。公司现在正在为开发人员准备 API,以构建他们自己的生成式 AI 平台。该技术的早期应用包括客户服务、游戏和营销。 OpenAI 已与贝恩合作,可口可乐计划将该技术用于营销。开启生成式 AI 未来的竞赛正在进行中,能够成功实现 AI 应用的公司将从中受益匪浅。
研究
Latent Video Diffusion Models模型
One of the main bottlenecks of generative video work is the inability of current methods to scale to the massive number of frames or maintain temporal consistency in generation. This work tries to solve both problems at the same time by working in a projective latent space. They obtain impressive FID scores on standard benchmarks and have fun videos on their project page.
用于扩散模型的新(理论上有动机的)采样器显着提高了质量
通过建立对扩散模型的迷人的“基于分数”的解释,这项工作调查了为什么扩散模型在需要组合的各种任务中失败。他们确定采样器,而不是底层模型,一定是错误的来源。然后,他们提出了一种新的基于能量的参数化和 Metropolis 校正采样器。他们在各种艰巨的任务上表现出很大的进步。此外,作为一个较小的胜利,他们有一个关于所有这些主题的很好的背景部分!
模块化深度学习:为多个任务开发模型的解决方案
模块化深度学习已成为一种很有前途的解决方案,可用于开发专门从事多项任务而不会产生负面干扰的模型,并且可以系统地泛化到非相同分布的任务。本文概述了模块化架构,探讨了模块化的各种附加用途,并报告了成功部署模块化的各种具体应用。
提示调优、情境学习和指令提示调优的研究
本文讨论了使用参数有效的自适应方法,例如提示调整 (PT)、上下文中学习 (ICL) 和指令提示调整 (IPT) 来微调大型语言模型。该论文实证研究了上下文示例何时以及如何改进提示调优,并观察到 IPT 并不总是优于 PT,PT 不稳定,并且通过 PT 为特定源任务学习的提示在与上下文示例配对时表现出正迁移不同的目标任务。
工程
AI编程助手UX论文
可以说,除了强大的模型,副驾驶的成功还在于创新的用户体验。无论如何,此页面提供了一份论文列表,这些论文研究了不同选择对编程辅助工具用户的有效性。
Vid2Avatar:从单眼野外视频中学习人类化身
这篇文章提出了一种称为 Vid2Avatar 的方法,它可以从单眼野外视频中学习人类头像,而无需地面实况监督、外部分割模块或从大型数据集中提取的先验知识。该方法通过使用两个独立的神经场对场景中的人和背景进行联合建模来解决表面重建和场景分解的任务。
MochiDiffusion (GitHub Repo)
此应用程序为 Mac 带来了稳定的扩散。此应用程序使用 Apple 的 Core ML Stable Diffusion 实现,以在基于 Apple Silicon 的 Mac 上实现最高性能和速度,同时降低内存需求。它还可以在基于 Intel 的 Mac 上运行。
杂七杂八
Nvidia 如何主导 AI - 并计划保持这种状态
自 2012 年创建 AlexNet 以来,GPU 一直是 AI 的主要工作马。 Nvidia 在硬件和软件方面采取了许多精明的战略举措,使他们成为最近生成人工智能热潮中的最大赢家之一。他们的芯片为当今所有令人兴奋的人工智能应用程序中的绝大多数提供支持,而且几乎没有放缓的迹象。这篇文章是一些关键参与者的精彩历史,以及他们做出的导致他们当前(希望是未来)成功的决定。
以数据为中心的 AI 简介(在线课程)
这是有史以来第一个融合数据科学和 AI/ML 交叉点的课程。以数据为中心的 AI (DCAI) 是一门新兴科学,研究改进数据集的技术,这通常是提高实际 ML 应用程序性能的最佳方法。虽然优秀的数据科学家长期以来一直通过临时试验/错误和直觉手动实践这一点,但 DCAI 将数据改进视为系统工程学科。
我是如何用人工智能生成的声音闯入银行账户的
银行使用 Voice ID 来保护账户,但正如本文所示,AI 生成的声音会破坏这些计划。
精神控制的人工智能机器狗
澳大利亚军方正在测试一种人工智能“大脑机器人接口”,以控制与士兵思维同步的“机器狗”。
人工智能聊天机器人应该拥有机器人权利吗?
本文是对 David Gunkel 教授的采访,讨论了 AI 聊天机器人应该拥有哪些权利(如果有的话)。
人工智能创建的图像失去美国版权
美国版权局裁定,人工智能创作的图画小说中的图像不应获得版权保护,这是美国法院或机构就人工智能艺术和版权问题做出的首批裁决之一。