数据科学简讯 2023-04-01

头条

与 OpenAI 合作的 Zoom IQ（AI 智能伴侣）

Zoom 正在通过整合专有人工智能模型和利用 OpenAI 等公司的外部模型来扩展其人工智能能力。下一代 AI 智能伴侣 Zoom IQ 旨在通过总结聊天线程、起草内容和创建会议议程来增强协作和简化工作流程。随着这些功能向特定客户推出，Zoom IQ 旨在为个人和团队节省时间并增强创造力。

意外消费科技公司

本文以 ChatGPT 和 Meta 为例，讨论了消费技术和人工智能融合的影响，以及公司在实现产品市场匹配和将 API 集成到他们的产品中所面临的挑战。

研究

HiPer：使用高度个性化的文本嵌入来个性化图像生成和操作

该论文提出了一种称为 HiPer 的新方法，它使用高度个性化的文本嵌入来实现图像生成和操作中的个性化和内容操作，而无需模型微调或标识符。该方法仅使用单个图像和目标文本就可以操纵背景、纹理和运动，从而在各种任务中产生高度个性化和复杂的语义图像编辑。作者认为，他们对文本嵌入空间的新颖理解有可能激发对各种任务的进一步研究。

Piano Playing AI

自动钢琴在计算机出现之前就已经存在，但现在计算机可以通过控制机械手指来弹奏钢琴。这是一个令人着迷的控制问题，可以让 RL 智能体学习如何控制灵巧的手指弹奏钢琴。有一个交互式演示，可让您在玩游戏时戳戳手。

DreamBooth3D：使用少量图像个性化文本到 3D 生成模型

DreamBooth3D 是一种新方法，它可以使用少至 3-6 个随意拍摄的主题图像来个性化文本到 3D 生成模型。该方法将个性化文本到图像模型的最新进展与文本到 3D 生成相结合，通过 3 阶段优化策略克服了输入视点过度拟合的问题。 DreamBooth3D 可以生成高质量的、特定于主题的 3D 资产，这些资产具有文本驱动的修改，例如新颖的姿势、颜色和在主题的任何输入图像中都看不到的属性。