头条
与 OpenAI 合作的 Zoom IQ(AI 智能伴侣)
Zoom 正在通过整合专有人工智能模型和利用 OpenAI 等公司的外部模型来扩展其人工智能能力。下一代 AI 智能伴侣 Zoom IQ 旨在通过总结聊天线程、起草内容和创建会议议程来增强协作和简化工作流程。随着这些功能向特定客户推出,Zoom IQ 旨在为个人和团队节省时间并增强创造力。
意外消费科技公司
本文以 ChatGPT 和 Meta 为例,讨论了消费技术和人工智能融合的影响,以及公司在实现产品市场匹配和将 API 集成到他们的产品中所面临的挑战。
研究
HiPer:使用高度个性化的文本嵌入来个性化图像生成和操作
该论文提出了一种称为 HiPer 的新方法,它使用高度个性化的文本嵌入来实现图像生成和操作中的个性化和内容操作,而无需模型微调或标识符。该方法仅使用单个图像和目标文本就可以操纵背景、纹理和运动,从而在各种任务中产生高度个性化和复杂的语义图像编辑。作者认为,他们对文本嵌入空间的新颖理解有可能激发对各种任务的进一步研究。
Piano Playing AI
自动钢琴在计算机出现之前就已经存在,但现在计算机可以通过控制机械手指来弹奏钢琴。这是一个令人着迷的控制问题,可以让 RL 智能体学习如何控制灵巧的手指弹奏钢琴。有一个交互式演示,可让您在玩游戏时戳戳手。
DreamBooth3D:使用少量图像个性化文本到 3D 生成模型
DreamBooth3D 是一种新方法,它可以使用少至 3-6 个随意拍摄的主题图像来个性化文本到 3D 生成模型。该方法将个性化文本到图像模型的最新进展与文本到 3D 生成相结合,通过 3 阶段优化策略克服了输入视点过度拟合的问题。 DreamBooth3D 可以生成高质量的、特定于主题的 3D 资产,这些资产具有文本驱动的修改,例如新颖的姿势、颜色和在主题的任何输入图像中都看不到的属性。
工程
“LLaMA-Adaptor”的正式实现(GitHub Repo)
这个 repo 提出了 LLaMA-Adapter,这是一种用于微调指令跟随 LLaMA 模型的轻量级自适应方法,使用 Stanford Alpaca 提供的 52K 数据。
HOLODIFFUSION:使用 2D 图像训练 3D 扩散模型(GitHub Repo)
本研究提出了一种新颖的扩散设置,通过利用 2D 摆位图像和模型记忆与空间记忆的解耦,解决了 3D 生成建模中数据稀缺和计算复杂性的挑战。当应用于 CO3D 数据集时,该方法展示了可扩展性、稳健的训练和有竞争力的样本质量。
Xturing (GitHub Repo)
Xturing 提供快速、高效和简单的 LLM 微调。
杂七杂八
人工智能的寒武纪
本文将人工智能的发展现状与地球生命史上的寒武纪进行对比,探讨人工智能技术的快速多样化和演进,以及该领域创新进步的新时代潜力。
开发者工具 2.0
在这篇文章中,红杉资本探索了人工智能可以改变软件制作方式的一些领域。
GPT Jailbreakers Say They’re Preventing A Closed-Source AI Dystopia
这篇文章报告了“越狱 GPT”的开发,这是一种开源语言模型,旨在复制 OpenAI 的 GPT 模型的功能,并解决对后者的闭源性质和局限性的担忧。
Google Denies Bard Was Trained With ChatGPT Data
谷歌否认有关 Bard 聊天机器人是使用来自 ChatGPT 的数据进行训练的报道。
Midjourney Is Discontinuing Free Trials
随着一些 AI 生成的图像的病毒式传播和新用户的激增,Midjourney 将停止免费试用。
Kittl AI (Product Launch)
Kittl AI 是尖端人工智能图像生成和直观的 Kittl 设计流程的终极融合。通过将 AI 直接集成到编辑器中,Kittl 提供了无与伦比的速度和无缝的工作流程。
AI Library (Product Launch)
AI Library 是 AI 工具和神经网络的免费目录,其中添加了 1000 多种工具和教育材料。