头条
Copilot Githut 升级
GitHub Copilot gets an upgrade
GitHub Copilot 获得升级。凭借更强大的基础模型、新的轻量级客户端模型和中间填充 (FIM) 功能,Copilot 自推出以来不断改进。合成代码的接受率从 27% 上升到 35%!
Coda AI (产品)
如果您是 Coda 高级用户,您会爱上 Coda AI。将 Coda 构建块的强大功能与 OpenAI 的 GPT 相结合,以加速您的文档创建。 Coda AI 还与 600 多个其他应用程序集成,以改进您的工作流程。
研究
10亿参数的多模态模型优于 1750亿参数的 GTP3
小的模型仍然可以击败更大的通用模型。这篇论文是另一个例子,作者使用小型多模态模型在视觉/文本基准 ScienceQA 上击败 GPT3 16%。这只是一个基准测试,但很高兴看到尺寸更合理的模型有所改进。
稳定熵假说
本文提出了一个假设,即“类人”文本生成位于一个狭窄的低熵区域。具有重复单词、不连贯句子和语法错误的退化文本远离该区域。他们提供了支持证据并提出了熵感知解码方案。
工程
在稳定扩散中导航潜在的流形
这篇博文提供了一个简单、直观的比喻来理解稳定扩散和基于扩散的生成模型中潜在的多样性。作者分享了他们探索潜在空间的旅程以及导航它的各种技术,提供了对稳定扩散的主要组成部分的见解。对于那些对控制图像生成和它们之间的插值感兴趣的人来说,这篇文章是一个很好的资源。
用于网络的 Langchain (GitHub repo)
与其他最近发布的库类似,Langchain 现在有一个 JavaScript 库。使用它来构建 LM 支持的网络应用程序。重要的是,与 python 版本的接口是一个巨大的焦点,特别是围绕对象的序列化。
Talk-To-ChatGPT (GitHub Repo)
Talk-To-ChatGPT 是一个谷歌 Chrome 扩展程序,它允许用户使用他们的声音与 ChatGPT 交谈,并用声音收听 AI 的回答。
杂七杂八
Netflix 扩展媒体机器学习
在此博客中,Netflix 概述了他们的媒体和艺术作品 ML 管道的工作和扩展方式。他们讨论预处理、培训、生产和存储。本文提供了一个案例研究,展示了这些组件如何改进现有管道的可扩展性、优化和可靠性。这里有一些有趣的花絮,特别是他们使用 Ray 为他们的 GPU 集群提供动力。
如何Fine Tune 最强大的开源LLM
FlanT5 可能是最好的开源语言模型之一。最大的版本(3B 和 11B 参数)性能最高,但由于需要并行性,因此最难调整。这篇文章概述了如何使用 deepspeed 在多个 GPU 上调整这些模型以进行总结。
启发现代人工智能艺术的物理原理
本文深入探讨了支持 DALL-E 和其他生成式 AI 模型的系统,这些模型在很大程度上受到了非平衡热力学的启发。
索尼创意人工智能研究总结
索尼创意人工智能研究小组的论文清单。他们专注于深度生成建模、音乐和电影 AI。如果您想了解音乐的最新发展水平,这里有很多很棒的链接可以放在您的阅读列表中。
人工智能可以帮助设计阿片类药物
人工智能现在被用于设计阻断 kappa-opioid 受体的药物,kappa-opioid 受体是对抗阿片类药物的关键受体,其速度比人类快得多。
人工智能乳腺癌诊断
开发和验证支持 AI 的数字乳腺癌检测,以预测 6 年内的早期乳腺癌复发。
随着加密热潮的消退,人工智能成为硅谷的下一个热门潮流
技术专家一致认为,为 ChatGPT 等系统提供动力的生成式人工智能有可能改变我们的生活和工作方式,尽管该技术存在明显缺陷。但有些人看到了泡沫的迹象,这让他们想起了最近消退的加密热潮。