数据科学简讯 2023-03-23


头条


Google 发布 Bard

它在这里!谷歌期待已久的语言模型服务游戏。 Bard 是 Lambda 的轻量级版本,Lambda 是几年前训练的 70B 参数的模型。他们花了很多努力使模型安全,并且避免胡说八道,我们将看到人们何时开始被添加到 wait list,如果这次 Google 能兑现承诺的话。

OpenAI 停止 Codex

自 2021 年以来一直处于免费测试阶段的 4 种流行编码模型集现已停产,取而代之的是 turbo 和 gpt-4 模型。虽然这些模型非常擅长编码。但研究界担心,淘汰这些模型将大大降低重现基于它们的先前研究的能力。

Adobe 的生成模型

Player 2 已经发布。 Adobe 为其 Firefly 模型集推出了私人测试版。在强大的视觉团队和重要数据的支持下,这家艺术巨头现在准备提供他们自己的生成图像模型。越来越多的人认为技术不那么重要,渠道仍然是王道,当两者结合时,我们将拭目以待!


研究


Google 提出SVDiff, 一种个性化的文本到图像扩散模型

谷歌的研究人员提出了一种称为 SVDiff 的新方法,以解决现有文本到图像扩散模型在个性化方面的局限性,包括过度拟合和低效的参数存储。 SVDiff 涉及对权重矩阵的奇异值进行微调,从而产生紧凑且高效的参数空间,从而降低过度拟合、语言漂移的风险,并具有明显更小的模型大小,使其在实际应用中更加实用。

Zero-1-to-3:Zero-shot 图像到 3D Object

Zero-1-to-3 是一个框架,用于从单个 RGB 图像更改对象的相机视点,使用条件扩散模型从合成数据集中学习相对相机视点的控制。这种方法对分布外数据集和野外图像(包括印象派绘画)显示出强大的零样本泛化能力,并且可用于从单个图像进行 3D 重建,优于最先进的模型利用互联网规模的预训练。


工程


我需要多少个 GPU 来训练我的模型?

简而言之,训练一个模型至少需要16*N(十亿参数)GB的集群内存。较大的集群可以加快收敛速度和训练时间,本文的方法是一种估量自己训练模型成本与性能的好方法。

GPTNeox 2.0 (GitHub Repo)

最好的、开放的、可用的模型并行训练库之一现在是最新的 deepspeed 版本。让这两个项目保持同步一直是一个挑战,现在将得到更多的关注。如果您想从头开始训练具有数十亿个参数的模型,那么这可能是适合您的存储库。

CLIP goes 3D (GitHub Repo)

CG3D 提出了一种框架,通过使用点云、渲染的 2D 图像和文本训练 3D 编码器,实现了零样本 3D 几何特征提取。对比损失(Contrastive loss)将特征对齐到多模态嵌入空间,并且可训练输入参数的提示微调(prompt tuning)克服了分布偏移问题。CG3D 展示了令人印象深刻的零样本、开放场景理解和检索能力,并作为下游 3D 识别任务的强起始权重(starting weight)。


杂七杂八


Nvidia H 系列芯片获得内存提升

大多数大型语言模型受限于芯片上的内存。这个新系列的芯片提供了188GB的芯片内存,令人惊叹。同时,这个芯片还拥有990 TFLOPS的计算能力,预计会更频繁地被用于训练和推理需要大量计算的模型。

人工智能与旅游行业的机遇

在这篇文章中,a16z 认为,旅游行业在从计划旅行到预订机票,再到旅途中的各个方面,都可以通过人工智能实现颠覆性的变革。生成式人工智能可以利用公共和私人旅行偏好、位置、交通和活动等方面的数据,提供洞察和建议。初创公司可以利用人工智能为旅行者提供灵感、行程规划、预订和旅途协助,创造更具有对话性和定制化的旅行体验。

减缓人工智能发展的理由

本文主张,我们在人工智能上的发展速度过快,也许减缓速度、更好地理解风险,才是人类最好的选择。

Bing 开放使用 DALL-E 创建图像

微软的 Bing 聊天机器人现在在搜索引擎中内置了一个由人工智能驱动的图像创建器。

AI Commits (GitHub Repo)

AI Commits 是一个 CLI 工具,它使用人工智能为你编写 Git 提交信息。

Awesome-Totally-Open-ChatGPT (GitHub Repo)

一个开源的 ChatGPT 替代品列表。

CanceledGPT (Product)

CanceledGPT是一个使用AI搜索和修改旧的攻击性推文的网站。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,635评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,628评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,971评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,986评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,006评论 6 394
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,784评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,475评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,364评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,860评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,008评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,152评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,829评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,490评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,035评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,428评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,127评论 2 356

推荐阅读更多精彩内容