2023-08-25 简讯 :Meta 推出 Code Llama


头条


Meta 推出 Code Llama

https://ai.meta.com/blog/code-llama-large-language-model-coding/
Meta 发布了 Code Llama,这是一种基于 Llama 2 的大型编码语言模型。 7B、13B 和 34B 参数模型现已推出。他们在 HumanEval (53.7) 和 MBPP (56.2) 上表现强劲。 Code Llama 模型可以生成和调试代码,经过指令调整,并且具有极长的上下文 - 多达 100k 个 Token。

Hushing Face 融资 2.35 亿美元

https://techcrunch.com/2023/08/24/hugging-face-raises-235m-from-investors-including-salesforce-and-nvidia/
Hugging Face 在 D 轮融资中筹集了 2.35 亿美元,参与方包括谷歌、亚马逊、Nvidia、英特尔、AMD、高通、IBM、Salesforce 和 Sound Ventures。该初创公司目前估值为 45 亿美元。

白宫的“人工智能网络挑战”旨在众包国家安全解决方案

https://www.engadget.com/the-white-houses-ai-cyber-challenge-aims-to-crowdsource-national-security-solutions-170003434.html
白宫与谷歌和 OpenAI 等科技巨头合作,发起了“人工智能网络挑战”,以开发能够发现和修复软件漏洞的人工智能。该竞赛提供2000万美元的奖金。将鼓励获胜团队开源他们的解决方案。


研究


法律推理基准

https://hazyresearch.stanford.edu/legalbench/
为了构建衡量语言模型在法律框架中推理能力的基准,需要付出相当大的协作努力。注意已训练模型中的污染。

视频生成基准

https://arxiv.org/abs/2308.11606
通过自动视频生成讲故事是一个新兴的研究领域。故事延续、故事混音等任务是很难衡量的。希望这个伟大的新 Google 基准测试能够帮助该领域取得进展。

使用 LiDAR 点跟踪 3D 对象的新方法

https://arxiv.org/abs/2308.11875v1
由于注意力分散或没有注意到长期运动,大多数计算机视觉工具在使用 LiDAR 点跟踪 3D 物体时遇到困难。 MTM-Tracker混合了两种方法并分两个阶段工作来解决这些问题。


工程


低精度训练的单位缩放

https://graphcore-research.github.io/unit-scaling/user_guide.html
Graphcore 发布了一个优秀的 Pytorch 库,使 fp8 的训练变得超级简单和稳定。人们只需要一个模型包装器和火炬编译即可。

使用简单指令制作更智能、更小型模型的酷方法 (GitHub Repo)

https://github.com/neulab/prompt2model
Prompt2Model 不使用大型且占用大量资源的 AI 模型,而是让人们用简单的语言描述想要的内容,然后为该任务创建一个更小、更高效的 AI 模型。它可以使模型比一些流行的大模型工作得更好。

Cheetah:用于视觉语言任务的突破性多模式LLM (GitHub Repo)

https://github.com/dcdmllm/cheetah
由于理解混合图像文本上下文的限制,最近的模型经常难以处理复杂的视觉语言任务。 I4 基准测试的引入是为了评估这些任务。结果显示视觉提示生成器的注意力存在缺陷。为了解决这个问题,研究人员开发了 Cheetah,这是一种具有独特模块和训练策略的模型,擅长理解复杂的交错指令。 Cheetah 在 I4 基准测试中取得了顶级性能。


杂七杂八


Llama 2 上的 DPO

https://huggingface.co/blog/dpo-trl
人类反馈是提高语言模型一致性和整体性能的关键。然而,近端策略优化的训练过程存在一些挑战。最近的工作表明,人们可以直接针对人类偏好进行优化并绕过奖励模型。通过基于文本的强化学习,人们可以在最先进的开放模型上做到这一点。

迈向 AGI——缺少什么?

https://mark-riedl.medium.com/toward-agi-what-is-missing-c2f0d878471a
探索为什么当前的LLM 不太可能导致通用人工智能,以及为什么物理学本身会阻止我们从现在到通用人工智能的突然飞跃。

人工智能还不够好

https://skventures.substack.com/p/ai-isnt-good-enough
虽然人工智能非常好,但还不足以提供经济所需的自动化。

从命令行一键微调

https://jxnl.github.io/instructor/finetune/
一个很酷的工具,可以使用磁盘中的本地文件自动执行新的 gpt-3.5-turbo 调整过程。

AutoML Web 应用程序 (GitHub Repo)

https://github.com/mljar/automl-app
用于使用 MLJAR AutoML 训练机器学习管道的 Web 应用程序。

Bloc (Product)

https://www.askbloc.ai/
Bloc 是一款人工智能聊天机器人,可帮助人们进行销售、客户支持和浏览长内容。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,319评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,801评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,567评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,156评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,019评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,090评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,500评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,192评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,474评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,566评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,338评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,212评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,572评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,890评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,169评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,478评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,661评论 2 335

推荐阅读更多精彩内容