头条

Mistral Large

https://mistral.ai/news/mistral-large/
法国人工智能初创公司 Mistral 宣布与 Azure 建立合作伙伴关系，为其 API 推出新模型。 Mistral Large 擅长多语言任务，在 MMLU 上与 GPT-4 相差几个百分点，并且具有强大的性能。该初创公司还在其 API 中添加了一个新的 mistral-small 模型。

https://defensescoop.com/2024/02/20/scale-ai-pentagon-testing-evaluating-large-language-models/
Scale AI 已获得一份为期一年的合同，为五角大楼的大型语言人工智能模型开发测试和评估框架。该公司的目标是加强军事应用中人工智能的安全部署和稳健性。该项目涉及创建用于模型评估的专用数据集，以及为安全环境完善人工智能系统的迭代过程。此次合作将帮助国防部了解并负责任地部署生成式人工智能技术。

DatologyAI 融资 1100 万美元用于可扩展的数据管理

https://techcrunch.com/2024/02/22/datologyai-is-building-tech-to-automatically-curate-ai-training-data-sets/
Datology 由一些最优秀的数据质量研究人员创立，旨在使数据集的可扩展管理变得更加容易。

研究

MobileLLM

https://arxiv.org/abs/2402.14905
Meta提出了350m的参数语言模型，具有很强的推理性能，在API函数调用任务的正确性上甚至接近Llama 7B。模型尚未发布，但固定参数模型的创新值得探索。

测试LLM数学技能的新方法

https://arxiv.org/abs/2402.14660v1
ConceptMath 是一个新的双语基准测试，用于测试LLM的中英文数学技能。它的独特之处在于它将数学问题分解为特定的概念，从而可以更详细地评估人工智能在数学方面的优势和劣势。

使用 DreamRec 预测用户理想的下一个选择

https://arxiv.org/abs/2310.20453v1
DreamRec 引入了一种新颖的“学习生成”顺序推荐方法，它不是传统的从正面和负面项目组合中对用户偏好进行分类的方法，而是创建一个代表用户理想的下一个选择的“预言”项目。

工程

人体运动生成

https://barquerogerman.github.io/FlowMDM/
FlowMDM 是一种新模型，用于根据文本描述生成长、连续的人体运动序列。这种首创的基于扩散的模型使用混合位置编码来创建真实的运动，无需额外的降噪步骤，在关键数据集上的准确性和真实性方面表现出色。

使用语言模型进行视觉语音识别 (GitHub Repo)

https://github.com/sally-sh/vsp-llm
VSP-LLM 框架通过集成 LLM 引入了一种新的视觉语音识别和翻译方法。它通过对嵌入的视觉特征进行重复数据删除并采用低阶适配器进行经济高效的训练来有效地处理视频输入。

使用未来代币增强自回归模型 (GitHub Repo)

https://github.com/jakespringer/echo-embeddings
该项目引入了回声嵌入，这是一种新颖的策略，通过合并未来的代币信息来克服自回归模型的关键限制。这是通过重复输入两次来实现的，这显着提高了基准任务的性能，同时与其他嵌入增强方法兼容。

2024-02-29 简讯 : Scale AI 为五角大楼的LLM提供测试和评估框架

2024-02-29 简讯 : Scale AI 为五角大楼的LLM提供测试和评估框架

头条

Mistral Large

Scale AI 为五角大楼的LLM 提供测试和评估框架

DatologyAI 融资 1100 万美元用于可扩展的数据管理

研究

MobileLLM

测试LLM数学技能的新方法

使用 DreamRec 预测用户理想的下一个选择

工程

人体运动生成

使用语言模型进行视觉语音识别 (GitHub Repo)

使用未来代币增强自回归模型 (GitHub Repo)

杂七杂八

增强各种环境下的 3D 重建

平衡自动驾驶汽车的性能和效率 (GitHub Repo)

旧金山计算公司

Lazy Axolotl (Colab Notebook)

Persuva

AlphaMonarch 7B 模型合并 (HuggingFace Hub)

推荐阅读更多精彩内容

友情链接更多精彩内容

2024-02-29 简讯 : Scale AI 为五角大楼的LLM提供 测试和评估框架

头条

研究

工程

杂七杂八

推荐阅读更多精彩内容

友情链接更多精彩内容

2024-02-29 简讯 : Scale AI 为五角大楼的LLM提供测试和评估框架