MatrixOnEarth - 简书

MatrixOnEarth

IP属地：俄勒冈州

Intel 显卡单机多卡 FSDP 模型 checkpointing 时 Assert Out
现象使用 Hugging Face Trainer 在单机多卡环境下对 LLAMA2-7B 进行 LoRA finetuning 时，在第一次...

187 0 0
辅助式文本生成 - 文本生成新范式
辅助式文本生成 - 文本生成新范式 @(NLP)[文本生成] 引言 LLM 要跨越从早期采用者到大众市场的鸿沟，其必要条件是价格大众化，也就是降...

0.3 419 0 1

使用开源 LLM 充当 LangChain 智能体
太长不看版开源 LLM 现已达到一定的性能水平，可堪作为智能体工作流的推理引擎。在我们的测试基准上，Mixtral[https://huggi...

656 0 0
详解 MoE
随着 Mixtral 8x7B 的发布（公告[https://mistral.ai/news/mixtral-of-experts/]，模型卡[...

1917 0 0
乱弹 LLM 的工程化
乱弹 LLM 的工程化 @(Thoughts) 仅为个人观点，乱弹而已。这一波 LLM 狂热很有意思，从现象上来看跟智能手机 + 移动互联网那...

515 0 0
Transformer 估算 101
@(Engineering Practice) 本文主要介绍用于估算 transformer 类模型计算量需求和内存需求的相关数学方法。引言 ...

459 0 0
优化故事: BLOOM 模型推理
优化故事: BLOOM 模型推理 @(Engineering Practice) 经过“九九八十一难”，大模型终于炼成。下一步就是架设服务，准备...

748 0 0

BLOOM 训练背后的技术
BLOOM 训练背后的技术 @(Engineering Practice) 假设你现在有了数据，也搞到了预算，一切就绪，准备开始训练一个大模型，...

994 0 0
ChatGPT 与 AIGC 简问乱答
ChatGPT 与 AIGC 简问乱答 ** 仅代表个人观点。 ** [Q1] ChatGPT 最近非常火爆，2 个月突破 1 亿月活，从产品形...

497 0 0