小羊简书说 - 简书

IP属地：陕西

BERT：双向编码器的革命性突破
一、引言 2018年，Google提出的BERT（Bidirectional Encoder Representations from Tran...

32 0 0
SGLang：结构化生成语言推理框架深度解读
一、引言在大语言模型（LLM）的应用场景中，推理性能一直是制约系统部署的核心瓶颈。尽管vLLM通过PagedAttention机制实现了显著的...

144 0 0

DPO直接偏好优化深度解读:无需奖励模型的RLHF革新
DPO直接偏好优化深度解读：无需奖励模型的RLHF革新一、引言在大语言模型（LLM）的对齐技术中，RLHF（Reinforcement Le...

124 0 0
RAG检索增强生成深度解读：知识检索如何赋能大语言模型
RAG检索增强生成深度解读：知识检索如何赋能大语言模型一、引言在大语言模型（Large Language Models, LLMs）快速发展...

50 0 0
vLLM推理加速深度解读：PagedAttention如何提升10x吞吐量
vLLM推理加速深度解读：PagedAttention如何提升10x吞吐量 1. 引言在大语言模型（Large Language Models...

71 0 0
RLHF深度解读：从人类反馈到ChatGPT的关键技术
引言强化学习人类反馈（RLHF）是近年来大语言模型领域最重要的技术突破之一。它解决了预训练语言模型与人类意图对齐的核心问题，使得模型输出不仅流...

121 0 0
Transformer深度解读：注意力机制如何革新深度学习架构
Transformer深度解读：注意力机制如何革新深度学习架构一、引言 2017年，Google Brain团队在论文《Attention i...

0.3 109 0 1

UE5.3更新带来了哪些新功能呢？
太快啦！太快啦！！学习速度已经跟不上虚幻引擎版本迭代速度了。距离2023年5月11日上一版本UE5.2才刚发布短短4个月不到，于2023年9月6...

3694 0 0
Web缓存与策略
Web缓存定义 Web缓存（或HTTP缓存）是用于临时存储（缓存）Web文档（如HTML页面和图像），以减少服务器延迟的一种信息技术。Web缓存...

218 0 0