https://mp.weixin.qq.com/s?__biz=Mzk1NzQ1ODk5NQ==&mid=2247524863&idx=1&s...
综述:Memory in the Age of AI Agents[https://arxiv.org/pdf/2512.13564] Retr...
LLM 推理加速中的 Prefill(预填充) 与 Decode(解码) 分离(也常被称为 Disaggregated Prefill and ...
这篇文章讲的很好:投机解码[https://zhuanlan.zhihu.com/p/699670010] 另外需要补充下approximati...
这篇文章写的比较好了:[通俗易读]LLM训练-从显存占用分析到DeepSpeed ZeRO 三阶段解读[https://zhuanlan.zhi...
介绍 累加器是CPU中独立的寄存器,运算速度非常快。因此,乘法如果能表示成加法,也会大大提高执行效率。"快速乘"算法,就是这种通过加法来模拟乘法...
这里只记录最后一道算法题:题目如下:地上有n团杂物,每团杂物包含4个物品,第i个物品坐标(xi,yi),每次可以将它绕着(a,b)逆时针旋转90...
写在前面 网上已经有一篇笔记很好的记录了这篇论文《Aspect Level Sentiment Classification with Deep...
写在前面 网上对这篇论文的解读非常少,质量也不高,笔者在读的时候,顺手做了下笔记,分享出来。笔者在读的过程中,感觉这篇论文偏实际应用,虽然暂时没...