2025年末Meta宣布裁减 AI 部门约600名员工,其中包括华裔科学家田渊栋。随后,田渊栋在一次访谈中坦诚地总结了自己的心路历程和思考感悟,...
理工男的朋友圈,每天总能冒出一大堆新技术,看的多了,似乎就琢磨出一点门道。TCP/IP协议栈当中的各种网络协议,加上应用层的各种流控协议,都是网...
SDN的又一篇总结,Communications of the ACM再次发布 Nick和Jeniffer 联袂长文,估计是要跟大统领要经费,只...
不久前,我买了一本菊花厂25年9月份新出版的IPv6随路遥测的书。虽然早前就知晓IPv6具备遥测能力,但亲眼看到书中描述的体系化复杂度与标准化进...
近期火爆的两篇论文,每个网络工程师都应该深读,均聚焦“规模化+高效化”但侧重点不同。• DeepSeek‑V3 提出 MLA 机制减少注意...
4.3 资源高效预填充与混合并行和微批次 预填充阶段负责处理输入提示以生成初始 KV 缓存,对首令牌时间(TTFT)和系统吞吐量有显著影响。鉴于...
摘要 大语言模型(LLM)的迅速扩展揭示了当前硬件架构在内存容量、计算效率和互联带宽方面的关键限制。DeepSeek-V3 在 2,048 张 ...
2024年,谷歌在SIGCOMM发表论文《A Decentralized SDN Architecture for the WAN》,宣告集中控...
甚至到目前为止,向控制平面注入更复杂的算法仍然是网络技术研究领域的主流方向,只不过控制的基石从分布式控制切换到了集中控制,控制的载体从路由器转移...