无影寺 - 简书

发简信

无影寺

0
关注
0
粉丝
2
文章
3052

字数
0

收获喜欢

IP属地：广东

无影寺

【LLM/大模型】一种新的注意力机制-System 2 Attention
一、结论写在前面论文提出了一种技术方案--System 2 Attention(S2A)，可以让LLM决定输入上下文的重要部分，来生成好的响应。实现这点的方法是：首先诱导L...

2444 0 0
无影寺

【LLM/大模型】Orca 2:教小语言模型如何推理(Orca 2: Teaching Small Language Models How to Reason)
一、结论写在前面论文研究表明，提高小语言模型的推理能力不仅是可能的，而且可以通过训练定制的合成数据来实现。 Orca 2模型通过实现各种推理技术和识别每个任务最有效的解决策...

1430 0 0

无影寺

@IT·互联网
若锦编，68043 篇文章，2653017 人关注

Hi，很高兴在@IT·互联网专题遇见你。收录范围：收录IT&互联网行业观察与思考，数码产品极客体验分析等类型文章投稿须知：https://www.jianshu.com/p/4edc76104c27 专题主编：@若锦 https://www.jianshu.com/u/e4c63b354a77 官方社群：可联系添加 @若锦加入专题官方社群交流、学习，添加时备注简书ID。
无影寺

读书
爱吃土豆的佩奇编，999709 篇文章，5572685 人关注

读书专题收录与读书有关的书评、读书笔记、阅读方法、读书清单等文章文中不得出现推广链接；包括但不限于公众号、头条号、二维码、微博等带有广告性质的信息；配图不能带有水文。请不要直接抄袭原文来投稿。请注意排版美观、内容结构完整、内容丰富、富有内涵等，注意不要密集投稿！投稿须知：https://www.jianshu.com/p/92d97be1a133
无影寺

暂无个人介绍