240 发简信
IP属地:广东
  • 120
    【LLM/大模型】一种新的注意力机制-System 2 Attention

    一、结论写在前面 论文提出了一种技术方案--System 2 Attention(S2A),可以让LLM决定输入上下文的重要部分,来生成好的响应。实现这点的方法是:首先诱导L...

  • 120
    【LLM/大模型】Orca 2:教小语言模型如何推理(Orca 2: Teaching Small Language Models How to Reason)

    一、结论写在前面 论文研究表明,提高小语言模型的推理能力不仅是可能的,而且可以通过训练定制的合成数据来实现。 Orca 2模型通过实现各种推理技术和识别每个任务最有效的解决策...