240 发简信
IP属地:香港
  • 120
    NoThinking vs Thinking:推理模型无需思考也能有效

    摘要:最近的大型语言模型(LLMs)显著提升了推理能力,主要是通过在生成过程中包含一个明确且冗长的“思考”过程来实现的。在本文中,我们质疑这种明确的思考过程是否真的必要。我们...

  • 120
    DyPRAG:通过参数转化和动态知识增强,有效缓解RAG幻觉

    摘要:检索增强型生成(Retrieval-augmented generation,RAG)通过从外部资源检索相关文档并将它们整合到上下文中来增强大型语言模型(LLMs)。虽...