240 发简信
IP属地:上海
  • Agent合成数据

    合成数据的可验证性比较重要,参考美团这篇论文:EvoCUA[https://arxiv.org/pdf/2601.15876] 在 EvoCUA...

  • Agent可视化工具

    Laminar 详见github[https://github.com/lmnr-ai/lmnr]

  • claude code原理研究

    需要调研资料 An agent is just a for-loop.[https://github.com/browser-use/agent...

  • claude code router配置

    背景 本地环境配置的deepseek-v3.2,使用的是openai协议,需要ccr转成claude code可以识别的协议。 过程 执行如下命...

  • 可视化数据库

    目标 方便协同,在线excel的形式,后端数据库可以通过REST api的形式操作处理。满足产运和RD之间数据交付的需求,支持多种格式,包括附件...

  • RAG

    RAG检索到的内容进行embedding编码 meta[https://arxiv.org/pdf/2509.01092]meituan[htt...

  • 信息抽取

    评估指标 如 F1、CEM、EM 等方式EM:完全匹配 F1: 将预测值和标准答案都看作词语(tokens)的集合,计算两个集合的交集。 CEM...

  • WebAgent

    MIND2WEB[https://arxiv.org/pdf/2306.06070]纯LLM方案,通过大小模型组合使用的方式,缓解了html过长...

  • 思考

    深度 中长尾需求 是否有简单验证器 是否依赖用户反馈(长尾需求用户反馈稀疏,这条不可靠) 赋能 框架级工作,可以增加效率,基于该框架和示例,简单...