240 发简信
IP属地:北京
  • Resize,w 360,h 240
    LlamaFactory 微调

    训练的时候 可能需要的cuda版本太高 提示找不到gpu 没办法只能降低torch的版本幕僚的现在只到12.6...autodl的租不到 微...

  • Resize,w 360,h 240
    LlamaFactory学习笔记

    开源大模型微调框架 32位的全量微调 4字节 7B的模型的话 全量微调的话大概 47516位的强化微调 2字节 7B的模型的话 ...

  • 一些专有名词

    PPO(Proximal Policy Optimization,近端策略优化)是一种强化学习算法,核心思想是「每次更新策略时,步子不能迈太大,...

  • 客服系统启动笔记

    ollama 启动服务 mysql部分 redis启动服务 neo4j 可能要下载对应版本的 APOC 插件 https://neo4j.com...

  • Resize,w 360,h 240
    MinerU 笔记

    MinerU 用于处理pdf 属于是工作流 最后解析成markdown+json conda install -c nvidia nccl检...

  • Resize,w 360,h 240
    GraphRAG笔记

    个人理解:是将知识图谱和rag技术结合起来的框架里面可以将数据变成知识图谱的过程,里面用了在线的大模型,涉及token的消耗,所以成本上比较高。...

  • 大模型应用开发工程师

    02 手推transformer运行流程

  • 大模型相关

    传智星云网(AI工具导航站) 相关职位:大模型应用开发工程师 简历生成网站 职场密码