240 发简信
IP属地:江苏
  • Resize,w 360,h 240
    actix-web 日志组件

    0x00 目标 0x01 代码 Cargo.toml main.rs日志初始化,需要在程序开始时执行 middleware_log.rs基于官方...

  • 后端框架杂记(Robyn)

    今天刷到个后端框架Robyn https://github.com/sparckles/robyn[https://github.com/spa...

  • MSK kafka topic 副本数更新

    0x00 TLDR; 0x01、创建两个单rf的topic 0x02、创建参数 topics.json 0x03、生成建议内容 执行结果: 0x...

  • Langgraph开发调用mcp的agent

    0x00 TLDR; 使用 Langgraph 进行agent 开发,涉及一个最简单的mcp 服务端 0x01 准备 deepseek api ...

  • Resize,w 360,h 240
    基于triton vllm 部署qwen

    0x00 整体介绍 基于 triton 部署 qwen ,使用triton镜像中的 vllm 执行推理请求。假设本地工作目录 /home/ubu...

  • 基于对话数据集进行微调

    0x00 TLDR; 0x01 训练 准备参数文件: my_chat_dataset.jsonl 编写代码: 0x02 验证 看起来,没有达到预...

  • Bert模型微调

    0x01 TLDR; 接上一篇,完成了CLM模型的预训练实践后,这里进行模型微调的实践。 微调 = 现有模型 + 新数据训练 所以,流程上,我们...

  • Resize,w 360,h 240
    CLM模型预训练

    0x00 关键信息 下载开源数据集 CLM( Causal Language Model) 因果语言模型, 比如 gpt 理解训练过程 0x01...

  • 运行gpt2预训练库

    0x00 TLDR; 0x01 环境&准备 系统环境 手动下载模型 由于原始模型文件无法直接访问,采用国内镜像方式预先手动下载。 0x02 代码...

个人介绍
--disable-features=DownloadsPageRefererUrl