240 发简信
IP属地:广东
  • java服务jvm metric采集之jmx_prometheus_javaagent

    简述 记录java服务运行时jvm的metric信息采集操作,本文使用的方案是通过jmx_prometheus采集服务数据。 相关依赖 jmx_...

  • Resize,w 360,h 240
    Hadoop之Tez-UI

    TEZ UI部署 参考官方Tez UI[https://tez.apache.org/tez-ui.html]部署文档;修改集群相关配置,并在t...

  • Resize,w 360,h 240
    知识库RAG应用-Dify&RagFlow文档处理整理

    Dify 默认只解析文档中的文本,对于表格、图表类不做处理 文档加载流程a.) 入口 api\core\indexing_runner.pyb...

  • 知识库RAG应用--文档转换(Docs转PDF)

    Docs转PDF 在构建知识库应用时,发现在文档解析步骤,PDF解析(使用pdfplumber)的效果(在处理表格方面)要强于Docs文档(使用...

  • Resize,w 360,h 240
    常用推理引擎对比

    推理引擎概述性能表现易用性适用场景模型支持硬件需求部署方式系统支持其他说明ollama本地化轻量级LLM运行工具,旨在简化大语言模型的部署与管理...

  • 大语言模型压测工具探索 -- EvalScope

    EvalScope[https://evalscope.readthedocs.io/zh-cn/latest/index.html] 安装 验...

  • Resize,w 360,h 240
    推理引擎vLLM使用笔记 -- 0x01

    01 背景 在火山云下,运行DS-70B模型;官方推荐的推荐引擎是vLLM,相关环境按火山文档逐步安装GPU-部署DeepSeek-R1-Dis...

  • 知识库RAG应用技术点整理--文档加载

    知识库RAG应用技术点 -- 知识处理 文档解析 关于知识库应用,第一步的操作都是需要加载解析相关文档(doc,PFD,PPT等),再此基础上才...

    0.4 53 0 1
  • uv + vLLM使用笔记 -- 0x01

    uv安装 查看可用python版本 查找已安装python版本 配置相关镜像及参数 安装指定版本python 创建项目并指定python版本 创...