240 发简信
IP属地:台湾
  • Resize,w 360,h 240
    RAG那些事儿

    RAG一般流程 将用于检索的知识库(文档)拆为小(几百个token)的文本块Chunk 对文本块进行 TF-IDF 编码,建立索引 语义嵌入Em...

  • Resize,w 360,h 240
    LangChain解析

    LangChain 是一个用于开发由语言模型驱动的应用程序的框架,它旨在帮助开发者更容易地构建、实验和部署大模型应用程序。LangChain 的...

  • Resize,w 360,h 240
    AutoGPT解析

    AutoGPT[https://github.com/Significant-Gravitas/AutoGPT]是一个相对全面精巧可以构建AI ...

  • Python现代包管理框架Poetry

    Poetry 是一个用于Python的依赖管理和打包工具,它通过一个pyproject.toml文件来管理项目依赖,简化了依赖管理的过程。Poe...

  • 基于k8s云原生的模型推理架构

    Kubeflow是运行在K8S之上的一套技术栈,通过各种组件实现机器学习模型的训练和推理部署到云原生的模型平台。 Kubeflow组件 Kube...

  • RAG检索增强生成——使用LlamaIndex框架

    LlamaIndex 是一个RAG检索增强生成框架, 提供了必要的抽象,可以更轻松地摄取、构建和访问私有或特定领域的数据,以便将这些数据安全可靠...

  • 信贷风控那些事儿

    模型是一把尺子,好的策略可以承受一个不太准的尺子。 类似做评分的纯表格数据,特别是连续变量特征适合树模型,深度模型效果一般。 深度模型适合处理离...

  • 提示工程prompt优化框架DSPy

    对于LLM大模型应用来说,提示工程prompting engineering 是基本的,也是很重要的工具,对于模型智力和推理能力有着至关重要的影...

  • 从0到1搭建一个智能体

    从0到1搭建一个智能体,写一个能帮忙买火车票的智能体AI Agent,火车票相关API均为Mock。基于LongChain框架,使用ReAct的...