240 发简信
IP属地:北京
  • 基于k8s云原生的模型推理架构

    Kubeflow是运行在K8S之上的一套技术栈,通过各种组件实现机器学习模型的训练和推理部署到云原生的模型平台。 Kubeflow组件 Kube...

  • RAG检索增强生成——使用LlamaIndex框架

    LlamaIndex 是一个RAG检索增强生成框架, 提供了必要的抽象,可以更轻松地摄取、构建和访问私有或特定领域的数据,以便将这些数据安全可靠...

  • 信贷风控那些事儿

    模型是一把尺子,好的策略可以承受一个不太准的尺子。 类似做评分的纯表格数据,特别是连续变量特征适合树模型,深度模型效果一般。 深度模型适合处理离...

  • 提示工程prompt优化框架DSPy

    对于LLM大模型应用来说,提示工程prompting engineering 是基本的,也是很重要的工具,对于模型智力和推理能力有着至关重要的影...

  • 从0到1搭建一个智能体

    从0到1搭建一个智能体,写一个能帮忙买火车票的智能体AI Agent,火车票相关API均为Mock。基于LongChain框架,使用ReAct的...

  • Resize,w 360,h 240
    智能体AI Agents

    智能体 智能体AI Agents指能够感知环境、做出决策并采取行动以实现特定目标的智能系统。自动驾驶汽车就是一种典型的智能体。大模型LLM是智能...

  • Resize,w 360,h 240
    蔚来架构图

    这次WAIC2024 世界人工智能大会,参观了蔚来的展台,看了几幅架构图画的有点意思,分享一下。

  • Transformers的微调训练

    数据集准备和预处理 通过dataset包加载数据集定义Dataset.map要使用的预处理函数定义DataCollator来用于构造训练batc...

  • Hugging Face Pipeline神器

    直接使用Huggingface的Pipeline这个神器来轻松使用Transformer处理各种NLP问题简直太方便了。 通过AutoModel...