240 发简信
IP属地:北京
  • 机器学习文本分类算法代码

    以下是一个综合示例,展示如何使用词袋模型和TF-IDF进行文本分类。 注意事项 参数调整:CountVectorizer 和 TfidfVect...

  • 文本型数据预处理+代码

    处理文本数据通常涉及多个步骤,包括文本清洗、分词、去除停用词等,是NLP的基础工作。 1、文本清洗 文本清洗包括去除特殊字符、转换为小写、处理缩...

  • 类别型数据预处理+代码

    本文将介绍处理类别型数据常用技术,以便将它们转换为适合机器学习算法使用的格式。 类别型数据是由一组离散的值组成的数据。 有序的(如教育水平:小学...

  • Resize,w 360,h 240
    数据预处理方法大全+实战代码(五)--特征工程

    前言 数据清洗的第一步:缺失值处理、异常值检测、数据一致性处理,笔者上几篇给出了原理和示例代码,这些也是特征工程里面的内容。数据和特征决定了算法...

  • Resize,w 360,h 240
    大模型实战--RAG与向量数据库搭建

    OpenAI接口方式 | 真实代码 一、整体概述 搭建本地向量数据库:使用向量数据库存储“新闻数据 ” 实现智能问答功能:输入问题,自动检索相关...

  • 想学习大语言模型(LLM),应该从哪个开源模型开始?

    一、首先制定学习目标: 学习如何从零训练大模型(1B左右规模,预训练+SFT++DPO+),打通整个流程。 钻研SFT:1)专有任务如Code生...

  • Resize,w 360,h 240
    DeepSeek:解释应用、API及调用方法:

    DeepSeek培训内容,解释应用、API及调用方法: 一、什么是应用? 定义:应用(Application)是解决特定需求的软件程序。例子: ...

  • 数据预处理方法大全+实战代码(四)

    前言 继续详细介绍缺失值处理、异常值检测、数据一致性处理。这是数据清洗的第一步,关键步骤。上一篇因为篇幅的原因,只介绍了异常值检测,本文介绍数据...

  • Resize,w 360,h 240
    数据预处理方法大全+实战代码(三)

    前言 继续详细介绍缺失值处理、异常值检测、数据一致性处理。这是数据清洗的第一步,关键步骤。上一篇因为篇幅的原因,只介绍了缺失值处理,本文介绍异常...