240 发简信
IP属地:重庆
  • 线性回归的简洁实现习题

    1.如果我们用nn.MSELoss()替换nn.MSELoss(reduction='sum'),为了使代码的行为相同,需要怎么更改学习率?为什么? reduction默...

  • 不同树模型重要性计算方法总结

    首先,目前计算特征重要性计算方法主要有两个方面: 1.计算重要性特征方法 1.1训练过程中计算 训练过程中通过记录特征的分裂总次数、总/平均信息增益来对特征重要性进行量化。例...

  • 120
    集成学习

    引言:在机器学习的有监督学习算法中,我们的目标是学习出一个稳定的且在各个方面表现都比较好的模型,但实际情况往往不这么理想,有时我们只能得到多个有偏好的模型(弱监督模型,在某些...

  • 感知机

    1. 什么是感知机? (1)感知机的定义是什么? 感知机(perceptron)是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别。感知机预测是用学习得到的感...

  • 120
    支持向量机

    1. SVM简介 支持向量机(support vector machines,SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别...

  • 朴素贝叶斯分类算法

    前言:在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法,比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习...

  • 120
    逻辑回归

    逻辑回归是一种广义线性模型,它与线性回归模型包含的线性函数十分相似。但逻辑回归通过对数概率函数将线性函数的结果进行映射,目标函数的取值空间从( ∞, +∞)映射到了(0,1...

  • 120
    线性回归

    1.线性回归的重要性 1)Linear Regression:是回归问题的基础 2)Logistic Regression:是分类问题的基础 3)可扩展性:使用基函数来解决非...

  • 120
    决策树

    1.什么是决策树? 决策树是监督学习算法。是机器学习算法中一种依靠对条件进行判断来进行分类(针对离散数据生成分类树)和回归(针对连续数据生成回归树)的算法。是直观运用概率...

  • 120
    聚类模型的评价指标

    1.误差平方和SSE 误差平方和(Sum of the Squared Error, SSE),也被称为组内误差平方和,它是机器学习中很重要的概念,该概念是在聚类和回归类算法...

  • 120
    分类模型评估指标

    机器学习解决问题的通用流程:问题建模----特征工程----模型选择----模型融合 其中问题建模主要包括:设定评估指标,选择样本,交叉验证。 解决一个机器学习问题都是从...

  • 120
    降维算法之LDA(线性判别降维算法)--有监督

    LDA在模式识别领域(比如人脸识别,舰艇识别等图形图像识别领域)中有非常广泛的应用,因此我们有必要了解下它的算法原理。 不同于PCA方差最大化理论,LDA算法的思想是将...

  • KNN算法

    KNN做回归和分类的主要区别在于最后预测的时候决策方式不同。KNN做分类预测时,一般是选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类...

  • 120
    聚类算法--KMeans

    1.聚类与KMeans 与分类、序列标注等任务不同,聚类是在事先并不知道任何样本标签的情况下,通过数据之间的内在关系把样本划分为若干类别,使得同类别样本之间的相似度高,不同类...

  • 分类和聚类的区别

    1.简单地说,分类就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指实现没有"标签"而通过某种成团分析找出事物之间存在聚集性原因的过程。 2.区别是,分类是事先定义...

  • 120
    聚类算法--DBSCAN

    DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一...

  • 机器学习中的SVD总结

    1.矩阵分解 1.1矩阵分解的作用 矩阵填充(通过矩阵分解来填充原有矩阵,例如协同过滤的ALS算法就是填充原有矩阵) 清理异常值与离群点 降维、压缩 个性化推荐 间接的特征组...

  • 降维算法之PCA(主成分分析)--无监督

    1.相关背景 在许多领域的研究应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上...

  • XGBoost三种特征重要性计算方法对比

    特征重要性作用与来源 特征重要性,我们一般用来观察不同特征的贡献度。排名靠前的,我们认为是重要的。这一思路,通常被用来做特征筛选。剔除贡献度不高的尾部特征,增强模型的鲁棒性...

  • Python打开zip文件

    Zip文件格式是通用的文档压缩标准。自1.6版本起,Python中zipfile模块能够直接处理zip文件里的数据,例如需要将对应目录或多个文件打包或压缩成zip格式,或...