一只胖猪猪 - 简书

发简信

一只胖猪猪

0
关注
2
粉丝
52
文章
71177

字数
8

收获喜欢

IP属地：澳门

一只胖猪猪

线性回归的简洁实现习题
1.如果我们用nn.MSELoss()替换nn.MSELoss(reduction='sum')，为了使代码的行为相同，需要怎么更改学习率？为什么？ reduction默...

568 0 0
一只胖猪猪

不同树模型重要性计算方法总结
首先，目前计算特征重要性计算方法主要有两个方面： 1.计算重要性特征方法 1.1训练过程中计算训练过程中通过记录特征的分裂总次数、总/平均信息增益来对特征重要性进行量化。例...

1920 0 0

一只胖猪猪

集成学习
引言：在机器学习的有监督学习算法中，我们的目标是学习出一个稳定的且在各个方面表现都比较好的模型，但实际情况往往不这么理想，有时我们只能得到多个有偏好的模型(弱监督模型，在某些...

1202 0 0
一只胖猪猪

感知机
1. 什么是感知机？（1）感知机的定义是什么？感知机(perceptron)是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别。感知机预测是用学习得到的感...

396 0 0
一只胖猪猪

支持向量机
1. SVM简介支持向量机(support vector machines，SVM)是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别...

4326 0 1
一只胖猪猪

朴素贝叶斯分类算法
前言：在所有的机器学习分类算法中，朴素贝叶斯和其他绝大多数的分类算法都不同。对于大多数的分类算法，比如决策树，KNN，逻辑回归，支持向量机等，他们都是判别方法，也就是直接学习...

1134 0 0
一只胖猪猪

逻辑回归
逻辑回归是一种广义线性模型，它与线性回归模型包含的线性函数十分相似。但逻辑回归通过对数概率函数将线性函数的结果进行映射，目标函数的取值空间从（ ∞，＋∞）映射到了(0,1...

1237 0 0

一只胖猪猪

线性回归
1.线性回归的重要性 1）Linear Regression：是回归问题的基础 2）Logistic Regression:是分类问题的基础 3）可扩展性：使用基函数来解决非...

1775 0 0
一只胖猪猪

决策树
1.什么是决策树？决策树是监督学习算法。是机器学习算法中一种依靠对条件进行判断来进行分类(针对离散数据生成分类树)和回归(针对连续数据生成回归树)的算法。是直观运用概率...

1445 0 0
一只胖猪猪

聚类模型的评价指标
1.误差平方和SSE 误差平方和(Sum of the Squared Error, SSE),也被称为组内误差平方和，它是机器学习中很重要的概念，该概念是在聚类和回归类算法...

8608 0 0
一只胖猪猪

分类模型评估指标
机器学习解决问题的通用流程：问题建模----特征工程----模型选择----模型融合其中问题建模主要包括：设定评估指标，选择样本，交叉验证。解决一个机器学习问题都是从...

349 0 0
一只胖猪猪

降维算法之LDA(线性判别降维算法)--有监督
LDA在模式识别领域(比如人脸识别，舰艇识别等图形图像识别领域)中有非常广泛的应用，因此我们有必要了解下它的算法原理。不同于PCA方差最大化理论，LDA算法的思想是将...

5507 0 1

一只胖猪猪

KNN算法
KNN做回归和分类的主要区别在于最后预测的时候决策方式不同。KNN做分类预测时，一般是选择多数表决法，即训练集里和预测的样本特征最近的K个样本，预测为里面有最多类别数的类...

1228 0 0
一只胖猪猪

聚类算法--KMeans
1.聚类与KMeans 与分类、序列标注等任务不同，聚类是在事先并不知道任何样本标签的情况下，通过数据之间的内在关系把样本划分为若干类别，使得同类别样本之间的相似度高，不同类...

1243 0 0
一只胖猪猪

分类和聚类的区别
1.简单地说，分类就是按照某种标准给对象贴标签，再根据标签来区分归类。聚类是指实现没有"标签"而通过某种成团分析找出事物之间存在聚集性原因的过程。 2.区别是，分类是事先定义...

1465 0 0
一只胖猪猪

聚类算法--DBSCAN
DBSCAN(Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于密度的聚类方法)是一...

2045 0 0
一只胖猪猪

机器学习中的SVD总结
1.矩阵分解 1.1矩阵分解的作用矩阵填充(通过矩阵分解来填充原有矩阵，例如协同过滤的ALS算法就是填充原有矩阵) 清理异常值与离群点降维、压缩个性化推荐间接的特征组...

2015 0 0

一只胖猪猪

降维算法之PCA(主成分分析)--无监督
1.相关背景在许多领域的研究应用中，通常需要对含有多个变量的数据进行观测，收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息，但是也在一定程度上...

5145 0 5
一只胖猪猪

XGBoost三种特征重要性计算方法对比
特征重要性作用与来源特征重要性，我们一般用来观察不同特征的贡献度。排名靠前的，我们认为是重要的。这一思路，通常被用来做特征筛选。剔除贡献度不高的尾部特征，增强模型的鲁棒性...

10884 0 1
一只胖猪猪

Python打开zip文件
Zip文件格式是通用的文档压缩标准。自1.6版本起，Python中zipfile模块能够直接处理zip文件里的数据，例如需要将对应目录或多个文件打包或压缩成zip格式，或...

3108 0 0

暂无个人介绍