前言
这是小编关于学习线性回归、梯度下降及特征工程部分知识的学习随笔,里面记录了一些小编对于有关知识自己独到的见解。
基础概念
一、模型
什么是模型,小编认为模型是一种非常抽象型的,具有多种形式化的表达方式。例如有物理模型、数学模型、思维模型等等,利于研究。
二、模型函数
是基于模型之上,经过数据化处理后将数据中的实体、属性及其联系视作一种函数关系。
三、召回率
小编的理解是用来评价结果的质量,是一种度量值。即:
值 = 正确率
召回率
2
(正确率 + 召回率) (
值为平均值)
反映了被正确判定的正例占总的正例的比重。
四、训练集
和模型的关系密不可分,是确定权重及偏置参数的重要构成因素。因为它的全名是(train set)所以又称之为学习参数。
五、验证集
也与模型关系紧密,与训练集不同的是验证集决定的是超参。
六、验证函数
小编的理解是验证超参数据是否成功代入并使用的一种表达式:
(
)
(
)
七、损失函数
同样与模型有关,是用来反映预测结果和真实结果之间的不同差别,参与回归问题。即:
(
(
))
(
(
))
(
)
(
) (
)
(
)
(
)
线性回归
一、概念
线性回归是回归问题中的一种,可分为多元性和单元性,通常是作为预测两种变量之间的变化状态使用,具有快速、直接的优点,但异常值对于线性回归影响较大。
二、线性回归模型
(
)
(
)
(
)
梯度下降
一、概念
是属于迭代法中的一种,在线性回归当中最为有效、最好用的方法之一,梯度下降就是让梯度中所有偏导函数都下降到最低点的过程。
二、公式
(
)
(
)
特征工程
一、概念
小编认为它就是变量一个把原始数据转变成特征的过程,目的是获取更好的训练数据。
二、分类
连续型
无序离散型
有序离散性
三、特征工程的重要性
特征越好,灵活性越强
特征越好,构建的模型越简单
特征越好,模型的性能越出色
总结
以上就是目前小编所学范围之内,自己对于知识的理解,本篇幅较短就告一段落了,小编最近会继续发布一些短篇,谢谢大家的支持,回见!