正式稿:
每天1分钟数据分析小知识1-回归分析
我们现实中遇到的数据,一般都是“毫无规律”的散点图,回归分析就是把这张散点图,假设成有两个或多个变量,通过一些系数、常数或者指数化过程组合起来,求出它们之间的函数表达,去探索出这张散点图的“规律”,以还原出这两个或多个变量之间的依赖关系,这个过程就叫做回归分析。
比如在EXCEL中,求一张散点图的回归方程的方法就是,作出这张散点图的趋势线,然后选中这条趋势线在“设置趋势线格式”中勾选最下面两行“显示公式”和“显示R平方值”,我们就可以看到这张散点图的回归方程y=ax+c和拟合度R²。
这个是实际工作中最快捷求出回归方程和拟合度(即回归方程可信程度)的方法。
资料收集:
百度词条:在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
INTERCEPT 函数
说明
利用已知的 x 值与 y 值计算直线与 y 轴交叉点。 交叉点是以通过已知 x 值和已知 y 值绘制的最佳拟合回归线为基础的。 当自变量是 0(零)时,可使用 INTERCEPT 函数确定因变量的值。 例如,当您在室温或更高温度的情况下采集数据点时,您可以使用 INTERCEPT 函数预测金属在 0°C 时的电阻。
语法
INTERCEPT(known_y's, known_x's)
INTERCEPT 函数语法具有下列参数:
Known_y's必需。 因变的观察值或数据的集合。
Known_x's必需。 自变的观察值或数据的集合。
备注
参数可以是数字,或者是包含数字的名称、数组或引用。
如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。
如果 known_y's 和 known_x's 所包含的数据点个数不相等或不包含任何数据点,则函数 INTERCEPT 返回错误值 #N/A。
回归线 a 的截距公式为:
公式中斜率 b 计算如下:
其中 x 和 y 是样本平均值 AVERAGE(known_x's) 和 AVERAGE(known_y's)。
INTERCEPT 和 SLOPE 函数中使用的下层算法与 LINEST 函数中使用的下层算法不同。 当数据未定且共线时,这些算法之间的差异会导致不同的结果。 例如,如果参数 known_y's 的数据点为 0,参数 known_x's 的数据点为 1:
截距和斜率返回 #DIV/0! 错误。 截距和斜度算法旨在查找一个且仅一个答案,在这种情况下,可以有多个答案。
LINEST 会返回值 0。 LINEST 的算法用来返回共线数据的合理结果,在这种情况下至少可找到一个答案。
示例
复制下表中的示例数据,然后将其粘贴进新的 Excel 工作表的 A1 单元格中。 要使公式显示结果,请选中它们,按 F2,然后按 Enter。 如果需要,可调整列宽以查看所有数据。
已知 y已知 x
26
35
911
17
85
公式说明结果
=INTERCEPT(A2:A6, B2:B6)利用上面已知的 x 值与 y 值计算直线与 y 轴的截距0.0483871