对数回归是什么?
Logit regression 发生率自然对数回归 是以过去的可能性或过去的概率为因变项的回归分析,研究概率的变化。
概率:现在的可能性。
似然(likelihood):过去的可能性。
罗列了3个概念,需要扎扎实实的搞清楚。看到以上解释,我们需要不停的转化时空观念,进入更抽象的境地。类似于概率(车辆的速度)与对数回归(加速度)的关系。
其一、关于概率:站在今天位置,过去有可能发生的事情,如今有的发生了、有的没发生。换句话说今天发生的事情,过去是不确定知道的必然发生的,那个时候只有一个“似然”。
其二、关于对数:日常中我们通常以百分比表示概率,如“下雨概率是60%”。对数回归中表示用的是发生率的自然对数。即:发生概率与不发生概率的比值,取自然对数。
对数回归分析的目的:
哪些因素以什么方式影响某事的似然性,即:过去某个时刻事情发生的可能性。
能够做个时光穿梭旅行,到过去的时刻,观察当时的情况是最适当的。但是目前来说不现实。我们只能设计思想实验。就现实已经实现的可能性是过去最大的可能性(概率=似然最大值)。
根据现实追溯以往,推测在过去某个时刻,当自变项与因变项是什么关系时,实现的发生概率最大。再给这个过程起个名字:最大似然性估计(Maximum Likelihood Estimate)。
阶段复盘:
“确定的世界、必然的出现”,在我们小时候就深深地印在脑海里。成长的过程中,发现听到、看到的怎么跟自己想象的不一样,疑虑顿生。一件件事情的发生,让自己知道有些事“自己不知道”,原因有可能有:首先,是太多的事物我仅仅从一个角度着眼,没有看清全面(只有一个自变项);其次,即使是看到了全面,每种可能的结果发生的概率不是只有0%(一定不发生)或者100%(一定发生);再次,事件发生的概率随着影响条件的变化,也同时在变化,它不是不变的数值(可能是个函数F(x));第四,概率的变化结果是预估,自变项、因变项是我们定性取得的,函数关系有可能是线性的、“U”型的等等,也可能相互间转换(两自变项共线等)。概率思维能够指导我们多维度、深度思考,各种分析方式使我们在赤身裸体之外,拥有可以抵抗的武器。在适度的情况下关注“灰犀牛”与“黑天鹅”,头脑保持多样性,始终存有两种不同(对立)的观念,同时正常的生活。