偏态分布为统计学概念,即统计数据峰值与平均值不相等的频率分布。根据峰值小于或大于平均值可分为正偏函数和负偏函数,其偏离的程度可用偏态系数刻画。(苦了我这个大学概率论考了78,高数89的。线性代数98的人)
下午,老师说:
左偏分布(负偏态)中:mean(平均数)<median(中位数)<mode(众数)
右偏分布(正偏态)中:mode(众数)<median(中位数)<mean(平均数)
这个结论我百思不得其解。后来不断地查资料看图,得到了以下解释(以右偏为例子):
偏度本身是相对于均值左右数据的多少。右偏(尾巴一定是在右边),也就是说数据在均值左侧的数量较多,所以为了达到所有数据于均值之差和为0,应该存在较大的数与之平衡,所有分布图里有一个很长的右端的拖尾(就是右端必须存在很大的值)。既然均值左侧的数比较多,对比中位数左右两侧数一样多,则均值必在中位数的右侧(即这样围成面积才大于0.5)。另外,右偏的图像围成面积为0.5的分界点应该在峰值点的右侧,所以中位数大于众数。所以就有众小于中小于均。
运用到实际中:
金融行业中不同类型的风控企业他的偏态分布体现了他的战略体系和风控体系。传统商业银行的信用风险分布是——左偏分布。因为他的经营模式是固定债权人,低杠杆、低风险(利率低,相比较私募股权投资等)),表现出的偏态特征就是:
(1)他的大部分数值集中在均值右侧——frequent small gains(频繁小幅收益),
(2)同时有一个很长的左端拖尾(就是左端存在很大的值),信用风险(极端值)一旦出现会有非常大的损失——a few extreme losses.
当然描述性统计属于定量分析,而几乎所有的定量分析都具有滞后性,也就是说我们是根据样本分布找到总体参数,从而分析总体特征,这些特征都是滞后表现的。