一、前言
在信评实际工作中,通常会遇到以下问题:在存在部分披露的情况下,如何比较两组应收账款的分散程度?通常采用的指标是前10名或前5名所占百分比。但是,前N名合计占比这个指标不能完全衡量分散程度。例如,有以下两组应收款:
序号 | 占比(%) | 累计占比(%) |
---|---|---|
1 | 30 | 30 |
2 | 30 | 60 |
3 | 30 | 90 |
4 | 5 | 95 |
5 | 5 | 100 |
序号 | 占比(%) | 累计占比(%) |
---|---|---|
1 | 70 | 70 |
2 | 14 | 84 |
3 | 6 | 90 |
4 | 5 | 95 |
5 | 5 | 100 |
-
情况1:披露时,都只披露前3名的情况。
此时,披露出的部分占比都是90%,无法比较谁的分布更集中,但是显然后者更集中,前者更分散。
-
情况2:完全披露应收款的分布情况
采用前3名合计占比这个指标来衡量,则二者分散度的度量结果相同,无法比较,但是显然后者更集中,前者更分散。
-
情况3:前者只披露出前3名,后者全部披露
无法直接比较二者的分散程度
本文的目的在于:提出一种通用的度量,可以比较两组应收款的分布哪一个更分散。
同时,本文提出的分散程度度量方法,其适用的范围更广,可以将一组完全披露、一组不完全披露的两组应收款来比较其分散度。由于它是借用Markowitz均值-方差模型的想法构建的,因此暂称之为-度量。
二、原理、方法论与假设
本文提出度量应收款分散度的思路如下。化用Markowitz均值-方差模型的想法,在Markowitz均值-方差模型的假设下,应收款越分散,合计违约金额这个随机变量的方差就越小。因此,合计违约金额的方差的大小,可以作为应收款分散度的一个度量方式。
具体来说,即假定应收款中:
- 每笔债务违约与否相互独立
- 每笔债务违约的概率都是
- 每笔债务回收金额为0
三、σ-度量的计算方法、性质及含义解读
1、计算方法
设实际的应收款百分比降序列为,其中,前项为报表附注中注明,通常是前5大债务人,或前10大;为实际上有多少笔应收款。因此有。记。采用度量区间来度量,其中
其中,对于未知的部分的计算方式如下:
取,
- 若
- 则另取,
- 否则取,
- 若
- 则取,2
- 否则取,
- 若,
- ……依此类推
- 若,
- 若
例:有不完整的降序百分比列:80%, 7%, 3%
计算:
计算:还应再指定的值
不完整百分比例之外,还有1-(80%+7%+3%)=10%,因此取,,
2、性质(与应用无关,可跳过)
对于披露完全的,有,即区间段收缩成一个数,记为
分布越集中,、越大;反之越小
-
、的最大值为1,最小值为,其中为实际上应收账款的笔数
这一条也说明,-度量对于应收账款笔数也是有所反映的,不像前N名合计占比,对应收账款笔数不敏感
是假定未知的部分达到最分散的状态时,σ-度量如何;是假定未知部分达到最集中的状态时,σ-度量如何
开二次根号完全是为了数字看上去舒服,不会太过接近于1,类比于方差与标准差而生产,无其他实际用途
3、解读
计算出的、本身没有意义,通过与另一个区间进行比较才有意义。
-
对于计算出的两个区间,解读方法是:
若,即两区间没有重合,则小者表示分布更分散,大者表示分布更集中
-
若,即两区间有重合,则认为不可判断。对于“轻微接触”的情形,可视“轻微程度”来解读。
如,,相交的部分是,长度为0.01,认为可以忽略,认为后者比前者更分散
如,后者包含着前者,则认为完全无法判断
-
对于计算出的一个区间、一个数,解读方法是:
- 若,则小者表示分布更分散,大者表示分布更集中
- 若,则看是否特别接近和,如果不是特别接近,则认为无法判断,否则根据大小可以粗略判断
4、另一种使用方法
在计算出和后,可以寻找与之分散度最为接近的项等值,即利用解出的值。此时,的值代表着可将这样的分散程度,视作几等分的分散度。
四、计算举例
1、前言中的例子
利用上述度量,比较前言中情形3的两个应收账款分散度。
上表:,
下表:
下表的71.99%在区间(51.96%, 52.92%]的右侧,因此下表的分布更集中,上表的更分散。
2、无法直观比较出的分散度举例
例1:虚拟的例子
应收款1 | 应收款2 | |
---|---|---|
第1名 | 27.49 | 34 |
第2名 | 12.96 | 7.5 |
第3名 | 7.18 | 5 |
第4名 | 4.15 | 3.95 |
第5名 | 3 | 3.94 |
前5名合计占比 | 54.78 | 54.39 |
上表为两组应收款,各按其中债务主体进行汇总,排序为金额占比由大到小,其中的数字表示该债务人占总应收款的比重。用肉眼观察,前5名合计占比二者差不多;第1组应收款的第1名占比小,但是2~4名占比大。因此,无法用直观地看出哪一组应收款更分散。
用本文提出的方法计算,得到:
应收款1 | 应收款2 | |
---|---|---|
31.65 | 35.61 | |
33.71 | 38.00 |
其中,应收款1中:
因为,从而有
应收款2的计算同理。
观察上表,可知:应收款1的区间整体都在应收款2的左侧,因此,应收款1更分散。
例2:易事特集团股份有限公司应收款分散度分析
将以上两张表的占比部分提取出来,得到下表:
2017Q1应收款 | 2017Q3应收款 | |
---|---|---|
第1名 | 27.49 | 26.88 |
第2名 | 12.96 | 13.24 |
第3名 | 7.18 | 6.88 |
第4名 | 4.15 | 4.05 |
第5名 | 3 | 3.94 |
前5名合计 | 54.78 | 54.99 |
现在需要分析该企业这两次报告期的应收账款分散度如何变动。
经计算,得到:
2017Q1应收款 | 2017Q3应收款 | |
---|---|---|
31.65 | 31.26 | |
33.71 | 33.92 |
两区间基本是重叠在一起的(2017Q3的区间是包含着Q1的区间的),相交的部分长度为2.06,两区间长度为2.06、2.66,因此认为,两期的应收账款分散度没有变化。
通过以上两个例子,可以看出,用肉眼直接观察、用前N名占比和这些指标,是无法准确判断出两组应收款谁更分散的。
五、与熵、Theil指数的比较
1、定义
借用本文的符号,用熵来度量分散度是
用Theil指数度量是
其中,是第个个体的收入。
2、问题
熵度量的问题在于,对于任何一张未尽的、截断的应收账款占比的表(记剩余未展示的百分比为),其最分散情况都是:
从而,无法区分最分散的情况下,谁更分散。
Theil指数的问题在于,当时,
也就是说,对于一个三等分的应收款分布,和一个一百等分的应收款分布,Theil指数认为二者的分散程度是一样的,然而这显然是不正确的(当然,这对于收入分配来讲,3人均分和100人均分,应该是等价的,所以Theil才用于衡量收入均等化的程度)。
六、结论、拓展及展望
1、结论
本文提出了一种衡量应收账款分散程度的指标——-度量。对于一张完整的应收账款明细表,可以计算出其分散程度;对于截断的应收账款降序表(如前5大应收账款占比表),可以充分利用表内的信息,估计出其分散程度的范围。可比性方面,完整表-缺失表、完整表-完整表、缺失表-缺失表之间的分散程度度量,都可以进行比较。
此方法避免了用肉眼观察以及一些简单指标使用时带来的误判。
另外,需要指出的是,与应收款分布类似的,即可以等价于一组非负的、和为1的数的情形,都可以用此方法计算其分散程度。如:
- 股权分布是否分散(前十大股东的持股比例表)
- 其他就收款的分布是否分散
- 企业的业务是否多元(企业某一期各板块营业收入占总营业收入比重的表)
- 企业的业务是否趋于集中(企业历期各板块营业收入占总营业收入比重的表)
- ……
2、拓展
A、用于GDP分项(细分程度不同)分散度的度量
对于成组缺失的,比如比较A、B两个地区的产业分布,A只公布了一二三产业的产值,B公布得更详细,公布了几个具体行业大类的产值,如:沈阳和济南
沈阳GDP分项 | 济南GDP分项 |
---|---|
由于细项之和即大项,如:工业=采矿业+制造业+电力、燃气及水的生产和供应业,因此,取二者分类之最细,分别计算沈阳和济南的分散度。由于济南的GDP分项的每一项都比沈阳的要细,因此,济南的分散度计算出来应为一个数,而沈阳为2个数。
沈阳GDP分项的分散度计算过程,即:设各细项之比例,但已知一些细项之和的比例,计算这些未知比例变动时,使得分散度达到的最大值(上确界)和最小值(下确界)。当所有的分项都取所属大分项的平均值时,分散度达到最小(最分散)(证明:取向量和,利用欧氏空间Cauchy不等式可得);当所有已知分项组中,只有1个值非零,其他值全为0时,分散度达到最大(最集中)(证明:利用附录中的引理1可得)。
例:设非负,之和为1,已知,未知,但是已知,求分散度
,
3、展望
本文提出的方法,基于以下前提假设:
假定应收款中:
每笔债务违约与否相互独立
每笔债务违约的概率都是
每笔债务回收金额为0
引申到更广的层次,就是:
假定各个份额都满足:
- 互不相关
- 只有零和满两个状态
其中第2条的意思是,每个份额都只有“非此即彼”两种状态,如:
- 应收账款表
- 零:违约,回收金额为0
- 满:不违约,全额回收
- 股东表
- 零:表决时同意
- 满:表决时不同意
- 主营业务比例表
- 零:板块不景气
- 满:板块景气
- 地区GDP分项表
- 零:行业不景气
- 满:行业景气
而且,本文方法的根本想法是风险代表分散度。也就是说,不能用风险代表的分散度,就不能用本文的方法来度量。如收入分配是否足够分散(即平均分配),更适合用Theil指数来度量,而不适宜用本文的方法来度量。
而这些,也正是本方法需要改进的地方:
- 风险无法代表的分散度,如何度量?如:
- 收入分配是否均匀
- 一个地区的创新创业活力
- 一般团队越多,创业越可能成功
- 成功一个好项目,就能带动起一个地区的发展(即预期收益不是各分项的平均收益之和,即孵化出了3个项目,3个都搞搞;而是:孵化出了3个项目,只选一个最有前景的)
- 份额之间存在相关性,怎么办?如:
- 应收账款:某几个债务人同属一个行业
- 股东表:存在一致行动人
- 主营业务比例表:一些板块之间存在联动,如发电和电解铝(上下游)、环保发电设备与环保电厂运营(上下游)、汽油和柴油的生产(原料同是燃料油或原油)
- 地区GDP分项表:细项之间相关联,如邮政业-航空运输业,一些快递就是通过飞机运输的,二者为紧密相关
- 每个份额存在不止2种状态,还存在其他中间态,如:
- 应收账款:收回8成的本金
- 股东表:不参与经营
- 主营业务比例表:板块景气度还存在
一般
这个状态 - 地区GDP分项表:行业景气度还存在
一般
这个状态
附录:推导
记为第笔应收款违约,且收回金额为0,为第笔应收款不违约。
则所有应收款可收回的金额占总应收金额的百分比为,期望
其方差为(随机变量独立性)
不妨记,则上式为
类似于Markowitz的“分散投资带来风险降低”的核心思想,投资组合的风险可以拆解成“分散度单项资产风险”。去除掉违约概率的影响,剩下的便是分散度的度量。因此,上式除以单项资产的波动,得到应收款分散度的度量
遗憾的是,我们也许不能通过报表附注得到全部的,只能得到前面的一部分。有时是前5大应收款,有时是前10大。为了充分运用报表给出的信息,以得到一个统一的对于应收款分散度的度量,因此通过上式求得该分散度,并估计期最大最小值,即可对不统一的应收款分布进行统一比较。
- 命题1: 取最小值时,比例未知的部分取 。令,则在不确定的取值时,下确界为
-
命题2:取最大值时,比例未知部分尽量堆得更“集中”。
所谓“集中”,指:剩余未知项占比,至多有一项的占比小于已知的最后一名的占比,如:
例1:剩余部分比例为,且,则后续序列尽量往前堆,即取 。
例2:剩余部分比例为,且,则后续序列必须小于,因此持续未知序列至少有3项。取,,
命题1证明:
设 ,则有,
根据詹森不等式有 :
当且仅当 ,等号成立。
,随递减。当,,故的下确界为
# 证毕
命题2证明:
证明:当未知部分占比当且仅当满足以下条件A时,取到最大值:
条件A:小于且大于0的个数至多有1个
一、先证明:只有未知部分占比小于且大于0的个数至多有1个时, 才可能取到最大值(即条件A为必要条件)
反设:存在:未知部分占比小于且大于0的个数大于等于2的,可以取到 的最大值
记,则有 。
取其中介于两项,, ,分情况讨论:
-
时
试以新的两项 取代
此时 ,不会对其他项产生影响。
作差
所以
即以 取代 能令 的取值更大,
即此时 并未取到最大值。
-
时
试以新的一项 分别取代
显著地,
即以 取代 能令 的取值更大,
即此时 并未取到最大值。
至此假设被推翻,即:当存在2个及以上的、取值在之间的项时,无法取到最大值。
因此当中至多存在1个介于项时,才有可能取到最大值。
二、再证明:条件A为充分条件、存在最大值
任取不满足条件A的,记之为,对应的为
则从中取出,其中,记,,其他项沿袭,即:,由此得到,以及该序列的。由必要性证明部分可知,。
依此类推,得到,对于任何,每经过一步,序列中都会多出1个为的项。而对于任何未知部分占比,其中等于的项是有限多个。因此,从任何有限项的,都可以经过有限步(记步数为),得到,且满足条件A,且此条件下对应的所有都相同,记为。
因此,有
任取满足条件A的,其特点是:
-
只有项,其中表示对向上取整,如
证明:反设。则:
即,与题设矛盾。
所有项都为;或者只有一项不为,其值为,其余项都为
因此,其值都相同,记为
综上,当满足条件A时,成立
即当满足条件A时,达到最大值
# 证毕