一开始接触行业分析的概念,是在本科毕业的第一份实习,那时候在一家信用评级公司,貌似叫远东XX资信,Anyway,这不重要,重要的是行业分析一直以来是个较为空泛的概念,尤其是行业分析报告,网上查到的基本是报价在X千元的东西,分析框架一般是从宏观,到中观,再到微观,厚厚几百页,有用的信息也不能说没有,但看过的都知道,形式大于实质。(当然,也可能是我没有真的花钱去买,嗯,一定是这样的!)
现在我们尝试,从真实的数据开始做,一旦开始这样想,就发现可以获得的数据确实很多,但能用于成体系分析的数据又少得可怜,而且作为技术小白,也没有懂爬虫的攻城狮朋友,一切都要从零开始。能想到的是,从股票的二级市场数据进行抓取。(此处感谢聚宽量化交易平台,提供数据接口,截止目前,每天少量的数据调用是免费的)
我按照证监会的行业分类标准,导出了2018年至2019年的各行业市值变化(其中排除了2019年中上市和退市的公司,保证数据比较的有效性)。在每个行业中,按每个企业对行业总体市值的贡献度进行排序,之后对前25%和50%的企业对行业市值变化的贡献度进行计算,这样做的目的是判断行业表现优异的情况下,是否依赖于少数的头部企业。得到的结果如下: