量化交易——量化选股(多因子选股)二

量化交易——量化选股(多因子选股)二之选股因子有效性的检验和有效冗余因子的剔除!

昨天我们说到了量化交易——量化选股(多因子选股)的基本概念大致流程的讲解,我们知道了多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。    今天我们做一个延续,实操和所用因子的选择以及我们举例说明,方便大家详细直观了解!

这就说明了在这一年时间里,流通市值与最终的收益率之间存在正相关关系。

从这可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。当然可以选择其他的因子同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。

选股因子有效性的检验

一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验

具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。


上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。

有效冗余因子的剔除

不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。

例如成交量指标流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

冗余因子剔除的详细操作步骤假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为:


1.先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高

 

2.按月计算个股的不同因子得分间的相关性矩阵

 

3.在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值

 

4.设定一个得分相关性阀值,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。     以上则是多因子选股如何剔除冗余因子剔除方式。目前很多券商都可以开通量化,专业成熟的并不多,每家费用也不一样,这个作为一个参考:

原创码字不易,赠人玫瑰,手留余香!明天我们讲解综合评分模型的建立和选股如何操作!更多详情关注交流,在线指导!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容