阅读原文请点击链接:https://www.ricequant.com/community/topic/4691/?utm_source=jianshu
白马过隙,随着最后一代90后正式踏入成年大关,我们也与2017正式说再见。在过去的一年里,公众号的粉丝成功翻番。在我们普及金融科技教育的同时,收获了与用户间的深厚友谊。本篇文章将为大家梳理2017年四季度一起度过的美好回忆。
多因子系列
在多因子量化投资体系中,具有稳定的预期收益,可解释的经济驱动理论,与其他因子的低相关性是选择alpha因子的关键指标。本篇文章中,作者以此为因子选取标准,简单地构建了自己的因子库,总共包括八个大类因子,每个大类因子中包含四到五个子类细分因子。为了比较不同的权重优化方法的优劣,作者首先采取不同的方法对各个大类因子下的细分因子进行合成,确定了不同大类因子的各自最优的合成方法;其次,通过不同权重合成方法对合成的大类代理因子进行二次权重合成,并比较了这些不同合成方法下的因子表现差异。
(逐步回归(stepwise)流程图)
在量化交易中,多因子策略是一种常被提及且应用广泛的选股策略。我们会经常使用某种指标或者多种指标来对股票池进行筛选,这些用于选股的指标一般被称为因子。多因子模型的优点在于,它能通过有限共同因子来有效地筛选数量庞大的个股,在大幅度降低问题难度的同时,也通过合理预测做出了判断。本篇文章作者梳理了多因子模型的常规构建步骤,方便大家学习如何科学地构建多因子策略。
在日常处理数据的过程中,因为过大或过小的数据可能会影响到分析结果,尤其是在做回归的时候,我们需要对那些离群值进行处理。实际上离群值和极值是有区别的,因为极值不代表异常。本篇文章讲述了对于离群值的处理与数据的标准化。
当我们提及中性化时,我们往往是希望剔除待使用数据中那些多余的风险暴露。这些数据根据不同的应用场景会有不同类型。本篇文章将探讨中性化处理在多因子模型中的应用。除去行业中性化以及市值中性化以外还讲述了如何判断对什么因子进行中性化处理。
作为与内地金融市场高度关联的香港资本市场,尤其是基于港交所的二级权益市场,在量化投资领域的发展却相对滞后。究其原因,一方面受限于香港股票市场长期以来的基本特点:行业过于集中(以金融、地产为主),大部分股票市值较小、成交量较低、交易不活跃,且存在不少“仙股”“老千股”,不利于量化策略的开展;另一方面也与香港市场信息披露频率较低(大部分公司一年只发布两次财报),IT和数据资讯技术不够发达,全面、准确和有效的市场数据较难获取的特点有关。
而随着港股通的全面开展,内地与香港股市的交流前所未有地增强,许多内地资金通过港股通等渠道大举南下,“北水”已经成为香港股票市场的一只重要力量。本篇文章将探讨通过港股通数据构建多因子模型的应用。
机器学习
神经网络初步尝试/Neural network in Stock market ---胡子大叔
本文通过两部分通过最浅显的试错学习原理讲解了如何通过构建神经网络使得程序具备回炉机制。作者写的文章风趣幽默,实乃入门神经网络必备。
深度强化学习选股-上证50指数增强----猫狗大战
链接:https://www.ricequant.com/community/topic/4435/
简单的强化学习选股框架,在选股方面训练虚拟交易员选股调仓,实现SH50指数增强。在每个交易日,Agent根据获取的观测数据[Batch, Length,Factor]计算出一个行为向量[Batch],对50只成份股进行调仓,先卖后买使用,使用开盘价成交,在每交易日结束,使用收盘价评估持仓获得reward。Agent 推断架构为2层LSTM后接MLP输出。在与训练环境交互的时候使用gather处理n step折现问题。
虚拟交易员HS300指数择时-使用A3C训练卷积网络逼近函数----猫狗大战
使用asynchronous advantage actor-critic 框架优化两个神经网络近似函数,训练一个虚拟的指数择时交易员。
A3C 的计算框架简单说就是多个AC (Actor-Critic)同步进行工作,并且每个一段时间交流一下修正方向。简单的使用一个课题组进行比喻,设某课题有导师一人,学生N人,对一项课题进行研究。每周学生找导师交流一次,或每次学生卡壳找导师交流一次。这样所有的探索经验都会上传到导师处,导师综合所有的探索,同时了解多方向的进展和问题,修正课题组研究路线。学生获得导师的经验,可以从导师处获得技巧或者杀招,加速自己这一周研究进程。
(虚拟交易员样本外交易账户净值走势)
小波去噪结合机器学习分类算法预测涨跌 ----aggie89
使用小波分析对高频的信号进行滤波。首先将信号按小波尺度指标分层展开,再把小波高频信号的小波系数设为 0,最后再将分层小波信号重构,得到滤掉高频信号的股票指数。
利用常见的机器学习分类算法对沪深三百指数涨跌进行预测(总计2413次),结果显示如果将数据进行小波去噪,预测成功率会有一定程度的改善(2%~8%)
神经网络是一种热门的机器学习算法,可以用来模拟非常复杂的系统。本文用旨在探索利用最简单的神经网络预测隔天收盘价格。所选取的输入是过去的收盘价格。作者之后会尝试对数据进行滤波,结合时间序列分析里的预测方法进行预测。
趣味帖
If you are Alphago, how you're gonna trade?----胡子大叔
作者受AlphaGO成功的启发,认为AlphaGO只是比我们见过、听过、玩过更多的东西。只要数据集足够庞大,那么策略的效果一定非常惊人。最后通过4年的收盘价训练集进行股票的交易,回测时间从2010年至2017年,最终策略效果如何呢?
作者通过喝咖啡无人应答的例子说明在现实生活中,人是无法全部时间放在屏幕上盯着屏幕的,无法注意每一个股票价格信息。有时候我们会遇到某一类情况,一支股票早上开盘之后,在缓慢上涨,然后在一段时间之后,在毫无预警信号的情况下,突然下降。又或者,一直股票早上开盘之后,价格缓慢下跌,也是在某一个不定的时间点上,突然价格回升。作者设想如果能大概预测到这个时间点,通过历史数据回测,便能因此获利。
在股票市场我们市场发现一些股票“名嘴”一致看好市场时,市场往往会转瞬即下。我们此番并不是要找出名嘴当中的股海明灯,而是寻找股票中的“天灯”。“天灯”意味着它与其他股票两两相对之后得出的correlation是所有负相关中绝对值最大的,同时在股票池中它也负影响了最多支股票,并且在每支被影响股票的千百个correlation中,它们相对应的负相关系数绝对值也是最大的。