72/100#深夜阅读营#2016.1.18《海龟交易法则》p161-183 第十二章 脚踏实地
这一章主要讲怎么利用统计学,认识历史测试的一般原理,提高历史测试的准确度,在可能范围内得到最好的粗略估计。
本章大意我是了解的,但里面很多概念都不是很明白。
比如RAR(回归年度回报率)、R立方、年度化的月度回报标准差、CAGR。
谁都想在交易中洞察未来,哪怕只是粗略的估算。但如果用作者的方法,首先必须理解这些概念,知道怎么计算,然后必须设计相关的数据统计分析模型。
以下是读书摘要:
样本特征推断总体特征是统计学的一个领域,也是历史检验结果的未来预测价值的理论基础。
如果我们对某种特定交易策略的历史交易记录有充分的研究,就可以对这种系统的未来潜力得出结论。
样本分析受两大因素影响,一是样本的规模,一是样本对总体的代表性。
要避免近期偏好,因为只用近期的数据做测试,得出的结果就没有代表性了。
我们要找到稳健的业绩衡量指标,这涉及稳健统计学相关原理。
如果对数据稍作修改以后,不会显著影响到一个统计指标,那么这个指标就是稳健的。
上章节提到了MAR比率、CAGR(平均复合增长率)和夏普比率,这些指标并不稳健。如果改动一下其中的统计时间,相关的数据就会发生很大的变化。
回归年度回报率
线性回归线和它所代表的回报率为我们提供了一个新指标RAR(回归年度回报率)
R立方
R立方(稳健风险回报比率)的分子是RAR,分母是长度调整平均最大衰落。
平均最大衰落就是5次最大衰落幅度的平均值,长度调整就是将这5个衰落期的平均天数除以365,然后用这个结果乘以平均最大衰落,最后得到长度调整平均最大衰落。
稳健夏普比率
RAR除以年度化的月度回报标准差。
稳健的指标不太容易受到时间的影响,也不太容易受到运气因素的影响,而且可以帮助我们避开过度拟合的危害。
代表性样本
怎样得到有代表性的样本呢?
第一,市场数量,选择尽量多的市场。
第二测试时间,时间跨度越长涵盖的市场状态就越多。
我们可以把能得到的所有数据都测试一遍,因为买数据花不了多少钱,但如果没有经过多个市场多个年头的充分测试就盲目相信一个系统,风险就太大了。
样本规模
样本越小,推理就越粗糙。
只有得到一个足够大的样本才能作出有效的统计学推理,一般而言,达到数百的样本规模也许对大多数测试来说都够用了,而不到20的样本规模会导致严重的偏差。
在测试一条新法则时,必须衡量这个法则的使用频率。可以把法则一般化,提高它发挥作用的频率,这样样本规模就会矿大,法则测试的统计学说服力就相应提高了。
有两种常见的做法可能将小样本规模的问题进一步放大。
单一市场最优化,单独应用在各个市场中的最优化方法,很难有足够大的样本进行测试,因为单个市场的交易机会很少。
过于复杂的系统,复杂的系统有很多法则,有时候很难判断是哪一条法则发挥作用。
洞察未来
怎样判断在实际交易中可能获得什么成果呢?
要想得到有意义的答案必须理解影响系统表现的因素,使用稳健指标的必要性,以及采集足够大的代表性样本的重要性。
参数调整检验
在采用一个系统之前,先体验一下参数的作用是很好的习惯。
具体的做法是,挑出几个系统参数,大幅度调整参数值,比如20%到25%,然后看看效果怎么样。
滚动最优化窗口
滚动最优化窗口可以帮助我们直接体验从虚拟测试到现实交易的转变。
具体做法是:
随便选择8到10年前的某一天,用这一天之前的所有的数据进行最优化,要使用平常所用的最优化方法,做出平常会作出的权衡决策,就好像你只有截止到那一天的数据;
当你得出了最优化参数值后再用这一天之后两年内的数据检验一下这些参数值,系统在这两年内的表现会怎样呢?
接下来把测试点向后顺延两年,也就是6到8年前的一天,再测试一次,重复这个程序,直到延伸至今天。
蒙特卡洛检验
蒙特卡洛检验是判断系统稳健性的一种方法,它是一种用随机数据来检验某种特定现象的办法。
对于复杂的无法预测的交易,我们可以像费曼用随机数字来分析铀一样,借助随机数字来更好地认识一个交易系统的潜在特征。
常见的办法是:
交易调整:随机性的改变实际模拟结果中的交易命令和起始日,然后用调整后的交易命令和这些交易的损益水平来调整资产净值。
净值曲线调整:在初始净值曲线中随机选择一些部分,将它们组合成新的净值曲线。