通过之前的Quantopian系列文章,大家已经了解Quantopian是一个在线构建量化交易策略的平台,而zipline
则是Quantopian开源的python量化交易库,提供了Quantopian大部分的功能(如回测、研究)。
本文就带大家快速的搭建一个zipline环境。
可以通过pip
或者conda
安装zipline
,这里推荐大家使用conda
, 因为conda同时提供了环境与包的管理,使用起来更为方便。
安装Anaconda
Anaconda 是包含了conda、python及常用可用计算库的一个一体化的安装包,同时也提供了一个UI界面供使用。
下载地址:
https://www.anaconda.com/download/#linux
windows直接下载exe安装,linux用户下载后直接执行该shell
$ chmod +x Anaconda3-5.2.0-Linux-x86_64.sh
$ ./Anaconda3-5.2.0-Linux-x86_64.sh
同时由于国内网速的原因,推荐切换至清华源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
确认是否安装成功
$ conda -V
conda 4.5.4
安装zipline
首先使用 conda创建一个单独的环境供使用,可指定python版本,在环境中安装的包不会影响其他环境
# 构建名为env_zipline的环境,指定python版本为3.5
$ conda create -n env_zipline python=3.5
切换至该环境
$ source activate env_zipline
可以看到shell前缀已经显示在该环境中
(env_zipline) $
使用conda安装zipline
# -c 表示指定channel
(env_zipline) $ conda install -c Quantopian zipline
数据准备
在写算法策略前,我们需要一些数据,本文通过Quandl API 来获取,你可以去网站免费注册一个账号(获取API_KEY),并使用如下命令将数据灌入zipline。
$ QUANDL_API_KEY=<yourkey> zipline ingest [-b <bundle>]
其中<bundle>
是数据包的名称,默认为 quandl
。
国内速度感人,可以自己想想办法 o( ̄︶ ̄)o,提示如下
$ QUANDL_API_KEY=api_key proxychains4 zipline ingest -b quandl
可参考之前的番前篇
在执行zipline ingest
时,处理进程莫名被killed,最后通过系统日志/var/log/*发现为OOM(Out of memory)被系统杀死,可调大虚拟机内存/swap,或调整OOM-Killer配置。
经常会失败,可能需要清理 data bundles
$ zipline clean [-b <bundle>] --keep-last 0 #数字表示保留最近的n次数据
编写算法策略
每个算法策略包含两个函数
initialize(context)
handle_data(context, data)
在算法执行前,zipline
首先会调用 initialize()
传入context
,context
是算法执行过程中共用的上下文信息,可以用来存储算法执行不同阶段的需要保存的数据。
初始化后,zipline
会根据事件调用 handle_data()
,每次调用,都会传入context
与data
,context
是执行过程中唯一的一份,但data
则与该次调用的事件相关,通常会包含此刻的开盘,最高、最低及收盘价。
来尝试写一个最简单的算法策略
from zipline.api import order, record, symbol
def initialize(context):
pass
def handle_data(context, data):
order(symbol('AAPL'), 10)
record(AAPL=data.current(symbol('AAPL'), 'price'))
首先需要引入使用的函数,所使用的函数大部分来自zipline.api
。当前算法中我们使用了order
和record
两个函数,order有两个参数——证券对象和买卖数量(为正标识买,为负表示卖),本例中我们买了10股苹果的股票。
record函数用来记录每次迭代过程中的你希望保存的数据,使用key=value的方式设置,当算法执行完后你就可以通过key来获取保存的数据。
执行算法策略
zipline提供了三种执行算法策略的方式:
- 命令行
- Jupyter Notebook
-
run_algorithm()
函数
命令行
首先我们使用命令行来执行下:
zipline run -f ../../zipline/examples/buyapple.py --start 2016-1-1 --end 2018-1-1 -o buyapple_out.pickle
run
首先会调用initialize
函数,然后使用handle_data()
对历史股票价格数据逐天处理,每调用一次,本策略就会买入10股苹果的股票。每次调用order()时,zipline就会在委托订单中新增10股苹果股票,handle_data执行结束后,zipline就会去寻找尚未成交的委托,并尝试去成交,如果交易数量巨大,通常需要考虑佣金及滑点的影响(简单来说,就是你会花费比股价*数量更多的钱)。
现在我们来看看结果,结果类型为pandas中的Dataframe。
import pandas as pd
perf = pd.read_pickle('buyapple_out.pickle') # read in perf DataFrame
perf.head()
可以使用matplotlib将苹果股价与我们策略的运行结果绘制出来。
%pylab inline
figsize(12, 12)
import matplotlib.pyplot as plt
ax1 = plt.subplot(211)
perf.portfolio_value.plot(ax=ax1)
ax1.set_ylabel('Portfolio Value')
ax2 = plt.subplot(212, sharex=ax1)
perf.AAPL.plot(ax=ax2)
ax2.set_ylabel('AAPL Stock Price')
因为我们的策略中只是单纯的买入苹果股票,可以看到两图基本保持一致。
Jupyter Notebook
Jupyter Notebook为python解释器提供了非常强大的浏览器界面,现在业界很多的quant都在使用,在notebook中也可以方便的执行zipline。
在notebook中,需要先加载zipline,然后使用魔术方法%%zipline
来执行zipline命令,参数与命令行完全相同。
%load_ext zipline
%%zipline --start 2016-1-1 --end 2018-1-1
from zipline.api import symbol, order, record
def initialize(context):
pass
def handle_data(context, data):
order(symbol('AAPL'), 10)
record(AAPL=data[symbol('AAPL')].price)
在notebook中我们就不在需用单独定义一个文件,会自动使用当前cell中的算法,同时,输出也不在需要单独定义,可以使用_.head()
直接获取。
至此,我们就完整搭建了一套zipline的环境,后续就可以随意玩耍了。
感谢阅读,欢迎订阅~