图片来自网络
现在很多客户端提供市场数据,但只能作为观看,并不能做深入分析。另一方面,量化分析越来越火热的今日。分享自己的量化回测笔记。
既然要开始本地量化回测。首先是要有一个完整的行情数据。为了方便本教程。笔者选择美股市场上的一支股票来快速的开始量化策略分析。
行情数据获取
我们使用pytdx来获取美股的历史行情数据
pytdx是一个github的开源项目,通过访问通达信的行情服务器来获取美股市场数据。
1. 安装pytdx
笔者使用python2.7并且安装Anaconda包管理工具
pip install pytdx
2. 获取数据
a.可以通过获取市场列表来选择你想要获取的行情,这里笔者选择美股知名公司
markets = api.get_markets()
api.to_df(markets)
得到的市场如下(节选):
market | name | short_name |
---|---|---|
1 | 临时股 | TP |
4 | 郑州商品期权 | OZ |
5 | 大连商品期权 | OD |
6 | 上海商品期权 | OS |
8 | 上海个股期权 | |
10 | 基本汇率 | FE |
11 | 交叉汇率 | FX |
31 | 香港主板 | KH |
40 | 中国概念股 | CH |
41 | 美股知名公司 | MG |
b.通过市场过滤,得到美股代码
df_inst = api.to_df(insts)
df_inst[df_inst['market'] == 41]
得到结果如下:
知名美股列表
c.获取历史日K线数据
from pytdx.params import TDXParams
his_kline = api.get_instrument_bars(TDXParams.KLINE_TYPE_DAILY, 40, "AAPL", 0, 300)
api.to_df(his_kline)
d.取日线,划张价格走势图(APPL-demo.csv)
import matplotlib.pyplot as plt
import datetime
def format(date):
return datetime.datetime.strptime(str(date), "%Y%m%d")
df = datadf
df['time'] = df['year'] * 10000 + df['month'] * 100 + df['day']
plt.plot(df['time'].apply(lambda x : format(x)), df['close'])
苹果300天历史K线数据
e.保存为csv格式
#保存为csv格式,命名为APPL-demo/按照逗号分隔
datadf.to_csv(r'./APPL-demo.csv',index=False,sep=',')
至此获取任意股票的历史行情的教程到此结束。下一篇开始讲述量化回测
f.获取数据完整代码附上(spider.py)
(代码未经过优化处理,需要解决通信达超时重连问题,如需要自动化下载移步Githut)
#spider.py
from pytdx.exhq import TdxExHq_API
from pytdx.params import TDXParams
import pandas as pd
api = TdxExHq_API(heartbeat=True)
host = "180.153.18.176" #通信达的api地址
port = 7721 #通信达的连接端口
#开始连接通信达服务器
api.connect(host, port)
insts = []
count = 500
curr_index = 0
while (True) :
insts_tmp = api.get_instrument_info(curr_index, count)
if insts_tmp is None:
break
insts.extend(insts_tmp)
curr_index = curr_index + len(insts_tmp)
if len(insts_tmp) < count:
break
#查看通信达提供的市场列表
#print api.to_df(api.get_markets())
df_inst = api.to_df(insts)
#这里笔者选择的美国知名公司列表, 所以market = 41
df_inst[df_inst['market'] == 41]
#这里教程获取AAPL单一数据,如果需要全部数据可以使用列表循环下载整个数据
#笔者获取的是苹果公司最近300天交易日行情Day版
his_kline = api.get_instrument_bars(TDXParams.KLINE_TYPE_DAILY, 41, "AAPL", 0, 300)
datadf = api.to_df(his_kline)
#保存为csv格式,命名为APPL-demo/按照逗号分隔
datadf.to_csv(r'./APPL-demo.csv',index=False,sep=',')
转载连接
pytdx官方说明文档