利用matplotlib.finance绘制K线图时使用关键要点
绘制k线图的核心语句是:
import matplotlib.finance as mpf
mpf.candlestick_ochl( ax, matrix_data, colorup=***, colordown=***)
这其中 ax 是 matploblib 的 axis,matrix_data 是股价数据。
matrix_data 是 np.matrix 对象,对于 candlestick_ochl 方法来讲,它需要按照约定的顺序来排列数据,即 matrix_data 每一行中前五个数据必须是:时间、开盘价、收盘价、最高价、最低价。
在这里,“时间”不是 datetime 对象,也不是 string,它必须使用 matplotlib.pylab 中的 date2num(datetime) 方法来将datetime对象转换一个特定的时间戳数字。
通常我们会用 pandas.DataFrame 来储存股价数据——比如,利用 pd.read_csv() 读取 csv 文件后,得到就是一个 DataFrame 对象。假定 DataFrame 中包含有 date, open, close, high, low, volume 六列数据,在将其转化为 candlestick_ochl() 中所需的 matrix_data,要做如下几步工作:
- 删除空行
- 按时间升序排列数据
- 将date转化为特定的时间戳数据
- 按照 date,open,close,high,low,volume 的顺序重新排列 DataFrame
- 将 DataFrame 转为 matrix
删除空行
假定 pd.read_csv() 读入的数据为 data
data[data['volume']==0]=np.nan
data=data.dropna()
按时间升序排列数据
data.sort_values(by='date',ascending=True,inplace=True)
将date转化为特定的时间戳数据
from matplotlib.pylab import date2num
data.date=data.date.apply(lambda x:date2num(x))
按照 date,open,close,high,low,volume 的顺序重新排列 DataFrame
data=data[['date','open','close','high','low','volume']]
将 DataFrame 转为 matrix
data_mat=data.as_matrix()
合成代码案例
绘制k线
import matplotlib.pyplot as plt
import matplotlib.finance as mpf
import numpy as np
import pandas as pd
from matplotlib.pylab import date2num
data=pd.read_csv(u'兴业银行.csv',usecols=['date','open','close','high','low','volume'])
data[data['volume']==0]=np.nan
data=data.dropna()
data.sort_values(by='date',ascending=True,inplace=True)
data=data[['date','open','close','high','low','volume']]
# data=data.head(60)
data.date=pd.to_datetime(data.date)
data.date=data.date.apply(lambda x:date2num(x))
data_mat=data.as_matrix()
fig,ax=plt.subplots(figsize=(1200/72,480/72))
fig.subplots_adjust(bottom=0.1)
mpf.candlestick_ochl(ax,data_mat,colordown='#53c156', colorup='#ff1717',width=0.3,alpha=1)
ax.grid(True)
ax.xaxis_date()
plt.show()
并置成交量图
fig,(ax1,ax2)=plt.subplots(2,sharex=True,figsize=(1200/72,480/72))
mpf.candlestick_ochl(ax1,data_mat,colordown='#53c156', colorup='#ff1717',width=0.3,alpha=1)
ax1.grid(True)
ax1.xaxis_date()
plt.bar(data_mat[:,0],data_mat[:,5],width=0.5)
ax2.set_ylabel('Volume')
ax2.grid(True)
plt.show()