1收集数据
收集日期date开盘价open最高价high最低价low和收盘价close
技术指标:MACD、RSI、布林带、ATR、均线
2数据加工
变量选择确认标签和数据清洗
将不同频率数据统一到同一时间戳
数据对齐
指定用哪些特征来输入
给这个样本点打上类别标签,预测数据第二天的涨跌情况
3训练模型
特征编码标准化
将完整数据分为两部分一部分训练特征,一部分测试与真实数据对比,算出精度
4调整
反复调整参数,精度达到要求特征筛选
通过随机森林/xgboost输出特征
防止过拟合避免未来信息泄漏,验证特征在训练集与测试集的分布一致性
检查特征是否包含未来数据
5策略编写
根据模型编写策略,设计逻辑买卖条件验证策略效果
买入预测值为1的股上涨,买入预测涨的概率最高的股,根据预测集标签对时实数据处理01涨跌
编写策略时调用特征函数训练数据,再将特征数据给到模型,预测出结果。