数据集划分

看了几个大佬的数据集划分总觉得有些可能是后期进行过修改的,于是决定先用最简单的数据集划分方式,如下图:


滑窗法以增加样本

(修改:所有特征区间改为feature窗口,预测区间改为label窗口。feature区间-2取02/01-05/31,label窗口-2取06/01-06/30)


负样本数量:977900

正样本数量:75382

由这两个数字得知正负样本不均衡,

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容