3.房价预测Baseline

制作训练集、评测集

将数据集拆成k份 -> (首先进行shuffle洗牌，防止不均、局限性)
规定k-1份进行训练，剩下1份进行评测，总共训练k次，轮流每个子数据集作为评测集
a. 数据集被分成k份，1……k
b. 第一次训练使用第1份数据集作为评测集，剩下的k-1份作为训练集
c. 第i次训练使用第i次数据集作为评测集，剩下的k-1份作为训练集
d. 做k次训练
k次训练之后，评测的分值=k次评测的平均（k折）
不同的模型会提供不同的子模型的合并方法，会将所有的k个子模型进行合并

SVM 是否容忍控制NAV？

基于数值计算/数值回归→ 一定要将所有内容数字化→ 不支持

DecisionTree 是否容忍控制NAV？

决策树的学习，实际是对控件的划分。
把空值当成空间的一部分，不要求连续
→ CART，ID3，C4.5
水果忍者，黎、水果，切成丁
超市找东西，容易找到相应的商品的位置

DNN 是否容忍控制NAV？

不容忍，基于数值计算

最后编辑于：2019.08.27 17:54:41

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。