预测区间(Prediction Interval):
给定一个概率,确定预测区间
。该区间有
的概率包含真实值
。预测区间可以反映预测值是否可靠,预测区间越大,该预测值越不可信。
-
计算预测区间有两种方式:
- Conformal Prediction
- Quantile RF
-
Conformal Prediction
Assumption: 数据是iid
用于衡量预测是否可信,主要利用NonConformity Measure, 简称
-
为计算
, 构建了两个学习器:
-
. 拟合
之间的关系,用
来表示;
-
. 拟合
之间的关系,用于预测给定测试点
的误差,的用
表示。
-
-
其算法步骤如下:
从数据集
中,构建训练集
, 校准集
(RF中可用oob instance代替)。
用于训练上述提到的
和
用于计算
。对于校准集
中的第
个测试点
(
), 计算其NonConformity Score, 如下:
其中,,
。计算每个值,并按照降序排列,从而得到Set
给定一个significance level
, 利用某公式确定
。
对于新来的测试点
(
), 用
预测得到其
,该测试点的预测区间为:
2018-11-09 会议
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。