本文转自:http://blog.csdn.net/mengzhongsuiyi521/article/details/50778264
做自然语言处理相关科研的过程中,训练集,开发集和测试集是非常常见的基础性概念,对它们有清楚的理解是做科研的基础,本文给出三者的概念以及它们之间的关系。
训练集:用于训练模型的数据的集合。
开发集:是在使用训练集训练出模型后,对训练出的模型的参数进行调整的数据集合。
测试集:用于测试最终生成的模型的数据集合。
三者的关系:
训练集+测试集=所有的数据集合
训练集∩测试集= ∅
开发集⊊训练集