Q:信息需求和查询词的关系?
A:查询词是用户自身用来描述自己信息需求的词。
比如,我想知道中国新说唱的冠军是谁。那么我的查询词可以设置为中国新说唱冠军。这个查询就是我自己概括的能反映我信息需求的词。
Q:常用的Test Collection到底指的是啥?
A:常规的方法评估信息检索系统就需要一个测试集。这个测试集包括以下三部分
1.一个文档集
2.一组用于测试的信息需求集合,信息需求可以表示成查询。(就我个人而言,用到的信息需求集合,好像都是以主题的形式展示,50个,具体的构成可以参加国外的比赛,有数据集分享)
3.一组相关性判定结果,对每一个查询-文档对而言,通常会赋值0或1,代表相关不相关。