传统算法没有考虑不同时间段内寻找最近邻,赋予每项评分按时间逐步递减的权重,利用加权后的评分寻找最近邻。做实验证明提高了推荐质量。几个最近邻如何算的?求对项目的加权平均值,从而产生推荐。逻辑斯底函数赋予每个评分一个按时间逐步递减的权重,最近的评分数据权重比过去的时间权重要大,可是数据里面好像没有时间这个维度?这个数据去哪找?代码呢?不同用户在不同时间段的评分值来判定最近邻居明显是不符的。加一个逻辑回归的函数?
image.png
将时间进行归一化,像腾讯视频有多少用户,多少电影,多少评分?
用户的相似度度量用什么方法?余弦相似性,pearson相关相似性和修正的余弦相似性。
image.png
公式找个时间打出来
image.png
image.png
k设置为20或30会不会使计算量变大?k为什么要设置为20到30?
数据集包含了943个用户,怎么我的是6000多个?1682我的是3952,100000我的是6040。
数据集包含时间属性?
我的想法是:前面的数据为训练集,后面时间的为测试集
MAE度量标准,如何确定?
公式是平均值还是为差的平方和?
改变k的大小,看看不同的邻居数量对算法结果的影响。
[图片上传中...(image.png-aa1b3f-1607948760105-0)]
这个图怎么得到的?怎么代码也没有?数据连接也没给出?
我的想法,将多个算法进行混合,最后画图总结?四条对比线
此文为基于时间加权的个性化推荐算法研究3页多好少?