学习元平台推荐策略1.0:
1、基于热度的推荐:哪些内容看的人多,就推荐哪些内容
学习元(feed流)热度算法:学习元热度分 = 初始热度分 + 用户交互产生的热度分 – 随时间衰减的热度分
a) 学习元热度分:
a1. 不同主题、具备不同资源、不同学科的内容初始热度分不应该相同,可以对每个不同学科进行一定的赋值,根据内容类型、活动的丰富度进行一定的赋值
a2. 教学过程中,应该考虑重点知识、难点知识的影响,核心知识点与普通知识点之间应该做一定的区分,可以根据教学大纲对知识点的初始热度进行定义
b) 用户交互产生的热度分:
b1. 定义用户操作:阅读、加入学习、资源下载、参与活动、评论、推荐、分享、协作、评分等
b2. 对每一种用户操作赋予一定的能量值
b3. 热度分会随活跃/在线用户数进行一定过滤
c) 随时间衰减的热度分
在资讯类内容的热度排序过程中,由于时效性影响较大,所以会较快的随时间流逝而衰减。时间对学习元这种学习资源影响程度没有那么大,但是也应该对学习元有一定的更新,确保教育资源的活跃性
d) 其他与教育挂钩的热度
结合教学特性,考虑其他能够正向促进教、学过程的相关特性,如:学习者得分高的学习元会更容易给学生信心,产生积极影响,可以考虑在学习者刚登陆平台开始学习时考虑(类似于新手教程)。
2、基于内容的相关推荐:根据用户看过的内容进行推荐
a) 确定关键词
推荐的基本流程为:分词 - 关键词指标 - TF-IDF模型【学习元内关键词频率(Team Frequency)高,所有文档内关键词频率低(Inverse Document Frequency)】
这个是基于内容过滤的基本流程,前期可以采用开源的词典,同时结合教育大纲与教学常用词语,构建关键词语料库
b) 计算学习材料的关键词指标
b1 计算学习内容相关性的算法
b2 每一条学习元的模型可以用其中包含的关键词的 TF-IDF得分
c) 相关性推荐环节:
可以通过不同新闻中重合关键词 tf-idf 模型的余弦相似度,计算出两篇新闻的相似性。
3、基于用户协同过滤
通过标签给用户分类,为用户提供所在人群会看的内容(对用户规模有一定的要求)
用户标签也应该是自动从用户阅读、加入学习、参与活动等的操作对象,对用户进行关键词标签的标注。
注: 如果引入教学目标、知识点类型等多层级的教育属性概念,需要制定相应的策略,完成对各概念的定义。