零基础入门推荐系统 Task01:赛题理解+Baseline(3天)

学习文档:https://github.com/datawhalechina/team-learning-rs/blob/master/RecommandNews/%E8%B5%9B%E9%A2%98%E7%90%86%E8%A7%A3%2BBaseline.ipynb

跟着跑了一下baseline,记录一下遇到的不熟的函数和问题:

  • drop_duplicates :去除重复数据
drop_duplicates((['user_id', 'click_article_id', 'click_timestamp']))
  • reset_index():重置索引
DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

有关itemCF部分补充这里的文档进行学习:https://github.com/datawhalechina/team-learning-rs/blob/master/RecommendationSystemFundamentals/02%20%E5%8D%8F%E5%90%8C%E8%BF%87%E6%BB%A4.md

需要后续再查的问题:逆用户频率(IUF, Inverse User Frequence)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容