1.基于NGINX和thrif rpc的日志采集 1.1 软件包准备 前提环境:Hadoop+Flume+Hbase+zookeeper安装环境...
1.基于NGINX和thrif rpc的日志采集 1.1 软件包准备 前提环境:Hadoop+Flume+Hbase+zookeeper安装环境...
1.典型的信息流架构 信息流是推荐系统应用中的当红炸子鸡,它表现形式有很多:社交网络的动态信息流、新闻阅读的图文信息流、短视频信息流等等。 整体...
1.LFM推荐 思路和ALS算法类似,区别在于,ALS利用坐标下降法,LFM利用梯度下降法假设: 评分矩阵𝑅𝑚,𝑛,m个用户对n个物品评分:用户...
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代。在这个时代,无论是信息消费...
1.Spark MLlib概述 1.是什么:spark MLLib 是基于Spark 引擎实现的机器学习算法库,spark开发应用都是基于RDD...
1.Mahout介绍 1.1概述 根据百度的解说,Mahout 是 Apache Software Foundation(ASF) 旗下的一个开...
1.Spark ML重要概念 1.Spark ML基于什么来处理的? Spark-Core的核心开发是基于RDD,但是RDD并不是非常的灵活,如...
1.用户画像概述 1.1什么是用户画像 用户画像是对现实世界中用户的数学建模 1.2用户画像特点 1.源于现实,高于现实用户画像是描述用户的数据...
1.Lambda介绍: 提出者:Twitter工程师Nathan Marz提出,同时是Storm项目发起人Lambda作用:Lambda系统架构...
1.思想简介: 协同过滤,从字面上理解,包括协同和过滤两个操作。所谓协同就是利用群体的行为来做决策(推荐)。对于推荐系统来说,通过用户的持续协同...
专题公告
推荐系统的概述、用户画像、模型训练、模型调优、协同过滤、Mahout推荐、MLlib推荐算法、WEB日志采集、sqoop数据收集、离线实时推荐实现