基于Spark的数据管理平台的设计与实现 http://d.g.wanfangdata.com.cn/Thesis_Y2987666.aspx
本论文的主要研究成果包括:
1.针对企业内部运营部门的实际需求,并结合当前大数据领域的相关技术,设计了基于Spark集群的数据管理平台总体架构,以满足运营部门APP内容分发的需求。
2.设计数据仓库,使用Spark编程模型实现数据仓库ETL自动化操作。
3.设计用户画像系统,给每一个用户都打上详细的属性维度标签和兴趣维度标签,并且使用NoSQL数据库存储标签,构建完整的可扩展的用户画像系统。
4.设计推荐系统的引擎。针对用户的历史数据,设计使用推荐系统的相关算法。