Kudu 是一个基于 Raft 的分布式存储系统,它致力于融合低延迟写入和高性能分析这两种场景,并且能很好的嵌入到 Hadoop 生态系统里面,...
Kudu 是一个基于 Raft 的分布式存储系统,它致力于融合低延迟写入和高性能分析这两种场景,并且能很好的嵌入到 Hadoop 生态系统里面,...
Spark 2.x项目实战视频教程(实时统计、离线分析和实时ETL) 课程学习地址:http://www.xuetuwuyou.com/cour...
Spark2.x机器学习视频教程 课程学习址:http://www.xuetuwuyou.com/course/311 课程出自学途无忧网:ht...
Spark2.x 机器学习视频教程 讲师:轩宇老师 课程观看地址:http://www.xuetuwuyou.com/course/311 课程...
这是最近读到的讲关于 JDBC 的超时问题最透彻的文章,原文是http://www.cubrid.org/blog/understanding-...
前言 因为最近在研究spark-deep-learning项目,所以重点补习了下之前PySpark相关的知识,跟着源码走了一遍。希望能够对本文的...
Spark MLlib机器学习开发指南(3)--Pipelines 翻译自官方文档如有问题,欢迎留言指正,转载请注明出处 在这个章节,我们介绍管...
macOS Sierra 10.12.4 Spark 1.6.2 Python 2.7 转载请注明出处:http://blog.csdn.net...
欢迎关注我的微信公众号:FunnyBigData 在《Spark 内存管理的前世今生(上)》中,我们介绍了 UnifiedMemoryManag...
欢迎关注我的微信公众号:FunnyBigData 作为打着 “内存计算” 旗号出道的 Spark,内存管理是其非常重要的模块。作为使用者,搞清楚...
专题公告
走向大数据分析,我的学习之路