在计算机科学中,树是一种很重要的数据结构,比如我们最为熟悉的二叉查找树(Binary Search Tree),红黑树(Red-Black Tr...
转行写spark程序快一年时间了,我最深刻的体会是实现功能容易,但如何提高程序的执行效率却是个难题。我们用的spark主要是spark sql框...
人工智能(AI)是近两年来最热门的词之一了,自16年Google DeepMind的AlphaGo打败了世界围棋大师李世石后,人们在惊叹之余,也...
1. spark steaming概述 在《spark 基础(上篇)》中,spark streaming是spark体系中的一个流式处理框架。因...
AlphaGo在人机大战中战胜李世乭让深度学习这个名词在大众口中广为传播,深度学习的强大,也让其增加了一层神秘色彩,似乎这是名校博士才能理解的算...
在前面的文章《spark基础(上篇)》和《spark基础(下篇)》里面已经介绍了spark的一些基础知识,知道了spark sql是spark中...
1. spark三种分布式部署模式 Spark支持的主要的三种分布式部署方式分别是standalone、spark on mesos和 spar...
前两篇我们讲了spark的基础知识,包括spark的体系结构、执行框架、spark的基本数据类型以及spark中stage的划分等等。本篇要介绍...
1. 机器学习基本概念 1.1 什么是机器学习 机器学习(Machine Learning)是一种基本数据的学习,是人工智能(AI, artif...