Spark - 专题 - 简书

投稿

Spark

收录了1篇文章 · 4人关注

Spark技术内幕++深入解析Spark内核架构设计与实现原理（一）
spark技术背景大多数现有的集群计算系统都是基于非循环的数据流模型。即从稳定的物理存储（如分布式文件系统）中加载记录，记录被传入由一组确定性...

Grey____ 0 0
Spark踩坑之路
当以cluster/client运行spark时候，运行在如下所示，没有任何异常报错。接下来就是找日志，发现卡在hadoop-slave1节点...

Grey____ 0 0

Yarn， Hbase日志
cdh默认安装，日志都在/var/log下，先找这里最方便 yarn 查看某个具体的applicationid的log：yarn logs -a...

Grey____ 0 0
Spark API - RDD
转摘地址： Spark笔记：RDD基本操作（上） RDD本质就是一个数组，因此构造数据时候使用的是List（链表）和Array（数组）类型。 R...

Grey____ 0 0