sakersun - 简书

发简信

sakersun

0
关注
2
粉丝
11
文章
23772

字数
12

收获喜欢
2

总资产

IP属地：浙江

香沙小熊

elasticsearch 为什么比mysql快
为什么 Elasticsearch/Lucene 检索可以比 mysql 快 Mysql 只有 term dictionary 这一层，是以 b-tree 排序的方式存储在磁...

6945 0 20
sakersun

Hadoop文档（2.9.2） - HDFS架构
介绍 Hadoop分布式文件系统（HDFS）是一种运行在通用硬件上的分布式文件系统。它与传统的分布式文件系统有很多相似之处，但是也有显著的不同。HDFS是高容错的，可以部署在...

1088 0 1
sakersun

Spark文档 - 快速入门
本文简要介绍一下Spark。首先通过交互式shell介绍Spark API，然后是如何使用Scala编写应用程序。要注意的是，Spark 2.0之前，Spark的主要编程接...

484 0 1
sakersun

Spark文档 - 集群模型预览
组件 Spark应用程序运行在集群上的独立进程中，由驱动程序中的SparkContext对象调度。 SparkContext可以连接到几种集群管理器（例如Standalone...

241 0 1
sakersun

Hadoop文档（2.9.2） - YARN架构
YARN最基本的想法就是将资源管理的功能和作业调度/监控的功能分隔在不同的进程中。即使用一个全局的资源管理器（RM）和每个应用一个的应用节点（AM）。应用要么是一个单独的作业...

270 0 1
sakersun

Hadoop文档（2.9.2） - MapReduce指南
预览 Hadoop MapReduce是一个软件框架，用于编写并行处理海量数据的应用程序，应用程序运行在一个通用硬件组成的，可靠的，容错的大型集群之上。 MapReduce作...

1777 0 1
sakersun

Spark文档 - 作业调度
概述 Spark提供了几个可以在计算过程之间调度资源的工具。首先，每个Spark应用程序（SparkContext实例）都运行在独立的executor进程中，而集群管理器可以...

667 0 1
sakersun

Flink文档 - 数据流编程模型
抽象层级 Flink提供了几个不同的抽象层级来开发流处理/批处理应用程序。最底层抽象简单的提供了状态流处理。该功能主要封装在DataStream API中的Process函...

624 0 1
sakersun

Windows下搭建Spark开发测试环境
Windows下使用IDEA开发Spark应用程序配置说明（使用sbt构建）。软件环境 Hadoop 2.7.7 Spark 2.4.0 Scala 2.11 Java 8...

1339 0 1