【Spark简介】 Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPL...
【什么是大数据、大数据技术】 大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法在合理时间内通过传统的应用软件工具进行抓取、收集、管理...
wait、notify、notifyAll t.interrupt(),t.isInterrupted(),Thread.interrupted...
Spark运行模式 Spark 的运行模式多种多样、灵活多变,部署在单机上时,既可以用本地模式运行,也可以用伪分布式模式运行,而当以分布式集群的...
Hive 命令行 输入$HIVE_HOME/bin/hive –H 或者 –help可以显示帮助选项: -d,–define <key=valu...
HBase存储架构图 HBase Master 为Region server分配region 负责Region server的负载均衡 发现失效...
Avro([ævrə])是Hadoop的一个子项目,由Hadoop的创始人Doug Cutting(也是Lucene,Nutch等项目的创始人)...
集群规划 前期准备 静态IP设置$ vi /etc/sysconfig/network-scripts/ifcfg-eth0 账号分配需要使用具...
说明 认证(authentication):验证用户所用的身份是否是对的 授权(authorization):验证用户所用身份操作是否有权限 目...