Hive简介 Hive是简历在Hadoop HDFS上的数据仓库基础架构 Hive可以用来进行数据提取转化加载(ETL),通过sqoop加载数据 Hive定义了简单的sql查...

Hive简介 Hive是简历在Hadoop HDFS上的数据仓库基础架构 Hive可以用来进行数据提取转化加载(ETL),通过sqoop加载数据 Hive定义了简单的sql查...
Redis特性 速度快内存、c语言、单线程 持久化所有数据保持在内存中,对数据的更新将异步保存到磁盘上 多种数据结构 支持多种客户端语言 功能丰富发布订阅、事务、Lua脚本、...
YARN官网介绍地址:http://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/YARN.html ...
项目简介 统计主站最受欢迎的课程Top N 访问次数 按地市统计主站最受欢迎的Top N 课程 按流量统计主站最受欢迎的Top N 课程 环境安装 CDH相关软件下载地址 S...
项目简介 今天到现在为止实战课程的访问量 今天到现在为止从搜索引擎引流过来的实战课程的访问量 项目流程 需求分析 ==> 数据产生 ==> 数据采集 ==> 数据清洗 ==...
字符串处理 计算字符串长度方法1:${#变量}方法2:expr length "$变量" (如果内容有空格,则必须加上" ") 获取字符索引的位置expr index "$...
Resilient(弹性) Distributed Datasets (RDDs) Spark revolves(围绕) around the concept of a re...
scala下载和安装 命令行使用 JAVA8环境 scala下载 unzip scala 配置环境变量 启动 ./scala 基本数据类型 和java类型一致 var 和 v...
MapReduce官网介绍地址http://hadoop.apache.org/docs/stable/hadoop-mapreduce-client/hadoop-mapr...
核心概念 Split:MapReduce作业处理的数据块,是MapReduce中最小的计算单元。和HDFS中的block默认是一一对应的,也可以手动设置他们之间的比值关系(不...
操作步骤 IDEA + MAVEN 创建JAVA工程本地安装maven,IDEA配置maven并创建相应的maven项目 添加HDFS相关依赖 开发Java api 操作HD...
「简书」作为一款「写作软件」在诞生之初就支持了 Markdown,Markdown 是一种「电子邮件」风格的「标记语言」,我们强烈推荐所有写作者学习和掌握该语言。为什么?可以...
HDFS官网介绍地址:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDe...
hadoop官网地址:http://hadoop.apache.org/ 官网对于Hadoop的介绍 What Is Apache Hadoop?The Apache™ Ha...