Flink运行时的组件 Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应用程序时协同工作:作业管理器(JobManager),资源管理器(ResourceM...
Flink运行时的组件 Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应用程序时协同工作:作业管理器(JobManager),资源管理器(ResourceM...
数据集市 数据集市 (Data Market) ,现在市面上的公司和书籍对数据集市有不同的概念。 数据集市是一种微型的数据仓库,它通常有更少的数据,更少的主题...
SKU sku = Stock Keeping Unit (库存量基本单位) 现在已经被引申为产品统一编号的简称,每种产品均对应有唯一的 SKU 号 SPU spu (Sta...
创建LZO文件索引,LZO压缩文件的可切片特性依赖于其索引,故我们需要手动为LZO压缩文件创建索引。若无索引,则LZO文件的切片只有一个
什么是拉链表 拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效开始日期。 如果当前信息至今有效,在生效结束日期中填入一...
concat_ws 函数 concat_ws 函数在连接字符串的时候,只要有一个字符串不是NULL,就不会返回NULL,concat_ws 函数需要指定分隔符。 hive>...
concat 函数 concat 函数在连接字符串的时候,只要其中一个是NULL,那么将返回NULL hive> select concat('a','b'); ab hi...
UDF 函数特点: 一行进一行出。简称,一进一出 自定义UDF函数,根据传入进来的key,获取对应的value值 UDTF 函数特点:多行进多行出 (解析事件字段) 1.自定...
(1)单引号不取变量值 (2)双引号取变量值 (3)反引号`,执行引号中命令 (4)双引号内部嵌套单引号,取出变量值 (5)单引号内部嵌套双引号,不取出变量值
维度表 维度表:一般是对事实的描述信息。每一张维表对应现实世界中的一个对象或者概念。例如:用户,商品,日期,地区等。 维表的特征: 维表的范围很宽(具有多个属...
在 HDFS 上删除文件,可以使用以下命令 hadoop fs -rm -r -skipTrash /path_to_file/file_name 在HDFS 上删除文件夹,...
数据仓库,是为企业所有决策者制定过程,提供所有系统数据支持的战略集合。通过对数据仓库中的数据的分析,可以帮助企业,改进业务流程,控制成本,提高产品质量等。数据仓库,并不是...
表的分类 1 实体表,一般是指一个现实存在的业务对象,比如用户,商品,商家等 2 维度表,一般是指对应一些业务状态,编号的解释表。也可以称为码表。比如地区表,订单状态,支付方...
安装Hive 1.将 apache-hive-1.2.1-bin.tar.gz 解压到指定的目录,修改其名称为hive。修改hive配置文件名称hive-env.sh.tem...
这篇文章足以应对90%的APP应用定制化的需求了. 首先我们创建一个类JDCustomNavigationController继承UINavigationController...
前言 最近项目中的UIWebView被替换为了WKWebView,因此来总结一下。示例Demo:WKWebView的使用本文将从以下几方面介绍WKWebView:1、WKWe...
文章中的内容已全部更新至Swift5! Swift是一门新的语言,不过现在已经出到Swift5了,今天不介绍这些。很多人想学Swift,不知从何开始,今天我就简单说下入门知识...