最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。 例子1:抽球 举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽...
最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。 例子1:抽球 举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽...
Sentry 简介Apache Sentry是Cloudera公司发布的一个Hadoop开源组件,2016年3月从Incubator毕业,成为Apache顶级项目。Sentr...
Influxdb是由Golang 构建的时序数据库,由于由Go语言构建使得其跨平台部署相对方便。用户只需下载其可执行文件到相应系统执行即可。 核心概念 示例数据(解释某些概念...
1. 简述 时间序列数据:从定义上来说,就是一串按时间维度索引的数据。 时序数据库(TSDB)特点:持续高并发写入、无更新;数据压缩存储;低查询延时。 常见 TSDB:inf...
IOPS IOPS (Input/Output Per Second)即每秒的输入输出量(或读写次数),是衡量磁盘性能的主要指标之一。IOPS是指单位时间内系统能处理的I/O...
Flink源码分析系列文档目录 请点击:Flink 源码分析系列文档目录[https://www.jianshu.com/p/d4a372809e3d] 背景 Unalign...
分布式计算的核心思想在没有包裹业务之前并不复杂,简单而言,如果有一个任务(可以是查询,排序,搜索)可以被拆分为互不影响的若干个重复的小任务,那么我们就可以使用多台计算机并行的...
源头 flink的checkpoint和savepoint用于恢复作业状态,在恢复作业时,如果存在多个checkpoint,将获取最新的checkpoint来进行恢复,没有c...
前面文章介绍了Flink的任务执行流程,每一个operator都会有对应的Task去执行,如果程序中使用了window的话,当程序执行到window的task时就会调用Win...