最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。 例子1:抽球 举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽...
最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。 例子1:抽球 举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽...
Sentry 简介Apache Sentry是Cloudera公司发布的一个Hadoop开源组件,2016年3月从Incubator毕业,成为Apache顶级项目。Sentr...
Influxdb是由Golang 构建的时序数据库,由于由Go语言构建使得其跨平台部署相对方便。用户只需下载其可执行文件到相应系统执行即可。 核心概念 示例数据(解释某些概念...
1. 简述 时间序列数据:从定义上来说,就是一串按时间维度索引的数据。 时序数据库(TSDB)特点:持续高并发写入、无更新;数据压缩存储;低查询延时。 常见 TSDB:inf...
IOPS IOPS (Input/Output Per Second)即每秒的输入输出量(或读写次数),是衡量磁盘性能的主要指标之一。IOPS是指单位时间内系统能处理的I/O...
Flink源码分析系列文档目录 请点击:Flink 源码分析系列文档目录[https://www.jianshu.com/p/d4a372809e3d] 背景 Unalign...
分布式计算的核心思想在没有包裹业务之前并不复杂,简单而言,如果有一个任务(可以是查询,排序,搜索)可以被拆分为互不影响的若干个重复的小任务,那么我们就可以使用多台计算机并行的...
源头 flink的checkpoint和savepoint用于恢复作业状态,在恢复作业时,如果存在多个checkpoint,将获取最新的checkpoint来进行恢复,没有c...
前面文章介绍了Flink的任务执行流程,每一个operator都会有对应的Task去执行,如果程序中使用了window的话,当程序执行到window的task时就会调用Win...
Calcite主要是做SQL解析、校验、优化等工作,比如Flink、Hive底层都是使用的calcite。本文内容是基于Flink 1.12来讲解。 首先从整体上对Calci...
CMS日志及对应阶段 CMS 收集器是老年代经常使用的收集器,它采用的是标记-清楚算法,应用程序在发生一次 Full GC 时,典型的 GC 日志信息如下: 阶段1:Init...
Java 的类实例一般在 JVM 堆上分配,而 Java 是通过 JNI 调用 C 代码来实现 Socket 通信的,那么 C 代码在运行过程中需要的内存又是从哪里分配的呢?...
JDK1.4中新加入了NIO,引入了一种基于通道(Channel)和缓存区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存(native堆),然后通...