介绍 背景由于一直苦于尝试追踪spark的列级血缘,所以出于个人目的对spark源代码进行了修改,并且在github上独立了一个项目(Ushas)。传统数据治理中针对spar...
IP属地:贵州
介绍 背景由于一直苦于尝试追踪spark的列级血缘,所以出于个人目的对spark源代码进行了修改,并且在github上独立了一个项目(Ushas)。传统数据治理中针对spar...
[TOC] 什么是Zab协议? Zab协议 的全称是 Zookeeper Atomic Broadcast (Zookeeper原子广播)。 Zookeeper 是通过 Za...
Elasticsearch分布式特性 Elasticsearch 是一个实时的分布式搜索分析引擎,它能让你以一个之前从未有过的速度和规模,去探索你的数据。它被用作全文检索、结...
二叉搜索树 二叉搜索树(Binary Search Tree,简写BST),又称为二叉排序树,属于树的一种,通过二叉树将数据组织起来,树的每个节点都包含了健值 key、数据值...
推荐系统的“前身” 2016年,腾讯以80亿美元估值投资今日头条,结果大家都知道,张一鸣拒绝了腾讯的投资,现在大家也知道,字节跳动估值750亿美元,这一切,推荐系统功不可没。...
思维导图如下: 机器学习解决问题的通用流程 问题建模-特种工程-模型选择-模型融合。 问题建模应包含三方面的内容:评估指标、样本选择、交叉验证。 评估指标 评估指标很多,我们...