240 发简信
IP属地:加州
  • 什么是数据管理,数据治理,数据中心,数据中台,数据湖?

    大家好,我是独孤风,大数据流动的作者。 最近几个概念频繁出现在大家的视野内。 什么是数据管理,数据治理,数据中心,数据中台,数据湖? 他们之间又...

  • 34岁上岸,我终于圆了自己的考研梦

    [图片上传失败...(image-302b48-1688374117497)] 海阔天空 在勇敢以后 要拿执着 将命运的锁打破 冷漠的人 谢谢你...

  • 数据湖搭建指南——几个核心问题

    1、什么是数据湖? 数据湖是一种技术系统,可以大批量并且廉价的分析结构化和非结构化数据资产。 其实很简单,数据湖的最大魅力在于可以分析一切类型的...

  • Apache Superset 1.2.0教程 (二)——快速入门(可视化王者英雄数据)

    上一篇我们已经成功的安装了superset,那么该如何可视化我们的数据呢?本文将可视化王者英雄的数据,快速的入门Superset。 一、连接数据...

  • Apache Superset 1.2.0教程 (一)—— 安装(Windows版)

    Apache Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dash...

  • Resize,w 360,h 240
    大数据理论篇HDFS的基石——Google File System

    Google File System 但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS)...

  • 揭秘阿里巴巴的客群画像

    阿里巴巴一直在面向未来探索B类新电商模式,并从2019年开始重点构建“新供给、新链接、新营销”三新体系。买家是三新体系的核心,缺少买家维度的数字...

  • Kafka2.6.0发布——性能大幅提升

    近日Kafka2.6版本发布,距离2.5.0发布只过去了不到四个月的时间。 Kafka 2.6.0包含许多重要的新功能。以下是一些重要更改的摘要...

  • Resize,w 360,h 240
    Spark Streaming——Spark第一代实时计算引擎

    虽然SparkStreaming已经停止更新,Spark的重点也放到了 Structured Streaming ,但由于Spark版本过低或者...

个人介绍
公号 大数据流动
专注于实时计算,数据治理,数据可视化相关技术与应用。