Avatar notebook default
9篇文章 · 10878字 · 1人关注
  • Resize,w 360,h 240
    Hadoop、Spark、Flink概要

    Hadoop,Spark、Flink是目前重要的三大分布式计算系统 · Hadoop用于离线复杂大数据处理·Spark 用于离线快速的大数据处理...

  • Resize,w 360,h 240
    数据采集——埋点设计

    1 埋点定义 埋点也叫事件追踪(Event Tracking)。是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。在数据分析过...

    5.1 9973 3 76
  • Resize,w 360,h 240
    数仓概要

    一、概要 大数据平台由底层至上可分为:原始数据层、数据仓库、数据应用层。 二、原始数据层——ODS(Operational Data Store...

  • Resize,w 360,h 240
    分析策略

    数据分析流程: 1、明确问题:必须明确数据分析的真实目的,也便于后续分析策略的选取。 2、理解数据:数据收集和探索,如爬虫、API、设备的实测数...

  • Python实现数据分析2

    数据分析流程: 1、明确问题:必须明确数据分析的真实需求 2、理解数据:数据获取和数据探索 3、数据清洗:一个数据分析项目大部分时间花在数据清洗...

  • Resize,w 360,h 240
    Python实现数据分析1

    Python-数据分析常用库 1)Numpy 2) Pandas 3) Matplotlib Numpy 基于数组运算,效率高。拥有许多高级函数...

  • 从底层数据到报表展现

    经常会遇到这样的场景,某业务方:“帮我做个报表,很简单的,很着急今天就要”。一听到这种话,就想打人。实际上最终呈现出来的报表并不是简单的改改画画...

  • 指标体系建设

    定义:用于评估某个业务场景下的效果而搭建的一套衡量标准,同时也便于监测业务健康,快速定位业务运营问题。 以广告投放金融保险类产品为例 搭建指标体...

  • 保险业务

    ·专业术语: 被保险人:受保险合同保障的人 投保人:购买保险并交纳保险费的人 受益人:发生保险事故后领取保险金的人 保险人:保险公司 基本保险金...

文集作者