
Hadoop,Spark、Flink是目前重要的三大分布式计算系统 · Hadoop用于离线复杂大数据处理·Spark 用于离线快速的大数据处理...
1 埋点定义 埋点也叫事件追踪(Event Tracking)。是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。在数据分析过...
一、概要 大数据平台由底层至上可分为:原始数据层、数据仓库、数据应用层。 二、原始数据层——ODS(Operational Data Store...
数据分析流程: 1、明确问题:必须明确数据分析的真实目的,也便于后续分析策略的选取。 2、理解数据:数据收集和探索,如爬虫、API、设备的实测数...
数据分析流程: 1、明确问题:必须明确数据分析的真实需求 2、理解数据:数据获取和数据探索 3、数据清洗:一个数据分析项目大部分时间花在数据清洗...
Python-数据分析常用库 1)Numpy 2) Pandas 3) Matplotlib Numpy 基于数组运算,效率高。拥有许多高级函数...
经常会遇到这样的场景,某业务方:“帮我做个报表,很简单的,很着急今天就要”。一听到这种话,就想打人。实际上最终呈现出来的报表并不是简单的改改画画...
定义:用于评估某个业务场景下的效果而搭建的一套衡量标准,同时也便于监测业务健康,快速定位业务运营问题。 以广告投放金融保险类产品为例 搭建指标体...
·专业术语: 被保险人:受保险合同保障的人 投保人:购买保险并交纳保险费的人 受益人:发生保险事故后领取保险金的人 保险人:保险公司 基本保险金...
文集作者