一
1、最简单架构
流量binlog系统/mysql数据存储/数据平台调度/mysql数据保存/报表数据查询
2、离线计算与实时计算的拆分
流量binlog系统/mysql实时数据(当日)/HDFS分布式存储(历史数据)/数据平台调度/SPARK离线数据计算/mysql数据保存/报表数据查询
3、实时数据分库分表、读写分离、滑动时间窗口/离线数据全量和增量分离
容错机制重试与恢复/滑动窗口计算引擎
全量计算转增量计算
流量bing系统/mysql实时数据(当日)/实时数据分库分表+读写分离/实时数据时间分片-滑动时间窗口/HDFS分布式存储(历史数据)-全量数据/HDFS分布式存储(增量)/SPARK离线数据计算/mysql计算数据保存/报表数据查询