说说数仓(5)-最重要的维度之日期维度


数仓总结目录:
说说数仓(1) - 什么是数仓
说说数仓(2) - 传统数仓与互联网数仓
说说数仓(3) - 数仓架构
说说数仓(4) - 指标字典
说说数仓(5)-最重要的维度之日期维度
说说数仓(6)-关于命名规范
说说数仓(7)-浅谈数据治理
说说数仓(8)-关于增量
说说数仓(9)-上下游约定
说说数仓(10)-任务注释


日期维度是我们最常用的维度,平台初始,最先初始化的可能就是日期维度,这里我们就简单介绍下日期维度。

什么是日期维度

我们日常生活,数据的产生都和日期有关,每一分、每一秒都会产生数据,数据分析也离不开日期。
日期维度就是一张固化的日历,一年365天,每一天都有,我们打开电脑中的日历:

日历

这里面有的,我们都可以固化下来,像周几、农历、年、月、日、节假日,我们都可以固化下来,方面我们分析的时候使用。

日期维度的结构

日期维度可以尽可能多的包含日期详细信息,这样在分析的时候可以直接使用,还要结合公司的一些特殊情况,像一些特殊展示的日期格式。

  • 基本的年季度月周日信息


    基本信息
  • 拓展信息
    除了上面的基本的日期,平时用的还有有些拓展信息


    拓展信息

可能还有些农历信息、农历年份等,公司自定义周的开始日期、结束日期等,和日期相关的所有内容都可以加进来进行维护。

维度初始化

数据初始化,我们可以使用Java、Python或者SQL,通过常用的日期函数基本可以满足我们的数据需求,用SQL初始化,需要使用有循环控制语句的,如:MySQL、PG都行,Hive的话要结合Shell或者Python来使用。

一般不需要初始化太多年的数据,只要覆盖公司业务数据就好了,还有节假日信息每年都需要结合国务院发布的信息就行维护。

关于小时

平时我们还会分析小时数据,一般不会把他放在日期表中,而是会单独放在一张小时维度表里,需要的时候一起使用就行了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 32,008评论 2 89
  • 我是一朵红莲 你是湛蓝苍穹里的一朵浮云 我生于幽暗的水底 你飘于广阔的天地 我时常谦卑的低下头 在平静的湖面搜寻你...
    墨镜123456阅读 127评论 0 3
  • Handler位于 android.os.Handler中。 首先抛出几个问题 开启了Looper.loop()的...
    黑森林中的小木屋阅读 307评论 0 1
  • “星空的美丽是因为有一朵看不见的花。”——7月7日,20岁第一天 看到一句话“那种‘生活正在往好的方向走’的感觉真...
    DoubleU_阅读 482评论 0 0
  • 左道先生是一位旅者,不只是心灵上的,也是身体上的。滑雪,是左道先生的一大爱好,他经常去世界各地去滑雪。 ...
    青竹青竹青阅读 207评论 0 0