多维数据分析方法

转载:https://blog.csdn.net/xiangluping/article/details/84806239

多维分析可以对以多维形式组织起来的数据进行上卷、下钻、切片、切块、旋转等各种分析操作,以便剖析数据,使分析者、决策者能从多个角度、多个侧面观察数据库中的数据,从而深入了解包含在数据中的信息和内涵。多维分析方式适合人的思维模式,减少了混淆,并降低了出现错误解释的可能性。

多维数据分析通常包括以下几种分析方法。

1.切片

在给定的数据立方体的一个维上进行的选择操作就是切片(slice),切片的结果是得到一个二维的平面数据。例如,在例2-1中对图2-1所示数据立方体分别使用条件:“委托方式=现场”、“营业部编号=02”、“时间=2011-01”进行选择,就相当于在原来的立方体中切片,结果分别如图2-2所示。


image

2.切块

在给定的数据立方体的两个或多个维上进行的选择操作就是切块(dice),切块的结果是得到一个子立方体,如图2-3所示。


image

例如,对例2-1中的图2-1所示的数据立方体使用条件:

(时间=“3月”or“4月”)and(营业部编号=“02”or“03”)and(委托方式=“现场”)

进行选择,就相当于在原立方体中切出一小块,结果如图2-4所示。


image

3.上卷

维度是具有层次性的,如时间维可能由年、月、日构成,维度的层次实际上反映了数据的综合程度。维度的层次越高,所代表的数据综合度越高,细节越少,数据量越少;维度的层次越低,所代表的数据综合度越低,细节越充分,数据量越大。上卷(roll-up)也称为数据聚合,是在数据立方体中执行聚集操作,通过在维级别中上升或通过消除某个或某些维来观察更概括的数据。表2-2给出了进行数据上卷操作的示例。

表2-2 部分营业部2011年度的交易量(按年合计)
营业部编号 交易量/亿元 营业部编号 交易量/亿元
01 50 03 62
02 38 04 55

4.下钻

下钻(drill-down)也称为数据钻取,实际上是上卷的逆向操作,通过下降维级别或通过引入某个或某些维来更细致地观察数据。

5.旋转

通过数据旋转(pivot or rotate)可以得到不同视角的数据。数据旋转操作相当于基于平面数据将坐标轴旋转。例如,旋转可能包含行和列的交换,或是把某一维旋转到其他维中去,对例2-1中的图2-1进行旋转后的结果如图2-5所示。

image
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 团队涉及到数据分析的项目,有必要和小伙伴做一个简单的入门培训。BI 是一个非常大的领域,涉及到非常多的概念和技术,...
    voxer阅读 1,397评论 0 9
  • 数据分析部分,引用公众号‘秦路’ 的文章--《数据科学家成长指南》。原文链接:https://mp.weixin....
    迷途小球迷阅读 568评论 0 0
  • OLAP概述 OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(维数据)的多种可能的观察形式...
    李小李的路阅读 1,585评论 0 4
  • 一、结构化思维 根据《金字塔原理》,“任何事情都可以归纳出中心论点,由中心论点出发,可由三至七个论据支撑,每个一级...
    还是太菜阅读 1,382评论 2 24
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,594评论 16 22