关于BI的"黑话"

关注小聚,数据分析不迷路

提到BI,你是不是清楚了解呢?

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

但关于这些BI“黑话”你又知多少呢?

因此,小聚通过本文给出一个常用的BI术语表,抛砖引玉,供大家深入了解~

01

OLAP

On-Line Analytical Processing:

联机分析处理,OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。

OLAP是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。

联机分析处理OLAP具有共享多维信息的快速分析的特征(即FASMI)。其中F是快速性(Fast),指系统能在数秒内对用户的多数分析要求做出反应;A是可分析性(Analysis),指用户可以定义新的专门计算,将其作为分析的一部分;M是多维性(Multi—dimensional),指提供对数据分析的多维视图和分析;I是信息性(Information),指能及时获得信息,并且管理大容量信息。

02

数据挖掘(Data Mining)

又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

03

数据仓库(Data Warehouse)

数据仓库(Data Warehouse)和数据集市(Data Mart):包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。

数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

04

数据集市(Data Mart)

数据集市,也叫数据市场,数据集市就是满足特定的部门或者用户的需求,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。

05

ETL

是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

06

NLP

NLP (Nature Language Processing) 是人工智能(AI)的一个子领域。自然语言是人类智慧的结晶,自然语言处理是人工智能中最为困难的问题之一,而对自然语言处理的研究也是充满魅力和挑战的。

07

批量处理

批量处理(Batch processing)。批量数据处理是处理一段时间内收集的大量数据的有效方式

08

分布式文件系统

由于大数据太大而无法在单个系统上进行存储,分布式文件系统提供 种数据存储系统,方便跨多个存储设备进行大量数据的存放,并有助于降低大量数据存储的成本和复杂度。批量处理(Batch processing)。批量数据处理是处理一段时间内收集的大量数据的有效方式。

09

上卷下钻

下钻,是指将特定分组的数据按第二维度继续向下细分显示。

上卷,是下钻的逆过程,即收起细节数据,显示上一层级的汇总数据。

10

颗粒度

颗粒度是指具体的详细和清晰程度;

颗粒度越细,表示细节越详尽,越有助于了解事情的全貌

颗粒度越粗,表示细节越少,更多的是抽象概括。

11

维度(字段)与度量

维度,包含定量值(例如名称、日期或地理数据)。您可以使用维度进行分类、分段以及揭示数据中的详细信息。维度影响视图中的详细级别。

度量,包含可以测量的数字定量值。度量可以聚合。将度量拖到视图中时,Tableau(默认情况下)会向该度量应用一个聚合。

END

数据分析资料学习群持续开放中

    期待你的加入,收获更多实用知识~

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容