使用 DAX 概念进行数据建模


商业智能 (BI) 在多个领域和组织中变得越来越重要。基于历史数据的决策和预测在竞争日益激烈的世界中变得至关重要。对于任何类型的数据分析,都有大量来自不同来源的内部和外部数据可用。

然而,挑战在于根据当前要求从可用的大数据中提取相关数据,并以一种友好的方式存储它,以便从数据中投射出不同的见解。通过使用关键业务术语获得的数据模型是一种有价值的沟通工具。数据模型还需要提供一种根据需要快速生成报告的方法。

BI 系统的数据建模使你能够应对许多数据挑战。

BI 数据模型的学习前提


BI 的数据模型应该满足正在进行数据分析的业务的要求。以下是任何数据模型必须满足的最低要求:

数据模型需要是业务特定的

适用于一个业务线的数据模型可能不适合不同的业务线。因此,必须根据具体业务、使用的业务术语、数据类型及其关系来开发数据模型。它应该基于组织中做出的目标和决策类型。

数据模型需要内置智能

数据模型应该包括通过元数据、层次结构和继承来促进高效和有效的商业智能过程的内置智能。有了这个,你将能够为不同的用户提供一个通用平台,从而消除该过程的重复。

数据模型需要是健壮的

数据模型应该精确地呈现特定于业务的数据。它应该启用有效的磁盘和内存存储,以便于快速处理和报告。

数据模型需要是可扩展的

数据模型应该能够以快速有效的方式适应不断变化的业务场景。可能必须包含新数据或新数据类型。可能必须有效地处理数据刷新。

BI 数据建模


BI的数据建模包括以下步骤:

  • 塑造数据
  • 加载数据
  • 定义表之间的关系
  • 定义数据类型
  • 创造新的数据洞察力

塑造数据

构建数据模型所需的数据可以来自各种来源,并且可以采用不同的格式。你需要确定特定数据分析需要来自这些数据源的哪一部分数据。这称为塑造数据。

例如,如果你要检索组织中所有员工的数据,则需要确定每个员工的哪些详细信息与当前上下文相关。也就是说,需要确定需要导入employee表的哪些列。这是因为,数据模型中表中的列数越少,对表的计算就越快。

加载数据

你需要加载已识别的数据 - 每个表中包含所选列的数据表。

定义表之间的关系

接下来,你需要定义各种表之间的逻辑关系,以方便组合来自这些表的数据,即如果你有一个表 - Products - 包含有关产品的数据,还有一个表 - Sales - 与产品的各种销售交易,通过定义两个表之间的关系,你可以总结销售、产品方面的信息。

定义数据类型

为数据模型中的数据识别适当的数据类型对于计算的准确性至关重要。对于你已导入的每个表中的每一列,你需要定义数据类型。例如文本数据类型、实数数据类型、整数数据类型等。

创建新的数据洞察

这是 BI 日期建模的关键步骤。构建的数据模型可能必须与需要了解数据趋势并在很短的时间内做出所需决策的几个人共享。因此,从源数据中创建新的数据洞察力将是有效的,避免了对分析的返工。

新的数据洞察可以采用元数据的形式,特定业务人员可以轻松理解和使用。

数据分析


一旦数据模型准备好,就可以根据需要对数据进行分析。呈现分析结果也是一个重要步骤,因为将根据报告做出决策。