数据仓库 ETL 和报告工具
ETL 工具从所有这些异构数据源中提取数据,转换数据(如应用计算、连接字段、键、删除不正确的数据字段等),并将其加载到数据仓库中。
萃取
在 ETL 加载期间需要一个暂存区。需要暂存区的原因有多种。源系统仅在特定时间段内可用以提取数据。此时间段小于总数据加载时间。因此,暂存区允许你从源系统中提取数据,并在时隙结束之前将其保存在暂存区中。
当你想要从多个数据源一起获取数据或想要将两个或多个系统连接在一起时,需要暂存区域。
例如 :你将无法执行连接来自两个物理上不同的数据库的两个表的 SQL 查询。
不同系统的数据提取时间段因时区和运行时间而异。从源系统中提取的数据可用于多个数据仓库系统、操作数据存储等。
ETL 允许你执行复杂的转换,并且需要额外的区域来存储数据。
转换
在数据转换中,你对提取的数据应用一组函数以将其加载到目标系统中。不需要任何转换的数据称为直接移动或传递数据。
你可以对从源系统提取的数据应用不同的转换。例如,你可以执行自定义计算。如果你想要销售收入总和并且这不在数据库中,你可以在转换期间应用 SUM 公式并加载数据。
例如 : 如果一个表的名字和姓氏在不同的列中,可以在加载前使用连接。
Load
在加载阶段,数据被加载到最终目标系统中,它可以是平面文件或数据仓库系统。
BI 报告工具
商业用户使用 BI(商业智能)工具从数据仓库中的事务数据创建基本、中等和复杂的报告,并使用 信息设计工具/UDT .各种 SAP 和非 SAP 数据源可用于创建报告。
市场上有很多 BI 报告、仪表板和数据可视化工具。其中一些如下:
- SAP 业务对象 Web 智能 (WebI)
- 水晶报表
- SAP Lumira
- 仪表板设计器
- IBM Cognos
- 微软商业智能平台
- Tableau 商业智能
- 碧玉软件
- Oracle BI OBIEE
- Pentaho
- QlickView
- SAP BW
- SAS 商业智能
- Necto
- Tibco Spotfire