Teradata 性能调优
本章讨论 Teradata 中的性能调整过程。
Explain
性能调优的第一步是在查询中使用 EXPLAIN。 EXPLAIN 计划提供了优化器将如何执行你的查询的详细信息。在解释计划中,检查诸如置信度、使用的连接策略、假脱机文件大小、重新分配等关键字。
收集统计数据
Optimizer 使用数据人口统计数据来制定有效的执行策略。 COLLECT STATISTICS 命令用于收集表的人口统计数据。确保在列上收集的统计信息是最新的。
-
收集 WHERE 子句中使用的列和连接条件中使用的列的统计信息。
-
收集有关唯一主索引列的统计信息。
-
收集非唯一二级索引列的统计信息。优化器将决定它是否可以使用 NUSI 或全表扫描。
-
尽管收集了基表的统计信息,但收集了 Join Index 的统计信息。
-
收集分区列的统计信息。
数据类型
确保使用正确的数据类型。这将避免使用过多的存储空间。
转换
确保连接条件中使用的列的数据类型兼容,以避免显式数据转换。
Sort
除非需要,否则删除不必要的 ORDER BY 子句。
线轴空间问题
如果查询超出该用户的每个 AMP 假脱机空间限制,则会生成假脱机空间错误。验证说明计划并确定消耗更多假脱机空间的步骤。这些中间查询可以拆分并单独放置以构建临时表。
一级索引
确保为表正确定义了主索引。主索引列应均匀分布数据,并应经常用于访问数据。
设置表
如果你定义了一个 SET 表,那么优化器将检查插入的每条记录是否重复。要删除重复检查条件,你可以为表定义唯一二级索引。
更新大表
更新大表会很耗时。你可以删除记录并插入带有修改行的记录,而不是更新表。
删除临时表
如果不再需要临时表(临时表)和 volatile,则删除它们。这将释放永久空间和线轴空间。
多组表
如果你确定输入记录不会有重复记录,那么你可以将目标表定义为 MULTISET 表,以避免 SET 表使用的重复行检查。