HCatalog 显示分区
分区是用于创建单独的表或视图的表格数据的条件。 SHOW PARTITIONS 列出给定基表的所有现有分区。分区按字母顺序列出。在 Hive 0.6 之后,还可以指定分区规范的一部分来过滤结果列表。
你可以使用 SHOW PARTITIONS 命令查看特定表中存在的分区。本章介绍如何列出 HCatalog 中特定表的分区。
显示分区声明
语法如下:
SHOW PARTITIONS table_name;
以下查询删除了一个名为 employee :
./hcat –e "Show partitions employee;"
成功执行查询后,你会看到以下响应:
OK Designation = IT Time taken: 5.3 seconds
动态分区
HCatalog 将表组织成分区。它是一种根据日期、城市和部门等分区列的值将表划分为相关部分的方法。使用分区,很容易查询一部分数据。
例如,一个名为 Tab1 包含员工数据,例如 id、name、dept 和 yoj(即加入年份)。假设你需要检索 2012 年加入的所有员工的详细信息。查询会在整个表中搜索所需信息。但是,如果你按年份对员工数据进行分区并将其存储在单独的文件中,则会减少查询处理时间。以下示例展示了如何对文件及其数据进行分区:
以下文件包含 员工数据 table.
/tab1/employeedata/file1
id, name, dept, yoj 1, gopal, TP, 2012 2, kiran, HR, 2012 3, kaleel, SC, 2013 4, Prasanth, SC, 2013
上述数据使用 year 划分为两个文件。
/tab1/employeedata/2012/file2
1, gopal, TP, 2012 2, kiran, HR, 2012
/tab1/employeedata/2013/file3
3, kaleel, SC, 2013 4, Prasanth, SC, 2013
添加分区
我们可以通过更改表来将分区添加到表中。让我们假设我们有一个名为 employee 包含 Id、Name、Salary、Designation、Dept 和 yoj 等字段。
语法
ALTER TABLE table_name ADD [IF NOT EXISTS] PARTITION partition_spec [LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...; partition_spec: : (p_column = p_col_value, p_column = p_col_value, ...)
以下查询用于将分区添加到 employee table.
./hcat –e "ALTER TABLE employee ADD PARTITION (year = '2013') location '/2012/part2012';"
重命名分区
你可以使用 RENAME-TO 命令重命名分区。其语法如下:
./hact –e "ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;"
以下查询用于重命名分区:
./hcat –e "ALTER TABLE employee PARTITION (year=’1203’) RENAME TO PARTITION (Yoj='1203');"
删除分区
用于删除分区的命令语法如下:
./hcat –e "ALTER TABLE table_name DROP [IF EXISTS] PARTITION partition_spec,. PARTITION partition_spec,...;"
以下查询用于删除分区:
./hcat –e "ALTER TABLE employee DROP [IF EXISTS] PARTITION (year=’1203’);"