Hive教程

Hive 分区

Hive 将表组织成分区。它是一种根据日期、城市和部门等分区列的值将表划分为相关部分的方法。使用partition，可以方便的查询一部分数据。

表或分区被细分为桶，为数据提供额外的结构，可用于更有效的查询。分桶基于表中某列的哈希函数值进行工作。

例如，名为 Tab1 的表包含员工数据，例如 id、name、dept 和 yoj（即加入年份）。假设您需要检索 2012 年加入的所有员工的详细信息。查询在整个表中搜索所需信息。但是，如果您将员工数据按年份分区并将其存储在单独的文件中，则会减少查询处理时间。以下示例显示了如何对文件及其数据进行分区：

以下文件包含员工数据表。

/tab1/employeedata/file1

id, name, dept, yoj
1, gopal, TP, 2012
2, kiran, HR, 2012
3, kaleel,SC, 2013
4, Prasanth, SC, 2013

以上数据使用年份划分为两个文件。

/tab1/employeedata/2012/file2

1, gopal, TP, 2012
2, kiran, HR, 2012

/tab1/employeedata/2013/file3

3, kaleel,SC, 2013
4, Prasanth, SC, 2013

添加分区

我们可以通过改变表来向表添加分区。假设我们有一个名为 employee 的表，其中包含 Id、Name、Salary、Designation、Dept 和 yoj 等字段。

语法：

ALTER TABLE table_name ADD [if NOT EXISTS] PARTITION partition_spec
[LOCATION 'location1'] partition_spec [LOCATION 'location2'] ...;
partition_spec:
: (p_column = p_col_value, p_column = p_col_value, ...)

以下查询用于向员工表添加分区。

hive> ALTER TABLE employee
> ADD PARTITION (year=’2012’)
> location '/2012/part2012';

重命名分区

该命令的语法如下。

ALTER TABLE table_name PARTITION partition_spec RENAME TO PARTITION partition_spec;

以下查询用于重命名分区：

hive> ALTER TABLE employee PARTITION (year=’1203’)
   > RENAME TO PARTITION (Yoj=’1203’);

删除分区

以下语法用于删除分区：

ALTER TABLE table_name DROP [if EXISTS] PARTITION partition_spec, PARTITION partition_spec,...;

以下查询用于删除分区：

hive> ALTER TABLE employee DROP [if EXISTS]
   > PARTITION (year=’1203’);

找工作要求35岁以下，35岁以上的程序员都干什么去了？

长久以来，一直有一个问题困扰着技术人——如何打破“程序员的35岁职业魔咒”，这一天迟早会到来，或早或晚。

或许是选错了行业，程序员薪水虽高，但光鲜的外表下，背后的苦衷只有自己知道。三十多岁本该是一个人事业的黄金期，但技术变化日新月异，行业竞争异常残酷，对一个企业来说，永远有比你更年轻、劳动成本更低的人可以选择，这让你的中年危机提前到来。破局的智慧可以看看这本书！>>

<< Hive 删除表 Hive 内置运算符 >>

昵称：邮箱：