Hive教程

Hive 查看和索引

本章介绍如何创建和管理视图。视图是根据用户需求生成的。您可以将任何结果集数据保存为视图。 Hive 中视图的用法与 SQL 中视图的用法相同。这是一个标准的 RDBMS 概念。我们可以在一个视图上执行所有 DML 操作。

创建视图

您可以在执行 SELECT 语句时创建视图。语法如下：

CREATE VIEW [if NOT EXISTS] view_name [(column_name [COMMENT column_comment], ...) ]
[COMMENT table_comment]
AS SELECT ...

示例

让我们举个例子来看看。假设员工表如下所示，包含字段 Id、Name、Salary、Designation 和 Dept。生成查询以检索工资超过 30000 卢比的员工详细信息。我们将结果存储在名为 的视图中emp_30000。

+------+--------------+-------------+-------------------+--------+
| ID   | Name         | Salary      | Designation       | Dept   |
+------+--------------+-------------+-------------------+--------+
|1201  | Gopal        | 45000 | Technical manager | TP |
|1202  | Manisha      | 45000       | Proofreader       | PR     |
|1203  | Masthanvali  | 40000 | Technical writer  | TP     |
|1204  | Krian        | 40000       | Hr Admin          | HR     |
|1205  | Kranthi      | 30000       | Op Admin          | Admin  |
+------+--------------+-------------+-------------------+--------+

以下查询使用上述场景检索员工详细信息：

hive> CREATE VIEW emp_30000 AS
SELECT * FROM employee
WHERE salary>30000;

删除视图

使用以下语法删除视图：

DROP VIEW view_name

以下查询删除名为 emp_30000 的视图：

hive> DROP VIEW emp_30000;

创建索引

索引只不过是表特定列上的指针。创建索引意味着在表的特定列上创建一个指针。其语法如下：

CREATE INDEX index_name
ON TABLE base_table_name (col_name, ...)
AS 'index.handler.class.name'
[WITH DEFERRED REBUILD]
[IDXPROPERTIES (property_name=property_value, ...)]
[IN TABLE index_table_name]
[PARTITIONED BY (col_name, ...)]
[
   [ ROW FORMAT ...] STORED AS ...
   | STORED BY ...
]
[LOCATION hdfs_path]
[TBLPROPERTIES (...)]

示例

让我们以索引为例。使用我们之前使用过的带有字段 Id、Name、Salary、Designation 和 Dept 的员工表。在员工表的薪水列上创建一个名为 index_salary 的索引。

以下查询创建索引：

hive> CREATE INDEX inedx_salary ON TABLE employee(salary)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler';

它是一个指向薪水列的指针。如果列被修改，则使用索引值存储更改。

删除索引

以下语法用于删除索引：

DROP INDEX <index_name> ON <table_name>

以下查询删除名为 index_salary 的索引：

hive> DROP INDEX index_salary ON employee;

找工作要求35岁以下，35岁以上的程序员都干什么去了？

长久以来，一直有一个问题困扰着技术人——如何打破“程序员的35岁职业魔咒”，这一天迟早会到来，或早或晚。

或许是选错了行业，程序员薪水虽高，但光鲜的外表下，背后的苦衷只有自己知道。三十多岁本该是一个人事业的黄金期，但技术变化日新月异，行业竞争异常残酷，对一个企业来说，永远有比你更年轻、劳动成本更低的人可以选择，这让你的中年危机提前到来。破局的智慧可以看看这本书！>>

<< Hive 内置函数 HiveQL SELECT Where >>

昵称：邮箱：