启动 Sqoop
Sqoop是具有以下结构的命令行工具
sqoop TOOL PROPERTY_ARGS SQOOP_ARGS [--EXTRA_ARGS]
工具指示操作,例如: "导入","导出"。
PROPERTY_ARGS是Java属性,格式为"-Dname = value"
SQOOP_ARGS提到了各种Sqoop参数
EXTRA_ARGS用于专用连接器,以"-"与SQOOP_ARGS分开
示例:
% sqoop import --connect jdbc:mysql://localhost/hadoopguide--table widgets-m 1
键入" sqoop帮助"以获取所有可用工具:
后端发生了什么
当您决定将数据从RDBMS移到HDFS时,第一个使用的产品就是Apache Sqoop。当您请求将数据导入HDFS时,会发生以下情况。
Sqoop向Relation DB请求元数据信息。
关系数据库返回所需的请求。
Sqoop基于元数据信息生成Java类。
基于主ID的分区在表中发生,因为多个映射器将同时导入数据。