Hadoop教程
HBase
Hive
Pig
Sqoop
Spark

什么是Sqoop

Sqoop是用于在关系数据库和Hadoop之间传输数据的命令行界面应用程序。
它支持单个表的增量负载。或自由形式的SQL查询以及保存的作业,这些作业可以运行多次以导入自上次导入以来对数据库所做的更新。使用Sqoop,可以将数据从MySQL/PostgreSQL/Oracle/SQL移至HDFS/hive/hbase服务器/DB2,反之亦然。
Sqoop

Sqoop工作

步骤1: Sqoop向关系数据库发送请求,以发送有关表的元数据信息(此处的元数据是有关关系数据库中表的数据)。
步骤2: 从接收到的信息中,它将生成Java类(为什么要在运行Java之前先配置Java,Sqoop内部使用JDBC API生成数据)。
步骤3: 现在Sqoop(用Java编写的方法是将已编译的类打包以生成表结构),后期编译会创建jar文件(Java打包标准)。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4