首页 > 其他 > 详细

20180611早课记录28-Sqoop

时间:2018-06-11 14:41:29      阅读:183      评论:0      收藏:0      [点我收藏+]
1.sqoop是什么?

主要用于在Hadoop与RDBMS间进行数据的传递

2.sqoop分为哪两个分支,各最新版本是什么?

sqoop1:1.4.7
sqoop2:1.99.7

3.在工作中我们用的最多的是sqoop1,那么导入和导出,谁给谁的

导入是RDBMS到Hadoop
导出是Hadoop到RDBMS

4.假如输入一个命令找不到not found,你们觉得该怎么办?(老生常谈)

先看打错了没有,再看PATH有没有,或者yum安装

5.sqoop命令参数-m是什么意思

指定MapReduce的数量

6.sqoop 想要把MySQL数据导到hive里,那么是不是要加mysql jdbc jar包?

需要

7.sqoop导入,我能不能直接写SQL的导?

可以 --query指定

8.sqoop会有reduce job吗

不会

9.假如让你们项目作业的sqoop 每天导数据到hive分区表里,用shell脚本和crontab,有没有信心完成?

还要练习

20180611早课记录28-Sqoop

原文:http://blog.51cto.com/10814168/2128005

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!