首页 > 其他 > 详细

【转】Hive的insert操作

时间:2015-07-14 16:58:54      阅读:157      评论:0      收藏:0      [点我收藏+]

insert 语法格式为:

 

1. 基本的插入语法:

insert overwrite table tablename [partition(partcol1=val1,partclo2=val2)] select_statement;

insert into table tablename [partition(partcol1=val1,partclo2=val2)] select_statement;

eg:

insert overwrite table test_insert select * from test_table;
insert into table test_insert select * from test_table;

注:
overwrite重写,into追加。

 

2. 对多个表进行插入操作:

from source_table
insert overwrite table tablename1 [partition (partcol1=val1,partclo2=val2)] select_statement1
insert overwrite table tablename2 [partition (partcol1=val1,partclo2=val2)] select_statement2

eg:

from test_table                     
insert overwrite table test_insert1 
select key
insert overwrite table test_insert2
select value;

注:hive不支持用insert语句一条一条的进行插入操作,也不支持update操作。数据是以load的方式加载到建立好的表中,数据一旦导入就不可以修改。


2.通过查询将数据保存到filesystem

insert overwrite [local] directory ‘directory‘ select_statement;

eg:

(1)导入数据到本地目录:

insert overwrite local directory ‘/home/hadoop/data‘ select * from test_insert1;

产生的文件会覆盖指定目录中的其他文件,即将目录中已经存在的文件进行删除。

只能用overwrite,into错误!

(2)导出数据到HDFS中:

insert overwrite directory ‘/user/hive/warehouse/table‘ select value from test_table;
只能用overwrite,into错误!

(3)同一个查询结果可以同时插入到多个表或者多个目录中:

from source_table
insert overwrite local directory ‘/home/hadoop/data‘ select * 
insert overwrite directory ‘/user/hive/warehouse/table‘ select value;

 

3. 小结:

(1)insert命令主要用于将hive中的数据导出,导出的目的地可以是hdfs或本地filesysytem,导入什么数据在于书写的select语句。

(2)overwrite与into:

insert overwrite/into table 可以搭配;

insert overwrite directory 可以搭配;

【转】Hive的insert操作

原文:http://www.cnblogs.com/zhengrunjian/p/4645462.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!