Hive安装
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。?
Hive是一个客户端工具,需要在哪台机器上运行就在哪台机器上安装,根据metastore的位置可以将hive的安装模式分为3种:内嵌模式,本地模式,远程模式。
Hive的安装是需要在hadoop基础上的,关于hadoop集群的搭建在之前已经讲过,在此基础上我们来安装hive。
1?在master机器的~目录下解压hive-0.7.1.tar.gz,并重命名为hive。
2?在~/.bashrc中添加以下内容:
?
?
?
?
3?在HDFS中建立tmp和/user/hive/warehouse目录并改写权限
?
?
4?在命令行下输入hive,出现如下界面,则安装成功。
?
以上是内嵌模式的安装过程,内嵌模式仅仅允许一个会话,只适用于简单的测试。
如果要支持多用户多会话,则需要一个独立的元数据库,目前比较流行的是使用mysql作为元数据库,配置一个独立的元数据库需要在内嵌的基础上增加以下步骤。
5?在本地安装mysql客户端和服务器端,并启动mysql服务。
sudo?apt-get?install?mysql-server?mysql-client
?
?
6?为hive建立相应的mysql账号,并赋予足够的权限。
?
?
7?建立hive专用的数据库
?
?
8?修改HIVE_HOME/conf目录下的hive-site.xml文件(如果不存在,从hive-default.xml复制)
打开hive-site.xml文件,修改以下属性值:
?
?
?
?
?
9?将mysql的驱动包放到HIVE_HONE/lib目录下
10?在命令行下输入hive,出现如下界面,则安装成功。
?
以上是hive独立模式的安装,hive的独立模式可以满足大多数的开发需要。
在独立模式的基础上,我们来配置远程模式
11?打开HIVE_HOME/conf/hive-site.xml文件,修改如下两项:
?
?
(其中的192.168.0.21是远程mysql所在的地址)
添加如下一项
?
(其中的192.168.0.21是hive所在的地址)
12?启动如下两项服务(在此之前,保证你的远程mysql已经启动)
?
?
13?在命令行下输入hive,出现如下界面,则安装成功。
?
以上是远程模式的安装过程。
?
原文:http://yizhenn.iteye.com/blog/2159055