首页 > 其他 > 详细

Hive的使用

时间:2020-02-26 17:47:31      阅读:63      评论:0      收藏:0      [点我收藏+]

Hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

 

#hive查看一个表的详细信息,类似一些sql数据库
desc formatted 表名

 

安装

java安装:

java官网下载网页:https://www.oracle.com/java/technologies/javase-jdk13-downloads.html

运行后,在terminal查看:java --version。可以看到版本号信息。

网上找的一篇安装文章:https://juejin.im/post/5d36d9ea6fb9a07ee16968f3 (还要进行配置?)

安装hadoop

网上找的一篇安装文章: https://zhuanlan.zhihu.com/p/33117305

下载 hadoop-2.8.2.tar.gz 

解压缩在/Users/chentianwei/hadoop文件夹内。

添加环境变量:

在 .bash_profile 文件中配置 Hadoop 的环境变量,使用 vim 打开该文件, 输入下面代码,使用:wq保存退出, 。

 23 # 加载hadoop环境,目的是使用hive
 24 export HADOOP_HOME=/Users/chentianwei/hadoop/hadoop-2.8.2-src
 25 export PATH=$PATH:$HADOOP_HOME/bin

 

然后运行 source 命令使文件中的修改立即生效.

在终端执行命令:hadoop version。

?,我这类没有显示版本号。

 

Hive的使用

原文:https://www.cnblogs.com/chentianwei/p/12367349.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!