Hive的使用

时间：2020-02-26 17:47:31 阅读：70 评论：0 收藏：0 [点我收藏+]

Hive

Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼，查询和分析。

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

#hive查看一个表的详细信息，类似一些sql数据库
desc formatted 表名

安装

java安装:

java官网下载网页：https://www.oracle.com/java/technologies/javase-jdk13-downloads.html

运行后，在terminal查看：java --version。可以看到版本号信息。

网上找的一篇安装文章：https://juejin.im/post/5d36d9ea6fb9a07ee16968f3 （还要进行配置？）

安装hadoop

网上找的一篇安装文章： https://zhuanlan.zhihu.com/p/33117305

下载 hadoop-2.8.2.tar.gz

解压缩在/Users/chentianwei/hadoop文件夹内。

添加环境变量：

在 .bash_profile 文件中配置 Hadoop 的环境变量，使用 vim 打开该文件, 输入下面代码，使用:wq保存退出, 。

 23 # 加载hadoop环境，目的是使用hive
 24 export HADOOP_HOME=/Users/chentianwei/hadoop/hadoop-2.8.2-src
 25 export PATH=$PATH:$HADOOP_HOME/bin

然后运行 source 命令使文件中的修改立即生效.

在终端执行命令：hadoop version。

?，我这类没有显示版本号。

Hive的使用

原文：https://www.cnblogs.com/chentianwei/p/12367349.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)