Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
#hive查看一个表的详细信息,类似一些sql数据库 desc formatted 表名
java官网下载网页:https://www.oracle.com/java/technologies/javase-jdk13-downloads.html
运行后,在terminal查看:java --version。可以看到版本号信息。
网上找的一篇安装文章:https://juejin.im/post/5d36d9ea6fb9a07ee16968f3 (还要进行配置?)
网上找的一篇安装文章: https://zhuanlan.zhihu.com/p/33117305
解压缩在/Users/chentianwei/hadoop文件夹内。
添加环境变量:
在 .bash_profile 文件中配置 Hadoop 的环境变量,使用 vim 打开该文件, 输入下面代码,使用:wq保存退出, 。
23 # 加载hadoop环境,目的是使用hive 24 export HADOOP_HOME=/Users/chentianwei/hadoop/hadoop-2.8.2-src 25 export PATH=$PATH:$HADOOP_HOME/bin
然后运行 source 命令使文件中的修改立即生效.
在终端执行命令:hadoop version。
?,我这类没有显示版本号。
原文:https://www.cnblogs.com/chentianwei/p/12367349.html