q
1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
我统计的是博客园2018年到4月底的新闻词频统计,统计的结果大部分为中文,统计的最后几个单词如下图

首先在本地把统计好的词频转化成csv格式和txt格式


通过软件WinSCP把文件上传到虚拟机


然后要启动hdfs

上传到hdfs并显示前10条

启动mysql

启动hive

创建数据库

创建表

导入数据

查看数据

原文:https://www.cnblogs.com/zzrf/p/9068456.html