1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。
在user/hadoop创建文件夹EnglishWord
上传文档到user/hadoop/EnglishWord文件夹中
在hive创建表world
导入文本world并查看
.
用SQL进行词频统计并保持到表word_count
Hadoop综合大作业
原文:https://www.cnblogs.com/ming-z/p/9090854.html