首页 > 其他 > 详细

分析文件中频率出现最多的前十个词

时间:2014-03-03 18:48:07      阅读:468      评论:0      收藏:0      [点我收藏+]

当想到要做这个小程序的时候,分了下步骤:
1.读取文件到内存
2.计算各个词出现的频率
3.找出频率前十名的单词
读取文件主要靠文件流读取,这样第一步便完成了。
建立一维数组记录字母出现的频数,其中数组下标与单词的首字母的ASII代码相关联。例如在A[0]中,首字母为A的单词,在读取后,通过建立一个结构体,插入到A[0]后,其中数据域存储个数与单词。
在读取的过程中,依次按照单词给所对应的数据域累加。这样便能计算出各个单词出现的频数。
通过循环遍历出最大值的对应的数组的下标,记录下来,赋值为零的方式找到前十名的字母。
2014 3月2日8点半到10点半。

分析文件中频率出现最多的前十个词,布布扣,bubuko.com

分析文件中频率出现最多的前十个词

原文:http://www.cnblogs.com/liyanzhui/p/3577751.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!