首页 > 其他 > 详细

第三次作业——词频统计

时间:2018-10-09 22:36:46      阅读:151      评论:0      收藏:0      [点我收藏+]

一、编程环境

版本:python2.7

二、程序分析

  1、读文件到缓冲区

技术分享图片

2、处理文件,统计词频

技术分享图片

 

3、输出TOP10的单词

技术分享图片

 

4、主函数,进行处理

技术分享图片

三、代码风格

1、python3与2不同:在print函数时:python3用print(),python3用print""。

2、python与C不同没有用到分号。

3、每一条可执行语句为一行

四、程序运行命令、运行结果截图

词频统计运行截图

技术分享图片

 

五、性能分析结果及改进

技术分享图片

1、运行总耗时

技术分享图片

 

2、执行次数最多

技术分享图片

3、 运行时间最长

技术分享图片

 

六、可视化操作

下载转换 dot 的 python 代码gprof2dot 官方下载,下载完了,解压缩,将『gprof2dot.py』 copy 到当前分析文件的路径,或者你系统 PATH 环境变量设置过的路径。

(1) 性能分析:``` python -m cProfile -o result.out -s cumulative word_freq.py Gone_with_the_wind.txt``` ;分析结果保存到 result.out 文件;

(2)转换为图形;gprof2dot 将 result.out 转换为 dot 格式;再由 graphvix 转换为 png 图形格式。 命令:```python gprof2dot.py -f pstats result.out | dot -Tpng -o result.png```

转换得到图如下:

 技术分享图片

第三次作业——词频统计

原文:https://www.cnblogs.com/tw1356961332/p/9762296.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!