首页 > 其他 > 详细

词频统计

时间:2019-04-04 11:12:49      阅读:173      评论:0      收藏:0      [点我收藏+]

1) 自己的基本信息:

  • 学号:2017*****1054;
  • 姓名:杨玉婷
  • 码云仓库地址:https://gitee.com/yyyt1/word_frequency_count.git
  • 用命令python -m cProfile word_freq.py Gone_with_the_wind.txt运行:
  • 技术分享图片

     

    执行次数最多的代码:349/次

    执行时间最长的代码:0.001


     

    应改把执行时间最长的代码优化一下,函数process_buffer函数中有一行代码:

    if word in word_freq.keys():

    代码在for循环中,有多少单词,这个循环就会执行多少遍,每次进行条件判断的时候都要执行一次字典的keys方法,所以耗时很多。于是把keys去除,代码变为:

    if word in word_freq:

  • 技术分享图片

     

词频统计

原文:https://www.cnblogs.com/yyt1/p/10653612.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!