这学期跟着MOOC的嵩天老师在学Python,但是有蛮多虽然跟着视频敲,但实际上自己用vscode做出问题的案例,所以记一下以后人家百度搜比较快。(老是读不到文件..之类的
一、英文文本词频统计
1 #CalaliceV1.py 2 def getText(): 3 txt = open("11.txt","r",encoding=‘utf-8‘).read() 4 txt = txt.lower() #将所有大写变小写 5 for ch in ‘|"$%&*()^#@;:_-.><!~`[\\]+=?/“”{|}‘: 6 txt=txt.replace(ch," ")#将特殊符号替换为空格符 7 return txt 8 #得到一个没有符号的 都是小写的 单词间都用空格间隔开的txt 9 aliceTxt=getText() 10 words=aliceTxt.split()#split采用空格分隔单词,以列表形式返回 11 counts={} 12 for word in words: 13 counts[word]=counts.get(word,0)+1 14 items=list(counts.items()) 15 items.sort(key=lambda x:x[1],reverse=True) 16 for i in range(10): 17 word,count=items[i] 18 print("{0:<10}{1:>5}".format(word,count))
二、中文文本词频统计
注意,要读的文件要放在上一级目录,而不是跟代码放在一起
原文:https://www.cnblogs.com/Nickyl07/p/12727388.html