主要有以下几类:
1、实现英文文章字频统计
2、统一剪裁某一指定目录下的所有图片的分辨率
3、代码行数统计(包括注释行数、空行数、代码总行数)
#-*- coding:utf-8 -*-
# Author:Konmu
# 任一个英文的纯文本文件,统计其中的单词出现的个数。
import re
f=open('C:/xxxx.txt','r')
data=f.read()
punctuations=r'["!,.?"]+'
'''
由于英文文章中也还是包含有标点,但是在后续分割时会发现由于标点和单词之间并没有空格所以也会被当作
单词的一部分,这是我们所不希望的,所以要先设立要去除的标点
'''
data=re.sub(punctuations,'',data)
data=data.split(' ')
#通常我们写英文作文时都会有的习惯,每个单词之间使用
#空格分开,所以可以根据此将每个单词分割开来
count={}
total=0
for alpha in data:
count.setdefault(alpha,0)
count[alpha] = count[alpha] + 1
for i in count:
total+=count[i]
print('each words:'+'\n',count)
print('total_number:'+'\n',total)
#-*- coding:utf-8 -*-
# Author:Konmu
# 你有一个目录,装了很多照片,把它们的尺寸变成指定分辨率的大小。
import os
from PIL import Image
file_path='C:/xxx'
image_file=os.listdir(file_path)
save_path='C:/xxx/output{}.jpg'
count=0
for i in image_file:
im=Image.open(file_path+i)
im.thumbnail((1136,640))#关键的缩略图裁剪函数
for j in range(len(image_file)):
count+=1
im.save(save_path.format(count))
break
# -*- coding:utf-8 -*-
# Author : 代码字数统计
# 每日一练:第 0007 题: 有个目录,里面是你自己写过的程序,
# 统计一下你写过多少行代码。包括空行和注释,但是要分别列出来。
num_empty=0
num_note=0
f=open('C:/xxx.py','r',encoding ='utf-8')
data=f.readlines()#读取文件所有内容
count = len(data)
print('Total count of Codes: ',count)
pattern1='#' #匹配注释符,用于统计注释
for i in range(count):
if(pattern1 in data[i]):
num_note += 1
elif(data[i].isspace()):#匹配空行
num_empty += 1
else:
pass
print('num_note: ', num_note)
print('num_empty: ',num_empty)
f.close()
原文:https://www.cnblogs.com/Konmu/p/12512884.html