三元运算:
三元运算又称三目运算,是对简单的条件语句的简写。如:
简单条件语句:
if 条件成立:
val = 1
else:
val = 2
变成三元运算是:
val = 1 if 条件成立 else 2
文件操作:
文件操作包括读、写、修改。
读:
f = open( file = ‘ F: /工作日常/文件名.txt‘ , mode = ‘r‘, encoding = ‘utf-8‘) # ‘r‘ 表示以(文本)读的模式打开文件(只能把文本转化成字符串), encoding= 的作用是: 以什么格式储存的文件, 就让Python以什么格式打开。如果不指定,Python就按默认的格式打开,Python3默认的是utf-8。 # 读取出来的内容是字符串格式。
data = f.read() #读取文件并赋值 # f.read()是读取所有内容
f.close()
注:数据在硬盘上是以二进制的模式储存
f.read(1) #读取一个字符
二进制读:
f = open( file = ‘ F: /工作日常/文件名.txt‘ , mode = ‘rb‘) # ‘rb‘ 的意思是二进制读的模式, 把要读的内容不需要转码,直接以二进制的形式读到内存里(就是硬盘怎么存的就怎么拿出来)。两种情况需要这种读取模式:1. 不知道它是什么编码格式 2. 用于读取视频、图片、网络文件传输的文本。
检测编码工具: chardet
import chardet
f= open(‘文件名‘, ‘rb‘)
data = f.read()
print( chardet.detect(data))
循环读取文件:
f = open( ‘文件‘ , ‘r‘, encoding = ‘gbk‘)
for line in f: #语法 # 就是一次取一行
print(line) # 文件中没有空行,但利用循环打印出的结果每行之间都有空行,原因:文本中每行结束有个换行符\n,并且 print()里面也默认有一个换行符,每打印完一次都会换行。
f.close()
写:
f = open( file = ‘d:/工作日常/文件名.txt‘ , mode=‘w‘, encoding=‘gbk‘) # ‘w’表示创建一个文件,encoding=‘gbk‘ 表示将要写入的Unicode字符串编码成gbk的格式创建并保存
f.write(‘ 内容 ‘) # 表示写入内容,写入的内容传入的时候是Unicode字符串类型,内部会根据encoding自动转换成指定编码的010101010101(即:字节类型)
f.close()
注: 用这种模式也可以直接创建一个文件,文件名就是你在open()中命名的“文件名.txt”。
二进制写:
f= open( file = ‘d:/工作日常/文件名.txt‘ , mode=‘wb‘) #‘wb‘ 表示只以2进制模式写
f.write(‘内容‘ .encode(‘gbk‘)) # .encode(‘gbk‘) 表示写入时需要直接传入何种格式的编码(如‘gbk’),如果不写默认的是‘utf-8’
f.close()
注:
1. 文件操作时,以 “w”或“wb” 模式打开,则只能写,并且在打开的同时会先将内容清空;(原先的内容在open的那一步就被清空了)
2. 写入到硬盘上时:
- wb,写入时需要直接传入以某种编码的0100101,即:字节类型
- w 和 encoding,写入时需要传入unicode字符串,内部会根据encoding制定的编码将unicode字符串转换为该编码的 010101010
追加:
f = open( file = ‘d:/工作日常/文件名.txt‘ , mode=‘a‘, encoding=‘gbk‘)
f.write(‘ 内容 ‘)
f.close()
二进制追加:
f= open( file = ‘d:/工作日常/文件名.txt‘ , mode=‘ab‘)
f.write(‘内容‘ .encode(‘gbk‘))
f.close()
读写:
f = open( file = ‘ F: /工作日常/文件名.txt‘ , mode = ‘r+‘, encoding = ‘utf-8‘)
data = f.read()
f.close()
注:1. read的时候在文件最前面有个小光标,read完或者write完之后会小光标会向后移动,最次read的时候光标只会往后面走,不会再read以前已经read过或者write过的内容。
2. 这种模式也能直接创建文件。 但是,‘r’ 模式的创建不了。
文件操作其他功能:
fileno() #返回文件句柄在内核中的索引值,以后做IO多路复用时可以用到(网络编程)
flush() # 把文件从内存buffer(缓存)里强制刷新到硬盘
readline() #只读一行,遇到\r 或者 \n为止 #读取出来的内容是字符串格式
f.tell() #返回当前文件光标的位置 # 返回的是字节所在位置
f.seek(数字) # 把操作文件的光标移到指定位置 #
注意seek的长度是按字节算的, 不同字符编码存每个字符所占的字节长度不一样。
f.truncate() # 从光标当前位置往后截断,只保留前面的内容。 也是按字节去截断。truncate()里面要是有数字,就是从头开始截多少个字节留下来。 #不能是‘r’模式
修改:
f = open(‘文件名.txt‘, ‘r+‘, encoding= ‘utf-8‘)
f.seek(数字)
f. write(‘ 你好‘) #插入后就把原先的内容覆盖了
f.close
覆盖原因:
注: 出于以上的原因,文件不要在硬盘上修改,但可以把内容全部读到内存里,数据在内存里是可以随便增删改查的,修改之后,把内容再全部写回硬盘,把原来的数据全部覆盖掉。vim Word等各种文本编辑器的工作原理就是这样的。
文件修改示例:
思路: 把要修改的文件中的内容逐行读取到内存就行修改,优点: 省内存, 缺点:需要再创建一个文件,多占了硬盘。
f_name = ‘文件操作测试.txt‘ f_new_name = ‘文件操作测试.txt.new‘ #创建一个新的文件名 old_str = ‘狗猴‘ new_str = ‘廖小伟‘ #用于修改、替换的内容 f = open(f_name,‘r‘,encoding=‘utf-8‘) f_new = open(f_new_name,‘w‘,encoding=‘utf-8‘) #把这两个文件都打开 for line in f: #一行一行循环读取老文件中的信息到内存 if old_str in line: #判断读取到内存的那行内容里面 有没有要替换的 line = line.replace(old_str,new_str) # 内容(字符串的格式)替换 f_new.write(line) # 替换的内容写到新文件中 f.close() f_new.close() # 关闭两个文件夹
注:待解决: import os
os.rename(f_new_name,f_name)会出错