首页 > 编程语言 > 详细

Python: 把txt文件转换成csv

时间:2019-10-13 19:10:26      阅读:85      评论:0      收藏:0      [点我收藏+]

最近在项目上需要批量把txt文件转成成csv文件格式,以前是手动打开excel文件,然后导入txt来生产csv文件,由于这已经变成每周需要做的事情,决定用python自动化脚本来实现,思路:

  1. 读取文件夹中所有txt文件,保存到list中
  2. 针对每个txt文件,自动生产同文件名的csv文件
  3. 对每个txt文件,根据分隔符来保存为csv文件,分隔符为分号“;”,在转换之前先把文件编码统一成‘utf-8‘,因为在实现过程中,发现总会有编码报错问题出现
  4. 新建txt文件夹来存放所有txt文件

完整代码如下:

import csv
import os
import shutil
from chardet.universaldetector import UniversalDetector

def get_encode_info(file):
    with open(file, rb) as f:
        detector = UniversalDetector()
        for line in f.readlines():
            detector.feed(line)
            if detector.done:
                break
        detector.close()
        return detector.result[encoding]

def read_file(file):
    with open(file, rb) as f:
        return f.read()

def write_file(content, file):
    with open(file, wb) as f:
        f.write(content)

def convert_encode2utf8(file, original_encode, des_encode):
    file_content = read_file(file)
    file_decode = file_content.decode(original_encode,ignore)
    file_encode = file_decode.encode(des_encode)
    write_file(file_encode, file)

## Move *.txt to a folder
def move2txtfolder(path, txt_file_list):
    txt_folder_path = path + \\txt
    if not os.path.exists(txt_folder_path):
        os.makedirs(txt_folder_path)

    for file in txt_file_list:
        des_path = os.path.join(txt_folder_path, os.path.basename(file))
        shutil.move(file, des_path)

##在路径中找出所有的*.txt文件
def findtxt(path, txt_file_list):
    file_name_list = os.listdir(path)
    for filename in file_name_list:
        de_path = os.path.join(path, filename)
        if os.path.isfile(de_path):
            if de_path.endswith(".txt"):  # Specify to find the txt file.
                txt_file_list.append(de_path)
        else:
            findtxt(de_path, txt_file_list)

def txt2csv(txt_file):
    ##先把所有文件的encoding都转换成utf-8
    encode_info = get_encode_info(txt_file)
    if encode_info != utf-8:
        convert_encode2utf8(txt_file, encode_info, utf-8)

    csv_file = os.path.splitext(txt_file)[0] + .csv
    with open(csv_file, w+, newline=‘‘, encoding=utf-8) as csvfile:
        writer = csv.writer(csvfile, dialect=excel)

        with open(txt_file, r, encoding=utf-8) as txtfile:
            for line in txtfile.readlines():
                line_list = line.strip(\n).split(;)
                writer.writerow(line_list)

if __name__ == __main__:
    folder_path = rC:\Details
    # ##如果文件夹中还有子文件夹,请用findtxt函数
    # txt_file_list = []
    # findtxt(folder_path, txt_file_list)

    ##如果文件夹中没有子文件夹的时候直接使用推导式来生产txt文件的list
    txt_file_list = [os.path.join(folder_path, file) for file in os.listdir(folder_path) if os.path.join(folder_path, file).endswith(.txt)]

    for txt_file in txt_file_list:
        txt2csv(txt_file)
    
    move2txtfolder(folder_path, txt_file_list)

 

Python: 把txt文件转换成csv

原文:https://www.cnblogs.com/danvy/p/11667763.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!