首页 > 其他 > 详细

转化文本文件为UTF8无BOM

时间:2015-10-28 15:53:05      阅读:260      评论:0      收藏:0      [点我收藏+]
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;

public class ToUtf8NoBOM {

	/**
	 * 入口函数
	 * 
	 * @param args
	 * @throws Exception
	 */
	public static void main(String[] args) throws Exception {
		if (args.length < 2) return;
		else {
			String strSuffix = args[0];
			String strFile = null;
			for (int i = 1; i < args.length; i++) {
				strFile = args[i];
				winToLinux(strFile, strSuffix);
			}
		}
	}

	/**
	 * 将文件转换为UTF8无BOM,若参数为文件件,则转换所有指定后缀的文件为UTF8无BOM
	 * 
	 * @param strFile 文件或文件夹
	 * @param strSuffix 后缀
	 * @throws Exception 异常
	 */
	private static void winToLinux(String strFile, String strSuffix)
			throws Exception {
		File file = new File(strFile);
		if (file.isFile()) {
			if (strFile.endsWith(strSuffix)) {
				convertToUtf8NoBOM(file);
			} else {
				return;
			}
		} else {
			for (String str : file.list()) {
				winToLinux(file.getPath() + File.separatorChar + str, strSuffix);
			}
		}
	}

	/**
	 * 将文件转化为UTF8无BOM
	 * 
	 * @param file
	 * @throws IOException
	 */
	private static void convertToUtf8NoBOM(File file) throws IOException {
		String strText = null;

		// 读取文件
		InputStream in = null;
		try {
			in = new FileInputStream(file);
			byte[] buf = new byte[(int) file.length()];
			in.read(buf);
			if (buf.length > 3 && (byte) 0XEF == buf[0] && (byte) 0XBB == buf[1] && (byte) 0XBF == buf[2]) {
				strText = new String(buf, 3, buf.length - 3, "UTF-8");
			} else {
				strText = new String(buf);
			}
			strText.replace("\r\n", "\n");
		} catch (IOException e) {
			e.printStackTrace();
			throw e;
		} finally {
			if (null != in) {
				in.close();
			}
		}

		// 写文件
		OutputStream out = null;
		try {
			out = new FileOutputStream(file);
			out.write(strText.getBytes("UTF-8"));
		} catch (IOException e) {
			e.printStackTrace();
			throw e;
		} finally {
			if (null != out) {
				out.flush();
				out.close();
			}
		}
	}
}

说明:

1、编译生成字节码文件ToUtf8NoBOM.class

在命令行运行如下命令即可

javac ToUtf8NoBOM.java

2、使用举例

(1)多文件批量转换

在命令行运行如下命令

java ToUtf8NoBOM .java D:\myjava\src

可将D:\myjava\src下所有后缀名为“.java”的文本文件转化为UTF8无BOM格式

(2)单个文件转换

在命令行运行如下命令

java ToUtf8NoBOM .java D:\myjava\src\test.java

可将文件“D:\myjava\src\test.java”转化为UTF8无BOM格式


转化文本文件为UTF8无BOM

原文:http://my.oschina.net/u/1425545/blog/523105

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!