考虑如下需求场景:
终端按固定时间间隔(单位为分钟)生成诊断日志(格式为UserName-Status-yyyy-mm-dd-hh-mm.log),并上传至服务器。若终端与服务器的传输通道中断,则终端本地暂存最新的N个日志文件,即第(N+1)个周期生成的新日志将覆盖第1个周期的旧日志,以此类推。待传输恢复后,终端一次性上传该N个日志。
本文主要讨论该需求中“最新日志覆盖最旧日志”的功能点。为突出层次,文中“覆盖”用先删除旧日志后创建新日志实现。实际中先删后建和先建后删各有优点,前者适于内存受限(如仅允许存在N个固定大小的日志),后者更为安全(避免创建新日志失败但已删除旧日志)。
创建文件时调用现成库函数即可,而删除时需确定当前最旧的那个文件。下文将介绍几种删除判决的实现方式(时间复杂度依次降低)。
Linux系统中文件没有创建时间的概念,只有访问时间(atime)、修改时间(mtime)和状态改动时间(ctime)。因该需求中日志创建后立即写入内容,其后内容和状态(权限与属性等)均不再改变,故可用mtime或ctime表征创建时间。
调用stat库函数即可获取日志的三种时间,比较各日志的mtime或ctime(整数)信息即可。
1 #define FILE_NUM (unsigned short)30 //允许共存的文件数目 2 #define FILE_NAME_LEN sizeof("%Log-Clover-65535.log") 3 4 #include <sys/types.h> 5 #include <sys/stat.h> 6 #include <dirent.h> 7 #include <errno.h> 8 #define DIR_FILE_LEN 96 //目录和文件组成的绝对路径最大长度 9 const char *gDirectoryName = "/sdb1/Clover/linux_test/log"; 10 11 12 int CreateLogFile1(const char *pszCreateFileName){//比较文件时间戳 13 DIR *pDir = opendir(gDirectoryName); 14 if(NULL == pDir){ 15 fprintf(stderr,"Cannot open directory: %s!\n", gDirectoryName); 16 return -1; 17 } 18 19 unsigned char ucFileNum = 0; 20 time_t tFileTempCtime = 0; 21 char szDelFileName[NAME_MAX+1] = {0}; //待删除的文件名 22 struct dirent *pFileEntry = NULL; 23 while((pFileEntry = readdir(pDir)) != NULL){ 24 //剔除当前目录.,上一级目录..及隐藏文件,避免死循环遍历目录 25 if(0 == strncmp(pFileEntry->d_name, ".", 1)) 26 continue; 27 28 struct stat tFileStatus; //文件状态信息 29 char szAbsFile[DIR_FILE_LEN] = {0}; //文件绝对路径 30 sprintf(szAbsFile, "%s/%s", gDirectoryName, pFileEntry->d_name); 31 if(stat(szAbsFile, &tFileStatus) != 0){ 32 fprintf(stderr,"Call stat error(errno:%d)!\n", errno); 33 return -1; 34 } 35 36 if(S_ISDIR(tFileStatus.st_mode)) //跳过子目录 37 continue; 38 39 if((ucFileNum < 1) || 40 (tFileStatus.st_ctime < tFileTempCtime)){ //首个文件或当前文件更老 41 tFileTempCtime = tFileStatus.st_ctime; 42 strcpy(szDelFileName, pFileEntry->d_name); 43 } 44 ucFileNum++; 45 if(ucFileNum >= FILE_NUM){ 46 char szDeleteAbsFile[DIR_FILE_LEN] = {0}; //待删除的文件绝对路径 47 sprintf(szDeleteAbsFile, "%s/%s", gDirectoryName, szDelFileName); 48 if(0 != remove(szDeleteAbsFile)){ 49 fprintf(stderr,"Fail to delete file: %s!\n", szDeleteAbsFile); 50 return -1; 51 } 52 } 53 } 54 55 char szCreateAbsFile[DIR_FILE_LEN] = {0}; //待创建的文件绝对路径 56 sprintf(szCreateAbsFile, "%s/%s", gDirectoryName, pszCreateFileName); 57 FILE *pFile = fopen(szCreateAbsFile, "w+"); 58 if(NULL == pFile){ 59 fprintf(stderr,"Cannot open file: %s\n", szCreateAbsFile); 60 return -1; 61 } 62 63 fputs(szCreateAbsFile, pFile); //暂时写入绝对路径 64 fclose(pFile); 65 printf("Create file(%s) success!\n", pszCreateFileName); 66 67 closedir(pDir); 68 69 return 0; 70 }
因日志文件名包含时间信息,故可直接调用strcmp库函数比较日志文件名字符串。
1 int CreateLogFile2(const char *pszCreateFileName){//比较文件名 2 DIR *pDir = opendir(gDirectoryName); 3 if(NULL == pDir){ 4 fprintf(stderr,"Cannot open directory: %s!\n", gDirectoryName); 5 return -1; 6 } 7 8 unsigned char ucFileNum = 0; 9 char szDelFileName[NAME_MAX+1] = {0}; //待删除的文件名 10 struct dirent *pFileEntry = NULL; 11 while((pFileEntry = readdir(pDir)) != NULL){//readdir返回的文件顺序与文件名无关 12 //剔除当前目录.,上一级目录..及隐藏文件,避免死循环遍历目录 13 if(0 == strncmp(pFileEntry->d_name, ".", 1)) 14 continue; 15 16 if(ucFileNum < 1) //首个文件 17 strcpy(szDelFileName, pFileEntry->d_name); 18 19 if(strcmp(szDelFileName, pFileEntry->d_name) > 0) //当前文件更老 20 strcpy(szDelFileName, pFileEntry->d_name); 21 22 ucFileNum++; 23 if(ucFileNum >= FILE_NUM){ 24 char szDeleteAbsFile[DIR_FILE_LEN] = {0}; //待删除的文件绝对路径 25 sprintf(szDeleteAbsFile, "%s/%s", gDirectoryName, szDelFileName); 26 if(0 != remove(szDeleteAbsFile)){ 27 fprintf(stderr,"Fail to delete file: %s!\n", szDeleteAbsFile); 28 return -1; 29 } 30 } 31 } 32 33 char szCreateAbsFile[DIR_FILE_LEN] = {0}; //待创建的文件绝对路径 34 sprintf(szCreateAbsFile, "%s/%s", gDirectoryName, pszCreateFileName); 35 FILE *pFile = fopen(szCreateAbsFile, "w+"); 36 if(NULL == pFile){ 37 fprintf(stderr,"Cannot open file: %s\n", szCreateAbsFile); 38 return -1; 39 } 40 41 fputs(szCreateAbsFile, pFile); //暂时写入绝对路径 42 fclose(pFile); 43 printf("Create file(%s) success!\n", pszCreateFileName); 44 45 closedir(pDir); 46 47 return 0; 48 }
创建日志时为其创建一个句柄(整数编号),比较句柄即可。为便于说明,定义如下信息:
typedef struct{ char szFileName[NAME_MAX+1]; //文件名称 unsigned int dwFileHandler; //文件句柄 }FILE_INFO; static FILE_INFO gFileInfoMap[FILE_NUM] = {{{0}}}; //FILE_NUM为允许共存的文件数目 |
全局信息表gFileInfoMap存储当前各日志文件的文件名及其句柄。每当创建一个新日志时,删除句柄最小的文件,并更新其对应的数组记录:文件名称改为新日志名,文件句柄值增加FILE_NUM。
例如:
{“log20130517”, 1};
{“log20130518”, 2};
{“log20130519”, 3};
创建“log20130520”文件后,上面的结构体数组内容变为
{“log20130520”, 4};
{“log20130518”, 2};
{“log20130519”, 3};
下次再创建新文件时覆盖“log20130518”——哪怕新文件名为“log20130513”(比前两种方法更安全)!
该方法无需关心文件的时间信息。这类似于新员工报道时分配的工号,工号数字的大小就代表入职的时间先后(无论工号是否包含入职精确时间)。
因2.4节方法可视为本节的“升级版“,此处省略本节实现。
为便于说明,定义如下信息:
//gFileNameMap按新旧次序环形记录FILE_NUM个文件的文件名信息 static char gFileNameMap[FILE_NUM][FILE_NAME_LEN] = {{0}}; //gLatestFileIndex记录gFileNameMap第一维最新文件的下标, //该下标+1并对FILE_NUM取余后对应的元素为最旧的文件,即 //Oldest = (Latest + 1) mod FILE_NUM. static unsigned short gLatestFileIndex = FILE_NUM-1; |
该方法利用“环形存储时最新文件后必为最旧文件“这一特性。最新文件为数组最后一个元素时,取余操作将定位到数组最前端的最旧文件。
1 int CreateLogFile3(const char *pszCreateFileName){//表驱动法(无需比较) 2 DIR *pDir = opendir(gDirectoryName); //目录操作并非必要 3 if(NULL == pDir){ 4 fprintf(stderr,"Cannot open directory: %s!\n", gDirectoryName); 5 return -1; 6 } 7 8 char szDeleteAbsFile[DIR_FILE_LEN] = {0}; //待删除的文件绝对路径 9 unsigned short wOldestFileIndex = 0; //(gLatestFileIndex+1)%FILE_NUM; 10 if(FILE_NUM != (gLatestFileIndex+1)) 11 wOldestFileIndex = gLatestFileIndex + 1; 12 if(‘\0‘ != gFileNameMap[wOldestFileIndex][0]){//记录为空时remove会删除目录 13 sprintf(szDeleteAbsFile, "%s/%s", gDirectoryName, gFileNameMap[wOldestFileIndex]); 14 if(0 != remove(szDeleteAbsFile)){ 15 fprintf(stderr,"Fail to delete file: %s!\n", szDeleteAbsFile); 16 return -1; 17 } 18 } 19 20 char szCreateAbsFile[DIR_FILE_LEN] = {0}; //待创建的文件绝对路径 21 sprintf(szCreateAbsFile, "%s/%s", gDirectoryName, pszCreateFileName); 22 FILE *pFile = fopen(szCreateAbsFile, "w+"); 23 if(NULL == pFile){ 24 fprintf(stderr,"Cannot open file: %s\n", szCreateAbsFile); 25 return -1; 26 } 27 28 fputs(szCreateAbsFile, pFile); //暂时写入绝对路径 29 fclose(pFile); 30 printf("Create file(%s) success!\n", pszCreateFileName); 31 32 gLatestFileIndex = wOldestFileIndex; 33 strcpy(gFileNameMap[gLatestFileIndex], pszCreateFileName); 34 35 closedir(pDir); 36 37 return 0; 38 }
采用如下方法粗略统计除2.3节外的三种实现耗时(未考虑缓存、预热等因素):
1 #include <sys/time.h> 2 #define TIME_ELAPSED(codeToTime) do{ 3 struct timeval beginTime, endTime; 4 gettimeofday(&beginTime, NULL); 5 {codeToTime;} 6 gettimeofday(&endTime, NULL); 7 long secTime = endTime.tv_sec - beginTime.tv_sec; 8 long usecTime = endTime.tv_usec - beginTime.tv_usec; 9 printf("[%s(%d)]Elapsed Time: SecTime = %lds, UsecTime = %ldus!\n", __FUNCTION__, __LINE__, secTime, usecTime); 10 }while(0) 11 12 #include <unistd.h> 13 void CalcTime1(void){ 14 unsigned short wFileIdx = 0; 15 for(; wFileIdx < 1; wFileIdx++){ 16 //time_t精度为秒,批量测试文件创建时需作秒级延迟; 17 //但这样会影响计时统计,因为sleep会"淹没"CreateLogFile1(单次执行微妙级) 18 //sleep(1); 19 char szFileName[FILE_NAME_LEN] = {0}; 20 sprintf(szFileName, "Log-Clover-%05d.log", wFileIdx); 21 CreateLogFile1(szFileName); 22 } 23 } 24 void CalcTime2(void){ 25 unsigned short wFileIdx = 0; 26 for(; wFileIdx < 1000; wFileIdx++){ 27 char szFileName[FILE_NAME_LEN] = {0}; 28 sprintf(szFileName, "Log-Clover-%05d.log", wFileIdx); 29 CreateLogFile2(szFileName); 30 } 31 } 32 void CalcTime3(void){ 33 unsigned short wFileIdx = 0; 34 for(; wFileIdx < 1000; wFileIdx++){ 35 char szFileName[FILE_NAME_LEN] = {0}; 36 sprintf(szFileName, "Log-Clover-%05d.log", wFileIdx); 37 CreateLogFile3(szFileName); 38 } 39 } 40 41 int main(void){ 42 TIME_ELAPSED(CalcTime1()); 43 TIME_ELAPSED(CalcTime2()); 44 TIME_ELAPSED(CalcTime3()); 45 DIR *pDir = NULL; 46 TIME_ELAPSED(pDir = opendir(gDirectoryName)); 47 TIME_ELAPSED(readdir(pDir)); 48 struct stat tFileStatus; //文件状态信息 49 char szAbsFile[DIR_FILE_LEN] = {0}; //文件绝对路径 50 sprintf(szAbsFile, "%s/%s", gDirectoryName, "Log-Clover-00002.log"); 51 TIME_ELAPSED(stat(szAbsFile, &tFileStatus)); 52 TIME_ELAPSED(remove(szAbsFile)); 53 FILE *pFile = NULL; 54 TIME_ELAPSED(pFile = fopen(szAbsFile, "a+")); 55 TIME_ELAPSED(fputs(szAbsFile, pFile)); 56 TIME_ELAPSED(fclose(pFile)); 57 TIME_ELAPSED(closedir(pDir)); 58 TIME_ELAPSED(strcmp("Log-Clover-00000.log","Log-Clover-00001.log")); 59 60 TIME_ELAPSED({int i=0;for(;i<10000;i++){strcmp("Log-00000","Log-00001");}}); 61 TIME_ELAPSED({int i=0;for(;i<10000;i++){int new=20;if(FILE_NUM!=new+1){int old=new+1;}}}); 62 TIME_ELAPSED(int new=20;if(FILE_NUM!=new+1){int old=new+1;}); 63 64 return 0; 65 }
统计结果如下所示:
对象 |
条件 |
耗时(us) |
2.1: CalcTime1() |
单次 |
792 |
2.2: CalcTime2() |
单次 |
214 |
2.2: CalcTime2() |
FILE_NUM=30,循环1000次 |
274357 |
2.4: CalcTime3() |
FILE_NUM=30,循环1000次 |
77789 |
opendir() |
单次 |
81 |
readdir() |
单次 |
13 |
stat() |
单次 |
9 |
remove() |
单次 |
78 |
fopen() |
单次 |
33 |
fputs() |
单次 |
8 |
fclose() |
单次 |
39 |
closedir() |
单次 |
8 |
strcmp() |
单次 |
2 |
strcmp() |
循环10000次 |
27 |
Oldest = (Latest + 1) mod FILE_NUM |
循环10000次 |
36 |
Oldest = (Latest + 1) mod FILE_NUM |
单次 |
1 |
注意:计时结果仅作粗略参考,且每次统计时结果可能略有不同。 |
可见,文件操作函数(opendir、fopen等)的计时噪声会“淹没“比较代码,导致2.4节表驱动法相比其他方法效果不甚显著。同时考虑到表驱动法其实无需调用opendir/closedir函数,故执行效率可进一步提高。
本文给出的表驱动法适用于如下场景:
在按照时空顺序依次创建的若干对象中,查找符合指定时空规则的某个对象(如第N个最老对象),而不关心对象内部信息。
原文:http://www.cnblogs.com/clover-toeic/p/3737283.html