编译器相关的文主要是 luac.c 。
看一下它的内容:
int main(int argc, char* argv[]) { lua_State* L; Proto* f; int i=doargs(argc,argv); argc-=i; argv+=i; if (argc<=0) usage("no input files given",NULL); L=lua_open(); luaB_opentests(L); for (i=0; i<argc; i++) { const char* filename=IS("-") ? NULL : argv[i]; if (luaL_loadfile(L,filename)!=0) fatal(lua_tostring(L,-1)); } f=combine(L,argc); if (listing) luaU_print(f); if (dumping) { FILE* D=fopen(output,"wb"); if (D==NULL) cannot(output,"open","out"); if (stripping) strip(L,f); luaU_dump(L,f,writer,D); if (ferror(D)) cannot(output,"write","out"); fclose(D); } lua_close(L); return 0; }
程序一上来先分析命令行的输入参数,剩下的命令行参数都认为是输入文件。
for 循环处理剩下的命令行参数,如果参数为减号 "-",则把标准输入作为文件,此时文件名为 NULL。
对文件调用 luaL_loadfile 来进行编译,如果编译出错,则 fatal。
f=combine(L,argc); 把所有的编译后的 Proto 整合到一起。
luaB_opentests 这个是测试用的,不用管它。
if (listing) luaU_print(f); 如果需要列出编译后的字节码,则打印字节码内容。
if (dumping) 如果需要保存字节码,则写编译后的字节码及程序运行的环境到文件。
分别看下程序中调用的函数
static int doargs(int argc, char* argv[]) { int i; if (argv[0]!=NULL && *argv[0]!=0) progname=argv[0]; for (i=1; i<argc; i++) { if (*argv[i]!=‘-‘) /* end of options; keep it */ break; else if (IS("--")) /* end of options; skip it */ { ++i; break; } else if (IS("-")) /* end of options; use stdin */ return i; else if (IS("-l")) /* list */ listing=1; else if (IS("-o")) /* output file */ { output=argv[++i]; if (output==NULL || *output==0) usage("`-o‘ needs argument",NULL); } else if (IS("-p")) /* parse only */ dumping=0; else if (IS("-s")) /* strip debug information */ stripping=1; else if (IS("-v")) /* show version */ { printf("%s %s\n",LUA_VERSION,LUA_COPYRIGHT); if (argc==2) exit(EXIT_SUCCESS); } else /* unknown option */ usage("unrecognized option `%s‘",argv[i]); } if (i==argc && (listing || !dumping)) { dumping=0; argv[--i]=Output; } return i; }
程序一上来就把 progname 赋值为编译器执行程序 argv[0],这个是可执行程序的带路径的展示。
之后就是各种参数的分析。
如果对参数的意义不太明确的话,可以看 usage
static void usage(const char* message, const char* arg) { if (message!=NULL) { fprintf(stderr,"%s: ",progname); fprintf(stderr,message,arg); fprintf(stderr,"\n"); } fprintf(stderr, "usage: %s [options] [filenames]. Available options are:\n" " - process stdin\n" " -l list\n" " -o name output to file `name‘ (default is \"" OUTPUT "\")\n" " -p parse only\n" " -s strip debug information\n" " -v show version information\n" " -- stop handling options\n", progname); exit(EXIT_FAILURE); }
它会打印各种参数的意义。
static void fatal(const char* message) { fprintf(stderr,"%s: %s\n",progname,message); exit(EXIT_FAILURE); }
打印出错信息并退出。
static void cannot(const char* name, const char* what, const char* mode) { fprintf(stderr,"%s: cannot %s %sput file ",progname,what,mode); perror(name); exit(EXIT_FAILURE); }
打印出错信息,带简单的原因说明,出错退出。
在 dumping 时会调用到它。
static Proto* toproto(lua_State* L, int i) { const Closure* c=(const Closure*)lua_topointer(L,i); return c->l.p; }
把栈的指定位置元素转换为 Closure 指针,返回其中的函数原型 Proto。
static Proto* combine(lua_State* L, int n) { if (n==1) return toproto(L,-1); else { int i,pc=0; Proto* f=luaF_newproto(L); f->source=luaS_newliteral(L,"=(" PROGNAME ")"); f->maxstacksize=1; f->p=luaM_newvector(L,n,Proto*); f->sizep=n; f->sizecode=2*n+1; f->code=luaM_newvector(L,f->sizecode,Instruction); for (i=0; i<n; i++) { f->p[i]=toproto(L,i-n); f->code[pc++]=CREATE_ABx(OP_CLOSURE,0,i); f->code[pc++]=CREATE_ABC(OP_CALL,0,1,1); } f->code[pc++]=CREATE_ABC(OP_RETURN,0,1,0); return f; } }
把几个函数原型整合,每个 Lua 文件会被编译成一个函数原型。
这里对每个函数原型添加调用返回指令。
static void strip(lua_State* L, Proto* f) { int i,n=f->sizep; luaM_freearray(L, f->lineinfo, f->sizelineinfo, int); luaM_freearray(L, f->locvars, f->sizelocvars, struct LocVar); luaM_freearray(L, f->upvalues, f->sizeupvalues, TString *); f->lineinfo=NULL; f->sizelineinfo=0; f->locvars=NULL; f->sizelocvars=0; f->upvalues=NULL; f->sizeupvalues=0; f->source=luaS_newliteral(L,"=(none)"); for (i=0; i<n; i++) strip(L,f->p[i]); }
删除调试相关信息,包括行号,局部变量,upvalue
static int writer(lua_State* L, const void* p, size_t size, void* u) { UNUSED(L); return fwrite(p,size,1,(FILE*)u)==1; }
写数据块儿。
原文:http://my.oschina.net/xhan/blog/499300