开源编译器 UCC 研究－工作流程

皮贝贝 posted @ 2009年9月15日 17:18 in 编译器 with tags ucc 编译器编译原理 , 6511 阅读

最近看 UCC 的代码，研究下编译器的工作原理。大学时候的编译原理知识也忘得差不多了，本来当初就学的不好。现在拿一个实例来研究下吧。

从用户接口来看，一个正常的流程是这个样子的：

ucc -o test.exe test.c

从一个 test.c 生成一个 test.exe.中间经历的步骤，从UCC源代码看，主要是这个流程：

1. 对 test.c 进行预处理。

这一步是 ucc 调用 vc 的cl进行的，结果生成 test.i 文件：

cl -nologo -u -D_WIN32 -D_M_IX86 -D_UCC -P test.c

2. 对test.i 进行编译处理。

这一步是调用自己的编译器 ucl 进行的，结果生成 test.asm 汇编文件：

ucl -ignore __declspec(deprecated),__declspec(noreturn),__inline,__fastcall -keyword __int64 -ext:.asm test.i

3. 对汇编文件 test.asm 进行编译

这一步是调用 vc 的汇编编译器 ml 进行的，结果生成 test.obj 文件：

ml -nologo -c -Cp -coff -Fotest.obj test.asm

4. 对 test.obj 和一些需要的lib 进行链接

这一步是调用 vc 的链接器 link 进行的，结果生成 test.exe 可执行文件：

link -nologo -subsystem:console -entry:mainCRTStartup -OUT:test.exe test.obj oldnames.lib libcmt.lib kernel32.lib

由上面看到，仅仅对 C源程序的纯编译是调用自己的 ucl 进行，其余都是调用VC进行。接下来看看 ucl 的工作流程：

1. 读入 test.i, 生成语法树，并进行语法检查

这一步是调用函数 ParseTranslationUnit() 函数进行，结果生成一个 AstTranslationUnit 类型的语法树( 暂且定名为 transUnit ）。

transUnit = ParseTranslationUnit(file);

2. 对 transUnit 进行语义检查

这一步是调用函数 CheckTranslationUnit() 函数进行，

CheckTranslationUnit(transUnit);

3. 将transUnit 翻译成中间代码

这一步是调用函数 Translate() 进行，

Translate(transUnit);

4. 通过 transUnit 生成汇编文件 test.asm

这一步是调用函数 EmitTranslationUnit() 进行，

EmitTranslationUnit(transUnit);

草贝星球's C++ Blog