第二章 编译和链接

2.1 被隐藏了的过程

  • ide一般将编译和链接的过程一步完成,通常将这种编译和链接合并到一起的过程叫构建
  • 从代码变成可执行文件,概括来说氛围4步:预处理、编译、汇编、链接

2.1.1 预编译

  • 预编译过程主要处理那些“#”开始的预编译指令,规则如下

    1."#define"删除,并展开所有的宏定义

    2.处理所有的条件预编译指令,比如“#if”,“#ifdef”,“#elif”,“#else”,“#endif”

    3.处理#include预编译指令,将包含的文件插入到该预编译指令的位置,这里过程会是递归进行,保证依赖的文件都会被加载进来

    4.删除所有注释

    5.添加行号以及文件名标识,ex:#2 ,以便编译时便一起产生调试用的行号信息,以及报错时显示行号

    6.保留所有# 编译器指令,因为编译器需要使用它们
  • 当无法判断宏定义是否正确或者头文件包含是否正确的时候,可以查看预编译后的文件来确定问题

2.1.2 编译

  • 将预处理完成的文件进行一系列词法分析、语法分析、语义分析以及优化后生成的汇编代码

2.1.3 汇编

  • 汇编器将汇编代码转变成机器可以执行的指令,每一个汇编语句机会对应一条机器指令
  • 经过预编译、编译和汇编直接输出的事目标文件,.o形式

2.2 编译器做了什么

  • 通俗理解是编译器将高级语言翻译成机器语言的一个工具

2.2.1 词法分析

  • 源代码程序被输入到扫描器,扫描器只进行词法分析,利用算法(有限状态机的算法)将源代码的字符序列分割成一系列记号(token)
  • 记号:关键字、标识符、字面量(包含数字、字符串等)和特殊符号(加号、等号),识别出来后将对应的token放对应的地方,ex:将标识符放符号表,将数字、字符串常量放文字表

2.2.2 语法分析

  • 将扫描器产生的记号进行语法分析,从而形成语法树,可以认为每一个;间隔的会组成一个语法树
  • 通俗理解为由语法分析器生成的语法树就是以表达式为节点的树
  • 在形成语法树的时候,符号的优先级也被确定下来了
  • 整个分析过程采用上下文无关语法,只针对一个分号进行分割,分析生成语法树

2.2.3 语义分析

  • 语义分析,由语义分析器完成
  • 编译器所能分析的语义是静态语义,即编译期可以确定的语义
  • 动态语义:只有在运行期才能确定的语义
  • 静态语义通常包括声明合类型的匹配,类型的额转换,要是发现类型不匹配,编译器会报错
  • 经过语义分析,整个语法树的每一个节点都会标记类型

2.2.4 中间语言生成

  • 有些编译期会在源代码级别进行优化
  • 优化通常不会在语法树上进行优化,是将整个语法树转换为中间代码上进行优化,ex:4+6有的时候直接用10代替
  • 中间代码可以理解为编译过程中的中间层,中间层之前的东西都是编译器前端完成,中间层之后的东西都是编译器后端完成

2.2.5 目标代码生成与优化

  • 编译器后端主要包括代码生成器,目标代码优化器
  • 编译过程:扫描代码-》语法分析-〉语义分析-》源代码优化-〉代码生成-》目标代码优化
  • 现代的编译器可以将源代码文件编译成一个未链接的目标文件,然后由链接器将这些目标文件链接成可执行文件

2.3 链接器年龄比编译器长

  • 当程序修改后,代码位置会被改动,这些位置都要重新计算,这种重新计算各个目标的地址过程叫重定位(在类似用纸记录二进制程序的时代)
  • 为了解决重定位的重复计算问题,发明了汇编,可以用符号来标记位置,这样相对纸条编程,不用关心实际的代码位置
  • 一个程序可以分为多个模块,模块之间的通信可以分为:函数调用和变量访问
  • 函数调用需要知道目标函数的地址,变量访问也需要知道目标变量的地址,合在一起可以总结为模块间的符号引用
  • 模块的拼接过程就叫链接

2.4 模块拼接--静态链接

  • 人们把源代码模块独立编译,然后按规则组装,这个组装的过程叫链接
  • 从原理上讲,链接的工作是把一些指令对其他符号地址的引用加以修正,a类用了b类中的函数进行调用,但是编译过程中并不知道b类中函数的地址,所以需要链接进行重定位之后,才能知道具体的地址
  • 链接过程主要包括地址和空间分配,符号决议,重定位等
  • 符号决议也叫符号绑定,地址绑定,

推荐阅读更多精彩内容