24、启动优化一

虚拟内存 && 物理内存

由于早期的数据访问是直接通过物理地址访问的,会出现以下两种问题:
1、内存不够用
2、内存数据的安全问题

内存不够用的方案:虚拟内存

针对问题1:

我们在进程与物理内存之前增加一个中间层,这个中间层就是所谓的 虚拟内存 ,主要用于解决当多个进程同时存在时,对物理内存的管理。提高了cpu的利用率 ,使多个进程可以同时,按需加载。所以虚拟内存本质就是 一张虚拟地址 和物理地址对应关系的映射表

  • 每个进程都有一个独立的虚拟内存,其地址都是从开始,大小是4G固定的,每个虚拟内存又会划出为一个一个的(页的大小 在iOS中是16KB,其他的是4KB),每次加载都是以页为单位加载的,进程间是无法相互访问的,保证了进程间数据的安全性。

  • 一个进程中,只有部分功能是活跃的,所以只需要 将进程中活跃的部分放入物理内存,避免物理内存的浪费

  • 当CPU需要访问数据时,首先访问虚拟内存,然后通过虚拟内存取去寻址,即可以理解为在表中找对应的物理地址,然后对相应的物理地址进行访问

  • 如果在访问时,虚拟地址的内容未加载到物理内存,会发生 缺页异常,将当前进程阻塞掉,此时需要先将数据载入到物理内存,然后再去寻址,进行读取。这样就避免了内存浪费

ASLR技术 (内存数据安全问题处理)

在上面解释的虚拟内存中,我们提及到了虚拟内存的起始地址与大小都是固定的,这意味着,当我们访问时,其数据的地址也是固定的,这会导致我们的数据非常容易被破解,苹果为了解决这个问题,在iOS4.3引入了ASLR技术

ALSR:地址空间配置随机加载 是一种 针对缓冲区溢出安全保护技术 ,通过对堆、栈、共享库映射等线性区布局的随机化,通过增加攻击者预测目的地址的难度,防止攻击者直接定位攻击代码位置,达到阻止溢出攻击目的的一种技术

其目的的通过 利用随机方式配置数据地址空间,使某些敏感数据(APP登录注册、支付相关代码)配置到一个恶意程序无法事先获知的地址,令攻击者难以进行攻击。

由于ASLR的存在,导致可执行文件和动态链接库在虚拟内存中加载地址每次启动都不固定,所以需要在编译时来修复镜像中的资源指针,来指向正确的地址。即:正确的内存地址 = ASLR地址 + 偏移值

可执行文件

不同的操作系统,其可执行文件的格式页不同,系统内核将可执行峎见读取到内存,然后根据可执行文件的头签名 判断二进制文件的格式

image.png

其中PE、ELF、Mach-O 这三种可执行文件格式都是 COFF (Command file Formal)格式的变种,COFF的主要贡献时目标文件里面 引入“段”的机制,不同的目标文件可以拥有不同数量和不同类型的“段”

通用二进制文件

因为不同CPU平台 支持的指令不同,比如 arm64 和 x86,苹果中的通用二进制格式就是将多种框架的mach-O文件打包在一起,然后系统根据自己的CPU平台,选择合适的mach-O,所以 通用二进制格式 也 被称为 胖二进制格式

通用二进制格式的定义在<mach-o/fat.h>中,然后根据xnu->EXTERNAL_HEADERS ->mach-o 中找到该文件,通用二进制文件开始的Fat Header 是 fat_header 结构体,而Fat Archs 是表示通用二进制文件中有多少个Mach-O,单个Mach-O的描述是 通过fat_arch 结构体。

两个结构体的定义如下:

/*
 - magic:可以让系统内核读取该文件时知道是通用二进制文件
 - nfat_arch:表明下面有多个fat_arch结构体,即通用二进制文件包含多少个Mach-O
 */
struct fat_header {
    uint32_t    magic;      /* FAT_MAGIC */
    uint32_t    nfat_arch;  /* number of structs that follow */
};

/*
 fat_arch是描述Mach-O
 - cputype 和 cpusubtype:说明Mach-O适用的平台
 - offset(偏移)、size(大小)、align(页对齐)描述了Mach-O二进制位于通用二进制文件的位置
 */
struct fat_arch {
    cpu_type_t  cputype;    /* cpu specifier (int) */
    cpu_subtype_t   cpusubtype; /* machine specifier (int) */
    uint32_t    offset;     /* file offset to this object file */
    uint32_t    size;       /* size of this object file */
    uint32_t    align;      /* alignment as a power of 2 */
};

综上所述:

1、通用二进制文件是苹果公司提出的一种新的二进制文件的存储结构,可以同时存储多种架构的二进制指令,使CPU在读取该二进制文件时 可以自动检测并选用合适的架构,以最理想的方式进行读取

2、由于通用二进制文件会同时存储多种框架,所以比单一架构的二进制文件大很多,会占用大量的磁盘空间,但由于系统会自动选择最合适的,不相关的架构代码不会占用内存空间,且执行效率高 了

Mach-O的合并与拆分

  • 查看当前Mach-O 的框架:lipo - info machO 文件

  • 合并:lipo - create Mach01 mach02 -output 输出文件路径

  • 拆分:lipo MachO文件 -thin 架构 -output 输出文件路径

Mach-O文件

mach-o文件 是 mach object 文件格式的缩写,它是用于可执行文件、动态库、目标代码的文件格式。作为a.out格式的替代,Mach-O格式 提供了更强的扩展性,以及更快的符号表信息访问速度

熟悉Mach-O 文件格式,有助于更好的理解苹果底层的运行机制,更好的掌握dyld加载mach-O的步骤。

查看Mach-O文件

如果想要查看具体的Mach—O文件信息,可以通过以下两种方式,推荐使用第二种方式,更直观

方法一:otool 终端命令:otool -l Mach-o文件名

推荐阅读更多精彩内容