初识Mach-O文件

详细版本 https://www.yuque.com/docs/share/077aaf76-0fe6-47da-a7c9-d2af0c4b4e3a?# 《初识Mach-O 文件》

何为Mach-O文件?

Mach-O为Mach Object文件格式的缩写,它是一种用于可执行文件,目标代码动态库内核转储的档案格式,mac和iOS的可执行文件都是这种格式

当然了,他也有很多种存在的格式

  • 目标文件.o
  • 库文件:.a静态库文件;.dylib动态库文件;.framework系统级为动态库文件,自己创建的为静态库文件
  • 可执行文件及MDW.app内部的MDW文件(通用二进制文件)
  • .dyld动态链接器将依赖的动态库加载到内存
  • .dsym符号表

发展历史

macOS系统一路走来,支持的CPU及硬件平台都有了很大的变化,从早期的PowerPC平台,到后来的x86,再到现在主流的arm、x86-64平台。软件开发人员为了做到不同硬件平台的兼容性,如果需要为每一个平台编译一个可执行文件,这将是非常繁琐的。为了解决软件在多个硬件平台上的兼容性问题,苹果开发了一个通用的二进制文件格式(Universal Binary)。

Mach-O文件的内部结构

官方图片

image.png

文件分为三个部分:

1、Header:包含Mach-O文件的基本信息,字节顺序、架构类型、加载指令的数量等

2、Load commands:包含区域位置、符号表、动态符号表,加载Mach-O文件时使用这里的数据确定内存分布

3、Data:数据段segement,包含具体代码、常量、类、方法等,有多个segment,每个segment有0到多个section,每个段有一个虚拟地址映射到进程的地址空间

通过Mach-O文件 可以查看到里面的内容


image.png

Header

image.png
  • magic:魔数,确定是64位还是32位
  • cputype:cpu类型
  • cpusubtype:cpu子类型(arm64 armv7)
  • filetype:Mach-O支持多种文件类型,使用filetype来标注具体文件类型,比如可执行文件、目标文件等等
  • ncmds:加载命令(load commands)的数量
  • sizeofcmds:命令区域(load commands)总的字节大小
  • flags:标识二进制文件所支持的功能,主要与系统的加载、链接有关

Load commands

image.png
  • LC_SEGMENT_64:将文件中的段映射到进程地址空间中
  • LC_DYLD_INFO_ONLY:动态链接相关信息
  • LC_SYMTAB:符号表信息,位置、偏移、数据个数,供dyld使用
  • LC_DYSYMTAB:动态符号表信息,供dyld使用
  • LC_LOAD_DYLINKER:链接器信息,记录使用那些链接器完成内核后序的加载工作
  • LC_UUID:Mach-O文件的唯一标识
  • LC_VERSION_MIN_MACOSX:支持最低操作系统版本
  • LC_SOURCE_VERSION:源代码的版本号
  • LC_MAIN:设置主线程的入口即栈大小
  • LC_LOAD_DYLIB:依赖库信息,dyld通过该命令去加载依赖库
  • LC_FUNCTION_STARTS:函数的起始地址表
  • LC_CODE_SIGNATURE:代码签名
image.png
  • sectname:是__text ,就是主程序代码
  • segname:该section所属的segment名,第一个是__TEXT
  • addr:当前section在内存中的起始位置
  • size:当前section所占内存大小
  • offset:当前section的文件偏移
  • align:字节大小对齐
  • reloff:重定位入口的文件偏移,0
  • nreloc:需要重定位的入口数量,0
  • flags:包含section的type和attributes
  • reserved1、reserved2预留字段

Data

Data区域由Segment段和Section节组成

Segment

segment主要有__TEXT和__DATA组成

__text:是主程序代码
__stubs、__stub_helper:是动态链接的桩
__cstring:程序中c语言字符串
__const:常量
image.png
image.png

Section
在 Segment 里面会包含不同的 section ,其结构如下

struct section_64 { /* for 64-bit architectures */
    char        sectname[16];   /* name of this section */
    char        segname[16];    /* segment this section goes in */
    uint64_t    addr;       /* memory address of this section */
    uint64_t    size;       /* size in bytes of this section */
    uint32_t    offset;     /* file offset of this section */
    uint32_t    align;      /* section alignment (power of 2) */
    uint32_t    reloff;     /* file offset of relocation entries */
    uint32_t    nreloc;     /* number of relocation entries */
    uint32_t    flags;      /* flags (section type and attributes)*/
    uint32_t    reserved1;  /* reserved (for offset or index) */
    uint32_t    reserved2;  /* reserved (for count or sizeof) */
    uint32_t    reserved3;  /* reserved */
};

sectname: section 的名字
segname: segment 的名字
addr: 映射到虚拟地址的偏移
size: section 的大小
offset: section 在当前架构中的偏移
align: section的字节对齐大小 n
reloff: 重定位入口的文件偏移
nreloc: 重定位入口的个数
flags: section的类型与属性:
reserved: 保留位
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,026评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,655评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,726评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,204评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,558评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,731评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,944评论 2 314
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,698评论 0 203
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,438评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,633评论 2 247
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,125评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,444评论 3 255
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,137评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,103评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,888评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,772评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,669评论 2 271

推荐阅读更多精彩内容

  • 上一篇说到源码经过预处理、编译、汇编之后生成目标文件,这一章介绍一下iOS、Mac OS中目标文件的格式Mach-...
    Tenloy阅读 1,916评论 2 9
  • 最近尝试做符号分析及静态链接相关方面的探索,发现离不开对Mach-O文件结构的分析。所以这里整理一篇笔记,来梳理下...
    Super超人阅读 1,661评论 0 8
  • 熟悉Linux和windows开发的同学都知道,ELF是Linux下可执行文件的格式,PE32/PE32+是win...
    Klaus_J阅读 3,765评论 1 10
  • 前文讲解了dyld加载Mach-O的用户态过程,大家都知道Mach-O代表的是苹果系统的可执行文件,那你们了解Ma...
    佛系编程阅读 1,765评论 0 2
  • 1. 概述 在Mac的开发中, 有没有想过当我们点击可执行文件之后,Mac究竟做了什么事情才让我们的程序运行起来?...
    大成小栈阅读 788评论 0 7