Objective-C 类的本质

Objective-C (以下简称 OC )是一门动态性强的编程语言,OC 的动态性是基于 Runtime 来实现的,Runtime 系统是由 C\C++\汇编语言 编写的,提供的 API 基本都是 C 语言的。这里我们从苹果提供的 Runtime 代码来探究类的本质。

runtime 源码地址

legacy 版本

OCruntime 分为两个版本.一个是 legacy 版本,一个是 modern 版本。相信很多读者都见过下面这段代表 OC 类结构的代码:

struct objc_class {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;

#if !__OBJC2__
    Class _Nullable super_class                              OBJC2_UNAVAILABLE;
    const char * _Nonnull name                               OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list * _Nullable ivars                  OBJC2_UNAVAILABLE;
    struct objc_method_list * _Nullable * _Nullable methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache * _Nonnull cache                       OBJC2_UNAVAILABLE;
    struct objc_protocol_list * _Nullable protocols          OBJC2_UNAVAILABLE;
#endif

} OBJC2_UNAVAILABLE;

其实这段代码就是 legacy 版本 已经在 2006 年的 WWDC 大会上发布 Objective-C 2.0 后弃用了, OBJC2_UNAVAILABLE 标记的内容已经不再使用,那么现在的结构是什么呢?

对象

OC 中,每一个对象都是类的实例,先直接来看源码中的结构:

struct objc_object {
private:
    isa_t isa;
    // ...
}

代表对象的结构中只有一个 isa 的成员变量,在 arm64 架构下,系统对 isa 进行了优化,它不光存着地址信息,还存着其他信息。因此对象的本质就是包含了一个私有成员变量 isa 的结构体,而 isa 存着的地址就指向着对象所属的类。不同的对象有不同的成员变量,编译后,每个对象的结构体也会存着自己的成员变量的

使用命令获取编译后的代码 -sdk iphoneos clang -arch arm64 -rewrite-objc Coder.m

@interface Coder : Person
@property (nonatomic, copy) NSString *name;
@end
    
// 编译后查看 `Coder` 的实现
struct NSObject_IMPL {
    Class isa;
};

struct Coder_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    NSString * _Nonnull _name;
};

之所以成员变量的值存在对象中,这个也很好理解,每个对象肯定是独立存在的,都需要拥有自己的变量值。而变量名称和方法等等存在什么地方呢,就是类了!

类存着成员变量的类型,方法等等,源码如下:

struct objc_class : objc_object {
    // Class ISA;
    Class superclass;
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags

    class_rw_t *data() { 
        return bits.data();
    }
    // 省略...
}

首先可以看到的一点是 objc_class 继承了 objc_object,因此其实 OC 中的类也可以理解为一种对象,称之为类对象,在 legacy 版本中,对象的结构体中只有一个 isa 指针,指向它的类对象,而类对象中也有一个 isa 指针,指向它的元类。modern 版本使用继承后,类对象的结构体就继承了这个优化后的 isa 变量。但对比两个版本,会发现 modern 版本中除了superclass&cache ,其余的很多变量不在了,并多了一个 bits 变量。

struct class_data_bits_t {
    uintptr_t bits;
    
    class_rw_t* data() {
        return (class_rw_t *)(bits & FAST_DATA_MASK);
    }
    // ...
}

这个结构体里面是通过一个位运算获取的指向 class_rw_t 的指针,可见 bits 存着 class_rw_t 结构体的指针和一些其他信息。然后把目光转到 class_rw_t 上:

'rw' 和 ro' 分别表示 'readwrite' 和 'readonly'

struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro;

    method_array_t methods;
    property_array_t properties;
    protocol_array_t protocols;
    // ...
}

可以看到原先 legacy 版本中的方法、属性和协议列表就存在这个里面,这几个列表可以理解为是二维数组,是可读可写的,包含了类的初始内容、分类的内容,二维数组方便增加。 而这里又有一个 class_ro_t :

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
    // ....
    const char * name;
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars;
    // ....
};

class_ro_t 里面的 baseMethodList、baseProtocols、ivars、baseProperties 可以理解为是一维数组,是只读的,包含了类的初始内容。

从这里我们也能看出分类不能动态添加成员变量到类对象的原因,分类是通过 runtime 加载的,这时候类结构已经确定下来了,并且这里保存成员变量的内存是只读的。

元类

上面已经提到,类对象的 isa 中储存的地址指向的就算类对象的类,称之为元类,元类储存着对象方法。也就是说实例方法是储存在类中的,类方法是存储在元类中的。用一个经典的图来表示对象、类和元类的关系。

object_model.png

图中已经很好的阐述了三者之间的关系,不过这里需要强调两点。

  • 元类的 isa 指向的是基类的元类。
  • 基类的元类的 superclass 指向的是基类

这两个点很容易被忽略,在一些面试题中经常出现。

参考

Objective-C 对象模型

推荐阅读更多精彩内容