Javascript垃圾回收机制

简介

JS自带一套内存管理引擎,负责创建对象、销毁对象,以及垃圾回收。这期探讨一下垃圾回收机制。垃圾回收机制主要是由一个叫垃圾收集器(garbage collector,简称GC)的后台进程负责监控、清理对象,并及时回收空闲内存。

可达性(Reachability)

GC的最主要职责是监控数据的可达性(reachability);哪些数据是所谓的可达的呢?

  1. 所有显示调用,被称为,包括

    • 全局对象
    • 正被调用的函数的局部变量和参数
    • 相关嵌套函数里的变量和参数
    • 其他(引擎内部调用的一些变量)
  2. 所有从根引用或引用链访问的对象

举个简单的例子

let user = {
    name: 'Onion'
}

这里全局变量user指向内存里的对象{name: 'Onion'},我们称其为引用。这时对象Onion(以下均以名字简称)是所谓可达的

user reference

将user置为null后,引用丢失,Onion对象就变成不可达了。最终GC会将它从内存中清除。

user = null
unreachable

再举一个复杂一点的例子:

function marry(man, woman) {
  woman.husband = man;
  man.wife = woman;

  return {
    father: man,
    mother: woman,
  }
}

let family = marry({
  name: "Onion"
}, {
  name: "Garlic"
});

如图,现阶段所有对象都是可达的。

family reachable

现在我们删除一些对Onion的引用

delete family.father
delete family.mother.husband

如图,尽管Onion还有对Garlic的引用,但是它本身已不可达,所以很快就会被GC发现并回收。

onion clean

回收算法

最基本的垃圾回收算法被称为标记清除法(mark-and-sweep)。有这么几步:

  1. GC标记所有的变量

    mark root
  2. 访问所有变量的引用,并标记它们

    mark reference
  3. 标记所有引用链上的对象,已标记的对象不再被访问

    mark reference chain
  4. 最后删除所有未被标记的对象(:并非未被引用的对象,如图右)

    sweep unreachable

现代的GC引擎自然比这个复杂得多,很多优化手段早已被用到各大厂家中,比如V8的分代回收(Generational collection)、增量回收(Incremental collection)、空闲时回收(Idle-time collection)等等。不过,这些手段已超出了本文的范畴,不再深入探讨。

内存泄漏

内存泄漏指申请的内存一直得不到释放,GC回收不了。一般在项目中就是,你创建的对象一直保存在内存中,可达但你把它的引用地址搞丢了结果没法操作它,而GC又不会回收这块内存。内存泄漏的危害就是堆积耗尽系统所有内存。

常见的有这么几种泄漏方式:

  1. 意外的全局变量

    function foo() {
        bar = "等价于创建global变量window.bar";
    }
    
  2. 忘记清空计时器

    let someResource = {...};
    setInterval(function cb() {
        let node = document.getElementById('Node');
        if(node) {
            // 若不清空计时器,node和someResource将长期驻留内存
            node.innerHTML = JSON.stringify(someResource);
        }
    }, 1000);
    
  3. 闭包里的循环引用

    
    function assignHandler(){
        let element = $('id');
        let id = elment.id; // 引用element变量id
    
        element.onclick = function(){
            alert(id); // 引用assignHandler变量id
        };
    }
    
  4. 其他

    在ie等老旧浏览器里还有许多匪夷所思的内存泄漏,比如自动类型装箱转换,一些不经意的DOM操作,甚至闭包本身就会泄漏;这类泄漏需要专人特别关注,这里不再一一赘述了。

小结

今天简单接受了一下Javascript的GC机制,由于功力有限我只能浅尝则止。不过还是有几点概念性的总结:

  1. GC机制是自动完成的,但我们可以强制启动它,或是关闭它。
  2. 只要是可达的,对象就会常驻内存,所以需要特别注意内存泄漏问题
  3. 引用与可达的是不一样的,有些引用链可能根本无法在内存中驻留

推荐阅读更多精彩内容

  • 什么是垃圾回收机制? 和java,c#一样,javascript也有垃圾回收的机制,比如说c++和c就没有垃圾回收...
    我向你奔阅读 346评论 0 1
  • 为什么需要垃圾回收 由于字符串、对象和数组没有固定大小,只有当他们的大小已知时,才能对他们进行动态的存储分配。Ja...
    宇cccc阅读 815评论 1 0
  • 1.什么是垃圾回收? 垃圾回收(Garbage Collection)是Java虚拟机(JVM)垃圾回收器提供...
    简欲明心阅读 79,101评论 17 306
  • 和C#、Java一样JavaScript有自动垃圾回收机制,也就是说执行环境会负责管理代码执行过程中使用的内存,在...
    ConRon阅读 175评论 0 0
  • 复盘刚刚过去的2017年职场,可谓“高开、震荡、低走”。 年初的时候,我们的创业团队在激情与梦想中顺利完成了第一轮...
    黄樟阅读 223评论 0 5
  • 接到小自班张辉同学要求采访的橄榄枝,让我激动不已,因为张辉同学的文章也是我很喜欢的,高产,内容广泛,文字美丽,她在...
    诸慧的身心园地阅读 113评论 1 1
  • 上午,同事一大姐说,小白你有没有听你跟别人说话的语气,我脑袋一懵,想肯定是哪儿又做的不对了。她说你很善良...
    木兮日记阅读 111评论 0 1