四、JavaScript内存管理和闭包

2022/7/27 JS高级js内存管理V8垃圾回收机制引用计数标记清除闭包闭包引起内存泄露V8内部优化

# 1、JavaScript的内存管理

# 1.1.认识内存管理

  • 不管什么样的编程语言,在代码的执行过程中都是需要给它分配内存的,不同的是:某些编程语言需要我们自己手动的管理内存,某些编程语言会可以自动帮助我们管理内存:

  • 不管以什么样的方式来管理内存,内存的管理都会有如下的生命周期:

    • 第一步:分配申请你需要的内存(申请);
    • 第二步:使用分配的内存(存放一些东西,比如对象等);
    • 第三步:不需要使用时,对其进行释放;
  • 不同的编程语言对于第一步和第三步会有不同的实现:

    • 手动管理内存:比如C、C++,包括早期的OC,都是需要手动来管理内存的申请和释放的(malloc和free函数);
    • 自动管理内存:比如Java、JavaScript、Python、Swift、Dart等,它们有自动帮助我们管理内存;
  • 对于开发者来说,JavaScript 的内存管理是自动的、无形的。

    • 我们创建的原始值、对象、函数……这一切都会占用内存;
    • 但是我们并不需要手动来对它们进行管理,JavaScript引擎会帮助我们处理好它;

# 1.2.JavaScript的内存管理

  • JavaScript会在定义数据时为我们分配内存。
  • 但是内存分配方式是一样的吗?
    • JS对于原始数据类型内存的分配会在执行时,
      • 直接在栈空间进行分配;
    • JS对于复杂数据类型内存的分配会在堆内存中开辟一块空间,并且将这块空间的指针(即内存地址)作为返回值 给变量进行引用;

vpSjjU.png

# 2、V8引擎的垃圾回收(GC)机制

# 2.1.JavaScript的垃圾回收

  • 因为内存的大小是有限的,所以当内存不再需要的时候,我们需要对其进行释放,以便腾出更多的内存空间。

  • 在手动管理内存的语言中,我们需要通过一些方式自己来释放不再需要的内存,比如free函数:

    • 但是这种管理的方式其实非常的低效,影响我们编写逻辑的代码的效率;
    • 并且这种方式对开发者的要求也很高,并且一不小心就会产生内存泄露;
  • 所以大部分现代的编程语言都是有自己的垃圾回收机制:

    • 垃圾回收的英文是Garbage Collection,简称GC;
    • 对于那些不再使用的对象,我们都称之为是垃圾,它需要被回收,以释放更多的内存空间;
    • 而我们的语言运行环境,比如Java的运行环境JVM,JavaScript的运行环境js引擎都会内存 垃圾回收器;
    • 垃圾回收器我们也会简称为GC,所以在很多地方你看到GC其实指的是垃圾回收器;
  • 但是这里又出现了另外一个很关键的问题:GC怎么知道哪些对象是不再使用的呢?

    • 这里就要用到GC的实现以及对应的算法;

# 2.2.常见的GC算法 – 引用计数(Reference counting)

  • 引用计数:

    • 当一个对象有一个引用指向它时,那么这个对象的引用就+1;
    • 当一个对象的引用为0时,这个对象就可以被销毁掉;
  • 这个算法有一个很大的弊端就是会产生循环引用;

vpCtts.png

# 2.3.常见的GC算法 – 标记清除(mark-Sweep)

  • 标记清除:
    • 标记清除的核心思路是可达性(Reachability)
    • 这个算法是设置一个根对象(root object),垃圾回收器会定期从这个根开始,找所有从根开始有引用到的对象,对于哪些没有引用到的对象,就认为是不可用的对象;
    • 这个算法可以很好的解决循环引用的问题;

vpCwcV.png

# 2.4.常见的GC算法 – 其他算法优化补充

  • JS引擎比较广泛的采用的就是可达性中的标记清除算法,当然类似于V8引擎为了进行更好的优化,它在算法的实现细节上也会结合一些其他的算法。

  • 标记整理(Mark-Compact) 和“标记-清除”相似;

    • 不同的是,回收期间同时会将保留的存储对象搬运汇集到连续的内存空间,从而整合空闲空间,避免内存碎片化;
  • 分代收集(Generational collection)—— 对象被分成两组:“新的”和“旧的”。

    • 许多对象出现,完成它们的工作并很快死去,它们可以很快被清理;
    • 那些长期存活的对象会变得“老旧”,而且被检查的频次也会减少;
  • 增量收集(Incremental collection)

    • 如果有许多对象,并且我们试图一次遍历并标记整个对象集,则可能需要一些时间,并在执行过程中带来明显的延迟。
    • 所以引擎试图将垃圾收集工作分成几部分来做,然后将这几部分会逐一进行处理,这样会有许多微小的延迟而不是一个大的延迟;
  • 闲时收集(Idle-time collection)

    • 垃圾收集器只会在 CPU 空闲时尝试运行,以减少可能对代码执行的影响。

# 2.5.V8引擎详细的内存图

  • 事实上,V8引擎为了提供内存的管理效率,对内存进行非常详细的划分:

vpC6AJ.png

# 3、JavaScript闭包

# 3.1.JavaScript的函数式编程

  • 在前面我们说过,JavaScript是支持函数式编程的

  • 在JavaScript中,函数是非常重要的,并且是一等公民:

    • 那么就意味着函数的使用是非常灵活的;
    • 函数可以作为另外一个函数的参数,也可以作为另外一个函数的返回值来使用;
  • 所以JavaScript存在很多的高阶函数:

    • 自己编写高阶函数
    • 使用内置的高阶函数;如:find,reduce,map,filter,findIndex等
  • 目前在vue3+react开发中,也都在趋向于函数式编程:

    • vue3 composition api: setup函数 -> 代码(函数hook,定义函数);
    • react:class -> function -> hooks

# 3.2.闭包的定义

  • 闭包是JavaScript中一个非常容易让人迷惑的知识点:

  • 这里先来看一下闭包的定义,分成两个:在计算机科学中和在JavaScript中。

  • 在计算机科学中对闭包的定义(维基百科):

    • 闭包(英语:Closure),又称词法闭包(Lexical Closure)或函数闭包(function closures);
    • 是在支持 头等函数 的编程语言中,实现词法绑定的一种技术;
    • 闭包在实现上是一个结构体,它存储了一个函数和一个关联的环境(相当于一个符号查找表);
    • 闭包跟函数最大的区别在于,当捕捉闭包的时候,它的 自由变量 会在捕捉时被确定,这样即使脱离了捕捉时的上下文,它也能照常运行;
  • 闭包的概念出现于60年代,最早实现闭包的程序是 Scheme,那么我们就可以理解为什么JavaScript中有闭包: 因为JavaScript中有大量的设计是来源于Scheme的;

  • 我们再来看一下MDN对JavaScript闭包的解释:

    • 一个函数和对其周围状态(lexical environment,词法环境)的引用捆绑在一起(或者说函数被引用包围),这样的组合就是闭包closure);
    • 也就是说,闭包让你可以在一个内层函数中访问到其外层函数的作用域;
    • 在 JavaScript 中,每当创建一个函数,闭包就会在函数创建的同时被创建出来;
  • 那么我的理解和总结:

    • 一个普通的函数function,如果它可以访问外层作用域的自由变量,那么这个函数和周围环境就是一个闭包;
    • 从广义的角度来说:JavaScript中的函数都是闭包;
    • 从狭义的角度来说:JavaScript中一个函数,如果访问了外层作用域的变量,那么它是一个闭包;

# 4、通过js代码执行过程来了解闭包是如何引起内存泄露的

# 4.1.闭包引起内存泄露的代码案例

# 如果我们编写了如下的代码,它一定是形成了闭包的:

  • 那么在执行过程中,闭包为什么会导致内存泄露呢?
  • 我们以下面代码为例,来看看它的执行过程,进行理解吧
var message = 'global'//1
function createAdder(count) {//2
  return function (num) {//3
    return count + num//4
  }//5
}//6
var adder5 = createAdder(5)//7
var adder8 = createAdder(8)//8
console.log(adder5(5))//9
console.log(adder8(2))//10

//解决闭包引起的内存泄露问题
adder5 = null
adder8 = null
1
2
3
4
5
6
7
8
9
10
11
12
13
14

# 4.2.初始化全局对象(GO)

  • 初始化全局对象(GO),执行全局代码前创建GEC,并将GO关联到VO,然后将GEC加入ECS中:

vptnlq.png

  • 下面开始执行全局代码,从上往下依次给全局属性赋值:

# 4.3.执行第1行代码

  • 给message属性赋值为global;

vptKXV.png

# 4.4.执行第7行代码前,对createAdder函数进行预解析

# 执行到createAdder函数调用,准备执行createAdder函数前,创建createAdder函数的AO:

vpU9Z8.png

# 4.5.执行第7行代码 和 执行完第7行代码

# 创建createAdder函数的FEC,并加入到ECS中,然后开始执行createAdder函数体内的代码,返回一个匿名函数;并进行赋值;执行完第7行代码:会将前面 创建的函数执行上下文FEC 弹出 执行上下文栈ECS

vpa178.png

# 4.6.执行第8行代码前 和 执行第8行代码 和 执行完第8行代码

# 执行第8行代码前:执行到createAdder函数调用,准备执行createAdder函数前,创建createAdder函数的AO;

# 执行第8行代码:创建createAdder函数的FEC,并加入到ECS中,然后开始执行createAdder函数体内的代码,返回一个匿名函数;并进行赋值;

# 执行完第8行代码:会将前面 创建的函数执行上下文FEC 弹出 执行上下文栈ECS

vpdAuq.png

# 4.7.执行第9行代码前

# 执行到adder5函数调用,准备执行adder5函数前,创建adder5函数的AO:

vpw76A.png

# 4.8.执行第9行代码 和 执行完第9行代码

# 创建adder5函数的FEC,并加入到ECS中,然后开始执行adder5函数体内的代码,返回一个和值,并进行console.log打印;

# 执行完第9行代码:会将前面 创建的函数执行上下文FEC 弹出 执行上下文栈ECS;adder5函数的AO对象被回收

vp0Qn1.png

  • 由于第10行代码跟第9行代码的执行过程类似,这里就不再进行图解了

# 4.9.闭包引起的内存泄露情况分析

  • 7,8行代码createAdder函数执行完毕,正常情况下我们对应函数的AO对象会被释放;

  • 但是因为在0xb00、0xc00的函数中有作用域引用分别指向了这个两个AO对象,所以它不会被释放掉;从而引起了内存泄露

  • 那么我们为什么经常会说闭包是有内存泄露的呢?

    • 在上面的案例中,如果后续我们不再使用adder5、adder8函数了,那么该函数对象应该要被销毁掉,并且其引用着的父作用域AO也应该被销毁掉;
    • 但是目前因为在全局作用域下adder5变量对0xb00的函数对象有引用,而0xb00(匿名函数)的作用域 对 createAdder函数AO对象(0x200)有引用,所以最终会造成这些内存都是无法被释放的;(adder8同理)
    • 所以我们经常说的闭包会造成内存泄露,其实就是刚才的引用链中的所有对象都是无法释放的;
  • 那么,怎么解决这个问题呢?

    • 当将adder5和adder8设置为null时,就不再对函数对象0xb00和0xc00有引用,那么对应的AO对象0x200和0x300也就不可达了;
    • 在GC的下一次检测中,它们就会被销毁掉;(标记清除)

# 5、闭包的内存泄漏测试

  • 每次点击下面生成10000个数组,浏览器占用的内存就会增加4mb左右;
  • 具体我们可以根据浏览器生成快照功能来进行查看

vphxQx.png

<button class="box">生成10000个数组</button>
<button class="bar">全部销毁</button>
<script>
  function foo() {
    var arr = Array(1024*1024).fill(1)//4MB
    function bar() {
      console.log(arr)
    }
    return bar 
  }

  var totalArray = []
  var boxEl = document.querySelector('.box')
  var barEl = document.querySelector('.bar')
  boxEl.onclick = function() {
    totalArray.push(foo())
    console.log(totalArray.length)
  }
  barEl.onclick = function() {
    totalArray = []
  }
</script>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

# 6、AO不使用的属性优化

  • 我们来研究一个问题:AO对象不会被销毁时,是否里面的所有属性都不会被释放?(会被释放v8引擎会对此进行优化)
    • 下面这段代码中age属于闭包的父作用域里面的变量;
    • 我们知道形成闭包之后count一定不会被销毁掉,那么age是否会被销毁掉呢?
    • 这里我打上了断点,我们可以在浏览器上看看结果;

vp4FFH.png

最后更新时间: 2022/07/28, 18:11:40
彩虹
周杰伦