周元-JavaScript的运行机制

# 周元-JavaScript的运行机制

# 进程与线程

进程：CPU分配资源的最小单位；包括：进行中的程序 + 进行中的程序所使用的内存和资源；

CPU可以有很多进程，我们的电脑每打开一个软件就会产生一个或多个进程；CPU给每个进程分配资源空间，但CPU资源固定，分出去越多，越卡，每个进程之间是相互独立的，CPU在运行一个进程时，其他的进程处于非运行状态，CPU使用 时间片轮转调度算法 来实现同时运行多个进程。

线程：CPU的调度的最小单位；线程是建立在进程的基础上的一次程序运行单位，通俗点解释线程就是程序中的一个执行流，一个进程可以有多个线程。

一个进程中只有一个执行流称作单线程，即程序执行时，所走的程序路径按照连续顺序排下来，前面的必须处理好，后面的才会执行。
一个进程中有多个执行流称作多线程，即在一个程序中可以同时运行多个不同的线程来执行不同的任务，也就是说允许单个程序创建多个并行执行的线程来完成各自的任务。

# 进程与线程的区别

进程是操作系统分配资源的最小单位，线程是程序执行的最小单位。

一个进程里可能包含多个线程，线程可以理解为是一个进程中代码的不同执行路线；
进程之间相互独立，但同一进程下的各个线程间共享程序的内存空间(包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号)；

程序：让线程执行不用的任务；

调度和切换：线程上下文切换比进程上下文切换要快得多

多进程

多进程指的是在同一个时间里，同一个计算机系统中如果允许两个或两个以上的进程处于运行状态。多进程带来的好处是明显的，比如大家可以在网易云听歌的同时打开编辑器敲代码，编辑器和网易云的进程之间不会相互干扰；

多线程

多线程是指程序中包含多个执行流，即在一个程序中可以同时运行多个不同的线程来执行不同的任务，也就是说允许单个程序创建多个并行执行的线程来完成各自的任务；

Q: JS为什么是单线程？

作为浏览器脚本语言，JavaScript的主要用途是与用户互动，以及操作DOM。这决定了它只能是单线程，否则会带来很复杂的同步问题。

如果是双线程或多线程，不符合JS设计语言的规范和目的；比如，双线程下，两条命令一个删除div，一个添加div，不知道该执行哪一个~

Web Worker

HTML5提出Web Worker标准，允许JavaScript脚本创建多个线程，但是子线程是完全受主线程控制的，而且不得操作DOM；可用于帮忙解决其他任务。所以，这个标准并没有改变JavaScript是单线程的本质。

# 浏览器

Chrome：每打开一个Tab页就会产生一个进程。

进程相互独立，避免某个Tab页崩掉影响其他Tab页~

浏览器进程

Brower进程：主进程，负责协调，主控，只有一个；负责界面显示，交互，页面管理等；
插件进程
GPU进程：只有一个，用于3D绘制，图形化渲染等
渲染进程（Render进程）：即浏览器内核，多线程；每个Tab页都有一个独立的进程；页面渲染，JS脚本执行，事件处理等；

# 渲染进程

页面的渲染，JS的执行，事件的循环，都在渲染进程内执行。

GPU的渲染线程：负责渲染浏览器界面，解析HTML，CSS，构建DOM树和RenderObject树，布局和绘制等；
- DOM Tree + CSSDOM => Rendering Tree;
- 重绘(Repaint)、回流(Reflow)
- 与JS的执行线程互斥，GUI更新会被保存在一个队列中等到JS引擎空闲时立即被执行
JS引擎线程：JS引擎线程就是JS内核，负责处理Javascript脚本程序(例如V8引擎)；
- <script>，JS引擎线程负责解析Javascript脚本，运行代码；defer: JS延迟执行，知道DOM渲染完成；async: 不会让脚本阻塞文档；
- 浏览器同时只能有一个JS引擎线程在运行JS程序，所以js是单线程运行的；一个Tab页(renderer进程)中无论什么时候都只有一个JS线程在运行JS程序；
- GUI渲染线程与JS引擎线程是互斥的，js引擎线程会阻塞GUI渲染线程；

例如浏览器渲染的时候遇到<script>标签，就会停止GUI的渲染，然后js引擎线程开始工作，执行里面的js代码，等js执行完毕，js引擎线程停止工作，GUI继续渲染下面的内容。所以如果js执行时间太长就会造成页面卡顿的情况；（所以有了defer 和 async标签）

事件触发线程：属于浏览器而不是JS引擎，用来控制事件循环，并且管理着一个事件队列(task queue)：onclick,methods...
- 当js执行碰到事件绑定和一些异步操作(如setTimeOut，也可来自浏览器内核的其他线程，如鼠标点击、AJAX异步请求等)，会走事件触发线程将对应的事件添加到对应的线程中(比如定时器操作，便把定时器事件添加到定时器线程)，等异步事件有了结果，便把他们的回调操作添加到事件队列，等待js引擎线程空闲时来处理；
- 当对应的事件符合触发条件被触发时，该线程会把事件添加到待处理队列的队尾，等待JS引擎的处理；
定时器触发线程：setInterval与setTimeout所在线程；通过单独线程来计时并触发定时(计时完毕后，添加到事件触发线程的事件队列中，等待JS引擎空闲后执行)，这个线程就是定时触发器线程，也叫定时器线程。
Http异步请求线程：XMLHttpRequest，当执行到一个http异步请求时，就把异步请求事件添加到异步请求线程，等http状态变化，再把回调函数添加到事件队列，等待js引擎线程来执行；

# 事件循环（Event Loop）

JS分为同步任务和异步任务。同步任务都在主线程(JS引擎线程)上执行，会形成一个执行栈。

JS引擎线程之外，事件触发线程管理着一个任务队列，只要异步任务有了运行结果，就在任务队列之中放一个事件回调。一旦执行栈中的所有同步任务执行完毕，系统就会读取任务队列，将可运行的异步任务(任务队列中的事件回调，只要任务队列中有事件回调，就说明可以执行)添加到执行栈中，开始执行。

一个例子：

let setTimeoutCallBack = function() {
  console.log('我是定时器回调');
};
let httpCallback = function() {
  console.log('我是http请求回调');
}

// 同步任务
console.log('我是同步任务1');

// 异步定时任务
setTimeout(setTimeoutCallBack,1000);

// 异步http请求任务
ajax.get('/info',httpCallback);

// 同步任务
console.log('我是同步任务2');

JS是按照顺序从上往下依次执行的；
首先，执行console.log('我是同步任务1')；
接着，执行到setTimeout时，会移交给定时器线程，通知定时器线程 1s 后将 setTimeoutCallBack 这个回调交给事件触发线程处理，在 1s 后事件触发线程会收到 setTimeoutCallBack 这个回调并把它加入到事件触发线程所管理的事件队列中等待执行；
接着，执行http请求，会移交给异步http请求线程发送网络请求；请求成功后将 httpCallback 这个回调交由事件触发线程处理，事件触发线程收到 httpCallback 这个回调后把它加入到事件触发线程所管理的事件队列中等待执行；
再接着执行console.log('我是同步任务2')；
至此主线程执行栈中执行完毕，JS引擎线程已经空闲；开始询问事件触发线程的事件队列中是否有需要执行的回调函数，如有则将事件队列中的回调事件加入执行栈中，开始执行回调；如果事件队列中没有回调，JS引擎线程会一直发起询问，直到有为止；

总结：

定时触发线程只管理定时器且只关注定时不关心结果，定时结束就把回调扔给事件触发线程；
异步http请求线程只管理http请求同样不关心结果，请求结束把回调扔给事件触发线程；
事件触发线程只关心异步回调入事件队列；
JS引擎线程只会执行执行栈中的事件，执行栈中的代码执行完毕，就会读取事件队列中的事件并添加到执行栈中继续执行；
反复执行，就是我们所谓的事件循环(Event Loop)；

# 宏任务（macrotask）

在ECMAScript中，macrotask也被称为task。

JS执行上下文执行的过程就是一个宏任务，每一个宏任务会从头到尾执行完毕，不会执行其他。

宏任务：JS线程同步执行，不能异步中断

宏任务 -> GUI渲染 -> 宏任务 -> ...

主代码块；
setTimeout，setInterval；
setImmediate () -Node；
requestAnimationFrame () -浏览器

# 微任务(microtask)

ES6新引入了Promise标准，同时浏览器实现上多了一个microtask微任务概念，在ECMAScript中，microtask也被称为jobs。

微任务可以理解成在当前宏任务执行后立即执行的任务。

当一个宏任务执行完，会在渲染前，将执行期间所产生的所有微任务都执行完.

宏任务 -> 微任务 -> GUI渲染 -> 宏任务 -> ...

process.nextTick () -Node；
Promise.then()；
catch；
finally；
Object.observe；
MutationObserver；

# 宏任务与微任务区别

一个例子：

document.body.style = 'background:blue'
console.log(1);
Promise.resolve().then(()=>{
    console.log(2);
    document.body.style = 'background:pink'
});
console.log(3);

输出 1 3 2 , 是因为 promise 对象的 then 方法的回调函数是异步执行，所以 2 最后输出;
页面的背景色直接变成粉色，没有经过蓝色的阶段，是因为，我们在宏任务中将背景设置为蓝色，但在进行渲染前执行了微任务，在微任务中将背景变成了粉色，然后才执行的渲染。

总结：

浏览器会先执行一个宏任务，紧接着执行当前执行栈产生的微任务，再进行渲染，然后再执行下一个宏任务；
微任务和宏任务不在一个任务队列!!!

例如setTimeout是一个宏任务，它的事件回调在宏任务队列，Promise.then()是一个微任务，它的事件回调在微任务队列，二者并不是一个任务队列；

Q: 微任务是如何产生的呢？

当执行到script脚本的时候，js引擎会为全局创建一个执行上下文，在该执行上下文中维护了一个微任务队列，当遇到微任务，就会把微任务回调放在微队列中，当所有的js代码执行完毕，在退出全局上下文之前引擎会去检查该队列，有回调就执行，没有就退出执行上下文，这也就是为什么微任务要早于宏任务.

# 完整的 Event Loop

整体的script(作为第一个宏任务)开始执行的时候，会把所有代码分为同步任务、异步任务两部分，同步任务会直接进入主线程依次执行，异步任务会再分为宏任务和微任务；
宏任务进入到Event Table中，并在里面注册回调函数，每当指定的事件完成时，Event Table会将这个函数移到Event Queue中；
微任务也会进入到另一个Event Table中，并在里面注册回调函数，每当指定的事件完成时，Event Table会将这个函数移到Event Queue中；
当主线程内的任务执行完毕，主线程为空时，会检查微任务的Event Queue，如果有任务，就全部执行，如果没有就执行下一个宏任务；
上述过程会不断重复，这就是Event Loop；

# Promise

new Promise(() => {}).then() 中，前面的 new Promise() 这一部分是一个构造函数，这是一个同步任务，后面的 .then() 才是一个异步微任务：

new Promise((resolve) => {
	console.log(1)
  resolve()
}).then(()=>{
	console.log(2)
})
console.log(3)
// 上面代码输出1 3 2

# async/await 函数

async/await本质上还是基于Promise的一些封装，而Promise是属于微任务的一种

setTimeout(() => console.log(4))

async function test() {
  console.log(1)
  await Promise.resolve()
  console.log(3)
}

test()

console.log(2)
// 输出1 2 3 4

# NodeJS中的运行机制

nodejs与浏览器的区别，就是nodejs的宏任务分好几种类型，而这好几种又有不同的任务队列，而不同的任务队列又有顺序区别，而微任务是穿插在每一种宏任务之间的。

Node会先执行所有类型为 timers 的 MacroTask，然后执行所有的 MicroTask(NextTick例外)；
进入 poll 阶段，执行几乎所有 MacroTask，然后执行所有的 MicroTask；
再执行所有类型为 check 的 MacroTask，然后执行所有的 MicroTask；
再执行所有类型为 close callbacks 的 MacroTask，然后执行所有的 MicroTask；
至此，完成一个 Tick，回到 timers 阶段，重复执行；

# 函数式编程

海鸥程序：

// 定义一个 海鸥 构造函数
function Flock (n) {
  this.seagulls = n;
};

// 定义 增加 方法
Flock.prototype.conjoin = function(other) {
  this.seagulls += other.seagulls;
  return this;
};

// 定义 乘 方法
Flock.prototype.breed = function(other) {
  this.seagulls = this.seagulls * other.seagulls;
  return this;
};

var flock_a = new Flock(4);
var flock_b = new Flock(2);
var flock_c = new Flock(0);

var result = flock_a.conjoin(flock_c).breed(flock_b).conjoin(flock_a.breed(flock_b)).seagulls;
//=> 32

// 期望：(4 + 0) * 2 + 4 * 2 = 16
// 实际：32  
// 因为原型方法返回this，flock_a 改变为 16 了

/**
 * 优化：
 */
var add = function(x, y) { return x + y };
var multiply = function(x, y) { return x * y };

var flock_a = 4;
var flock_b = 2;
var flock_c = 0;

var result = add(multiply(flock_b, add(flock_a, flock_c)), multiply(flock_a, flock_b));
//=>16

再优化：

// 结合律（assosiative）：(x + y) + z = x + (y + z)
add(add(x, y), z) == add(x, add(y, z));

// 交换律（commutative）: x + y = y + x
add(x, y) == add(y, x);

// 同一律（identity）: x + 0 = x
add(x, 0) == x;

// 分配律（distributive）: x * (y + z) = x * y + x * z
multiply(x, add(y,z)) == add(multiply(x, y), multiply(x, z));



// 原有代码
add(multiply(flock_b, add(flock_a, flock_c)), multiply(flock_a, flock_b));

// 应用同一律，去掉多余的加法操作（add(flock_a, flock_c) == flock_a）
add(multiply(flock_b, flock_a), multiply(flock_a, flock_b));

// 再应用分配律
multiply(flock_b, add(flock_a, flock_a));
// => flock_b * flock_a * 2;

函数式编程：面向函数式编程开发；

其他：面向对象编程

原子化

# 一等公民

函数是一等公民

函数没什么特殊的，你可以像对待任何其他数据类型一样对待它们——把它们存在数组里，当作参数传递，赋值给变量...等等。

const hi = name => `Hi ${name}`;

// bad
const greeting = name => hi(name);

// good
const greeting = hi;
greeting("times"); // "Hi times"


// bad
const getServerStuff = callback => ajaxCall(json => callback(json));
// good
const getServerStuff = ajaxCall;

/**
 * 原因如下：
 */
ajaxCall(json => callback(json));
// 等价于
ajaxCall(callback);
// 那么，重构下 getServerStuff
const getServerStuff = callback => ajaxCall(callback);
// ...就等于
const getServerStuff = ajaxCall // <-- 看，没有括号哦

所以：

// bad
const BlogController = {
  index(posts) { return Views.index(posts); },
  show(post) { return Views.show(post); },
  create(attrs) { return Db.create(attrs); },
  update(post, attrs) { return Db.update(post, attrs); },
  destroy(post) { return Db.destroy(post); },
};

// good
const BlogController = {
  index: Views.index,
  show: Views.show,
  create: Db.create,
  update: Db.update,
  destroy: Db.destroy,
};

getServerStuff和 BlogController，虽说添加一些没有实际用处的间接层实现起来很容易，但这样做除了徒增代码量，提高维护和检索代码的成本外，没有任何用处。

// 如果一个函数被不必要地包裹起来了，而且发生了改动，那么包裹它的那个函数也要做相应的变更。
httpGet('/post/2', json => renderPost(json));

// 如果 httpGet 要改成可以抛出一个可能出现的 err 异常，那我们还要回过头去把“胶水”函数也改了。
httpGet('/post/2', (json, err) => renderPost(json, err));

// 写成一等公民函数的形式，要做的改动将会少得多：
httpGet('/post/2', renderPost);  // renderPost 将会在 httpGet 中调用，想要多少参数都行

一定要非常小心 this 值，这一点与面向对象代码类似:

var fs = require('fs');
// bad
fs.readFile('freaky_friday.txt', Db.save);
// good a little
fs.readFile('freaky_friday.txt', Db.save.bind(Db));

把 Db 绑定（bind）到它自己身上以后，你就可以随心所欲地调用它的原型链式了。

this 有利有弊，如果不熟悉，尽量避免使用它，因为在函数式编程中根本用不到它。然而，在使用其他的类库时，可能会发现各种各样关于this的使用。

# 纯函数

没有任何副作用的函数。

相同的输入 => 相同的输出

slice 符合纯函数的定义：因为对相同的输入它保证能返回相同的输出；
splice 却不同：会产生可观察到的副作用，即这个数组永久地改变了；

var xs = [1,2,3,4,5];

// 纯的
xs.slice(0,3); //=> [1,2,3]
xs.slice(0,3); //=> [1,2,3]

// 不纯的
xs.splice(0,3); //=> [1,2,3]
xs.splice(0,3); //=> [4,5]

在函数式编程中，我们追求的是那种可靠的，每次都能返回同样结果的函数。

使用纯函数的形式，函数就能做到自给自足

从数学的概念上将，纯函数就是数学上的函数，而且是函数式编程的全部。

追求纯函数的原因

可缓存性（Cacheable）

纯函数总能够根据输入来做缓存~

var squareNumber  = memoize(function(x){ return x*x; });

squareNumber(4); //=> 16
squareNumber(4); // => 16
// 从缓存中读取输入值为 4 的结果

squareNumber(5); //=> 25
squareNumber(5); //=> 25
// 从缓存中读取输入值为 5 的结果

// 缓存函数
var memoize = function(f) {
  var cache = {};
  return function() {
    var arg_str = JSON.stringify(arguments);
    cache[arg_str] = cache[arg_str] || f.apply(f, arguments);
    return cache[arg_str];
  };
};

可移植性／自文档化（Portable / Self-Documenting）

纯函数是完全自给自足的，它需要的所有东西都能轻易获得；纯函数的依赖很明确，因此更易于观察和理解。

可测试性（Testable）
合理性（Reasonable）

纯函数最大的好处是引用透明性（referential transparency）。如果一段代码可以替换成它执行所得的结果，而且是在不改变整个程序行为的前提下替换的，那么我们就说这段代码是引用透明的。

并行代码

我们可以并行运行任意纯函数。因为纯函数根本不需要访问共享的内存，而且根据其定义，纯函数也不会因副作用而进入竞争态（race condition）。

# 柯里化

curry 的概念很简单：只传递给函数一部分参数来调用它，让它返回一个函数去处理剩下的参数。

# 代码组合

两个函数组合之后返回了一个新函数，也就是组合某种类型（本例中是函数）的两个元素本就该生成一个该类型的新元素。

// 在 compose 的定义中，g 将先于 f 执行，因此就创建了一个从右到左的数据流。这样做的可读性远远高于嵌套一大堆的函数调用
var compose = function(f,g) {
  return function(x) {
    return f(g(x));
  };
};

// eg
var toUpperCase = function(x) { return x.toUpperCase(); };
var exclaim = function(x) { return x + '!'; };
var shout = compose(exclaim, toUpperCase);
shout("send in the clowns");
//=> "SEND IN THE CLOWNS!"

// 如果不用组合，shout 函数将会是这样的：
var shout = function(x){
  return exclaim(toUpperCase(x));
};

结合律：

// 结合律（associativity）
var associative = compose(f, compose(g, h)) == compose(compose(f, g), h); // true
// eg
compose(toUpperCase, compose(head, reverse));
// 或者
compose(compose(toUpperCase, head), reverse);


// 结合律的一大好处是任何一个函数分组都可以被拆开来，然后再以它们自己的组合方式打包在一起。让我们来重构重构前面的例子：
var loudLastUpper = compose(exclaim, toUpperCase, head, reverse);
// 或
var last = compose(head, reverse);
var loudLastUpper = compose(exclaim, toUpperCase, last);
// 或
var last = compose(head, reverse);
var angry = compose(exclaim, toUpperCase);
var loudLastUpper = compose(angry, last);

运用结合律能为我们带来强大的灵活性，而且你也可以在类似 lodash、underscore 以及 ramda 这样的类库中找到它们的常规定义。

pointfree

pointfree 模式指的是，永远不必说出你的数据。它的意思是说，函数无须提及将要操作的数据是什么样的。一等公民的函数、柯里化（curry）以及组合协作起来非常有助于实现这种模式。

// 非 pointfree，因为提到了数据：word
var snakeCase = function (word) {
  return word.toLowerCase().replace(/\s+/ig, '_');
};
// pointfree
var snakeCase = compose(replace(/\s+/ig, '_'), toLowerCase);


// 非 pointfree，因为提到了数据：name
var initials = function (name) {
  return name.split(' ').map(compose(toUpperCase, head)).join('. ');
};
// pointfree
var initials = compose(join('. '), map(compose(toUpperCase, head)), split(' '));
initials("hunter stockton thompson");
// 'H. S. T'

pointfree 模式能够帮助我们减少不必要的命名，让代码保持简洁和通用。

# 讲义

上次更新: 7/6/2023, 7:44:05 PM