JavaScript 函数式编程
一、什么是函数式编程
函数式编程是一种编程范式,主要是利用函数把运算过程封装起来,通过组合各种函数来计算结果。
举个例子,要把字符串 functional programming is great
变成每个单词首字母大写,可以这样实现:
var string = 'functional programming is great';
var result = string
.split(' ')
.map(v => v.slice(0, 1).toUpperCase() + v.slice(1))
.join(' ');
上面先用 split 把字符串转换数组,然后再通过 map 把各元素的首字母转换成大写,最后通过 join 把数组转换成字符串。
整个过程就是 join(map(split(str)))
,体现了函数式编程的核心思想:通过函数对数据进行转换。
1、特点
- 通过函数来对数据进行转换。
- 通过串联多个函数来求结果。
2、优缺点
优点:
- 更好的管理状态,减少代码量,提高可维护性;
- 更强的复用性,由于没有副作用,复用时不需要考虑它的内部实现和外部影响;
缺点:
- 函数式编程往往会对方法进行过度包装,产生上下文切换的性能开销;
- 函数式编程为了实现对象状态的不可变,往往会创建新的对象,从而产生额外的垃圾回收压力;
二、命令式与声明式
1、命令式
通过编写一条又一条指令去让计算机执行一些动作,一般会涉及到很多繁杂的细节。
命令式代码中频繁使用语句来完成某个行为,例如 for、if、switch、throw 等等
// 命令式
var CEOs = [];
for (var i = 0; i < companies.length; i++) {
CEOs.push(companies[i].CEO)
}
2、声明式
通过写表达式的方式来声明操作,而非通过一步一步的指示。表达式通常是某些函数调用的复合、一些值和操作符,用来计算出结果值。
// 声明式
var CEOs = companies.map(c => c.CEO);
从上面的例子中,可以看到声明式的写法是一个表达式,无需关心如何进行计数器迭代,返回的数组如何收集,它指明的是做什么,而不是怎么做。
函数式编程的一个明显的好处就是这种声明式的代码,对于无副作用的纯函数,我们完全可以不考虑函数内部是如何实现的,专注于编写业务代码。
三、常见特性
1、无副作用
指调用函数时不会修改外部状态,即一个函数调用 n 次后依然返回同样的结果。
var a = 1;
// 含有副作用,它修改了外部变量 a
// 多次调用结果不一样
function test1() {
a++
return a;
}
// 无副作用,没有修改外部状态
// 多次调用结果一样
function test2(a) {
return a + 1;
}
2、透明引用
指一个函数只会用到传递给它的变量以及自己内部创建的变量,不会使用到其他变量。
var a = 1;
var b = 2;
// 函数内部使用的变量并不属于它的作用域
function test1() {
return a + b;
}
// 函数内部使用的变量是显式传递进去的
function test2(a, b) {
return a + b;
}
3、不可变变量
指的是一个变量一旦创建后,就不能再进行修改,任何修改都会生成一个新的变量。
使用不可变变量最大的好处是线程安全。多个线程可以同时访问同一个不可变变量,让并行变得更容易实现。
由于 JavaScript 原生不支持不可变变量,需要通过第三方库来实现。 (如 Immutable.js,Mori 等等)
var obj = Immutable({ a: 1 });
var obj2 = obj.set('a', 2);
console.log(obj); // Immutable({ a: 1 })
console.log(obj2); // Immutable({ a: 2 })
4、函数是一等公民
函数是 JavaScript 的"一等公民",指的是函数没什么特殊的,与其他数据类型一样,处于平等地位,可以赋值给其他变量,也可以作为参数,传入另一个函数,或者作为别的函数的返回值。
下面列举的常用函数式编程模型都是围绕这一特性的应用 ↓
四、常见的函数式编程模型
1、闭包(Closure)
如果一个函数引用了自由变量,那么该函数就是一个闭包。
自由变量 指不属于该函数作用域的变量(所有全局变量都是自由变量,严格来说引用了全局变量的函数都是闭包,但这种闭包并没有什么用,通常情况下我们说的闭包是指函数内部的函数)
1-1、闭包的形成条件
- 存在内、外两层函数
- 内层函数对外层函数的局部变量进行了引用
1-2、闭包的用途
可以定义一些作用域局限的持久化变量,这些变量可以用来做缓存或者计算的中间量等。
// 简单的缓存工具
// 匿名函数创造了一个闭包
const cache = (function () {
const store = {};
return {
get(key) {
return store[key];
},
set(key, val) {
store[key] = val;
}
}
}());
console.log(cache) // {get: ƒ, set: ƒ}
cache.set('a', 1);
cache.get('a'); // 1
上面是一个简单的缓存工具的实现,匿名函数创造了一个闭包,使得 store 对象 ,一直可以被引用,不会被回收。
1-3、闭包的弊端
持久化变量不会被正常释放,持续占用内存空间,很容易造成内存浪费,所以一般需要一些额外手动的清理机制。
2、高阶函数
函数式编程倾向于复用一组通用的函数功能来处理数据,它通过使用高阶函数来实现。
高阶函数指的是一个函数以函数为参数,或以函数为返回值,或既以函数为参数又以函数为返回值。
高阶函数的应用:
- 抽象或隔离行为、作用,异步控制流程作为回调函数,promises,monads 等
- 创建可以泛用于各种数据类型的功能
- 部分应用于函数参数(偏函数应用)或创建一个柯里化的函数,用于复用或函数复合
- 接受一个函数列表并返回一些由这个列表中的函数组成的复合函数
JavaScript 语言是原生支持高阶函数的,例如 Array.prototype.map,Array.prototype.filter 和 Array.prototype.reduce 是 JavaScript 中内置的一些高阶函数,使用高阶函数会让我们的代码更清晰简洁。
2-1、map
map() 方法创建一个新数组,其结果是该数组中的每个元素都调用一个提供的函数后返回的结果。
map 不会改变原数组。
假设有一个包含名称和种类属性的对象数组,想要这个数组中所有名称属性放在一个新数组中,要如何实现呢?
不使用高阶函数实现:
// 不使用高阶函数
var animals = [
{ name: "Fluffykins", species: "rabbit" },
{ name: "Caro", species: "dog" },
{ name: "Hamilton", species: "dog" },
{ name: "Harold", species: "fish" },
{ name: "Ursula", species: "cat" },
{ name: "Jimmy", species: "fish" }
];
var names = [];
for (let i = 0; i < animals.length; i++) {
names.push(animals[i].name);
}
console.log(names); // ["Fluffykins", "Caro", "Hamilton", "Harold", "Ursula", "Jimmy"]
使用高阶函数实现:
// 使用高阶函数
var animals = [
{ name: "Fluffykins", species: "rabbit" },
{ name: "Caro", species: "dog" },
{ name: "Hamilton", species: "dog" },
{ name: "Harold", species: "fish" },
{ name: "Ursula", species: "cat" },
{ name: "Jimmy", species: "fish" }
];
var names = animals.map(x => x.name);
console.log(names); // ["Fluffykins", "Caro", "Hamilton", "Harold", "Ursula", "Jimmy"]
2-2、filter
filter() 方法会创建一个新数组,其中包含所有通过回调函数测试的元素。
filter 为数组中的每个元素调用一次 callback 函数, callback 函数返回 true 表示该元素通过测试,保留该元素,false 则不保留。
filter 不会改变原数组,它返回过滤后的新数组。
假设有一个包含名称和种类属性的对象数组,想要创建一个只包含狗(species: "dog")的数组,要如何实现呢?
不使用高阶函数实现:
// 不使用高阶函数
var animals = [
{ name: "Fluffykins", species: "rabbit" },
{ name: "Caro", species: "dog" },
{ name: "Hamilton", species: "dog" },
{ name: "Harold", species: "fish" },
{ name: "Ursula", species: "cat" },
{ name: "Jimmy", species: "fish" }
];
var dogs = [];
for (var i = 0; i < animals.length; i++) {
if (animals[i].species === "dog") dogs.push(animals[i]);
}
console.log(dogs);
使用高阶函数实现:
// 使用高阶函数
var animals = [
{ name: "Fluffykins", species: "rabbit" },
{ name: "Caro", species: "dog" },
{ name: "Hamilton", species: "dog" },
{ name: "Harold", species: "fish" },
{ name: "Ursula", species: "cat" },
{ name: "Jimmy", species: "fish" }
];
var dogs = animals.filter(x => x.species === "dog");
console.log(dogs); // {name: "Caro", species: "dog"}
// { name: "Hamilton", species: "dog" }
2-3、reduce
reduce 方法对调用数组的每个元素执行回调函数,最后生成一个单一的值并返回。
reduce 方法接受两个参数:
- reducer 函数(回调)
- 一个可选的 initialValue。
假设我们要对一个数组的求和:
不使用高阶函数实现:
// 不使用高阶函数
const arr = [5, 7, 1, 8, 4];
let sum = 0;
for (let i = 0; i < arr.length; i++) {
sum = sum + arr[i];
}
console.log(sum); // 25
使用高阶函数实现:
// 使用高阶函数
const arr = [5, 7, 1, 8, 4];
const sum = arr.reduce((accumulator, currentValue) => accumulator + currentValue, 0);
console.log(sum) // 25
可通过下图展示三者的区别:
3、函数柯里化
柯里化又称部分求值,柯里化函数会接收一些参数,然后不会立即求值,而是继续返回一个新函数,将传入的参数通过闭包的形式保存,等到被真正求值的时候,再一次性把所有传入的参数进行求值。
// 普通函数
function add(x, y) {
return x + y;
}
add(1, 2); // 3
// 函数柯里化
var add = function (x) {
return function (y) {
return x + y;
};
};
var increment = add(1);
increment(2); // 3
这里定义了一个 add 函数,它接受一个参数并返回一个新的函数。 调用 add 之后,返回的函数就通过闭包的方式记住了 add 的第一个参数。
3-1、简易柯里化函数的实现
那么,如何来实现一个简易的柯里化函数呢?
function curryIt(fn) {
// 参数 fn 函数的参数个数
var n = fn.length;
var args = [];
return function (arg) {
args.push(arg);
if (args.length < n) {
return arguments.callee; // 返回这个函数的引用
} else {
return fn.apply(this, args);
}
};
}
function add(a, b, c) {
return [a, b, c];
}
var c = curryIt(add);
var c1 = c(1);
var c2 = c1(2);
var c3 = c2(3);
console.log(c3); // [1, 2, 3]
可以看出,柯里化是一种“预加载”函数的方法,通过传递较少的参数,得到一个已经记住了这些参数的新函数,某种意义上讲,这是一种对参数的“缓存”,是一种非常高效的编写函数的方法。
4、函数组合(Composition)
前面提到过,函数式编程的一个特点是通过串联函数来求值。 然而,随着串联函数数量的增多,代码的可读性就会不断下降,函数组合就是用来解决这个问题的方法。
假设有一个 compose 函数,它可以接受多个函数作为参数,然后返回一个新的函数。 当我们为这个新函数传递参数时,该参数就会「流」过其中的函数,最后返回结果。
// 两个函数的组合
var compose = function (f, g) {
return function (x) {
return f(g(x));
};
};
// 或者
var compose = (f, g) => (x => f(g(x)));
var add1 = x => x + 1;
var mul5 = x => x * 5;
compose(mul5, add1)(2); // =>15
五、应用 - 实现函数缓存
实现原理:把参数和对应的结果数据存在一个对象中,调用时判断参数对应的数据是否存在,存在就返回对应的结果数据,否则就返回计算结果:
const memoize = function (func, content) {
let cache = Object.create(null)
content = content || this
return (...key) => {
if (!cache[key]) {
cache[key] = func.apply(content, key)
}
return cache[key]
}
}
使用:
const calc = memoize(add);
const num1 = calc(100,200)
const num2 = calc(100,200) // 缓存得到的结果
该函数做了以下事情:
过程分析:
- 在当前函数作用域定义了一个空对象,用于缓存运行结果;
- 运用柯里化返回一个函数,返回的函数由于闭包特性,可以访问到 cache;
- 然后判断输入参数是不是在 cache 中。如果已存在则直接返回 cache 的内容,如果没有则使用函数 func 对输入参数求值,然后把结果存储在 cache 中。
以下几种情况下,适合使用缓存:
- 对于昂贵的函数调用,执行复杂计算的函数;
- 对于具有有限且高度重复输入范围的函数;
- 对于具有重复输入值的递归函数;
- 对于纯函数,即每次使用特定输入调用时返回相同输出的函数。