函数式编程

函数式编程

Posted by 高明 on 2021-08-18

函数式编程

  1. Lambda
  2. Stream
  3. Reactive Stream
  4. Reactor
  5. WebFlux

函数式编程概念

命令式编程关注怎么做

函数式编程关注做什么

举例:找出最小的数字

1
2
3
4
5
6
7
8
9
10
11
public static void main(String[] args) {
int[] nums = {1, 2, 4, 2, 4, 5, 6, 1, 0, -2};

int m = Integer.MAX_VALUE;
for (int i = 0; i < nums.length; i++) {
if(nums[i] < m){
m = nums[i];
}
}
System.out.println(m);
}
1
2
3
4
5
public static void main(String[] args) {
int[] nums = {1, 2, 4, 2, 4, 5, 6, 1, 0, -2};
int asInt = IntStream.of(nums).min().getAsInt();
System.out.println(asInt);
}
1
2
3
4
5
6
7
8
9
10
11
new Thread(new Runnable() {
@Override
public void run() {
System.out.println("ok");
}
}).start();

new Thread(() ->
System.out.println("ok")
).start();
}

定义

简单说,”函数式编程”是一种“编程范式”(programming paradigm),也就是如何编写程序的方法论。

它属于“结构化编程”的一种,主要思想是把运算过程尽量写成一系列嵌套的函数调用。举例来说,现在有这样一个数学表达式:

1
(1 + 2) * 3 - 4

传统的过程式编程,可能这样写:

1
2
3
var a = 1 + 2;
var b = a * 3;
var c = b - 4;

函数式编程要求使用函数,我们可以把运算过程定义为不同的函数,然后写成下面这样:

1
var result = subtract(multiply(add(1,2), 3), 4);

特点

函数是”第一等公民”

所谓“第一等公民”(first class),指的是函数与其他数据类型一样,处于平等地位,可以赋值给其他变量,也可以作为参数,传入另一个函数,或者作为别的函数的返回值

举例来说,下面代码中的print变量就是一个函数,可以作为另一个函数的参数

1
2
var print = function(i){ console.log(i);};
[1,2,3].forEach(print);

只用”表达式”,不用”语句”

“表达式”(expression)是一个单纯的运算过程,总是有返回值;”语句”(statement)是执行某种操作,没有返回值。函数式编程要求,只使用表达式,不使用语句。也就是说,每一步都是单纯的运算,而且都有返回值。

原因是函数式编程的开发动机,一开始就是为了处理运算(computation),不考虑系统的读写(I/O)。”语句”属于对系统的读写操作,所以就被排斥在外。

当然,实际应用中,不做I/O是不可能的。因此,编程过程中,函数式编程只要求把I/O限制到最小,不要有不必要的读写行为,保持计算过程的单纯性

没有”副作用”

所谓“副作用”(side effect),指的是函数内部与外部互动(最典型的情况,就是修改全局变量的值),产生运算以外的其他结果。

函数式编程强调没有”副作用”,意味着函数要保持独立,所有功能就是返回一个新的值,没有其他行为,尤其是不得修改外部变量的值。

不修改状态

上一点已经提到,函数式编程只是返回新的值,不修改系统变量。因此,不修改变量,也是它的一个重要特点。

在其他类型的语言中,变量往往用来保存”状态”(state)。不修改变量,意味着状态不能保存在变量中。函数式编程使用参数保存状态,最好的例子就是递归。下面的代码是一个将字符串逆序排列的函数,它演示了不同的参数如何决定了运算所处的”状态”。

1
2
3
4
5
6
7
function reverse(string) {
if(string.length == 0) {
return string;
} else {
return reverse(string.substring(1, string.length)) + string.substring(0, 1);
}
}

由于使用了递归,函数式语言的运行速度比较慢,这是它长期不能在业界推广的主要原因

引用透明

引用透明(Referential transparency),指的是函数的运行不依赖于外部变量或”状态”,只依赖于输入的参数,任何时候只要参数相同,引用函数所得到的返回值总是相同的。

有了前面的第三点和第四点,这点是很显然的。其他类型的语言,函数的返回值往往与系统状态有关,不同的状态之下,返回值是不一样的。这就叫”引用不透明”,很不利于观察和理解程序的行为。

意义

函数式编程到底有什么好处,为什么会变得越来越流行?

代码简洁,开发快速

函数式编程大量使用函数,减少了代码的重复,因此程序比较短,开发速度较快。

Paul Graham在《黑客与画家》一书中写道:同样功能的程序,极端情况下,Lisp代码的长度可能是C代码的二十分之一。

如果程序员每天所写的代码行数基本相同,这就意味着,”C语言需要一年时间完成开发某个功能,Lisp语言只需要不到三星期。反过来说,如果某个新功能,Lisp语言完成开发需要三个月,C语言需要写五年。”当然,这样的对比故意夸大了差异,但是”在一个高度竞争的市场中,即使开发速度只相差两三倍,也足以使得你永远处在落后的位置。”

接近自然语言,易于理解

函数式编程的自由度很高,可以写出很接近自然语言的代码。

前文曾经将表达式(1 + 2) * 3 - 4,写成函数式语言:

1
subtract(multiply(add(1,2), 3), 4)

对它进行变形,不难得到另一种写法:

1
add(1,2).multiply(3).subtract(4)

这基本就是自然语言的表达了。再看下面的代码,大家应该一眼就能明白它的意思吧:

1
merge([1,2],[3,4]).sort().search("2")

因此,函数式编程的代码更容易理解。

更方便的代码管理

函数式编程不依赖、也不会改变外界的状态,只要给定输入参数,返回的结果必定相同。因此,每一个函数都可以被看做独立单元,很有利于进行单元测试(unit testing)和除错(debugging),以及模块化组合。

易于”并发编程”

1
函数式编程不需要考虑"死锁"(deadlock),因为它不修改变量,所以根本不存在"锁"线程的问题。不必担心一个线程的数据,被另一个线程修改,所以可以很放心地把工作分摊到多个线程,部署"并发编程"(concurrency)。

请看下面的代码:

1
2
3
var s1 = Op1();
var s2 = Op2();
var s3 = concat(s1, s2);

由于s1和s2互不干扰,不会修改变量,谁先执行是无所谓的,所以可以放心地增加线程,把它们分配在两个线程上完成。其他类型的语言就做不到这一点,因为s1可能会修改系统状态,而s2可能会用到这些状态,所以必须保证s2在s1之后运行,自然也就不能部署到其他线程上了。

多核CPU是将来的潮流,所以函数式编程的这个特性非常重要。

代码的热升级

函数式编程没有副作用,只要保证接口不变,内部实现是外部无关的。所以,可以在运行状态下直接升级代码,不需要重启,也不需要停机。Erlang语言早就证明了这一点,它是瑞典爱立信公司为了管理电话系统而开发的,电话系统的升级当然是不能停机的。

Lambda表达式

1
Runnable a = () -> System.out.println("a");
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
@FunctionalInterface
public interface Runnable {
/**
* When an object implementing interface <code>Runnable</code> is used
* to create a thread, starting the thread causes the object's
* <code>run</code> method to be called in that separately executing
* thread.
* <p>
* The general contract of the method <code>run</code> is that it may
* take any action whatsoever.
*
* @see java.lang.Thread#run()
*/
public abstract void run();
}

接口里面只有一个要实现的方法,参考函数接口

左边是参数,右边是实现体

1
Runnable a = () -> System.out.println("a");

如果没有参数

1
()

只有一个参数

1
RemovalListener<K, V> kvRemovalListener = x -> {};

两个参数必须带括号

1
Thread.UncaughtExceptionHandler uncaughtExceptionHandler = (x, y) -> {};

实现体如果只有一行,且没有返回,是不需要{}

类型,指定具体的参数

1
(A)(x) -> System.out.println("a");

函数接口

接口 输入参数 返回类型 说明
Predicate T boolean 断言
Consumer T / 消费一个数据
Function<T,R> T R 输入T输出R的函数
Supplier / T 提供一个数据
UnaryOperator T T 一元函数(输出输入类型相同)
BiFunction<T, U,R> (T, U) R 2个输入的函数
BinaryOperator (T,T) T 二元函数(输入输出类型相同)
1
2
3
4
5
6
7
8
9
10
11
12
13
public static <T> void setObject(Supplier<T> supplier, Consumer<T> consumer) {
T t = supplier.get();
if (t != null) {
consumer.accept(t);
}
}

public static <T> void setList(Supplier<List<T>> supplier, Consumer<List<T>> consumer) {
List<T> ts = supplier.get();
if (ts != null && !ts.isEmpty()) {
consumer.accept(ts);
}
}

断言

1
2
3
Predicate<Integer> predicate = i -> i > 0;
System.out.println(predicate.test(9));
// true

链式调用

链式调用必须是同一个接口

参考文献

Java响应式编程WebFlux基础与实战

函数式编程初探

函数式编程