你需要知道的有关泛函编程的一些知识 —— 代数类型与类型匹配

你需要知道的有关泛函编程的一些知识 —— 代数类型与类型匹配

我们知道在面向对象编程中有这么一条军规:向修改说No,向扩展说Yes。基于这条军规,我们实现了“继承”。客观地说,当我们从具体功能的角度审视这条军规时,它在大多数情况下都能良好地发挥作用,但是如果我们将视角从具体的功能实现提升到基于类型安全的角度,那么这条军规依然能够完美地约束我们对多态的要求吗?让我们来看一个简单的例子: 假设我们要实现一个“交通灯”应用,基于这条军规我们可能会先实现一个名为 Light的接口(或抽象基类),然后通过扩展这个接口(或基类)实现“RedLight”,“YellowLight”和“GreenLight”三个子类分别代表“红”“黄”“绿”三种灯: 接下来我们通常会编写一个信号灯控制器(LightController)来控制灯的点亮和熄灭: 从这段代码中我们可以看到几个明显的问题:首先:我们需要在强制转换之前先使用 instanceof 关键词来判断当前Light的子类型。因为在OO中,我们只被允许安全地向“上”,而不是向“下”进行类型的转换,当我们要将一个类型转换到它的子类型时,我们就必须自己完成类型检查,而编译器无法对我们行为的安全性负责。这就是继承带来的第一个局限性。 那么有没有一种方法使得我们的类型也可以向下负责呢?也就是说,我们是否可以让编译器通过有限的枚举来自动识别出正确的子类型呢?从传统的OO原理出发,因为继承的开放性,也就是我们之前提到的那条军规,让我们无法将Light的子类限定在仅仅只有这三种可选项内,虽然从常识上我们可能永远也不会去尝试实现一个粉色的交通灯,但是编译器并不具备这个常识,因此它不可能为我们实现这种我们所期待的类型检查。甚至,为了防止在未来某种未知的状态下发生低级错误,我们可能还需要给 if…elseif…语句块在最后加上一个else来为所有未知的情形提供处理。这就犹如脱裤子放屁一样,但是却是必须的。由此可见如何依据父类型对子类型实现安全检查,这就是我们要解决的由OO带来的第一个问题。 在离散代数中我们知道有一个“集合”的概念,一个集合是所有满足定义域的解的全集,所以如果我们把接口(或基类)视为某个定义域,而它可能的子类视为它的“解”的话,那么我们就会得到这样一个代数式: Light ={RedLight, YellowLight, GreenLight} 所以如果我们能够实现一个类,它的子类只能是花括号中的三种,那么我们也就能够告诉编译器它可以通过枚举这三种子类型来找到我们所需要的类型。因此在泛函编程中,我们引入了一个名为“和(sum)类型”的概念,顾名思义,也就是说,某个类型是它所有子类型的全集。在Scala 中,我们用 sealed 关键词来标识这个类,于是我们得到以下代码: 在这样一个实现中 sealed trait Light 被明确限定为其下三种子类型的父类,它不可能在别的地方被继承,并且它的子类也不能被继承,也就是说它的所有可能的“解”都被封印了起来,于是我们可以安全地使用 match…case 来进行类型匹配了: 并且,因为编译器已经得到足够的信息来保证Light的子类型不会超出以上三种,因此这三个case已经完全覆盖了所有的可能性,我们也没必要再实现一个 default来处理超出期待的情况。这样的代码不仅安全而且简洁明了。 第二个问题是:我们知道交通灯的信号组合永远只可能有一盏灯是处于点亮的状态,因此在实现的过程中,我们必须考虑他们的组合以防止不合理的状态出现,那么我们能否让编译器为我们检查所有的排列组合呢?很遗憾,回答依然是做不到,因为如果我们要让编译器检查每一种组合,那么我们需要通过某种方式明确地告知编译器所有可能的参数和它们的形式,而没有一种传统手段可以做到这一点,因此我们只能自行在程序中通过if…else…来枚举所有的情况,如果稍有不慎漏掉了某种情况,那么编译器是不会发现错误的,等待你的也许是灾难性的结果。 但是在离散代数中,我们知道在一个确定的数据全集中,其中的任何一个或多个成员的组合都是这个全集的子集。而一个非无穷全集中的子集是可以穷举的!基于这一点,我们以RedLight这个类为例,它的数据公民有两个,分别是true和false,并且它们出现在子集中的机会是排它性的,因此它可能的结果也就只有两个。如果我们进一步将组合扩大到三个灯,那么我们就可以得到他们不同的组合,因此现在我们只需要通过某种方式将这个组合告诉编译器就可以,答案就隐藏在 case class 中,我们只需要定义一个包含全部三个类型的灯的LightController case class就可以做到这一点: 这个LigjtController类包含了三个参数,现在编译器只需要观察这三个参数(包括递归每个参数的两种结果)就可以覆盖所有可能的组合情况,因此如果我们有以下代码: 编译器就可以给出警告我们的代码是不完整的,因为很显然我们只枚举了三种合理的情况,除非我们提供一个缺省的方法来覆盖全部情况: 与“和类型”一样,这样的 case class 也有一个称呼叫做“积(product)类型”,顾名思义就是它表示一个集合中所有解的“积”结果。而对应不同的“积”的处理函数称为“偏函数”,这个概念和代数中的偏函数是一致的。 由于以上的“和类型”和“积类型”都来自代数,因此它们被统称为“代数类型”。代数类型在泛函编程中发挥了重要的作用,尤其在类型安全领域,它弥补了OO的缺憾,为继承带来更安全的编程体验。可喜的是今天的Java也逐步接受了代数类型,在最新的Java14中已经出现了 Record类,其实就是积类型,而在即将发布的Java15中也将引入sealed关键词用于实现和类型。我们很高兴看到Java正在一步一步走向OO和FP的结合,虽然这一天的到来有点慢。

错误处理

本章节探讨一些常用的检测和处理错误的方法。 Either 您可以使用  ZIO#either 来处理故障,方法是使用  ZIO[R, E, A]  并产生  ZIO[R, Nothing, Either[E, A]]。 您可以使用  ZIO.absolve 来将(Either 类型的)失败反转成 ZIO,这与上例相反,它将  ZIO[R, Nothing, Either[E, A]] 转换为 ZIO[R, E, A]: 捕获所有错误 如果您想捕获所有类型的错误并有效地尝试恢复,则可以使用 catchAll 方法: 在传递给 catchAll的回调中,您可以返回具有不同错误类型(或可能为Nothing)的 effect,并且它将被反映在 catchAll 返回的 effect 类型中。 捕获特定的错误 如果您只想捕获并恢复某些类型的异常,则可以使用 catchSome 方法: 于 catchAll 不同, catchSome 不能减少或消除所能包含的错误类型,但是它可以将错误类型扩展为更广泛的错误类别。 失败回退 您可以使用 orElse 组合器让它尝试一种 effect,如果它失败了,那么继续尝试执行另一个 effect。 Folding Scala 的 Option 和 Either 数据类型都具有 fold 方法,它可以让您同时处理成功和失败。ZIO  effect 也具有类似的几种方式可以让您处理失败和成功。 第一种方法是使用 fold,通过为每种情况提供一个非效果的函数,让您以 “非效果” 的方式同时处理成功和失败: 第二种方式是使用 foldM 函数,它允许您通过为每种情况提供效果化的(纯净的)处理程序,来处理失败和成功: 几乎所有错误处理方法都是根据 foldM 定义的,因为它既强大又快速。 在下面的例子中,foldM 被同时用于处理 readUrls 方法的成功和失败的: 重试 ZIO数据类型上有许多有用的方法可以重试失败的 effect。 ZIO#retry 是其中最基本的用法,它接收一个 Schedule 并返回一个会在前次执行失败后,基于指定的策略尝试重新执行的 effect: 另一个强大的函数是 ZIO#retryOrElse,它允许指定一个失败回退函数,如果效果指定的策略也无法取得成功,则执行回退函数: 最后,ZIO#retryOrElseEither 函数允许返回失败回退函数返回一个不同的类型: 有关如何新建一个 schedules,请参考 Schedule. Next Steps 如果您对基本的错误处理感到满意,那么下一步就是学习安全的 资源管理。

你需要知道的有关泛函编程一些知识 —— effect 和 side effect

在翻译 ZIO 文档的时候有一个比较头疼的问题是有关如何翻译 effect 和 side effect。在许多文章中 effect 有时被翻译成“作用”,而有的时候又被翻译成“效果”。side effect 则在多数时候被翻译成“副作用”,很少见到被翻译成“副效果”的,因为中文中似乎没有这样一个词汇。当我第一次看到“副作用”这个词的时候的第一反应是该吃药了。但是不管怎么翻译,这都很容易产生理解上的偏差,甚至有时不管用哪个词都不正确。所以为了更准确地表达原文,最后我决定还是尽可能不对这两个词做翻译,保持它们的英文原文。其实只要准确理解了 effect 和 side effect 的内涵并不影响阅读,就当是两个专有名词好了。 effect 和 side effect 是一对反义词(貌似废话),只要理解了一个,另一个自然也就理解了。他俩的关键在如何理解什么是 side effect。简单地说,side effect 指的是那些任何主动或被动地对“非当前局部环境变量”的访问的操作。 注意,“非当前局部环境变量”不仅仅包括访问全局变量和静态变量。这个操作可能非常广泛,甚至不局限于变量,还包括访问外部 IO,执行某些特殊指令,以非正常返回的方式引起的主动或被动出栈(比如异常)等行为。总之,它包含了大部分的栈外资源,要特别强调的是哪怕对本地变量的操作也可能引发栈外动作,比如除 0 运算,哪怕被除数是一个本地变量,但是因为它会触发异常,这也被视为 side effect。总之一切除了正常返回外,任何可能引入栈外因数的行为,都被称为 side effect。当然,还需要加一个前提是这些行为必须是“可观测”到的,如果你适当地将引起异常的运算用 try…cache…包裹起来并不将异常直接弹出,那么可以被认为消除了由此带来的 side effect。但是这种消除 side effect 的手段非常有限,绝大多数的对当前环境之外的资源的访问都是可以被观测到的,比如对网络的访问,它几乎无法被隐藏。 为什么要将这些操作单独区分出来呢?因为这些操作对程序的正常运行可能产生“危害“,这里的所谓“危害”并不是贬义词,而是指它可能导致函数结果的不可预测(不纯),甚至可能产生运行时中断。 什么叫函数的不纯?想象一下当我们用一张纸来解答一道存粹的数学函数的时候,我们最终得到的答案将完全依赖当前这张纸上的这道函数的输入参数,并且我们也一定会得到一个确定的结论(包括“无解”和那些尚未被数学家解答出来的“猜想”,它们也最终会有一个确定的结论),并且这个结论的改变只依赖如上参数条件。这就是函数的存粹性。函数的纯粹性有一个非常可贵的特点,就是一个存粹的函数不受任何外部宇宙条件的影响,它都会而且只会得到一个仅仅与参数有关的确定答案。无法想象我们换一张纸来答题,或者到火星上就会让 1+1得到一个非2的答案。也就是说,一个函数的存粹性取决于两个必要条件:1)是否所有的求解条件都由参数来传递?2)是否返回一个确定的结论,并且这个结论只和参数相关? 在计算机中满足了以上两个必要条件还不能称为纯函数,它还必须保证求解的过程不产生主动中断。side effect 除了会引入域外因数(外部变量)外,还有一个重要的原因是许多 side effect 的行为都会引起 CPU 在求解的过程中产生让程序脱离执行序列的中断。比如在执行的过程中插入 sleep 指令,这条指令将中断当前任务并将它调离执行序列进入睡眠状态。在CPU的执行过程中有许多类似的主动或被动的中断事件,包括在多线程环境中访问共享变量,设立临界区,这可能导致大量线程陷入等待中断。side effect 主要关注的是那些由程序内部引发的中断,包括但不限于 IO 中断(不包括缺页中断)。因为这些中断会大大地降低代码的执行效率。 除了 side effect 之外剩下的(在概念上非常局限的)那一部分,就称为 effect,也就是泛函编程中极力追求的目标。effect 是保证我们写出纯函数的必要(非充分)条件,而纯函数是泛函编程“高效率”,“低故障”,“可验证”的重要保障,因此我们要非常清楚如何正确地利用或避免 side effect 来构建我们的程序以达到我们希望的目的。 最后要强调一点,明确认识 side effect 并非让我们“惧怕”使用它们,一个程序最终还是要通过 IO 和人或设备打交道,因此一个功能的程序几乎不可避免用到 side effect,认识 side effect 只是让我们能够更好地组织我们的代码,避免在不必要的地方使用,让程序运行的更加高效可靠。

基本操作

Mapping 您可以通过调用 ZIO#map 方法让 effect 在成功通道上进行映射。这使您可以转换effect 的成功值。 您可以通过调用  ZIO#mapError 方法让效果在错误通道上进行映射。这使您可以转换 effect 的失败值。 注意,在 effect 的成功或错误通道上进行映射不会更改效果的成功或失败,就如同  Either,在任何一个通道上映射都不会改变它是 Left 还是 Right。 链式调用 您可以使用 flatMap 方法串联执行两个 effects,这要求您提供一个回调函数,该回调接收第一个 effect 的输出作为它的输入,最终的返回取决于此第二个 effect 的结果: 如果第一个 effect 失败了,那么传递给 flatMap 的回调将不会被执行,并且 flatMap 返回的合成效果也将失败。 在 任何 的效果链中,第一个失败将会直接导致整个调用链立即终止,就像抛出异常会提早从一系调用中退出一样。 For Comprehensions 因为 ZIO 数据类型同时支持 flatMap 和 map 调用,所以你可以使用 Scala 的 for comprehensions 来构建 effect 的执行序列: For comprehensions 提供了用于组合效果链的更具过程性的语法。 Zipping 您可以使用 ZIO#zip 方法将讲个 effect 合并成一个单个的 effect,产生的 effect 是一个包含了两个 effect 的成功值的元组: 要注意 zip 运算的顺序:左边效果的运算先于右边。 在任何一个 zip 运算中,如果左边或右边中的任意一边失败,那么整个effect组合都将失败,因为生成元组需要两个值。 有时候一个成功的 effect 的返回值是无用的(比如 Unit),那么可以使用 ZIO#zipLeft 或 ZIO#zipRight 函数来方便地舍弃,这个些函数先执行 zip,然后执行映射(map)来丢弃一边: zipRight 和 zipLeft 函数分别可以使用符号别名 *> 和 <* 来代替。有些开发者认为以下代码的可读性更高: Next Step 如果您对ZIO effect 的基本操作感到满意,那么下一步就是学习错误处理.

创建 effect

本章节将探讨从直接量、常见的 Scala 类型,和同步、异步 side effect 中创建 ZIO effect 的一些常用方法。 必定成功的值 使用 ZIO.succeed 方法,你可以为一个特定值建立一个成功的 effect。: 也可以在 ZIO 的别名中使用这些方法: succeed 方法接收一个 by-name 参数以确保在构造该值时产生的任何 side-effect 都可以被 ZIO 的运行时适当地管理。但是 succeed 倾向于被用在没有任何 side-effect 的求值。如果你确定这个值会产生 side-effect,请考虑使用 ZIO.effectTotal 来声明: 这个成功效果的构造器 ZIO.effectTotal 只在必要的时候才会产生出值。 必定失败的值 使用 ZIO.fail 来为失败效果建模。 ZIO 数据类型不限定错误的类型,您可以使用适合您的应用程序的字符串,异常或自定义数据类型作为错误类型。 许多程序使用扩展自 Throwable 或 Exception 的类来为错误建模: 需要注意的是,不同于其它效果伴随对象,UIO 的伴随对象没有 UIO.fail,因为由 UIO 表达的 effect 不会失败。 取自 Scala 类型 很多来自 Scala 标准库的数据类型都可以被转换成 ZIO effect。 Option 可以通过  ZIO.fromOption 将 Option 转换成 ZIO effect: 它返回的错误效果类型是 Option[Nothing],它没有提供有关为何不存在该值的信息。你可以通过 ZIO#mapError 将 Option[Nothing] 映射到特定的错误类型: 你还可以轻松地组合不同的运算并保持“可选性”的结果 (与 OptionT 类似): Either 通过 ZIO.fromEither 可以将 Either 转换成 ZIO effect: 得到的 effect 中的错误类型将是任意的左值(Left)类型,而成功类型将是任意的右值(Right)类型。 Try 通过 ZIO.fromTry 可以将 Try 转换成 ZIO effect: 得到的 effect 中的错误类型总是 Throwable,因为 Try 只会以 Throwable 作为失败类型。 Function 通过 ZIO.fromFunction 可以将函数 A => B 转换成 ZIO effect 该 effect 的环境类型是 A (等于函数的输入类型),因为为了让该 effect 的到执行,我们必须提供该类型的输入值。 Future 通过 ZIO.fromFuture 可以将一个 Future 转换成 ZIO effect: 这个函数将一个  ExecutionContext 传递 fromFuture 函数,它将允许 ZIO 管理 Future 的运行 (当然,你也可以忽略该 ExecutionContext). 返回效果的错误类型总是 Throwable,因为 Future 只会以 Throwable 作为失败类型。 取自副作用(Side-Effects) ZIO可以将同步和异步 side-effect 都转换为ZIO effect(纯值)。 以下这些函数可用于包装过程代码,从而使您可以将ZIO的所有功能与遗留的 Scala 和 Java 代码以及第三方库无缝地结合使用。 同步 side-effect ZIO.effect 可以用于将有 side-effect 的同步代码转换成 ZIO: 结果的错误类型总是 Throwable,因为 side-effect 可能会引发任何类型的 Throwable 类型的异常。 如果给出的 side-effect 代码不会抛出任何异常,那么它可以用 ZIO.effectTotal 来转换。 当你使用 ZIO.effectTotal 的时候要特别小心 —— 如果你不能完全确定没有 side-effect,那么请使用 ZIO.effect 。 如果您希望细化效果的错误类型(将其他错误视为致命错误),那么可以使用 ZIO#refineToOrDie: 异步 side-effect ZIO.effectAsync 可以将一个基于回调 API 的异步 side-effect 转化成 ZIO effect: 与基于回调的API相比,异步 ZIO effect 更易于使用,并且它将受益于 ZIO 提供的功能,例如中断、资源安全和出色的错误处理。 阻塞的同步 Side-Effects 有一些 side-effect 代码使用阻塞 IO 或以某总方式使线程进入等待状态,如果你不小心加以管理,这些 side-effect 代码可能会耗尽应用程序主线程池中的线程,从而导致资源匮乏。 ZIO 提供了 zio.blocking 包,可以用于将阻塞 side-effects 安全地转换到 ZIO effects. […]

摘要

ZIO是一个基于纯函数式编程的的异步并发库。 有关如何在纯函数编程中处理“效果“,比如输入输出的背景知识,请参阅此章节:背景知识. ZIO 的核心是 ZIO,这是一种源自Haskell 的 IO monad的强大的效果类型。通过此数据类型,您可以通过简单的、类型安全的、可测试和可组合地的代码来解决复杂的问题。 ZIO ZIO[R, E, A] 数据类型有三个参数: R – Environment Type. 该效果通过一个类型 R 用以标示“环境”。如果此类型参数为Any,则表示对该效果没有要求,因为您可以使用任何值(例如单位值())。 E – Failure Type. 如果该类型有可能失败,以类型 E 来标示。有些应用中可以使用 Throwable. 如果该类型是 Nothing, 它标示该效果不可能失败,因为 Nothing 标示没有值可以提供。 A – Success Type. 该效果成功执行的返回类型标记为类型 A. 如果该类型参数返回 Unit, 这表示该效果没有产生有用的信息,如果返回的是 Nothing, 标示该效果将永远执行下去(直到失败为止)。 例如, 一个 ZIO[Any, IOException, Byte] 类型的效果表示它没有输入参数,可能导致 IOException 类型的失败,或成功返回 Byte 类型的返回值。 ZIO[R, E, A] 类型的值类似以下函数类型: 这个函数要求一个 R 类型的输入参数,将可能产生或者 E 类型的失败,或一个 A 类型的成功返回值。但是 ZIO 不完全等于是一个实际的函数,它是面向复杂的效果的模型,比如并发和并行效果。 类型别名 ZIO 数据类型是 ZIO 中唯一的效果数据类型.。但是,有一系列类型别名和伴随对象可以在不同情况下简化它的表达形式: UIO[A] — 这是 ZIO[Any, Nothing, A] 的别名,它表示一个对输入类型没有要求,并且不可能失败,并且能够成功返回一个 A 类型返回值的效果。 URIO[R, A] — 这是 ZIO[R, Nothing, A] 类型的别名,它表示输入要求为  R 类型,并且不可能失败,并能攻成功返回 A 类型的效果。 Task[A] — 这是 ZIO[Any, Throwable, A]的别名,表示一个对输入类型没有要起,可能导致 Throwable 类型的失败,或成功返回 A 类型的效果。 RIO[R, A] — 这是 ZIO[R, Throwable, A] 的别名,它表示一个输入类型为 R,可能导致 Throwable 类型的计算失败,或成功返回 A 类型的效果. IO[E, A] — 这是 ZIO[Any, E, A] 的别名,它表示对输入没有要求,并且可能导致 E 类型的失败,或成功返回 A 类型的效果。 这些别名都有一个伴随对象,并且这些对象具有可用于构造适当类型的值的方法。 如果您对函数的效果不熟悉,我们建议您从 Task 类型开始,它只有一个参数,并且与 Scala 标准库的 Future 最接近。 如果您正在使用 Cats Effect 库,则 RIO 类型可能会很有用,因为它允许您通过第三方库和应用程序对环境进行线程化。 无论您在应用程序中使用哪种类型的别名,UIO 都可用于描述不可能失败的效果,包括结果出自对错误的处理函数。 最后,如果您是经验丰富的函数式程序员,则建议直接使用 ZIO 数据类型,虽然您可能最终会在应用程序的不同部分中创建自己的类型别名。 下一步 如果您对ZIO数据类型及其类型别名系列感到满意,那么下一步就是学习如何 创建 effects.

Getting Started

在项目的 build.sbt 文件中添加以下配置来使用 zio 如果你想使用 ZIO streams,需要添加以下配置: Main 您的应用程序可以扩展自App,它提供一个完整的运行时(runtime)系统,并允许您使用 ZIO 编写整个应用程序。 run 方法应返回一个 ZIO 值,该值包括负责处理所有的错误, 在 ZIO 的术语环境中,它代表一个不会产生异常的 ZIO 值。 一种实现方法是在 ZIO 值上调用 fold,以获的非异常的 ZIO 值。这需要两个具柄函数:eh: E => B(错误处理具柄),和 ah: A => B(成功处理具柄)。 如果 myAppLogic 失败,则将使用 eh 从 e: E 获得 b: B;如果成功,则将使用 ah 从 a: A 获得 b: B。 以上为例,myAppLogic 产生一个非异常的 ZIO 值,其中 B 为 Int。 如果 myAppLogic 失败,将得到 1;否则如果成功,则将得到 0。 如果要使用依赖注入,将 ZIO 集成到现有应用程序中,或者不打算直接编写 main 函数,那么可以显式创建运行时(runtime)以执行 ZIO 程序: 理想情况下,您的应用程序应该只有一个运行时,因为每个运行时都有自己的资源(包括线程池和未处理的错误报告)。 控制台(Console) ZIO 提供了用于与控制台进行交互的模块。您可以使用以下代码片段将此模块中的功能导入. 如果需要将文本打印到控制台,则可以使用 putStr 和 putStrLn: 如果需要从控制台读取输入,则可以使用 getStrLn:

BACK TO TOP