本书的翻译简直是灾难性的,因此这个笔记是参考了原文后做的。塔勒布写书比较碎碎念,虽然逻辑展开很有层次,但是想一眼看出其中的逻辑主线还是不太容易。这里的笔记主要是帮助回顾全书的核心内容。

导言:“云中的清真寺”

本书讨论的是随机性。在日常生活中,随机性(Randomness)往往被认为是决定论(Determinism),幸运(Luck)往往被认为是技术(Skills)。大多数时候,我们低估了随机性在所有事情中的比例。左栏中的情况往往被误认为是右栏。

An image to describe post

但是反过来,如果非随机性事件被误认为是随机性的,情况就没有那么严重。因为:

  • 没有被检测到的模式不太值得担心;
  • 后者的犯错成本较低。

我们之所以会将两边的概念搞混,一个可能的原因是我们缺乏批判性思考。善于批判性思考的人,有勇气在面对一系列信息时,将大部分可能性归因于左边,而不是右边。

第一部分:Solon的警告——偏态、非对称性、归纳法

Solon的警告:这是传说中Solon和Lydia的国王Croesus的一段对话(实际并未发生)。白话版是:不到最后,都不算结束(it ain't over until it's over)。

第一部分探讨的是 “处境随着时间的变化情况(the degree to which a situation may yet, in the course of time, suffer change)”。 具体来说:

  • 运气得来的可能被运气取回,较少依赖运气的有比较好的抗随机性
  • 归纳法的问题:黑天鹅(Black Swan)和稀有事件(Rare Event);
  • 偏态:如果失败的代价难以承受,那么成功的概率多高根本无关紧要。

第一章 如果你那么富有,为什么却不聪明呢?

第一章塔勒布描述了两个截然不同的交易员的生活,Nero Tulip(这个交易员的名字谐音是「郁金香中性」,可以理解为「不受泡沫影响的人」)是一个交易风格保守(止损严格,资产增值依赖的是现金的增加而不是资产价格的变动)的交易员,而 John (这个名字一般被定义为普罗大众,有点像「张三」)则更加激进。在较长的时间段内,John的表现都要比Nero更优秀,但是最终Nero往往会活得更久。这其中的关键就是:“抗随机性(resistance to randomness)”。

第二章 不同寻常的计算方法

第二章塔勒布核心想表达的是一种看待问题的方法——Alternative History(我决定把它翻译成 “备择历史”, 来源于数理统计中“备择假设”,Alternative Hypothesis)。在这种世界观下,一个很重要的方法论就是,评判成败不能仅仅依据结果,还要考虑过程中的概率性成本。

理解随机性(randomness) 的难点在于:

  • 逻辑上反直觉;
  • 随机现象的所有结果呈现无法观察。

第三章 关于历史的数学思考

本章继续探讨概率思维下的历史观。上一篇重点讲了历史的背面——备择历史,作者在本章引入了“随机过程”的概念。随机过程是指随着时间的行进,各种事件纷纷出现的动态过程。在作者看来,由于现实存在着诸多随机性,因此真实的历史只是历史这个随机过程中的一条随机样本路径(或者说随机序列)。

在研究历史的过程中,一个很重要的步骤就是要排除掉历史中的随机性。作者提到了两种有效的手段:

  • 针对未来的历史:利用蒙特卡罗方法,遍历所有历史的可能性(包括已实现的和未实现的),并将其求和汇总(summing under histories)
  • 针对过去的历史:阅读前人的经验总结。在这个部分,很关键的问题在于,历史不像一般科学,可以通过可重复的科学实验来研究,但随机过程给予了历史一个非常好的性质,那就是时间越长,历史中的信噪比越高,受到随机性干扰越小,具有较好的抗随机性。

除了历史,在现实中,有效区分噪音(随机性)和信息(非随机性)也是非常重要的事情。比较好的手段包括:

  • 经历时间越长的思想,其内含的噪音越少;
  • 当面临不确定的情境时,恰当的做法是系统性地排除掉新观念、新信息、新方法;
  • 在决策时,大量的新信息只是随机噪音,不仅仅令人分心、毫无作用,而且有害;
  • 尽量少接触媒体,断绝获得信息的渠道,尽量阅读信息发表频率较低的媒体,在投资上是有帮助的。

第四章 随机性,胡言乱语和科学人士

上一章中,作者借着区分噪音和信息,顺便抨击了新闻人士大多数时间只是在传递噪音。在本章中,作者将矛头指向人文学者,尤其是黑格尔(可能也是导致本章中敏感段落没有被翻译的原因)。本章中作者主要要区分的是语言中的随机性(噪音,胡言乱语)和非随机性(信息,真知灼见),上一章则是讨论历史中的随机性和非随机性。

如何不被缺乏见地又胡言乱语的人愚弄?作者提出了一个 “反向图灵测试”。图灵测试是指计算机能够骗到一个人,使其误认为是人类;反向图灵测试是指,我们选择一台没有通过图灵测试的计算机,让它模拟某个人,如果能骗过人类,则该人“缺乏见地”。典型胡言乱语的人包括善于言辞的公司老板,以及一些人文学者(尤其提到了黑格尔,作者认为它是所有胡言乱语的伪思想家之父)。

但是另一方面,作者在美学方面又非常享受被随机性(没有意义的噪音)愚弄。作者认为,随机性反而能带来美的体验。如果要被随机性愚弄,最好是无害且美丽的那部分。

作者总结说,在日常生活中,不需要那么理性、讲究科学,只有在可能伤害和危害生存的状况中才需要这么做。但是现实是,在宗教和个人行为方面,人们非常理智,却在面对市场时显得那么不理性。

第五章 “最不适者”生存——进化可能被随机性愚弄吗?

随机性的问题也存在于进化中,大多数人对达尔文进化论的理解非常天真和幼稚(naïve)。大多数人认为进化论就是强者生存,弱者灭绝,进化只会趋向于往好的方向演进。事实上,对达尔文理论的误用集中在以下两点:

  • 达尔文讨论的是繁殖适应性(reproductive fitness) 的问题,而不是关于生存(survival)。由于有随机性的存在,看似进化的现象很可能只是偏离或退化。世界并不像大多数人认为的,是连续变化的,我们也不生活在事物持续趋向改善的世界中。即使在生物界,也存在新突变劣于旧性状而存活的现象(负突变)。
  • 达尔文讨论的适应性适用于物种的长时间发展,而不是短期。

进化被随机性愚弄的一个重要结论就是,由于存在随机的“罕见进化事件”,那些越适应的“适者”往往对此类事件的承受力越脆弱。而且根据“遍历性”原则,只要时间足够长,这个“适者”一定是“最不适者”。吊诡的地方就在于此:长期而言肯定是“最不适者”,短期内却有很高的存活概率,甚至活得很好,即“最不适者”生存。

具体到投资上,市场上那些“最不适者”——不懂随机性的市场傻瓜(Market fools of randomnes)往往是这样的人:

  • 他们高估了某些方法(经济学或者统计学)的精准程度
  • 和持仓“恋爱”
  • 经常改变说辞,一亏损就变长线投资者
  • 没有提前规划发生亏损时的应对措施
  • 缺乏批判性思维,固守立场不愿止损
  • 否认事实,忽视现实信号

第六章 偏态和非对称性

第一部分讨论的主题是“偏态、非对称性、归纳法”,但是前面五章一直在讲“随机性”,作者希望通过讨论历史(第二、三章)、语言(第四章)、进化(第五章)中的随机性现象,告诉我们这个世界充斥着“随机性”。

本章开始讨论现实随机性的特征之一——非对称性。对离散分布来说,非对称性是说每种可能性背后的结果并不相同;对连续分布(比如正态分布)来说,是指分布曲线左右不对称的情况。或者说,中位数和均值(期望)不等的情况。统计学中用偏度来实数随机变量概率分布的不对称性。

虽然学习中很容易学到非对称性的知识,但是将其应用于实际,大多数人做的并不好,主要是因为很多现象人们没有意识到不是正态分布,而是偏态分布,比如癌症的期望寿命。

在偏态分布中,概率没有那么重要,重要的是期望值,但是大多数人只盯着概率。举例来说,在投资中,人们经常混淆看涨看跌与做多做空。看涨跌讨论的是多大概率上涨还是下跌,做多做空是考虑概率乘以波动空间后的期望报酬。比如认为70%概率上涨1%、30%概率下跌10%,则应该看涨做空。

在一个典型的偏态分布的随机性市场中,稀有事件是必然存在的东西。虽然在概率上,稀有事件非常罕见,但考虑到发生后带来的巨大后果,就不能视而不见。很有趣的是,稀有事件虽然在概率上“稀有”,却经常发生。

但是传统科学却习惯于将异常值剔除,这种问题也存在于借鉴传统科学方法的计量经济学(统计学)和金融工程中。金融工程中,人们往往依据过去的一个时间序列来预测未来,而忽略了稀有事件的存在。统计学家往往察觉不到稀有事件,则是因为两个原因:

  • 知识的不对称性:统计上得到的信息越多,置信水平越高,但与观察的数量不是线性关系。在偏态分布中,大概率事件的频繁发生只能增加一点点置信水平,而小概率事件只要发生一次就会大大增加否定大概率事件的置信水平,也就是波普尔的证伪主义。(也就意味着稀有事件并不需要大规模观察值就能拥有比较高的置信度)
  • 统计的平稳性问题:统计学假定了样本都来自同一总体,底层是不变的。但是现实是,总体本身的概率分布就是依从概率分布的。

正如第三章中作者提到向历史学习一样,真正向历史学习不能仅仅观察近期的历史(就像金融工程做的那样),因为短期历史有很强的偶然性,而应该去了解更加长期的历史表现。

面对稀有事件和偏态市场,作者在本章提出了自己的应对之道(其实这里已经开始铺垫《反脆弱》里的内容了)。作者认为,由于人类心理偏差的原因,稀有事件在市场上并没有得到合理的价值,而且事件约稀有,价格越低估。既然稀有事件无可避免,与其回避,不如更加积极,通过“欹斜下注”的方式,靠稀有事件挣钱(频率罕见,但回报丰厚)。

第七章 归纳法的问题

人类从哲学发展到近代科学,一个很重要的变化就是重视“经验观察”,强调通过对真实世界的观察得到结论,而不是自我演绎。但是这其中无法规避的是归纳法的缺陷——黑天鹅问题:无论看到多少白天鹅,我们也没办法推断出所有的天鹅都是白的,但只要发现一只黑天鹅,就足以推翻这个结论。

塔勒布认为,科学研究方法本身没有问题,问题出在科学方法的使用场景上。数据不应该用于证明某个推断,而应该用于否定它。这背后的核心世界观是波普尔的证伪主义,虽然作者认为真正的“波普尔主义者”不是波普尔,而是索罗斯。

这种对世界的理解在投资上带来的一大变化就是,任何统计学的概率预判都无法用来判断一个事情是否即将发生。因此,利用统计学的规律去管理风险或者预估亏损是非常危险的。这也是我自己对国内很多量化策略和量化投资人嗤之以鼻的原因。他们中的大多数人都是不懂随机性的傻瓜,却因为“科学的”数据膨胀了自己莫名其妙的信心。

真正比较好的应对不确定性的策略是,利用统计学和归纳法非对称下注:在保证亏损是有限的前提下,利用统计规律进行下注。正如莫尼什·帕伯莱(《憨夺型投资者》的作者)的说法——“正面,我贏;反面,我輸不多”。

第二部分:打字机前的猴子:幸存者及其它偏差

作者在第一部分中探讨了几种典型的情况:历史、语言、进化。随机性的特征充斥其中,但是人们没有认识到其中的随机性,也没有理解当随机性事件发生时的结果特征——偏态和非对称性。因此,人们用归纳法理解这个世界,会出非常大的问题。

第二部分主要是讲随机性导致的认知偏差,不过这部分已经有很多文章讲了,连作者自己都说这个部分非常“鸡肋”。

第八、九章 幸存者偏差

第八章原标题为《到处是“邻家的百万富翁”》,第九章原标题为《买卖证券比煎蛋容易》。这两章都是在说明一个认知偏差:幸存者偏差。

第八章先介绍了一下幸存者偏差。人们倾向于认为,实现的历史就是所有随机性历史中最具可能性的那一个。但事实上,实现的历史可能就是偶然发生的一个随机过程。表现最好的往往能够让我们看到,因为失败者都淹没于无闻。

第九章则讨论了幸存者偏差在现实生活中的具体表现,尤其是在历史时间序列(或者具体来说,投资者的历史净值表现)中的反直觉特征

作者首先做了一个蒙特卡罗实验,设计了一群期望收益为负的个体,不断进行投资,事实上依然会有少数人拥有良好的历史净值表现。这里体现出两个历史时间序列的反直觉特征:

  1. 一个完全由糟糕的基金经理组成的群体仍会产生少量优秀的历史净值表现;

  2. 一个业绩净值表现的最大期望值,更多地取决于初始样本的大小,而不太取决于每个基金经理的个体期望收益。具体来说,某个市场中优秀基金经理的人数取决于从业人数而不是个人的水平。

如何定义幸存者偏差?人们往往通过样本来推断总体,但是当表现较好的群体更容易出现在样本中时,这个样本推断的总体是有偏的。这两个总体的差异就是幸存者偏差。

在现实中,一个基金经理的历史业绩既无意义也没必要,理解一个投资经理的交易风格比历史业绩重要的多。了解这位基金经理所属群体的人数多少和总体成功率,才能正确评估一位基金经理的真实水平。

偶然事件的分布特征:偶然事件发生的次数并不偶然,随机事件发生的频率并不随机。很多偶然事件是经常发生的,随机事件却可能呈现出一定的规律性。

因此,作者最后得出结论,对于随机性导致的结果,由于缺乏更多的信息,最好处理办法是不做判断。

第十章 成功靠的是运气

第十章原标题为《输者通吃:人生中的非线性》。这一章比较有意思,作者将非线性现象随机现象结合,讨论了一个著名的现象:蝴蝶效应

比较常见的非线性现象:

  • 沙堆效应(sandpile effect):如果你一粒一粒的把沙粒堆起来,直到能垒起一个大约像拳头大小的沙堆,你怎么才能知道,什么时候这个小小的金字塔会突然倒塌。在临界状态下,任何一个微小的干扰都会导致或大或小的崩溃,即“压垮骆驼的最后一根稻草”;
  • 路径依赖结果(path dependent outcome):比如键盘的布局并没有采用最理想的顺序,但是更好的布局却很难推广;比如演员的走红会导致越来越多的人欣赏他们从而导致更走红;
  • 网络外部性(network externalities):比如微信、QQ、微软的office产品等等。大部分人选用这个软件,只是因为别人在都在用。

比较常见的随机性:现实中,存在大量不理性的偶然行为,比如招聘选人、一时起念、偶然见面等。

将随机性和非线性现象结合起来就是蝴蝶效应(《混沌理论到底是什么——从蝴蝶效应出发》):在一个动力系统中,初始条件下微小的变化能带动整个系统的长期的巨大的连锁反应(来源:百度百科)。

塔勒布没有使用蝴蝶效应这个词,反而用了一个比较陌生的模型——波利亚罐子模型。这个模型更能够揭示其背后的原理——现实中的概率论往往因不满足“独立性”的假设(下一次拿球的概率与上一次拿的是什么球有关),而呈现出与教科书完全不同的样子。

波利亚罐子模型:一个罐子中有五个红球,四个黑球,三个黄球,两个绿球,一个蓝球。先随便抓取一个球,然后把它和另一个相同颜色的球放回到缸内。重复着这个过程,直到填满整个缸为止。有一个网站专门做了一个模拟程序,感兴趣的可以去尝试一下:波利亚罐子模拟器

这个模型有一些比较有意思的特性:

  • 竞争中开始就有利的一方,最终在竞争中胜出的概率会更高;
  • 如果一开始差距不是太大,一开始弱势的一方逆袭的可能是存在的;
  • 如果一开始差距实在太大,逆袭的可能性大大减小(不是完全不可能);
  • 重复无数次,会有完全不同的结果。

很多时候,人生和投资也是这样的过程(《波利亚罐子模型的现实意义》《如何增加赢的概率》《利息理论的读书笔记》)。

  • 原先不如你的人最后比你强的概率是很大的(尤其是和你差距没有那么大的时候);
  • 人生一开始的优势没有那么重要,不断积累的优势往往才是决定性的;
  • 学会利用复利和路径依赖,威力无穷。

在这种充满随机和不确定性的非线性系统中,塔勒布再一次鄙视了哪些用计量经济学和数学计算研究经济和投资的“经济学家”。这些问题不会有答案,却可以通过蒙特卡罗模拟来直观地得到答案。在随机世界中,数学只是一种思考方式,除此以外几乎没有其他作用。

最后,塔勒布提到了这个现象的一个实际用途——在遇到僵局的时候,善用随机性打破僵局,比如扔硬币。由于非线性现象的存在,僵局往往迎刃而解。

第十一章 随机性和我们的大脑:我们是概率盲

本章塔勒布主要探讨了一些反直觉的概率特性:联合概率、条件概率和概率分布的非线性特征。

  • 联合概率的特性是,如果多个大概率事件同时发生,其概率小于任一事件的概率;
  • 条件概率的特性是,特定条件下的概率不等于无条件下的概率;
  • 概率分布非线性的特性是,小概率事件发生,对原有判断会有非常大的影响。

此外,作者还讨论了置信水平的问题。在面对不确定的事物发表看法或观点时,置信水平(或者说,特定置信水平下的标准差)往往比估计值更加重要。

这里需要补充一下贝叶斯概率公式的理解。大学学习贝叶斯公式时,主要是为了应试,既没有深刻理解,也没有办法运用于生活中。

在理解贝叶斯公式方面,以下三份材料值得一看:

第一份材料来自于3Blue1Brown的视频:《贝叶斯定理,使概率论直觉化》、《贝叶斯定理的简洁证明》。

贝叶斯定理最根本的结论是说,新证据不能直接凭空决定你的看法,而是应该更新你的先验看法(之前的经验)。已有的证据限制了概率空间,因此贝叶斯定理的本质是要去思考新概率空间里面事情发生的比例。

An image to describe post

图片来自视频截图

当你有一些假设,同时你得到了一些证据,你想知道在这个证据存在时假设成立的概率。首先考虑在没有证据的情况下,假设成立的概率(叫做“先验概率”,Prior),然后再考虑在假设成立条件下看到证据的概率(叫做“似然概率”,Likelihood)以及在假设不成立的条件下看到证据的概率。条件概率(也叫做“后验概率”,Posterior)最终等于先验概率乘以似然概率除以证据出现的概率,是指当你看到证据后,你对假设成立与否的看法。

视频也提供了一个图像化分析此类问题的方法:

把整个概率空间想象成一个1x1的正方形,任何事件都对应概率空间的一个子集,事件发生的概率就是子集的面积。

  1. 首先根据假设的概率,将正方形切分成两个矩形(其中一个矩形的宽是先验概率);
  2. 在特定假设的矩形中,再切割出现证据的概率面积,同样在假设不成立的矩形中,也切割出现证据的概率面积,最后得到一个L型的面积;
  3. 条件概率就等于假设成立那部分的矩形占L型的面积比。

如果无论假设成立与否,证据出现的可能性都相同,后验概率等于先验概率。或者说,证据与假设无关,新证据并没有改变你的看法;但如果证据的似然概率在假设成立与否的不同情况下差别巨大,那么后验概率就会和先验概率差别很大了,也意味着新证据改变了你的看法。

第二份材料来自于伤神的博客《深入浅出——理解条件概率、全概率公式和贝叶斯公式》。博客对贝叶斯公式有更加全面的理解,如果觉得视频深度不够,可以参考这篇文章。

这篇文章提供另一种图像化分析此类问题的方法(见下图),而且更具有普适性(视频中证据出现的情况只有假设成立和假设不成立,伤神的方法还考虑了有多种可能性的情况)。

An image to describe post

在人类的实践活动中,通常原因是未知的,所以我们需要通过结果来推断出原因;而且,我们通常只知道结果(的概率)但并不知道原因(的概率)。贝叶斯公式可以解出,谁作为原因得到结果的可能性最大,

第三份材料则和投资更相关,来自于胡彧的《成长性行业与公司研究的基本框架》。

An image to describe post

可以看出,什么时候一个新的信息比较重要?或者说,什么时候P(B|A)会远大于P(B)?主要包括两个条件:

  1. 证据本身是小概率事件,P(A)足够小;

  2. 证据本身大概率是假设的结果(或格兰杰因果检验显著),B发生后A就会发生,P(B|A)足够大。

第三部分:充耳不闻——与随机性共处之道

如何在这样一个随机性的世界中生存,塔勒布没有说的特别明确。总体来说,你应该意识到我们自身的缺陷,并且努力克服它,一个比较好的方法就是充耳不闻(不看新闻和分析师的观点)。

有两件事情是人类生物性上的倾向:

  • 在两件先后发生的事情之间建立因果联系(往往表现为迷信);
  • 观点存在路径依赖,会坚持最初的观点。

如何改善?

  • 不以否定自己的观点为耻;
  • 举止优雅,无论出现什么状况都不改变表现出来的行为。命运女神唯一不能控制的东西,是你的行为。