预测的认识论 — 从企业分析到方法论重构

01 —研究起点

一篇穿越三十年的预言

1994年5月，英国《独立报》专栏作家哈米什·麦克雷写下了一篇预言文章，大胆预测三十年后的世界——也就是我们所处的2020年代——在人口、能源、技术、社会等领域将发生的深刻变化。

彼时，互联网尚未商业化，智能手机是科幻概念，中国人均GDP不足500美元。麦克雷却已在想象：光纤将改变通信世界，电话会变成可视化的，全球变暖将成为核心挑战。

三十年后回望，这篇文章有哪些命中靶心？有哪些明显偏差？它又揭示了哪些关于预测这件事的深层规律？这场分析对话正是从这里出发。

11

✓ 基本准确

7

⚠ 部分准确

3

✗ 明显偏差

~72%

综合准确率

预测准确度分布共21项核心预测

准确 52% 部分准确 33% 偏差 15%

各领域预测准确率（雷达图）

这篇文章最惊人的准确之处，是在1994年——互联网商业化元年——就预见到"给澳大利亚打可视电话，费用不到10便士"。三十年后我们天天用微信视频，那一刻，他的预言成了历史。

技术领域准确率接近92%，是所有领域中最高的；社会政治领域最低，约52%。这个落差本身就是一条重要规律：物理系统可以预测，人类系统几乎不可预测。

02 —报告评析

发现的问题与可能的改进

原始报告在框架设计和视觉呈现上颇具水准，但在评估方法论上存在几处值得指出的问题——有硬错误，也有需要细化的地方。

!

数据矛盾

雷达图 JS 数据与备用文字不一致

JavaScript 中写入的数值为 [62, 73, 92, 83, 52]，但 canvas 元素的无障碍备用文本却写着"人口65%、能源70%、技术95%、住房交通85%、社会政治55%"——两组数字完全不同，必须统一。

!

逻辑错误

"未提及"被算作"偏差"——类别混淆

报告将"（未提及）中国的崛起、人工智能革命、社交媒体"评为 ✗。这是根本性的类别错误——没有预测和预测错了是两回事。把"沉默"计入"偏差"，既压低了准确率，也混淆了评估标准。建议把这条单独列为"重大盲区"，不纳入准确率计数。

?

方法不透明

"72%综合准确率"计算逻辑未说明

若以 ⚠ 算 0.5 分，则 (11 + 7×0.5) / 21 ≈ 69%，凑不到 72%。读者无法复现，降低了分析的可信度。应在报告中明确加权规则。

?

判断可商榷

"技术减少犯罪"评为 ✗ 过于简单

分析说"网络犯罪反而大量增加"，但1990年代后西方国家经历了显著的"犯罪大退潮"——暴力犯罪、财产犯罪均大幅下降，监控技术、数据库有明显贡献。这条应评为 ⚠ 而非 ✗。

+

可补充

缺少评分标准（Rubric）

✓/⚠/✗ 的判定边界是什么？人口预测数量高估 8% 算 ⚠ 还是 ✓？建议加一句评分说明，增强可信度。

+

可补充

缺少参照系——72% 好不好？

和谁比？学术文献显示一般专家的30年预测准确率在40–60%之间。有了基准，72% 才有意义。

+

可补充

没有讨论"幸存者偏差"

我们只看到麦克雷选择写下来的预测，不知道他考虑过但放弃的预测有哪些。这影响对其"预测能力"的整体评价。

+

可补充

没有区分"方向对了但量级错了"

人口预测方向完全正确，但数量高估约8%（85亿 vs 78亿）。这和"完全方向相反"性质不同，建议增加这个维度。

+

可延伸

六条规律与具体预测的对应关系较松

六条规律读起来更像独立的 forecasting 格言，而不是从21条具体预测归纳出来的。如果每条规律能附上"哪几条预测印证了这一规律"，说服力会强很多。

03 —预测的认识论

关于预测本质的六个洞见

超越"对了几条、错了几条"的评分框架，去追问预测这件事的本质，能看到更根本的东西。以下六个洞见，是比麦克雷文章本身更值得深思的内容。

01

预测的悖论：说出来就改变了它

物理系统不会因为你预言它而改变行为，但社会系统会。如果1994年有人写"30年后中国将超越美国"，这个预言本身就会影响美国的政策、资本的流向、中国的战略自信。预测者既是观察者，也是参与者。

关键区分：你能预测日食，因为月亮不会读你的报告；你很难预测战争，因为你的预测本身就是一个变量。

02

真正的盲区是"想都没法想"的

说麦克雷"没预测到AI、社交媒体、中国崛起"，定性为"失败"并不公平。更准确的说法是：他的认知框架里没有这些事物存在的位置。1994年"社交媒体"这个词不存在，AI还是学术小众话题。

深层洞见：不是预测能力的问题，是语言和概念的问题。你只能预测你能命名的事物。真正颠覆历史的东西，在发生之前连名字都没有。

03

准确≠有价值，错误≠没价值

马尔萨斯预言人口增长终将超过粮食供应——这个预言从某种意义上"错了"，正是因为它激起了恐慌，推动了农业技术革命。它的错误是一种自我否定的预言（self-defeating prophecy）。

关键洞见：预测的价值不在准确率，在于是否改变了决策。这个视角在几乎所有预测框架中都被忽视。

04

预测的真实功能：控制焦虑

人类为什么执迷于预测，即使它经常错？面对不确定的未来，大脑无法在"完全未知"的状态下运作。预测——哪怕是错误的——提供了一种虚假的确定性，让人能继续行动。气象预报、经济预测、占星术，心理功能上其实是同一件事。

推论：为什么预测专家反复被证明不准，但人们仍然信任、付钱请他们——因为需求不是准确，是安慰。

05

最好的"预测"是构建鲁棒性

有一种更深刻的应对不确定性的方式，是不预测具体结果，而是构建对多种结果都能存活的系统。军事上叫"全域作战能力"，金融上叫"反脆弱"，生态学上叫"物种多样性"。

核心洞见：未来不是一条线，而是一个扇形。真正的智慧不是猜中那条线，而是让自己站在扇形中心——无论哪条线实现了都能活下去，甚至受益。

06

时间长度与预测难度的关系是非线性的

常识认为预测期越长越难。但某些长期趋势比短期趋势更容易预测。人口结构30年后怎样，比明年股市涨跌容易判断得多。为什么？长期趋势由慢变量主导（人口、物理、技术积累），短期波动由快变量主导（情绪、政治、随机事件）。

关键纠正：不是"长期预测难"，而是"预测快变量难"。时间长短是表象，变量类型才是本质。

预测的终极困境，不是信息不足，而是预测者本身就活在他要预测的系统之内——他的语言、他的行动、他的焦虑，都是变量。这是麦克雷的局限，也是所有预测者共同面对的处境。

04 —企业预测的二元困境

消费型与科技型企业的预测差异

当把预测框架从宏观世界带入企业分析，一个核心问题浮现：预测消费型企业和科技型企业，差异是根本性的——因为它们的锚点、护城河性质、失效模式都完全不同。

维度	🟢 消费型企业	🔴 科技型企业
预测锚点	锚在人性中不变的部分：归属感、享乐、认可、仪式。可口可乐卖的不是糖水，是"那种感觉"。	锚在技术代际。技术代际是会断裂的，而且断裂点几乎无法预判。
护城河性质	社会性护城河：品牌、习惯、渠道、信任。建立慢，消亡也慢，有预警信号。	技术性或网络性护城河。一旦底层范式转移，护城河瞬间变成包袱（遗留代码、路径依赖）。
财务数据的意义	历史财务是高质量参考。稳定的毛利率对未来有真实预测力。	历史数据经常是陷阱。爆发期低估价值（亚马逊的"不盈利"），衰退期高估价值（停止研发后的账面利润）。
竞争对手来源	显而易见且相对稳定。可口可乐的对手是百事，不会突然变成一家科技公司。	最危险的竞争对手来自意想不到的方向。柯达的对手不是富士，是手机；出租车的对手不是另一家出租车公司，而是写软件的团队。
核心预测问题	它十年后还在（基本确定），然后判断它会更好还是更差。	它十年后是否还存在——这个问题本身就不确定，必须先回答。
失效模式	慢性病：有症状，有预警，有时间响应。	相变：水在99度时还是水，100度时突然成蒸汽。在事前几乎无法精确预测那1度。

    一个重要的当代趋势：最好的消费型企业开始变得越来越像科技企业（Nike靠数据分析用户行为、星巴克靠App建立金融飞轮），而最好的科技企业开始变得越来越像消费企业（苹果卖的是生活方式认同，微信的护城河是社会关系链）。今天最难预测的企业，恰恰是那些横跨两个范式的公司——它们既有技术迭代的不确定性，又有品牌社会性的复杂性。
  

预测消费型企业，核心问题是"人性会变吗"；预测科技型企业，核心问题是"这项技术还有多少时间"。前者锚定在人类几千年不变的底层，后者锚定在一个每十年就可能断裂一次的技术代际。

05 —连续谱框架

资产半衰期与衰减模式

二元论是个方便的起点，但它遮蔽了真正有趣的东西。一个更诚实的框架需要两个核心维度：资产的半衰期，以及衰减过程本身是否可预测。

每家公司的价值，其实存储在一组不同类型的资产里，这些资产以完全不同的速度在衰减。一家公司的可预测性，大致等于它核心资产半衰期的加权平均。

物理基础设施

20—50 年

监管特许权

10—30 年

品牌与文化意义

10—25 年*

客户惯性与关系

3—10 年

网络效应

3—15 年

技术优势

1—5 年

算法与模型优势

0.5—3 年

* 品牌资产通常稳定，但存在突然死亡的风险（胖尾分布）

但半衰期只是第一个维度。还需要第二个维度：衰减过程本身是否可预测——是平滑衰减，还是偶尔突然死亡，还是双峰分布（要么强者愈强，要么迅速崩解）？

企业可预测性坐标系 — 资产半衰期 × 衰减模式

高可预测性区域中等可预测性低可预测性区域

第三个维度：你在哪个层次做预测

任何一家企业同时存在于好几个层次，每个层次的稳定性完全不同。好的预测应该先声明自己在哪个层次做判断，然后给出那个层次相应的置信度。

L1

人类需求层

归属、享乐、安全、认可——人类几千年来的恒定底层需求

极度稳定
✓✓✓✓✓

L2

行业品类层

咖啡、饮料、支付、社交——品类本身的存续逻辑

比较稳定
✓✓✓✓

L3

商业模式层

订阅制、广告驱动、平台双边——价值捕获的具体方式

中等稳定
✓✓✓

L4

竞争地位层

市场份额、定价权、网络效应强度——相对竞争格局

不太稳定
✓✓

L5

具体产品技术层

当前产品形态、技术架构、算法——最具体也最易变

最不稳定
✓

    常见错误：把在某个层次的确定性，错误地转移到另一个层次。你可以对"人类需要社交连接"（L1）有九成把握，但对Facebook具体的广告商业模式（L3）的判断，不能因此也有九成把握。两件事完全可以同时成立：L1极度确定，L5高度不确定。
  

06 —生产关系视角

换一套语言思考企业

之前所有框架——半衰期、技术代际、护城河——本质上都在分析生产力的问题。生产关系问的是另一套问题：谁在生产？谁拥有生产资料？谁在分配价值？这个安排，各方真的接受吗？

    核心命题：每家公司本质上是对以下问题的一个具体回答——价值由谁创造、被谁捕获、风险由谁承担、这个安排被各方认为合法吗？当这套答案处于均衡状态，公司是稳定的，可以预测；当答案内部出现张力，公司进入不稳定期，预测难度急剧上升。
  

创造价值 vs 提取价值的反事实测试

有一个简单的反事实测试：如果这家公司明天消失，它所在的生态系统会变好还是变差？

价值创造 ←————————————→ 价值提取

茅台

Visa

苹果

平台悖论：用户既是消费者，也是生产者，却不拥有生产资料

平台型科技公司发明了一种历史上前所未有的生产关系：用户创造了内容、维系了社交关系，这是真实的价值生产。但生产资料——算法、数据基础设施、分发权力——由平台拥有。这个安排在很长时间里是不透明的，用户没有意识到自己在扮演什么角色。

    预测含义：这是一个内在不稳定的生产关系，因为它依赖于提取的不可见性。一旦这个提取变得可见——通过监管调查、公众讨论或泄露的内部文件——原本看似稳定的结构会快速崩塌。Facebook在2018年剑桥分析事件后的舆论崩塌，不是技术出了问题，是生产关系的合法性突然消失了。
  

最有趣的当代案例：AI公司的生产关系危机

大语言模型是用人类几十年积累的文字、代码、艺术训练出来的。这些内容的创造者——作家、程序员、艺术家——既没有被征询同意，也没有获得补偿，但他们的劳动成果构成了AI能力的基础。目前的诉讼浪潮不只是版权纠纷，是更深层的生产关系冲突的第一波信号：谁拥有用于训练AI的人类知识，这个问题还没有被回答。

    预测含义：今天AI公司的预测难度，不只来自技术迭代的快速，更来自它建立在一组尚未被各方接受为合法的生产关系之上。这个不确定性，用技术分析的框架几乎完全看不到。
  

生产关系视角给出的三条预测原则

P1

提取越隐蔽，崩塌越突然

显性的价值交换是稳定的，各方清楚安排是什么。隐性提取在不可见时稳定，但一旦变得可见，崩塌速度远快于显性模式。关注"可见性临界点"何时到来。

P2

生产力变化快于生产关系时，预测系统性失效

互联网出现了三十年，平台劳动关系的法律框架还在形成中。生产力跑得比生产关系快的那段时间，是预测最不可靠的时期。

P3

生产关系被嵌入文化的公司最稳定

最高层次的稳定，不是合同，不是技术锁定，而是生产关系被参与者内化为自然秩序。茅台的消费者不觉得自己在被提取价值——他们觉得自己在参与一种有意义的社会仪式。

07 —经济特性识别

什么是真正好的商业模式？

经济特性有好有差，有可持续的，有不可持续的。识别它们的关键，是六个诊断性问题——每个问题都能看到不同的东西。

01

这家公司在创造价值，还是在提取价值？

✓生态系统因它存在而净受益；消失后整体变差

✗只是价值转移；消失后生态系统变好或不变

反事实测试：如果这家公司明天消失，生态系统会变好还是变差？

02

谁在承担这个模式的真实成本？

✓成本真正内部化，利润是真实的剩余价值

✗大量成本外部化给骑手、环境、公共卫生系统

外部化成本迟早被收回——通过监管、诉讼或社会压力。把所有成本列出来，包括不在财务报表上的。

03

定价权来自哪里？来源决定耐久性。

真实差异化

最耐久，难以复制

转换成本

稳固，但可被克服

网络效应

强但可能崩塌

信息不对称

系统性被压缩

监管保护

政治性的，可被收回

04

规模扩张是强化还是侵蚀经济模型？

✓边际成本趋近于零（软件、平台）——规模是纯粹的朋友

✗每增加一个用户都要亏损，寄望于"规模后再盈利"——庞氏逻辑

追踪每个增量用户/客户/交易的边际贡献是在上升还是下降？不要被总收入增长迷惑。

05

再投资需求有多高？再投资回报有多好？

✓几乎不需要再投资就能维持竞争地位，且再投资回报率极高

✗把赚的钱全部再投回去才能维持地位，自由现金流近乎为零（航空业）

看自由现金流 / 净利润的比率。接近 1 = 利润几乎全转化为真实现金。远低于 1 = 账面好看但现金流薄弱。

06

增长在稀释还是强化核心竞争力？

✓增长强化了护城河、品牌、网络——越大越强

✗快速扩张后平均质量下降，让公司离自己最擅长的事越来越远

对比增长最快的业务和核心业务的单位经济。如果新业务单位经济系统性弱于核心，增长在稀释价值。

应当这样判断，应当避免这样判断

可持续经济特性的共同特征

资本回报持续超越资本成本，无需连续注资
定价权来自真实差异化或转换成本
单位经济随规模稳定或改善
成本真正内部化，无大规模外部化
增长强化而非稀释核心竞争力
生产关系各方都有足够激励留在安排里

不可持续经济特性的预警信号

需要持续资本注入才能驱动增长
利润来自信息不对称或监管保护，随时可被收回
增长时单位经济持续恶化
大量成本外部化给供应商、劳动者或社会
增长让公司离核心能力越来越远
生产关系各方存在明显张力，提取依赖不可见性

所有"好经济特性"都可以退化，所有"坏经济特性"在某些条件下也可以被修复。识别它们，不是为了贴标签，而是为了判断这组生产关系正在向哪个方向演化，演化的速度有多快。

真正不可持续的经济特性，往往有一个共同结构：现在的利润是通过某种方式透支未来的。透支环境、透支劳动者、透支用户信任、透支资本市场的耐心——每一种透支都有它自己的还款日期。

各类经济特性可持续性评分（综合示例）

08 —预测方法论

四个要素构成完整预测体系

好的预测需要四个相互支撑的条件：知识渊博、证据充足、逻辑完备（结构外推而非类比外推）、尺度约束（数学直觉）。这四个要求不是经验总结出来的"最佳实践"，而是有内在的逻辑顺序和不可替代性。

    核心矛盾：大多数预测用的是类比外推——X像Y，Y发生了Z，所以X也会发生Z。它不关心机制，只看表面形态是否相似。一旦进入类比对象没有经历过的区域，模型就完全失效，而预测者甚至不知道自己已经失效了。
  

类比外推（Analogical）

模式匹配跨越语境

X像Y → Y发生Z → X也会发生Z
只看表面形态相似性
不需要理解中间机制
在训练分布内插值效果好
一旦外推立刻失效
失效时预测者自己不知道

类似机器学习里的判别模型——拟合输入输出映射，对分布外样本无能为力

结构外推（Structural）

从机制推导轨迹

识别驱动变化的真实机制
找到不变量、速率约束、耦合关系
在约束空间内推导可能轨迹
能告诉你哪些轨迹不可能
外推时仍有可靠性
失效时有可识别的前兆

类似机器学习里的生成模型——建模数据生成过程，可以在未见过的区域做可靠推断

①

硬过滤层

尺度约束——先排除不可能的

在讨论"什么更可能"之前，先把物理上不可能的轨迹整体过滤掉。这不是一个权衡层，而是一个硬边界。违反尺度约束的预测，不是"不太可能"，是"概率严格为零"。

具体工具：增长率乘法（7%×30年=7.6倍，意味着多少资源？）；物理转型速度（60万亿美元能源资产，25年寿命，最快多快能替换？）；计算约束（这个AI能力需要多少算力，现在能制造多少？）；Fermi估算作为量级检验

②

机制基础

知识渊博——构建准确的生成模型

不是记住更多案例，而是理解足够多不同领域的内在机制，从而识别它们之间的真实耦合，而不是表面类比。宽度和深度同等重要。同时包含一种元知识：清楚地知道自己的机制理解在哪里终止，在那里相应扩大不确定性区间。

警告：专业知识有时让预测变差。领域专家的先验被太多证据强化，新的范式转移证据需要极大的强度才能更新这个先验。专家预测失败，经常不是因为不够聪明，而是因为先验太强。

③

位置锚定

证据充足——精确测量当前状态

证据不只是"支持你的观点的数据"，这是确认偏误。证据充足需要三层：（1）精确测量当前位置，不是"大约在哪里"；（2）测量变化率——一阶导数和二阶导数，不只是当前值；（3）主动寻找反驳性证据——找到它要么推翻预测，要么精炼模型，都是好事。

核心判别标准：有效的证据是似然比最大的证据——能最大程度区分不同假设的可观测量。一堆与所有假设都兼容的证据，其实没有更新任何东西。

④

结构推导

逻辑完备——从机制推导，不从模式外推

给定生成模型、当前位置、尺度约束，推导出哪些轨迹是必然的、哪些是可能的、哪些是不可能的。好的预测结论包含：方向（确定）、区间（有界）、概率（分布）、条件（触发条件是什么）、关键变量（哪些参数的变化会改变结论）。

完整预测的样子："中国出生率到2040年极可能在0.9—1.2之间，中位情景约1.05。反弹需要托育补贴占GDP的3%以上并在5年内落地（概率15%）；进一步下滑到0.85以下的概率约20%，条件是城镇化率超过75%叠加住房成本继续上升。" ——而不是"会继续下降"。

四个要素对预测质量的影响——缺失任一要素的后果

这个方法论让你对越来越多的问题说"不知道"，同时让你对少数核心问题异常确定。对不知道的问题承认不知道，是诚实的代价；对结构清晰的问题，它给出的判断会比专家共识更准——因为它依赖的是结构的内在逻辑，不是权威的背书。

09 —认知科学基础

贝叶斯大脑的具体化

四个预测要素不是任意组合出来的，它们是贝叶斯最优推断在人类认知能力范围内的有限逼近。对应关系是精确的、结构性的，而不是表面类比。

P（假设 | 证据）∝ P（证据 | 假设）× P（假设）

P(H|E)

后验概率
预测结论

→ 逻辑完备推导

∝

P(E|H)

似然函数
证据精度

→ 证据充足

×

P(H)

先验分布
生成模型

→ 知识渊博

+ 超先验约束

∀H∉Ω

超先验约束
物理不可能区

→ 尺度约束

这个对应不是装饰性的，每一层的功能在贝叶斯框架里都有精确含义。

超先验

尺度约束（物理定律、数学守恒）

不是"很强的先验"，是比任何经验先验都高一层的超先验。违反它的预测不在似然函数有定义的区域内——任何量的证据都无法把后验推进那个区域。这解释了为什么尺度约束是硬过滤而不是软权衡。

∞

精度

先验

知识渊博（生成模型）

贝叶斯大脑的核心是生成模型——对"世界如何运作、原因如何产生结果"的内在表征。知识渊博不是记住了更多案例（查表），而是拥有一个更准确的生成模型，能从机制上推导先验。结构外推用的是生成模型，类比外推用的是判别模型，这正是它们预测能力差异的根源。

高

精度

似然

证据充足（P(E|H)的精度）

证据的作用由似然函数决定。证据充足不只是数量多，而是能有效区分不同假设。一堆与所有假设都兼容的证据，似然函数是平的，后验几乎等于先验——等于没有学到任何东西。好的证据选择是主动寻找似然比最大的可观测量。

中

精度

后验

逻辑完备（结构推导 → 后验分布）

贝叶斯推断在数学上是完备的，但输出质量完全取决于模型设定是否正确。错误设定的生成模型，拿再多证据做再正确的推断，只能在错误的空间里越来越自信地走向错误结论——这叫模型设定误差，是贝叶斯系统最危险的失效模式。结构外推的本质，就是追求模型设定的正确性。

推导

结果

主动推断（Active Inference）：推断循环永远是闭合的

Friston的主动推断框架把贝叶斯大脑从被动推断延伸到主动行为：大脑不只是更新对世界的信念，它还采取行动让世界符合它的预测，从而最小化"意外"（free energy）。

主动推断闭合回路 — 预测者与被预测系统的耦合

红色虚线回路表示社会系统中的耦合：预测者的输出进入系统，成为系统演化的一个变量，再经由感知回到预测者。把预测者从被预测系统里抽离是一个理想化简化——在真实社会预测里推断循环永远是闭合的。

为什么人类天生不擅长长期预测

贝叶斯大脑的进化压力，是在秒到天的时间尺度上、用直接感官反馈来校准生成模型。30年尺度的预测任务，是在严重偏离校准域的条件下运行贝叶斯推断——反馈回路太长，先验无法通过经验迭代更新；证据太间接，没有感官信号告诉你30年后的世界。

大脑贝叶斯系统的校准域 vs 长期预测所需的时间尺度

高精度校准区（进化充分优化）部分校准区几乎无校准（长期预测区间）

四类系统性失效——贝叶斯解释

缺失：尺度约束

预测结论落在物理不可能的区域。表现为预测的增长率在数学上无法持续，或转型速度超出了物理约束允许的范围。往往被包装成"乐观假设"。

用Fermi估算做量级检验；在宣布结论前先做一次增长率的30年乘法

缺失：知识渊博（生成模型错误）

机制理解浅薄，用类比代替因果。表现为"X像Y"的推理，忽视了X和Y在结构上的关键差异。是最常见也最隐蔽的失效。

显式说明你认为的因果机制；询问"哪些结构条件让这个类比成立，这些条件在当前案例里存在吗"

缺失：证据充足（似然太平）

选择性使用证据，或使用的证据无法区分竞争假设。后验几乎等于先验——什么都没有更新，只是给已有偏见做了背书。

主动寻找反驳性证据；问"如果我的假设是错的，我应该观察到什么？现在是否观察到了？"

缺失：逻辑完备（模型设定误差）

有了机制和证据，但推断过程中混入了模式匹配。在错误的模型空间里做了正确的推断，结论越来越自信地指向错误方向。

要求预测包含：方向、区间、关键条件、敏感变量。拒绝"方向正确但无法证伪"的预测

四个要求是对最优贝叶斯推断在有限计算资源下的有限逼近。我们做不到完美的贝叶斯——先验无法完整表达，似然无法精确计算，生成模型永远是近似的。但这四个要求告诉你，在人类认知能力范围内，如何系统性地逼近最优推断。

能做好，是例外。不能做好，才是正常状态。这不是智力问题，是贝叶斯系统在失去校准信号时的原理性失效——30年预测根本不在自然选择能给反馈的时间尺度内。