预测的认识论
分析报告 · 2026

预测的认识论

从哈米什·麦克雷1994年的三十年预言出发,重新审视预测这件事的本质、局限与方法论——从企业层面延伸至更深的认知框架。
原始文本:英国《独立报》1994年 作者:哈米什·麦克雷 分析对话:2026年 涵盖九个主题维度
01 —研究起点

一篇穿越三十年的预言

1994年5月,英国《独立报》专栏作家哈米什·麦克雷写下了一篇预言文章,大胆预测三十年后的世界——也就是我们所处的2020年代——在人口、能源、技术、社会等领域将发生的深刻变化。

彼时,互联网尚未商业化,智能手机是科幻概念,中国人均GDP不足500美元。麦克雷却已在想象:光纤将改变通信世界,电话会变成可视化的,全球变暖将成为核心挑战。
三十年后回望,这篇文章有哪些命中靶心?有哪些明显偏差?它又揭示了哪些关于预测这件事的深层规律?这场分析对话正是从这里出发。
11
✓ 基本准确
7
⚠ 部分准确
3
✗ 明显偏差
综合准确率
预测准确度分布 共21项核心预测
准确 52% 部分准确 33% 偏差 15%
各领域预测准确率(雷达图)
这篇文章最惊人的准确之处,是在1994年——互联网商业化元年——就预见到"给澳大利亚打可视电话,费用不到10便士"。三十年后我们天天用微信视频,那一刻,他的预言成了历史。
技术领域准确率接近92%,是所有领域中最高的;社会政治领域最低,约52%。这个落差本身就是一条重要规律:物理系统可以预测,人类系统几乎不可预测。
02 —报告评析

发现的问题与可能的改进

原始报告在框架设计和视觉呈现上颇具水准,但在评估方法论上存在几处值得指出的问题——有硬错误,也有需要细化的地方。

!
数据矛盾
雷达图 JS 数据与备用文字不一致
JavaScript 中写入的数值为 [62, 73, 92, 83, 52],但 canvas 元素的无障碍备用文本却写着"人口65%、能源70%、技术95%、住房交通85%、社会政治55%"——两组数字完全不同,必须统一。
!
逻辑错误
"未提及"被算作"偏差"——类别混淆
报告将"(未提及)中国的崛起、人工智能革命、社交媒体"评为 ✗。这是根本性的类别错误——没有预测预测错了是两回事。把"沉默"计入"偏差",既压低了准确率,也混淆了评估标准。建议把这条单独列为"重大盲区",不纳入准确率计数。
?
方法不透明
"72%综合准确率"计算逻辑未说明
若以 ⚠ 算 0.5 分,则 (11 + 7×0.5) / 21 ≈ 69%,凑不到 72%。读者无法复现,降低了分析的可信度。应在报告中明确加权规则。
?
判断可商榷
"技术减少犯罪"评为 ✗ 过于简单
分析说"网络犯罪反而大量增加",但1990年代后西方国家经历了显著的"犯罪大退潮"——暴力犯罪、财产犯罪均大幅下降,监控技术、数据库有明显贡献。这条应评为 ⚠ 而非 ✗。
+
可补充
缺少评分标准(Rubric)
✓/⚠/✗ 的判定边界是什么?人口预测数量高估 8% 算 ⚠ 还是 ✓?建议加一句评分说明,增强可信度。
+
可补充
缺少参照系——72% 好不好?
和谁比?学术文献显示一般专家的30年预测准确率在40–60%之间。有了基准,72% 才有意义。
+
可补充
没有讨论"幸存者偏差"
我们只看到麦克雷选择写下来的预测,不知道他考虑过但放弃的预测有哪些。这影响对其"预测能力"的整体评价。
+
可补充
没有区分"方向对了但量级错了"
人口预测方向完全正确,但数量高估约8%(85亿 vs 78亿)。这和"完全方向相反"性质不同,建议增加这个维度。
+
可延伸
六条规律与具体预测的对应关系较松
六条规律读起来更像独立的 forecasting 格言,而不是从21条具体预测归纳出来的。如果每条规律能附上"哪几条预测印证了这一规律",说服力会强很多。
03 —预测的认识论

关于预测本质的六个洞见

超越"对了几条、错了几条"的评分框架,去追问预测这件事的本质,能看到更根本的东西。以下六个洞见,是比麦克雷文章本身更值得深思的内容。

01
预测的悖论:说出来就改变了它
物理系统不会因为你预言它而改变行为,但社会系统会。如果1994年有人写"30年后中国将超越美国",这个预言本身就会影响美国的政策、资本的流向、中国的战略自信。预测者既是观察者,也是参与者。
关键区分:你能预测日食,因为月亮不会读你的报告;你很难预测战争,因为你的预测本身就是一个变量。
02
真正的盲区是"想都没法想"的
说麦克雷"没预测到AI、社交媒体、中国崛起",定性为"失败"并不公平。更准确的说法是:他的认知框架里没有这些事物存在的位置。1994年"社交媒体"这个词不存在,AI还是学术小众话题。
深层洞见:不是预测能力的问题,是语言和概念的问题。你只能预测你能命名的事物。真正颠覆历史的东西,在发生之前连名字都没有。
03
准确≠有价值,错误≠没价值
马尔萨斯预言人口增长终将超过粮食供应——这个预言从某种意义上"错了",正是因为它激起了恐慌,推动了农业技术革命。它的错误是一种自我否定的预言(self-defeating prophecy)。
关键洞见:预测的价值不在准确率,在于是否改变了决策。这个视角在几乎所有预测框架中都被忽视。
04
预测的真实功能:控制焦虑
人类为什么执迷于预测,即使它经常错?面对不确定的未来,大脑无法在"完全未知"的状态下运作。预测——哪怕是错误的——提供了一种虚假的确定性,让人能继续行动。气象预报、经济预测、占星术,心理功能上其实是同一件事。
推论:为什么预测专家反复被证明不准,但人们仍然信任、付钱请他们——因为需求不是准确,是安慰。
05
最好的"预测"是构建鲁棒性
有一种更深刻的应对不确定性的方式,是不预测具体结果,而是构建对多种结果都能存活的系统。军事上叫"全域作战能力",金融上叫"反脆弱",生态学上叫"物种多样性"。
核心洞见:未来不是一条线,而是一个扇形。真正的智慧不是猜中那条线,而是让自己站在扇形中心——无论哪条线实现了都能活下去,甚至受益。
06
时间长度与预测难度的关系是非线性的
常识认为预测期越长越难。但某些长期趋势比短期趋势更容易预测。人口结构30年后怎样,比明年股市涨跌容易判断得多。为什么?长期趋势由慢变量主导(人口、物理、技术积累),短期波动由快变量主导(情绪、政治、随机事件)。
关键纠正:不是"长期预测难",而是"预测快变量难"。时间长短是表象,变量类型才是本质。

预测的终极困境,不是信息不足,而是预测者本身就活在他要预测的系统之内——他的语言、他的行动、他的焦虑,都是变量。这是麦克雷的局限,也是所有预测者共同面对的处境。

04 —企业预测的二元困境

消费型与科技型企业的预测差异

当把预测框架从宏观世界带入企业分析,一个核心问题浮现:预测消费型企业和科技型企业,差异是根本性的——因为它们的锚点、护城河性质、失效模式都完全不同。

维度 🟢 消费型企业 🔴 科技型企业
预测锚点 锚在人性中不变的部分:归属感、享乐、认可、仪式。可口可乐卖的不是糖水,是"那种感觉"。 锚在技术代际。技术代际是会断裂的,而且断裂点几乎无法预判。
护城河性质 社会性护城河:品牌、习惯、渠道、信任。建立慢,消亡也慢,有预警信号。 技术性或网络性护城河。一旦底层范式转移,护城河瞬间变成包袱(遗留代码、路径依赖)。
财务数据的意义 历史财务是高质量参考。稳定的毛利率对未来有真实预测力。 历史数据经常是陷阱。爆发期低估价值(亚马逊的"不盈利"),衰退期高估价值(停止研发后的账面利润)。
竞争对手来源 显而易见且相对稳定。可口可乐的对手是百事,不会突然变成一家科技公司。 最危险的竞争对手来自意想不到的方向。柯达的对手不是富士,是手机;出租车的对手不是另一家出租车公司,而是写软件的团队。
核心预测问题 它十年后还在(基本确定),然后判断它会更好还是更差。 它十年后是否还存在——这个问题本身就不确定,必须先回答。
失效模式 慢性病:有症状,有预警,有时间响应。 相变:水在99度时还是水,100度时突然成蒸汽。在事前几乎无法精确预测那1度。
一个重要的当代趋势:最好的消费型企业开始变得越来越像科技企业(Nike靠数据分析用户行为、星巴克靠App建立金融飞轮),而最好的科技企业开始变得越来越像消费企业(苹果卖的是生活方式认同,微信的护城河是社会关系链)。今天最难预测的企业,恰恰是那些横跨两个范式的公司——它们既有技术迭代的不确定性,又有品牌社会性的复杂性。
预测消费型企业,核心问题是"人性会变吗";预测科技型企业,核心问题是"这项技术还有多少时间"。前者锚定在人类几千年不变的底层,后者锚定在一个每十年就可能断裂一次的技术代际。
05 —连续谱框架

资产半衰期与衰减模式

二元论是个方便的起点,但它遮蔽了真正有趣的东西。一个更诚实的框架需要两个核心维度:资产的半衰期,以及衰减过程本身是否可预测。

每家公司的价值,其实存储在一组不同类型的资产里,这些资产以完全不同的速度在衰减。一家公司的可预测性,大致等于它核心资产半衰期的加权平均。
物理基础设施
20—50 年
监管特许权
10—30 年
品牌与文化意义
10—25 年*
客户惯性与关系
3—10 年
网络效应
3—15 年
技术优势
1—5 年
算法与模型优势
0.5—3 年
* 品牌资产通常稳定,但存在突然死亡的风险(胖尾分布)
但半衰期只是第一个维度。还需要第二个维度:衰减过程本身是否可预测——是平滑衰减,还是偶尔突然死亡,还是双峰分布(要么强者愈强,要么迅速崩解)?
企业可预测性坐标系 — 资产半衰期 × 衰减模式
高可预测性区域 中等可预测性 低可预测性区域

第三个维度:你在哪个层次做预测

任何一家企业同时存在于好几个层次,每个层次的稳定性完全不同。好的预测应该先声明自己在哪个层次做判断,然后给出那个层次相应的置信度。
L1
人类需求层
归属、享乐、安全、认可——人类几千年来的恒定底层需求
极度稳定
✓✓✓✓✓
L2
行业品类层
咖啡、饮料、支付、社交——品类本身的存续逻辑
比较稳定
✓✓✓✓
L3
商业模式层
订阅制、广告驱动、平台双边——价值捕获的具体方式
中等稳定
✓✓✓
L4
竞争地位层
市场份额、定价权、网络效应强度——相对竞争格局
不太稳定
✓✓
L5
具体产品技术层
当前产品形态、技术架构、算法——最具体也最易变
最不稳定
常见错误:把在某个层次的确定性,错误地转移到另一个层次。你可以对"人类需要社交连接"(L1)有九成把握,但对Facebook具体的广告商业模式(L3)的判断,不能因此也有九成把握。两件事完全可以同时成立:L1极度确定,L5高度不确定。
06 —生产关系视角

换一套语言思考企业

之前所有框架——半衰期、技术代际、护城河——本质上都在分析生产力的问题。生产关系问的是另一套问题:谁在生产?谁拥有生产资料?谁在分配价值?这个安排,各方真的接受吗?

创造价值 vs 提取价值的反事实测试

有一个简单的反事实测试:如果这家公司明天消失,它所在的生态系统会变好还是变差?
价值创造 ←————————————→ 价值提取
茅台
Visa
苹果
Meta
外卖平台
纯食利者
生态系统消失后变差 生态系统消失后变好
注:大多数公司介于两者之间,且比例会随时间变化——平台公司典型轨迹是早期大量创造,晚期越来越多提取。

平台悖论:用户既是消费者,也是生产者,却不拥有生产资料

平台型科技公司发明了一种历史上前所未有的生产关系:用户创造了内容、维系了社交关系,这是真实的价值生产。但生产资料——算法、数据基础设施、分发权力——由平台拥有。这个安排在很长时间里是不透明的,用户没有意识到自己在扮演什么角色。
预测含义:这是一个内在不稳定的生产关系,因为它依赖于提取的不可见性。一旦这个提取变得可见——通过监管调查、公众讨论或泄露的内部文件——原本看似稳定的结构会快速崩塌。Facebook在2018年剑桥分析事件后的舆论崩塌,不是技术出了问题,是生产关系的合法性突然消失了。

最有趣的当代案例:AI公司的生产关系危机

大语言模型是用人类几十年积累的文字、代码、艺术训练出来的。这些内容的创造者——作家、程序员、艺术家——既没有被征询同意,也没有获得补偿,但他们的劳动成果构成了AI能力的基础。目前的诉讼浪潮不只是版权纠纷,是更深层的生产关系冲突的第一波信号:谁拥有用于训练AI的人类知识,这个问题还没有被回答。
预测含义:今天AI公司的预测难度,不只来自技术迭代的快速,更来自它建立在一组尚未被各方接受为合法的生产关系之上。这个不确定性,用技术分析的框架几乎完全看不到。

生产关系视角给出的三条预测原则

P1
提取越隐蔽,崩塌越突然
显性的价值交换是稳定的,各方清楚安排是什么。隐性提取在不可见时稳定,但一旦变得可见,崩塌速度远快于显性模式。关注"可见性临界点"何时到来。
P2
生产力变化快于生产关系时,预测系统性失效
互联网出现了三十年,平台劳动关系的法律框架还在形成中。生产力跑得比生产关系快的那段时间,是预测最不可靠的时期。
P3
生产关系被嵌入文化的公司最稳定
最高层次的稳定,不是合同,不是技术锁定,而是生产关系被参与者内化为自然秩序。茅台的消费者不觉得自己在被提取价值——他们觉得自己在参与一种有意义的社会仪式。
07 —经济特性识别

什么是真正好的商业模式?

经济特性有好有差,有可持续的,有不可持续的。识别它们的关键,是六个诊断性问题——每个问题都能看到不同的东西。

01
这家公司在创造价值,还是在提取价值?
生态系统因它存在而净受益;消失后整体变差
只是价值转移;消失后生态系统变好或不变
反事实测试:如果这家公司明天消失,生态系统会变好还是变差?
02
谁在承担这个模式的真实成本?
成本真正内部化,利润是真实的剩余价值
大量成本外部化给骑手、环境、公共卫生系统
外部化成本迟早被收回——通过监管、诉讼或社会压力。把所有成本列出来,包括不在财务报表上的。
03
定价权来自哪里?来源决定耐久性。
真实差异化
最耐久,难以复制
转换成本
稳固,但可被克服
网络效应
强但可能崩塌
信息不对称
系统性被压缩
监管保护
政治性的,可被收回
04
规模扩张是强化还是侵蚀经济模型?
边际成本趋近于零(软件、平台)——规模是纯粹的朋友
每增加一个用户都要亏损,寄望于"规模后再盈利"——庞氏逻辑
追踪每个增量用户/客户/交易的边际贡献是在上升还是下降?不要被总收入增长迷惑。
05
再投资需求有多高?再投资回报有多好?
几乎不需要再投资就能维持竞争地位,且再投资回报率极高
把赚的钱全部再投回去才能维持地位,自由现金流近乎为零(航空业)
看自由现金流 / 净利润的比率。接近 1 = 利润几乎全转化为真实现金。远低于 1 = 账面好看但现金流薄弱。
06
增长在稀释还是强化核心竞争力?
增长强化了护城河、品牌、网络——越大越强
快速扩张后平均质量下降,让公司离自己最擅长的事越来越远
对比增长最快的业务和核心业务的单位经济。如果新业务单位经济系统性弱于核心,增长在稀释价值。

应当这样判断,应当避免这样判断

可持续经济特性的共同特征
  • 资本回报持续超越资本成本,无需连续注资
  • 定价权来自真实差异化或转换成本
  • 单位经济随规模稳定或改善
  • 成本真正内部化,无大规模外部化
  • 增长强化而非稀释核心竞争力
  • 生产关系各方都有足够激励留在安排里
不可持续经济特性的预警信号
  • 需要持续资本注入才能驱动增长
  • 利润来自信息不对称或监管保护,随时可被收回
  • 增长时单位经济持续恶化
  • 大量成本外部化给供应商、劳动者或社会
  • 增长让公司离核心能力越来越远
  • 生产关系各方存在明显张力,提取依赖不可见性

所有"好经济特性"都可以退化,所有"坏经济特性"在某些条件下也可以被修复。识别它们,不是为了贴标签,而是为了判断这组生产关系正在向哪个方向演化,演化的速度有多快。


真正不可持续的经济特性,往往有一个共同结构:现在的利润是通过某种方式透支未来的。透支环境、透支劳动者、透支用户信任、透支资本市场的耐心——每一种透支都有它自己的还款日期。

各类经济特性可持续性评分(综合示例)
08 —预测方法论

四个要素构成完整预测体系

好的预测需要四个相互支撑的条件:知识渊博、证据充足、逻辑完备(结构外推而非类比外推)、尺度约束(数学直觉)。这四个要求不是经验总结出来的"最佳实践",而是有内在的逻辑顺序和不可替代性。

核心矛盾:大多数预测用的是类比外推——X像Y,Y发生了Z,所以X也会发生Z。它不关心机制,只看表面形态是否相似。一旦进入类比对象没有经历过的区域,模型就完全失效,而预测者甚至不知道自己已经失效了。
类比外推(Analogical)
模式匹配跨越语境
  • X像Y → Y发生Z → X也会发生Z
  • 只看表面形态相似性
  • 不需要理解中间机制
  • 在训练分布内插值效果好
  • 一旦外推立刻失效
  • 失效时预测者自己不知道
类似机器学习里的判别模型——拟合输入输出映射,对分布外样本无能为力
结构外推(Structural)
从机制推导轨迹
  • 识别驱动变化的真实机制
  • 找到不变量、速率约束、耦合关系
  • 在约束空间内推导可能轨迹
  • 能告诉你哪些轨迹不可能
  • 外推时仍有可靠性
  • 失效时有可识别的前兆
类似机器学习里的生成模型——建模数据生成过程,可以在未见过的区域做可靠推断
硬过滤层
尺度约束——先排除不可能的
在讨论"什么更可能"之前,先把物理上不可能的轨迹整体过滤掉。这不是一个权衡层,而是一个硬边界。违反尺度约束的预测,不是"不太可能",是"概率严格为零"。
具体工具:增长率乘法(7%×30年=7.6倍,意味着多少资源?);物理转型速度(60万亿美元能源资产,25年寿命,最快多快能替换?);计算约束(这个AI能力需要多少算力,现在能制造多少?);Fermi估算作为量级检验
机制基础
知识渊博——构建准确的生成模型
不是记住更多案例,而是理解足够多不同领域的内在机制,从而识别它们之间的真实耦合,而不是表面类比。宽度和深度同等重要。同时包含一种元知识:清楚地知道自己的机制理解在哪里终止,在那里相应扩大不确定性区间。
警告:专业知识有时让预测变差。领域专家的先验被太多证据强化,新的范式转移证据需要极大的强度才能更新这个先验。专家预测失败,经常不是因为不够聪明,而是因为先验太强。
位置锚定
证据充足——精确测量当前状态
证据不只是"支持你的观点的数据",这是确认偏误。证据充足需要三层:(1)精确测量当前位置,不是"大约在哪里";(2)测量变化率——一阶导数和二阶导数,不只是当前值;(3)主动寻找反驳性证据——找到它要么推翻预测,要么精炼模型,都是好事。
核心判别标准:有效的证据是似然比最大的证据——能最大程度区分不同假设的可观测量。一堆与所有假设都兼容的证据,其实没有更新任何东西。
结构推导
逻辑完备——从机制推导,不从模式外推
给定生成模型、当前位置、尺度约束,推导出哪些轨迹是必然的、哪些是可能的、哪些是不可能的。好的预测结论包含:方向(确定)、区间(有界)、概率(分布)、条件(触发条件是什么)、关键变量(哪些参数的变化会改变结论)。
完整预测的样子:"中国出生率到2040年极可能在0.9—1.2之间,中位情景约1.05。反弹需要托育补贴占GDP的3%以上并在5年内落地(概率15%);进一步下滑到0.85以下的概率约20%,条件是城镇化率超过75%叠加住房成本继续上升。" ——而不是"会继续下降"。
四个要素对预测质量的影响——缺失任一要素的后果
这个方法论让你对越来越多的问题说"不知道",同时让你对少数核心问题异常确定。对不知道的问题承认不知道,是诚实的代价;对结构清晰的问题,它给出的判断会比专家共识更准——因为它依赖的是结构的内在逻辑,不是权威的背书。
09 —认知科学基础

贝叶斯大脑的具体化

四个预测要素不是任意组合出来的,它们是贝叶斯最优推断在人类认知能力范围内的有限逼近。对应关系是精确的、结构性的,而不是表面类比。

P(假设 | 证据)∝ P(证据 | 假设)× P(假设)
P(H|E)
后验概率
预测结论
→ 逻辑完备推导
P(E|H)
似然函数
证据精度
→ 证据充足
×
P(H)
先验分布
生成模型
→ 知识渊博
+ 超先验约束
∀H∉Ω
超先验约束
物理不可能区
→ 尺度约束
这个对应不是装饰性的,每一层的功能在贝叶斯框架里都有精确含义。
超先验
尺度约束(物理定律、数学守恒)
不是"很强的先验",是比任何经验先验都高一层的超先验。违反它的预测不在似然函数有定义的区域内——任何量的证据都无法把后验推进那个区域。这解释了为什么尺度约束是硬过滤而不是软权衡。
精度
先验
知识渊博(生成模型)
贝叶斯大脑的核心是生成模型——对"世界如何运作、原因如何产生结果"的内在表征。知识渊博不是记住了更多案例(查表),而是拥有一个更准确的生成模型,能从机制上推导先验。结构外推用的是生成模型,类比外推用的是判别模型,这正是它们预测能力差异的根源。
精度
似然
证据充足(P(E|H)的精度)
证据的作用由似然函数决定。证据充足不只是数量多,而是能有效区分不同假设。一堆与所有假设都兼容的证据,似然函数是平的,后验几乎等于先验——等于没有学到任何东西。好的证据选择是主动寻找似然比最大的可观测量。
精度
后验
逻辑完备(结构推导 → 后验分布)
贝叶斯推断在数学上是完备的,但输出质量完全取决于模型设定是否正确。错误设定的生成模型,拿再多证据做再正确的推断,只能在错误的空间里越来越自信地走向错误结论——这叫模型设定误差,是贝叶斯系统最危险的失效模式。结构外推的本质,就是追求模型设定的正确性。
推导
结果

主动推断(Active Inference):推断循环永远是闭合的

Friston的主动推断框架把贝叶斯大脑从被动推断延伸到主动行为:大脑不只是更新对世界的信念,它还采取行动让世界符合它的预测,从而最小化"意外"(free energy)。
主动推断闭合回路 — 预测者与被预测系统的耦合
生成预测 感知误差 触发行动 更新模型 社会系统 反馈耦合 先验 / 生成模型 知识渊博 预测 感官输入 结构逻辑 预测误差 Prediction Error 证据充足 更新 / 行动 尺度约束 自由能最小化 Free Energy Min.
红色虚线回路表示社会系统中的耦合:预测者的输出进入系统,成为系统演化的一个变量,再经由感知回到预测者。把预测者从被预测系统里抽离是一个理想化简化——在真实社会预测里推断循环永远是闭合的。

为什么人类天生不擅长长期预测

贝叶斯大脑的进化压力,是在秒到天的时间尺度上、用直接感官反馈来校准生成模型。30年尺度的预测任务,是在严重偏离校准域的条件下运行贝叶斯推断——反馈回路太长,先验无法通过经验迭代更新;证据太间接,没有感官信号告诉你30年后的世界。
大脑贝叶斯系统的校准域 vs 长期预测所需的时间尺度
高精度校准区(进化充分优化) 部分校准区 几乎无校准(长期预测区间)

四类系统性失效——贝叶斯解释

缺失:尺度约束
预测结论落在物理不可能的区域。表现为预测的增长率在数学上无法持续,或转型速度超出了物理约束允许的范围。往往被包装成"乐观假设"。
用Fermi估算做量级检验;在宣布结论前先做一次增长率的30年乘法
缺失:知识渊博(生成模型错误)
机制理解浅薄,用类比代替因果。表现为"X像Y"的推理,忽视了X和Y在结构上的关键差异。是最常见也最隐蔽的失效。
显式说明你认为的因果机制;询问"哪些结构条件让这个类比成立,这些条件在当前案例里存在吗"
缺失:证据充足(似然太平)
选择性使用证据,或使用的证据无法区分竞争假设。后验几乎等于先验——什么都没有更新,只是给已有偏见做了背书。
主动寻找反驳性证据;问"如果我的假设是错的,我应该观察到什么?现在是否观察到了?"
缺失:逻辑完备(模型设定误差)
有了机制和证据,但推断过程中混入了模式匹配。在错误的模型空间里做了正确的推断,结论越来越自信地指向错误方向。
要求预测包含:方向、区间、关键条件、敏感变量。拒绝"方向正确但无法证伪"的预测

四个要求是对最优贝叶斯推断在有限计算资源下的有限逼近。我们做不到完美的贝叶斯——先验无法完整表达,似然无法精确计算,生成模型永远是近似的。但这四个要求告诉你,在人类认知能力范围内,如何系统性地逼近最优推断。


能做好,是例外。不能做好,才是正常状态。这不是智力问题,是贝叶斯系统在失去校准信号时的原理性失效——30年预测根本不在自然选择能给反馈的时间尺度内。