历史的周期律,不是简单土地兼并,而是“好人”与“坏人”的模型演化博弈
一、一个计算机模拟实验:红点与绿点的演化循环
首先,让我描述一个计算机模拟实验。
在一台计算机中,程序划定了一个有限的空间范围,里面散布着密密麻麻的小点。这些小点分为两种颜色:红色的和绿色的。红色的小点代表倾向于合作策略的个体——我们暂且称他们为“好人”;绿色的小点代表倾向于背叛策略的个体——我们暂且称他们为“坏人”。每个小点都在这个空间中运行,彼此相遇时会发生博弈。
这套实验的逻辑是这样的:
· 当两个红色小点(两个“好人”)相遇时,他们选择合作,彼此帮助、共享资源,双方都获得适中的收益。
· 当一个红色小点与一个绿色小点(“好人”与“坏人”)相遇时,好人选择合作,坏人选择背叛。于是坏人占了大便宜,好人吃了亏。
· 当两个绿色小点(两个“坏人”)相遇时,双方都选择背叛、互相伤害,结果双方都只获得极低收益,甚至双双受损。
演化生物学家托马斯·弗拉特做过类似的模型研究。他的发现是:在简单生物种群中,“好人”很容易被“作弊者”侵蚀——“从理论演化角度看,作弊往往是最好的策略”。但这并不是故事的终点。
这个实验最精彩的地方在于它的演化机制:每个博弈回合结束后,收益较低的小点会被淘汰,而收益较高的小点则有机会“繁殖”出与自己策略相同的新点。一代又一代地模拟下去,你会看到一个令人震惊的周期性循环:
第一阶段(好人主导期): 初始状态下,空间里几乎全是红色“好人”,只有零星几个绿色“坏人”。好人之间广泛合作,整个系统运行良好,总收益很高。坏人虽然能从与好人的相遇中占便宜、获得超额收益,但因为数量太少,不足以动摇整体秩序。
第二阶段(坏人扩张期): 问题在于:坏人占便宜这件事本身会产生示范效应。他们的成功信号在系统中传播——不是说其他人“变坏了”,而是在策略淘汰机制下,那些倾向于合作的个体相对收益下降、逐渐被淘汰,而背叛策略的个体相对收益上升、逐渐占据更多份额。阿克塞尔罗德在《合作的进化》一书中通过计算机模拟也揭示了类似的困境:“坏人”占便宜的信息会使“好人”退化。
坏人的比例逐渐攀升。好人越来越少。社会环境越来越不利于合作者的生存。
第三阶段(坏人主导崩溃期): 当绿色“坏人”占据绝大多数时,整个系统的博弈性质彻底改变了。大量坏人与坏人相遇——双方都选择背叛,互相伤害,收益极低。整体资源被无谓地消耗殆尽,系统的总收益跌入谷底。坏人群体因为无法内部合作,开始自我损耗、自我崩溃。这种情形正是非合作博弈的典型结果——每个个体的理性自保,导致了集体的非理性崩溃。
第四阶段(合作重新崛起期): 当背叛者比例过高、系统接近崩溃边缘时,一个微小的变化就会触发反转。在背叛者占主导的废墟中,少数还坚持合作策略的个体反而开始显现优势——因为他们彼此相遇时能获得正收益,而背叛者们正在互相消耗。于是合作者的比例开始重新上升,好人越来越多。系统逐渐回暖,回到了类似第一阶段的“好人主导”状态。于是,整个循环再次开始。
这正是“好人模型”与“坏人模型”之间的永恒较量——一个关于合作与背叛的演化循环。
二、社会的兴衰,不过是这个模型的宏观投影
现在,你把这个计算机模型拿到现实社会中来对照。
建国初期: 秩序刚刚建立,制度相对公正,奖惩比较分明,上升通道向大多数人开放。在这样的环境下,合作策略是最优解——你勤奋、诚实、帮助别人,就能获得稳定的生存回报。这相当于模型中的“好人主导期”:红色点占据绝对多数,社会信任度高,整个系统快速发展。
中期: 随着时间推移,制度执行开始出现松弛,监管漏洞被人发现和利用。少数坏人(背叛者)发现:钻空子、损人利己、搭便车,居然能获得比老老实实干活更高的回报。更关键的是,惩罚这些坏人的成本太高了——你要在人群中把他们识别出来,要搜集证据,要走法律程序,这一切都需要巨大的社会成本。所以大多数坏人逍遥法外,他们的成功被后来者模仿。这是“坏人扩张期”:绿色点的比例逐渐攀升。
环境开始逆转:好人越来越不适合生存,坏人越来越如鱼得水。
这就是所谓的“世风日下,人心不古”——不是人天生变坏了,而是环境在筛选行为策略。
崩溃期: 当坏人的比例超过某个临界点,整个社会的博弈性质彻底改变。社会从“合作博弈”(大家一起把蛋糕做大)滑入“非合作博弈”(人人对抗,存量厮杀)。在这个阶段,任何需要信任和协作才能完成的大规模任务——抵御外敌入侵、兴修水利、公平赈灾、甚至维持基本的社会治安——都会陷入困境。因为你不知道身边的人会不会出卖你,所以你不敢合作;因为别人也不知道你会不会出卖他们,所以他们也不信任你。
这就是明末的情形。 我不是说明朝灭亡的唯一原因是这个。历史事实从来都是多种因素交织的结果——小冰河期的气候剧变、财政体系的全面破产、军事技术的代差、瘟疫的肆虐,甚至崇祯皇帝的个人决策失误,都扮演了重要角色。但是,在社会信任这个维度上,我们的分析抓住了真相的一个关键切面:明末的军阀割据、官僚党争、地方豪强自保,本质上就是“背叛策略”在社会各层面蔓延的表现。在这个人人自危、互不信任的环境里,任何有组织的抵抗都变得异常困难。满清入关后,正是利用了明朝社会内部已经无法产生大规模、可信合作网络的弱点,通过分化瓦解、拉拢一部分打击另一部分,实现了各个击破。
三、“土地兼并”只是表象,博弈演化才是底层逻辑
传统的历史周期律解释常常归因于“土地兼并”:开国时地权平均,后期土地越来越集中到少数人手中,失地农民越来越多,最终起义爆发,王朝崩溃。
这个解释不是错的,但它太表面了。它没有回答一个更根本的问题:为什么同样的土地制度,在前期能够维持稳定,到了后期就失灵了?为什么朝廷颁布的“限田令”“均田制”在王朝中后期总是执行不下去?
答案在我们的模型里:当一个社会中背叛者比例过高时,任何需要信任和执行力才能落实的制度——包括土地制度的监管和执行——都会彻底失效。 地方官吏在执行“限田”政策时,如果他自己就在勾结豪强、从中渔利,政策就是一纸空文。而社会信任崩溃的根源,不在于“地主阶级的道德败坏”,而在于环境在筛选行为策略——当背叛者持续获得超额收益而缺乏有效惩罚时,合作者就会逐渐被淘汰,整个社会滑入低信任、高内耗的陷阱。
四、崩溃之后:坏人互害,好人重生
当社会彻底烂透——比如满清时期——坏人们之间已经没有“好人”可以剥削了。背叛者遇到背叛者,结果是双输。整个社会的总福利跌入谷底,蛋糕急剧缩小,大部分人都活不下去。
在这个极点到来之时,合作策略反而重新获得了生存优势。因为只有在废墟中还能抱团、互助、讲求信任和奉献的群体,才能在绝境中生存下来并逐步壮大。于是,好人开始重新聚集,合作网络从底层重新组织起来。从民国时期的进步团体,到最后新中国的建立,正是这个逻辑的体现——在一个坏到极点、人人互害的环境中,能够彼此信任、彼此合作的力量,最终会脱颖而出。
历史周期律,本质上不是什么神秘的天命,而是一场发生在人群之中的演化博弈。好人多了,坏人钻空子;坏人多了,自我损耗;极点到来,好人重生。 循环不止,周而复始。
五、如何打破这个循环?一个没有完美答案的问题
读到这里,你一定会问:既然我们看清了这个“好人多→坏人钻空子→坏人互害→好人重生”的循环,那有没有办法打断它?能不能让社会永远停留在好人占主导的阶段,不让坏人有机会崛起?
答案的核心其实非常简单,甚至近乎常识:让好人得到好报,让坏人得到惩罚。 只要能做到这一点,合作策略就会成为社会中的稳定优势策略,背叛者无机可乘。
但问题恰恰在于:“建立规则”本身,就会被坏人钻漏洞。 任何成文的制度、任何奖惩机制,只要它是固定的、可预测的,就一定会有人去研究它的缝隙,找到绕过惩罚、骗取奖励的方法。坏人最擅长的,就是伪装成好人去钻规则的空子。你设一个“举报坏人奖励机制”,就会有人恶意诬告;你设一个“好人优先扶持政策”,就会有人包装出好人的人设去骗取资源。规则越复杂,漏洞往往越多;规则越简单,又容易被暴力破坏。
那怎么办?难道真的没有办法了吗?
历史上和思想史上,人们提出过几条可能的路径,但每一条都有自己的局限:
1.提高背叛的长期成本:通过声誉机制、社会信用体系,让一次背叛行为在长时间内影响一个人获得合作的机会。但声誉系统同样可能被操纵、被误判、被权力滥用。
2. 培养内化的合作道德:通过教育、文化、信仰,让合作成为人们不需要计算成本收益的本能。但这需要漫长的代际传承,而且一旦环境恶化,最先吃亏的恰恰是这些“有道德的人”。
3. 由人民去监督:理想状态下,如果每一个人都能参与监督,让权力和规则运行在阳光下,那么坏人钻空子的空间就会被压缩到最小。这听起来是最根本的解法。但现实是,这条路并没有完全走通。在今天的现实中,所谓的“人民监督”更多时候变成了媒体监督、平台监督、网络舆论监督。这就产生了一个新的问题:这究竟是人民的权利,还是少数媒体、少数平台的权利?它们可以选择报道什么、不报道什么,有“选择性执法”的意味。那些没有被曝光的不公,就像不存在一样。与此同时,社会的公众注意力被各种热点极限拉扯,今天一个热搜,明天一个反转,久而久之,人民疲惫了。哪怕再看到不公,也没有那么多精力去关注了。监督权在名义上属于每一个人,但在实际操作中,它被少数机构和注意力经济所绑架。
坦白说,我也没有一个完美的答案。也许根本不存在一劳永逸的“终极方案”。人类社会可能永远要在“建立规则”和“规则被钻空子”之间反复博弈,不断修补、迭代、进化。打破循环的关键,或许不是找到一套永远正确的规则,而是保持一种永远清醒、永远愿意修复规则的能力。 这种能力,需要一代又一代人中的“好人”——那些愿意为长期合作付出短期成本的人——在每一次循环的低谷中,重新点燃信任的火种。