读《合作的复杂性》

时间：2020-02-24 13:17:05 阅读：75 评论：0 收藏：0 [点我收藏+]

[美]罗伯特·阿克塞尔罗德著

2008年出版

摘要：从其最初赢得全球声誉的《合作的进化》https://i-beta.cnblogs.com/posts/edit;postId=12355725中“一报还一报”的简单模型策略进行具体讨论，侧重于研究博弈中的合作。书中设计了一个接近人类社会群体的现实情景，引入噪声考量和博弈规则，利用计算机程序建模，进行试验，并在理论上分析可行性。

问题的提出：人类群体是如何达至合作的

博弈论中，即使是有限重复博弈中，也是无法达到合作或帕累托效率的，但是现实生活中却是合作四处可见，它是文明的基础。在每个人都有自私动机下，人们怎么样才能合作，历史上霍布斯提出极权体制机构；卢梭提出社会公意，通过某种社会契约达到合作。

从霍布斯到卢梭，西方古典社会结论的一个基本假设，是一个具有共同利益的群体会在某种外在强制力量和社会安排下，为实现共同利益而采取集体行动。这要么导致君主专制，要么导致共和独裁。新古典和博弈论理性最大化理论阵营只是短视看到了他在与对手进行博弈，没有意识到，他是与对手一起在与庄家博弈。

在《合作的进化》一书中，作者提到合作的基础不是真正的信任，而是关系的持续性。对策者能通过：1 对双方有利的可能性的试错学习，2 通过对其他成功者的模仿，或者3 通过选择成功的策略，剔除不成功的策略的过程，来达到相互的合作。也就是说，人类合作的扩展持续可以自发的形成，没有必要一定要创造出一个独裁者。

在有噪音的情况下，一报还一报的方式会引起相互惩罚，无穷无尽，无法达到合作的模式。对消除这种有噪音的方法中可以有三种比较好的策略，一种是增加宽容，即允许一定比例的背叛者不受到惩罚；二互惠政策增加悔悟，如果无意中选择背叛，并迎来对手的背叛时，就不要再背叛下去了；三设计一种巴甫洛夫原则，在双方都使用背叛，导致双方收益均偏低，双方会自动调整到合作（不如前两种方法稳定）。

在可以选择冒失的时候，因为惩罚背叛总要付出一定的执行成本，所以惩罚的人就变得罕见，冒失的水平又会上升，这样规范就完全崩溃了，而且崩溃是一个稳定的结果。怎么样才能维持局部稳定。引入元规则情况下，博弈哲不光惩罚背叛者，而且要惩罚那些不惩罚背叛者的人。博弈者增加报复水平，以免被别人惩罚，所以结论是元规则可以提高和维持人群中的合作水平。

一对一的博弈比较容易建立理论分析和数量模型，但n对n的很难，尤其是当博弈者还有记忆，而且现实的人还有复杂的情感

为什么用试错、模拟？

归纳是在实证数据中发现模式，比如从数据中进行分析。而演绎主要涉及规定一套公理，并证明那些有假设中得出的结论，第三种方法是基于参与者的模型设计，他并不证明定理，而是基于参与者的模型产生模拟数据，可以继续用归纳的方法及分析，但是这些数据是模拟，而非来自真实世界的直接测量。

当参与者使用适应性的策略，而非最优化的策略时：推断结果经常不可能，模拟成为唯一的解决方法。适应可能是在个人层次上通过学习发生，也可能通过成功的个人的生存和繁殖在整个群体层次上发生。当许多互动的参与者遵循的规则具有非线性效果时，适应性过程的演化结果常常难以直接推断。

现在社会科学的领域中，经常使用理性选择方式，这个理论的最大优势是可以允许我们进行推断，但不真实。现实世界不允许，所以我们只能选择模拟。

读《合作的复杂性》

原文：https://www.cnblogs.com/Engineblogs/p/12355692.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)