博弈论的构成要素
博弈论的基本假设
- 博弈中的每一个参与人都是工具理性
- “每一个参与人都是工具理性”是每一个人的共识
- 每一个参与人都充分了解博弈的规则
- 理性人假设:理性人有一个明确的偏好(任意两件事物都可以进行比较,比较过程中偏好保持一致性);在约束条件下,理性人总是追求偏好最大化;理性人假设中,个体是具有完全理性的,即具有完美的认知和决策能力,不会犯错
- 偏好具有连续性,物品所能带来的满足程度是连续的,不会跳跃的,所以可以用一个连续的效用函数进行衡量
(Remark:价值理性与工具理性:价值理性指有正确的价值观,动机一定会纯正,同时也会采用正确的手段来实现自己想要的目标,无论结果如何;而工具理性指为达目的不择手段,参与者的行为从自身效用最大化的角度出发,漠视人的情感和精神价值)
参与人:
博弈中的决策主体,参与人记为,参与人的集合记为,若共有n个参与人,则,参与人参与决策是为了让自身效用最大化(另:虚拟参与人:“自然”、“上帝”——不以参与人的意志为转移的外生事件,虚拟参与人的选择体现为外生事件的各种可能现象,并用概率分布来描述“自然”的选择机理)为方便讨论,把参与人之外的其他参与人记为,虚拟参与人\自然记为。
单人博弈已经退化为了最优化问题进行处理,对单人博弈而言掌握的信息越多,所能获得的收益越大。
双人博弈并不总是对抗的,双人博弈也包括合作的情况,与单人博弈不同,双人及以上博弈中,参与者掌握的而信息越多并不能保证所得到去的收益越多;个人理性并不一定能导致集体条理性(囚徒困境);多人博弈(大于等于3)中可能出现破坏者——做损人不利己之事。
行动:
行动是参与人在决策时可供选择的动作,一般用表示第个参与人的特定行动,表示可供参与者选择的行动集合,行动可以是连续的也可以是离散的。个参与人的行动的有序集合称为行动组合。
行动是具有顺序的:同时行动或先后行动,行动的顺序对行动结果至关重要。
静态博弈指参与人同时选择行动的博弈
动态博弈指参与人先后选择行动的博弈
(Remark:"同时"指的是信息概念,如果参与者在决策过程中不知道对方的选择,那么不管是否是同一时间进行的决策都是静态决策)
信息:
信息是指在博弈当中,参与人有关该博弈的知识:自然的选择,其他参与人的策略集合、支付函数、行动时间等。
动态博弈中的信息集:可理解为参与人掌握了多少信息,一个参与人无法准确知道的变量的全体可能情况属于一个信息集。
根据信息的概念可以将博弈分为完美信息博弈和完全信息博弈
完全信息与完美信息的关系
划分标准不同:
完美信息博弈:在动态博弈中,如果参与人对其他人的行动的信息掌握得非常充分的一类博弈(如果包含虚拟参与者,自然的初始行动也会被所有参与者观测到)即:不存在事前的不确定性。
完全信息博弈:在博弈中,如果参与人对其他人的特征和类型的信息掌握得非常充分,这类博弈就叫做完全信息博弈。完全信息意味着,参与人完全了解博弈的格局——每个参与人的特征、策略集及支付函数等方面的准确信息,每个参与人都没有私人信息。
(Remark:不完全信息的博弈,往往可以视为有自然参与行动的不完美信息博弈,即由自然来决定对手的类型,但自然的行动选择不是所有的参与人都观察到了,故不完全信息可以视为不完美信息的子集,不完全一定不完美,反之不成立)
附:完全信息与完美信息相关概念
共同知识和私人信息
共同知识:是关于参与人对某种知识(如参与人的理性、参与人的支付等)了解程度的一种描述,如果某种知识成为共同知识就意味着——每个参与人都知道它,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它……
在现有的博弈分析框架下,一般都假设博弈问题的结构(或者对博弈问题的描述)为共同知识。
私人信息:指任何一个他拥有但不是该博弈中所有参与人共同知识的信息。
由于存在私人信息,便有了信息不对称的问题。
策略
策略(也称战略)是参与人如何对其他参与人的行动作出反应的行动规则,它规定参与人在什么时候选择什么行动。或者说,策略是参与人“相机行动方案”
一般用小写 表示第 个参与人的一个特定的策略。大写表示第个参与人所有策略的集合 ,也称参与人的策略空间。
或者:
用表示参与人在博弈中可能面临的所有决策情形的集合,称为观测集。参与人在博弈中的策略可以定义为从观测集到行动集的映射关系:
例:A有4个策略
A的每一个策略中的第一个元素是针对B选择“开发”时A的行动,第二个元素针对B选择不开发时A的行动
注:A的策略空间里面的元素只能是自己的行动
在人博弈中,如果每个参与人选择一个策略,那么维向量 称为一个策略组合。
本例中有8个策略组合:如S=((不开发,开发),开发)是一个策略组合,意味着A的策略是“如果B开发,我不开发;如果B不开发,我开发”,B的策略是开发。
策略和行动的关系
策略与行动是两个不同的概念。策略是一个与过程有关的概念,行动是与时序无关的动作。策略是行动的规则,而不是行动的本身。
在静态博弈中,所有参与人同时行动,没有任何人能获得他人行动的信息,故策略与行动是一回事。这时的策略选择就变成简单的行动选择,策略空间就是行动空间。但在动态博弈中策略和行动则是两个不同的概念。
策略必须具有完备性
作为一种行动的规则,在制定策略时,必须给出参与人在每一种可能情况下的行动选择,即使参与人清楚这种情况实际上并不会发生。
支付
支付是指在一个特定的策略组合下参与人所获得的利益(可以是确定的收益,也可以用效用水平或期望效用水平来表示)。参与人i的支付通常记为,简记为(参与人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。)
按支付之和的博弈分类
零和博弈:一方的收益必为另一方的损失,其支付之和为零的博弈。
常和博弈:支付之和不为零,但为一非零常数(或正或负)的博弈。
变和博弈:支付之和不为零,且不同策略组合下的支付之和也各不相同的博弈。
均衡
均衡是所有参与人的最优策略组合,一般记为。 表示第个参与人在均衡情况下的最优策略。
(通俗地说,在博弈达到均衡时,每一个参与人都不可能因为单方面改变自己的策略而增加收益,于是各方为了自己利益的最大化而选择了某种最优策略,并与其他对手达成了某种暂时的平衡。在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。)
博弈的描述
例如:
博弈的“策略式”表述或标准式表述一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
与之相对应的是“扩展式表述”(或博弈树)一般适用于描述完全信息动态博弈问题。
博弈的分类
除此之外,根据博弈参与人选择的策略,可以将博弈分成合作博弈与非合作博弈。合作博弈与非合作博弈之间的区别,主要在于博弈的参与人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。