博弈论 | 演化博弈理论(Evolutionary Game Theory)的理解

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

目录

研究论文出现的名词飞速Google、Baidu、Bing等齐上阵。

一、演化博弈理论的概述

演化博弈理论的英文名是Evolutionary Game Theory。演化博弈理论一般会探讨博弈论在生物学中的应用尤其是纳什均衡的一种很重要的生物学角度的解释纳什均衡是无数次动态博弈的稳定状态也可以说成物竞天择适者生存。虽然演化思想最初来自于生物学领域但演化博弈论和演化经济学都把“创新选择和扩散”视为演化的主要机制演化博弈论也为演化经济学提供了微观基础演化博弈的基本形成如下图

在传统博弈理论中常假定参与人是完全理性的且参与人在完全信息条件下进行的但在现实的经济生活中的参与人来讲参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中参与人之间是有差别的经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题也显而易见。

与传统博弈理论不同演化博弈理论并不要求参与人是完全理性的也不要求完全信息的条件。演化博弈论是把博弈理论分析动态演化过程分析结合起来的一种理论。在方法论上它不同于博弈论将重点放在静态均衡和比较静态均衡上强调的是一种动态的均衡。演化博弈理论源于生物进化论它曾相当成功地解释了生物进化过程中的某些现象。如今经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程也取得了令人瞩目的成绩。演化博弈论目前成为演化经济学的一个重要分析手段并逐渐发展成一个经济学的新领域。


二、演化博弈模型的特征

演化博弈模型有如下几个特征

  1. 以参与人群体为研究对象分析动态的演化过程解释群体为何达到以及如何达到目前的这一状态
  2. 群体的演化既有选择过程也有突变过程
  3. 经群体选择下来的行为具有一定的惯性。

三、演化博弈理论的两大要素

关于演化博弈的实例可以查看【四、参考文献】中的第 3 条。

3.1 复制动态方程

演化博弈模型中所构建的复制动态方程的基本形式为
d x ( t ) d t = [ f ( s i , x ) − f ( x , x ) ] x i \frac{\mathrm{d} x(t)}{\mathrm{d} t} = [f(s_i, x)-f(x,x)]x_i dtdx(t)=[f(si,x)f(x,x)]xi

其中

符号含义
s i s_i si演化群体内博弈的策略集
x i x_i xi在 t 时刻下博弈群体中有多少数量比例的个体选择了策略 s i s_i si
f ( s i , x ) f(s_i, x) f(si,x)当博弈个体选择 s i s_i si 时个体的期望支付
f ( x , x ) f(x, x) f(x,x)整个群体的平均期望支付

3.2 稳定策略均衡解

在演化博弈过程中博弈双方不再是以稳定的纳什均衡解作为策略最终的选择结构而是通过一个不断比较、学习和模仿的过程逐渐去探究演化稳定均衡解。
演化博弈模型的基本形式如下

主体A \ 主体B选择 P 1 P_1 P1 策略选择 P 2 P_2 P2 策略
选择 P 1 P_1 P1 策略(g, g)(k, f)
选择 P 2 P_2 P2 策略(f, k)(c, c)

在这个博弈矩阵中P1 策略博弈主体的数量比例为 x x xP2 策略博弈主体的数量比例为 1 − x 1-x 1x

其中

符号含义
g g g双方都采取 P 1 P_1 P1 策略时的收益
c c c双方都采取 P 2 P_2 P2 策略时的收益
k k k主体 A 选择了 P 1 P_1 P1 策略而 B 选择了 P 2 P_2 P2 策略时行为主体 A 的收益
f f f主体 A 选择了 P 2 P_2 P2 策略而 B 选择了 P 1 P_1 P1 策略时行为主体 A 的收益

因此行为主体 A用 U 1 U_1 U1 代表和行为主体 B用 U 2 U_2 U2 代表各自的收益以及整个博弈群体的平均收益用 U 代表满足以下等式。

U 1 = x g + ( 1 − x ) k U 2 = x c + ( 1 − x ) f U = x U 1 + ( 1 − x ) U 2 U_1 = xg + (1-x)k \\ U_2 = xc + (1-x)f \\ U = xU_1 + (1-x)U_2 U1=xg+(1x)kU2=xc+(1x)fU=xU1+(1x)U2

根据演化博弈概念构建演化博弈的复制动态方程
F ( x ) = d x d t = x ( U 1 − U ) F(x)=\frac{dx}{dt}=x(U_1-U) F(x)=dtdx=x(U1U)

通过数理计算可以得出复制动态方程的最终形式为
F ( x ) = x ( 1 − x ) [ k − f + x ( g − f − k + c ) ] F(x)=x(1-x)[k-f+x(g-f-k+c)] F(x)=x(1x)[kf+x(gfk+c)]

令复制动态方程结果为零得出三个解如下
x 1 = 0 x 2 = 1 x 3 = c − k g − f − k + c x1=0 \\ x2=1 \\ x3=\frac{c-k}{g-f-k+c} x1=0x2=1x3=gfk+cck

再将这三个解入公式 F ’ ( x ) F’(x) F(x) 中即复制动态方程的一阶导方程中。

F ’ ( x ) < 0 F’(x)<0 F(x)<0则该解就是演化博弈的稳定策略均衡解。


四、参考文献

  1. 演化博弈理论
  2. 百度百科演化博弈理论
  3. Chapter7演化博弈论Evolutionary Game Theory
阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6