演化博弈算法.ppt
文本预览下载声明
演化博弈算法 优化问题 非合作博弈 基本映射 博弈模型 博弈策略的强化学习 最优反应动态 静态博弈与动态博弈 博弈协调-廉价商议模型 连续策略的随机加权学习 并行化 多目标优化 * * 叶俊 2003.4.22 G = [I, S, U] EG = [I(t), S(t), U(t)] 演化博弈 x* D x s* S s f(x) u(s) φ ψ 博弈学习 最优反应动态 协调博弈 0 0 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 -1,-1 -8,0 0,-8 -5,-5 囚徒乙 囚徒甲 C D C D BRC 0 9 5 0 1 2 2 3 1 1 3 8 6 0 6 8 4 2 联盟 1 联盟 2 联盟 n 9 2 8 5 1 4 5 1 3 5 7 4 5 8 3 5 4 1 7 1 7 5 2 9 2 8 8 7 2 0 7 8 7 0 3 2 t = 1, 2, … BRC BRC BRC 静态博弈 动态博弈 BRC BRC 0 9 5 0 5 2 2 3 1 1 3 8 7 0 6 8 4 2 if rand pde 信息传递无成本且没有约束力 wi
显示全部