A均衡与贝叶斯推测与德州扑克

新用户注册 | 用户登陆 | 回复 | 刷新 论坛嘉宾: 快刀浪子

大漠孤狼


发表文章数: 58
内力值: 98/98
贡献度: 254
人气: 19

A均衡与贝叶斯推测与德州扑克 [文章类型: 原创]

客栈里没有经济与博弈方面的栏目,就放到这个目录下吧。

当初学博弈论时,很快就把兴趣转移到非完全理性方面,因为我觉得那样的模型才能反映现实。而对完全理性假设下的理想模型,总觉得那只是进一步修改模型时的参考,本身没有多大价值,对其推导出的结论,也就不太重视了。后来接触到德州扑克的KQJ模型,才发现在完全理性下推出的结论,扮演了进一步模型的基点角色。尤其当非完全理性的新模型不易提出时,靠理想模型给出的基点,加上已知条件中对理想模型的偏离,也能得出很多有用的结论,于是对KJQ这类理想模型兴趣大增。只是后来考虑更复杂情况时,发生了很多参数纠缠一起的现象,不能运用KQJ模型里系数为零法推导,才不得不放弃。现在终于找到了解决方法,故总结一下这方面的内容。

在没有最优纯态策略的策略集中,可能存在这样的一个混态策略:

1,当一个参入者1运用该混态策略时,无论对手用什么策略组合,该参入者的收益不变,则称该混态策略为A1策略;当每一个参入方n都持有An策略时达到的均衡,称为A均衡。

A均衡有相应的中文名,我以前采用了一个,可感觉很容易望文生义,干脆先用字母代替吧。假如这个均衡真有价值,将来会有人给出恰当的中文名,犯不着我来操心。

A均衡与纳什均衡是不是等价的?搞不清楚。二者的定义不同,按理说不应该相同;可我检验了两个特例,他们却给出同样结果。比如,剪子包袱锤,KQJ模型,他们给出的值都一样。

2,当A均衡包含n个纯态策略时,有EV=a1EV1+...+anEVn(a1+...+an=1),当且仅当EV1=...=EVn时,a1,...an取任意值时,EV不变。

这是计算均衡时用到的一个技巧,非常简单,非常非常非常有用。

3,对于德州扑克,可按照两种方法写出博弈树。

一,按照行动。比如甲check,bet不同牌力的牌;当甲check时,乙可check,bet;当甲bet时,乙可flop,call,reraise;然后甲再以此类推。


二,按照牌力。比如,当甲持有某种牌力时,其做出相应的bet,check;乙用也按不同牌力做出不同的动作。

一与二是等价的,但在两者转换中,可以求不同的概率分布。另外,把某轮某人所有可能的行动或牌力段称为同一等级,以便运用2给出的技巧

3,逆向归纳法(逆向推测法),写出某个博弈的博弈树后,从后到前,先求最后一级的An均衡并依此向前推出前一级的An-1均衡,最后所有的各级均衡构成A均衡。

用上面方法求出A均衡后,当需要观察某个特定对手的玩牌模式与A均衡的偏离,以做出相应的调整,制定最优策略,可用贝叶斯推测。这就是基于贝叶斯推测原理下的读牌。

同样,我们可以利用贝叶斯推测,来给出对手某些倾向性玩法,这就是贝叶斯原则下的读人。

读人读牌是互为表里的关系,因为一个参数需要调用另一个参数。

另外,当推测对手咋呼或价值注与其面部表情肌体语言相关性时,也叫做读人,也可以用贝叶斯推测。不过这种情况下就与前面提到的读人读牌参数没有直接联系了。

原则上,基于贝叶斯推测与对A均衡偏离为基础从而得出的最优策略,是在不涉及心理学情况下所能达到的最好结果。由于当前心理学并不成熟,并不能给出多少以基本心理假设为基础的可靠结论。所谓的从心理角度的读人读牌,只不过是糅合了经验,直觉,盲信等各种因素的大杂烩。不可否认,有人利用这些,达到了惊人准确性;可在大多数人哪里,并没有想象中那么好的效果。并且这种能力真的象艺术,只可意会,无法言传。

发表时间: 2014-11-05, 08:08:54 个人资料
您尚未登陆 | 用户登陆