我们无论是做股票还是炒白银,本质上就是一种博弈,说到博弈,就不得不提一下著名的纳什均衡,那么什么是纳什均衡呢?纳什均衡在我们做白银的过程中又有什么价值呢?
纳什均衡是一种策略组合,使得同一时间内每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(StrategyProfile)。
纳什均衡,从实质上说,是一种非合作博弈状态,非合作博弈是指在策略环境下,非合作的框架把所有的人的行动都当成是个别行动,这就非常符合我们的白银市场,每个人对白银未来走势都有自己的想法,看涨看跌,做多做空,它主要强调一个人进行自主的决策,而与这个策略环境中其他人无关。通常也就是我们字面上博弈的意思。博弈并非只包含了冲突的元素,往往在很多情况下,既包含了冲突元素,也包含了合作元素,即冲突和合作是重叠的。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。
在一个博弈中可能有一个以上的纳什均衡,而纳什均衡的经典案例-囚徒困境中有且只有一个纳什均衡。下面丁循文给大家先来看下囚徒困境的例子,对纳什均衡有个初步了解。
假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
基于经济学中Rationalagent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。
下面我们再来看另一个纳什均衡的经典案例-智猪博弈。
假设猪圈里面有两只猪,一只大,一只小。猪圈很长,一头有一个踏板,另一头是饲料的出口和食槽。每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物,踩的越狠,落下的食物越多。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,由于小猪轻,落下食物少,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,大猪重,落下食物多,小猪吃的又少,则大猪还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。那么,两只猪各会采取什么策略?令人出乎意料的是,答案居然是:小猪将选择等待策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。其实道理很简单,因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好不知疲惫的跑来跑去了。
智猪博弈就很好的反映出白银市场的两类人,资金雄厚,可能成为庄家的就是“大猪”,而资金薄弱的散户就相当于“小猪”,由此看到,散户和庄家的博弈中,散户并不是总没有优势的,关键是找到有“大猪”的那个食槽,并等到对自己有利的游戏规则形成时再进入,而你会不会成为那只聪明的“小猪”呢?
关注公众.号丁循文了解更多!