什么是纳什均衡?
纳什均衡(Nash Equilibrium)描述了一种稳定状态,即假设其他参与者的策略保持不变,每个参与者都已经选择了最优策略。换句话说,在纳什均衡状态下,没有任何一个参与者,可以通过单方面改变自己的策略,来获得更好的结果。
囚徒困境中的纳什均衡:
囚徒困境是博弈论中的经典例子,描述了两个共谋犯罪的嫌疑人被分开审讯的情景:
如果两人都保持沉默(合作),每人坐牢1年;如果一人背叛另一人,而另一人保持沉默,背叛者被释放,沉默者坐牢5年;如果两人都背叛,双方各坐牢2年;
在这个例子中,背叛是A和B的支配策略,因为无论对方做什么,背叛都能带来更好的结果,因此,两个囚徒都会选择背叛,导致的结果是双方各坐牢2年。这就是囚徒困境的纳什均衡。
举个例子:
假设有两家公司A和B,考虑是否投放广告。每家公司都有两个策略:投放广告和不投放广告。
广告的收益和成本如下:
如果A和B都投放广告,收益均为10;如果A和B都不投放广告,各自收益为15;如果A投放广告,B不投放,A收益为25,B收益为5;如果B投放广告,A不投放,B收益为25,A收益为5;
在这个广告投放的例子中,唯一的纳什均衡是双方都投放广告,各自获得10的收益。
因为其他三种情况,任何一方单方面改变策略,都会让自己收益变大:如果A投B不投,B会考虑改成投放策略,使收益从5变成10,反之亦然;如果AB都不投,则AB都会单方面考虑改成投放策略,让收益从15变成25。