Объясняем равновесие Нэша в покере

new$world$order

Administrator
Автор месяца
27 Май 2022
2,798
176
Равновесие Нэша — это теоретический способ игры в покер (или в любую некооперативную соревновательную игру), в котором каждый игрок играет с абсолютно идеальной стратегией, и любое отклонение от стратегии любого из игроков приведет к проигрышу для этого игрока. Равновесие Нэша лежит в основе покерной стратегии Game Theory Optimal (GTO).

Равновесие Нэша в покере определяется как состояние в многопользовательской игре, когда каждый игрок знает стратегию каждого другого игрока, и ни у одного игрока нет стимула менять свою собственную стратегию. Эта концепция может показаться чисто академической, поскольку она объясняет то, что мы уже понимаем, но в дополнение к способу формализации наших интуитивных представлений о человеческом поведении внутри экономической теории, эта концепция также отвечает за изменения в том, как мы думаем про реальный мир.

Применение этой концепции к реальным случаям делает ее осязаемой. Например, в игре в покер реальную прибыль можно получить, просто следуя стратегиям, сводящим к минимуму отклонение вашей собственной игры от «идеального» равновесия Нэша. Чтобы вытолкнуть это за рамки абстрактной теории игр, подумайте об этой стратегии как об эксплуатации кого-то, атакуя его слабости, и когда навыки противников повышаются до такой степени, что у них больше нет слабостей, ваш лучший вариант — устранить свои собственные слабости, чтобы чтобы нельзя было эксплуатировать.

В онлайн-покере (который убирает такие элементы, как теллсы) есть два способа обозначить каждую стратегию — эксплуатируемая и эксплуатирующая. Эксплуатационные стратегии — это стратегии, которые отклоняются от равновесия Нэша, в то время как эксплуатационные стратегии отклоняются от Нэша специально для того, чтобы использовать эксплуатируемые стратегии противников. По определению, эксплуататорские стратегии всегда должны меньше отклоняться от Нэша, чем эксплуататорские стратегии, иначе они были бы эксплуататорскими стратегиями. Следовательно, при определенных условиях оптимальная стратегия заключается скорее в том, чтобы не быть эксплуатируемым, чем в использовании слабостей других. Точное следование равновесию Нэша становится довольно сильной эксплуататорской стратегией, а следование «идеальному» Нэшу по определению является неэксплуатационной стратегией.

Тривиальное применение этого рассуждения можно увидеть в блефе и колле. Если другой игрок очень часто блефует, когда делает ставку, вы будете очень часто коллировать. Предположим, что по какой-то причине — возможно, он пытается произвести впечатление на подругу — он знает, что вы позвоните, но все же считает, что в его интересах продолжать свою стратегию. Таким образом, ни один из вас не решился бы изменить свою стратегию: он продолжал бы блефовать, а вы продолжали бы коллировать. Поскольку стратегии не меняются, они находятся в статическом состоянии, т. е. находятся в равновесии.

Стратегии кажутся достаточно простыми, но расчет равновесия Нэша — нет. Когда два человека играют в онлайн-покер, количество возможных комбинаций карт, которые могут быть сданы, равно 5,56*10^13. Чтобы получить равновесие Нэша, вам нужно вычислить каждую из этих комбинаций, а также решить такие вещи, как оптимальный размер ставки в каждом из четырех раундов торговли. В целом, эти решения подтолкнут показатель степени далеко за пределы 10^20. Кроме того, вы можете играть в игры с шестью или девятью игроками за столом, что увеличит количество комбинаций карт до 2*10^25 и 3*10^33 соответственно. Поскольку количество комбинаций карт и количество комбинаций ставок так велико, ни один компьютер не сможет найти равновесие Нэша в покере в ближайшее время. Таким образом, лучшие игроки мира должны оценивать равновесие Нэша и конкурировать между своими оценками.