Критерий решения игры в чистых стратегиях.



КРИТЕРИЙ РЕШЕНИЯ ИГРЫ В ЧИСТЫХ СТРАТЕГИЯХ - выигрыш одного из них равен проигрышу другого. Внешние факторы отсутствуют. Оба игрока обладают конечным числом действий и логикой, которая определят их действия (рассмотрим ниже). Строки матрицы являются возможными действиями игрока А, столбцы матрицы - возможными действиями игрока В. Возможные действия игроков называются чистыми стратегиями.

 

Критерий решения игры в чистых стратегиях упирается в критерий существования цены игры в чистых стратегиях.

Свойство: ни одному из игроков А и В, придерживающихся одной из своих оптимальных стратегий невыгодно от нее отклоняться, поскольку в этом случае он не увеличивает свой выигрыш.

Цена игры в чистых стратегиях представляет собой значение выигрыша игрока А, которое он не может увеличить, если игрок В придерживается своей оптимальной стратегии и значение проигрыша игрока В, которое последний не может уменьшить при условии, что игрок А действует по своей оптимальной стратегии.

Теорема: для того, чтобы существовала цена игры в чистых стратегиях, т.е. для того чтобы нижняя цена игры равнялась верхней цене игры , необходимо и достаточно существование у матрицы этой игры седловой точки.

В игре без седловых точек ни у одного из игроков оптимальных стратегий нет. Т.е. задача в чистых стратегияхи меет решение, если сущ. седловая точка.


 

8. Доказательство утверждения

Теорема 1. Для элементов матрицы (13) имеют место неравенства

αi ≤ aij ≤ βj, i = 1,..., m, j = 1,...,n, (14)

и, следовательно, нижняя цена игры не больше ее верхней цены в чистых стратегиях:

αβ. (15)

Доказательство. По определению (3) показателей эффективности α i стратегий Аi игрока А и определению (9) показателей неэффективности β j стратегий Bj игрока В имеем

следовательно, неравенства (14) доказаны.

Так как доказанное неравенство αi ≤ βj справедливо для любых i = 1,..., т, j =1,..., п, то оно будет справедливым в частности для номеров i = i0 и j = j0 соответственно максиминной и минимаксной стратегий и :

Тогда в силу (6) и (12) получим требуемое неравенство (15).
9.Удовлетворительность игровой ситуации для игрока A.

 

Т. Ситуация (Ai0, Bjo) будет удовлетворительна для игрока А Тогда и только тогда, когда его выигрыш совпадет с показателем неэффективности стратегии Bjo игрока В: , то есть будет максимальной в j-ом столбце матрицы игры

Д-во: Пусть ситауция (Ai0, Bjo) удовлетворительна для игрока А. Тогда по определению справедливо нер-во .Из этого неравенства и по определению (1) показателя неэффективности стратегии Bj0 следует, что , то есть нер-во доказано. Тогда применяя (1) при j=j0 получим , то есть доказано


10. Удовлетворительность игровой ситуации для игрока B.

Если игроки А и В придерживаются своих максиминной и минимаксной стратегий соответственно, то ни один из них не может увеличить свой выигрыш, отступая от своей стратегии. Ситуация 2, B3) является в данной игре устойчивой. Нижняя и верхняя цены игры совпадают: α = β = 0,4.

Ситуация (сложившаяся в результате выбора игроками А и В соответственно стратегий и , называется удовлетворительной для игрока В, если

Теорема 2. Ситуация является удовлетворительной для игрока В тогда и только тогда, когда его проигрыш совпадает с показателем эффективности стратегии игрока А:

т. е. минимален в i0-й строке матрицы игры.


11. Равновесие в антагонистической игре.

Ситуация (сложившаяся в результате выбора игроками А и В соответственно стратегий и называется равновесной, или ситуацией равновесия, или устойчивой, или седловой, точкой игры, если она удовлетворительна для каждого из игроков А и В, т.е. если выполняются неравенства:

или равенства:

Выигрыш соответствующий ситуации равновесия , называют седловой точкой матрицы игры.

Теорема 1 (свойство равнозначности седловых точек).

Если и - седловые точки, то

Теорема 2 (свойство взаимозаменяемости седловых точек).

Если и - седловые точки, то и и - также седловые точки.

 


12. Смешанные стратегии. Функция выигрыша и цена игры в смешанных стратегиях.

Стратегия игрока, состоящая в случайном выборе одной из его чистых стратегий, называется смешанной стратегией. Это дискретную случайную величину, значениями которой являются номера его чистых стратегий.

,
Р и Q - смешанные стратегии игроков А и В. Таким образом, смешанная стратегия Р(Q) задается законом распределения

  i m
p1 pi pm

где pi ≥ 0 (qj ≥ 0) - вероятность применения игроком А (B) чистой стратегии Ai (Bj), и p1 +...+ pi +...+ рт = 1 (так же для q).

Смешанную стратегию Р можно отождествить с m-мерным вектором (p1,..., рт), т. е.

То же относится и к В: p меняем на q, i меняем на j

Обозначим через

--- множество всех смешанных стратегий игрока А Каждую чистую стратегию Ai, i = 1,..., m, игрока A можно рассматривать как смешанную стратегию в которой чистая стратегия Ai выбирается с вероятностью pi = 1, а все остальные чистые стратегии - с 0. Поэтому конечное множество , состоящее из т чистых стратегий игрока А, является собственным (при т ≥ 2) подмножеством бесконечного множества его смешанных стратегий SA:

каждую смешанную стратегию можно представить линейной комбинацией чистых стратегий с коэффициентами, являющимися координатами данной смешанной стратегии:

Функция выигрыша игрока А в смешанных стратегиях, заданная на декартовом произведении множеств смешанных стратегий, ставит в соответствие каждой ситуации в смешанных стратегиях средний выигрыш игрока А, определяемый выражением:

Таким образом,à ,

где

Матричная форма выигрыш-функции:

Нижней ценой (или максимином) матричной игры в смешанных стратегиях называется

Верхней ценой (или минимаксом):

Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях.

Смешанная стратегия PО SA, максимизирующая показатель эффективности α(Р) - максиминная смешанная стратегия игрока А, а нижняя цена игры показатель t` эффективности:

В частном случае PО = является максиминной чистой стратегией игрока A.

Аналогично, смешанная стратегия QО SB, минимизирующая показатель неэффективности β(Q), назовем минимаксной смешанной стратегией игрока В. Показатель неэффективности минимаксной смешанной стратегии QО равен верхней цене игры :

Если QО = то - минимаксная чистая стратегия.


Дата добавления: 2015-12-21; просмотров: 33; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!