Игры с оптимальной остановкой в условиях неполной информации тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Кочетов, Эдуард Анатольевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
г.-з Ол
\ I и •
^ ^ VIУ>
■,«». Г) г*
а
САНКТ - ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
Кочетов Эдуард Анатольевич
ИГРЫ С ОПТИМАЛЬНОЙ ОСТАНОВКОЙ В УСЛОВИЯХ НЕПОЛНОЙ ИНФОРМАЦИИ
01.01.09 — математическая кибернетика
АВТОРЕФЕРАТ
диссертации на соискание учений степени кандидата физико • математических наук
Саикг - Петербург 199В
Работа выполнена в Читинском государственном педагогическом институте на кафедре математического анализа.
Научный руководитель: доктор физико-математических наук, профессор Мазалов В.В.
Официальные оппоненты:
доктор физико-математических наук, профессор В.В. Захаров кандидат физико-математических наук, доцент А.Н. Кириллов.
Ведущая организация — Иркутский вычислительный центр. СО РАН.
Защита состоится " Л' • 1996 г. в _часов на заседании специализированного Учёного совета К — 003.57.10 по присуждению учёной степени кандидата физико-математических наук в Санкт-Петербургском государственном университете.
С диссертацией можно ознакомиться в библиотеке им. А.М. Горького Санкт-Петербургского государственного университета.
Автореферат разослан
Ученый секретарь специализированного совета К - «03.57.10
доктор физико-математических наук, профессор
Горьковой В.Ф.
ОБШАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Игры с оптимальной остановкой, как один из классов задач теории игр, известен достаточно давно и в целом создан математический аппарат для решения такого рода задач. Оказалось, что такие игры могут быть использованы для построения математических моделей например в биологии, при изучении экологии поведения животных (выбор партнёра, выбор мест питания и размножения), а также для решения некоторых классов дифференциальных уравнений.
Классические методы, используемые для моделирования поведения животных, например при выборе ими партнёра, предполагают, что выбирающей особи заранее известно распределение качества (например, окраска, размеры и т.д.) потенциальных партнёров, однако в действительности это не всегда верно. Эксперименты показывают, что животные используют адаптивный поиск, т.е. их "представление" о распределении качества потенциальных партнёров зависит от качеств партнёров с которыми животное уже сталкивалось в прошлом.
В связи с этим очевидна актуальность решения игр с оптимальной остановкой в условиях неполной информации.
Цель диссертации. Целью диссертационной работы является
1. Построение математической модели поведения животных при выборе ими партнёра, если известен закон распределения качества ( в частности нормальный) потенциальных партнёров, но неизвестны параметры распределения.
2. Решение многошаговой динамической игровой задачи с оптимальной остановкой.
3. Решение игровой задачи оптимальной остановки с отражающими
• экранами.
Научная новизна. В данной работе Кочетова Э.А. получены новые результаты касающиеся игровых задач с оптимальной остановкой. Впервые исследована задача оптимальной остановки с неизвестными параметрами закона распределения поступающих наблюдений, когда критерием является выбор наблюдения с наибольшим значением. Новыми являются результаты по многошаговой игре двух лиц с оптимальной остановкой, когда выигрыш определяется в конце процесса. Продолжены исследования игровых задач с оптимальной остановкой определённых на симметричных
случайных блужданиях с отражающими экранами. При решении задач предложены новые аналитические и численные методы.
Практическая ценность. Исследованные в диссертации модели оптимального принятия решений могут быть использованы в задачах экологии поведения, касающихся выбора партнёра или места питания. ■ Предложенные методы сведения игровых задач к серии задач оптимальной остановки представляют большой интерес в теории динамических игр с оптимальной остановкой.
Апробация работы. Результаты диссертационной работы докладывались на VI Японско-Российском симпозиуме по теории вероятностей и' математической статистике (Токио, 1995), V школе "Математические проблемы экологии", (Чита 1994), на научном семинаре кафедры математической статистики, теории надёжности и массового обслуживания факультета прикладной математики —процессов управления Санкт - Петербургского государственного университета (Санкт - Петербург, 1996 г.), на научном семинаре Читинского института природных ресурсов СО РАН.
Публикации. По теме диссертации опубликовано три печатных работы.
Структура и объём работы. Диссертационная работа, объёмом 93 страницы, состоит из введения, трёх глав, заключения и списка литературы, содержащего 72 наименования.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Первая глава — введение. В втой главе вводится понятие стратегий и функций выигрыша в играх на случайных блужданиях, описываются основные методы, применяемые при решении задач оптимальной остановки, а также обосновывается практическая необходимость решения такого рода задач.
Во второй главе рассматриваются проблемы последовательного выбора, которые имеют приложение в экологии поведения животных. Одной из популярных тем здесь является задача выбора партнёра. Классические методы предполагают, чтй определённому полу заранее известно точное распределение, по которому апробируются потенциальные партнёры. Однако, в действительности это предположение может быть нереально: поведение выбирающей самки может зависеть от качества самца, столкнувше-
шегося с ней перед этим. Это подтверждают и биологические наблюдения. Эта зависимость показывает, что поиск позволяет определённому полу узнавать кое-что о качестве потенциального партнёра и приспосабливать своё поведение в соответствии с этой информацией.
В данной главе рассматривается такая модель с адаптивным поиском и информацией основанной на стохастическом динамическом программировании, причём известно, что закон распределения качества потенциальных партнёров является нормальным с неизвестным математическим ожиданием и диссперсией. Задача решена без и с ограничениями на промежуток времени наблюдения, причём за каждое наблюдение взимается плата с.
В первом пункте этой главы даётся общая постановка задачи. Во втором пункте рассматривается случай, когда неизвестен лишь первый параметр — среднее, которое перевычисляется на каждом шаге рекурентно по формуле ап+1 = а„ 4-(и',|+| — <»п)/(» + 1), причём на первом шаге среднее полагается равным наблюдаемому значению и остановки на первом шаге не происходит. Второй параметр — среднее квадратичное, считается постоянным и равным единице. Пусть функция Беллмана У(ц>„,а„,п) — ожидание максимального выигрыша самки, т.е. ожидаемое качество выбранного самца в случае, когда самка действует оптимально. Здесь п — номер текущего партнёра, ю„ т— его качество, а ап — текущее среднее.
В этом случае уравнение Беллмана имеет вид
У(ш„,а„,п) = шах |и>„,-с+ J 1'(ш,а„ + + 1)с/Га„(и))| .п = 1,2...
(1)
с граничным условием
У(и>,а,М) = ш (2)
В данном пункте доказываются следующие утверждения:
Теорема 2.1 Для любого п решение уравнения (1) с условиями (2) имеет следующий вид
К(ш,«.п) = тах(1о,-с + а +6п(М)),п = - 1, (3)
. где ¿л/-,(.У) = 0, ц
n = 2,...,N — 1. (4)
Теорема 2.2 Если N стремится к ос, то последовательность ¿n(N) сходится к предельному значению ¿„ ограниченному единственным решением уравнения
6 = (6 — c)F(6 — с) + /(Ä — с). (5)
Также здесь представлены численные значения Ä„ для различных сип.
В третьем пункте рассматривается случай, когда неизвестны оба параметра. В втом случае установлены следующие факты:
Теорема 2.3 Для любого п решение уравнения для данного случая с соответствующими граничными условиями имеет вид
V(w,a,<r,ti) = тах{ш,—c-f а + ¿¡^(<0}, п = 2.....N- 1, (6)
где =0, и для п =2.....N-1
R
Лемма 2.6 Последовательность ¿^(сг) для каждого п,а возрастает по N. Теорема 2.4 Функция
г„(<г)= lim
N—оь
выпукла и возрастает для каждого п
Существует определённая трудность в подсчёте функций Sn(o) для всех п. Пусть п —» оо и предположим, что существует предел функции Ца) = lim ¿„(ст). В втом случае функция ¿(er) удовлетворяет уравнению
п—.оо
Интересно, что уравнение (8) совпадает с уравнением (5) полученным в предыдущем пункте для фиксированного <7 = 1,
Лемма 2.7 Функция ¿(а) возрастает и выпукла.
Итак, оптимальное поведение выбирающей самки следующее: она не останавливается на первом самце, но запоминает его качественное значение м>|. Когда встречается со вторым самцом она запоминает и перевычисляет а-1 как (к>| + м^)/2 и <т1 как у— а', затем сравнивает и>2 с —г+«а+йа(<Уа). Если последний не превышает предыдущего она останавливается. а противном случае она опробует нового самца, Шз, и сравнивает ЭТО С —с +11:, + Л.)((Г.|), и т.д.
В третьей главе — "Многошаговая игра с оптимальной остановкой" рассматривается игра двух лиц с оптимальной остановкой. Её можно интерпретировать, представив гонки двух яхт движущихся вдоль одной прямой, начальное расстояние между которыми равно х. В каждый момент времени (на каждом шаге) игроки могут наблюдать .V — независимых одинаково распределённых случайных величин из их последовательностей с непрерывными функциями распределения (/) и С(у) соответственно. От того на каком наблюдении остановится игрок зависит дальность его продвижения по прямой. Игрок выигрывает, если он опередит противника за К — шагов К > 1. В данной главе эта задача решена и построены численные модели для экспоненциального и равномерного распределений при Л' = 1 и Л' = 2 соответственно и числом наблюдений N = 3 и .V = 2 соответственно. Особенность этой задачи заключается в том, что оптимизируется поведение игрока не на каждом шаге, а за все К шагов сразу.
В первом пункте этой главы даётся общая постановка задачи. Во втором — задача формализуется. Третий пункт представляет технику решения. В четвёртом пункте описывается класс стратегий на которых достигается ситуация равновесия в данной игре. Это стратегии вида:
( > -Iм
г(--">) = < г]*'Н=1...М>;*|« > .{*» (9)
I 'V; < .. N-1)
для первого игрока. И стратегии вида:
<Ф»,;'> = \ ¡;ч!4 < > ..>!" (10)
для второго игрока.
И наконец в пятом пункте находятся пороги г, и для (9) и (10), как
решение следующих систем.
J J Hk.Ar + i-v)dG(v)dF{i)- J 4 *„-«')</<?(»>)] = О
(n = l.....N- 1).
(И)
j tfwIi + ii-iiJilfliil + CI^,) J Hk-ilx + v - iVn-n)dF(u)) =
= 0
(»=1.....ЛГ-1).
(12)
Решение систем (11) и (12) (учитывая, что zü — +са\гц = —оо) и есть пороги ?„ и tu„ для стратегий соответственно первого и второго игрока на k-ом шаге игры.
В четвёртой главе рассматривается игра двух лиц с оптимальной остановкой случайны! блужданий. Рассмотрим игру двух игроков, определённую на случайных блужданиях следующего вида. Пусть х„ и у„ — симметричные случайные блуждания на множестве Е = {0,1,...А'}, начинающиеся из состояния а и Ь для первого и второго игроков соответственно и поглощающиеся в состояниях 0 и А' с вероятностью рис вероятностью q переходящие из втйх состояний в состояния 1 и А' — 1 соответственно. Игроки действуют независимо друг от друга на основании полученных наблюдений и останавливают наблюдения в некоторые случайные моменты г и а соответственна. Если х, > у,, то первый игрок выигрывает, если хт < у „у то выигрывает второй игрок, а если хг — у,, то ничья. Задача решена аналитически для произвольных pnq>0up + q = l.
В первом пункте даётся постановка задачи. Во втором — игровая задача сводится к задаче оптимальной остановки с помощью введения спектров стратегий д,- = Р{хт = ¿} и = Р{у, = «'}. В третьем пункте даётся решение задачи, которое опирается на следующее з'тверждение* :
'Маэалои B.Ii. Нгуоннс моменты остановки. — Новосибирск, Наука, 1987. — 187 с.
Теорема 4.1 Для того чтобы вектор л - (а.., л0,... бил спектром
некоторой стратегии т необходимо а достаточно выполнение следующих условий:
К + г
]Г (13)
(14)
з, > 0; 1 = -с.О.....А' +(15)
Где —г и А' + с — фиктивные состояния такие, что теперь случайные блуждания рассматриваются на множестве Е = {—;,0,1,... А'—1, А", А'+г}, но переход из состояния 0 и А* соответственно в состояния — г и А' +1 происходит с вероятностью </, после чего частица поглощается в последних состояниях с вероятностью 1, а переход из состояния 0 и А' соответственно в состояния 1 и А' — 1 происходит с вероятностью р. Очевидно, что такая модель эквивалентна первоначальной. Далее будет рассматриваться именно она.
Приведём основные теоремы описывающие решение данной задачи.
Лемма 4.1 Если а = 4, то существуют такие стратегии т' и а' первого и второго игроки соответственно, что
вир Я(т, ст") = М1Цг\а) = 0.
г а
Причём спектры оптимальных стратегий будут иметь следующий вид.
1. Если 4 + 1 + [;] < А' < 2(6+ (:]) + 1, то ((с]+ 1)/(Ь + 1+ .- + [;]); ;=-;; (--[_-])/(4 + 1 + .--+ И)!
¿ = 1,3.....2( А' — 4 — 1 — [г]) — 1;
([_-]-_- + 1)/(6+1 + .- + [г]);
' =2,4.....2( А' - 4 - 1 — [г]);
(24 - А' + [;] + с + 1 )/(4 + 1 + ; + (;|); = А'; 0; для других < 6 Е.
2. Если 2(4 + [с]) + 1 < А', то ([.-] +1)/(6 + 1+- + (_-]); =
(.- - [--|)/(Ь + 1 + + [-]); = 1,3.....2(6 + [г]) + 1;
((.-1 - с + 1 )/(6+ 1 + + [.-]); = 2,4.....2(4+ (г|);
0; для других У 6 £'.
<■ = а; =
/, = л, =
Лемма 4.2 Если а < Ь., и выполнены следующие условия
b<r.!íi±M±i£±£; 2(« + (.-1 + 1) + .-'
Л' > а + [;] + 1,
то существует такая стратегия а' второго игрока, что
и, -V (а + 1 + (-])(а - 6 + [;)-;) - + 1) + а(; + 1) 4 -(.- - [.-])
Т"(Т-(« + |;] + --+.1)(«. + |--] + -- + 2)-*
Оптимальные стратегии при атом имеют следующий вид.
1. Если а то вектор t* — (/-*,. ■ -1 ¿a'+j ) имеет
вид
2(а 4 1 4 (;])a + z- ¿(2(а 4 1 4 М> 4 ;) , = _ (а + [.-] + г + 1)(а 4 [--] 4 - 4 2) ' ''
(Ь-в + с-[г])/(л + [г] + г+1); i = 1;
■2= 4 Ь 4 1
(«4 + ; + + Н + : +2) |2г + Ь+1Н2([с]+о + 1)-А")
; г = 3,5.....2(Л'- а -[.-]) - 3;
; ' = Л';
(« + [с] + ; + 1)(а+[;1 + г+2) О ; для других i € Е.
2. Если А' = а 4 (с) 4 2, то вектор I' = (/_.,... имеет вид
2Ы + 1 + И)3 4 г - Ы2(« 4 1 + [z]) 4 :) , = _ (« + [sJ + : + l)(e + [;] + r + 2) '
(Ь _ „ + с _ [;])/(„ + [_-] + - + 1); J s 1; (2; + й + l)(2(fj¡ 4 а 4 1) — А")
О : для других г 6 Е.
i = А';
3. Если К > 2(н + |с]) + 1. то вектор Г = (/_;,____<л>=) имеет вид
2(а + 1 + |;))* + - - Ц2(а + 1 + [:]) + ;) , =
(л + [;| + .- + 1)(«+[:| + с + 2) : ' (Л — я + ; - (--])/(« +[--]+ г + 1); I = 1;
2- + А + 1 , , + + , + + ' = 3-5.....2(и + [:]) + 1;
О : для других / £ Е. Лемма 1.3 Если а < Ь и выполнены следующие условия:
2(« + [.-] + 1У + .-
ь< ь-
2(« + [--1+ 1) + --
К > а + [с] + 1. то существует такая стратегия т" первого игрока, что
■ г»/ - . +1 + НИ"~ь + н-->-+1) +"(--+ п + =(--(-1) ■*> =-(в + И + .- + 1)(« + н + .- + 2)-'
Оптимальные стратегии при атом имеют следующий вид.
1. Если а + + 2 < А* < 2(я + [;) + 1), то вектор = (я..,... + имеет вид
(г+1)(о + 2([.-| + 1))
(о + - + [1] + 1)(« + ; + (:] 4 2)' а+ 21 [с)-И)
+ - + + 1)(« + - +И+ 2) М + 1-г
—; / =2,4....,2(А'-а-
•2);
а + с + [--] + 1'
1 = 2( А' — а — [г) — 1)
(Д + г + И + 2)(2(<1 + [;[) + 1 - Д-) -К; - [с|)(А' + 2, + 1) (я + - + [-] + !)(„ + ; + [-) +2) ;
А':
0: для других ' € Е.
2. Если Л' = а + (г] + 2, то вектор 6* — (<$_*, • • м имеет вид (г + 1)(а + 2([г| + 1))
(а+с + |г]+1)(а + = + (г] + 2)'
И + 1-' -
в + г + И + 1'
* = + + 2)(2(а+ [;]) + !- А)-Цг - [;])(А + 2:+ 1) 1а + г + 14 + 1)(в + в + [8] + 2)
,= А'; 0; для других г 6 Е.
3. Если К > 2(а -I- [г] 4-1), то вектор а" = (а-,,..имеет вид
(.-+ !)(<■ +2((г] + 1)) .__
(а +г + И + 1)(а + -- + [--] + 2)' ' ~ "
___; = 9 4 о(р + Н).
(а +г + И+ !)(« + .- + (.-1 + 2)' -.«,..■.-<<» +МЛ
-; ¿=2(« +1*1 + 1)
о + - + |г] + 2' 0; для других I е Е. Леыма 4.7 Если а < Ь и выполнены следующие условия:
Ь>Ь' =
2(« + |:]+1)Чг
2(а+[г] + 1)4-;' А' > ¿+ЛГ + 1,
то существует такая стратегия а' второго игрока, что
... .. (Л' + Ш-в + Л'-.-К^ + А^б-а)
ТЩт'а > =--+ -•
где N 6 {« : I = 0,1,2.....} и т.ч.
1. Ь в если 21*+ 1)<;;
2• Ье «ли2Л' < г <2(Л? + 1).
При этом оптимальные стратегии имеют следующий вид. Пусть
66
: — 2.4 '
14-2.У(ЛГ4-1)~\ г - 2.У - 1 ) '
если ; > 2Л' 4- 1. И пусть
46
г 4- 2ЛГ1
с — 2.У
если : < 2.У 4- 1. Тогда,
1. если 6 + .V + 1 < А' < 2(4 4-V), то вектор Г = (<-,,..., ) имеет вид
Л =
(1+ЛГ)/(Ь + ЛГ) 1 = 1; г(4 — 1) — 2.У(6 4- .V)
(6+.У)(6+У + ;+1) 6 4-14- 2.У(Ь+ N 4-1) — г( 6 — 1)
; I = 2,4...,2(А' — 6 — ./V — 1);
(2.У 4-4 4- 1)(2(Ь + ЛГ) - А') 4- Ц- - 2.У) - (.- 4- 2.У2)
(6 4- .У)(Ь.4- :У 4- - 4-1) 1
I = А'; О ; для других I € £; 2. если А' >2(6 4- -V), то вектор /" = (<_,,... имеет вид
(1 4- Л0/(&4- ЛО « = 1; г(4 — 1) — 2Л^(Ь4-
(6 4- 4- -V 4- : 4-1) 44-14- 2^(44- N 4-1)-г(6-1)
(6 4- ЛЛ)(& 4- Л/ 4- с 4-1) О ; для других < 6 Е.
; I = 2,4...,2(44- .V);
; ¿ = 3,5.....2( 6 4- /V) — 1;
Пусть теперь
[ г — 2Ы - 1 ;г-2(Лг + 1)У'
если с > 2Л'+ 1 (если ато не так, то мы находимся в предыдущем случае) -и если г > + 1). Если же г > 2Л'+ 1 и г < 2(ЛГ+ 1) пусть
Ье[ .--2Л'-1
1. Если Ь +' ЛГ + 2 < К < 2(6 + ЛГ) + 1, то вектор Г = («.,,..., <А>.) имеет вид
<¿-^/(¿ + N + = + 1) .-=1;
2(Л' + 1)(6 + Л' + 1)-.-(Ь-1) ... .... ,
^Ь + ^^)^Ь + N + : + l) ; ."М...,2(Л->-АГ-1);
,(-- + 1)(Ь-.1)-2(Ь+Л')(Л' + 1) . м .. . -(Ь + К){Ь+м + я + 1)-; » = ЗЛ...,2(А-Ь-ЛГ-1)-1;
(2Л' + г. + 1)(2( 4 + ЛГ) + 1 - А') + ыг - 2Л' - 1) - (г + 1 + 2А/( Л' + 1)
<Ь +ЛГ)(4 + Л' + -- + 1)
»= А'; О ; для других ¡е£. 2. Если А' = 6 + Л' + 2, то вектор I' = (<_,,... имеет вид
^Z-N)J^Ы-N +z +1) ¡ = 1;
и =
2(ЛГ + 1)(Ь + ЛГ + 1)-2(Ь-1)
(Ь + ЛГ)(Ь + Лт + - + 1) '
«=2;
(2Л' + Ь + 1 ){Ь + Л' - 1) + ¿(г - 2Ы - 1) - (; + 1 + 2Л'(Л' + 1) (4 + Л')(6+ЛЧ: + 1) ;
» = А"; О ; для других I 6 Е.
3. Если К > 2(А + .V) + 1, то вектор Г = .имеет вид I- —- ЛГ>/СЬ -Н -V -Ы + 1) 1 = 1;
2(.У 4-1Н& + .У -И)-:(&-!) . (6 + .У)(А + Л' + -- + 1) ;
« =2,4. ,.,2(Ь+#);
1)(й-1)--2(4+,У)(/У+1). (6+.\')(6+Л/ + : +1) 1
»' = 3,5,...,2(6+.У) + 1;
О ; для других «' 6 Е.
Лемма 4.8 Если а < Ь и выполнены, следующие условия: II. 2(а+[.») + !)' +г.
Ь>* = 2(а + (г) + 1) + ; ' Ь + N 4- 1 < А',
то существует гюкая стратегия т' первого игрока, что
(М +,1)(Ь - о + ¿V - г) + (Ь + АГ)(А - а)
1Ь+.М)(Ь+.\ + :+ 1) где .V б {I : г = 0,1.2.....} а т.ч.
1. если 2и* + 1)<;;
2. бе если2Ы < г <2(^ + 1).
При этом оптимальные стратегии имеют следующий вид. 1. Если Ь+ N + 1 < А' < 2(4 + /V), то вектор а' = (з_г,..., лл+г) имеет вид ' (¿-а + Л + 1)/(6+У+г + 1) I = —г;
- + а
(¿+Л0(Ь + ЛГ4-г+1)
(2(.У + Ь) + 1- А')(.-+а) (Ы-.У)(6 + Л/ + „--Ы)
О ; для других ; £ £7.
; ¿ = 2,4...,2(Л'-Ь-ЛГ — 1); ! < = А';
2. Если К > 2(Ь + Л^), то вектор л" = имеет вид
(Ь~а + N + 1)/(Ь + Л' + с + 1) . = -г; 2 + а
(6+Л')(6 + Л' + ; + 1) О ; для других г 6 Е.
; I = 2,4.. .,2(Ь + Л');
Лемма 4.9 Если а < Ь и выполнены следующие условия:
- ; - 2Л' а+ с + 1 < к' < Ь+ Лг+ 1,
то существует такая стратегия с' второго игрока, что т .. Ь-1 + 2(К-Ь),
«ирЯ(т,<г )= (у + д)(А._1)(« + «)-1.
где Л' €{»':» = 0,1,2,...,} в то.«».
«сл.**+ !)<*; 2. Ьб [^г;+оо), если 2ЛГ< г <2(ЛГ+1).
Если а + : + 1 < К < Ь+ Л' + 1, то вектор Г = ,1А+1) имеет вид
( (К-Ь)ЦК-\) ¿ = 1; <(= | (Ь-1)/(Л'-1); » = Л"; | 0 ; для других / 6 Е.
Лемма 4.10 Если а < Ь и
в + : + 1<А'<Ь+А' + 1,
то существует такая стратегия г" первого игрока, что
где N е {»: ( = 0,1,2,...,} и т.ч.
1-ъе если 21А + 1)<,-;
2- ь 6 [й^г; -если < - ^ +
При этом оптимальные стратегии имеют следующий вид. Вектор а" = ... »л^+г) имеет вид
[ (Л"-а)/(Л' + г) « = -.-; .*,= ^ (а + .-)/(/1 +с); 1 = А"; [ 0 ; для других г е Е.
Лемма 4.11 Если А' < а + - + 1, то существуют такие стратегии т" и а' первого и второго игроков, что
\а( Щт",<г) = зщ>Н{т,а') =
А' + г'
При этом оптимальные стратегии имеют следующий вид. Вектор <* = ¿л+г) имеет вид
Г (А' - Ь)/(1\ + :) ,' = -;; /,-= | (¿ + -)/(А' + с); 1 = А'; I 0 ; для других I е Е.
Вектор .5" = («_,,..., 5д+г) имеет вид
( (А'-а)/(А' + .-) = * =< (а + с)/(А' + ;); = А'; I 0 ; для других I 6
РАБОТЫ. ОПУБЛИКОВАННЫЕ ПО ТЕМЕ ДИССЕРТАЦИИ "
1. Э.А. Кочетов Задача сбора урожая с линейной функцией цены.
//сб. тез. V школы Математические проблемы экологии, Чита: изд - во ЧИПР СО РАН. 1994, с. 54.
2. В.В. Мазалов, Н. Перрин, Э.А. Кочетов. C.B. Панова Экологические задачи выбора с неполной информацией. //Обозрение прикладной и промышленной математики, М.: изд - во ТВП, Т. 3, вып. 3, 199G,
с. 371 — 383 .
3. Э.А. Кочетов Многошаговая игра, с оптимальной остановкой.
//сб. Математический анализ и его приложения, Чита: изд - во ЧГПИ. вып. 2. 1990. с. 25 — 32.
"РаОота выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект 96-0I-(JI6ll(l)
IS