Игры с оптимальной остановкой в условиях неполной информации

Кочетов, Эдуард Анатольевич

Игры с оптимальной остановкой в условиях неполной информации тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Кочетов, Эдуард Анатольевич АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

1995 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Игры с оптимальной остановкой в условиях неполной информации»

Автореферат диссертации на тему "Игры с оптимальной остановкой в условиях неполной информации"

г.-з Ол

\ I и •

^ ^ VIУ>

■,«». Г) г*

САНКТ - ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Кочетов Эдуард Анатольевич

ИГРЫ С ОПТИМАЛЬНОЙ ОСТАНОВКОЙ В УСЛОВИЯХ НЕПОЛНОЙ ИНФОРМАЦИИ

01.01.09 — математическая кибернетика

АВТОРЕФЕРАТ

диссертации на соискание учений степени кандидата физико • математических наук

Саикг - Петербург 199В

Работа выполнена в Читинском государственном педагогическом институте на кафедре математического анализа.

Научный руководитель: доктор физико-математических наук, профессор Мазалов В.В.

Официальные оппоненты:

доктор физико-математических наук, профессор В.В. Захаров кандидат физико-математических наук, доцент А.Н. Кириллов.

Ведущая организация — Иркутский вычислительный центр. СО РАН.

Защита состоится " Л' • 1996 г. в _часов на заседании специализированного Учёного совета К — 003.57.10 по присуждению учёной степени кандидата физико-математических наук в Санкт-Петербургском государственном университете.

С диссертацией можно ознакомиться в библиотеке им. А.М. Горького Санкт-Петербургского государственного университета.

Автореферат разослан

Ученый секретарь специализированного совета К - «03.57.10

доктор физико-математических наук, профессор

Горьковой В.Ф.

ОБШАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Игры с оптимальной остановкой, как один из классов задач теории игр, известен достаточно давно и в целом создан математический аппарат для решения такого рода задач. Оказалось, что такие игры могут быть использованы для построения математических моделей например в биологии, при изучении экологии поведения животных (выбор партнёра, выбор мест питания и размножения), а также для решения некоторых классов дифференциальных уравнений.

Классические методы, используемые для моделирования поведения животных, например при выборе ими партнёра, предполагают, что выбирающей особи заранее известно распределение качества (например, окраска, размеры и т.д.) потенциальных партнёров, однако в действительности это не всегда верно. Эксперименты показывают, что животные используют адаптивный поиск, т.е. их "представление" о распределении качества потенциальных партнёров зависит от качеств партнёров с которыми животное уже сталкивалось в прошлом.

В связи с этим очевидна актуальность решения игр с оптимальной остановкой в условиях неполной информации.

Цель диссертации. Целью диссертационной работы является

1. Построение математической модели поведения животных при выборе ими партнёра, если известен закон распределения качества ( в частности нормальный) потенциальных партнёров, но неизвестны параметры распределения.

2. Решение многошаговой динамической игровой задачи с оптимальной остановкой.

3. Решение игровой задачи оптимальной остановки с отражающими

• экранами.

Научная новизна. В данной работе Кочетова Э.А. получены новые результаты касающиеся игровых задач с оптимальной остановкой. Впервые исследована задача оптимальной остановки с неизвестными параметрами закона распределения поступающих наблюдений, когда критерием является выбор наблюдения с наибольшим значением. Новыми являются результаты по многошаговой игре двух лиц с оптимальной остановкой, когда выигрыш определяется в конце процесса. Продолжены исследования игровых задач с оптимальной остановкой определённых на симметричных

случайных блужданиях с отражающими экранами. При решении задач предложены новые аналитические и численные методы.

Практическая ценность. Исследованные в диссертации модели оптимального принятия решений могут быть использованы в задачах экологии поведения, касающихся выбора партнёра или места питания. ■ Предложенные методы сведения игровых задач к серии задач оптимальной остановки представляют большой интерес в теории динамических игр с оптимальной остановкой.

Апробация работы. Результаты диссертационной работы докладывались на VI Японско-Российском симпозиуме по теории вероятностей и' математической статистике (Токио, 1995), V школе "Математические проблемы экологии", (Чита 1994), на научном семинаре кафедры математической статистики, теории надёжности и массового обслуживания факультета прикладной математики —процессов управления Санкт - Петербургского государственного университета (Санкт - Петербург, 1996 г.), на научном семинаре Читинского института природных ресурсов СО РАН.

Публикации. По теме диссертации опубликовано три печатных работы.

Структура и объём работы. Диссертационная работа, объёмом 93 страницы, состоит из введения, трёх глав, заключения и списка литературы, содержащего 72 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Первая глава — введение. В втой главе вводится понятие стратегий и функций выигрыша в играх на случайных блужданиях, описываются основные методы, применяемые при решении задач оптимальной остановки, а также обосновывается практическая необходимость решения такого рода задач.

Во второй главе рассматриваются проблемы последовательного выбора, которые имеют приложение в экологии поведения животных. Одной из популярных тем здесь является задача выбора партнёра. Классические методы предполагают, чтй определённому полу заранее известно точное распределение, по которому апробируются потенциальные партнёры. Однако, в действительности это предположение может быть нереально: поведение выбирающей самки может зависеть от качества самца, столкнувше-

шегося с ней перед этим. Это подтверждают и биологические наблюдения. Эта зависимость показывает, что поиск позволяет определённому полу узнавать кое-что о качестве потенциального партнёра и приспосабливать своё поведение в соответствии с этой информацией.

В данной главе рассматривается такая модель с адаптивным поиском и информацией основанной на стохастическом динамическом программировании, причём известно, что закон распределения качества потенциальных партнёров является нормальным с неизвестным математическим ожиданием и диссперсией. Задача решена без и с ограничениями на промежуток времени наблюдения, причём за каждое наблюдение взимается плата с.

В первом пункте этой главы даётся общая постановка задачи. Во втором пункте рассматривается случай, когда неизвестен лишь первый параметр — среднее, которое перевычисляется на каждом шаге рекурентно по формуле ап+1 = а„ 4-(и',|+| — <»п)/(» + 1), причём на первом шаге среднее полагается равным наблюдаемому значению и остановки на первом шаге не происходит. Второй параметр — среднее квадратичное, считается постоянным и равным единице. Пусть функция Беллмана У(ц>„,а„,п) — ожидание максимального выигрыша самки, т.е. ожидаемое качество выбранного самца в случае, когда самка действует оптимально. Здесь п — номер текущего партнёра, ю„ т— его качество, а ап — текущее среднее.

В этом случае уравнение Беллмана имеет вид

У(ш„,а„,п) = шах |и>„,-с+ J 1'(ш,а„ + + 1)с/Га„(и))| .п = 1,2...

(1)

с граничным условием

У(и>,а,М) = ш (2)

В данном пункте доказываются следующие утверждения:

Теорема 2.1 Для любого п решение уравнения (1) с условиями (2) имеет следующий вид

К(ш,«.п) = тах(1о,-с + а +6п(М)),п = - 1, (3)

. где ¿л/-,(.У) = 0, ц

n = 2,...,N — 1. (4)

Теорема 2.2 Если N стремится к ос, то последовательность ¿n(N) сходится к предельному значению ¿„ ограниченному единственным решением уравнения

6 = (6 — c)F(6 — с) + /(Ä — с). (5)

Также здесь представлены численные значения Ä„ для различных сип.

В третьем пункте рассматривается случай, когда неизвестны оба параметра. В втом случае установлены следующие факты:

Теорема 2.3 Для любого п решение уравнения для данного случая с соответствующими граничными условиями имеет вид

V(w,a,<r,ti) = тах{ш,—c-f а + ¿¡^(<0}, п = 2.....N- 1, (6)

где =0, и для п =2.....N-1

Лемма 2.6 Последовательность ¿^(сг) для каждого п,а возрастает по N. Теорема 2.4 Функция

г„(<г)= lim

N—оь

выпукла и возрастает для каждого п

Существует определённая трудность в подсчёте функций Sn(o) для всех п. Пусть п —» оо и предположим, что существует предел функции Ца) = lim ¿„(ст). В втом случае функция ¿(er) удовлетворяет уравнению

п—.оо

Интересно, что уравнение (8) совпадает с уравнением (5) полученным в предыдущем пункте для фиксированного <7 = 1,

Лемма 2.7 Функция ¿(а) возрастает и выпукла.

Итак, оптимальное поведение выбирающей самки следующее: она не останавливается на первом самце, но запоминает его качественное значение м>|. Когда встречается со вторым самцом она запоминает и перевычисляет а-1 как (к>| + м^)/2 и <т1 как у— а', затем сравнивает и>2 с —г+«а+йа(<Уа). Если последний не превышает предыдущего она останавливается. а противном случае она опробует нового самца, Шз, и сравнивает ЭТО С —с +11:, + Л.)((Г.|), и т.д.

В третьей главе — "Многошаговая игра с оптимальной остановкой" рассматривается игра двух лиц с оптимальной остановкой. Её можно интерпретировать, представив гонки двух яхт движущихся вдоль одной прямой, начальное расстояние между которыми равно х. В каждый момент времени (на каждом шаге) игроки могут наблюдать .V — независимых одинаково распределённых случайных величин из их последовательностей с непрерывными функциями распределения (/) и С(у) соответственно. От того на каком наблюдении остановится игрок зависит дальность его продвижения по прямой. Игрок выигрывает, если он опередит противника за К — шагов К > 1. В данной главе эта задача решена и построены численные модели для экспоненциального и равномерного распределений при Л' = 1 и Л' = 2 соответственно и числом наблюдений N = 3 и .V = 2 соответственно. Особенность этой задачи заключается в том, что оптимизируется поведение игрока не на каждом шаге, а за все К шагов сразу.

В первом пункте этой главы даётся общая постановка задачи. Во втором — задача формализуется. Третий пункт представляет технику решения. В четвёртом пункте описывается класс стратегий на которых достигается ситуация равновесия в данной игре. Это стратегии вида:

( > -Iм

г(--">) = < г]*'Н=1...М>;*|« > .{*» (9)

I 'V; < .. N-1)

для первого игрока. И стратегии вида:

<Ф»,;'> = \ ¡;ч!4 < > ..>!" (10)

для второго игрока.

И наконец в пятом пункте находятся пороги г, и для (9) и (10), как

решение следующих систем.

J J Hk.Ar + i-v)dG(v)dF{i)- J 4 *„-«')</<?(»>)] = О

(n = l.....N- 1).

(И)

j tfwIi + ii-iiJilfliil + CI^,) J Hk-ilx + v - iVn-n)dF(u)) =

= 0

(»=1.....ЛГ-1).

(12)

Решение систем (11) и (12) (учитывая, что zü — +са\гц = —оо) и есть пороги ?„ и tu„ для стратегий соответственно первого и второго игрока на k-ом шаге игры.

В четвёртой главе рассматривается игра двух лиц с оптимальной остановкой случайны! блужданий. Рассмотрим игру двух игроков, определённую на случайных блужданиях следующего вида. Пусть х„ и у„ — симметричные случайные блуждания на множестве Е = {0,1,...А'}, начинающиеся из состояния а и Ь для первого и второго игроков соответственно и поглощающиеся в состояниях 0 и А' с вероятностью рис вероятностью q переходящие из втйх состояний в состояния 1 и А' — 1 соответственно. Игроки действуют независимо друг от друга на основании полученных наблюдений и останавливают наблюдения в некоторые случайные моменты г и а соответственна. Если х, > у,, то первый игрок выигрывает, если хт < у „у то выигрывает второй игрок, а если хг — у,, то ничья. Задача решена аналитически для произвольных pnq>0up + q = l.

В первом пункте даётся постановка задачи. Во втором — игровая задача сводится к задаче оптимальной остановки с помощью введения спектров стратегий д,- = Р{хт = ¿} и = Р{у, = «'}. В третьем пункте даётся решение задачи, которое опирается на следующее з'тверждение* :

'Маэалои B.Ii. Нгуоннс моменты остановки. — Новосибирск, Наука, 1987. — 187 с.

Теорема 4.1 Для того чтобы вектор л - (а.., л0,... бил спектром

некоторой стратегии т необходимо а достаточно выполнение следующих условий:

К + г

]Г (13)

(14)

з, > 0; 1 = -с.О.....А' +(15)

Где —г и А' + с — фиктивные состояния такие, что теперь случайные блуждания рассматриваются на множестве Е = {—;,0,1,... А'—1, А", А'+г}, но переход из состояния 0 и А* соответственно в состояния — г и А' +1 происходит с вероятностью </, после чего частица поглощается в последних состояниях с вероятностью 1, а переход из состояния 0 и А' соответственно в состояния 1 и А' — 1 происходит с вероятностью р. Очевидно, что такая модель эквивалентна первоначальной. Далее будет рассматриваться именно она.

Приведём основные теоремы описывающие решение данной задачи.

Лемма 4.1 Если а = 4, то существуют такие стратегии т' и а' первого и второго игроки соответственно, что

вир Я(т, ст") = М1Цг\а) = 0.

г а

Причём спектры оптимальных стратегий будут иметь следующий вид.

1. Если 4 + 1 + [;] < А' < 2(6+ (:]) + 1, то ((с]+ 1)/(Ь + 1+ .- + [;]); ;=-;; (--[_-])/(4 + 1 + .--+ И)!

¿ = 1,3.....2( А' — 4 — 1 — [г]) — 1;

([_-]-_- + 1)/(6+1 + .- + [г]);

' =2,4.....2( А' - 4 - 1 — [г]);

(24 - А' + [;] + с + 1 )/(4 + 1 + ; + (;|); = А'; 0; для других < 6 Е.

2. Если 2(4 + [с]) + 1 < А', то ([.-] +1)/(6 + 1+- + (_-]); =

(.- - [--|)/(Ь + 1 + + [-]); = 1,3.....2(6 + [г]) + 1;

((.-1 - с + 1 )/(6+ 1 + + [.-]); = 2,4.....2(4+ (г|);

0; для других У 6 £'.

<■ = а; =

/, = л, =

Лемма 4.2 Если а < Ь., и выполнены следующие условия

b<r.!íi±M±i£±£; 2(« + (.-1 + 1) + .-'

Л' > а + [;] + 1,

то существует такая стратегия а' второго игрока, что

и, -V (а + 1 + (-])(а - 6 + [;)-;) - + 1) + а(; + 1) 4 -(.- - [.-])

Т"(Т-(« + |;] + --+.1)(«. + |--] + -- + 2)-*

Оптимальные стратегии при атом имеют следующий вид.

1. Если а то вектор t* — (/-*,. ■ -1 ¿a'+j ) имеет

вид

2(а 4 1 4 (;])a + z- ¿(2(а 4 1 4 М> 4 ;) , = _ (а + [.-] + г + 1)(а 4 [--] 4 - 4 2) ' ''

(Ь-в + с-[г])/(л + [г] + г+1); i = 1;

■2= 4 Ь 4 1

(«4 + ; + + Н + : +2) |2г + Ь+1Н2([с]+о + 1)-А")

; г = 3,5.....2(Л'- а -[.-]) - 3;

; ' = Л';

(« + [с] + ; + 1)(а+[;1 + г+2) О ; для других i € Е.

2. Если А' = а 4 (с) 4 2, то вектор I' = (/_.,... имеет вид

2Ы + 1 + И)3 4 г - Ы2(« 4 1 + [z]) 4 :) , = _ (« + [sJ + : + l)(e + [;] + r + 2) '

(Ь _ „ + с _ [;])/(„ + [_-] + - + 1); J s 1; (2; + й + l)(2(fj¡ 4 а 4 1) — А")

О : для других г 6 Е.

i = А';

3. Если К > 2(н + |с]) + 1. то вектор Г = (/_;,____<л>=) имеет вид

2(а + 1 + |;))* + - - Ц2(а + 1 + [:]) + ;) , =

(л + [;| + .- + 1)(«+[:| + с + 2) : ' (Л — я + ; - (--])/(« +[--]+ г + 1); I = 1;

2- + А + 1 , , + + , + + ' = 3-5.....2(и + [:]) + 1;

О : для других / £ Е. Лемма 1.3 Если а < Ь и выполнены следующие условия:

2(« + [.-] + 1У + .-

ь< ь-

2(« + [--1+ 1) + --

К > а + [с] + 1. то существует такая стратегия т" первого игрока, что

■ г»/ - . +1 + НИ"~ь + н-->-+1) +"(--+ п + =(--(-1) ■*> =-(в + И + .- + 1)(« + н + .- + 2)-'

Оптимальные стратегии при атом имеют следующий вид.

1. Если а + + 2 < А* < 2(я + [;) + 1), то вектор = (я..,... + имеет вид

(г+1)(о + 2([.-| + 1))

(о + - + [1] + 1)(« + ; + (:] 4 2)' а+ 21 [с)-И)

+ - + + 1)(« + - +И+ 2) М + 1-г

—; / =2,4....,2(А'-а-

•2);

а + с + [--] + 1'

1 = 2( А' — а — [г) — 1)

(Д + г + И + 2)(2(<1 + [;[) + 1 - Д-) -К; - [с|)(А' + 2, + 1) (я + - + [-] + !)(„ + ; + [-) +2) ;

А':

0: для других ' € Е.

2. Если Л' = а + (г] + 2, то вектор 6* — (<$_*, • • м имеет вид (г + 1)(а + 2([г| + 1))

(а+с + |г]+1)(а + = + (г] + 2)'

И + 1-' -

в + г + И + 1'

* = + + 2)(2(а+ [;]) + !- А)-Цг - [;])(А + 2:+ 1) 1а + г + 14 + 1)(в + в + [8] + 2)

,= А'; 0; для других г 6 Е.

3. Если К > 2(а -I- [г] 4-1), то вектор а" = (а-,,..имеет вид

(.-+ !)(<■ +2((г] + 1)) .__

(а +г + И + 1)(а + -- + [--] + 2)' ' ~ "

___; = 9 4 о(р + Н).

(а +г + И+ !)(« + .- + (.-1 + 2)' -.«,..■.-<<» +МЛ

-; ¿=2(« +1*1 + 1)

о + - + |г] + 2' 0; для других I е Е. Леыма 4.7 Если а < Ь и выполнены следующие условия:

Ь>Ь' =

2(« + |:]+1)Чг

2(а+[г] + 1)4-;' А' > ¿+ЛГ + 1,

то существует такая стратегия а' второго игрока, что

... .. (Л' + Ш-в + Л'-.-К^ + А^б-а)

ТЩт'а > =--+ -•

где N 6 {« : I = 0,1,2.....} и т.ч.

1. Ь в если 21*+ 1)<;;

2• Ье «ли2Л' < г <2(Л? + 1).

При этом оптимальные стратегии имеют следующий вид. Пусть

: — 2.4 '

14-2.У(ЛГ4-1)~\ г - 2.У - 1 ) '

если ; > 2Л' 4- 1. И пусть

г 4- 2ЛГ1

с — 2.У

если : < 2.У 4- 1. Тогда,

1. если 6 + .V + 1 < А' < 2(4 4-V), то вектор Г = (<-,,..., ) имеет вид

Л =

(1+ЛГ)/(Ь + ЛГ) 1 = 1; г(4 — 1) — 2.У(6 4- .V)

(6+.У)(6+У + ;+1) 6 4-14- 2.У(Ь+ N 4-1) — г( 6 — 1)

; I = 2,4...,2(А' — 6 — ./V — 1);

(2.У 4-4 4- 1)(2(Ь + ЛГ) - А') 4- Ц- - 2.У) - (.- 4- 2.У2)

(6 4- .У)(Ь.4- :У 4- - 4-1) 1

I = А'; О ; для других I € £; 2. если А' >2(6 4- -V), то вектор /" = (<_,,... имеет вид

(1 4- Л0/(&4- ЛО « = 1; г(4 — 1) — 2Л^(Ь4-

(6 4- 4- -V 4- : 4-1) 44-14- 2^(44- N 4-1)-г(6-1)

(6 4- ЛЛ)(& 4- Л/ 4- с 4-1) О ; для других < 6 Е.

; I = 2,4...,2(44- .V);

; ¿ = 3,5.....2( 6 4- /V) — 1;

Пусть теперь

[ г — 2Ы - 1 ;г-2(Лг + 1)У'

если с > 2Л'+ 1 (если ато не так, то мы находимся в предыдущем случае) -и если г > + 1). Если же г > 2Л'+ 1 и г < 2(ЛГ+ 1) пусть

Ье[ .--2Л'-1

1. Если Ь +' ЛГ + 2 < К < 2(6 + ЛГ) + 1, то вектор Г = («.,,..., <А>.) имеет вид

<¿-^/(¿ + N + = + 1) .-=1;

2(Л' + 1)(6 + Л' + 1)-.-(Ь-1) ... .... ,

^Ь + ^^)^Ь + N + : + l) ; ."М...,2(Л->-АГ-1);

,(-- + 1)(Ь-.1)-2(Ь+Л')(Л' + 1) . м .. . -(Ь + К){Ь+м + я + 1)-; » = ЗЛ...,2(А-Ь-ЛГ-1)-1;

(2Л' + г. + 1)(2( 4 + ЛГ) + 1 - А') + ыг - 2Л' - 1) - (г + 1 + 2А/( Л' + 1)

<Ь +ЛГ)(4 + Л' + -- + 1)

»= А'; О ; для других ¡е£. 2. Если А' = 6 + Л' + 2, то вектор I' = (<_,,... имеет вид

^Z-N)J^Ы-N +z +1) ¡ = 1;

и =

2(ЛГ + 1)(Ь + ЛГ + 1)-2(Ь-1)

(Ь + ЛГ)(Ь + Лт + - + 1) '

«=2;

(2Л' + Ь + 1 ){Ь + Л' - 1) + ¿(г - 2Ы - 1) - (; + 1 + 2Л'(Л' + 1) (4 + Л')(6+ЛЧ: + 1) ;

» = А"; О ; для других I 6 Е.

3. Если К > 2(А + .V) + 1, то вектор Г = .имеет вид I- —- ЛГ>/СЬ -Н -V -Ы + 1) 1 = 1;

2(.У 4-1Н& + .У -И)-:(&-!) . (6 + .У)(А + Л' + -- + 1) ;

« =2,4. ,.,2(Ь+#);

1)(й-1)--2(4+,У)(/У+1). (6+.\')(6+Л/ + : +1) 1

»' = 3,5,...,2(6+.У) + 1;

О ; для других «' 6 Е.

Лемма 4.8 Если а < Ь и выполнены, следующие условия: II. 2(а+[.») + !)' +г.

Ь>* = 2(а + (г) + 1) + ; ' Ь + N 4- 1 < А',

то существует гюкая стратегия т' первого игрока, что

(М +,1)(Ь - о + ¿V - г) + (Ь + АГ)(А - а)

1Ь+.М)(Ь+.\ + :+ 1) где .V б {I : г = 0,1.2.....} а т.ч.

1. если 2и* + 1)<;;

2. бе если2Ы < г <2(^ + 1).

При этом оптимальные стратегии имеют следующий вид. 1. Если Ь+ N + 1 < А' < 2(4 + /V), то вектор а' = (з_г,..., лл+г) имеет вид ' (¿-а + Л + 1)/(6+У+г + 1) I = —г;

- + а

(¿+Л0(Ь + ЛГ4-г+1)

(2(.У + Ь) + 1- А')(.-+а) (Ы-.У)(6 + Л/ + „--Ы)

О ; для других ; £ £7.

; ¿ = 2,4...,2(Л'-Ь-ЛГ — 1); ! < = А';

2. Если К > 2(Ь + Л^), то вектор л" = имеет вид

(Ь~а + N + 1)/(Ь + Л' + с + 1) . = -г; 2 + а

(6+Л')(6 + Л' + ; + 1) О ; для других г 6 Е.

; I = 2,4.. .,2(Ь + Л');

Лемма 4.9 Если а < Ь и выполнены следующие условия:

- ; - 2Л' а+ с + 1 < к' < Ь+ Лг+ 1,

то существует такая стратегия с' второго игрока, что т .. Ь-1 + 2(К-Ь),

«ирЯ(т,<г )= (у + д)(А._1)(« + «)-1.

где Л' €{»':» = 0,1,2,...,} в то.«».

«сл.**+ !)<*; 2. Ьб [^г;+оо), если 2ЛГ< г <2(ЛГ+1).

Если а + : + 1 < К < Ь+ Л' + 1, то вектор Г = ,1А+1) имеет вид

( (К-Ь)ЦК-\) ¿ = 1; <(= | (Ь-1)/(Л'-1); » = Л"; | 0 ; для других / 6 Е.

Лемма 4.10 Если а < Ь и

в + : + 1<А'<Ь+А' + 1,

то существует такая стратегия г" первого игрока, что

где N е {»: ( = 0,1,2,...,} и т.ч.

1-ъе если 21А + 1)<,-;

2- ь 6 [й^г; -если < - ^ +

При этом оптимальные стратегии имеют следующий вид. Вектор а" = ... »л^+г) имеет вид

[ (Л"-а)/(Л' + г) « = -.-; .*,= ^ (а + .-)/(/1 +с); 1 = А"; [ 0 ; для других г е Е.

Лемма 4.11 Если А' < а + - + 1, то существуют такие стратегии т" и а' первого и второго игроков, что

\а( Щт",<г) = зщ>Н{т,а') =

А' + г'

При этом оптимальные стратегии имеют следующий вид. Вектор <* = ¿л+г) имеет вид

Г (А' - Ь)/(1\ + :) ,' = -;; /,-= | (¿ + -)/(А' + с); 1 = А'; I 0 ; для других I е Е.

Вектор .5" = («_,,..., 5д+г) имеет вид

( (А'-а)/(А' + .-) = * =< (а + с)/(А' + ;); = А'; I 0 ; для других I 6

РАБОТЫ. ОПУБЛИКОВАННЫЕ ПО ТЕМЕ ДИССЕРТАЦИИ "

1. Э.А. Кочетов Задача сбора урожая с линейной функцией цены.

//сб. тез. V школы Математические проблемы экологии, Чита: изд - во ЧИПР СО РАН. 1994, с. 54.

2. В.В. Мазалов, Н. Перрин, Э.А. Кочетов. C.B. Панова Экологические задачи выбора с неполной информацией. //Обозрение прикладной и промышленной математики, М.: изд - во ТВП, Т. 3, вып. 3, 199G,

с. 371 — 383 .

3. Э.А. Кочетов Многошаговая игра, с оптимальной остановкой.

//сб. Математический анализ и его приложения, Чита: изд - во ЧГПИ. вып. 2. 1990. с. 25 — 32.

"РаОота выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект 96-0I-(JI6ll(l)