Методы оптимальной остановки в оптимизационных и минимаксных задачах

Мазалов, Владимир Викторович

Методы оптимальной остановки в оптимизационных и минимаксных задачах тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Мазалов, Владимир Викторович АВТОР

доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Ленинград МЕСТО ЗАЩИТЫ

1990 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Методы оптимальной остановки в оптимизационных и минимаксных задачах»

Автореферат диссертации на тему "Методы оптимальной остановки в оптимизационных и минимаксных задачах"

/пз

ЛЕНИНГРАДСКИЙ ОРДЕНА ЛЕНИНА И ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

/"2йО ■/? правах рукописи

^^У.сух^с УДК 519.2, 519.8

МАЗАЛОВ Владимир Викторович

МЕТОДЫ ОПТИМАЛЬНОЙ ОСТАНОВКИ В ОПТИМИЗАЦИОННЫХ И МИНИМАКСНЫХ ЗАДАЧАХ

01.01.09 — математическая кибернетика

Автореферат

диссертации на соискание ученой степени доктора физико-математических наук

Ленинград—1990

Работа выполнена в Читинском институте природных ресурсов СО А¥ СССР.

Официальные оппоненты:

доктор технических наук НЕЛЕПИН Р. А.;

доктор физико-математических наук НОВИКОВ А. А.;

доктор физико-математических наук ТОМСКИЙ Г. В.

Ведущая организация — Институт математики и механик! УО АН СССР.

Защита диссертации состоится «_» _ 1990 г

в _ часов на заседании специализированного Ученого совет:

Д-063.57.33 по присуждению ученой степени доктора физико-математиче ских наук при Ленинградском государственном университете (Ленинград В. О., 10 линия, д. 33, ауд. 88).

С диссертацией можно ознакомиться в библиотеке имени А. М. Горь кого Ленинградского государственного университета (199164, Универсн тетская наб., д. 7/9).

Автореферат разослан «_» _ 1990 г

Ученый секретарь специализированного совета кандидат физико-математических наук Л. В. ХАРИТОНОВ

- 3 -

СЕЦАЯ ХАРАКТЕЖЕШ ГЛБОТЫ

Актуальность тсуч. Задачи оптимального управления-случаинн?::: процесс?.!,г.! кь:ект парное теоретическое у.т практическое значение. Сд-ной из ветвей этого направления являятея задачи оптимальной остановка, где ас результатам-последовательно псс гупаю.'Д'.х наблюден:::'-, получение'хотогух связано с" определен!•>.?»и ззгратат/и, следует сде-дать ззкдвченке о ток, сто::? ."и еце продолжать Н1б.яюди:ля или и:-: достаточно для того, чтобы принять правильнее регение'.

Бозкяшргекие и интенсиэнсе развитие исследоээдов задачи сл-тиуальнсЛ сс-тансзкн получил;: после появления в К'^7 году ккнм А.Зальда " "Последсвательнк-Д анализ",-в которой енл списан один частный гетод проверки статистических гипотез, который назывался последовательны« критерием отнесения вероятностей. Л.Зальдо:.: и ¿bs. Зсль*оаи1;ем бкло доказано, что в задаче различения двух гипотез при заданных вероятностях одкбечных решений среднее число наблоде-ний о т о л последовательной процедуры не бедыге, чем у лзбего другого редакдего правила. 3 случае, когда получение наблюдений связано с определенным: затратами, последнее ку.еет важное практическое значение. онзчптельние продвижения в сбдей теории байесовских ресащих правил были едэданн в поеледукцих работах А.Зальда, Ля.ЗальрОБииа, Д.Елекуэлга, А.Г/рг:пг'а, ГеГроота и других авторов. 3 1951 году Д.К.ииг.яеэки Сьтло дано, решение задачи сб оптимальном обнаружении :.:о:,:."кга г.зхекенкя свойств наблядаеуого пропесса (так называемая задача с разладке), которая сказала еллыгсе злияннз на- дальнейшее развитие теории оптимальной остановки, как з связи с оригинальность» кетсда с еденяя, так и в связи с прикладной направленностью са:/ой задачи, поскольку больдей класс задач б радиотехнике, касакцийся обнаружения сигналов в цепи, относится к этоку типу. Алгоритм обна-руг.екия бъ'л основан на сведении задачи о разладке- к задаче опта-

галььсй остановки некоторого марковского проигсса. Стоеткм также ¡.•i.riiiv результаты в г то!! области К.ПэЬ^а, Т .Ладена, А.А.Новико-

\ч< 1! др. -

• Одновременно с отк!.'и работами развивалась о6е;эе теория опти-.vur.bHL-x правил остановки. Центральное место б ней занижает задача с гмСоге наклучпыо объекта. Обзор результатов ь ртом направлен'.'.'.! i.:o-~ho ш?ти в обобгеакзей ыоногра-Тии П.Чао, ГЛ-оббинса, Л.Сигкунда. 'Ткг,_: ия опткуьльных прагкл остановки" к статье Jl.C.Poysa { "Twenty years of secretary problems: a survey of developments in the theory of optinal choice".- Adv. Kaneg. St., 1, 1982, p.53-64).

- 3 ряде задач, оптимально»": остановки вид йункпки вкигрипа при оатаноьг.е' адгет сказаться не с-оьсы: определенны, например, когда задаче/ наблюдателя является остановить пронесе наблюдений как -1.:о'-.:но Слито к KeKOTO.LO.vy noj.oroEo.vy значений. Понятие "блкд.е" ко-::хт п/.еть разное толкование. Так б задачах последовательного анализа наблюдения продолжаются до тех пор, пока апостериорная вероятность какой-либо гипотезы не станет близка к единице, а "близость" определяется по задании!.: потерям в случае ошибочных jezse-ни?, которне бнЕает трудно оненить(ото особенно актуально v зада-чау. медицинскоп диагностики). В задаче о разладке оптимальное правило ищется в смысле йункниснала, учитывающего вероятность "ложной тревоги" к длину интервала вреуенк ме?'ду на ступи г-гх-к раз-лапкой и кокситам ее обнаружения. Однако кяогда трудно сгаьн;пь указанные величин:-.' между собсГ:.

В связи с: откм представляет интерес рассмотреть минимаксной карнант задач оптимальной остановки. Сн м.охет бнть йспольоор&к во бс.гх перечисленных выше задачах - б задаче с Енборе наилучшего объекта (нукно -выбрить объект лучший, чем у противника), задаче о разладке ! г-ги грива ет игрок, первым обнаруякбьйй mci.'sht разладки), алгоритма?, случайного поиска зке.тремума функций (¿''игркг.ает игрок,

насэджй значение ^ункагл больае, чем у противника), а такяе в ряде задач оптимального управления случайкккя процессами. !йшккакс-1-:ь;:.1 задачам'оптимальной остановки-были-поевяцены работа fcs.Гиль- • берта, О,.'.,остеллера, 'J. Сакагучи, ¿¡.Курано, Д.Какагаяи, ¿¡.Ясуда,

Е.Г.Еннса, З.З.Ференстейка, ЛJJ.Петру челли-, А.А.какт.уга-ра, Д.Н.Ляпунова, B.K.iovai-CKoro, Г.Н.Дюбкяа, З.Л.Прескат, П.У. Сснгна, F.H.Читасвхлля, Г.А.Чеизвялли* Н.В.йлбакидзе и.др.

Пельа паботи является исследование минимаксных проблем и задач спт;:г.:аль.чого управления' случа'Рньг/и прок-еса-'И, а которых стра-. тегияуи являются-уоненти остановки нлблюдаеунх- процессов."

. научная новизна и .практическая знач:::,;ость. Лкссертакиошая работа посвящена раззити» ноэого направления математической. ¡«бар-кет;::« , лЕг'л:цего на'стыке теории nrj) и управляемых случал!: ::<: процессов. ■ '

В -диссертаиии развит оригинальный, подход к исследованию задач оптимальной остакозги с помощью спектрсз-стратегий, которые, кая показано в работа.образуют выпуклое замкнутое кноу.естэо в евклидово:.-: пространстзе. Переход от сложных проетранстз измеримых функций, которжя-яйлявтся стратегии, к простак пространствам для'спектроз. даэт большие праииуцества. •

Впервые получены ресенкя ыиниыэхснкх проблем оптимальной остановки,/процессы наблюдений' в которых представлявт собой случайные блуждания, пннероЕскяе процессы-последовательности испытаний Бернулли, последовательности независимых, одинаково распределенных случайно: величин. Для достижения этого развиты новые геометрические кзтоды нахождения- пекы з.задачах оптимальной остановки. йш;;-уаксянв проблекы оптимальней огтанозяи можно исследовать с гояялыо теоретжо-кгрсзкх кетодоз," однако, икенно применяя-методы оптимально'/ остановки,в работе удалось получить значительные продви-лог>'я" я отом области.

. В диссертации впервге исследованы задачи,- в которых решение задччк оптимальной остановки является од ни е- из отапоь оптимального упрзьления некоторым случайны:.' блугданием. доказано, что оптимальнее стратегии ле~ат в классе пороговых стратегий и найден к:: я; • ьид и окрестности нуля и бссгокечнсютк, ксслсдосаки их «.оГства в шчкь-акскок варианте задач. Предложены численные гетодн их нахождения.

:азрабстаннуе в диссертации уезодн реп.-;:зоьаии и виде численных про::од\р. Ь лабератогин узтсг.*аткческкх проблем управления г скслогик Ч1П1Р СО АН СССР под руководство;; агтера создан пакет приклад »их программ "Остановка"предназначекнки для рег.ения различна пргклздтгх задач одтккальной остановки. Пакет кокет бить использован для нахождения местополотенпя источника 'примесей н реке, оптимального управления процессе;.: переработки гудч, оптимального сбора уро:-;ая е.различных задачах природопользования, диагностики, нахождения экономных методов распределения памяти. £Бт, прекращения наблюдений в задачах случайного поиска глобального экстрен/а ^унк-ций, решения других задач оптимальной остановки, в том числе - и б минимаксной постанське. Пакет "Остановка" используется на ряде организаций .и предприятий Читинской "области. На его основе на Кер-чинском полиметаллическом комбинате совместно со специалиста!.';; Читинского политехнического института была внедрена автоматизированная система оптимального управления процессом переработки слсг.нкх по составу полиметаллических руд, экономический згрТект от внедре-. кия. которой состегил 50 тыс.рублей (долегое участие автора 1а тыс. руб.).

Сенозже результаты, внносумнс на заикту.

I. Предложена теоретико-игровая схема исследования задач оптимальной остановки в классе стратегий'различного типа, изучены их скойстга, свойства их спектров.

.2. Разработаны новые геометрические методы построения цены з задачах оптимально;'! остановки.

3. Летально изучены спектры случайных Сдуддакий. ¿оказано, что они полностью определяются соотношениями, куда входят канонические координаты З.'1эллега.

4. Впе^слс получены- аналитические решения минимаксных проблем, опроделенннх на случайных Слушаниях, аинеровских процессах, последовательностях испытаний Бернулли, последовательностях нгса-знен.мых одинаково распределенных "случай:11:х величин.. При :>том, разработан метод. сведения минимаксной задачи к задаче оптимальней остановка с использог-анпек геометрических свойств рункнии пени. Ре-сесие найдено в классе смешанных стратегий, что значительно расширяет класс полученных другими авторами решений, 'которые искал:: его сред;: специальна чистых стратегий порогового вида.

. 5- Впервые исследована проблема оптимального управления случайна-": блуг-да:п:ем, з которой стратегиями каблядателя язллвтея момента остзновки не:;отсрсй случайной последовательности процесса. Показано, что оптимальные стратегии лезаъ о классе пороговая стратегий, получены их явные выразен;«; з окрестности нуля и бесконечности, показ а;'а их моното.чнссть. Прэдлснеку численные методы нахождения оптимально порогов.

6. Оригинальной является постановка задачи и разработанные кегоды исследован:« минимаксного варианта задзчи упрггеления случайным елу-данием. Доказано, что ситуация разкоаесия леки? з классе стратегий порогового вида, исслздозан их нид, получены .аналитические решения в окрестности .нуля и их асимптотический вид.

7. Разработаны новые- численные методы рекения канккакеш« • проблем оптимальней остановки путем сведения их к задачам линейного программирования или процедуре Бсауна-Робинсон.

В. Создан г:а:-т.т прикладных программ- для - рете-ния т;рокого яла с-

са задач оптимальной остановку.;, в ток числе л г- кинигаксно;.« варианте. . -

Апробация работы и'публикации. Ссновнке результат;,: диссертации оСсутдахксь на сегикарах по статистическому последовательному анализу с йатеь'атическоь: кнстк^тс кк.Б.А.Стеклова .Aíi CC'J?, в Яс-нингралекга:-к Якутском государетвекни .ижверсттетах, Иргутскоу шчислитедьног иентре СС АН CCUt, Читинско:; институте пркродплх ресурсов СС АН ££Сг, а такне на I и П Ь?.есся;ьн!;х конргрекцинх "Зс— гоятност'Ше х.стоды в дискретной гатегатике" (Пстрсьавсдек, itfcó, . Ii.-i.-fc), ,4i Бессоюзной коь'среннии "Проблемы теоретической кибсрне-тики" (Иркутск, 1Ы.5), I ■ Всилрноу конгрессе сбцестса г2?е:.-атеч',о— кок статистики и теории вероятностей ин.Ьериулли (Ташкент,.lücG), ¡вегдукародноС • ков?еренгии "¿дтег.атичесгие. кеголы е исследовании операций" (София,. 16£7), Всесоюзной коийеренпни "использование вычислительных средств ь экологии, экономике, ¡/едипине" (Саре^ОЕ, IC'ÉS), XI Все.ссвзноу см.:псзиу;.'е "Логическое управление с использованием ЕВи!" (Ьрдчоникидзе, K-Í.'b), XXII Еколе-коллодьиууе по теории вероятностей и математической статистике (Ьакуриани, И88.), í¿ Все-совзкок семинаре "Обнаружение изменения свойств случайных процессов" (йвекигород,• I9fc6), С Всесоюзно? KOK-f ерекпии "Уе.тодн кг.Сер— •нетики хигико-технологкчееккх пропл-сссв" (Москва, If-tí).

Публикации.' Основное содержание работа спубдккоганс в работах D-I83.

■ Сг,- - »• к структура Еисс.егтаиик.. ^иссертагкя состоит- из введения, пяти глав, списка литературы из 120 наименований и приложения, куда по;.;е^ено. описание пакета прикладных п:«грш.й' "Остановка' Сбьег. работы 253 стр;анини «/атйнописного текста.

. ССИКЬКАШЕ РАБОТЫ

Во введения дается крап-кий исторический обзор, гЧ^иу'дируютея

■ - s -

пели диссертации и основные результаты, кратко излагается- содержание работы.

В г.'П"е I "Задачи оптимальна," остановки" предлагается тяор-з---тико-игровчя схема исследовании задач оптимальней- остановки в классах етратегиТ: различного типа. При этом, дается постановка задачи оптимальной остановки- о рунккиям-а зыягрьса j- !Х) и л.гт» . CilГ), определение марковских моментов Î* , Р.'нкнип гены lT\X) и т.д. Б 5 I взодятся стратегии поведения, во § 2 - сме^аннуе стратегии, s ? 3 - чистое стратегии.

Под стратегией поесд&ния понимается векторл~= с компонентами Ж^ =Pfr*/l ] » где Т- коаант останов-

ки конечной марковской цепи ССп'и)) на мно:~еетзе El ),

з под опкгрсм- S» ( где jS.e £> {ЗГ, ** &£ ),

i = I, К. Следующее утяер-^дение является следствием прямых уравнений ¿-¡'-.Колмогорова. '

-Теорема- I.I. Компоненты спектра S кояно найти по формулам

г ^«Ь

где величина j удовлетворим системе линейных уравнений

здесь S" vî) = I. если i = <Х и = 0, если L^Ct,

а - а

' Его.следствием является утверждение, что множество всех-спектров - вшг.'клое и замкнутое множество з R- .

гандом/зания- на. множестве стратегий поведения приводит'к по-. кяга> смйчйнной стратегии. Смешанные■ стратегии будут играть особую гель в глаэе Ш при решении :/инн;.-акс;пи: проблем.3 % 2 показано, что ^меганнрд стратегии не даят новых спектров, и, следовательно, при решении сЛнлн'.« задач оптимальной остановки достаточно ограничи-зэться рассмотрением стратегий поведения. Чистыми стратегиями здесь галяатся моменты первого попадания з некоторое множество состояний.

Ь болы;, о:.: ряде работ оптимальное реление .ищется именно в атом классе стратегий. ' •

Обычно задач:; оптимальной остановки исследуится в случае по-ло-птелънок платы га наблюдения. В § 4 рассмотрены1 вариант знако-п< ;:и:сп:-;о# плати С (ЯГ) (саметим, что задачи с зкакслер-егонноГ: ■ п.па'.оГ логнпгакт при сйсдйпки задач;; олткг/альнсй остановки с dyiut-г за,чаче с ну.'.ьвоЯ qyui:;-;iui\ ыягркха J О, ¿J ). Ге-."уль-атсм исследования кьляетея

Ttcre.va 1.5. пусть , ..., - зс-к'ор.-и

й.'гг^елыйж .нероятностсй и плате-:«!: для оргодическкх классоз , . ...,,мар-кокской г.сш; соответственно. Тогда, если для некоторого / i^K* , то оптимально;» стратегий? прч; попадании прог:ссса в множество яелясгея Г =00 ; если в« , то спти-

. к»льпой стратегиеГ: является vckcht первого попадания в гнояостяо Г"* - | ХеЕ! : lf(x) ^ffa)}.! причеу цена if гскечнз и ясляется предела-.; jtpv.d.-* 4 пен tQ(Jf) в задачах с коэ£;?:шкситси переоценки ol.

' В § 5 получены соотношения, гстоиг/и полностью определяются спектры случайных блууданий на множестве |о, I, ... ,1с] с начале;-.' б точкеДп ¡¡а их основе ь 5 б предложен числен::«:" метод построения по заданный спектра?.: сами>: стратегия. При гтох; используются к&конкчеокгге координаты,... , введенное 2.1-еллер-о::, ьвд а. = 0,"И, = . г f." •

i = ..

Те op ема I.E. Хля того, чтобы -вектор S был спектр, он некоторой стратегии *JT , необходимо и достаточно, чтобы выполнялись условия

КГ 1С

t'O

В 5 7 для исследования задач оптимальной, остановки предлагается использовать геометрические свойства функции пены, при ото:.;, з гг.1, используя геометрические соображения, строится оптимальное правило в задаче с независимыми одинаково распределении;/;« случай-ню.:;; наблюдения;.'.;!, в п.2 и п.З предлагается простой геометрический способ нахождения иены з случае пронззолыых случайных блужданий на канонической ¡скале, и в п.4 описан геометрический метод построения цснк в задаче с наблюдаемой последовательностью испытаний Берну лла.

Глава Л "Оптимальная остановка наблюдений з задачах оптимального управления случайна'.::! блужданиями" посвящена исследовании задачи оптимального управления случайным блужданиям, связанной с задачей наилучшего выбора, "/¡меется последовательность серий^/(Ш) ( £ = I, ;_/=!, 2... ) независимых случайных величин с

одинаковой плотностью распределения р , I . В пределах

кандск. серии ^ ____осуществляется снбор как в задаче о

секеетаге, дагиий значения Ц1 /* = I, Г:____ Тос-буется осга-

низоеать выбор так, чтобы последовательностьИ)) = ОС. <0^

х+п: г/4 1-< Щ)

впервые достигала нулевого значения при .уиням.альноу .(либо, наоборот, максимально-.:)

3 § I э соответствии с геометрическими соображения:.';! первой гласи предлагается искать сезечие отой задачи а классе помгоэых

К-1

ст-атег

, .... ^ ) гида, если Я < О,

, /с

то я /С-ой серии забирается первая по номеру г. величина такая, чти (для задачи на максимум ); здесь ^ =

Ломнд 2.1. Плотность распределения 'собранной согласно стратегии Т (Ъ^ , .. ^ ^ ) величины ^ не зависит от немела еру;-»

1С и к»/еет вид

Г И-1 А/-/

дл>: .аадачи из »/а г га:-ум -

г И-1 А'-У

рСу)^ , 1А - »„таякср Л.

А.чалнр;р у я ь §§ 2 и-З уравнение для олтиг. а.\ы;сгс с-рсдньго ;.альи т.(») И (сос-тресствеичо Т (Ж) = дсстк-

Х'ЛиИЛ нуля

г /

получае:.- следующие. -утве^тйрм'кя. •

Teo.f-ei.-a 2.1 (случай уаллг /*/ ). Есл;: X тьковс, что. выполняете1? услоьио / Т(х-ц-)р(ч)ац. { •• (сс-отгс! п ьг.:ч:г-А/-* . в (• у О Г V <Г

стратегия поведения Т(2) определяется, с по>,'отьл породсв, гагяу-:

= . /= I......

Б равномерном случае « I, 1Л. от/. области пред-

стасляв? собой интервалы [ Ду , к [ Х^, , границы который

»/.окно найтк кз уравнсик."

"м-

*у

^К-*» АЬ/

V ~ „ • г /Н

?у;:к:л:.ч р (у) удовлетвс; яот уелоьи.'у: р О-соо . Лебега 1]: р у) = о} нулю, то .— г

• Tf. oy-p.va (случч?. бель.:;:л |*| ). Ьри - оо

Ьм\ Т(х) - (- т/Ь+- с)] = о,

Ь - ) ' » С - НСКСТО; ап псстс"..::-!-.

з?с;:, с?-;: обо значить оптимальные в задаче на ¡.ини;.;,;.- (ссответсг-

г-г.-нс максиму;.:) .пороги через (г^х), ... , -2^ (х))

- ) , то ¿X ваиитотма, ка-показано в 5 4 кнеет следуасхЯ вид.

Теорема 2.3. при . а: — - • - 2'6*0 = 2. ,

2 ^ » -2 , где ,2 определен!.: соотисягстпоино соотношениями -

I I

Н-1

о а! о $ _ »

• - М "

В § 5 отмечается монотонкость оптимальных иосогов 2 (X ) и

ш " ---

2 {X) в любой точке х<б

предлагается способ для их рекуррентного вычисления.

В главах Е! и 1У задачи оптимальной остановки исследуются з минимаксной постановке. Изменение критерия влечет изменение структуры решения. Заметим, что возникающие здесь минимаксные задачи мс:кно исследовать с псно^ью теоретико-игровых методов. Однако, . значительные продвижения удается получить,.применяя методы спти-. мальной остановки. ' •

Глава С "Аналитические методы /решения игровых задач на прави-. 1 ло остановки" посвящена исследованию игровых задач, в которой задачей игроков является остановить процесс своих наблюдений на зна-' чскии большем, чем у противника. В § I предлагается метод сведения таких игр к некоторой специальной задаче оптимальной остановки. Используя этот принцип, а такке разработанные в главе I геометрические методы нахождения функции пены, удается решить серпэ игро—. вкх задач для различных наблюдаемых процессов. В § 2 решена игровая задача /"*(й4) двух лип,, когда их наблюдения представляет

симметричные случайже бл'/ядания. * • - '■ ~со а)

Теорема 3.1. ьсли. Х^ ,(й>), X -(й)) - симметричные случайнее блуждания на множестве ЕГ = I,..., к| , начинавшиеся з состояниях Л( и алу, поглсцал-лиеся в состояниях 0,К, то значение игр« Г ка„а£ равно ( й,- а^/а г.-

3 § 3 каРдеко реззкис игрл: Г*Щ ) для несимметрична случайных блугдан'.!-/. При с-том используется геометрический метод построения гены в канонических координатах, предлшонный з главе I.

Один из полученных здесь результатов такой. Пусть *£{&)),

с началом в состоя

- 15 -

а) ~

Х^ (и)) - случайные блууда.чкя па множество Ь.

ниях 01 и й^ и поглощением а состояниях' О ¡: (С , :: ¡^ , р - вероятности перехода в любом состоянии влево и вправо и о( ,'р <[ Тесдема Ксли для некоторого нелого числа Ш такого, ч^о

№. £ (» выполняется условия

то значение игр н Г* (¿7,,равно

Н*--

«г

а сгект;:.; 5 и Б

лс:::д соотнесениями

оп'тмалы-пгх стратегий игреков х.и « опроде-

СП)

1+Л ~ Л -Л

I =

1т+1 «-л. . -о/ -о/

, ип+г . к . к+1

<+Л -Ы

/ -Аг

3 5 4 получено рее«икс игры .Г* (О, С) для последовательностей иелнтаппй Бергулли с вероятностью успеха р . При сведении иг-гевег задачи-к задачам оптимальной остановки используются кзкоки-

А Я

ческие координаты =.-!-> Ил-_{1 ~р ■ )/р , к геометрические сгойстг." йена, разработанные а глаье'1.

• ./ля нггото-.-ого набора нель:хчкгел ■<. £ К-1

< I ... т

обозначим

* / ¿-о 7"

Т'.огсга 1.7. Если р такое, что для всех £ = 0,|[Оп-ОЛ1 н-'лслняггся условия ■

гПИ+ги. .-и; ■

Г ¡=о j

¿-о У '¿^гж 1хе*£

-211. ,

¿Ы с

г-и* у * ^ ,

то с;,тиг*злык:.;и в игр-а Г* (0, 0) являются сизси стратегий Х^У пг.едппс1;вао,а>: прекращать наблюдения на п, -си таге, вида

р ¡> I- ^ ¿=0 " 7

+£П\-о\-П1. Ип-^л ч'/-г

В пссладусзих двух параграфах найдено решение для случая процессов с кет.рзркзчш.', гксягстви.;. состояний.. 3 §-о решена игровая задача, определенная на пинеровских процессах и значение игры полу чается такое яе, как в тессе;.« 3.1 и в § 6 решена игровая задача

для конечной совокупности независимых сдинакок» гасп; од;;.,е!.;;:г: г. неп;сркъноГ :*''ккг.ией еасп'.едслен.п': f (*)"на j£ сг.'ЧйГых :-e.v:".;;-.

Т^о;. ема Сптимальнг;.".: стратегия:--::'. к--л ист "й нгрсго;;;;о

„ д _ ►

стратегии, определеннее с пемопъ» порогов i, , ..., Z^ , г;-:-{ ГС FÍZu-l)} - ение систем" ;,ja н-. й

У-/ ' V-i

N-i «-*

I * zn n

Z, ^ z«»< *■= ,v< /-t У

11 1 * V-i

í+ZZ: /7 г.

/r-<*i J

Б случае bí = 2 наблюдений система 'представляет собой, одно уравнение для определения-единственного порога í* : Его решение - "золотое" сечение интервала [_0, i).

газгаботанний в 5 I- принцип сведения игр такого типа к задачам оптимальной остановки работает и в игровых задачах Г* (flf, -•-> Д ) с нееголыт.'.'л'. участниками. сто показано в § 7 и затек в 5 Ь sü^Tw-я полное регение иг; н ГЦ'-.йд ) для симметричных случай-•Hi'-í блугд«1:ий на гчог'-ет; й.у £ ~ ( О, i,..f}

В главе "Сптпучльннз стратегии в дин5>г.!Чпсгих играх ка правило оетансм-:;:" исследуется ккникакекнй вариант задачи управляемого случайного блуг-дания, которая рзе^матрп-а.саеь н глаю ii. Гасскатр-инаечся динамическая игра f ( Xt,Xz,fJ ) «ч'тоняямч) гида. Предположим, что из точек j", - на отрицательной полуоси ркхсдл-два объекта и начинают двигаться случайны;.?« скачка?, и в сторону ¡.-у- • ля. Величина,-на-которую двигается качдкй объект, определяется

: - 18;-

также, как в главе П. Выигрывает тот кэ игроков, чей объект лервыт,« цересочет нуль. Такие игры- можно трактс2дгн-£2Н.Х0нки под парусом со случайны.: ветром-.

Tarso, как и в главе ¡7," осковнуа роль здесь играат стратегии порогового Еига. Согласно теореме Носа, решение йене? получиться . в смесях этих стратегий. Исследуя уравнение для значения такси игры .

Li *

с использование« доказанной в § I в лсу.ме 4.1 непрерывностью сгупк-цки И(Г,,ТХ) в области *íí*0 УДаетоя показать в § 2, что

опти:.'йяьни.:к здесь язляэтея чистке стратегии (теорема 4.1).

В § 3 найдены оптимальные стратегии игроков, когда блу:кдания

находятся в окрестности нуля.

Теорема 4.2. Существует такая окрестность нуля U-:

' У *

где оптимальные стратегии игроков I и П имеют ви и . В равномерном случае( р(у)=

найдено аналитическое выражение для значения игрц |~| (Я^, ) в отой области.

Теорема 4.3. Решение уравнения для Н (X, в области Ц^ имеет еид «

„, V, V/ ¿А/+Г I)/

П (;//♦<)

И в 5 4 исследован случар, когда блуждание одного из игроков находится близко, а другого далеко от нуля.

Теорема 4.4. Три — со оптимальная стратегия игрока I

- IS -со ,

определяется порогами Z^ i ~1,tJ-t.

5 последней главе У "Численные методы рейекия задач оптимальной остановки" представлены численные методы, х-азработажые для репения задач оптимальной остановки и в тем числе, для решения игровых задач, которые положены в основу пакета прикладных щсграгм "Остановка", находящегося в приложении. В § I описан гриниип пропуска наблюдений в задачах оптимальной остановки, .что позволяет в ряде прикладных ьадач значительно увеличить выигркз при остановке. В §5 £ и 3 для решения игровых задач Г (£7,,^) и Г(ûj,

с наблюдениями,- случайными блужданиями на множестве 1£ = {и, I, ..., к-} предлагается, использовать методы линейного программирования. .

Теорема 5.1. Х.ябоэ оптимальное решение задачи линейного лрог-■раммнрокания и

JL, . (о min ¿.-; и *■ &.

при ограничениях

К H (m) а)

rzrz1 л ty) *^и, у=i

* СО . _

СО со (о —-Çs. и , ¡-щ

j-o J i 1 .Ci) _ ___

(СО —\ f ' где ÎU. j-0,K.j ~ канонические координаты для случа;.ново

(i) , —

блучдакия X^ , L * 4, N , дает спектры^оптигальных стратегий в игровой задаче- Г i(ft> при .отём^ПШконьзее значение

■тункпионалз равно 0. __. ■

Лт.ч произвольного случая" в 5 4 для псиона ситуации равновесия-в игрОЕСУ. задачах предлагается уодкЗикаиия итеративной пропедуры Г-гауна-гоби'лсск. 3 § 5 приведены результаты численного моделирования задачи опгкязльнсго управления случайннм блужданием и близкой • к ней по духу задачи динамического• гаепредрленкя паи-дти. 2ÏÏ.L 3 5 б i \ ьк:.ч:л оптимального риска в задаче г.рсьетки гипотез гасспатрива-ется как 'Зунк::и.<: от *.а?рицк платежей. Лля нее ставится несколько окстг.ьхаг.ьнк>: задач iуко*сствг таких к-атри:: и предлагается чис-ле.в'.нй метод редения.

В прпле;:енпп находится'списание пакета прикладных прсг: а:/л: "Остановка". Программы написаны на язаке '¿ортран я предназначены для серии ЕС.

Соновнг'о т-.зультать! диссертация опубликоваин в спзиугуяг га-бс.та х :

1. ¿азалоз В.5. Исследование уравнения для оптимального риска. - В кн.: Вопроси механики и пропесссв управления. Был.2.-Управление динамически:.';: системами. - Л.: ЛИ*, 1979. - с.1£У-1".5.

2. Мазало а З.В.. Сптиуалыи.» рЛк и катрииа платежей. - 3 кн.: Вопросы »леханкки и пропессоа управления. Вып.4. .'¿»тематический анализ управляемых процессов.'-JI. : ЛП>, ISbl. - c.l6C-IôS.

й. юазадов З.В. Об играх, определенных на еу:,?.:ах иезааасийнх одинаково распределенных -случайных величин.! - Б кн.: •Ве-твжциеея-процессы. - Петрозаводск: КЗ АН СССР, lîrtl. - с.ЗС-ос.

4. i-азалов 3.3., Соколов А..З. Со сптиуальнс:.: дикат.-ическом распределении нестраничной памяти. - В кн..: Авто^атизироваин-й систекк управления. Зьщ.З. - Харьков: XA1I, IScI. - с.32-33.

о. ¡.¡азалов В.З. Об оптимальном управлении игровыми случаГан.^;; последовательностями. - В ун.: Грикладнке задачи теории управления.

- Л.: JTj , Кт2. - с.175-163.

6. Завалов В.5. Игровая задача остановки случайных блуждании.

- В кн.: Вероятностное метсдн в дискрютной математике /тезисн дскд. I Бсесокпко?. кон!'. -'Петрозаводск; К4 АН СССР, КВ.;. - с.4?.

7. иззалев З.В. Кгроулле марковские моментн. - В кн.: Вероятностное задачи прикладной математики. - Петрозаводск: Г;Р„', Kg/. -О.62-69.

с. Разалев В.В. Нгрц. ка случайных блуждания::. - 3 кн.: Дроб-г.огм теоретической кибернетики /тезисы докл.,'»Б Всесоюзной конр, -Игкутск: ¡-IpfV, ISt5. - с.71-72.

5. Завалов З.В. Solution of .the gaae'e problem of optimal stop for the Bernoulli scheae. _ В кн.: ПерЕкГ. Бсепкрний конгресс общества математической статистики и теории вероятностей им. Берну л-ли. - и'.: Наука, 1966. - с.696.

Ю..'йзалоз В.В. Игровые моменты остановки. - Новосибирск: Наука, 1967. - 1Ь9 с.

II- KezaloT T.V. Races with random wind.- Mathematical Methods in Operation Research (abetracts of Int. Conference).— Sofia: Inst, of Kath. with Computer Centre, 1987.- p. 63.

ХЗ.Винкиченко С.В., ¿¡азалов В.В. йгрв на правило остановки вине; овски" дгсгессов. •- Теор-ия вероятностей и ее применение. т.ХХХШ, в.З, ier.G. - с.550-591.

'."азалсв З.В. С некоторых геометрических методах,решения

задач из правило остановки. - В кн.: Вопросы оптимального упраьле-

ния и ксдодсганик сперапий. - Иркутск: ИрП>, 19-Г.Р. - с. 120-1Г.&.

14.Викнкчеь'-о С.Б., .'„азалов В.З. Об оптимальном управлг.;;;--:; прог.ессс:.; ьосстзнс."Л«.-ия. - 3 кн.: Вероятноегние метсдн в ?;т.крзт-ь'Ой катекатике / тезисы докл.и Всесоюзной кокс-. - Петрозаводск:

HS АН СССР» 1988» - с.23-24» - .....

15. Вгнигченко C.B., ^азалов B.B. Игра на правило остапов-kz ко еле 3.0 вате ль нос кг наблз^снпй ¿дгелровашоЛ - Клбер- . нетака, ff Г, IS89. - c.IIS-121.

16. Кузлл В.5., .Мазолов В.В., Кузина i.A. Об оптиулльно"; переналадка, процесса горе работки руо:. - В кн. г Лог:яесгяе уп-равлзяпэ с использованном ЗВ.! (тезисы докл. H Есассазпого спяюзиуна. — И. : îffiî, IS88. - ç.376-377.

17. Кузина I.A., Ь-азалов В.З. "о толу об наружен ля разладки в за-дчах управлзщш- проздссоа переработка руда. — В кн.: Метода юзЗерлетша х^Ежо-технологстеских процессов (тезясы т;окл. Ш Бсесо-зяоХ конф.). - : У IT.!, ISS9. - с. 118.

18. ¡.'а залов. 3.3. Экология и проблегз оптиг-дльксл остановки. - В кн. : Натеттгчаскцэ рационального природопользования. - Новосибирск: Наука, 1980. - с.115-125.