Задачи управления на минимакс позиционного и квазипозиционного функционалов тема автореферата и диссертации по механике, 01.02.01 ВАК РФ
Красовский, Андрей Николаевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1992
ГОД ЗАЩИТЫ
|
|
01.02.01
КОД ВАК РФ
|
||
|
%7 0 4. 9 1
московский ордена лешна ордена октябрьской революции
ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В.ЛОМОНОСОВА
Механико-математический факультет
На правах рукописи
КРАСОВСКИЙ Андрей Николаевич
ЗАДАЧИ УПРАВЛЕНИЯ НА МИНИМАКС ПОЗИЦИОННОГО И КВАЗШОЗИДИОННОГО ФУНКЦИОНАЛОВ
01.02.01 - Теоретическая механика
•■"А втореферат диссертации на соискание ученой степени доктора физико-математических наук
МОСКВА - 1992
Работа выполнена в Уральском государственной ушшерсл-
е
готе ;;;.!. Л. П. Горького на ка|°дро теоретическом мах аники.
■Официальные оппоненты:
доктор физико-математических наук М.И.ЗЕЛИКИН,
доктор физико-математических наук, профессор А.А.МЕЛЙКЯН, члэн-корреснондент РАН, профессор В. В. РУМЯНЦЕВ.
Ведущая организация - С.-Петербургский государственный университет.
Защита состоится " _19Э2 г. в 'Г*
часов на заседании специализированного совета Д.053.05.01 й I по механике при МГУ им.М.В.Ломоносова по адресу: 119899, Москва, Ленинские)горы, ЛГУ, механико-математический факультет, ауд. 16-10.
С диссертацией мокно ознакомиться в читальном зале механико-математичеокого факультета МГУ.
Автореферат разослан " " ¿^/'/Ое?^^ 1ЧЪ2 г.
Ученый секретарь
кандидат физико-математических
нау!С
Д.В.ТРЕЩЕВ
') ОЛЦАЯ ХАРАКТЕРИСТИКА РАБОТ!I
Актуальцост^ тамч. Работа посвящена исследованию задач об
:шг динамической системой при дефиците информации о действующей помехе. Такие задачи возникает при решении реальных проблем об управлении по принципу обратной связи объектами, ко-торце описываются дифференциальными уравнениями и работают в ситуациях неопределенной информации о помехе или в условиях конфликта. Эти задачи формализуются в рампах теории дифференциальных игр. Становление этой теории относится к началу 60-х годов. Оно было определено развитием математической теории оптимального управления и потребностями практики. В настоящее время обсуя-даемая теория управления П'^л дефиците информации складывается в саиостоятельнуо дисциплину, имеющую прочные связи со многими разделами механики и математики.
В то же время здесь остаптся еще много не выяснонпых вопросов и .принципиального характера и в области построения эффективных процедур формирования стратегий управления и их реализации с использованием ЭВМ. Таким образом, та область науки, к которой относится диссертация, является дивой, развивающейся ветвью.
Обсуждаемая теория развивается во многих странах. Прогресс этой теории с&язанименами многих отечественных и зарубежных учены:". Соответствующая библиография весьма обширна. Здесь есть возможность назвать лишь часть исследователей, работы которых назболео тесно связаны с предлагаемой диссертацией. Обсуядаемо-му направлению посвящены исследования Р.Айзекса, А.А.АзЕмова,' А.Я.Азимова, М.И.Алексейчика, Э.Г.Альбрехта, В.Д.Батухтина, Т. Башара, Р.Беллмана, А.Бенсусаца, В.Г.Болтянского, Н.Д.Боткина, А.Врайсоиа, Р.Ф.Габассша, Р.В.Гамкрелилзе, И. В., Пгрсанова, Н.Г.
Григоринко, Л.Б.Русятшпсова, В.И.Чуковского, М.И.Заяикина, Ö.M.
о
Кирилловой, В.Б.Колмановского, А.Ф.Кононенко, Н.Н.Краоовского, [Д.Г.Крандаляа, А.В.Крлжимского, А.Б.Курганского, С.Н.Круякова, Б.Н.Лагунова, Ю.С.Ладяева, Д?..Лейтмана, Дт>.Лгяа, П.Л.Лионса, А.А.Ыелшшна, А.В.Мезенцева, Е.Ф.Мищенко, М. С.Никольского, Г. Олсдера, Ю.С.Осшюва, В.В.Остапенко, В.С.Пацко, А.Г.Паикова, II.И.Петрова, А.А.Петросяна, Г.К.Пссщрпцкого, В.С.Половинклна, Л.С.Понтрягина, Б.Н.Паенпчного, Э.Роксина, Н.Ю.Сатимова, Э.Р. Смольякова, А.И.Субботина, Н.Н.Субботиной, Е.Л.Тонкова, В.Е.Тро-тьякова, В.Н.Ушакова, Р.П.Федоренко, А.Ф.Филиппова, А.Фрпдаала, Ю.Хо, А.Г.Ченцова, Ф.Л.Черноусько, А.А.Чикрая и других авторов.
Материал диссертации развивает и дополняет результаты и метода этих исследований.
Цель работы. Цеьь работы состоит, превде воего, в выяснении принципиальных вопрооов о характере стратегий управления по принципу обратной связи, в которых целесообразно формализовать рассматриваемые задачи при условии минимакса-максимина показателей качества того или иного типа и в зависимости от характера уравнений движения. Центральным моментом является здесь вшене-ниа строения текущего информационного образа система, адекватного условиям задачи в том смысла, что в соответствующем классе стратегий существует седловая точка, складывающаяся из оптимальных минимаксной и максиминной стратегии.
Следующей и основной целью является разработка эффективного метода построения требуемых оптимальных стратегий управления по принципу обратной связи на базе вспомогательных конструкций, которые сопоставляются в процессе управления текущему значению информационного образа.
Пе^численные обстоятельства сопровождаются также целью
создать фундамент для соотЕетствутсзх учебных пособий для курсов по теории управления.
Целью работы была также апробация развиваемых исследований е раэработаннше алгоритмов в вычислительных экспериментах.
Методы исследования. Методы исследования опираются на достижения классических направлений науки: теории устойчивости двнзенпя и теории колебаний, аналитической механики, теории дифференциальных уравнений, вариационного исчисления, математической теорнл оптимальных процессов, математического и динамического программирования, теории случайных процессов. В данной работа задачи формализуются, исследуются и решаются на основе концепции для задач управления при дефиците информации предложенной и разрабатываемой.в Свердловске - пине Екатеринбурге. Разумеется, при этом используются методы исследования и результаты из теории оптимального управления, развиваемые и установленные во многих основных научных центрах, где ведутся работы в соответствующих областях.
В основе избранной концепции лелсат такяе конструкции, как экстремальный сдвиг управляемого движения на Taie называемо сопутствующие элементы этого движения - абстрактные или реализуемые на подходящей компьютерной модели в форме двккения-певодыря. Зти сопутствующие элементы формируются во многих случаях на базе вспомогательных конструкций,которые получаются из решения тех пли иных вспомогательных задач программного управления, которые сопоставляются текущим значением информационного дбраза. В данной работе главную роль играют такие вспомогательные конструкции, которые в рассматриваемых нерегулярных случаях базируются на идее программного стохастического синтеза. В регулярных случаях эти конструкции смыкаются с программным детермини-
3
реванше.! синтезом. Следует также отметить определенную связь используемых конструкций с методами, основанными на обобщенных решениях уравнений в частных производных типа уравнений Гашль-тона-Якоби, именуемых оби шо в тэории оптимального управления уравнениями Айзекса-Беллмана.
Научная новизна. Представляется, что полученные в диссертации результаты дополняют существующую теорию управления некоторыми новыми теоретически:,щ утверждениями общего порядка, сф-фоктившпли конструкциями для стратегий управления, выяснением возможностей реализации вытекающих из предлагаемых конструкций алгоритмов управления в устойчивых вычислительных схемах. Среди таких результатов отметим следующие.
1. Предложена некоторые иерархия рассматриваемых задач управления по принципу обратной связи при дефиците информации до минимаксному критерию.
2. Для ряда типичных случаев уравнений движения и оптимизируемых функционалов установлено существование седловых точек игры в соответствующих классах чистых или смешанных стратегий, отвечающих предлагаемой иерархии задач, выясняющей адекватные текущие информационные образы.
3. Для случаев линейных по фазовому вектору уравнений движения для рассматриваемых классов позиционных или квазипозиционных функционалов разработана иерархическая система процедур для эффективного построения минимизирующих или максимизирующих (в условиях шнимакса-ыаксимина) воздействий на базе предлагаемых вспомогательных конструкций. Центральным звеном этих построений является рекуррентная последовательность выпуклых сверху оболочек для некоторых функций, получающихся в названных конструкциях.
4. Излояешше в диссертации метода реализованы в комплексе программ для ЭШ, осуществимых в вычислительных схемах управлении. Эти программы опробованы в вычислительном эксперименте на модельных примерах.
5. На основе материала диссертации написан ряд учебных пособий для курсов теории управления для университетов и и/Зов.
Теоретическое и практическое значетае диссертации заключается в том, что изложенные в ней метода и установленные результаты объединяют общие теореш и конструктивные прощ_,щ)ы. Они создают теоретическую основу для разработки алгоритмов п программ для ЭВМ для реаения типичных конкретных задач управления. Эти программы могут использоваться в учебном процессе к служить пособием при разработке алгоритмов управления и реально реализуемых программ для прикладных задач управления.
Алуобвгш работы. Результаты работы были изложены в докладах па ряде конференций п семинаров.
В том числе: па 6-м и 7-м Всесоюзных съездах по теоретической и прикладной механике (Ташкент, 1989; Москва, 1991), 6-й и 7-й Всесоюзных конференциях по управлешш в механических системах (Львов, 1988; Свердловск, 1990), Всесоюзном совещании по проблемам упраалень?* (Ташкент, 1939), Международной конференции по дифференциальным уравнениям и приложениям (Русе, Болгария, 1939), Международном семинара по негладгшд и. разрывным задачам управления и оптимизации (Владивосток, 1991), 6-й Четаевской конференции по аналитической механике, устойчивости и управлению движением (Казань, 1992).
Диссертация была подробно обсундэна па семинарах кафедры теоретической механики Уральского госуниверситета. И на семинарах кафедры теоретической механики МГУ и отдела динамических си-
5
схем в Институте математики и механика УрО РАН.
о
Публикации. Результата, гошедаше в диссертацию,опубликованы в работах [i - 25J .
Структура и объем. Диссертация состоит из введения, четырех глай основного теоретического материала, приложения, которое содержит описание симулирования процессов на ЭВМ для пллю-стрирующих модельных примеров и списка литературы, содержащего 118 наименований. Диссертация содержит 30 параграфов. Обищй объем диссертации 204 страница.
СОДЕРЖАНИЕ РАБОТЫ
Во втзелени;т обосновывается актуальность тег.-и исследования; определяется цель работы; дается историко-бибдиографическая справка, приводятся1ссылки на основные работы, к которым примыкает диссертация; приводятся сведения о публикациях и апробации работы. Дается характеристика основного содержания работы. Эта характеристика в кратком изложении сводится к следующему. Рассматривается в-игровой постановке задача о шнншзации (или максимизации) гарантированного результата для функционалов от движения системы, управляющего воздействия и помехи. . При этом понятие гарантированного результата формализует такую оценку для соответствующего показателя качества, которая получается при самом неблагоприятном стечении обстоятельств для той воздействующей на систему стороны, с точки зрения интересов которой ставится задача. Рассматриваемые функционалы классифицируются на некоторые основные группы, отвечающие адекватному текущему информационному образу системы.
Рассматриваемые функционалы классифицируются на четыре основные группы. Первая - позиционные функционалы. Это такие функ-
циопали, для которых задача о минимаксе ыолет формализоваться на базе универсальных стратегий, для которых информационным образом слугит текущая позиция, которая складывается из текущего момента времени п текущего значения фазового вектора системы. Вторая, третья и четвертая группы объединяются в работе общим названием квазппозициошше функционалы.
Это название выбрано по той причине, что функционалы из второй, третьей и четвертой группы строятся при помощи таких операций как слояенио или взятие максимума для составляющих, которые являются позиционными функционалами. Однако, получающиеся составные функционалы уже не являются позиционными и для них но получается формализация задачи о минимаксе на базе позиционных стратегий, у которых информационным является текущая позиция. Именно, для таких функционалов не получается такая седловая точка как пара названных оптимальных позиционных стратегий. Поэтому для достижения седловой точки приходится расширять информационный образ.
При этом вторую группу составляют функционалы, для которых задача о минимаксе формализуется на базе стратегий, для которых информационные образом служит история двинення, слозившаяся к текущему моменту времени. Третья группа - функционалы, для которых задача формализуется на базе стратегий, для которых информационным образом является текущая позиция и вдобавок некоторая дополнительная переменная, представляющая текущее значение интегрального члена в функционале, зависящего от реализовавшихся управления и помехи. Четвертая группа - функционалы, для которых задача формализуется на базе стратегий, для которых информационным образом является история движения, сложившаяся к текущему моменту времени и вдобавок описанная выше дополнительная переменная.
Объединение в данной работе четырех упомянутых: типов функционалов объясняется также тем. что принципиальная схема построения стратегий во всех четырех случаях имеет общие черты и, что представляется особенно вареным, разрабатлваемая в диссертации схема эффективного построения стратегий во всех четырех случаях содержит однотипный элемент, который определяет главным образом цену рассматриваемой дифференциальной игры. Этим элементом является конструкция, которая складывается пз рекуррентной последовательности выпуклых сверху оболочек для некоторых функций, возникающих в схеме программного стохастического синтеза для рассматриваемой позиционной и квазипозиционной дифференциальной игры. Общие положения, рассматриваемые п обосновываемые в диссертации,сопровождаются модельными иллюстрирующими примерами. Соответствующие ситуации бы,пи симмулированы на персональной ЭВМ типа IBM AT.
Содержание I главы
Первая главд оостонт из 7 параграфов. Она носит характер стартового теоретического шага, опирающегося на принятую концепцию исследования. В этой главе вводится управляемый объект, описываемый векторным дифференциальным уравнением
ГХ. ш {(-t,Oc,U.,'U-), t (I.I)
где ос - фазовый вектор системы, и. - вектор управляющего воздействия, "О* - вектор помехи. Правая часть уравнения (I.I) удовлетворяет стандартным условиям непрерывности и условию лип-шицевости по ос . Воздействия и г U стеснены ограничениями ixe^p , Q. . где И Q. - компакты. Движе-.
¡пи рассматриваются в фиксированной ограниченной области -У-пространства (Ц Ос } } ^ 4: 6 3 , Ос е . Эта область обладает тем свойством, что любое возможное движение, начавшееся в ней, не покидает ее.
Ставится задача о минимаксе (по 14. и 1)" ) функционала
у» ^(осС-^М 91) (1.2)
от движения системы Ос ^-^Л'! = ^^ > - )
-к с С "Ь 9 ] . Обсуждается понятие позиционного функциона-
О г
ла. Такой функционал определяется следующим условием.
Функционал ^ называется позиционным , если он
представим в виде
^^^¿^ф^О^Д^^* , Ы.) г (1.3)
где оС =■ У (осС-Ьз л 4:* ^ ^ ^ ) и функция^ {•) при
каждой фиксированной истории Ос г £ 4 < -к* движения непрерывна и не убывает по сС . Пусть выполнено условие
»тилыл/х £ • £Т-М/х/и.и), (1-4)
иеФиеО , иеЦг^сф
лаковы бы ни были значения {"Ь, Ос.} £ С} и вектор"£
Векторы, обозначаемые малыми латинскими буквами, трактуем как векторы-столбцы, Индекс Т означает транспонирование.
Рассматриваемые задачи о минимаксе и максимине формализуются в рамках позиционной дифференциальной игры в классах чис-
9
тык универсальных стратегий , £.) п ЛК^,*^,
£)еО. так, что существует седловая точка ,
Ц-0(Л 3 Ос , £.) } . Здроь£>0 - параметр точности, сшсл которого 'выясняется следующими определениями.
Для исходной позиции з ос.^ } , при выбранных разбиении 9 ) .значении £ > 0 и некоторой измеримой помехе
стратегия 1Д.СО порождает движение Ос-С.*} объекта (1.1), как решение пошагового дифференциального уравнения
ОС [-1] = ^"Ч1 ,€.Т } ,
^ - и 1 + 1>1 А > ••• J * , .л. * •
Гарантированным результатом называется величина
о^-&Ж ,Ьиж> У (ос^) (1.6)
J £-0 5-0 Ле им
Стратегия Ц.°(*) - оптимальная, если
Р(и0(0; ^/х,)- ИгЬгрЫс-);^,^)-^^,^ (1.7)
и со
для любой возможной позиции е ^ • Величина^^ СО -
оптимальный гарантированный результат. Аналогично определяется величина
\ кт- WL т| У'(осС--1) ,
(ЬЗ)
£-0 5-0 Дк Ц.М
V ■ 8
.где ос^С-Т - движение, порожденное из исходной позиции г
Ос^} стратегией \МО в пара с измеримым управлением
14.14:1 е^Р, -Ь при выбранных значении параметра
точности £ >0 и разбиении Д V- - .
V V г «
Стратегия и гарантированный результат р^С"^,
Ос „ ) - оптимальные, если -й- -
уугсих =(ьэ)
Если
то
14/*»>е с,
есть пена пгтл.
Справедливо [I, I следующее утверждение. Теорема. Дифференциальная игра для объекта (1.1), (1.4) при п зиционном показателе (1.3) имеет ценуи седловую точку = , и°С-)= .ос-.й) }.
Оптимальные стратегии строятся конструктивно методом экстремального сдвига на сопутствующие точки , если удается эффективно вычислять функции цены игры
Следует сказать, что рассматриваемые в этой главе конструкции выясняют принципиальные вопросы на базе процедур, которые,
II
вообще говоря, нельзя считать эффективными.
Содержание П главы
Во второй главе рассматриваются два тгтичных класса позиционных функционалов от движения системы. Первый класс составляют функционалы, являющиеся интегралами от функции типа полунормы от текущего фазового вектора системы.
На отрезкеСЛ0,9] заданы моменты Ь^/1 , .полунормы
^^ (ос) } ¿** 1,..., 1 = -9 и полунорма-функция
^^ (4: , кусочно непрерывная по . Заданы набор
целых чисел = V е[1ПЛ и постоянные матрицы
к
размерности ( У11-1 строк) х ( И, столбцов). Полунорма ^^ 1 ("Эс ) определяется как некоторая норма.
• Аналогично^,Ос)
определяется некоторая норма-функция ^ (4:, Ос.) , ку-
сочно непрерывная по , где - кусочно постоянная
матрица-функция размерности у *^, -Ьо ¿А:*^ .
Первый рассматриваемый-показатель качества имеет вид
^+ * (). (2.1) **
Второй класс составляют функционалы, значения которых определяются как максимум от некоторой полунормы-функции от фазового вектора система на рассматриваемом отрезке времени. Такой рассматриваемый показатель качества имеет вид •
^ = ЬгаосУ т-сьог ,1) ос[Ал),
и> ******
.....<
где -Ь , € 8 1 - момент начала процесса управления,
_ наименьший из моментов ,, ^ ^ » . к * тг
Решается задача об управлениях 1л. и "Ц- , которые соответственно минимизируют и максимизируют значение У
Здесь рассматривается объект, описываемый уравнением
(2.3)
где Ос е ВЛ > Ял е фс Яг % и е0.с Е^ > матрица в вектор-функция £(4: >гд.,1>') кусочно непрерывны по * . Разрывы функции не зависят от и я
На интервалах непрерывности по -Ь функция по~
латается непрерывной по всем аргументам, Зйесь и ниие кусочно непрерывные функции имеют только разрывы первого рода и при
.о
этом полагаются непрерывными справа.
.Для перехода к развиваемому методу эффективного выделения цены (•) игры и построения оптимальных и Vе (О стратегий сначала обосновывается переход к соответствующим аппроксимирующим функционалам. [" 20 - 22 ]
/Ч^^Л), (2.4)
(2.5)
параметры которых связаны должным образом с параметрами исходных функционалов и Ущ . Эта связь получается при естественной дискретизации по выражений для и ^^ Далее вводится вспомогательная стохастическая модель, характеризуемая случайным фазовым вектором ..эволюция которого описывается стохастическим дифференциальным уравнением
•и>-=»А(±Уи>- + , ±о ¿Л ¿г $ ^ (2.6)
где го-е Я , И.е'Р ие . Пусть (тг Ялг]
> > ^ » «г ■*
- исходная позиция дЛл модели (2.6). Назначим еще разбиение •
такое, что и вс& моменты "Ь войдут в это разбиение.
Пусть - наименьший из. моментов "Ь ЛГ^ .. Модель
(2.6) опирается на вероятностное пространство {.С? , , Р } >
элементарные, события которого и> = -1 > V» } • Здесь
1 ' ''" ' к
^ } - равномерно распределенные слу-
чайные величины, связанные с моментами тг^ разбиения (2.7), ^ ] - единичный куб в 1с -мерном пространстве, Вз -
борелевская с5 -алгебра для этого куба, Р=Р(Ь) -лебегова мера, В ^ ЗЪ .
Рассмотрим случай показателя $({.) * Введем стохасти-
ческие неупреядакцзэ программы
Oteo ■={ гш-ь бф, j cosQ jf (2.8)
e Q. , t.é-té^jtóeQ}
(2.9)
fl стохастический программный максимин: /Г
4 « ' " *»
rn^mkMÍE , ^.10)
VX.-1 "U.t-3 i-"^-
гд9
M.^"" } -математическое ожидание, tií't't ^соЦ-
*го-с-Ь,а>1 при -te-t^^ í = % ,... r-Af • здэсь • 'Uí't't col t UíeQ - случайное движение "ur-uo-
. > ' -й- 9
дели (2.6), порожденное из исходной позиции {t: Од> } прог-
ТТ } 7Í
раммамв г»- С-3 (2.8) и VC-1 (2.9).
Переходом к двойственной векторной случайной величине £ (•) дело сводится х вычислении величины стохастического
программного экст|?о:луш в, СО .
Т\Л '
Введем V -мерные векторные случайные величина £(1)C<¿>) , определенные на , где
V е ti, П.1 опр9деляется:.размерноотьв матрицы cU . Объе-
;cil г >
диненио вссх случайных величин I^ С.-) составляет многомерную случайную величину С*) . Положим
II(•)!*= тл/х тлситолс (£(1)е(ло)) ; (2.Ш
тшх «д— (I л. со ^
где ( - норма, сопряженная о^ 1 • Обозначим
- фундаментальную матрицу для дифференциального уравнения - условное математическое ожидание.
Справедливы равенства
(2Л2)
^ (2.13)
(у (1)'
где ^и) - цена игры для исходного функционала . ,
- стохастический максимин (2.10), Дд. -разбиение с. (тг. -тг ~
Г 1
(2.7) при и-ихос ('V -тт) 4 6 - Величина е СО - опре-
IV -4.1 ; (1)
делена равенством
V . 1 . 1 V", 1
11*6
= т.схос
Г 14т
+ Ж Ц С*. --V ) толста 2 I {7Дсо)
1И 3 1 Уе 0.
о О * I
где d ф - min. (t) при условии -t М ^ -tt.
В случае функционала повторяются все предыдущие
конструкции со следующими изменениями:
= hxcxoc muv
VTUX/X. juw (Dl \лП1°^со"1)},(2Л5) vс-з гсС-з ^¡si^^
Il£( , (2.16)
e (tr A W
сСг> * » * >
[£ м{ С<«> 1 *
Hl
w
• З^Хс*1", -Л I I ^ ,...,11 \ ] <2-17)
Описанше конструкции являются конкретизацией для "рассматриваемых задач общей идеи,.метода программного стохастического синтеза.
Следующая далее конструкция для вычисления величин
и е (■) составляет одну из основных разработок в предлагае-(2)
мой работе.
Опишем кратко эту-конструкцию сначала для функционала Обозначая
г^-Хю/^'Ш; , У^о-Хсэ/*)^-), (2.18)
»пА-ХТ(А1>)М(3)ЙТЛи.)1 , Ч2Л9)
} , (2.20)
> I ^ 1
получаем
= Ьха/х[т*Т;и>- + т. д) | , (2.21) .. и * (1) * > *3 -1 '
т.*
•к
.("С кпа Д)■= ЫХХ/Х [М{£ ^Г^
" " г1 1
где
/эе( (1)
* си>
у/ ^
хт1п (Ц .' (2.22)
гсеЗ1 Ч-^Ф * 1
/Г
Здесь т. » - составляющая Их* .
* л.« к.
Основной результат - следующая процедура [jl.2I.24] построения 'Эе^(-) и обоснование этой процедуры. Процедура сводится к
построению по индукции по \ выпуклых сверху оболочек У.(Их)
« 3
для некоторых функций V. (т.) от подходящих условных математических ожиданий Уп. . Полагаем
W"0-0 ' .A'V"0-^ ''W^'" ■
= (Ч -"Ч") vnaocmLtn. WTf C^.TX.V)] Y (m.) .
ы к n m к k
ueQ. ue'JJ
£74^1т с M
Если полагать m. ~ ¿J t (w) , то по формуле yV
полного математического окидания по условным математическим ояя-даниям получается, что для каждого условного математического онидания = М {ltM1 (и>) I^ ,..., } надлежит
максимизировать величину М,{ С1^^),..., ^^ t } • Эта максимальная величина определяется как значение выпуклой сверху оболочки ^(Г"-) функции"^ (•) в точке ha-i) для области. JU^3* {I) £ 1 • Поэтому полагаем
sl'V^ СО при т. 6 , где символ Y обозначает вы-
пуклую сверху оболочку функции Y в соответствующей области. Здесь область С^ = { m.: JU1'*'1 * (£ 1} .
Пусть 9*- (fn.) и б-. уяе построены. При этом . 3 + i
T-+l>Q . t. < 4:1г+и . Рассмотрим-сначала случай t > J 3+1
> 4:. Тогда полагаем u-. = G-.
aY. -Г. m.) v. (m.) - ДУ. (пт.) ь
3 3' а+1» ' 3 3
+ У. (m) , (m-bY. 0) l + i 3 3
при те б;
J ,
Рассмотри.! случай -Т: = -Ъ . Тогда
■у. мхгх. [ду (их*) +
при «Г«.*» 1ТХ.-, =
£ 1 • Ойлаоть С- есть совокуп-
ность всех векторов т.* такого вида. Тогда 9". (1тх)="У! СО
н 3 3
при т..е - . Обоснование этого шага ивдукции аналогично
случаю - Ь , опирается на максимизацию соответствующего
условного математического ожидания от функции V- (•) . Данное
3
построение продолжается до момента ^^ • При этом воз-
можны два случая. В первом случае: < -^'Р . Тогда получаем область = С}^' и функцию ^С^) ПР0 ^ 6 С^^ « которая определяет величину"За (-)(2.22) так, что 1
КХ. А)*: у т. £ (2.23)
и) * > * ' 1 * 3 *
1
Во втором случае: Тг = х . Тогда получаем область а функцию такую, что
* г^
В первом случае в (2.21) имеем 1и « иг е ч .Во втором случае: Иг*= ИИг. , где Ьл.^ е Сг^44' }
■ В случае функционала ^^ конструкция, базирующаяся на последовательности выпуклых сверху оболочек У» функции V получается такой.
Величина е^ (•) представима в виде
кп* . V
^(а)^*,^*;^ • (2-25)
Процедура построения величины ^^С*) из (2.25), которая свертывает зту величину при помощи последовательности выпуклых сверху функций 9Ч1) претерпевает изменения, связанные с тем, что ограничения на £1^ <са>) , которые в случав ^^
имели вид ( 6 1 , в случае заменяются
ограничением
В связи с этим взодптся параметр УеСО.П , который
оСл!
определяет допустимую сумму норм для для оставшегося от-
резка времени Г/с. "с, 1 . Поэтому .функции V У
| 3 * к+1 ■ '
строятся здесь как функция от двух аргументов гп , V . Опишем кратко эту процедуру [17, 22] .
Сохраняем обозначения векторов и интегралов, введеыых для процедуры в случае . Полагаем
Ук (пг.у)» (иг , У^ =
при
Пусть и б v уже построены для УбС0,П
и 1т\. е £} , где
При ВТОМ + . рассмотрим
сначала случай 'Х > -к^1"-1 • Тогда полагаем =»(т.
(т..V)- . /г., V,- (т.,^ I 3 Л "
_ (2.28)
- ДУ. + ^ +
при По. € С?.
Рассмотрим случай = -Ь . Тогда
"У.Сиг* V)- ИоГа/х. (гп^у^] . (2.29)
1 1 • 1+1
при ,
»п-Х'с^.в)^1^ , ^Ь* (£) * V- V, .
Область б. - совокупность всех векторов т.* тако-3»^
ГО вида. Тогда У-(т. = (• . V) при 1г\.е С- ,, . По-3 ' 3 1,у
лучаем по индукции по д от ^ = до ^ - 1 :
в случав -с -
г, н«) (2.30)
3 случае -Чт -
' * *
гл9
В первом случае в выражении для С-) , составленном по аналогии с выражением для е, с-) имеем т, е
(1) ' * V
Во втором случае Ьг = Ио..^ + ^ ,
Сделаем еще следующее замечание. В случае, если в рассматриваемых процедурах все функции л7" получаются выпуклыми сверху, то имеет место регулярный случай. Тогда случайные вектор функции £(•) заменяются детерминированными. Приходим к прог-раглглному детерминированному синтезу.
Ваяно отметить, что в обоих случаях дело сводится к функциям, аргумент которых »-ух имеет размерность фазового вектора походной управляемой системы. Кроме того, следует подчеркнуть, что от многих других известных попятных конструкций для построения цены дифференциальной игры предлагаемая конструкция осуществляется не в фазовом пространстве {."Ш-} системы, но в пространстве двойственных переменных {I } , а точнее - условных математических ояидаштй т. переменных I , которые играют здесь роль модернизированных множителей Лагранжа или модернизированного вектора V из принципа максимума Понтрягина.
Важно также отметить, что предлагаемая конструкция, которая базируется на рекуррентной последовательности функций.
940 позволяет проверить нужные для величин 0) свойства тх -стабильности и и--стабильности-непосредственно по
свойствам функций 94*) . Такие прямые доказательства приведены в диссертации. При этсл величины е.^ СО в програм-шшй стохастический ыаксшлин (•) сохраняют за собой ту важную роль, что „они определяют, как должна строиться рекуррентная последовательность '9ЧО в зависимости от характера функционала У . .
Процедура построения оптимальных стратегий, базирующаяся на экстремальном сдвиге, описанная в I главе, конкретизируется здесь следующим образом [21]
Б случае функционала (2.1):
Оптимальная стратегия тд.°(.*) строится сладуициы образом.
Вводим функцию
ы.*
+ > ^ , (1+ IX(2.32)
где
А= Угсолс \А(Л)\ 1А(Л)\ = п-ихос. .
1 При этом в (2.32) максимум берется по векторам из
области определенной выше при описании процедуры с
функциями У СО . Решая
задачу на максимум (2.32), определяем вэктор т.*"°= Ьх*° (4: , Ос , е) .' Тогда оптимальный вектор х».0 = С "Ь г Сс ) определяется равенством
'и-еО.
= тхп. *гихоЛ т*ОТ г^и)] . (2.зз)
•иеФ -и-е 0.
Оптимальная стратегия V °(-) строится аналогично при за-•мене в (2.32) знака минус на плюс и определяется условием
»ьпсизстхп. [т.^Хсд^С-^-и./и)] ,
(2.34)
где Их - соответствувдий максимизирующий вектор. V* ,
В случае функционала (2.2) построения претерпевают
пекоторые понятные изменения.
В конце главы П выясняется, что функционал, ~ ^(О +
4 ¡¡^^ нэ является позиционным (где Уц^ и Уц^ суть
функционалы (2.1) и (2.2)).
Содержание И главы
В третьей главе рассматривается задача о минимаксе функционалов [ 23 ]
8
ЧМ "(1)
(3.1)
Я
^сы + I , (3.2)
Ч
Я
И1б) « У(3)+ 5 сЦ-^илАл г- (3.3)
"(б) "(3)
УУ^Х/ТС £ (4: С^з) ,
^ У1 (^осф),
^......<
где и суть Функционалы (2.x) и (2.2), ' в * » С ^о > ^ ~ момент начала процесса управления, -Ь^*1 -наименьший из моментов ^ 1 4:® ;
■К' *
фун.дия <5(-Ъ V-) полагается кусочно-непрерывной по ^ , а на интервалах непрерывности по -Ь - непрерывной по ц. и "У".
Будем полагать, что выполняется условие седловой точки для маленькой игры
УПХ.П. пха/х\ДТ /а) + =
гд-еФ иеО.
= тлостхп. [^{Я.гс.'О-) + 9 (з.б)
иеф 1
где í - любой п. верный вектор, С|_ - любой скалйр.
Функционал ' У(<)) представляется в виде сутулы из позиционного интегрального функционала, зависящего от движения системы и из слагаемого, которое является интегралом от реализовавшегося управления и реализовавшейся помехи на заданном отрезке времени, й в этом случае оказывается, что рассматриваемая дифференциальная игра имеет седловую точку, которая складывается из чистых позиционных стратегий, имевдих информационным образом текущую позицию системы.
Справедливо следующее утверждение [5^ [23] Дифференциальная игра для объекта (2.3) при условии (3.6) для -показателя качества (3-1) имеет седловуи точку
^"СЛ } » складывающуюся из пары чистых' оптимальных позиционных стратегий -иЛо-'и.'Ч-Цос, О и
Основным содержанием этой главы является развитие метода для эффективной оценки цены игры и построения оптимальных управляющих воздействий или оптимальной помехи на основе соответствующей рекуррентной последовательности выпуклых сверху оболочек для функций из вспомогательной программной стохастической конструкции. Алгоритмы для соответствующих построений снова иллюстрируются на модельных примерах, симмулирувдих соответствуйте ситуации на ЭВМ.
Функционалы У(5) и ^(6) У*9 110 яв^ются позиционными. Для них игра формализуется в классе стратегий, для которых информационным образом служит история 'ОсС-1 1 =
(от
01ССЗ 4 л; ^ } движения , сложившаяся к текуще-
> ТГ .
му моменту времени Ь . Именно, справедливо следующее утверяде-НИ9. [ТЗ],|>].
Дифференциальная игра на минимако функционалов У^(3.2) и (3.3) для системы, описываемой уравнением (2.3) при
условии (3.6) имеет сетловую точку {тд.^-)., } в клас-
се стратегий г1.(ос.1А® £-3^1, <5.) и иСосГ^^-Н! , о.
Конструкция оптимальных стратегий ц.°СО и пре-
терпевает здесь .то изменение [13 3 , что сопутствующая точка заменяется на сопутствующую историю.
Для уравнения движения (2.3) в случае функционала величина экстремума й СО определяется равенством
е(5> ¿O*
'(5)
, А"1
= n-uxoc.
+ Vrv*T + í • С +
[Ь1 +
f * ^
my"
ueQ. глеФ 3
•J С^гс/у) .U.V)]]] . . (3.7)
3 i
При эхоы векторная величина СО слагается из
детерминированных векторных компонент г "р = »
относящихся к истории lA^tV^j L-ltrl и из совокупности векторных случайных величин С^О , относящихся к прогнози-
15 I
руемому двиаению оо] -с ^ t . Норма:
I
f-9* weü ^
Подобным же образом с понятными изменениями трансформируется и величина е^СО для функционала (3.3).
В процедуру построения ^^jCO, {.=-5^6 . которая
базируется на последовательности функций внсскгся[20]
соответствующие изменения. Такие соответствующие изменения впо- -слтся и в соответствующую конкретизацию построения стратегий
СО,
■ В случае показателя качества ^(у) (3.4) задача решается в классе чистых стратегий
0., ей"*1, е> о }, (з.э)
которые являются функциями от пополненной позиции
(3.10)
Ос -объекта (2.3), где
-Ь
Ос. ] бС^-иС-е! иС-с:Л сН . (З.И)
Гарантированные результаты для стратегий %|_СО (3.9), \КО (3.9 ), оптимальные стратегии и.0<О , Л>°СО и оптимальные гарантированные результаты определяются при замене
ос) на{.-Ь,5с} в (1.5)- (1.10). [2з] Дифференциальная игра для объекта (2.3) при условии (3.6) для показателя качества (3.4) имеет седловута точку
{"и°(0 , '0-оС') } , складыващуюся из оптимальных стратегий
•иЛО'-и/Ч-^-ЗЕ. , и 'Ц-0С-') = С.").
1Э
Доказательство этого утверждения основывается на том факте, что функционал э
(ЗЛ2)
от пополненного движения Ос С-191 -эс -объекта является
к
позиционным [*1 ] функционалом.
В случае показателя качества в(в)(3.5) задача решается в классе чистых стратегий
гиО^С^^Ы^.^^Ое^, £>0 }, (3.13)
которые являются функционалами от истории ос.с4° £*1 и ска-лярвой величины (3.11).
(23^ Дифференциальная игра для объекта (2.3) при условии (3.6) для показателя качества ^^(3.5) имеет седловую точку
1д,°С') и°С-) } » складывающуюся из оптимальных стратегий ! * ' иЧо-г^ОЬ,'*^" ^^^ с), =
-и^-Ь.огС^мЪ.Зь^ ,0.
Если в случае показателя ^^ , как и в случае показа-геля , в информационный образ включить историю осС^М^, то, пользуясь принципом оптимизации гарантированного результата, от полной информации о дополнительной координате ^ .
г\. т х
можно избавиться в случаях обоих показателей У^ и •
Именно, при формировании стратегии вместо 1-11
можно включить дополнительно информации об истории *и.с4:° с-тЬ)
только своего управления и использовать в качестве текутпх значений 5с такиа, которые получились бы, если бы работала реализация ЯН* Сч*) , совмести:-ая с {ос М^:"] *) } я максимизирующая текущее значошто
' 6с ь + С*1 • При формировании стратегия Я>(0 можно
вместо бЕ добавлять к истории Ос. ц° А: 1 пнФор-
нации только об истории *) и использовать в ка-
честве значений 6с ^^С*! такие, которые получились бы, воля бы работата реализация * ) , совместимая с
, М^) } п минимизирующая теку-
щее значение 6Е. г^т .
Приведем в этом реферате для примера выражение для стохастического экстремума СО для функционала гдэ ^ и У^у суть позиционные функционалы (2.1) и (2.2) и отметим кратко особенности построения в этом случае рекуррентной последовательности функций ^Р(-).
[И' «'-О*
и(3)( 011*^1 .Г-^ме)
«у
г ^ У^ич
ЖЕ К -'С.уугралст.^ [(I: +
V 31 3 льеО. Зи>
ПО 3
где величины, входящие в это выражение, определяются подобно • как и выше в случае функционалов Уц^ (2.1) и У^) (2.2). При этом индексы (I) и (2) показывают, к какому из слагаемых функционалов, входящих в У^ , относятся соответствующие величины. В (3.13) есть векторная случайная случайная величина, которая оклздывается из - 1) и -Л^-- 1) ~ векторных случайных компонент :
и 1 с») - % и, , ^ (1) - 3 *(1) -постоянных компонент
И «Ж
^ ( КГ(С)> (зл6)
Яг»г
Процедура вычислопия величины 0{3)СО , па басз ;:зрх-алх липуклня оболочок СО повторю?, сообща гсворл, опя-содено еищэ процедура для функционалов у^ и ^^ с учетом тех обстоятельств, что при пэрэходо чербз моменты
меняются векторы (ти. , значения V и области С • ,, , как ь • 3 3 Ил
случае показателя • а пРи переходе через моменты
меняются векторы Иг. • и области С • , как в случае показаВ случае, когда в исходной задаче в функционале фигурирует аддитивный член, являющийся интегралом от реализации управления или помехи, в выражение для величины 6^0) появляется под знаком операции т_о/й тхп. дополнительное слагае-
иий лл-еФ
мое <з(т. ^-ц.)и) . В случае, когда этот член входит неаддитивно • и в информационном образе появляется дополнительная переменная, обсуждаемая конструкция из Функций УСО претерпевает несколько более существенные изменения, в том числе, лревде всего, размерность вектора Уп. увеличивается на единицу. >
В четвертой главе рассматриваемая процедура эффективного построения цены игры и оптимальных стратегий переносятся на случай, когда задача на м::нимакс функционала формализуется в классе смешанных стратегий. При этом устанавливается, что для тех же типов позиционных и квазипозиционных функционалов как правило игра формализуется должным образом на базе смешанных стратегий от таких же информационных образов, как и в случае чистых стратегий, рассматриваемых во второй и третьей главах, но там -в предположении о выполнении условия седловой точки для маленькой игры, которое здесь не выполняется.
Когда условие (1.4) иди соответственно условие (3.6) ко выполнено, то задача в случае ¡»позиционного показателя качества У решается в классе смотанных [12] позиционных стратегий
У^.с^Чо} , (4.1)
<? 4 О 9 в "
[У(0, ^СО; ^(О^СО; УЪ.^о] , (4.2)
где
? V1}'
При этом схема управления такова, что наряду с -х-объектом (1.1) рассматриваются -модель-поводноь. включенная в орган управления й^н £ -модель-поводырь. включенная в орган ¡управления . Базой для построения двааений ос.С-1 объекта (1.1) и модели-поводыря является некоторое ве-
роятностное пространство {Се^ , , Р* } > которое строится на основе функций -р СО, СО в свойств случайной помехи ^
-УС-1 = {ямЛ, е 0., -I:< -9, }.< 4.4)
Для исходной позиции .при выбранных
значении £.>0 .разбиении } = {А
1 I * > V ал*. >
А:; - Э } ь некоторой помехе -ц-Ю (4.4) стратегия
34
(4.1)-порождает двизешп Ос.С-1 и С-1 как решения чюиаго-вых лЕффэроицпальншс уравнений
(4.5)
'Cj/b* 1
В (4.5) со^т есть реализация случайной величи-
ны "U-C-tj^'i , удсвлетворящей условию
Р ( ULt i ^, w^l = Um \ ос с\. > coi, ijri^coi) =
гдо Р(* • • 1 • • ■) - условная вероятность, ,и.1Л1 е IXСf). Предполагается, что помеха стохастически независима от управления на квядом шаге, т.е.
-PÍVL^w^leC loil^.col.y^.wv). (4'8)
Гарантированным результатом называется величина
f( Su; Ч =
= &т&Ж&>п Л^илэ ¿cm ^KjJa ^р (tninoC) (4'9)
v-o д5 vc./v
гдо значения сС удовлетворяют условию
Р ( ^(ссЮ) ¿ос) ^ ,
Стратегия - оптгмольнея. если '
о
для любой позиции {Л^ } . Величина - оптималь-
ный гарантированный результат. Аналогично определяется величина
^ ^ ос.^') и оптимальные и^э^СО •
/ (£; \ ^х,<0- . (4'П)
Функционалы Уц^ (2.1) и У^ц (2.2) как отмечено выше являются позиционными [I, 2] . Поэтому, подобно тому как для класса чистых отратегий ХсС-) , 1КО при выполнении условия (1,4), здесь при невыполнении этого условия справедливо утверждение [12] о существовании седловой точки и цены игры для функционалов и уке
в классах смешанных стратегий (4.1) и (4.2).
Оптимальные сметанные стратегии ^ и в той
части, которая определяет движения -^-модели-поводыря и 2 --модели-поводыря строятся аналогично тому, как строятся чистые стратегии *и0(О и ■о-'Чо дая 'X-объекта при условии (1.4), но здесь при понятной замене управлений и в и на управления -р и О . При этом управления лэ*° » 0 и о*° п | г Г^г. '
обеспе-
Ч. 1 *»
чшзавт колаемло по существу задач свойства даияениЗ мод^-.сЯ поводырей ц а , соответственно. Оставшиеся управляющие
наборы { ¡^ } , { я;;^ ) { ^ } , } для стра-
тегиЗ и выбираются исходя'из соответствующих
условий, обеспечивающих необходимую близость движений "х-объ-окта и и %-моделей. Эти условия сфчрмулированы в работе [II с Л 88] и в книге [12 § 7].
В случае функционалов ¿2Ц)- ^ , У(3) при не-
выполнении условия (1.4) или соответственно условия (3.6) остаются справедливы утверждения о седдовых точках соответствующих дифференциальных игр, но уно в смешанных стратегиях СО ,
} при тех ке самых информационных образах, как и в случав выполнения условий (1.4) и (3.6), пополненных соответствующими информационными образами для или 5 -модели. Однако, в случае функционалов - (ЗЛ)-(З.З) уже не всегда удается избегать введения в информационный образ также дополнительной (п. + 1) -й координаты ос^ (З.П), которая характеризует историю управлений и помехи, работавших до данного момента времени - и даао, в отличие от случая чистых стратегий, когда этот интегральный член от управляющих воздействий является аддитивной добавкой.'
Наконец, в случае смешанных стратегий' и сох-
раняются основные соотношения с функциями УС-) , которые работают в рекуррентной схеме. Эти соотношения здесь опускаем [24]. Разница заключается в том, что теперь роль управлений "и. и
!)■ для объекта исполняют вероятности и с^ .
. .., I. & , /Ъ = ± , . .., Н ^ I отвечающие множествам векторов •ц^'ч и , достаточно плотно рассеянных в компак-
ТОХ Ф II 0.
В последнем разделе диссертации в Приложении приведены модельные примеры. Рассматриваются отдельно два случая- чистых в смешанных стратегий. Приводятся результаты численных экспе- • римеитов, проведенных на 1ВМ РС/АТ. Приведем здесь некоторые из
этих примеров.
Для объекта:
.V
при показателе
который является частным случаем показателя = + (2.1), (2.2). Здесь при некоторых исходных данных получили
,'Х^) = 6.380 и при'и°СО ,"\>°СО на реализовавшемся двикении получили значение У = 6.643«
(двикение - на фиг.1). В случае смешанных стратегий ^^ и рассматривается, например, задача[ 143 для объекта, описываемого уравнением Мещерского
•»
%
-— *. + —Ъ + р у. ■ у
* *
У
+ — у *
(5.1)
гдэ * = 'Ч
> ч.
'•а.
|4= ■?<: (и1 ссиь -у-* - V*4)
|г =|< • (и1".чагу'1 соб -и-*')
=9-
гл.: гС
и
"Г "о СЧ 0
0 1 „ - 0 , и. = -1
Уравнение (5.1) сппснпаот дсззокзе топки поремевдоД кяи-
сп
которая дблгг.зтся в горизонтальной плоскости КО "с.
а Еодвартэпа зоздействзям: сплн треяпя, возггуцатал центральпоЛ
с, сила неконтролируемой псмехл (вотоа) , и некоторой
# » ^
силы Г- г1 ■ М , которая пропорциональна по модула вектору
„
¡Ц и.
, по составляет с ним угол V- " (это и ' можно, та-
кс.! образом, трактовать как следствие люфта в управляющем устройстве, а вектор р.' определяет относительную скорость отбрасывания реактивной массы).
Показатель качества задал в виде
у - (ъ^СЭЗ,
(5.2)
то есть оценивается расстояние в момент 8 окончания процесса управления от начала координат [^ = 0 ' =г 0 } .
При выбранных исходных данных получили = 1.065.
На фиг.2 - движение при г ( У= 1.161--=^° ). На фиг.З
- движение при J ^^ ( У = 0.466 ). На фиг.4 -движение при , ( У = 1.614 > _р° ) • При этом,
неоптимальные управление "и. и помеха Ъ1-^ } формировались так, чтобы нацбливать вектор ускорения управляемой точки на начало (или в сторону, противоположную началу) координат.
Оиг.1
к,
Фиг.З
А
С
■¿чО
О
Фиг. 2
4 е«.
с
Д ЙИГ. 4
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
?аким образом, основными результатами диссертации, которые на взгляд автора дополняют известную теорию управления по принципу обратной связи при дефиците информации в игровой постановке, являются следующие результаты.
1. Выделен класс позиционных функционалов, зависящих от движения динамической системы, для которых задача о ыинимаксе формализуется в классе чистых универсальных позиционных стра- . тегий.
2. Доя двух типичных представителей этих функционалов разработана, обоснована и проверена в вычислительном эксперименте на модельных примерах процедура построения оптимальных позиционных стратегий. Подчеркнем, что эти функционалы являются либо ин-
тегралаия от функций от двговния свстемч, либо макск'лувди от йушсцй от этого движения и поэтому построение оптимальных стратегий представляот здесь $олэе сложную задачу, чем у например, для случат дифференциальных ятр с термйнатьиой платой.
3. Предложена покохорая классификация функционалов, скла-длвпггдзхся из поепцзошшх функционалов п таззе.шшх кзазипозлгл-omgptg. Эт;т хзпзапозгги'ошше функционалы рг.з<5?т>а»гся па трч группы, для ;сг~доЛ из когорте устанавливается ^декзатный лн^ор-г:-зг.го!тпий сбрап, поззадякгяЗ формализовать игру на базе соот-Евтстаугяях чястых уппвэрсалышх стратегий. Обосновывается ярки-цзпппльиая ногмоаность ттродяегенноЗ йормадизсцш!.
4. Дгд тяшпянх представителей квазшюзпцяонннх функционалов для каздой из названных групп разработана соответствующая обоснованная эффективная процедура построения оптимальных стратегий, проверенная в вычислительном эксперименте на модельных примерах.
5. Предложена и обоснована формализация задачи об управлении при дефиците информации на базе' смешанных позиционных и квазипозиционных стратегий в тех случаях, когда не получается седловой точки в классах чистых позиционных или квазипозиционных стратегий.
6. Для таких яе четырех групп функционалов, как и в случае чистых стратегий, формализуются правила эффективного построения оптимальных позиционных или квазипозиционных смешанных стратегий. Эти правила объединяют развитие в предыдущих разделах эффективные процедуры построения управляющих воздействий,. которые прилагаются здесь к движениям вспомогательных систем-поводырей, со стохастическими механизмами экстремального сдвига
дьзшшя управляемого объекта на эти дадеаэпия-поводыри.- Эти процедуры проверяются в вычислительных экспериментах на модельных пршарах.
ПУБЛИКАЦИИ ОСНОВНЫХ РЕЗУЛЬТАТОВ ПО TEiVS ДЮСЕРТАЩИ
1. КрасозсккП А.Н. О позиционном минимаксном управлении // Прим. катем, и мз::. ISB0. Т.44, J3 4. С.602-610.
2. Красобокнй А.Н. Дифференциальна! игра для позиционного функционала // Докл. АН СССР. I960. Т.253, J.1 6. C.I303-I307.
3. Красовский А.Н. О формализации позиционной ди|фэр&нци-альной ИГР" // догл. АН СССР. 1981. Т.257, Г> 4. С.812-817.
4. Красовский А.Н. Об условиях регулярности программного . им;семшп в задаче упраалои&т с поэкцвошши функционалом // Дея. V ВИНИТИ 23.11.82. Деп. JS 5601-62. 35 с.
5. Красовский А.Н. Нелинейная дифференциальная игра с интегральной платой // ДифЗ&еронц. уравнения. 1982. Т.18, J; 8. С. I306-I3II.
6. Красовский А.Н. Программный синтез в позиционной дифференциальной игре // Деп. э ВИНИТИ 04.05.83 Д£П. К 2398-83. 79 с.
I7, Красовский А.Н. Об условиях регулярности программного максимина // Изв. АН СССР. Техн.киберн. 1983, 4. С.70-77.
8. Красовский А.Н., Трогьяков В.Е. Стохастический программный синтез дифференциальной игры с интегральной платой // Прикл.матем, и мех. 1984, Т.48. й 5. С.883-889.
9. Красовский А.Н. Некоторые задачи игрового управления. Прсцринт. Учеб.пособие. Свердловск, УрГУ, 1984. 100 с.
10. Красовокий А.Н., Третьяков В.Е. Стохастический синтез оптимального гарантирующего управления // Тез.докл. 6-й Всесоюз. съезд по теоретической и прикладной механике. Ташкент. 1986.
С.237.
11. Красовский Л.П. Построение с-декапных стратегий ;;а ос-цозе стохастических программ // Прикл. :гатзм. - г-эх. IS87.'
Т.51, Л 2. С.185-192.
12. Красозскл" А.Н. Синтез смешанных стратегий управлещи.. Свердловск: Изд-во Уральск,госуштверситета, ISB8. 152 с.
13. Красовский А.Н. Управление в классе сгдапанкых стратегий // Деп. з ВПЗГГИ 12.04.89 ДЕЛ. J3 2370-3-89. 47 с.
14. Красовскпй А.Н., Рзгпэтова Т.Н. Управление при дефиците информации. Учеб.пособие. Сзердяовск: Изд-во Уральск.госуяи-версптета, 1990. 104 с.•
15. Красовский А.Н. Синтез смешанных стратегий на основе рандомизированных програ'.&шых конструкций // Тез.докл. 7-я Всесоюз.конф. "Управление в механических системах". Свердловск, 1990. С.62-63.
16. Красовскпй А.Н. Диффэренцяальпая игра для интегрального функционала // Тез.докл. II Мециународн.семик, по диф$. уравнениям (Пловдив, Болгария). I99I.C.I6I.
17. Красовский А.Н. дифференциальная игра на минимакс позиционного функционала. Препринт. Научи.докл. Свердловск: ИШ УрО АН СССР. 1991. 28 с.
18. Красовский А.Н. Построение оптимальных универсальных смешанных стратегий управления // Тез.докл. Менден.сомин. "Негладкие и разрывные задачи управления и оптимизации" (Владивосток, СССР). 1991. С.62-63.
19. Красовский А.Н. Управление в классе смешанных стратегий при дефиците информации // Тез.докл. 7-й Всесогоз.съезд по теоретической и прикладкой механике. М. 1991. С.208.
20. Красовск5Л Л.П. Задача об управлении на ииниаакс по-аиционного функционала, включающего фазовые координаты в воздействия. .Препринт. Научн.докл. Свердловск: Ш23 УрО АН СССР. 1991. 35 с. г>
21. Красовский А.Н. Управление на ьшшмаЯс интегрального функционала // Докл. АН СССР. 1991. Т.320, й 4. С.785-783.
22. Красовский А.Н. Эффективное построение цены дифференциальной игры и оптимальных стратегий для позиционного функционала // Деп. в ВИНИТИ. 09.01.92. 17 с.
23. Красовский А.Н. Дифференциальная игра для позиционного функционала от фазовых координат и управляодих воздействий // Докл. АН СССР. 1992. Т.322, Й 5.
24. Красовский А.Н. Управление в смешанных стратегиях на минвмакс интегрального функционала // Прикл.ыатем. и мех. 1992. Т.56, И 2. С.192-204.
25. Красовский А.Н. Задача об управлении на минимакс позиционного функционала // Тез.докл. 6-я Чатаевская конференция но аналитической механике, устойчивости и управлении движением. Казань. 19Э2.
I
-Б совместных публикациях |~8, 10 ] автору принадлекит развитие программного стохастического синтеза для типичного,,позиционного функционала, ,иыэщего характер нормы отклонения движения с г заданного эталонного движения, вместе с обоснованием этого метода для функциональных игровых задач' управления в нерегулярных случаях. Б работе 14 автору принадлекит постановка задачи, математическая модель и основная идея алгоритма для формирования оптимальных управляющих воздействий. Доскональное программирование этого алгоритма выполнено соавтором. Следует отметить,
V
но соавтор эго.1 работы [14] Т. Н. Роготовз О;саг;<оллп бош/э помозь *шгооу диссертация прл программировании 31 сямнулчцяп процессов управления я в других поделышх примерах.
Подписано к печати 20.03.92 г. Формат 60x84 1/16 Объем 2,0 печ.л. Тираж 120 экз. Заказ &&0 Бесплатно
Типолаборатория УрГУ. Екатеринбургпр.Ленина, 51.