Некоторые вопросы структуры решения игровых задач управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Авербух, Юрий Владимирович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2007
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи
АВЕРБУХ Юрий Владимирович
НЕКОТОРЫЕ ВОПРОСЫ СТРУКТУРЫ РЕШЕНИЯ ИГРОВЫХ ЗАДАЧ УПРАВЛЕНИЯ
01 01 02 — дифференциальные уравнения
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
ООЗ158745
Екатеринбург — 2007
003158745
Работа выполнена в отделе управляемых систем Института математики и механики Уральского отделения РАН
Научный руководитель член-корреспондент РАН
Ченцов Александр Георгиевич
Официальные оппоненты доктор физико-математических наук
Тарасьев Александр Михайлович, кандидат физико-математических наук Логинов Михаил Иванович
Ведущая организация Удмуртский государственный университет,
г Ижевск
Защита состоится « » октября 2007 года в « » чалов на заседании специализированного совета Д 004 006 01 по защите диссертаций на соискание ученой степени доктора физико-математических наук при Институте математики и механики Уральского отделения РАН по адресу 620219, г Екатеринбург, ул С Ковалевской, 16
С диссертацией можно ознакомиться в библиотеке Института математики и механики УрО РАН
Автореферат разослан с » сентября 2007 г
Ученый секретарь диссертационного совета,
доктор физ -мат наук
Н Ю Лукоянов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Диссертация посвящена изучению свойств решения игровой задачи наведения на множество Под решением понимается множество успешной разрешимости
Актуальность темы Теория управления в настоящее время является разделом современной математики, связанным с оптимизацией динамических процессов, и находит многочисленные приложения Основополагающее значение в этой теории имеет принцип максимума Л С Понтрягина Задачи управления в условиях неопределенности формализуются в рамках теории дифференциальных игр Такие задачи возникают при управлении техническими системами, осложненными действием помех Содержательные постановки подобных задач отражены в монографии R Р Isaacs1 Построение строгой теории задач конфликтного управления следует связать прежде всего с именами Н Н Красовского, JI С Понтрягина, Б Н Пшеничного и А И Субботина
Существенное влияние на теорию дифференциальных игр оказали работы А В Кряжимского, А Б Куржанского, Е Ф Мищенко, Ю С Осипова, Ф JI Черноусько, J Р Aubm, Т Basar, Р Bernhard, J V Breakwell, L Berkovitz, M G Crandall, R J Elliot, A Friedman, N J Kaiton, G Leitmann, J Lm, P L Lions, С Ryll-Nardzewski, P Varaiya
Большой вклад в теорию дифференциальных игр и ее приложения внесли Э Г Альбрехт, В Д Батухтин, С А Брыкалов, Н JI Григоренко, П Б Гусятников, М И Зеликин, А Ф Клейменов, В М Кунцевич, А А Меликян, Н Ю Лукоянов, М С Никольский, В В Остапенко, В С Пацко, Н Н Петров, Л А Петросян, Е С Половинкин, Н Н Субботина, А М Тарасьев, В Е Третьяков, В И Ухоботов, В Н Ушаков, А Г Ченцов, А А Чикрий, С В Чистяков, М Bardi, Е N Barron, A Blaquiere, I Capuz-zo Dolcetta, L С Evans, M Falcone, R Jensen, M Ishii, J Lewm, P Soravia, P E Souganidis и многие другие ученые
Предлагаемая работа лежит в русле работ уральской школы Н Н Красовского Рассматриваются дифференциальные игры, в которых задача одного из игроков (обычно называемого игроком-союзником или первым игроком) состоит в наведении движения системы на множество М,
1 Айзеке Р Дифференциальные игры М Мир 1967 480 с
содержащееся в пространстве позиций, с соблюдением фазовых ограничений, определяемых множеством N, второй игрок старается помешать наведению Наиболее удобной как с точки зрения теории, так и с точки зрения приложений представляется позиционная формализация H H Красовского В рамках этой формализации была установлена фундаментальная теорема об альтернативе H H Красовского и А И Субботина2, которая утверждает существование решения вышеупомянутой дифференциальной игры в классе позиционных стратегий (из этой теоремы следует существование седловой точки в классе позиционных стратегий) Из результатов H H Красовского и А И Субботина следует, что разрешающая позиционная стратегия определяется множеством успешной разрешимости задачи наведения Таким образом, задача построения разрешающей позиционной стратегии сводится к построению множества успешной разрешимости задачи наведения
Заметим также, что множество успешной разрешимости задачи наведения в классе позиционных стратегий совпадает с множеством успешной разрешимости задачи наведения в классе квазистратегий первого игрока Подход, основанный на использовании квазистратегий первого игрока, развит в работах Е Roxm3, RJ Elliot и N J Kalton4, Р Varaiya и J Lm5, H H Красовского и A Г Ченцова6 и многих других авторов А Г Ченцов рассматривал дифференциальные игры в классе многозначных обобщенных квазистратегий7 Им же рассматривались вопросы построения седловой точки в классе квазистратегий8
Конкретное построение множества успешной разрешимости задачи наведения при выполнении условий регулярности удается реализовать на
2Красиуский H Я Суббатин Л И Альтернатива для игровой задачи движения // ПММ, 1970, Т 34, №6, С 1005-1022, Красавский И H Субботин А И Позиционые дифференциальные игры M Наука 1974 455 с
zRoxvn Е Axiomatic approach ш differential games //J Optimization Theory and Application. 1969, Vol 3, No 3, 153-163
4 Elliot R J Kalton N The Existence of Value for Differential Games // Memoir of the American Mathematical Society, Vol 126 (1972) IV + 67
5 Varaiya P J Lm Existence of saddle points in differential games // SIAM J Control, 1969, Vol 7, No 1 P 141-157
6Krasovskïi N N Chentsov A G On the design of differential games I //J РгоЫ Control and Inform Theory, 1977, Vol 6, No 5-6 P 381-395, Krasovska N N Chentsov А в On the design of differential games II //J Probl Control and Inform Theory, 1979, Vol 9, No 1 P 3-11
7 Чепцов А Г Метод программных итераций для дифференциальной игры сближения-уклонения // Депонировано в ВИНИТИ 1933-79Деп, 103 стр
8 Ченцов А Г Об альтернативе в классе квазистратегий для дифференциальной игры сближения-уклонения // Дифференц уравнения, 1980 Т16, № 10 С 1801-1808
основе вспомогательных программных конструкций, т е средствами теории программного управления, восходящей к исследованиям Л С Понтрягина В работах H H Красовского, А Б Куржанского, Ю С Осипова и их учеников была построена стройная теория программного управления, на базе которой позднее были разработаны эффективные методы решения регулярных дифференциальных игр9 В общем случае построение решения дифференциальной игры сводится к реализации последовательности решений игровых задач программного управления (метод программных итераций, предложенный А Г Ченцовым10) Рассматриваемый вариант метода программных итераций состоит в построении последовательности множеств, сходящейся к множеству успешной разрешимости11 (другая версия метода программных итераций реализует построение функции цены игры) В связи с исследованием дифференциальных игр методом программных итераций отметим работы А А Медикяна12, В И Ухоботова13 и С В Чистякова14 Близкие к методу программных итераций подходы рассматривались в работе Р Cardahaguet, M Qumcampoix, Р Samt-Pierre15 Также А Г Ченцов построил "прямой" вариант метода программных итераций, реализуемый в пространстве мультифункций, имеющих смысл откликов на воздействие помехи Оба построенных варианта метода программных итераций находятся в двойственности Аналоги метода программных итераций применялись А И Субботиным и А Г Ченцовым для построения обобщенного решения уравнения Гамильтона-Якоби
Большой интерес представляет исследование структуры решения игровых задач управления и установление аквивалентности решений различных
0 Красовский H Я Игровые задачи о встрече движений M Наука 1970 420 с , Красовский H H Дифференциальная игра сближения-уклонения - I // Изв АК СССР (Техническая кибернентика), 1973, №2, С 3-18, Красовский НИ Дифференциальная игра сближения-уклонения - II // Изв АН СССР (Техническая кибернентика), 1973, №3, С 22-42, Красовский H H Субботин А И Позиндоные дифференциальные игры M Наука 1974 455 с
10 Субботин А И Ченцов А Г Оптимизация гарантии в задачах управления M Наука 1981 288с , Чепцов Л Г О структуре одной игровой задачи сближения // ДАН СССР, 1975, Т 224, №6 С 1272-1275, Ченцов А Г К игровой задаче наведения // ДАН СССР, 1976, Т 226, ЧЧ, С 73-76
11 Субботин А И Ченцов А Г Оптимизация гарантии в задачах управления M Наука 1981 288с
12Меликян А А Цена игры в линейной дифференциальной игре сближения // ДАН СССР, 1977, т 237,
№3, С 521-524
Ухаботов В И Построение стабильного моста для одного класса линейных игр // ПММ, 1977, т 41, №2, С 358-364
14 Чистяков С В К решению игровых задач преследования // ПММ, 1977, т 41, № 5, С 825-832 Cardahaguet Р Qumcampoix M, Samt-Pierrz Р Set-Valued Numerical Analysis for Optimal Control and Differential Games // Stochastic and Differential Games, Stochastic and Differential Games, No 4 Annu
Internat Soc Dynam Games, Birkhauser, Boston, 1999, pp 177-247
дифференциальных игр Представление решения дифференциальной игры сближения-уклонения как множества успешной разрешимости получено благодаря теореме об альтернативе H H Красовского и А И Субботина Дальнейшие исследования структуры связаны с работами H H Красовского, посвященными унификации дифференциальных игр16 и стохастическому программному синтезу17 Структура решения игровых задач управления с информационной памятью исследована А И Субботиным18 Полезные результаты в области исследования геометрической структуры решения игровых задач наведения получены в работах А Г Ченцова19, А Г Ченцова и В Я Рузакова 20, в которых исследовалось "устойчивость" мостов к операции объединения Отметим также работы Р M Cardaliguet, M Qumcampoix и P Sent-Pierre21
В теории дифференциальных игр интенсивно изучаются задачи, в которых момент окончания процесса не фиксируется, эти задачи исследовались в работах Л С Понтрягина, где предполагалось, что момент окончания может изменятся от 0 до бесконечности В диссертации исследуется структура задач наведения на ограниченное цилиндрическое множество в пространстве позиций (эти задачи также называются задачами наведения "к моменту") Такие постановки охватываются теоремой об альтернативе H H Красовского, А И Субботина Многие работы, посвященные этой задаче, используют вспомогательную задачу наведения на множество, содержащееся в гиперплоскости t = const (то есть задачу наведения "в момент") Структура решения задачи наведение на множество "к моменту" в регулярном случае изучена в работах H H Красовского и А И Субботина22 На основе построения решения уравнения Гамильтона-Якоби с дополнительными
16Красовсшй НИК задаче унификации дифференциальных игр // ДАН СССР, 1976, Т 226, N° 6, С 1260-1263
17 К'расовский И H Управление динамической системой Задача о минимуме гарантированного результата M Наука 1985 624с
16 Субботин А И Экстремальные стратегии в дифференциальных играх с полной памятью // ДАН СССР, 1972 Т206, № 3 С 552-555
19 Ченцов А Г О некоторых свойствах множеств позиционного поглощения в дифференциальных играх сближения-уклонения // Задачи динамического управления, сборник науч трудов Свердловск, ИММ УНЦ РАН, 1981, С 82-91,
20Рузаков В Я Ченцов А Г Об одной линейной дифференциальной игре сближения с невыпуклым целевым множеством // Дифференц уравнения, 1984 Т 20, № 4 С 593-597
21 Cardakaguet P Quzncampozx M, Saint-Pierre Р Set-Valued Numerical Analysis foi Optimal Control and Differential Games // Stochastic and Differential Games, Stochastic and Differential Games, No 4 Ашш Internat Soc Dynam Games, Birkhauser, Boston, 1999, pp 177-247
22 Красоеский H H Субботин А И Позиционные дифференциальные игры M Наука 1974 455с
ограничениями в виде неравенств А И Субботиным было получено решение задачи наведения "к моменту" в случае игры с простыми движениями23, для этой задачи им получено выражение функции цены, аналогичное выражению для функции цены в задачи наведения "в момент", полученному Б Н Пшеничным и М И Сагайдак Вопросы построения решения задачи наведения на цилиндрическое множество рассматривались в работе I М Mitchel, А М Вауеп, С J Tomlm24 решение задачи наведения на цилиндрическое множество в этой работе строилось как множество Лебега вязкостного решения вспомогательного уравнения типа Гамильтона-Якоби, построение решения использует преобразование исходной задачи к дифференциальной игре с фиксированным временем окончания Подобная процедура используется и в настоящей диссертации
Выделим также вопрос о реализуемости множества успешной разрешимости задачи наведения посредством метода программных итераций В этой области в работах А Г Ченцова25 и В И Ухоботова26 получены результаты, касающиеся условий, при которых метод программных итераций стабилизируется после конечного и небольшого числа итераций Обычно аналитически удается построить лишь некоторое число итераций В связи с этим, возникает вопрос о реализации метода экстремального сдвига на нестабильное множество Случай, когда множество, на которое осуществляется прицеливание, близко к множеству успешной разрешимости в инфинитезимальном смысле, рассматривался27 В Н Ушаковым и Я А Латушкиным
В диссертации исследуются вопросы структуры решения дифференциальных игр, понимаемого как множество успешной разрешимости задачи наведения Также рассматривается вопрос о характере сходимости метода программных итераций и построении позиционных
23 Субботин А И Обобщенные решения дифференциальных уравнений 1-го порядка Ижевск РХД 2003 336 с
24Mitchel IM Вауеп А М, Tomhn С J A Time-Depend Hamilton-Jacobi Formulation of Reachable Sets for Continuous Dynamic Gaines//IEEE Tiansaction on Automatic Control, 2005, Vol 50, No 7, Pp 947-957
25 Субботин А И Чепцре А Г Оптимизация гарантии в задачах управления М Наука 1981 288с , Челщое А Г Об игровой задаче сближения в заданный момент времени // Матем сб , 1976, Т 99, №3, С 394-420
26УхоботовВИ К построению стабильного моста в игре удержания//ПММ, 1981, т 45, №2, С 237240, Ухоботое В И К вопросу об окончанию игры за первый момент поглощения // ПММ, 1984, т 48, №6, С 892-897
27 Ушаков В Я Латушкин Я А Дефект стабильности множеств в игровых задачах управления // Труды ИММ УрО РАН, 2006, Т12, №2, С 178-194
стратегий, приближающих (в смысле гарантированного результата) оптимальную
Цель работы Исследование следующих свойств множества успешной разрешимости игровой задачи наведения непрерывная зависимость сечений от времени, связность сечений, преобразование игровых задач наведения на цилиндрическое множество к задачам наведения на основание цилиндра, построение аналогов метода экстремального сдвига Н Н Красовского и А И Субботина с использованием прицеливания на нестабильное множество
Методы исследования В основе работы лежат методы теории управления и теории позиционных дифференциальных игр, теория расширения экстремальных задач управления и конструкции метода программных итераций Используются элементы общей топологии и теории меры
Научная новизна Построен пример дифференциальной игры, в которой сечения разрывно зависят от времени и являются несвязными (целевое множество при этом связно) Получены достаточные условия непрерывной зависимости сечений от времени и связности сечений Предложен метод построения дифференциальной игры с заданным множеством успешной разрешимости Рассмотрена задача наведения автономной конфликтно управляемой системы на цилиндрическое множество Этой задаче сопоставлена задача наведения преобразованной системы на основание цилиндра Доказано, что последовательности множеств, построенные по методу программных итераций для обеих задач, совпадают Исследован характер сходимости метода программных итераций в случае компактного целевого множества На этой основе построены аппроксимативные аналоги правила экстремального сдвига Н Н Красовского и А И Субботина и экстремального управления с поводырем Результаты диссертационной работы являются новыми
Теоретическая и практическая значимость Полученные в работе теоретические результаты дают представление о геометрической структуре множества успешной разрешимости в игровой задаче наведения и о характере сходимости метода программных итераций Предложенный в работе метод построения дифференциальной игры с заданным множеством успешной разрешимости задачи наведения позволяет исследовать структуру
класса решений нелинейных дифференциальных игр сближения-уклонения Практическая ценность работы состоит в том, что полученные свойства могут быть применены при изучении различных методов решения задач игрового управления В частности, решение игровой задачи наведения автономной конфликтно-управляемой системы на цилиндрическое множество при весьма общих предположениях может быть сведено к решению задачи наведения преобразованной системы на основание цилиндра, благодаря тому, что доказано совпадение последовательностей, построенных по методу программных итераций для обеих задач Упомянутое свойство совпадения последовательностей может быть использовано при построении управления в задачах уклонения от множества, в которых ограничено число переключений управления одного из игроков Построены аппроксимативные аналоги правила экстремального сдвига, для реализации которых не требуется построение множества успешной разрешимости, а достаточно построения некоторого приближения к нему
Структура и объем работы Диссертация состоит из введения, трех глав и списка литературы Общий объем диссертации составляет 118 страниц, набранных в текстовом редакторе LATEX, библиографический список включает 141 наименование
Апробация работы Основные результаты диссертации докладывались на международном семинаре "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби" (Екатеринбург, 22-26 июня 2005 года), международной конференции по дифференциальным уравнениям и динамическим системам (Суздаль, 10-15 июля 2006 года), IX съезде по теоретической и прикладной механике (Нижний Новгород, 22-28 августа 2006 года), международной конференции "Моделирование и исследование устойчивости динамических систем" (Киев, 22-25 мая 2007 года), международной конференции по математической теории управления и механике (Суздаль, 22-27 июня 2007 года), Symposium on Functional Differential Equations (September, 11-15, Ariel, Israel), межрегиональной конференции "Современные математические методы и информационные технологии в образовании" (Тюмень, 14-15 апреля, 2005), семинарах отдела управляемых систем и отдела динамических систем ИММ УрО РАН, семинаре кафедры дифференциальных уравнений Удмуртского
государственного университета, семинаре отдела оптимизации управляемых процессов Института кибернетики им В М Глушкова HAH Украины
Публикации. Основной материал диссертации опубликован в работах [1]—[13] В совместных с А Г Ченцовым работах [2]-[6], [13] А Г Ченцову принадлежат постановки задач и некоторые идеи доказательств
СОДЕРЖАНИЕ РАБОТЫ
Во введении дается краткий обзор литературы, относящейся к игровым задачам наведения, определяется цель работы, излагаются основные результаты диссертации
Первая глава состоит из трех параграфов Она является вводной и посвящена основным постановкам и методам, связанным с применением обобщенных управлений в динамических системах, теории дифференциальных игр и метода программных итераций Рассматривается управляемая система
х = f(t,x,u,v), t е [<о.#о] (1)
Здесь х 6 К™ - фазовое состояние системы, и € Р - управление первого игрока, v е Q - управление второго игрока, Р и Q -компакты в конечномерных пространствах Предполагается, что функция / удовлетворяет условиям локальной липшицевости и подлинейного роста по второй переменой Рассматриваемая задача первого игрока состоит в том, чтобы привести траекторию системы на множество М не покидая множества N Второй игрок стремится помешать этому Задачу первого игрока будем называть задачей (М, ]У)-наведения Задачу второго игрока естественно называть задачей уклонения На множества М та N наложены следующие условия М с N С [io>$o] х К.™, М, N замкнуты
Используется формализация, предложенная в работах Н Н Красовского и А И Субботина28 Полагаем, что первый игрок выбирает свое управление в классе контрстратегий, а второй игрок в классе позиционных стратегий29 В случае, если выполняется условие седловой точки в маленькой игре (условие Айзекса), то предполагается, что оба игрока выбирают свое управление в классе позиционных стратегий
2&Красовсшй Н И Субботин А И Позшщоные дифференциальные игры М Наука 1974 455 с
29Еели обоим игрокам не известно управление противника, то управления игроков могут быть выбраны в классе смешанных стратегий
Рассматриваются порожденные контрстратегией первого игрока пошаговые движения (ломаные Эйлера) и их пределы при стремлении мелкости разбиения к нулю - конструктивные движения Н Н Красовского Структура решения задачи (М, ]У)-наведения определяется теоремой об альтернативе, установленной Н Н Красовским и А И Субботиным Согласно теореме об альтернативе, множество N (вне N очевидно разрешима задача второго игрока) допускает разбиение в сумму двух подмножеств множества успешной разрешимости задачи наведения, и множества успешной разрешимости задачи уклонения При этом множество успешной разрешимости задачи наведения является максимальным и-стабильным мостом30
Определение 1 Множество W С N называется u-стабильным мостом в задаче (М,-ЛГ)-наведения, если для любой позиции (¿*,ж*) е W и любого постоянного управления второго игрока и* £ Q существует решение дифференциального включения
y{t) е co{f(t,y(t),u,v*) и € Р}, удовлетворяющее начальному условию y(t*) = х*, такое, что для некоторого т 6 [¿*,1?о] справедливы включения у(т) 6 М[т] и y(t) 6 W[t] Vi 6 [i*,r]
Здесь (и ниже) E\t] - сечение множества Е С [i(b$o] х ®;п гиперплоскостью t = const, E[t] = {х (t, ж) € Е}
При этом вид разрешающей контрстратегии (позиционной стратегии, в случае выполнения условия седловой точки в маленькой игре) также дается теоремой об альтернативе Оптимальная контрстратегия - контрстратегия, экстремальная к множеству успешной разрешимости
Таким образом, задача (М, А^-наведения для дифференциальной игры сведена к задаче построения множества успешной разрешимости В дальнейшем под решением задачи наведения понимается именно множество успешной разрешимости Один из методов построения множества успешной разрешимости есть метод программных итераций, предложенный А Г Ченцовым Конструкция метода программных итераций использует
30Используемое в диссертации определение для случая замкнутых множеств эквивалентно определению, данному в книге Красовский И Н Субботин А И Позиционые дифференциальные игры М Наука. 1974 455 с
понятие обобщенных управлений (мер-управлений)31
Пусть £ 6 [¿о, 0о] Рассмотрим множество Л4 всех мер на борелевских а-алгебрах подмножеств -г?о] х -Р> согласованных с мерой Лебега на [£, (ее будем обозначать через А) Будем говорить, что мера ¡1 на \р, $о] х Р согласована с мерой Лебега А, если для любого измеримого подмножества Г отрезка [£, выполнено равенство /¿(Г х Р) — А(Г) Аналогично, рассмотрим множества всех мер на борелевских а-алгебрах подмножеств [¿,1?о] х й н [¡А| х х <2, согласованных с мерой Лебега Обозначим эти множества через и Н± соответственно Элементы множества являются обобщенными аналогами управлений первого игрока, элементы множества - аналогами управлений второго игрока, элементы множества " аналогами пар управлений (и( ),и()) Если и € то множество мер из Ни согласованных с V, непусто Обозначим его через ПДь-]
Для (и, ж») € [¿о, х через ¡р( обозначаем
траекторию системы (1), порожденную мерой V, выходящую из позиции (4*,я») Аналогично, если ц^И^, V* е <3, то через <р{ обозначаем (обобщенную) траекторию системы (1), порожденную обобщенным управлением первого игрока (г и обычным управлением второго игрока г/*, выходящую из позиции (¿*, х„)
Рассматриваются два варианта метода программных итераций Варианты различаются операторами программного поглощения, действующими в пространстве замкнутых подмножеств [¿сь^о] х Эти операторы
определяются следующим образом
А (Е) 4 {(г*, ж») &Е Уь> 6 Еи 3 г, е П*>] Эт е [4.,0ь]
{(р(т,и,х*,г)) 6 М[т])Ц<рЦ;,и,х„т)) в ЕЩ Ví € [**,т]))},
А(Е) = {(и,х*) &Е \ZveQ3iie 3т е
((<р(т,и,х*,11,у) € М[т])&(<р(ъи,х*,ц,у) € ЕЩ Ví е [4*,т]))}
Определим теперь последовательности подмножеств
N
_УУо^АГ, Щ 4 А(И4-1), к е N.
31 Гамкрелидзе Р В Основы оптимального управления Тбилиси Изд-во Тбилисского ун-та 1977 254 с , Варга Док. Оптимальное управление дифференциальными и функциональными уравнениями М Наука 1977 624 с
Рис 1 Множество К
= ЛГ, ^ 4 к е N
Определение стабильного моста может быть дано в терминах оператора А множество IV является «-стабильным мостом, если Ш = А(]У) Вариант метода программных итераций, определяемый оператором А, называется также методом итераций стабильности
В диссертации используется следующее представление множества успешной разрешимости задачи (М, Лг)-наведения 2ХТ, полученное А Г Ченцовым32
2Я= р| р|ИЪ
/ЬеМ йен
Вторая глава состоит из четырех параграфов Она посвящена вопросам структуры решения дифференциальной игры сближения-уклонения исследуется множество успешной разрешимости задачи наведения
В параграфе 2 1 показано, что в общем случае сечения дифференциальной игры разрывно зависят от времени и могут быть несвязными даже в случае связного целевого множества Построен следующий пример Пусть К С [0,1] х К2,
К ^ ([0,1] х {0} х {0}) и {(*, Ж1) г € [1/2,1], XI = 1 - ехр(г - 1)} х {0} »
Пусть £ > 0 Через Ке обозначим дополнение до е-окрестности множества К в пространстве [0,1] х К2
Определим функцию жь жг) 1] х Ш2 —► К
й{(г,Х1,Х2),Ке)
«!((*, хьх2), ке) + а((<, жьжг), ку
32 Субботин А И Ченцов А Г Оптимизация гарантии в задачах управления М Наука 1981 288с
здесь d((i,a;i,a;2), Е) - расстояние от (t,x 1,3:2) До множества Е С [0,1] х R2 Рассмотрим дифференциальную игру с фиксированным временем окончания для системы
xi = щ
Х2 = Хк,е(г> х1>х2)и2 ~ v,
t е [0,1], ui,u2,v € [—1,1] В качестве целевого множества рассмотрим множество M = {(1,0,0)}, фазовые ограничения положим равными всему пространству позиций N = [0,1] х R2 Для этой задачи наведения множество К является множеством успешной разрешимости
Как видно из структуры множества К, сечения множества К разрывно зависят от времени и при t 6 [1 /2,1] являются несвязными множествами (см рис 1)
В параграфе 2 2 предложен более общий метод построения дифференциальной игры наведения с заданным априори решением Обозначим предполагаемое целевое множество через М, предполагаемое множество успешной разрешимости задачи наведения на M через W Мы рассматриваем задачи наведения без фазовых ограничений, то есть предполагается, что N = [io, $0] х R™ Пусть n = m+ l,m(=N
Теорема 1 Пусть M С W С [to>$o] х Жт х {0}, M и W замкнуты, и существует, R > 0 со свойством
v(î*, X*) eW3t> t*(3x е M[t\ \\х - z*|| < R\t -t* |) &
(Vt € (t*,£) Зж € W[t] - s*|| < R\t - t*|)
Тогда существует дифференциальная игра, удовлетворяющая условию седловой точки в маленькой игре, такая, что W является множеством успешной разрешимости задачи (M, R"1"1"1)-наведения в этой игре
Параграф 2 3 посвящен достаточным условиям, при которых в задаче (М, .Л^-наведения для фиксированной конфликтно-управляемой системы вида (1) сечения множества успешной разрешимости непрерывно зависят от времени (в смысле Какутани) и являются связными множествами в случае связности целевого множества Обозначим множество успешной разрешимости в задаче (M, //)-наведения для системы (1) через 2ÏÏ
Определение 2 Будем говорить, что множество Е С [¿(ь$оЗ х не возрастает по сечениям, если для всех ¿1^2 6 [¿оЛ], > ¿2, выполнено включение С £^2]
Пусть г [¿о, #о] х К" К" непрерывная функция, локально липшицевая по фазовой переменной, удовлетворяющая по ней условию подлинейного роста Решение дифференциального уравнения
х = я (4, х)
с начальными условиями г{и) = х*, определенное на всем промежутке [¿о, обозначим через фг( ж*) Для каждой позиции 6 х
положим = фг($а,и,х*) Также у = ф2^,х) тогда и только
тогда, когда х = Будем называть множество Е С [¿о>^о] х ®и
г-невозрастающим по сечениям, если множество = {(Ъфг(Ь,х))
(¿, х) € .Е} не возрастает по сечениям Мы рассматриваем сечение множества Е С [¿о, 1?о] х как многозначное отображение £ ь-» .ЕЭД
Теорема 2 Предположим, что для системы (1) выполнено условие седловой точки в маленькой игре Рассмотрим задачу (М, Ы) -наведения для системы (1) Пусть также существует непрерывная функция 2( ! ) 11о,йо]хГ-.Г, удовлетворяющая по второй переменной условиям локальной липшицевости и подлинейного роста такая, что N есть г-невозрастающее по сечениям множество, и Н(1:,х,з) < (й г{Ь,х)) для всех (г,х) е N, в еЖп Тогда
1 если отображение £ 1-+ МЩ непрерывно справа, то отображение £ н-> 2#[£] непрерывно,
2 если М С {$0} х К™ и М линейно связно, то и множества 223$, £ €
- линейно связные множества
Два важных частных случая, когда заключения теоремы 2 выполнены (предполагается, что условие седловой точки в маленькой игре выполнено)
1 множество N не возрастает по сечениям, и Н(1;,х,8) < 0 для всех (М) € N. в е К",
2 функция f представляется в виде f(t,x,u,v) = g(t,x) + h(t,u,v) для некоторых функций д [io,iolx8e-»I и h [i0,^o] х Р * Q также N есть ^-невозрастающее по сечениям множество, и
mm max(s, h(t, u,v)) < 0 Vt € [¿о, i?0] Vs € M" ueP oeQ
Параграф 2 4 посвящен исследованию решения в задаче наведения на цилиндрическое множество автономной системы
х = fix, и, «), xsRn, иеР, veQ
на промежутке [0,1?] Рассматривается задача наведения на множество A/W = [о, I?] х F (F - замкнутое множество в К") внутри множества N
Этой задаче сопоставим задачу наведения внутри множества N на множество Af ® = {1?} х F для системы
ш = мо f(x,u,v) х € R™, и0 € {0,1}, и 6 Р, v е Q
Система рассматривается на отрезке времени [0,1?] Первый игрок распоряжается управлениями щ и и, второй игрок, как и в исходной системе, - управлением v Обозначим множество успешной разрешимости в исходной задаче через 2П« , в преобразованной, как и в исходной задаче, - через Последовательности, построенные по методу итераций стабильности для исходной и преобразованной задачи, обозначим через {W^lfcLo и
Теорема 3. Пусть N является невозрастающим по сечениям множеством Тогда справедливы следующие утверждения
1 wjp = W^ для всех keN,
S 223^=21^,
3 если исходная система удовлетворяет условию седловой точки в маленькой игре, то и преобразованная система также удовлетворяет условию седловой точки в маленькой игре
Обозначим гамильтонианы игр через
Я« и соответственно
Показано, что H^>(x,s) = mm{0,fW(i,s)} Таким образом, Я®(ж, в) < 0 Vs, х € R" Отсюда следует, что (при условии седловой точки в маленькой игре) сечения множества успешной разрешимости в игровой задаче наведения
на цилиндрическое множество для автономной системы непрерывно зависят от времени Также они являются связными множествами в случае связности множества ^
Третья глава посвящена изучению характера сходимости метода программных итераций и свойствам аппроксимативных аналогов метода программных итераций При этом прицеливание осуществляется на множества, являющиеся элементами последовательности, построенной по методу программных итераций На протяжении всей главы предполагается, что целевое множество М компактно и непусто
Параграф 31 посвящен характеру сходимости метода программных итераций
Теорема 4 Множества ЯП, УУд; компакты для к £ N Имеет место сходимость последовательностей {И^}^ и {УЦ^}^ к 2И в метрике Хаусдорфа
Следствие Пусть зафиксировано í € [¿сь^о] Тогда множества ШЩ, \¥кЩ, УУ^ЭД компакты для к € N В случае, когда %ВЩ непусто, имеет место сходимость последовательностей и {УУ^ВД}^], к в
метрике Хаусдорфа
Параграф 3 2 посвящен построению аппроксимативного аналога метода экстремального сдвига Н Н Красовского и А И Субботина Пусть условие седловой точки в маленькой игре выполнено, N = [¿о, х Стратегию, экстремальную к множеству Н^, обозначим через ¿4 Если I/ - некоторая позиционная стратегия, - начальная позиция, Д - разбиение
отрезка [£>,$о]> то через Хд[£*,;г*,г7] обозначим соответствующий пучок ломаных Эйлера Через <1(х,С) обозначим расстояние от точки в фазовом пространстве ж до множества С С К™
Теорема 5 Пусть г* € [Аь^о] такой момент времени, что 2П[т*] ф 0, и е > 0 Тогда существует 5 > 0 такое, что для любого разбиения отрезка [т*,$о] Д = Ш™0> Удовлетворяющего условию твх.^^^— т3) < 5, существует Л" £ N со свойством для любого к > К, любого х* € М^т*] и каждого движения ] 6 -Хд[т*, ж*,24]
Аналогичная теорема (теорема б) справедлива и для случая прицеливания на множества И^
В параграфе 3 3 построена конструкция модификация конструкции параграфа 3 2 для случая процедуры управления с поводырем Н Н Красовского и А И Субботина Особенностью данной модификации является построение переходной функции поводыря Получены оценки расстояния от пучка конструктивных движений, порождаемого модифицированной процедурой управления с поводырем, до целевого множества (теоремы 7 и 8)
Основные результаты диссертации
1 Показано, что в общем случае структура множества успешной разрешимости задачи наведения является нерегулярной в следующем смысле сечения множества успешной разрешимости (гиперплоскостью, получающейся при фиксации момента времени) разрывно зависят от времени и могут быть несвязными множествами даже в случае связности целевого множества
2 Найдены достаточные условия того, что сечения множества успешной разрешимости непрерывно зависят от времени и являются связными множествами
3 Исследована задача наведения на цилиндрическое множество автономной конфликтно-управляемой системы Этой задаче сопоставлена задача наведения на основание цилиндра преобразованной системы Показано, что последовательности, построенные по методу программных итераций для обеих задач, совпадают Также совпадают множества успешной разрешимости в обеих задачах
4 Построены аппроксимативные аналоги правил экстремального сдвига и управления с поводырем Н Н Красовского и А И Субботина В этом случае прицеливание осуществляется на множества, являющиеся элементами последовательности, построенной по методу программных итераций
Автор глубоко благодарен научному руководителю член-корреспонденту РАН Ченцову Александру Георгиевичу за постоянное внимание к работе
Публикации по теме диссертации
[1] Авербух Ю В Об одном аппроксимативном аналоге правила экстремального сдвига // Дифференциальные уравнения, 2007, Т 43, №8, с 1011-1018
[2] Авербух Ю В Ченцов А Г К вопросу о приближенной реализации сечений множеств позицонного поглощения в одной игровой задаче управления // Вестник УГТУ-УПИ (Серия радиотехническая), 2005, № 17 (69), С 217-230
[3] Авербух Ю В Ченцов А Г О характере сходимости в одной процедуре метода программных итераций // Труды семинара "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби", 2006, Т 1, С 166-175
[4] Авербух Ю В Ченцов А Г Об одной оценке, связанной с методом программных итераций // Межрегиональная конференция "Современные математические методы и информационные технологии в образовании" Тезисы докладов , Тюмень, 2005, С 3-5
[5] Авербух Ю В Ченцов А Г Некоторые свойства процедур, связанных с методом программных итераций // Дифференциальные уравнения и процессы управления (электронный журнал), 2005, № 3, С 38-62
[6] Авербух Ю В Ченцов А Г Некоторые конструкции, связанные с методом программных итераций в нелинейных задачах управления // Аннотации докладов IX Съезда по теоретической и прикладной механике, 2006, Т 1, С 8-9
[7] Авербух Ю В К вопросу о структуре множества позиционного поглощения в игровой задаче наведения // Проблемы управления и информатики, 2006, № 3, С 5-9
[8] Авербух Ю В Один метод построения конфликтно-управляемых систем с заданными свойствами // Тезисы международной конференции по
дифференциальным уравнениям и динамическим системам Владимир, 2006, С 16-18
[9] Авербух Ю В Об одной модификации правил экстремального сдвига Н Н Краеовского и А й Субботина // Дифференциальные уравнения и процессы управления (электронный журнал), 2006, №4, С 30-49
[10] Авербух Ю В Метод программных итераций в задачах наведения для автономных конфликтно-управляемых систем // Дифференциальные уравнения и процессы управления (электронный журнал), 2007, №1, С 74-90
[11] Авербух Ю В Достаточные условия непрерывной зависимости сечений множества успешной разрешимости в игровой задаче наведения // Тезисы международной конференции по математической теории управления и механике Владимир, 2007, С 4-5
[12] Авербух Ю В О задаче наведения автономной конфликтно-управляемой системы на цилиндрическое множество // Тезисы международной конференции "Моделирование и исследование устойчивости динамических систем" Киев, 2007, С 19
[13] Averboukh Ум V Chentsov A G On Character of Convegence of the Programmed Iteration Method for Control Problem with Elements of Uncer-tatamty // Functional Differential Equations, 2007, V 14, No 1, Pp 21-46
Авербух Юрий Владимирович
НЕКОТОРЫЕ ВОПРОСЫ СТРУКТУРЫ РЕШЕНИЯ ИГРОВЫХ ЗАДАЧ УПРАВЛЕНИЯ
Автореферат
Подписано в печать 18 09 2007 Формат 60x84 1/16 Объем 1 п л Тираж 150 экз Заказ №
Введение
1 Определения и обозначения
1.1 Элементы теории обобщенных управлений.
1.1.1 Множества в фазовом пространстве и пространстве позиций.
1.1.2 Стратегические меры
1.1.3 Слабо измеримые вероятностнозначные функции
1.2 Некоторые сведения из теории дифференциальных игр
1.3 Метод программных итераций.
2 Свойства структуры решения дифференциальных игр
2.1 Пример
2.2 Построение игр с заданным мостом.
2.3 Регулярная зависимость сечений.
2.4 Задача наведения автономной конфликтно-управляемой системы на цилиндрическое множество.
2.4.1 Преобразование исходной задачи.
2.4.2 Некоторые свойства операторов программного поглощения для автономных систем.
2.4.3 Свойства преобразованной задачи.
3 Характер сходимости МПИ
3.1 Характер сходимости процедур на основе метода программных итераций.
3.2 Аналог правила экстремального сдвига.
3.2.1 Формулировка основного результата.
3.2.2 Оценка расхождения при прицеливании на близкое множество на одном шаге.
3.2.3 Метод экстремального сдвига на множества-элементы последовательности, построенной по методу программных итераций.
3.3 Аналоги правила управления с поводырем
Н.Н. Красовского и А.И. Субботина
3.3.1 Формулировка основного результата.
3.3.2 Свойства управления, экстремального по отношению к паре множеств.
Общая характеристика работы
Представленная диссертация посвящена изучению структурных свойств множества успешной разрешимости в игровых задачах наведения на множество внутри фазовых ограничений, а также изучению характера сходимости метода программных итераций в этих задачах.
Актуальность темы
Теория управления в настоящее время является разделом современной математики, связанным с оптимизацией динамических процессов, и находит многочисленные приложения. Основополагающее значение в этой теории имеет принцип максимума JI.C. Понтрягина. Задачи управления в условиях неопределенности формализуются в рамках теории дифференциальных игр. Такие задачи возникают при управлении техническими системами, осложненными действием помех. Содержательные постановки подобных задач отражены в монографии R.P. Isaacs [14]. Построение строгой теории задач конфликтного управления следует связать прежде всего с именами Н.Н. Красовского, JI.C. Понтрягина, Б.Н. Пшеничного и А.И. Субботина ([40], [132], [60], [61], [66], [65]). Следует отметить также работы W.H. Fleming и Е. Roxin (см. [128], [137]).
Существенное влияние на теорию дифференциальных игр оказали работы А.В.Кряжимского, А.Б. Куржанского, Е.Ф. Мищенко,
Ю.С. Осипова, Ф.Л. Черноусько, J.P. Aubin, Т. Basar, P. Bern-hard, J.V. Breakwell, L. Berkovitz, M.G. Crandall, R.J. Elliot, A. Friedman N.J. Kalton, G. Leitmann, J. Lin, P.L. Lions, C. Ryll-Nardzewski, P. Varaiya ([41]-[44], [62] - [64], [48], [55], [107], [113], [114], [120], [124], [125],[129], [133], [138]).
Большой вклад в теорию дифференциальных игр и ее приложения внесли Э.Г.Альбрехт, В.Д. Батухтин, С.А. Брыкалов, H.JL Григоренко, П.Б. Гусятников, М.И. Зеликин, А.Ф. Клейменов, А.А. Меликян, Н.Ю. Лукоянов, М.С. Никольский, В.В. Остапенко, B.C. Пацко, Н.Н. Петров, Л!А. Петросян, Е.С. Половинкин, Н.Н. Субботина, В.Е. Третьяков, A.M. Тарасьев, В.И. Ухоботов, В.Н. Ушаков, А.Г. Ченцов, А.А. Чикрий, С.В. Чистяков, М. Bardi, E.N. Barron, A. Blaquiere, I. Capuzzo Dolcetta, M. Falcone, L.C. Evans, R. Jensen, M. Ishii, J. Lewin, P. Soravia, P.E. Souganidis и многие другие ученые (см. [15], [17], [20], [21], [25], [26], [28] - [30], [59], [58], [68] - [69], [76] -[82], [85] - [100], [101] - [103], [109] - [112], [121] - [123], [126], [127], [134]).
Предлагаемая работа лежит в русле работ уральской школы Н.Н. Красовского. Рассматриваются дифференциальные игры, в которых задача одного из игроков (обычно называемого игроком-союзником или первым игроком)' состоит в наведении движения системы на множество М, содержащееся в пространстве позиций, с соблюдением фазовых ограничений, определяемых множеством iV; второй игрок старается помешать наведению. Наиболее удобной как с точки зрения теории, так и с точки зрения приложений представляется позиционная формализация Н.Н. Красовского. В рамках этой формализации была установлена фундаментальная теорема об альтернативе Н.Н. Красовского и А.И. Субботина (см. [40], [132]), которая утверждает существование решения вышеупомянутой дифференциальной игры в классе позиционных стратегий (из этой теоремы следует существование седловой точки в классе позиционных стратегий). Из работ Н.Н. Красовского и А.И. Субботина следует, что вид разрешающей позиционной стратегии полностью определяется множеством успешной разрешимости задачи наведения (см. [40]). Таким образом, задача построения разрешающей позиционной стратегии сводится к задаче построения множества успешной разрешимости задачи наведения.
Заметим также, что множество успешной разрешимости задачи наведения в классе позиционных стратегий совпадает с множеством успешной разрешимости задачи наведения в классе квазистратегий первого игрока. Подход, основанный на использовании квазистратегий первого игрока, развит в работах Е. Roxin [137], R.J. Elliot и N.J. Kalton [125], R Varaiya и J. Lin [141], Н.Н. Красовского и А.Г. Ченцова [130],[131] и большом числе других работ. А.Г. Ченцов рассматривал дифференциальные игры в классе многозначных обобщенных квазистратегий (см. [90]). Им же рассматривались вопросы построения седловой точки в классе квазистратегий (см. [100]).
Конкретное построение множества успешной разрешимости задачи наведения при выполнении условий регулярности (см." [40], [32], [33]) удается реализовать на основе вспомогательных программных конструкций, т. е. средствами теории программного управления, восходящей к исследованиям JI.C. Понтрягина. В работах Н.Н. Красовского, А.'Б. Куржанского, Ю.С. Осипова и их учеников была построена стройная теория программного управления, на базе которой позднее были разработаны эффективные методы решения регулярных дифференциальных игр (см. [31]—[33], [40]). В общем случае построение решения дифференциальной игры сводится к реализации последовательности решений игровых задач программного управления, благодаря методу программных итераций (МПИ), « предложенному А.Г. Ченцовым. Рассматриваемый вариант метода программных итераций состоит в построении последовательности множеств, сходящейся к множеству успешной разрешимости (другая версия метода программных итераций реализует построение функции цены игры). В связи с исследованием дифференциальных игр методом программных итераций отметим также работы А.А. Меликяна [47], В.И. Ухоботова [78]—[80], С.В. Чистякова [102]—[104]. Близкие к методу программных итераций подходы рассматривались в работе P.M. Cardaliaguet, М. Quincampoix, P. Saint-Pierre [119]. Также А.Г. Ченцов построил "прямой" вариант метода программных итераций, благодаря которому решение строится в виде (неуиреждающей) многозначной квазистратегии [93], [94], [96] - [99]. Оба построенных варианта метода программных итераций находятся в двойственности [95], [121], [122]. Аналоги метода программных итераций применялись А.И. Субботиным и А.Г. Ченцовым для построения обобщенного решения уравнения Гамильтона-Якоби (см. [73]). Отметим, что при решении реальных задач далеко не всегда удается аналитически построить по методу программных итераций последовательность множеств. Во многих задачах удается построить лишь конечное и очень небольшое число итераций.
Большой интерес представляют задачи исследования структуры решения игровых задач управления и установления эквивалентности решений различных дифференциальных игр. Представление решения дифференциальной игры сближения-уклонения как множества успешной разрешимости установлено благодаря теореме об альтернативе Н.Н. Красовского и А.И. Субботина. Дальнейшие исследования структуры решения игровых задач управления связаны с работами Н.Н.Красовского, посвящениыми унификации дифференциальных игр [38], [39]. Следует отметить теорию стохастического программного синтеза, построенную в работах *
Н.Н. Красовского [34]. Структура решения игровых задач управления с информационной памятью исследована в работах А.И. Субботина
74], [75] (в связи с этим см. также [40]). Значительные результаты в области исследования геометрической структуры решения игровых задач наведения получены в работах А.Г. Ченцова, А.Г. Ченцова и В.Я. Рузакова [67], в которых исследовалась "устойчивость" мостов к операции объединения. Отметим также работы P.M. Cardaliguet, М. Quincampoix и P. Sent-Pierre (см. [117]—[119])
В диссертации исследуется структура задач наведения на цилиндрическое множество (эти задачи также называются задачами наведения "к моменту"). Большое количество работ, посвященных этой задаче, использует вспомогательную задачу наведения на множество, содержащееся в гиперплоскости t = const (то есть задачу наведения "в момент"). Структура решения задачи наведения на множество "к моменту" в регулярном случае изучеиа в работах Н.Н. Красовского и А.И. Субботина [40], [132]. На основе построения решения уравнения Гамильтона-Якоби с дополнительными ограничениями в виде неравенств А.И. Субботиным было получено решение задачи наведения "к моменту" в случае игры с простыми движениями [71]; для этой задачи им получено выражение функции цены, аналогичное выражению для функции цены в задаче наведения "в момент", полученной в работе Б.Н.Пшеничного и М.И.Сагайдак [66]. Вопросы построения решения задачи наведения на цилиндрическое множество рассматривались в работе I.M. Mitchel, A.M. Bayen, C.J. Tomlin [136]: решение задачи наведения на цилиндрическое множество в этой работе строилось как множество Лебега вязкостного решения вспомогательного уравнения типа Гамильтона-Якоби; построение решения использует преобразование исходной задачи к дифференциальной игре с фиксированным временем окончания.
Подобная процедура используется и в настоящей диссертации. #
Выделим также вопрос о реализуемости множества успешной разрешимости задачи наведения посредством метода программных итераций. В этой области в работах А.Г. Ченцова [72],[86], и В.И. Ухоботова [79], [80] получены результаты, касающиеся условий, при которых метод программных итераций стабилизируется после конечного и небольшого числа итераций. Как говорилось выше, обычно возможно построение лишь некоторого числа итераций. В связи с этим возникает вопрос о реализации метода экстремального сдвига на нестабильное множество. Случай, когда множество, на которое осуществляется прицеливание близко к множеству успешной разрешимости в инфинитезимальном смысле, рассматривался в статье В.Н. Ушакова и Я.А. Латушкина [82], где введено понятие дефекта стабильности.
В диссертации исследуются вопросы структуры решения дифференциальных игр, понимаемого как множество успешной разрешимости задачи наведения. Также рассматривается вопрос о характере сходимости метода программных итераций и построении позиционных стратегий, приближающих (в смысле гарантированного результата) оптимальную.
Цель работы
Исследование следующих свойств множества успешной разрешимости игровой задачи наведения: непрерывная зависимость сечений от времени, связность сечений; преобразование игровых задач наведения на цилиндрическое множество к задачам наведения на основание цилиндра; построение аналогов метода экстремального сдвига Н.Н. Красовского и А.И. Субботина с использованием прицеливания на нестабильное множество.
Методы исследования «
В основе работы лежат методы теории управления и теории позиционных дифференциальных игр, скользящих режимов управления и конструкции метода программных итераций. Используются элементы общей топологии и теории меры.
Научная новизна
Построен пример дифференциальной игры, в которой сечения разрывно зависят от времени и являются несвязными (целевое множество при этом связно). Получены достаточные условия непрерывной зависимости сечений от времени и связности сечений. Предложен метод построения дифференциальной игры с заданным множеством успешной разрешимости. Рассмотрена задача наведения автономной конфликтно управляемой системы на цилиндрическое множество. Этой задаче сопоставлена задача наведения на основание цилиидра преобразованной системы. Доказано, что последовательности множеств, построенные по методу программных итераций для обеих задач, совпадают. Исследован характер сходимости метода программных итераций в случае компактного целевого множества. На этой основе построены аппроксимативные аналоги правила экстремального сдвига Н.Н. Красовского и А.И. Субботина и экстремального управления с поводырем. Результаты диссертационной работы являются новыми.
Теоретическая и практическая значимость
Полученные в работе теоретические результаты дают представление о геометрической структуре множества успешной разрешимости в игровой задаче управления и о характере сходимости метода программных итераций. Предложенный в работе метод построения дифференциальной игры с заданным множеством успешной разрешимости задачи наведения позволяет исследовать структуру « множества в нелинейной дифференциальной игре сближения-уклонения. Практическая ценность работы состоит в том, что полученные свойства могут быть применены при изучении различных методов решения задач игрового управления. В частности, решение игровой задачи наведения автономной конфликтно-управляемой системы на цилиндрическое множество при весьма общих предположениях может быть сведено к решению задачи наведения преобразованной системы на основание цилиндра, благодаря тому, что доказано совпадение последовательностей, построенные по методу программных итераций для обеих задач. Упомянутое свойство совпадения последовательностей может быть использовано при t построении управления в задачах уклонения от множества, в которых ограничено число переключений управления одного из игроков. Построены аппроксимативные аналоги правила экстремального сдвига, для реализации которых не требуется построение множества успешной разрешимости, а достаточно построения некоторого приближения к нему.
Апробация работы
Основные результаты диссертации докладывались на международном семинаре "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби" (Екатеринбург, 22-26 июня 2005 года), международной конференции по дифференциальным уравнениям и динамическим системам (Суздаль, 10-15 июля 2006 года), IX съезде по теоретической и прикладной механике (Нижний Новгород, 22-28 августа 2006 года), международной конференции "Моделирование и исследование устойчивости динамических систем" (Киев, 22-25 мая 2007 года), международной конференции по математической теории управления и механике (Суздаль, 22-27 июня 2007 года), Symposium on Functional Differential Equations (September, 11-15, Ariel, Israel), межрегиональной конференции "Современные математические методы и информационные технологии в образовании" (Тюмень, 14-15 апреля,
2005); семинарах отдела управляемых систем и отдела динамических систем ИММ УрО РАН, семинаре кафедры диференциальных уравнений Удмуртского государственного университета, семинаре отдела оптимизации управляемых процессов Института кибернетики им. В.М. Глушкова НАН Украины.
Публикации
Основной материал диссертации опубликован в работах [1]-[12], [108]. В совместных с А.Г. Ченцовым работах [2]-[6], [108] А.Г. Ченцову принадлежат постановки задач и некоторые идеи доказательств.
Структура и объем работы
Диссертация состоит из введения, 3 глав и списка литературы. Главы разбиты на параграфы. Нумерация глав, параграфов и утверждений сквозная. Нумерация формул тройная. Объем работы 118 страниц, библиография содержит 141 наименований.
1. Лвербух Ю.В., Об одном аппроксимативном аналоге правила экстремального сдвига Н.Н. Красовского и А.И. Субботина // Дифференциальные уравнения, 2007, Т. 43, №8, С. 1011-1018.
2. Авербух Ю.В., Ченцов А.Г., К вопросу о приближенной реализации сечений множеств позицонного поглощения в одной игровой задаче управления // Вестник УГТУ-УПИ (Серия радиотехническая), 2005, № 17 (69), С. 217-230.
3. Авербух Ю.В., Ченцов А.Г., О характере сходимости в одной процедуре метода программных итераций // Труды семинара "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби", 2006, Т. 1, С. 166-175.
4. Авербух Ю. В., Ченцов А. Г., Об одной оценке, связанной с методом программных итераций / / Межрегиональная конференция "Современные математические методы и информационные технологии в образовании". Тезисы докладов, Тюмень, 2005, С. 3-5.
5. Авербух Ю. В., Ченцов А. Г., Некоторые свойства процедур, связанных с методом программных итераций // Дифференциальные уравнения и процессы управления (электронный журнал), № 3, 2005, С. 38-62.
6. Авербух Ю.В., Чепцов А.Г., Некоторые конструкции, связанные с методом программных итераций в нелинейных задачах управления // Аннотации докладов IX Съезда по теоретической и прикладной механике, Т. 1, С. 8-9.
7. Авербух Ю.В., К вопросу о структуре множества позиционного поглощения в игровой задаче наведения // Проблемы управления и информатики, № 3, 2006, С. 5-9.
8. Авербух Ю.В., Один метод построения конфликтно-управляемых систем с заданными свойствами // Тезисы международной конференции по дифференциальным уравнениям и динамическим системам. Владимир, 2006, С. 16-18.
9. Авербух Ю.В., Об одной модификации правил экстремального сдвига Н.Н. Красовского и А.И. Субботина // Дифференциальные уравнения и процессы управления (электронный журнал), 2006, №4, С. 30-49.
10. Авербух Ю. В., О задаче наведения автономной конфликтно-управляемой системы на цилиндрическое множество // Тезисымеждународной конференции "Моделирование и исследование устойчивости динамических систем". Киев, 2007, С. 3-4.
11. Аграчев А.А., Сачков Ю.Л., Геометрическая теория управления. М.: Физматлит. 2005. 392с.
12. Айзеке Р., Дифференциальные игры. М.: Мир. 1967. 480 с.
13. Альбрехт. Э. Г., Построение приближенных решений некоторых квазилинейных дифференциальных игр // Труды Института математики и механики УрО РАН, 2000, Т. 6, М. С. 27-38.
14. Барабанова (Субботина) Н.Н., Субботин А.И., О классах стратегий в дифференциальных играх уклонения от встречи // Прикладная математика и механика, 1971. Т.35, №3. С.385-392.
15. Батухтин В. Д., Экстремальное прицеливание в нелинейной игре сближения // Доклады АН СССР, 1972. Т. 207, №1. С. 11-14.
16. Биллингсли Я., Сходимость вероятностных мер. М.: Наука. 1977. 352с.
17. Борисович Ю.Г., Гельман Б.Д., Мышкис А.Д., Обуховский В.В. Введениев теорию многозначных отображений и дифференциальных включений: М. КомКнига. 2005.216 с
18. Брыкалов С.А., Конфликтно управляемые системы и дифференциальные включения // Дифефренциальная уравнения, 2002. Т.38, № 3. С.298-304.
19. Брыкалов С.А., Непрерывные стратегии в дифференциальных играх // Дифефренциальная уравнения, 2002. Т.38, № 4. С. 453459.
20. Буслинский А.В., Ширяев А.Н., Теория случайных процессов. М.: Физматлит. 2003. 400с.
21. Варга Дж., Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука. 1977. 624 с.
22. Гамкрелидзе Р. В., Основы оптимального управления. Тбилиси: Издательство Тбилисского университета. 1977. 254 с.
23. Григоренко H.JI., Дифференциальные игры преследования несколькими объектами. М.: Издательство МГУ. 1983. 79 с.
24. Гусятников П.В., Половинкин Е.С., Простая квазилинейная задача преследования // Прикладная математика и механика, 1980. Т. 44, № 5, С. 771 782.
25. Дятлов В.П., Ченцов А.Г., Управление с гибкими коррекциями при ограничении на общее число перключений // Гагаринские научные чтения по космонавтике и авиации. 1987. Сборник научных трудов, М.: Наука, 1988, С. 70-75.
26. Зеликин М.И., Гессиан решения уравнения Гамильтона-Якоби в теории экстремальных задач // Математический сборник, 2004. Т.195, № 6. С.57-70.
27. Жуковский В.И., Чикрий А.А., Линейно-квадратичные дифференциальные игры. Киев: Наукова Думка. 1994. 320 с.
28. Клейменов А. Ф., Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. 1993. 185 с.
29. Красовский Н.Н., Игровые задачи о встрече движений. М.: Наука. 1970. 420 с.
30. Красовский Н.Н., Дифференциальная игра сближения-уклонения -I // Известия АН СССР (Техническая кибернентика), 1973, №2, С. 3-18.
31. Красовский Н.Н., Дифференциальная игра сближения-уклонения -II // Известия АН СССР (Техническая кибернентика), 1973, №3, С. 22-42.
32. Красовский Я.Я., Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука. 1985. 624 с.
33. Красовский' Н.Н., Лукоянов Н.Ю., Задача конфликтного управления с наследственной информацией // Прикладная математика и механика, 1996. Т.60, №6, С.885-900.
34. Красовский Я. Н., Субботин А. И., Альтернатива для игровой задачи движения // Прикладная математика и механика, 1970, Т. 34, М, С. 1005-1022.
35. Красовский Я. Н., Субботин А. И., Аппроксимация в дифференциальной игре // Прикладная математика и механика, 1973, Т. 37, №2, С. 197-204.
36. Красовский Я.Я., К задаче унификации дифференциальных игр // . Доклады АН СССР, 1976, Т.226, № 6. С.1260-1263.
37. Красовский Я.Я.,. Унификация дифференциальных игр // Труды Института математики и механики УНЦ АН СССР, Свердловск, 1977. №24: Игровые задачи управления, С. 32-45.
38. Красовский Н.Н., Субботин А. И., Позиционые дифференциальные игры. М.: Наука. 1974. 455 с.
39. Кряжимский А.В., К теории позиционных дифференциальных *игр сближения-уклонения // Доклады АН СССР, 1978. Т. 239, №4. С. 779-782.
40. Кряжимский А. В., Об устойчивом позиционном управлении в дифференциальных играх // Прикладная математика и механика, 1978. Т. 42, №6. С. 963-968.
41. Кряжимский А. В., О некоторых стабильных мостах для линейных управляемых систем // Оптимальное управление системами с неопределенной информацией, ИММ УНЦ АН СССР. Свердловск". 1980. С. 35-41.
42. Куржанский, А. В., Варайя П.,, О проблеме достижимости при постоянно действующих возмущениях // Доклады РАН, 2000. Т. 372, №4. С. 446-450.
43. Ледяее Ю.С., Мищенко Е.Ф., Экстремальные задачи в теории дифефренциальных игр // Труды МИАН, 185, 147-170, 1988.
44. Лукояное Н.Ю., Стратегии прицеливания в направлении инвариантных градиентов // Прикладная математика и механика, 2004. Т.68, Ш. С.629-643.
45. Меликян А.А., Цена игры в линейной дифференциальной игре сближения // Доклады АН СССН, 1977, Т. 237, №3, С. 521-524.
46. Меликян А.А., Чёрноусько Ф.Л., Некоторые минимаксные задачи управления с неполной информацией // Прикладная математика и механика, 1971, Т. 35, № 6, С. 952-961.
47. Мищенко Е. Ф, Задачи преследования и уклонения от встречи в теории дифференциальных игр // Изв. АН СССР. Техн. кибернетика, 1971, №5, С. 3-9.
48. Неве Ж., Математические основы теории вероятностей. М.: Мир. 1969. 312с.
49. Никольский М.С., Об альтернированном интеграле JI.C. Понтрягина // Математический сборник, 1981, Т. 116, №1, С. 136-144.
50. Никольский М. С., Нестационарные линейные дифференциальные игры // Кибернетика, 1970, №1, 98-102.
51. Никольский М. С., О нижнем альтернированном интеграле Понтрягина в линейных дифференциальных играх преследования // Математический сборник, 1985, Т. 128(170) № 1), 35-49.
52. Никольский М.С., О применении первого прямого метода Понтрягина в играх преследования // Изв. АН СССР, Техническая кибернетика, Т. 10, 51-56, 1972.
53. Осипов Ю.С., Дифференциальные игры для систем с последействием // Доклады АН СССР, 1971. Т. 196, № 4. С.779-782.
54. Остапенко В.В., Операторные конструкции и вольтерровские отображения в дифференциальных. играх // Кибернетика и системный анализ, 2002. № 5. С.95-99.
55. Пацко В. С., Поверхности переключения в линейных дифференциальных играх // Современная математика и ее приложения, Тбилиси, 2005. Т. 23, С. 79-122.
56. Петров Н.Н., Об одной задаче преследования группы убегающих // Автоматика и телемеханика, 1996. №6. С.48-54.ф
57. Петросян Л. АДифференциальные игры преследования. JL: Изд-во Ленинградского государственного университета. 1977. 224с.
58. Понтрягин JI.C., О линейных дифференциальных играх. I // Доклады АН СССР, 1967 Т. 174, №6.
59. Понтрягин JI.C., О линейных дифференциальных играх. II // Доклады АН СССР, 1967, Т. 175, №4.
60. Понтрягин Л. С., Мищенко Е.Ф., Линейные дифференциальные игры // Доклады АН СССР, 1967. Т. 174, № 1, С. 27-29.
61. Понтрягин Л. С., Мищенко Е.Ф., Задача об уклонении от встречи в линейных 1 дифференциальных играх // Дифференциальные уравнения, 1971, Т. 7, №3. С. 436-445.
62. Понтрягин Л. С., Мищенко А. С., Линейная дифференциальная игра преследования (аналитическая теория) // Математический сборник, 1986, Т. 131(173) № 2,131-158.
63. Пшеничный Б.П., Структура дифференциальных игр // Доклады АН СССР, 1969. Т. 184, №2. С. 285-287.
64. Пшеничный Б.Н., Сагайдак М.И., О дифференциальных играх с фиксированным временем // Кибернетика, 1970. № 2, С.54-63.
65. Рузаков В.Я., Ченцов А.Г., Об одной линейной дифференциальной игре сближения с невыпуклым целевым множеством / / Дифефренциальная уравнения, 1984. Т.20, № 4. С. 593-597.
66. Субботина Н.Н., Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифефренциальная уравнения, 1983. Т.19, № И. С. 1890-1896.
67. Субботина Н.Н., Метод характеристик Коши и обобщенныерешения уравнения Гамильтона-Якоби-Беллмана // Доклады АН СССР, 1991. Т.320, № 3. С. 556-561.
68. Субботина Н.Н., Субботин А.И., Игровая задача управления при неполной информации // Известия АН СССР. Техническая кибернетика, 1977. № 5. С.14-23.
69. Субботин А.И., Обобщенные решения дифференциальных уравнений 1-го порядка. Ижевск: РХД. 2003. 336 с.
70. Субботин А.И., Ченцов А.Г., Оптимизация гарантии в задачах управления. М.: Наука. 1981. 288с.
71. Субботин А.И., Ченцов А.Г., Итерационная процедура построения минимаксных и вязкостных решений уравнений Гамильтона-Якоби и ее обобщения // Труды МИ РАН, 1999. Т. 224. С. 311-334.
72. Субботин А.И., Экстремальные стратегии в дифференциальных играх с полной памятью // Доклады АН СССР, 1972. Т.206, № 3. С.552-555.
73. Субботин А.И., Дифференциальные игры с полной памятью // Экстремальные стратегии в позиционных дифференциальных играх: Сб. ст. Свердловск, 1974, С.211-223.
74. Тарасъев A.M., Аппроксимационные схемы построения минимаксных решений уравнения Гамильтона-Якоби / / Прикладная математика и механика, 1994, Т. 58, 1, С 2236.
75. Третьяков В. Е., К теории стохастических дифференциальных игр // Доклады АН СССР , 1983. Т. 269, №3. С. 1049-1053.
76. У хоботов В. И., Построение стабильного моста для одного классалинейных игр // Прикладная математика и механика, 1977. Т. 41, №2, С. 358-364.
77. У хоботов В. И., К построению стабильного моста в игре удержания // Прикладная математика и механика, 1981. Т. 45, №2, С. 237-240.
78. У хоботов В. И., К вопросу об окончанию игры за первый момент поглощения //Прикладная математика и механика, 1984. Т. 48, №6, С. 892-897.
79. Ушаков В. Я, К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Известия АН СССР. Техническая кибернетика, 1980. Т. 219, №4. С. 29-36.
80. Ушаков В.Н., Латушкин Я.А., Дефект стабильности множеств в игровых задачах управления // Труды ИММ УрО РАН, 2006, Т. 12, № 2, С. 178-194.
81. Халмош Я, Теория меры. М.: Издательство иностранной литературы. 1953. 282с.
82. Хеннекен П.Л., Тортра А., Теория вероятностей и ее приложения. М.: Наука. 1974. 472с.
83. Ченцов А.Г., О структуре одной игровой задачи сближения // Доклады АН СССР, 1975, Т. 224, №6, С. 1272-1275.
84. Ченцов А.Г., Об игровой задаче сближения в заданный момент времени // Математический сборник, 1976, Т. 99, №3, С.394-420.
85. Ченцов А.Г., К игровой задаче наведения // Доклады АН СССР, 1976, Т. 226, №1, С. 73-76.
86. Ченцов А.Г., К вопросу об итерационной реализации неупреждающих многозначных отображений // Известия ВУЗов. Математика, 2000, №3, С. 66-76.
87. Чепцов А.Г., Метод программных итераций в абстрактных задачах управления // Прикладная математика и механика, 2004, Т. 68, №4, С. 573-585.
88. Ченцов А.Г., Метод программных итераций для дифференциальной игры сближения-уклонения j j Депонировано в ВИНИТИ 1933-79Деп, 1979, Свердловск, 103 стр.
89. Ченцов А.Г., О дифференциальных играх с ограниченим на число коррекций, I // Депонировано в ВИНИТИ 5272-80Деп., 1979, Свердловск, 53 стр.
90. Ченцов А.Г., О дифференциальных играх с ограничением на число коррекций, II // Депонирована в ВИНИТИ №5406-80Деп., 1980, Свердловск, 56 стр.
91. Ченцов А.Г., Неупреждающие многозначные отображения и их построение с помощью метода программных итераций // Дифференциальные уравнения, 2001, Т. 37, № 4, С. 470-480.
92. Ченцов А.Г., Неупреждающие многозначные отображения и их построение с помощью метода программных итераций, II // Дифференциальные уравнения, 2001, Т. 37, № 5, С. 679-688.
93. Ченцов А.Г., К вопросу о согласованности различных версий метода программных итераций // Доклады РАН, 2000. Т.372, Я2 5. С.600-603.
94. Ченцов А.Г., О некоторых вопросах структуры дифференциальных игр сближения-уклонения // ИММ УНЦ АН СССР. Свердловск, 1979. Депонировано в ВИНИТИ №205-80Деп., 44 е.
95. Ченцов А.Г., О реализации метода программных итераций в пространстве мультифункций // Доклады РАН, 2002. Т.385, № 2. С. 168-171.
96. Ченцов А.Г., Об альтернативе в классе квазистратегий для дифференциальной игры сближения-уклонения // Дифференциальные уравнения, 1980. Т.16, № 10. С.1801-1808.
97. Чикрий А.А., Конфликтно управляемые процессы. Киев: Наукова думка. 1992. 384 е.
98. Чистяков С.В., К решению игровых задач преследования // Прикладная математика и механика, 1977. Т. 41, J№ 5, С. 825-832.
99. Чистяков С.В., Программные итерации и универсальные е-стратегии в позиционной дифференциальной игре // Доклады АН СССР, 1991, Т. 319, №6. С.1333-1335.
100. Чистяков С.В., О функциональных уравнениях в играх сближения в заданный момент времени // Прикладная математика и механика, 1982, Т. 46, №5.
101. Эдварде Р., Функциональный анализ. Теория и приложения. М.: Мир. 1969. 1072с.
102. Энгелькинг Р., Общая топология. М.: Мир. 1986. 750 с.
103. Aubin J.-P., Viability theory. Boston: Systems k Control: Foundations k Applications. Birkhauser Boston, Inc. 1991.543 p
104. Averboukh Yu.V., Chentsov A.G, On Character of Convegence of the Programmed Iteration Method for Control Problem with Elements of
105. Cardaliaguet P., A differential game with two players and one target // SIAM Journal on Control and Optimization, 1996, Vol. 34, N. 4, Pp. 1441-1460.
106. Cardaliaguet P., Nonsmooth semi-permeable barriers, Isaacs' equation, and application to a differential game with one target and two players // Applied Mathematics and Optimization, Vol. 36, N. 36, Pp. 125-146.'
107. Chen Y. H., Leitmann G., Robustness of uncertain systems in the absence of matching assumptions // International Journal of Control, Vol. 45, Pp. 1527-1542.
108. Chentsov A.G., On a duality of different versions of the programmed iteration method, 1 j I Functional Differential Equations, Vol. 9, 2002, N. 3-4, Pp. 289-314.
109. Chentsov A.G., On a duality of different versions of the programmed iteration method,'2 // Functional Differentional Equations, Vol. 10, N. 1-2, 2003, Pp. 121-161.
110. Chentsov A.G., Morina S.I, and Zobnin B.B., On some constructions of control by systems with a varying structure // Mathematics and computers in simulation, 1999, Vol. 49, Pp. 319-334.
111. Crandall G., Lions P.L., Viscosity Solutions of Hamilton-JacobiEquations // Transactions of the American Mathematical Society, 1983, Vol. 277, No. 1, Pp. 1-42.
112. Elliot R.J., Kalton N., The Existence of Value for Differential Games // Memoir of the American Mathematical Society, 1972, Vol. 126: iv + 67.
113. Evans L.C., Sougandinis P.E., Differential Games and representation formulas for solutions of Hamilton- Jacobi-Bellman equations // Indiana University Mathematics Journal, 1984, Vol.33, Pp 773-797.
114. Evans L. C., Ishii H., Differential games and nonlinear first order PDE on bounded domains // Manuscripta mathematica, 1984, Vol. 49, N. 2, Pp. 109-139.
115. Fleming W. H., The convergence problem for differential games // Journal of Mathematical Analysis and Applications, 1961. Vol. 3, N. 1. Pp. 102-116.
116. Friedman A., Differential Games. N. Y.: Wiley Intersci. 1971. 350p.
117. Krasovskii N.N., Chentsov A.G., On the design of differential games. I // Problems of Control and Information Theory, 1977, Vol.6, N. 5-6. Pp.381-395.
118. Krasovskii N.N.,.Chentsov A.G., On the design of differential games. II// Problems of Control and Information Theory, 1979, Vol.9, N. 1. Pp. 3-11.
119. Krasovskii N.N., Subbotin A.I., Game-Theoretical Control Problems. New York: Springer. 1988. 517 p.
120. Leitmann G., On the efficacy of nonlinear control in uncertain linear systems // Journal of Dynamic Systems, Measurement and Control, 1981, Vol. 103, Pp. 95-102.
121. Lewin J., Differential games. (English summary). Theory and methods for solving game problems with singular surfaces. London: Springer-Verlag London, Ltd. 1994. xx+242 pp.
122. Lions P.-LSouganidis P. E., Differential Games, Optimal Control and Directional Derivatives of Viscosity Solutions of Bellman's and Isaacs' Equations // SIAM Journal on Control and Optimization, Vol. 23,1. 4 Pages 566-583.
123. Mitchell.M., BayenA.M., Tomlin C.J., A Time-Depend Hamilton-Jacobi Formulation of Reachable Sets for Continuous Dynamic Games // IEEE Transaction on Automatic Control, 2005, Vol. 50, N. 7, Pp. 947-957.
124. Roxin E., Axiomatic approach in differential games // Journal of Optimization Theory and Application, 1969, Vol. 3, N. 3, Pp. 153-163.
125. Ryll-Nardzewski С., The theory of pursuit and evasion // Advances in game theory, Annals of Mathematics Studies, Princeton Univ. Press, 1964, Pp. 113-126.
126. Soravia P, Я00 Control of Nonlinear Systems: Differential Games and viscosity Solutions // SIAM Journal on control and optimization, 1996, Vol. 34; N. 3, Pp. 1071-1097.
127. Varaiya P., On the existence of solutions to a differential game // SIAM on Journal Control and Optimization, 1967. Vol. 5, Pp. 153-162.
128. Varaiya P., J. Lin, Existence of saddle points in differential games // SIAM Journal on Control and Optimization, 1969. Vol. 7, N. 1. Pp. 141-157.