Расширение задач на программный максимин в классе конечно-аддитивных мер тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Бакланов, Артем Павлович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Диссертация по математике на тему «Расширение задач на программный максимин в классе конечно-аддитивных мер»
 
Автореферат диссертации на тему "Расширение задач на программный максимин в классе конечно-аддитивных мер"

005060037

БАКЛАНОВ Артем Павлович

РАСШИРЕНИЕ ЗАДАЧ НА ПРОГРАММНЫЙ МАКСИМИН В КЛАССЕ КОНЕЧНО-АДДИТИВНЫХ МЕР

01.01.09 — дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ диссертации па соискание ученой степени кандидата физико-математических паук

3 О МАЙ 2013

Екатеринбург — 2013

005060037

Работа выполнена в отделе управляемых систем ФГБУН Института математики и механики им. H.H. Красовского Уральского отделения РАН.

Научный руководитель: Чепцов Александр Георгиевич,

доктор физико-математических паук, член-корреспондент РАН. профессор.

Официальные оппоненты: Ухоботов Виктор Иванович.

доктор физико-математических паук, профессор, зав. кафедрой теории управления и оптимизации Челябинского государственного университета;

Лебедев Павел Дмитриевич, кандидат физико-математических паук, научный сотрудник отдела динамических систем Института математики и меха-пики УрО РАН.

Ведущая организация: ФГБУН Математический иистшпут им.

В. А. Стеклова РАН, г. Москва.

Защита состоится 19 нюня 2013 года в 14 часов па заседании диссертационного совета Д 004.006.04 по защите докторских и кандидатских диссертации при Институте математики и механики УрО РАН но адресу: 620990, Свердловская область, г. Екатеринбург, ул. Софьи Ковалевской, д. 16.

С диссертацией можно ознакомиться в библиотеке Института математики и

механики УрО РАН.

Автореферат разослан 17 мая 2013 года.

Ученый секретарь диссертационного совета, доктор физико-математических наук, с. н. с.

В.Д. Скарии

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертация посвящена построению корректных расширений игровых задач с ограничениями асимптотического характера. В частности, рассматриваются игровые задачи программного управления линейной системой с возможной разрывностью в коэффициентах при управляющем воздействии. В качестве обобщенных элементов используются конечно-аддитивные меры ограниченной вариации; соответствующие компакты упомянутых мер определяются в виде подпространств пространства, сопряженного пространству ярусных функций (определяемых как равномерные пределы ступенчатых функций), в оснащении *-слабой топологией. Конструируемые обобщенные игровые задачи (на макси-мин) определяют асимптотику реализуемых значений максимина при ослаблении стандартных ограничений. Исследуется постановка, в которой ограничения на выбор управления изначально имеют асимптотический характер.

Актуальность темы. В современном мире теория управления играет важную роль. Одна из проблем теории управления состоит в определении оптимального управления в условиях действия помехи, что типично для задач управления техническими системами. Наиболее плодотворным в решении такой проблемы является игровой подход, в котором выбор помехи осуществляет второй (зачастую фиктивный) игрок. Развитие математической теории задач конфликтного управления прежде всего связано с работами H.H. Красовского, Л.С. Понтрягина, Б.Н. Пшеничного, А.И. Субботина. Первые постановки дифференциальных игр были рассмотрены Р. Айзсксом.

Существенное влияние на теорию управления и теорию дифференциальных игр оказали работы Р.В. Гамкрслидзе, A.B. Кряжимского, A.B. Куржан-ского, Е.Ф. Мищенко, Ю.С. Осипова, Ф.Л. Черноусько, J.P. Aubin, Т. Basar, Р. Bernhard, J.V. Breakwell, L. Berkovitz, M.G. Crandall, R.J. Elliot, A. Friedman N.J. Kalton, G. Leitmann, P.L. Lions, C. Ryll-Nardzcwski, P. Varaiya, J. Warga.

Большой вклад в теорию управления и теорию дифференциальных игр внесли Э.Г.Альбрехт, В.Д. Батухтин, С.А. Брыкалов, Н.Л. Григоренко, П.Б. Гусятников, М.И. Зеликин, А.Ф. Клейменов, Н.Ю. Лукоянов, A.A. Меликян, М.С. Никольский, В.В. Остапенко, B.C. Пацко, H.H. Петров, Л.А. Петросян, Е.С. Половинкин, H.H. Субботина, A.M. Тарасьев, A.A. Толстоногов, В.Е. Третьяков, В.И. Ухоботов, В.Н. Ушаков, А.Г. Ченцов, A.A. Чикрий, C.B. Чистяков, M. Bardi, E.N. Barron, A. Blaquiere, I. Capuzzo Dolcetta, M. Falcone, L.C. Evans, R. Jensen, M. Ishii, J. Lewin, P. Soravia, P.E. Souganidis и многие другие ученые.

Задачам импульсного управления посвящены работы H.H. Красовского, A.B. Куржанского, Р. Винтера, В.И. Гурмана, М.И. Гусева, В.А. Дыхты и О.Н. Самсошок, С.Т. Завалищина и А.Н. Сесекина, A.M. Самойленко, Б.М. Миллера, В.М. Тихомирова, Т.Ф. Филипповой, А.Г. Ченцова, J. Warga, A. Halanay, D. Wexler и многих других ученых.

Конструкции расширений задач оптимального управления с геометрическими ограничениями рассматривались многими авторами, отметим здесь исследования Р.В. Гамкрелидзе, L.C. Yong, J. Warga. Конструкции расширений играют важную роль в игровых задачах управления (см., например, [6, 9]). Отметим, что для построения методов решения позиционных дифференциальных игр использовались результаты, полученные для игровых задач программного управления. В упомянутых игровых задачах программного управления применялись конструкции расширений на базе управлений-мер, что сыграло важную роль при построении вспомогательных программных конструкций для решения нелинейных дифференциальных игр и при исследовании условий регулярности, которые позволяют осуществлять прямой переход от (более простых) игровых задач программного управления к построению процедур управления по принципу обратной связи. Заметим, что в регулярных дифференциальных играх программный максимин определяет цену игры (см. [5]). Данное направление получило развитие в работах H.H. Красовского и его учеников. Важным этапом в исследованиях являлось построение обобщенных игровых задач программного управления, в том числе и при фазовых ограничениях. В последнем случае часто возникает скользящий режим управления, при котором фазовые ограничения соблюдаются «на грани фола». Напомним здесь же, что в определении фундаментального свойства стабильности H.H. Красовским было предложено использовать обобщенные реакции на обычные и, более того, постоянные управления одного из игроков; наряду с правилом экстремального сдвига это сыграло важную роль в доказательстве фундаментальной теоремы H.H. Красовского и А.И. Субботина об альтернативе в нелинейной дифференциальной игре. Заметим, что расширение «совокупной» игровой задачи может не сводиться к сочетанию индивидуальных расширений игроков; соответствующие примеры, касающиеся вспомогательных программных конструкций для позиционных дифференциальных игр, приведены в [10, 11].

Идеи, связанные по существу с конструкциями расширений, использовались и в других разделах математики (см., например, [1-3] в связи с задачами математического программирования). В качестве одного из самых известных ва-

риантов конструкций расширений следует отметить использование смешанных стратегий в антагонистических играх, благодаря чему в широком классе игровых задач удается решить проблему существования седловой точки (см. [7]).

В настоящей работе целенаправленно исследуются вопросы построения корректных расширений абстрактных игровых задач программного управления с ограничениями асимптотического характера, которые, в частности, могут возникать при ослаблении стандартных ограничений или быть заданными изначально. Данные построения связаны с постановками, в которых истинное качество процесса реализуется при соблюдении ограничений «на грани фола» (с высокой, но все же конечной степенью точности).

Конструкции расширения в классе конечно-аддитивных мер использовались в работах Е.Г. Белова, А.И. Жданка, А.И. Короткого, В.П. Серова, С.И. Тарасовой, А.Г. Ченцова, Ю.В. Шапарь. В связи с расширением задач с ограничениями асимптотического характера отметим работы [12, 13].

Большой вклад в развитие конечно-аддитивной теории меры внесли работы: Г. Гильдебрандта, Н. Данфорда и Дж.Т. Шварца, JI.B. Канторовича, Г.М. Фихтенгольца, Е. Хыоитта и К. Иосиды, Б. Pao К. и Б. Pao М.

Цель работы. Построение расширений абстрактных задач программного управления на максимин, реализуемых в соответствующих классах конечно-аддитивных мер. Построение асимптотики значений программного максимина в классе обычных управлений при ослаблении стандартных ограничений. Исследование задачи на программный максимин в классе импульсов управления с «исчезающе малой» продолжительностью.

Методы исследования. Используются методы теории управления, математического программирования, функционального анализа, общей топологии, теории игр, теории меры.

Научная новизна. Для абстрактных игровых задач с различными ограничениями импульсного характера и режимами управления построены расширения в подходящих классах конечно-аддитивных мер. Данный подход позволяет решить проблему компактификации пучка траекторий и области достижимости. Другим важным следствием данного подхода является возможность исследовать асимптотику значений (реализуемого) максимина в случаях, когда каждое упомянутое значение соответствует множеству-элементу некоторой базы фильтра (в терминах упомянутых баз фильтров задаются ограничения асимптотического характера). Ограничения асимптотического характера в виде баз фильтров могут, в принципе, возникать по разным причинам. Например, это может

происходить при ослаблении стандартных ограничений, задаваемых требованием принадлежности множеству некоторой «оценки» возможного решения. При этом реализуется семейство множеств допустимых обычных решений, отвечающих каждое соответствующей «степени» ослабления стандартного ограничения. В других случаях «асимптотические ограничения» задаются изначально, а их соблюдение приводит к реализации предельных значений функции стоимости. В рамках предполагаемого подхода, связанного с расширением исходной задачи, удается исследовать асимптотику реализуемых значений максимина в случае, когда игровая задача не обладает устойчивостью при ослаблении исходной системы стандартных ограничений.

Для одного конкретного варианта измеримого пространства с полуалгеброй множеств (а именно для пространства-стрелки) дано конкретное описание конечно-аддитивных мер, реализующих вспомогательное множество притяжения в пространстве обобщенных элементов, что позволяет находить асимптотику реализуемых значений максимина (асимптотический максимин).

Теоретическая и практическая значимость. Для игровых задач на максимин (с различными типами ограничений на выбор программного управления игроками) были реализованы конструкции расширения в классе конечно-аддитивных мер, что позволяет в упомянутых задачах корректно описать эффекты, возникающие при условиях разрывности в коэффициентах при управлении и имеющие смысл произведения разрывной функции на обобщенную. Результаты работы представляются полезными для исследования конкретных постановок игровых задач управления линейными системами с импульсными ограничениями и разрывностью в коэффициентах при управляющих воздействиях. Соответствующие примеры таких постановок доставляют инженерные задачи, связанные с управлением техническими системами при наличии ресурсных ограничений. Ограничения такого типа возникают в задачах космической навигации. При этом вышеупомянутая разрывность может, в некотором естественном смысле, отражать процесс резкого изменения массы управляемого объекта. В работе построены корректные расширения абстрактных задач управления на максимин, в которых присутствуют ограничения асимптотического характера, которые могут быть порождены ослаблением традиционных ограничений либо возникать изначально (пример такого рода задач рассмотрен в четвертой главе).

Структура и объем работы. Диссертация состоит из введения, 4 глав и списка литературы. Главы разбиты на параграфы. Нумерация глав, параграфов и утверждений сквозная. Нумерация формул тройная. Объем работы 108

страниц и включает 5 рисунков, 1 таблицу. Библиография содержит 81 наименование.

Апробация работы. Основные результаты диссертации докладывались на следующих конференциях: международная школа-конференция «Современные методы качественной теории краевых задач — Понтрягинские чтения-ХХ1» (г. Воронеж, 3-9 мая 2011); 42-я всероссийская молодежная школа-конференция «Современные проблемы математики» (г. Екатеринбург, 30 января-6 февраля 2011); 43-я всероссийская молодежная школа-конференция «Современные проблемы математики» (г. Екатеринбург, 29 января-5 февраля 2012); всероссийская научная конференция с международным участием «Математическая теория управления и математическое моделирование» (г. Ижевск, 14-18 мая 2012); 44-я всероссийская молодежная школа-конференция «Современные проблемы математики» (г. Екатеринбург, 27 января-2 февраля 2013).

Результаты диссертации докладывались на семинарах отдела управляемых систем ИММ УрО РАН, на семинаре кафедры теории управления и оптимизации ЧелГУ, на семинаре отдела оптимизации управляемых процессов Института Кибернетики им. В.М. Глушкова HAH Украины.

Публикации. Основной материал диссертации опубликован в работах [14-23]. В совместных с А.Г. Ченцовым работах [15-17] А.Г. Ченцову принадлежат постановки задач, общая схема исследования и некоторые идеи доказательств; конкретные доказательства основных положений проведены автором диссертации самостоятельно.

Личный вклад автора. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Все представленные в диссертации результаты получены лично автором, за исключением вспомогательных результатов, используемых в доказательствах, которые приводятся в тексте диссертации для полноты изложения и специально отмечены.

СОДЕРЖАНИЕ РАБОТЫ

Во введении дается краткий обзор литературы, относящейся к игровым задачам наведения, определяется цель работы, излагаются основные результаты диссертации.

Первая глава состоит из одиннадцати разделов. Она является вводной; в ней приводятся обозначения и определения, а также простые примеры линейных задач управления, мотивирующие построение конструкций расширения. Для

таких примеров показаны варианты корректных расширений соответствующих задач управления. При расширении задач программного управления линейными системами в классе конечно-аддитивных (к.-а.) мер мы переходим от обычных траекторий к обобщенным, определяемым следующим образом:

Фр{1) = Ф(Мо)яо +

$(í, СЖСМ«Ю € Л Vi € [ío, i?o], (1)

где А есть соответствующее задаче множество обобщенных управлений, которое является компактом в *-слабой топологии пространства к.-а. мер ограниченной вариации, Ф — фундаментальная матрица решений, Ь — вектор-функция (возможно разрывная), коэффициент перед управлением в правой части дифференциального уравнения.

Для задачи сближения с выпуклым компактом в заданный момент времени H.H. Красовским были получены конкретные соотношения (в том числе вариант принципа максимума JI.C. Понтрягина) для нахождения оптимального результата и управления, его доставляющего. В разделе 1.7 обсуждается упомянутая задача с особенностью: допускается использование разрывных зависимостей в коэффициентах при управляющих воздействиях (см. также [4, 8]). В качестве допустимых управлений (в строгой формализации) здесь рассматриваются конечные взвеси мер Дирака с ограничением на вариацию. На содержательном уровне это соответствует использованию в качестве управления последовательности «толчков» (чисто импульсное управление), которые в совокупности должны удовлетворять ресурсному ограничению. Установлен конкретный вид принципа максимума в классе обобщенных управлений, формализуемых в виде к.-а. мер. Для одного примера проведен вычислительный эксперимент.

В разделе 1.8 приведены общие понятия, связанные с множествами притяжения. Последние выступают асимптотическими аналогами областей достижимости в условиях приближенного соблюдения ограничений. В разделе 1.9 рассмотрены некоторые простые иллюстративные примеры, в которых может проявляться неустойчивость по результату: замыкание области достижимости не совпадает с множеством притяжения, отвечающим релаксации исходной системы ограничений. В разделе 1.10 излагается конструкция, которая позволяет вводить расширения в классе векторных к.-а. мер. Такие конструкции могут быть востребованы в задачах, где управление не является скаляром.

Существенной особенностью исследуемых в диссертации игровых задач является использование критерия, допускающего «вхождение» разрывных зависи-

мостей, что и требует на этапе расширения использования аппарата к.-а. теории меры при построении соответствующей компактификации пространства обычных решений (в настоящей диссертации используются компактные множества к.-а. мер). Более того, мы исследуем задачи, для которых сочетание индивидуальных расширений игроков эквивалентно расширению «совокупной» игровой задачи, то есть удается произвести некоторую «декомпозицию» задачи и перейти к более простым представлениям обобщенных элементов.

Введем некоторые обозначения и определения. Пусть Е — непустое множество, £ — полуалгебра (п/а) его подмножеств. Через Во(Е, £) обозначим множество всех ступенчатых, в смысле (Е,С), вещественнозначных функций на множестве Е, а через В(Е,С) — замыкание Во(Е,С) в топологии яир-нормы || • ||е пространства всех ограниченных в/з функций на Е. Функции из В(Е, С) иногда называют ярусными (в смысле (Е,С)). Через т*(£) обозначим *-слабую топологию на множестве А(£) всех к.-а. мер ограниченной вариации. Пусть Т(£) — множество к.-а. (0,1)-мер. Элементами Т(£) являются, в частности, счетно-аддитивные меры Дирака, отождествляемые фактически с точками из Е. Если х £ Е, то через (^[Е1]^) обозначаем меру, для которой при Ь 6 £ полагается (¿Х[.Е]|£) = 0 при х £ Ь и (^[¿^.С) = 1 при х е Ь. Если Е,С фиксированы, то будем использовать запись 5Х вместо (<5Х[.Е]|£). Через с1(А,т) обозначим замыкание множества А, А С X в топологическом пространстве (Х,т).

Вторая глава состоит из шести разделов и посвящена исследованию следующей абстрактной задачи на максимин. Даны два измеримых пространства с п/а множеств: (Е\, С\), (Е2, £2), £1 0. Итак, С\ есть п/а подмножеств

Еи а £2 — п/а подмножеств Е2- Кроме того, фиксируем к,1,р,<7 е N и четыре кортежа ярусных функций

(ai)ieT7k : ^ В(£Ь А), Щщ : М В(Е2, £2),

Ыктз ■■ 17Р -»• В(Еи £1), : В(Е2, £2).

Дана непрерывная по совокупности переменных вещественнозначная функция /о, которую будет удобно представить в виде /о : К1 х К1 ^ К. Полагаем, что Т : Е1 х Е2 —V К определяется следующим правилом: Ух 6 Е\ \/у Е Е2

Мы рассматриваем игровую задачу, в которой первый игрок стремится к минимизации значений Т путем рационального выбора х € Е\, а второй игрок стремится к максимизации этих значений путем выбора у £ Е2. При этом должны

соблюдаться исходные ограничения на выбор х £ Е\,у € Е2) которые заданы в терминах непустых замкнутых множеств Р С Кр, <3 С К9 условиями:

Ы*))йТ5еР- Ыу%^

Тогда невозмущенная игровая задача связана с множествами

й{хеЕ1 | Ы(х)),е-р е Р}, 42) £ е е2 | ЦЫ) ^ е С}.

Итак, мы рассматриваем задачу

Т(х, у) эир Ш ; (3)

уеЕт

сейчас полагаем, что Е^ 0 и Е^ ^ 0, но в дальнейшем, однако, допускается нарушение этих условий.

При этом на уровне аппроксимативных конструкций допускается ослабление ограничений (2) на выбор «программных» стратегий, которое формализуется переходом к рассмотрению «малых» окрестностей упомянутых замкнутых множеств Р, <2. Это приводит к возникновению ограничений асимптотического характера, что мотивирует специальное исследование асимптотики значений максимина в условиях ослабленных ограничений.

В начале второй главы отмечается возможная связь рассматриваемой задачи с некоторыми игровыми аналогами задач математического программирования. Для выявления упомянутой связи приводится общие обоснования и два иллюстрирующих примера.

Отметим, что для рассматриваемой задачи удается произвести упомянутую «декомпозицию» и построить индивидуальное расширение пространства стратегий каждого из игроков, которое реализуется в классах к.-а. (0,1)-мер. Введем операторы

х ОЫЕ1ЦА) : Е\ Т(А), У —» (Зу[Е2]\С2) : Е2 Т(£2),

которые обозначаем через X и 2) соответственно. Из [12, (7.6.16)] вытекают следующие два равенства:

Т(А) = ^(ЯО.гЛАН.ТОСг) = ст\Е2)М£г)).

Мы располагаем, наряду с множествами Е\ и Е2 обычных решений, непустыми компактами: Т(£х) компакт в (А(£1),т»(£1)), Т(£2) компакт в (А(£г), т*{С2)).

Будем рассматривать (ОД)-меры из множеств Т(£1) и Т(£2) как обобщенные решения, выбираемые первым и вторым игроком соответственно, то есть как обобщенные стратегии этих игроков. Введем в рассмотрение обобщенный аналог функции Т, который будет играть роль функции стоимости в обобщенной игровой задаче. Итак, полагаем, что отображение Т : Т(£х) х Т(£г) ® определяется следующим правилом: У/л е Т(£1) Чу €

(4)

Bi

Отметим, что интегралы в (4) являются пределами соответствующих ярусных функций по ультрафильтрам п/а С\ и £2 соответственно.

Замена Т —> Т отвечает идее расширения задачи (3). В свою очередь, условия (2) также допускают расширение:

(} iMieT* еР> (J ujd")jeXi е Q> (5)

£i Е2

(5) есть условия на выбор /i 6 T(£i), и G Т(£2)- Обобщенная задача имеет вид

Т(и, v) —> max min, (6)

V ß

где ¡1 € T(£i) ni/g Т(£г) выбираются с соблюдением условий (5). Переход от (3) к (6) является расширением исходной задачи (показано, что экстремумы в

(6) достигаются). Таким образом мы переходим к рассмотрению максимина в обобщенной задаче

V = max min Т(и, и) £ R. 1/еТ2деТ!

где Ti,T2 — множества допустимых обобщенных управлений (компакты в пространствах к.-а. мер ограниченной вариации); здесь

Ti = {/X б Т(£х) I (| lidß)^ € Р},т2 = {v е Т(£2) I (J Wjdu).eTj 6 Q}.

Ei Е2

Установлено свойство сходимости значений максимина при ослабленных ограничениях на выбор обычных управлений V(e, 5) к максимину обобщенной задачи V, рассматриваемой в классе к.-а. (ОД)-мер, посредством теоремы:

Теорема 2.6.1 Имеет место следующее свойство аппроксимативной реализации V: VC 6]0, оо[ Зкс €]0, оо[: |V(e, 5) - V| < С Ve е]0, к([ V<5 е]0, кс[П

Значения е и <5 отвечают за степень ослабления ограничения на выбор стратегий первым и вторым игроком соответственно.

Предметом исследования в третьей главе (состоящей из 7 разделов) является одна задача о достижимости для управляемой линейной системы, в которой допускается разрывность в коэффициента« при управляющих воздействиях в правой части дифференциального уравнения. Предполагается, что мы вправе выбрать момент времени 6 Е = в который будет приложен импульс

/3(£), где п-вектор-функция /3 задана и допускается разрывной. Данная функция будет использоваться для целей организации одноимпульсного управления, реализующего в пределах Е, скачок фазового вектора. На содержательном уровне рассматривается следующая система:

х{т) = А(т)х(т) + Р{т)Ъг-и х{Ь0) = х0е К";

здесь — дельта-функция. Варьируя £, мы можем реализовать различные траектории с разрывом в одной из точек Е, а, следовательно, различные терминальные состояния. На выбор £, £ 6 Е, имеется ограничение: /3(£) е У, где У есть замкнутое множество в К". Полагаем, что каждая компонента п х п мат-рицанта А = А(-) есть непрерывная функция на [¿о, г?о]- Нас интересует область достижимости упомянутой системы. Рассматриваемая задача не обладает, вообще говоря, устойчивостью при ослаблении ограничения. В этой связи конструируются ограничения асимптотического характера, вызванные ослаблением ограничения. Ослабляя ограничения, мы переходим к рассмотрению е-окрестностей множества У; е > 0. При этом возможно скачкообразное изменение области достижимости при сколь угодно малом ослаблении ограничений. Целью исследования является построение предельного аналога области достижимости (точнее, множества притяжения) для системы всех таких релаксаций. В реализации поставленной цели использовались конструкции расширения в классе к.-а. (ОД)-мер. Построен обобщенный аналог исходной задачи. Показано, что область достижимости в обобщенной задаче (при строгом соблюдении ограничений) совпадает с искомым множеством притяжения в исходной задаче при ограничениях асимптотического характера, определяемых ослаблением ограничения этой исходной задачи.

Пусть п/а С. подмножеств Е такова, что: каждое множество из С является борелевским и {[а, Ь[ | (а, 6) £ х [¿0,^0]} С Полагаем, что

Р = 6 В(Е,С)п- Введем расширение ¡3: = (/ 6 Т(£).

Е

Получено следующее представление вспомогательного множества притяжения (предложение 3.3.1):

{меВД | ДМ еУ}. (7)

Используя (7), найдено искомое множество притяжения в пространстве терминальных состояний:

{Ф(0О,*о)ю + Ф(0О, : М €

здесь 1 : Е Е — тождественная функция, для которой ¡(4) = £ У£ € Е. Для одного полезного частного случая измеримой структуры получено конкретное представление последнего множества.

Используя известные положения относительно связи интегрирования по к.-а. (ОД)-мере и пределу функции по ультрафильтру соответствующей п/а множеств, показана корректность различных представлений траекторий системы в обобщенной задаче; установлено, что

Ф(0о, = (¿|фV/* е ВД.

Е Е

В разделе 3.7 намечен «мостик» между игровой задачей второй главы и задачей, рассматриваемой в третьей главе. Оказывается, что приведенная игровая модификация содержательной постановки, рассмотренной в третьей главе, есть частный случай абстрактной постановки второй главы. К подобному заключению приводит исследование упомянутой задачи о достижимости, которое проведено в третьей главе.

В четвертой главе (состоящей из 4 разделов) рассматривается игровая задача на программный максимин функции платы, заданной на произведении фазовых пространств управляемых систем, отвечающих движению первого и второго игрока. Реально значения функции платы определяются для точек областей достижимости. Фиксируем две линейные управляемые системы

х{1) = С{1)х{г) + и(ф(1), у{1) = £>(%(*) + и(4)с(0

с управлениями и = «(■)= у(-) соответственно первого и второго игрока. Фазовое пространство первой системы (второй системы) полагаем /¡-мерным

(/-мерным), промежуток времени совпадает с /о = [0,1], а начальные условия таковы, что х(0) = хо К*5, у{0) = уо € К'. Полагаем, что при í £ [0,1] С(<) — к х /г-матрица и — I х /-матрица. Все компоненты матрицантов С(-) и £>(•) — непрерывные функции на отрезке [0,1]. Каждая компонента = ¿¿(-) (с^- = с^-(-)) вектор-функции Ъ (вектор-функции с) есть вещественнозначная функция на I = [0,1[, которая может быть разрывна. Программные управления игроков и, V считаем простейшими, а именно кусочно-постоянными и непрерывными справа, удовлетворяющими ограничению на энергетику в двух вариантах. В первом варианте используется традиционное условие типа неравенства на импульс силы

1 1

\u(t)\dt < 1,

|u(f)| dt < 1; (8)

о

во втором — при условии неотрицательности управления постулируется требование «полного расхода топлива»

1 1

(u{t) > 0,u(i) > 0 Vi <Е /)&(Ju(i)<ft = 1, v(t)dt = l). (9)

о о

Введем п/а £ подмножеств I: С = {[а, 6[ | (а, Ь) € [0,1] х [0,1]}. Пусть У = {w е Bq(I, С) | Jj |?^(i)|A(cii)}, где Л — сужение меры Лебега на С.

Имеется дополнительное (общее) ограничение: управления игроков должны быть «узкими» импульсами (иметь «малую» временную длительность). Последнее требование порождает множества-ограничения

FK = jw € S | 3t 6 / : {r 6 I | w{t) ^ 0} С [t, t + к[| С J Vk б]0, oo[

и семейство T = {FK : к ё]0, oo[} в терминах которого вводится асимптотический вариант постановки игровой задачи (рассматриваются реализуемые аналоги «предельно узких» импульсов). Естественным образом возникает задача нахождения асимптотических областей достижимости — множеств притяжения. Пусть F® по определению множество всех программ из FK, которые имеют не более одного переключения; F® С FK. Пусть Tq = {F® : к б]0, оо[}.

По формуле Коши для управления и € У первого игрока (управления v 6 У второго игрока) определена траектория фи первой (траектория второй) системы. Будем полагать, что задана некоторая непрерывная по совокупности

переменных функция Qo : Mfc х Мг -»• М. Пусть Т : £ х J -» К. определена по следующему правилу: Vit € J Vu € £

T(u,t;) = ao(^(l).it/(l))-

Сформулируем игровую задачу при ограничениях (8): первый игрок стремится к минимизации значений Т путем рационального выбора и 6 а второй игрок стремится к максимизации этих значений посредством выбора v € Точнее, нас интересует результат задачи, где управления удовлетворяют также ограничениям: и G Fe, v е F$, е > О, S > 0. Также мы ставим задачу найти асимптотику значений исходной задачи при ужесточении ограничений, которое мы понимаем в естественном смысле уменьшения неотрицательных значений е, <$. Таким образом, наша задача с реализуемыми (ослабленными) ограничениями имеет следующий смысл:

Т(u,v) —► sup inf , (10)

veFt ueFe

где e €]0, oo[, 6 €]0, oo[. Нас также интересует асимптотика значений (10).

Отметим, что задача четвертой главы, имеет одно существенное отличие от ранее рассмотренных задач, а именно: в этой (исходной) задаче отсутствует часть, которая имеет смысл требования соблюдать строгое ограничение, которое далее ослабляется. Требование использовать «достаточно узкие» импульсы управления не является ослаблением какого-либо стандартного ограничения. Определены вектор-функционалы от управления и и и, соответственно д и h:

и ^ фи{ 1) : & v I—> : ff -»• К',

определяющие терминальные состояния систем. Пусть Ve €]0, оо[ V<5 е]0, оо[

V{£,6) = sup inf a0(g(u),h(v)). veFs

Имеем, что V(e, ö) = max min ао(я, у) e R.

yecHh^Ft),T^) xecHg^F.),^) Рассмотрим упомянутые множества притяжения в пространстве терминальных состояний первого и второго игрока соответственно:

А = П cl(g\Fe),T^),BÜ р| cl(h\F5)tr^), £el0,oo[ ¿e]0,oo[

Ao= П cl(gHF^),B0ü p) dih^),^).

еб]0,оо[ 5б]0,оо[

Здесь т^ и т® есть естественные топологии в Жк и соответственно. Теперь возможно ввести определение асимптотического максимина:

v = maxmin ао{х, у) € К. уев хбА

Как и во второй главе, удается произвести упомянутую выше «декомпозицию» задачи и построить индивидуальное расширение пространства программных стратегий каждого из игроков в классах к.-а. мер ограниченной вариации слабо абсолютно непрерывных относительно сужения меры Лебега на выбранную измеримую структуру. По выбору п/а С при условии (8) множество всех обобщенных элементов каждого из игроков совпадает с единичным шаром в сильной норме и является компактом в *-слабой топологии.

В теореме 4.3.1 доказано совпадение вспомогательных множеств притяжения (реализуемых в пространстве обобщенных элементов) при ограничениях в терминах Т и То- Следствием этого факта являются равенства А = Aq, В = Во и совпадение значений обобщенного максимина для нескольких типов ограничений асимптотического характера. Последнее указывает на регуляризующую роль обобщенных элементов: результат обобщенной задачи совпадает для различных наборов ограничений асимптотического характера. Более того, асимптотический максимин является обобщенным пределом значений реализуемых максиминов в задачах с «исчезающе узкими» импульсами:

V« е]0, оо[ Звк е]0, оо[: \V(e, <5) — v| < к Ve б]0, вк[ V<5 €]0, вк[.

При этом параметры е, 5 ограничивают продолжительность допустимого обычного управления.

Для рассматриваемого измеримого пространства (стрелки) удается получить весьма конкретное описание вспомогательного множества притяжения в пространстве обобщенных элементов. При ограничениях (8) упомянутое множество есть объединение

1. множества, состоящего из всевозможных произведений коэффициента а, |а| < 1 и меры Дирака So в начальный момент времени, данные меры формализуют управление в начальный момент времени;

2. множества, состоящего из всевозможных произведений коэффициента а, |а| < 1 и чисто к.-а. меры интеграл по которой дает предел слева в момент t = 1, данные меры формализуют управление в последний момент времени;

3. множества {а^ + аг^ : Ь €]0,1[, |оц| + |а2| < 1} комбинаций меры Дирака и чисто к.-а. меры, интеграл по которой дает предел слева в моменты

*е]о,1[.

Элементы последнего множества позволяют решить проблему, связанную с разрывностью коэффициента при управляющем воздействии в правой части дифференциального уравнения. Используя подробное описание вспомогательного множества притяжения в пространстве обобщенных управлений, можно эффективно строить терминальное множество притяжения каждого из игроков. После этого не составляет труда найти значение асимптотического максимина, который совпадает с максимином в обобщенной задаче.

Отметим, что выше были приведены результаты при ограничениях в терминах которые включают в себя ограничение (8). При ограничениях (9) многие построения и результаты идейно повторяют вышеизложенные и поэтому опущены в автореферате, но достаточно подробно рассмотрены в четвертой главе работы (см. также [14]).

В разделе 4.4 для одного конкретного примера задачи управления (управление материальной точкой) найдено значение обобщенного максимина; в данном примере существенно используется вышеупомянутое представление вспомогательного множества притяжения. В конце главы на основе одного модельного примера намечен возможный вариант продолжения исследований диссертационной работы, связанный в идейном отношении с возможностью сочетания «асимптотических» ограничений главы 2 и главы 4. Пример показывает, что, по-видимому, целесообразно незначительно огрублять определенные ограничения с целью перехода к использованию более простых управляющих воздействий.

Характеризуя работу в целом, можно отметить, что в ней фактически указан класс игровых задач, для которого сочетание индивидуальных процедур расширения игроков эквивалентно «совокупному» расширению игровой задачи на максимин.

Основные результаты диссертации

1. Для задачи на максимин с критерием, имеющим вид композиции непрерывной функции и ярусной вектор-функции, определенной на произведении множеств обычных решений игроков, построено корректное расширение в классе конечно-аддитивных (0,1)-мер, доставляющее асимптотику реализуемых значений максимина при ослаблении геометрических ограничений на выбор обычных решений.

2. Показано, что к вышеупомянутой постановке сводится линейная игровая задача управления в классе одноимпульсных режимов для систем с разрывностью в коэффициентах при управляющих воздействиях; для данной постановки конкретизируется вид обобщенной задачи в классе конечно-аддитивных (0,1)-мер.

3. Построено расширение линейной задачи на программный максимин с ограничениями импульсного характера в классе неотрицательных обычных управлений с «исчезаюгце малой» временной протяженностью; установлена структура обобщенной задачи и указано представление асимптотики реализуемых значений программного максимина.

4. Для линейной задачи управления с импульсными ограничениями и требованием к реализации обычных управлений в виде импульсов «малой» продолжительности построено корректное расширение в классе линейных комбинаций мер Дирака и чисто конечио-аддитивных мер.

Автор благодарен научному руководителю члену-корреспонденту РАН Александру Георгиевичу Чснцову за постоянное внимание к работе.

Цитированная литература

[1] Голылтейн Е. Г. Теория двойственности в математическом программировании и ее приложения. М.: Наука, 1971.

[2] Даффин Р. Д. Бесконечные программы // Линейные неравенства и смежные вопросы: сборник статей. 1959. С. 263-267.

[3] Еремин И. И., Мазуров В. Д., Астафьев Н. Н. Несобственные задачи линейного и выпуклого программирования. М.: Наука, 1983.

[4| Зудихин Л. В., Ченцов А. Г. Об одной линейной задаче многоканального управления с ограничениями по пунктам следования // Динамика и упр. космич. объектами: Сб. науч. тр. 1992. С. 29-39.

[5] Красовский Н. Н. Дифференциальная игра сближения-уклонения - II // Изв. АН СССР. Техн. кибернетика. 1973. № 3. С. 22-42.

[6] Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.

[7] Нейман Д., Моргенштсрн О. Теория игр и экономическое доведение. М.: Наука, 1970.

[8] Серов В. П., Ченцов А. Г. О программной линейной игровой задаче наведения при ограничении на импульс управляющей силы // Автомат, и телемех. 1993. № 5. С. 61-74.

|9| Субботин A. II.. Чепцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.

[10] Чепцов А. Г. ОС игровых задачах сближения-уклонения // Прнкл. математика и механика. 1974. № 2. С. 211-223.

|11] Чепцов А. Г. Об одной дифференциальной игре сближения-уклонения // Прикл. математика и механика. 1974. № 4. С. 580-589.

|12] CLentsov A. G. Asymptotic attainability. Dordrecht: Kluwer. 1997.

|13| Chentsov A. G., Moriua S. I. Extensions and Relaxations. Dordrecht: Kluwer, 2002.

Публикации автора no теме диссертации

Статьи, опубликованные в ведущих рецензируемых научных журналах из списка ВАК:

[14] Бакланов А. П. OG одной игровой задаче асимптотически импульсного управления // Вести. Удмуртск. ун-та. Матем. Мех. Комньют. пауки. 2011. No 3. С. 3-14.

|15] Бакланов А. П., Чепцов А. Г. К вопросу о расширении одной игровой задачи в классе двузначных конечно-аддитивных мер // Вести. Тамбов, ун-та. Сер. Естеств. и техн. пауки. 2011. Т. 1С, No 1. С. 15-37.

Другие публикации:

|1G| Baklanov А. P., Chentsov A. G. On question about extension of abstract attainability problems admitting discontinuous dependences ',/ Functional Differential Equations. 2010. Vol. 17. no. 1-2. P. 21-50.

[17| Бакланов А. П., Чепцов А. Г. О корректном расширении игровой задачи в классе ко-печпо-аддитпвиых (0.1)-мер // Современные методы теории краевых задач. Тезисы весенней математ. школы «Поптрягипскпе чтения - XXII». Воронеж: 2011. С. 29-30.

|18| Бакланов А. П. К вопросу о расширении одной игровой задачи импульсного управления ,', Современные методы теории краевых задач. Тезисы весенней математ. школы «Поптрягипскпе чтения - XXII». Воронеж: 2011. С. 30-31.

[19| Бакланов А. П. Об одной игровой задаче асимптотически импульсного управле-ппя 7 Современные проблемы математики. Тезисы 42-й Всероссийской молодежной школы-копферепцпп. Екатеринбург: 2011. С. 3 5.

[20| Бакланов А. П. К вопросу о представлении максимипа в одной задаче импульсного управления / Дифференциальные Уравнения и Процессы Управления. 2012. No 3. С. 49 09.

[21| Бакланов А. П. Об одной игровой задаче па множестве чисто конечно-аддитивных мер 7 Современные проблемы математики. Тезисы 43-й Всероссийской молодежной школы-копферепцпп. Екатеринбург: 2012. С. 109-111.

|22| Бакланов А. П. Об одной игровой задаче программного управления с импульсными ограничениями / Изв. Инст. Мат. и Ннф. УдГУ 2012. No 1. С. 7.

|23| Бакланов А. П. К вопросу о представлении максимипа в одной задаче импульсного управления // Современные проблемы математики. Тезисы 44-й Всероссийской молодежной школы-конференции. Екатеринбург: 2013. С. 71-74.

Подписано в печать 15.05.2013. Формат 00x84 1/10. Объем 1 п.л. Тираж 100 экз. Заказ № 4790. Отпечатано в типографии ООО «Издательство УМЦ УПИ», г. Екатеринбург, ул. Гагарина, 35а, оф. 2.

 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Бакланов, Артем Павлович, Екатеринбург

российская академия паук

у ра л ьс к о го ог I ;а ]о.; 11 о н и е

институт математики и механики им. н.н. красовского

На правах рукописи

0420135^528

Бакланов Артем Павлович

РАСШИРЕНИЕ ЗАДАЧ НА ПРОГРАММНЫЙ МАКСИМИН В КЛАССЕ КОНЕЧНО-АДДИТИВНЫХ МЕР

01.01.09 — дискретная математика и математическая кибернетика

Диссертация па соискание ученой степени кандидата физико-математических наук

Научный руководитель чл.-корр. РАН Чснцов А.Г.

ЕкаїершіГІург 2013

Содержание

Введение ....................................................................4

1 Элементы теории расширений: общие свойства и некоторые применения 17

1.1 Задача управления с импульсными ограничениям» ..............17

1.2 Определения и обозначения..........................................19

1.3 Обобщенные управления............................................23

1.4 Расширение задачи управлении с импульсными ограничениями 27

1.5 Одна задача чисто импульсного управления ......................31

1.6 Расширение задачи чисто импульсного управления ..............34

1.7 Простейшая задача управления линейной системой..............36

1.8 Множества притяжения............................................48

1.9 Некоторые примеры неустойчивых задач..........................53

1.10 Векторные копечно-аддптпвпые меры..............................62

1.11 Один пример задачи па программный макспмин..................66

2 Расширение одной игровой задачи в классе конечно-аддитивных (ОД)-мер 69

2.1 Постановка задачи....................................................69

2.2 Расширение задачи....................................................78

2.3 Асимптотическая реализации обобщенных элементов............82

2.4 Множества оценок при ослаблении ограничений..................88

2.5 Макспмин в задачах с ослабленными ограничениями ............91

2.6 Аппроксимативная реализация обобщенного макспмина..........98

3 Расширение одной абстрактной задачи о достижимости 104

3.2 Множества притяжения.......................106

3.3 Конечно-аддитивные (ОД)-мсры как обобщенные элементы. . . . 108

3.4 Применение для целей построения обобщенных аналогов одно-импульспого управления.......................112

3.5 Связь с операцией предела по ультрафильтру ..........117

3.0 Реализация множества притяжения в классе приближенных управлений (случай пространства-стрелки)............125

3.7 Связь с построениями второй главы................129

4 Расширение одной игровой задачи с; импульсными ограничениями 133

4.1 Введение и постановка задачи ...................133

4.2 Конкретизация задачи........................130

4.3 Вспомогательные множества притяжения.............144

4.4 Пример ................................152

Список сокращений и основных обозначений..............159

Литература.................................100

Введение

Общая характеристика работы

Представленная диссертация посвящена построению корректных расширений игровых задач с ограничениями асимптотического характера. В частности, рассматриваются игровые задачи программного управления линейной системой с возможной разрывностью в коэффициентах при управляющем воздействии. В качестве обобщенных эцементов используются конечно-аддитивные (к.-а ) меры ограниченной вариации; соответствующие компакты упомянутых мер определяются в виде подпространств пространства, сопряженного пространству ярусных функций, в оснащении *-слабой топологией. Конструируемые обобщенные игровые задачи (па максимпн) определяют асимптотику реализуемых значений макспмппа при ослаблении стандартных ограничений. Исследуется постановка, в которой ограничения на выбор управления изначально имеют асимптотический характер.

Актуальность темы

В современном мире теория управления играет важную роль. Одна из проблем теории управления состоит в определении оптимального управления в условиях действия помехи, что 'пшичпо дчя задач управления техническими системами Наиболее плодотворным в решении такой проблемы является игровой подход, в котором выбор помехи осуществляет второй (зачастую фиктивный) игрок. Развитие математической теории задач конфликтного управления, прежде всего, связано с работами Н.П. Красовского, Л.С. Понтрягина, Б.Н. Пшеничного, А.И. Субботина. Первые постановки дифференциальных игр были рассмотрены в монографии Р. Айзекса [I].

Существенное влияние на теорию управления п теорию дифференциальных игр оказали работы Р.В. Гамкрелидзе. A.B. Кряжимского, А.Б. Куржан-ского, Е.Ф. Мищенко, Ю.С. Осинова, Ф Л. Черноуеько, J.P. Aubin, Т. Basar, Р. Bernhard, J.V. Breakwell, L. Berkovitz, M.С. Crandall. R.J. Elliot, A. Friedman N.J. Kalton, G. Leitmann, P.L. Lions, C. Ryll-Nardzewski, P. Varaiya. J. Warga.

Большой вклад в 'георию управления и теорию дифференциальных игр внесли Э.Г.Альбрехт, В.Д. Батухтпн. С.А. Брыкалов. Н.Л. Григоренко, П.Б. Гусятников, М.И. Зелпкпп, А.Ф. Клейменов, Н.Ю. Лукояиов, A.A. Ме-ликян, М.С. Никольский, В.В. Остапенко. B.C. Пацко, H.H. Петров, Л.А. Пет-росян, Е.С. Ноловипкин, H.H. Субботина, A.M. Тарасьев, A.A. Толстоно-гов, В.Е. Третьяков, В.И. У хоботов, В.Н. Ушаков, А.Г. Ченцов, A.A. Чи-крий, C.B. Чистяков. M. Bardi, E.N. Barron. A. Blaquiere, 1. Capnzzo Dolcetta, M. Falcone, L.C. Evans, R. Jensen. M. Ishii, J. Lewin, P. Soravia, P.E. Souganidis и многие другие ученые.

Задачам импульсного управления посвящены работы H.H. Красовского [28], A.B. Куржаиского, Р. Винтера, В.Н. Гурмана [17], М.И. Гусева, В.А. Дыхты и О.II. Самсонюк [20]. С.Т. Завалпщина и А.Н. Сесекина [22,81], А. М. Самойлснко [40], Б.М. Миллера [3G|. В.М. Тихомирова, Т.Ф. Филипповой, А.Г. Ченцова, J. Warga, A. Halanay, D. VVexler и многих других ученых.

Конструкции расширений задач оптимальною управления с геометрическими ограничениями рассматривались многими авторами, отметим здесь исследования Р.В. Гамкрелидзе [15|. L. С. Yong [71], J. Warga [14]. Конструкции расширений играют важную роль в игровых задачах управления (см., например, [30,31,43]). Отметим, что для построения методов решения позиционных дифференциальных игр использовались результаты, полученные для игровых задач программного управления. В упомянутых игровых задачах программного управления применялись конструкции расширений на базе управлений-мер (см.. например, «смешанные» программные управления [31]), что сыграло важную роль при построении вспомогательных программных конструкций для решения нелинейных дифференциальных игр и при исследовании условий регулярности, которые позволяют осуществлять прямой переход от

(более простых) игровых задам программного управления к построению процедур управления по принципу обратной связи. Заметим, что в регулярных дифференциальных играх программный максимип играет основную роль в определении функции цены (см. |29]). Данное направление получило развитие в работах Н.Ы. Красовского и его учеников. Важным этапом в исследованиях являлось построение обобщенных игровых задач программного управления, в том числе п при фазовых ограничениях. В последнем случае часто возникает скользящий режим управления, при котором фазовые ограничения соблюдаются «па грани фола». Напомним здесь же, что в определении фундаментального свойства стабильности II. Н. Красовским было предложено использовать обобщенные реакции па обычные и, более того, постоянные управления одного из игроков; наряду с правилом экстремального сдвига это сыграло важную роль в доказательстве фундаментальной теоремы II. Н. Красовского п Л. И. Субботина об альтернативе в нелинейной дифференциальной игре. Заметим, что расширение «совокупной» игровой задачи может не сводиться к сочетанию индивидуальных расширений игроков; соответствующие примеры, касающиеся вспомогательных программных конструкций для позиционных дифференциальных игр. приведены в (-15 47].

Идеи, связанные по существу с конструкциями расширений, использовались и в других разделах математики (см.. например, [16, 19,21] в связи с задачами математического программирования). В качестве одного из самых известных вариантов конструкций расширений следует отметить использование смешанных стратегий в антагонистических играх, благодаря чему в широком классе игровых задач удается решить проблему существования седловой точки (см. [38,39] и др.).

В настоящей работе целенаправленно пепедуются вопросы корректных расширений абстрактных игровых задач программного управления с ограничениями асимптотического характера, которые, в частности, могут возникать при ослаблении стандартных ограничении пли быть заданными изначально. Данные построения связаны с постановками, в которых истинное качество

процесса реализуется при соблюдении ограничении «па грани фола» (с высокой, но все же конечной степенью ТОЧНО("1 п)

Конструкции расширения в классе к -а. мер использовались в работах Е.Г. Белова, А.И. Жданка, А.И. Короткого, В.П. Серова, С.И. Тарасовой. А.Г. Чеицова, Ю.В. Шапарь. В связи с расширением задач с ограничениями асимптотического характера отметим работы [53,70,79]. Целый ряд работ (см. [65-68]) посвящен рассмотрел!по игровых задач программного управления, где упомянутые ограничения определяются релаксацией краевых и промежуточных условий.

Большой вклад в развитие к.-а. теории меры внесли работы: Г. Гильде-брандта. Н. Данфорда и Дж.Т. Шварца [18], Л.В. Канторовича, Г.М. Фихтен-гольца, Е. Хыоитта и К. Иосиды (80], Б. Pao К. и Б. Pao М. [73].

Цель работы

Построение расширений абстрактных задач программного управления на максимин, реализуемых в соответствующих классах к.-а. мер. Построение асимптотики значений программного макспмпна в классе обычных управлений при ослаблении стандартных ограничении. Исследование задачи на программный максимин в классе импульсов управления с «исчезающе малой» продолжительностью.

Методы исследования

Используются методы теории управления, математического программирования, функционального анализа, общей топологии, теории игр, теории меры.

Научная новизна

Для абстрактных игровых задач с различными ограничениями импульсного хараюера п режимами управления построены расширения в подходящих классах к.-а. мер. Данный подход; позволяет решить проблему компактифи-кацпп пучка траекторий и области достижимости. Другим важным следствием данного подхода является возможность исследовать асимптотику значе-

ний (реализуемого) макснмипа в случаях, когда каждое упомянутое значение соответствует множеству-элементу некоторой базы фильтра (в терминах упомянутых баз фильтров задаются ограничения асимптотического характера). Ограничения асимптотического характера в виде баз фильтров могут, в принципе, возникать по разным причинам. Например, это может происходить при ослаблении стандартных ограничении, задаваемых требованием принадлежности множеству некоторой «оценки» возможного решения. При этом реализуется семейство множеств допустимых обычных решении, отвечающих каждое соответствующей «степени» ослабления стандартного ограничения. В других случаях «асимптотические ограничения» задаются изначально, а их соблюдение приводит к реализации предельных значений функции стоимости. В рамках предполагаемого подхода, связанною с расширением исходной задачи, удаехся исследовать асимптотпм реализуемых значений максимина в случае, когда игровая задача пс обладает устойчивостью при ослаблении исходной системы стандартных ограничений.

Для одного конкретного варианта измеримою пространства с полуалгеброй множеств (а именно для пространства-стрелки) дано конкретное описание к.-а. мер, реализующих вспомогательное множество притяжения в пространстве обобщенных элементов, что позволяет находить асимптотику реализуемых значений максимина (асимптотический макспмин).

Теоретическая и практическая значимость

Для игровых задач па макспмин (с разтпчпымп типами ограничений на выбор программного управления игроками) были реализованы конструкции расширения в классе конечпо-аддптивных мер. что позволяет в упомянутых задачах корректно описать эффекты, возникающие при условиях разрывности в коэффициентах при управлении и имеющие смысл произведения разрывной функции на обобщенную Результаты работы представляются полезными для исследования конкретных постановок игровых задач управления линейными системами с импульсными oi раппченпямп и разрывностью в коэффициентах при управляющих воздействиях. Соответствующие примеры та-

кпх постановок доставляют инженерные задачи, связанные с управлением техническими системами при наличии ресурсных ограничении. Ограничения такого типа возникают в задачах космической навигации. При этом вышеупомянутая разрывность может, в некотором естественном смысле, отражать процесс резкого изменения массы управляемого объекта. В работе построены корректные расширения абстрактных задач управления на максимин, в которых присутствуют ограничения асимптотического характера, которые могут быть порождены ослаблением традиционных ограничений либо возникать изначально (пример такого рода задач рассмотрен в 4 главе).

Апробация работы

Основные результаты диссертации докладывались на следующих конференциях: международная школа-конференция «Современные методы качественной теории краевых задач -- Понтрягпнскпе чтепия-XXI» (г. Воронеж, 3-9 мая 2011); 42-я всероссийская молодежная школа-конференция «Современные проблемы математики» (г. Екатеринбург 30 января-6 февраля 2011);

43-я всероссийская молодежная школа-конферепцпя «Современные проблемы математики» (г. Екатеринбург, 29 япваря-5 февраля 2012); всероссийская научная конференция с международным участием «Математическая теория управления и математическое моделирование» (г. Ижевск, 14-18 мая 2012);

44-я всероссийская молодежная школа-конференция «Современные проблемы математики» (г. Екатеринбург, 27 ян варя-2 февраля 2013).

Результаты диссертации докладывались па семинарах отдела управляемых систем МММ УрО РАН, па семинаре кафедры теории управления и оптимизации Челябинского государственного университет, на семинаре отдела оптимизации управляемых процессов Института Кибернетики им. В.М.Глушкова HAH Украины.

Публикации

Основной материал диссертации опубликован в работах [3-11,72]. В совместных с А.Г. Ченцовым работах [10,11,72] А.Г. Ченцову принадлежат по-

становкп задач, общая схема исследования и некоторые идеи доказательств; конкретные доказательства основных положении проведены автором диссертации самостоятельно.

Структура и объем работы

Диссертация состоит из введения, 4 i пав и списка литературы. Главы разбиты на параграфы. Нумерация глав, параграфов и утверждении сквозная. Нумерация формул тройная. Объем работы 168 страниц и включает 5 рисунков. 1 таблицу. Библиография содержи'! 81 наименование.

Основное содержание работы

В первой главе (вводной) мы приводим обозначения и определения, а также простые примеры линейных задач управления, мотивирующие построение конструкций расширения. Для таких примеров показаны варианты корректных расширении соответствующих задач управления. При расширении задач программного управления чиненными системами в классе к.-а. мер мы переходим от обычных траекторий к обобщенным, определяемых следующим образом:

фМ = Ф(Мо)яо + / Ф(иЖСМ<Ю ty eAVie [¿о,0о],

Jt0

где А есть соответствующее задаче множество обобщенных управлений, которое является компактом в ^-слабой топологии пространства к.-а. мер ограниченной вариации, Ф — фундаментальная матрица решений, Ь — вектор-функция (возможно разрывная), коэффициент1 перед управлением в правой части уравнения.

Для задачи сближения с выпуклым компактом в заданный момент времени H.H. Красовскпм были получены конкретные соотношения (в том числе вариант принципа максимума Л.С. Поптрягпиа) для нахождения оптимального результата и управления, его доставпяющего. В разделе 1.7 обсуждается упомянутая задача с особенностью: допускается использование разрывных зависимостей в коэффициентах при управляющих воздействиях (см. так-

же [23,41]). В качестве допустимых управчснпй (в строгой формализации) здесь рассматриваются конечные взвеси мер Дирака с ограничением на вариацию. На содержательном уровне это соответствует использованию в качестве управления последовательности «чолчков» (чисто импульсное управление), которые в совокупности должны удовлетворять ресурсному ограничению. Установлен конкретный вид принципа максимума в классе обобщенных управлении, формализуемых в виде к.-а мер. Дчя одного примера задачи сближения с множеством проведен вычислительный эксперимент для различных начальных данных.

В разделе 1.8 приведены общие понятия, связанные с множествами притяжения. Последние выступают асимптотическими аналогами области достижимости в условиях приближенного соблюдения ограничений. В разделе 1.9 рассмотрены некоторые простые иллюстративные примеры, в которых может проявляться неустойчивость по результату: замыкание области достижимости не совпадает с множеством притяжения, отвечающим релаксации исходной системы ограничений.

В разделе 1.10 излагаемся конструкция, которая позволяет вводить расширения в классе векторных к.-а. мер. Такие конструкции могут быть востребованы в задачах, где управление не является скаляром. Однако далее в настоящей работе эти конструкции не используются. Это связано с тем, что случаи использования векторных управ