Асимптотические методы оптимального управления сингулярно возмущенными и квазилинейными системами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Кремлев, Александр Гурьевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
РОССИЙСКАЯ АКАДЕМИЯ НАУК УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
На правах рукописи УДК 517.977
КРЕМЛЁВ Александр Гурьевич
АСИМПТОТИЧЕСКИЕ МЕТОДЫ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННШИ И КВАЗШГИНЕШЬШ СИСТЕМАМИ
01.01.02 - дифференциальные уравнения
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
• ^ Л» **
_ Я '097
Екатеринбург - 1997
Работа выполнена в Уральском государственном университете им. А.М.Горького на кафедре прикладной математики.
Официальные оппоненты:
академик Национальной Академии Наук Украины, доктор физико-математических наук, профессор Б.Н.ПШЕНИЧНЫЙ;
доктор физико-математических наук, старший научный сотрудник Т.Ф.ФИЛИППОВА;
академик Российской Академии Наук, доктор физико-математических наук, профессор Ф.Л.ЧЕРШУСБКО.
Ведущая организация - Московский государственный университет им. М.В.Ломоносова, факультет вычислительной математики и кибернетики.
Защита диссертации состоится " * 1997 г.
в iL. часов на заседании специализированного совета Д 002.07.01 по защите диссертаций на соискание ученой степени доктора наук при Институте математики и механики Уральского отделения РАН по адресу: 620066, г.Екатеринбург, ул. 0.Ковалевской, 16.
С диссертацией южно ознакомиться в библиотеке Института математики и механики Уральского отделения РАН.
Автореферат разослан " 1997 г.
Ученый секретарь специализированного ссвета кандидат физико-математических наук,
старший научный сотрудник
М.И.Гусев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность те»1. В настоящее время многие принципиальные положения математической теории оптимальных процессов управления -принцип максимума Л.С.Понтрягина, фундаментальные исследования по теории необходимых и достаточных условий оптимальности, проблемам управляемости приобрели широкую известность. Разработаны и интенсивно применяются, особенно в приложениях как теоретического, так и прикладного характера, общие методы исследования бесконечномерных экстремальных задач.
В то же время практическая реализация полученных условий, соотношений, схем решения часто связана с большими вычислительными сложностями. Характерными особенностями математических моделей реальных управляемых процессов являются их нелинейность, отсутствие или неполнота информации о начальных данных и входных возмущениях, негладкость как ограничений, целевых функций, так и правых частей дифференциальных уравнений, описывающих динамику процесса. Краевая задача принципа максимума также, как правило, оказывается нелинейной и не имеет общего эффективного метода решения. В таких ситуациях получение содержательных результатов качественного и численного характера возможно путем сведения исходной задачи к семейству (последовательности) задач более простой структуры, для которых известны и могут быть реализованы способы нахождения (вычисления} решения. Основная тяжесть здесь переносится на аналитическое исследование математической модели, выбор эффективных аппроксимаций, разработку вычислительного метода решения и обоснование его сходимости. В настоящее время в связи с быстрым развитием вычислительной техники и программного обеспечения Ссистем аналитических вы-
числений, компьютерной алгебры) возрастает актуальность разработки аналитических приближенных или асимптотических методов, позволяющих получить численное решение задач управления и на практике реализовать сложные алгоритмы управления нелинейными системами.
Одним из важнейших этапов рассмотрения оптимизационной задачи является создание принципиальной схемы алгоритма решения с последующей ее численной реализацией, что предъявляет определенные требования к выбору использумых методов и процедур, в основе которых лежат различные аналитические способы представления решений. Для динамических систем с малыми параметрами особенно эффективными являются методы построения последовательных приближений к оптимуму. В этом случае на каждом шаге алгоритма рассматривается некоторая вспомогательная задача, доставляющая с определенной точностью (относительно параметра) решение исходной задачи. Однако применение таких итерационных схем для сингулярно возмущенных систем (с малым параметром при части производных) связано с рядом существенных трудностей, возникающих при этом Снеприемлемость выбора в качестве начального приближения решения вырожденной задачи, полученной при 0, ц, - малый параметр; выделение асимптотики элементов итерационной конструкции, причем на каждом шаге с соответствующей точностью по параметру ц; сходимость самой процедуры).
Особый интерес к сингулярно возмущенным системам обусловлен преаде всего их большой прикладной значимостью. Появление разномасштабных переменных при детальном описании динамики управляемого процесса довольно часто, и удобный способ формализации в этом случае - введение сингулярных возмущений. В теории дифференциальных уравнений хорошо известны фундаментальные результаты А.Н.Тихонова по проблемам асимптотики решений сингулярно возмущенных задач, основанные на принципе разделения быстрых и медленных "изоли-
рованных" движений и развитые в дальнейшем в многих статьях и монографиях. Для исследования проблем оптимального управления сингулярно возмущенными системами используются различные схемы асимптотического представления решений сингулярно возмущенных уравнений. Наиболее употребляемые из них - метод пограничных функций, метод усреднения. Эффективность этих схем существенно зависит от степени гладкости правых частей (реализации же управлений, возмущений, помех могут быть лишь измеримыми). Поэтому разработка аналитических методов асимптотического описания оптимального решения в задачах управления сингулярно возмущенными системами является весьма актуальной проблемой. Полученные на их основе вычислительные алгоритмы позволяют существенно уменьшить объем необходимых вычислений по сравнению с прямым решением.
Исследования по проблемам управления в условиях неопределенности и конфликта составляют одно из современных направлений математической теории управляемых процессов. Рассмотрение таких задач стимулировано практическими потребностями, поскольку очень часто априорная информация о состоянии управляемого объекта, неизвестных входных возмущениях является неполной (заданы лишь области изменения соответствующих величин, в рамках которых они могут реализоваться любым образом). Математические модели подобных задач для динамических систем исследуются в рамках теории управления в условиях неопределенности и теории дифференциальных игр, основы которых заложены в трудах Н.Н.Красовского и Л.С.Понтрягина. Принципиальные результаты по обсуждаемому направлению получены в работах отечественных и зарубежных математиков: Р.Айзекса, Р.Беллмана, В.Г.Болтянского, Р.Габасова, Р.В.Гамкрелидзе, В.Ф.Демьянова, А.Я.Дубовицкого, В.И.Зубова, Р.Калмана, Ф.М.Кирилловой, В.Ф.Крото-ва, А.В.Кряжимского, А.Б.Куржанского, Дж.Лейтмана, А.М.Летова, ..
A.А.Меликяна, Е.Ф.Мищенко, М.С.Никольского, Ю.С.Осипова, Н.Н Петрова, Л.А.Петросяна, Б.Н.Пшеничного, А.И.Субботина, Ф.Л.Черноусько и других.
Математическая формализация задач теории управления в условиях неопределенности и конфликта именно в минимаксной форме, обеспечивающей некоторый гарантируемый результат, разработка методов их решения предложены Н.Н.Красовским и развиты А.Б.Курканским, Ю.С.Осиповым, А.И.Субботиным и их сотрудниками и учениками для различных классов динамических систем. Ряд принципиальных результатов теории наблюдения, оценивания и управления в условиях неполной информации получен в работах Д.Бертсекаса, В.И.Гурмана, М.И.Гусева, И.Я.Каца, А.В.Кряжимского, М.С.Никольского, В.Г.Поко-тило, Б.Н.Пшеничного, А.Г.Ченцова, Ф.Л.Черноусько, Ф.Швеппе,
B.Шми ттендорфа и других.
Существенные трудности, возникающие при исследовании задач оптимального управления, привели к необходимости разработки приближенных аналитических методов построения решения. Ряд этих методов связан с наличием в математической модели динамической системы малых параметров, обусловленных, например, малостью нелинейных членов, малой помехой в управляющем устройстве, малыми коэффициентами при управлении или неопределенном возмущении, временной раз-номасштабностыо переменных и др. Для построения приближенных решений в таких ситуациях используют методы теории возмущений, причем выбор того или иного подхода существенно определяется типом зависимости от малого параметра правых частей дифференциальных уравнений Сописывающих динамику управляемого процесса) - регулярный или сингулярный. Теория приближенных аналитических методов с приложением к задачам управления для регулярно возмущенных систем развита в работах Л.Д.Акуленко, Э.Г.Альбрехта, В.Б.Колмановского,
Н.Н.Моисеева, В.А.Плотникова, Ф.Л.Черноусько и других.
Проблемам оптимального управления сингулярно возмущенными системами в последние годы посвящено много работ, в которых предлагаются различные приближенные аналитические методы построения субоптимальных режимов управления. В основном рассматривались задачи с функционалами качества, либо зависящими лишь от медленных переменных, либо квадратичными по своей структуре. Исследования в них проводились по следующим схемам:
- сведение с помощью принципа максимума исходной задачи к краевой
и последующая ее декомпозиция на основе метода пограничных функций;
- усреднение либо непосредственно правых частей уравнений движения и переход к более простой задаче управления Снапример, стационарной) , в общем случае на основе дифференциальных включений, либо уравнений краевой задачи принципа максимума Сили иных соотношений, задающих условия оптимальности).
Указанные подходы были развиты в работах В.Г.Гайцгори, В.Я.Глизера, М.Г.Дмитриева, А.И.Калинина, Л.В.Кокотовича, Г.А.Куриной, Р.Е.О'Малли, Н.Н.Моисеева, А.А.Первозванского, В.А.Плотникова и других. Применение этих схем исследования позволили получить некоторые приближения оптимальных решений, выделить ряд специфических свойств сингулярно возмущенных задач управления С асимптотика траекторий, явление скачка в функционале качества, если последний зависит как от медленных, так и от быстрых переменных). В то же время эффективность используемых методов Св частности, точность получаемых приближений) существенно зависит от степени гладкости правых частей уравнений движения, функционала качества, в том числе от вида и типа последнего Слибо зависимость только от медленных переменных, либо квадратичная структура, лисЗо наличие определенных условий периодичности), а такта от ограничений на уп-
равления и состояния динамической системы.
Б отличие от указанных схем исследования задач оптимального управления метод решения, предложенный А.Дончевым, основан на описании асимптотики множества достижимости сингулярно возмущенной системы С а не аппроксимации экстремалей из принципа максимума). Данный подход достаточно конструктивен и позволяет построить приближенное решение при сравнительно стандартных Св теории оптимального управления) условиях и ограничениях. Однако А.Дончевым получены лишь начальные оценки (с точностью о(1) по малому параметру).
В современной теории управляемых систем хорошо известна задача оценки неизвестных координат фазового вектора по данным измерений. Основополагающие результаты в теории наблюдения получены Р.Калманом и Н.Н.Красовским. Развитию теории наблюдения и разработке методов апостериорного оценивания состояния динамической системы посвящены работы А.Б.Куржанского. Центральное место в этих исследованиях занимает изучение свойств информационных областей системы - множеств допустимых состояний, совместимых с результатами измерений. Описание указанных областей позволяет получить минимаксные оценки неизвестного истинного состояния системы. Исследование эволюции информационных множеств во времени по ходу реализации наблюдаемого сигнала, составляющее предмет минимаксной теории наблюдения и фильтрации, представляется важным именно в перспективе улучшения результата управления динамическим объектом, для определения законов игрового позиционного наблюдения в условиях неполной информации. Таким образом, возникает проблема о совокупной оптимизации процессов управления и наблюдения. Процесс сочетания управления и наблюдения допускает большое разнообразие постановок: оптимальный синтез стратегий управления по данным наблюдения; выбор последовательности чередования интервалов управления и наблю-
дения; задача коррекции движения Сработы Б.И.Ананьева, А.С.Брату-ся, Н.Н.Красовского, А.Б.Куржанского, А.А.Меликяна, Д.Е.Охоцимско-го, В.А.Рясина, Ф.Л.Черноусько, Г.С.Шелементьева и других).
Диссертация посвящена разработке и обоснованию аналитических итерационных методов решения некоторых сингулярно возмущенных и квазилинейных задач теории оптимального управления, использующих идеи малого параметра. Для процессов, динамика которых описывается обыкновенными дифференциальными уравнениями, в работе рассматриваются задачи программного управления ансамблем траекторий в присутствии неопределенных входных возмущений, задачи апостериорного оценивания состояния системы по данным наблюдения при наличии помех, а также проблема о совокупной оптимизации процессов управления и наблюдения - задача коррекции.
Цель работы - разработка и теоретическое обоснование аналитических приближенных или асимптотических методов решения некоторых сингулярно возмущенных и квазилинейных задач управления и наблюдения в условиях неопределенности, а также задачи коррекции по данным измерений; разработка на основе этих методов вычислительных процедур; вывод достаточных условий оптимальности в некоторых сингулярно возмущенных и квазилинейных задачах управления; асимптотическое оценивание ансамблей траекторий, множеств достижимости, информационных множеств сингулярно возмущенных систем, функционирующих в условиях неопределенности.
Методы исследования. Диссертация выполнена в рамках исследований, ведущихся Свердловской школой Сныне в Екатеринбурге) по проблемам оптимальных управляемых процессов. Используются постановки задач, понятия, методы и результаты теории управления и наблюдения в условиях неопределенности. Работа опирается на методы теории экстремальных задач, нелинейного и выпуклого анализа, приб- ,
лияенные и численные методы в теории обыкновенных дифференциальных уравнений, метод малого параметра Ляпунова-Пуанкаре и асимптотические методы нелинейной механики.
Научная новизна. В диссертации разработаны аналитические приближенные методы решения сингулярно возмущенных и квазилинейных задач управления и наблюдения в условиях неопределенности; установлены достаточные условия оптимальности для систем указанного вида. Получены аналитические описания информационных множеств, множеств возможных начальных состояний наблюдаемых квазилинейных систем, функционирующих в условиях неопределенности, по данным измерений. Найдены асимптотические представления этих множеств в сингулярно возмущенных задачах апостериорного оценивания. Для построения оптимальной стратегии корректирования для квазилинейных систем разработаны итерационные схемы вычисления гарантируемых оценок управления Сиз текущей позиции и на основе множества допустимых продолжений наблюдаемого сигнала}. Исследованы асимптотические свойства ансамблей траекторий, множеств достижимости управляемых сингулярно возмущенных систем.
Полученные результаты являются новыми для квазилинейных и сингулярно возмущенных систем.
Теоретическая и практическая ценность. Результаты диссертации имеют теоретическое и практическое значение для математической теории оптимальных управляемых процессов, общей теории дифференциальных уравнений с малым параметром. Работа носит конструктивный характер. Разработанные в ней аналитические приближенные методы решения задач оптимального управления и наблюдения состояний динамических систем в условиях неопределенности могут эффективно применяться для исследования конкретных прикладных задач, поскольку допускают численную реализацию на ЭВМ.
Апробация работы. Результаты диссертации докладывались на:
- Всесоюзном семинаре "Проблемы оптимизации и управления динамическими системами в машно- и приборостроении" СВладивосток, 1987 г.);
- VI Всесоюзной конференции по управлению в механических системах СЛьвов, 1988 г.);
- VII Всесоюзной конференции "Управление в механических системах" ССвердловск, 1990);
- Республиканских конференциях "Моделирование и исследование устойчивости систем" СКиев, Украина, 1991 г., 1992 г., 1994 г.);
- II Международном семинаре "Негладкие и разрывные задачи управления и оптимизации" СЧелябинск, 1993 г.);
- Межгосударственной конференции "Динамические системы: устойчивость, управление, оптимизация" (Минск, Беларусь, 1993 г.);
- III Международном семинаре "Негладкие и разрывные задачи управления и оптимизации" (Санкт-Петербург, 1995 г.).
Результаты работы обсуждались на научных семинарах Уральского государственного университета им. А.М.Горького, Института математики и механики Уральского отделения РАН.
Публикации. Основные результаты диссертации опубликованы в 23 работах, список которых приводится в конце автореферата.
Структура и объем работы. Диссертация состоит из введения, двух частей, содержащих 7 глав, которые включают 31 параграф, заключения и списка литературы. Объем диссертации составляет 330 страниц машинописного текста. Библиография состоит из 184 наименований .
СОДЕРЖАНИЕ РАБОЙ
Математическими моделями многих управляемых динамических процессов являются сингулярно возмущенные, квазилинейные системы вида
g|= ACt,(i)z + BCt,n)u + C(t,p.)v + |j,iCt,z,n,D,
где матрицы ACt.p, BCt.nJ, CCt,|i), вектор-функция i(t,z,}i) допускают разложения по малому параметру ц С в области Ск ц как регулярные: тогда их элементы при ц-» +0 являются ограниченными; так и сингулярные: тогда они представимы следующим образом ACt.p,) =
Л Л*
= prCACt3+A(t,(J,)), ACt,(i) ограничена при ц-»+0. функция fCt,z,|A) определяет малую нелинейность в системе - квазилинейность.
В диссертации разрабатываются асимптотические методы решения
задач оптимального управления и минимаксной оценки состояния по
11 ?")
данным измерений Св постановках * ^ D для таких систем, причем в первой части рассматриваются линейные модели Слри ICt.z.jxJs О), сингулярно возмущенные по параметру ц,, во второй части - квазилинейные объекты, как регулярные по параметру, так и сингулярно возмущенные. Асимптотические представления решений поставленных задач получены при условии экспоненциальной устойчивости для подсистемы быстрых переменных ^.
Первая часть состоит из двух глав. В первой главе рассматри-
1 басовский H.H. Теория управления движением. М.: Наука, 1968. 476 с.
Куртанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. 392 с. u Васильева А.Б., Дмитриев М.Г. Сингулярные возмущения в задачах оптимального управления // Итоги науки и техники. Сер. Математический анализ. М.: ВИНИТИ, 1982. Т.20. С. 3-77.
вается задача управления по минимаксному критерию для системы dx/dt = A„(t)x + A,,(t)y + B,(t)u ,
C1.1)
рЛу/dt = AJ((t)x + A„Ct)y + B2(t)u ,
"где t«T= [t0,t, ]; x6 rn, y« r"; us rr- управление; A(J(t), Bj(t), 1.3=1.2, - матрицы соответствующих размеров с непрерывными элементами. Начальное состояние x(t0) = х,, уС t0) = у„ системы точно неизвестно и заданы лишь ограничения х0® Ха, у0е уя, Х0, ЭД - выпуклые компакты в соответствующих пространствах. Реализации uCt), te т -измеримые по Лебегу функции, удовлетворяющие условию uCO« Р, Р -слабо компактное выпуклое множество в П-^СТЗ. В частности, рассматриваются следующие два типа ограничения Ссоответственно, геометрические и интегральные):
Р= OiCO | uCt)e PCt), t« T>, (1.2)
P(t) - заданное многозначное отображение со значениями в виде выпуклых компактов (в £Rr), непрерывное по t в метрике Хаусдорфа; t.
Р= {и( ■) | J u'Ct)R(t)uCt)dt < X1 >, (1.3)
to
Х= const > 0, R(t) - симметричная, положительно определенная матрица с непрерывными элементами.
Введем следующие обозначения: z'= Сх', у'); 2, = Х„ х ZCt;uCO,2"0), множество (ансамбль) траекторий z(t;u( •) ,z„)
системы (1.1), исходящих из Zt, при фиксированном u(-)« Р; Определим функционал
J(u(-)) = max cpCzCt, ;u( •) ,z„)), (1.4)
z «2Г,
где cp(-): r"** -» r - заданная выпуклая конечнозначная функция.
Задача 1.1.*3 Среди управлений uCO« Р найти оптимальное и =
^Определения, теоремы и т.д. нумеруются по тексту диссертации.
= иСО, доставляющее минимум функционалу J на множестве Р:
еа.) = ЛиЗ = т1а «ГСиС-ЗЗ. иС-З-еР
2)
С1 .53
Указываются общие соотношения , описывающие оптимальное решение. Приведенные условия оптимальности содержат малый параметр ц, причем решение при 0 (соответствующая задача названа вырожденной! не дает в общем случае даже начального приближения к решению исходной задачи. Использование методов малого параметра для разработки эффективных вычислительных процедур здесь возможно лишь на основе качественного исследования асимптотических свойств сингулярно возмущенных систем. В §2 рассматривается фундаментальная матрица решений системы С 1.13, представленная в блочном виде соответственно размерностям быстрых и медленных переменных:
т.тз =
г,, сг,т;цз г,
г21
С 1.6)
здесь ги .И.тгц], га1 [-ь, ггг СЪ,т;м.] - матрицы с
размерами соответственно пхп, пхш, шхп, тхт. Получены асимптотические представления (по параметру ц, (X ц $ ц0, достаточно малоЗ блоков 1,3=1,2, фундаментальной матрицы. Указаны оценки
для них, а также рекуррентные форкдглы их вычисления: при г^т^Ъ^,
г т
t
усг.т] + |2^>[г,в;ц]А1,С83УСз,тг]бз; т
г т
г
С[Ъ,т;|1]= уусг.в^.свзг^'са.тгцзаз; к = 0,1,2,.
(2.183
2",сг.т;ц]=х0[г,т]. 2™' [г,т;|1]= У[г,т], где Х„^,т], YLt.Tr] - фундаментальные матрицы соответственно вырожденной системы С при и^О) х= А0С 1;)х+В0( 1;)и и подсистемы быстрых переменных (ху=Аг2Сг)у, причем А0а)=Аиа)-А12ст^стг,с1;), в0с«= в,с«-А1ас«^с«вас«.
На основе полученных представлений исследованы асимптотические свойства ансамбля тракторий управляемой сингулярно возмущенной системы, множества достижимости, найдены аппроксимации их опорных функций. Предлагаемая процедура позволяет построить оптимальное решение с заданной степенью точности (относительно параметра р. Разрешимость исходной задачи управления, а также допустимость используемых аналитических конструкций определяется рядом требований: вполне управляемость 1^ вырожденной системы (для медленных переменных) и подсистемы быстрых переменных (стационарные условия управляемости), условия регулярности экстремальных элементов, обеспечивающие невырожденность условий оптимальности, в том числе в пограничном слое концов траекторий сингулярно возмущенной системы (предположения 3.1, 3.2).
В §3 получено начальное приближение оптимального решения задачи 1.1 для геометрических ограничений (1.2).
Теорема 3.2. При СКрЗД,, ц,0 достаточно мало, справедливо е'и,) = е "(г,) + о(1),
8<0>(^)= шах|зе<0>(р,д)| рлГ, дл"]« а:0>(р°\О, (3.14)
Ъ.
эе'Чр.ч) = -Ь**(р,ч) - |р(-в'(г,;р,д)Х0[г,,т]В0(т)|Р(тг))йт -00
- |р(-д'Ф0[г),з]В2(Ъ1) I ри,))<18,
о
1\(р,д)= ср*(р,д) -рО'С^р.дЭХ^*. 5
гле з'СЬ, = р' -ц' А^ЗА,,«,); Ф^.в], Ф0[г,,О]= Е„ - фундаментальная матрица решений уравнения с постоянными коэффициентами у= А32Сг,)у; р( - опорная функция множества X на элементе е. Рассмотрим управляющее воздействие и"'С0:
Ги0>Ст), г„< х ^ 1,-аСм.),
' V [сг.-тд/н], г.-асц.) < т ^ г,,
где а= аСре к, а> 0, а= оШ, а/Ц -» +ш при ц-* +0; и'Чо, определяются условиями: для почти всех теТ з'Сг);р<0>,д<0>)Х0[^,т]В0Сг)и0>Ст) =
min s'Ct. ;рсо> ,q<0>)X.[t. ,t]B„(t3u(t3; (3.16)
И(ТГ)еРСТ)
для почти всех в^ О
а"'' ©„ Et. ,s]B,(t, )v 0>(s)= min q<0>'©ott, ,s]B2(t,)v(s). (3.17) 1 41 V(s)eP( t,)
Теорема 3.3. Пусть выполнены предположения 3.1, 3.2. Тогда
при CK ц. , достаточно мало, выполняется равенство
e°(t,)= J(u(-))= J(u"'(-)) + оС 13 -
Следующую задачу будем называть предельной.
Задача 3.1. Среди управлений иСт)еР(тг), Tett^t,], vCs3ePCt,3,
в-[0,«0. найти u<0>= u<0>(-), vt0>= v°'(0:
J<0>(u0>,v<0>) = min{j""(u(-3,v(-3)| uCOePCO, v(-)e P(t,)}.
J""CuC-),vC-)3 = maxjtpCzCt.juiO.viO.xp) | x„e (3.19) где обозначено
zCt,;u(-3,v(-3,x03= Jx[Ct,) | [-A^Ct,)AJ1(tI)x0Ct1) +
+J®„ [t, ,s]BJ(t1)v(s)dsJ j ,
причем x0( •)= x„C- ;u(-3 ,x0) - решение вырожденной системы (по х). Некоторый аналог предельной задачи рассматривался для неизме-
няемых геометрических ограничений на управления и при отсутствии
неопределенности по начальным данным в ^.
Теорема 3.4. При предположениях 3.1, 3.2 задача 3.1 разреши,,, (О) (0> . - .
ма, причем: (i) u , v удовлетворяют условиям минимума С3.163, С3.17) и доставляют значение функционалу J(0'Cu",v")= s<0>Ct,3; (ii) выполняется неравенство sco>C< e0(t,), где s„Ct,D- оптимальное значение функционала в вырожденной задаче.
Пусть СХ k=1 ,2,...- некоторая сходящаяся к нулю последо-
вательность чисел; u'0>CO, k=1,2,...- соответствующая по-
к
следовательность управлений вида С3.15). Выделим подпоследовательность i\0>( О, слабо сходящуюся С при lCj соЗ к некоторой функции и 0>( ОеР, и обозначим соответствующую последовательность оптимальных (для задачи 1.13 управлений uj С 0=и С• 3 , J=1,2,..., а также v° С Os vC• 3, v°Cs,(i3= и сг,-ца,|л), 0 $ s $ i < при
J j ° г
0< p. , где еХЗ - произвольно выбранное число.
Теорема 3.6. Пусть выполнены условия предположений 3.1, 3.2, причем максимум в (3.14) достигается на единственном векторе . Тогда: (1) ц СО слабо сходится к u""C0, v° СО слабо сходится к v0>CO Сна [0,1/е] для любого е>0 3, для которых выполняются С3.163, С3.173;
(II) равномерно по всем I в к"*", t i = 1,
ipCfl ZCt, ;u°CО,Я03 - pCf| 2rCt,;<0>CO,Z033| где ш0СцЗ =оС13, 0 < р, < ц,;
(III) при ц +0 множество ZCt, ;u°С О ,2,3 сходится в хаусдорфо-вой метрике к выпуклому, замкнутому, ограниченному множеству
ZCt,;u<0',v"",*03= S- zC t, ;u05 ,v(í,,x03, x0e xo}.
^Дончев А. Системы оптимального управления: возмущения, приближения и анализ чувствительности. М.: Мир, 1987. 156 с.
Начальное приближение оптимального решения задачи 1.1 при интегральных ограничениях С 1.3) получено для различных вариантов разложений матрицы коэффициентов при управлении в подсистеме быстрых переменных. Рассмотрим следующий случай: пусть в С 1.1) вместо В2и) имеем ур ВаШ. Тогда предельная задача имеет вид:
Задача 4.1. Среди управлений иСт), геТ, уСз), Вб[0,+оо), удовлетворяющих условию {\1С О ,УС О } « Р*" ,
4
иС О ,vC О
Ju'CT)RCT)u(T)dT + Jv Cs)RCt,)vCs)ds ^ Л2
t. 0
CO) CO)- CO) <05-
найти u = u С О, v = v CO, доставляющие минимум функционалу Jt0>CuCO,vCO) C3.19):
j'^Cu05,v<c>)= min jjco'CuCO .vCO) | CuCО ,vC О >. P<0'}
Оптимальная пара этой задачи u0>, v0> доставляет значение
-СО), СО) СО)- СО), . .
J Си ,v ) = е Ct,),
sts>Ct,) = max |ae""Cpsq) | p* к*. q* o?"}= a",Cp,,\q"'), ae<0>Cp,q) = -h**Cp,q) - *Ce,Cp.q»"\
С 4.5)
e„Cp,q)= |s'Ct1;p,q)X0[t1,T]BIC'«R"Cx)B^CT)XJt1,T]sCt1;p,q)clT +
+ |q'®0Ct1,s]BJCt1)R',Ct()B'JCt,)®/, [t(ta]qda. О
причем e(0>(t,K e0Ct,).
Рассмотрим управляющее воздействие ц"'СО:
u<0>Ct), t, $ t < t.-аСц),
Ct) =
-i- v' °' fct,-T)/vi], t,-QC|i) ^ т ^ t, L yjp t J
C4.10)
Как и в теореме 3.6, выделим подпоследовательность С О, слабо
1
сходящуюся (при к -» «О к некоторой функции и"'(-)« Р, и обозначим
У°СО ау'С-.Ць), УСЗ.Ц) = Ур иЧъ-цв.ц),
) з
э ^ | < аСц)/ц при СК (X ^ щ,, где е> 0 - произвольно выбранное число, ц, достаточно мало. Тогда (при соответствующих условиях регулярности и единственности доставляющего максимум в (4.5)3:
С -3 слабо сходится к и°Ч-), V® (•) слабо сходится к у°Ч-) (на [0,1/е1 для любого е > 0), где и'°Ч-), V °Ч ■)- оптимальная пара в предельной задаче 4.1; при 0< ц, справедливы:
еЧ^.ц) = Ли (-33 = .Ки^Ч-ЗЗ +0(13,
8°(г,,(13 = е'Чг.з + 0(1):
для оптимальной пары задачи 4.1 и (О, v (-3, управляющего воздействия и"Ч-3 (4.10) выполняются (II), (111) теоремы 3.6.
Рассмотрены другие варианты разложений (по параметру р матрицы коэффициентов при управлении в подсистеме быстрых переменных. В частности, если вместо В2("Ь) в (1.1) имеем е?(ц)ВгСЪ), е(ц,)=о(Ур, 0< ц ^ ц,, то в предельной задаче необходимо положить В2( • )з о, у(-)э 0, т.е. решения предельной и вырожденной задач совпадают. Если б(ц)= о(1), е(цЗ/Ур -♦ +оо при ц-* +0, то теперь уже могут нарушаться условия регулярности , поскольку имеется "излишек" ресурсов управления по быстрой переменной.
Последующие приближения оптимального решения в задаче 1.1 получены в §5. Используемые методы позволяют построить управляющее воздействие, приводящее к результату, аппроксимирующему оптимальное значение функционала качества с любой заданной точностью.
Предположение 5.1. Элементы матриц А,,(тЗ, А^Ст) на Т имеют ограниченные производные.
Случай геометрических ограничений (1.2). Пусть с\= а1(|1)> 0: сз^С^З =ОС 13, с\Сц)41 ■♦ +со при +0, причем для т е Щ .^-с^Сц) ]
|YCt, ,т] J < c0exp(-^( с0ц N,, N,>0- некоторая постоянная.
Рассмотрим управления u""( • , 7<10С-,цЗ, определяемые условиями: при почти всех т« [Ъ0 .^-о^Сц.З ], sc ГО.а^СцЗ/р.)
т'"Сх.% ,p"\q<kJ;pviik>CT,^ = min. r^'CT.t, ,р ",q ";м-ЗuCт),
HCT) «PC-О
r, Cs,t,,p ,q ;lüv Ct,li) = min r, Cs.t.,p ,q ;цЖз),
VC S) eVC S)
где V(s)= PCt,-|is); p<k>, qCk>- максимизирующие векторы в выражении
max|ae<l>(p,q;|A} | p^Rn,q^R"j= эе""Ср<к>;ц), t,-ak
as>k>Cp,q;|J.)= -ii** Cp.q) - JpC-r^Cx.t, ,p,q:p |PCT))dT-
t.
ak4i
- JpC-r^'Cs.t, ,p,q;n) |VCsDDds, 0
l\t>Cp,q)= cp*Cp,q)- p(p'Z"'[t,.t0;n3 + ctk4i
+ Jq' ФСt,, s;ц]А2)Сt, -цб) z"5 ttj-jxs ,t0 ;|j,]cls | X,]-0
ak4i
-p(p' С [t, ,t, ;ц]+ Jq'flMt, .BinlA^Ct.-MSixz;" [t,-^s,t0;n]ds| ; 0
обозначено Ott, ,а;ц.]= Ytt, Д,-цз]; вектор-функции r^'CT.t, ,p,q;|i), 1=1,2, определяются соответствующими формулами. Теорема 5.1. (1) управляющее воздействие
v " ,ц], t.-о^Сц) < т < t,,
доставляет оценку e"ct,) с точностью ОСцк*'), CK ц ^ ц0, Е° (t,) = JCuCO) = JCii,k>C-)) + 0С|/М);
(Ii) 8°Ct1)= E<k>(t,,|i,) + 0C|ik").
и(к>Ст)=
Последующие приближения оптимального решения исходной задачи управления получены и для случая интегральных ограничений С1.3). Указанные схемы могут применяться при различных постановках задач управления сингулярно возмущенными системами (максиминные, быстродействия, перевод из точки в точку при минимуме ресурсов и т.д.).
Во второй главе рассматриваются вопросы оценивания фазовых состояний наблюдаемых сингулярно возмущенных систем с неполной информацией Снеопределенность по начальным данным, входным возмущениям, помехам измерений). Задачи оценивания по реализациям наблюдаемого сигнала рассматриваются в минимаксной постановке При этом оценкой неизвестного фазового вектора служит информационное множество состояний системы, совместимых с данными измерений на текущем отрезке времени. Входные возмущения и помехи измерений стеснены интегральными квадратичными ограничениями. В этом случае для линейных систем решение задачи оценивания хорошо известно: информационное множество есть эллипсоид в фазовом пространстве, его центр определяет оптимальную минимаксную оценку состояния наблюдаемой системы. В то же время, для сингулярно возмущенных систем выделение асимптотики (по параметру |1) элементов, определяющих информационное множество, на основе известных соотношений весьма затруднительно. Ведь уравнения минимаксной фильтрации в данном случае являются сингулярно возмущенными (причем часть уравнений -типа Риккати). Разложение определяющих фильтр элементов по медленным и быстрым переменным ведет к резкому увеличению размерности задачи. Использование различных приближенных схем построения решений сингулярно возмущенных систем (метода пограничных функций, усреднения правых частей) здесь также не всегда возможно. В данной ситуации присутствует и характерная особенность сингулярно возмущенных систем: решение вырожденной задачи Сполученной при ц = 0)
не дает даже начального приближения к решению исходной задачи.
Рассматривается сингулярно возмущенная система
с1х/т= А„сгзх + А,,съэу + с.сгзу,
12 ' Сб.13
цлу/йг= Аг1изх + А„сиу + сасгзу,
с наблюдением
"Л = й.С «X + в, С «у + Сб.2)
где г« Т=СЪ0,1:, 3; V« к', к"- неопределенные возмущения, реализации которых есть измеримые по Лебегу функции, удовлетворяющие совместному квадратичному ограничению
1\ СУС-3,|С-33 = |С СтЗНСтЗ £СтЗ+У СТЗГСтЗуСтЗЗйт < V , С6.3)
> 0; НСт), ИСтЗ - симметричные, положительно определенные матрицы с непрерывными элементами.
Обозначим: т^С-З- реализовавшийся на сигнал Сб.23;
2Ст;у,24Э=Сх'Ст;у,х13,у'(т;т',у1)3'- решение системы Сб.13 на при у= уС-3 и с конечным условием 2Ш= гь=Сх;, у;3'; ??сг,-3 = -33- информационное множество Смножество состояний системы Сб. 13, совместимых с реализовавшимся сигналом т^С-ЗЗ.
В диссертации разработан итерационный метод построения информационных множеств для сингулярно возмущенных задач апостериорного наблюдения, в основе которого лежат:
- рекуррентные соотношения С2.183, определяющие фундаментальную матрицу при блочном представлении, ее асимптотические оценки;
- аналитическое описание множества возможных начальных состояний системы, совместимых с результатами измерений на текущем отрезке времени;
- асимптотика ансамбля траекторий, множества достижимости управляемой сингулярно возмущенной системы.
В §7 получены: дифференциальные уравнения для величин, определяющих описание множества возможных начальных состояний; формулы вычисления характеристик информационного множества через эти величины; соотношения для опорной функции множества достижимости, совместимого с реализовавшимся сигналом наблюдения к данному моменту г. Обозначим: С^С«! 02С«);
ACt) =
■ A, ( Ct) A(iCt) ' ' C,Ct) ■
, CCt) =
¡¡A„Ct) . i
(7.1)
Теорема 7.1. Опорная функция информационного множества ЖЬ,-] вычисляется по формуле
р(г|жг,т]1(-))= ?'сс« + (V- ^(^"'(Ур'Чт]"2,
где Р"'С«, сСИ, 1г*Ш есть:
С7.23)
Р (t)= ACt) + A(t,t,)P, cm (t,t„), t
c(t)= ACt,t„)c0Ct) + |ACt,s)nCs)G,Cs)HC3)T]lCs)cIs, t.
h2Ct) = hjct).
Здесь P„Ct), c0Ct), hjct) - характеристики, определяющие описание множества возможных начальных состояний.
Теорема 7.3. (i) ACtD, ACt.T), P0(t), d„(t) есть решения следующих дифференциальных уравнений: dflC t) /dt= AC t) AC t) +AC t) А' С t) -AC t) G' С t) HC t) GC t) AC t) +
+C(t)R'Ct)C'ct), O(t0)= 0;
dA(t,T)/dt= CACt)-ACt)G'ct)HCt)GCt))ACt,T), ДСт,т:)=Е„,
C7.28) С 7.29)
dP„Ct)/dt= A Ct,t„)G Ct)HCt)GCt)ACt,t„),
P0Ct0)= 0;
(7.30)
dd0Ct)/dt= Д С t,t„)G Ct)HCt)CiltCt)-GCt)aiCt)), d„Ct0)= 0.
(ii) Величины cCt), hzCt) C7.23) есть
cC t)= Act,t0)p*'ct)d,ct) + a,Ct),
и
112и) = ^СаЗ-ОСБЭсСаЗЗ'НСвЗС^СвЗ-ОСвЗсСаЗЗба.
г
авС«= |лсг,в)ПСв)0'СБ)НСа)т11.С8)(1з.
г.
В §§ 8,9 исследуется начальная асимптотика информационных множеств для сингулярно возмущенных систем. Выделяются некоторые случаи разложения матриц коэффициентов при входных возмущениях в подсистеме быстрых переменных, определяющие качественно различное поведение информационных множеств. Указывается предельная задача наблюдения, позволяющая получить начальное приближение для решения исходной задачи Счерез опорные функции). Найдены асимптотические разложения величин, формирующих аналитическое описание информационных множеств. Разрешимость исходной задачи наблюдения, допустимость используемых аналитических конструкций определяется рядом требований: вполне наблюдаемость 13 вырожденной системы С по медленным переменным) и подсистемы быстрых переменных Сстационарные условия наблюдаемости); сигнал т}ьС •), реализовавшийся при 0< ц ЗД для
системы С6.1), Сб.2), таков, что Цт^СО] . <
о-.СЕг.д])
Представим ПС г), ДСг.т), Р0СЪ) в блочном виде Скак С1.6)): (ц, ю], Р.С«- 4,»,*)= [А/*.^]. 1.3-1.2.
Пусть Ас0)СО, з^Ш, я^СЮ - матрицы соответствующих размеров - решения следующих уравнений:
- п1»,с«о'0сг)нс«с0сг)п(0)сг) + о,сюм«о'0сг). п(0)с^}= о, ЦЙЬ^С«/« = А22сг)^сг)+5с,сг)А#„с«-5и,сг)с'гсг)нсг)с2с«^сг) + + с3сг)Н"'сг)с2с«, о,
+ о.сш'Чмо'.с«, зс.С и0э= о,
где обозначены С без указания аргумента г):
00=0,-0АХ. Ъ^-ЪгК'Х,. Л.Ч^К'ЙА,,
И= И" -ВГ'К НКй", К= а2А;;С2, А21 =А21 НО,. 1=1,2.
Лемма 9.1. При 0< ц. ц, достаточно мало, X} ^-н^Сц), имеют место следующие разложения:
п,,с«= п(0)сг) + осп; л,2сг) = п21ш= + осп,
0«= гс.аз-п^сш'^сгхА^сш';
+ + оС1), С9.15Э
+1 |т,тКА„ст)ест)+еЧт)А2)стш' сг.тит;
#а% л/ « / л
где СС«= й,2 С«+Л(0,СШ21Сг)СА22СШ , УГЬ.т] - фундаментальная
А
матрица решений системы Аг2Шу.
Используя соотношения С2.18), С9.13) получим при 0<(1
д,,с1;,тз= дЦЧг.-й + оС1), д2гсг,т:)= пг.т] + осцэ,
д21сг,т)= -а;2с ъз а21 с г) д"' с г ,тгз [ г ,т] а;'2с тз дг1 с т) + осп.
где а"'с«= аис«-сп(0)сг)о|сг)+п;°'сг)о2сг))нс«^с1), 3=1,2; д"'С"Ь,т) - фундаментальная матрица решений системы (Зх/£№= А„СШ,
а0ш= А0сг) - о,„сгз6',сгэнс«6,с«;
р,, с« =р< „, с« +ос р.), р22с « =^,0, с« +ос ц). р, г с« =р'2 , с г) =цо, с г)+ос ц),
t
P(0) С t3 = jc СT, t, 3 g'0 (T3HC T3G0 С t> Д"' ст. t0) IT, t0
QICtD=-P<i)Ct)A1JCt0)A;;ct03-G'0Ct03HCt0)G3Ct0)A;;Ct0) + +A;iCt0)CA;;Ct033'Q2"3.
4»
0
0,(^3= 1 Jy' It, t„ ]G2СтЗНСтЗG2C тЗ Y [т,t0 Их".
to
а также разложения для abCt3= (aj0>'ct3, a^"' Ct)J + oC13, d0Ct)= = [<"' Ct3. ¿£0>'ct3]' + oC 13. где c(0>Ct3, di°'ct3, 1=1.2, определяются соответствующими формулами.
Георема 9.1. При для любых fes"**, ¡f||=1. t> t,+0jC|i3
справедливы равенства: (1) cct3 = [c"''ct3 I c"''(t)] +0С13.
с, Ct3= д„ Ct,t03P„,Ct3d, Ct3 + ц Ct3,
c2"ct3= -A;2ct3AJ1ct3c1""ct3 + о^аз; t
(11) tiCt3 = J С T) -G0 С гЗ с"' С тЗ -G2 С тЗ а, С тЗ J' НС тЗ ^ С тЗ -t,
- G, С T3 cj0' С T3 -G2С тЗ а,С T3 J йт + 0(13; (ill) pCf|WCt,Tit(-333= B'ct.nc^CtD + q'a,Ct3 + Cv2-hJCt33"S<
x[s/ct,f3p;,ct3s'ct,n + lq\ct3q + 2Cp'eCt3 +
1 r , л. л л, -,1'2
+ 1 Jq Y[t,T]A21CT36CT3Y [t,T3dTr3qJ + oC13, t.
/ t в Л # | /А. j Л
где обозначено I = Ср ,q 3, а Ct,0 = р -q A22Ct3A21Ct3, p;'ct3= fl(i)ct3+A;;,ct,t03p;:)ct3A;;,'ct,t03.
В §10 для величин С7.283-С7.303, определяющих описание информационного множества WCt.T^C-), приводятся рекуррентные соотно-
шения для вычисления приближений более высоких порядков точности (относительно параметра ц) при дополнительном условии: элементы матриц А„Ст), Aj[cтЭ имеют на Т ограниченные производные. Тогда при (к ц получим асимптотическое представление
ре г| ж t ,i]t с •)))=t с,„,с t J +с v-^c t)) w\ e p^c и о "*+ ос ц").
Во второй части диссертации, состоящей из пяти глав, рассматриваются квазилинейные системы Скак регулярные по параметру - главы 3-5, так и сингулярно возмущенные - главы 6,7). Основное внимание уделено обоснованию аналитических приближенных и асимптотических методов решения сформулированных задач управления и наблюдения для таких систем.
Проблеме программного управления движением квазилинейной системы по минимаксному критерию посвящена глава 3. Система функционирует в условиях неполной информации о начальных данных и входных возмущениях. Ограничения на управления рассматриваются как геометрические, так и интегральные квадратичные. В настоящей работе получены достаточные условия оптимальности С §13 ), основанные на свойствах локально минимаксных равномерно по параметру движений квазилинейной системы и условиях невырожденности оптимального решения для системы линейного приближения. Источником этих результант
тов являются исследования Н.Н.Красовского , посвященные выводу достаточных условий локальной оптимальности управлений в нелинейных системах для задачи предельного быстродействия.
Рассматривается управляемая система
ACt)z + BCt)u + CCt)v + jiiCt.z), C12.1)
где tetd.t,]; zetR", управление, v«Rr- неопределенное возмуще-
^Красовский H.H. Об одной задаче оптимального регулирования нелинейных систем //Прикл.матем. и мех. 1959. Т.23. Вып.2. С.209-229. '
ние; АС , ВСгз, ССйЗ - матрицы соответствующих размеров с непрерывными элементами; вектор-функция 1С непрерывна по Ьс [-в, Ъ, 3. дважды дифференцируема по переменной г и соответствующие частные производные первого и второго порядка непрерывны в [$Д,]х2), V- некоторый компакт в к". Реализации \iCt3, уСО , ^[-Э.Ъ,] - измеримые по Лебегу функции, удовлетворяющие ограничениям иС-Зе и, '/(• Зе V, причем II, V - слабо компактные выпуклые множества соответственно в п-'ССй.^ЗЗ и [-АД, 33. Начальное состояние г, системы
С 12.13 точно не известно и задано лишь условие г,, 2, - выпуклый компакт в к". Обозначим 21 t:\iC-33, ФСЬ^;,- множество С ансамбль) траекторий гС1;;и,у,г,3 системы С12.13, исходящих из г,, при фиксированном иС-Зе и и при всех уС-)« V.
Рассматривается задача 1.1 на множестве и для системы С12.13 с функционалом «Г(иС-ЗЭ= тах СсрСг) | г« ЖЬ, ;иС-33}. Пусть 2°, V-максимкзирующая пара при и С ■ 3:
Ли°СОЗ= тах^фСгС^;и .у.г,)) | г,, УС-З«* V} =
= срСгС^ ;и .V0 ,г°33= е'и.З. С 12.83
Траекторию гС1;;и ,У°,г°3, ^ Ъ <1;, системы С 12.13, порождаемую управлением иС-3, начальным условием гС = и возмущением уС • 3, будем называть лшшюксной.
В линейном случае (при ГСг.гЗн 03 решение рассматриваемой за-
и
дачи известно . Пусть соответствующая оптимальная пара - и СО, причем вектор г"' находится из соотношений: е(0,С^З= тах{ав(0>СО| (е к'}= ае<0>Сг<0>3, С12.113
исй= Ф*Сп- рсг'т,,$]|г,з- рс/г^.-зсс-з^),
где 211,1]- фундаментальная матрица решений системы линейного приближения С полученной из С 12.13 при 1(1,23= 03; ср*С П , Ы функ-
ция, сопряженная к cpCz); h**C£> = CcoTDC П; рСаС-)|Р) означает
pCsCО |РЗ= max| JsCtDwCtMi | wC-)e pj.
Пусть z""(t;u( •)), t ¡множество (ансамбль) траекторий z<0>Ct;u( •) ,vc •) ,z,) системы линейного приближения, исходящих из Z,, при фиксированном u(-)«U и всех vC Ос V. Сечение 2""ct;uc-)) при каждом t« ] и u( •)е U является выпуклым компактом. Будем считать, что 2""(1;;и( О) всегда содержится внутри V.
Предположение 12.1. (1) Система линейного приближения вполне управляема ^ на Cfl.t,! при va 0.
(II) Максимум в (12.11) достигается на векторе
(III) Максимум в соотношении
s(11Ct,) = cpcz(0,ct, ;u'°'( •) ,v<0>( •) ,z<,0,))=
= niax|{pCz((1>Ct1;ii">CO,vCO.zp) | z,« Z,, vCO« v|
реализуется на единственной паре , v""(-).
Для существования ненулевого вектора в предположении 12.1С 11) достаточно выполнения следующего условия регулярности 23 pt„- lni sup Cp+q) < e^ctp, C12.13)
P q
при pe r", q« 2""Ct;uC-))|
[uC -)s0
Пусть z"(t,ji)= z(t;u ,v,z°), ^ t есть движение системы (12.1), порождаемое некоторым управлением u= и(-,ц)е и и парой zC ■О) = z°, v°= v С •), доставляющей максимум в С12.8). Введем следующие обозначения: wCt,ц»), ^t^t, - произвольная вариация Su управления и , определяющая допустимую управляющую функцию u= иС-,ц)еи, u(t,(i)= u°Ct,p,)+w(t,|J.), fl^t^t,; z(t,(i)= z(t;u,v,z„), -S^t^t,- соответствующее движение системы С 12.1) при начальном условии z(iJ) = z,
А Л
и возмущении v=vC•), доставляющих максимум
«Ки( 0)= тах|фСаСг1;и,7,ар)|2,е2',,уСОеу|= срСаСг, ;и,7,2,))= ЕСЪ,3;
Дг=ДгШ = 2(1,(13-z4t.il) - отклонение от траектории г°(г,ц), удовлетворяющее полным уравнениям возмущенного движения
А0(г,ц)Дг + ВС «те + С(г)с0 + цг(г,Дг), С13.2)
с начальным условием Дг,= ДгС тЭ) = здесь матрица к°С1,\х) есть
А°(г,ц)= Асг)+цэг(г,2°сг,р.))/аг, , ш= усг)~у0ш; функция
гСЪ.Дг) включает слагаемые, содержащие Дг нелинейно; С"Ь,т:;1л] -фундаментальная матрица решений (при «а да 0) системы, линейной к (13.2), т.е. при ги,Дг)з 0.
Определение 13.1. Движение г°(1,|1), О^СЬ, системы (12.1) при , порождаемое управлением и°( • и парой , V , называется локально минимаксным равномерно по ц, если можно указать такое чис-
л
ло е>0, не зависящее от ц, что не существует движения zCt.ii), ^^
Л л А
порождаемого управлением иС ■ II и парой г,, у(0, что выполняется неравенство еС^Ке"^), и при этом такого, что llzCt.fi)--2°(г,|а) | < е при всех ^ Ъ , СХ ц
Соотношение (12.8) представим в следующем виде:
е°(1)= тах тах тах ;и°( •) Ж ■) ф*С ?)]■=
г, у(-) е I J
= г''асг1;и0со,уссо,а^-ф*со, (13.8)
г,« г,, Ы ЭфСгСг,;и(0,у(-),г,)).
Приведем некоторые варианты достаточных условий оптимальности для квазилинейных систем (12.1).
Теорема 13.2. Пусть выполнены предположение 12.1(1) и условие регулярности (12.13). Если г(г;и°( • ,ц,) .Vе С О .г"), - движение системы (12.1) при Ск порождаемое и С • , у°( •). такими, что: (1) при интегральных ограничениях (вида (1.3)) управление и°С • ,ц)е и удовлетворяет условию
г, г,
|г0'50[г1,1;ц]всг)и0сг,ц,)«= т1п ^'зЧг.д^всюисгзеи;;
(11) векторы 2°е г,, уЧ-3® V, ( есть решение С13.8), то движение гС^иС • ,цЗ ,уЧ -3 , I является локально минимаксным равномерно по ц.
Предположение 13.2. (1) Система линейного приближения Сдля (12.133 неособенна по каждому воздействию и,, Д-1.....т ^ на отрезке САД,].
(11) Существуют достаточно малое и„>0 и постоянные 7„>0, М,>0 такие, что для любых 0< ц Ск 7 лебегова мера множества
{г- [«.г,] | ||г°'з0[1;,д;ц]В(гз|| ^ г}
удовлетворяет неравенству теБС©,) ^ М,?.
Теорема 13.3. Пусть выполнены предположения 12.1С13, 13.2 и условие регулярности (12.133. Если гС^и С О ,уЧ-) .г0,), ^ I движение системы (12.13 при СК ц порождаемое и(-3, у°( - 3, 2° такими, что: (1) управление и(-3еипри геометрических ограничениях (вида (1 .233 удовлетворяет для любых и(1;ЗеР(ДЗ, г« [АД,]
гр'з'сг1д;ц]вс«и(« > ¿"'г^г, дгцэвазиШ;
(II) РСЪЭ. ^ г - локально сильно выпукло в точке и° С ЪЗ;
(III) векторы уЧ-Зе V, 2°е г,, ? есть решение (13.83,
то движение г(1;;иС -3 ,уЧ •) ,г°Э, ^ t СЬ, является локально минимаксным равномерно по ц.
Укажем следующее важное свойство локально минимаксных движений. Пусть , 1с= 1,2,..., СХ - сходящаяся к нулю последовательность, которой сопоставим последовательность локально минимаксных равномерно по ц движений системы (12.13 г°С И , ^ Ъ , 2°(гЗ= гЧъ,|\3, к=1,2,... и порождающую их последовательность управлений 1\(-3= и(-,|\3, к= 1,2,... .
Леша 13.1. Пусть выполнены условия предположения 12.1, причем максимум в C12.ll) достигается на единственном векторе Тогда \£(0 слабо сходится к оптимальному управлению и0>СО, а г°СЪЭ равномерно на [АД,] сходится к минимаксному движению г""^) системы линейного приближения Сдля С12.13).
Теорема 13.4. Пусть выполнены условия леммы 13.1. Тогда локально минимаксные равномерно по ц, движения системы С 12.1) являются минимаксными при 0 < ц $ |а„.
При построении вычислительного алгоритма получения оптимального решения для квазилинейных систем используются итерационные
С")
схемы, разработанные в работах Э.Г.Альбрехта . В методах построения последовательных приближений оптимального управления С §14 ) на каждом шаге рассматривается некоторая вспомогательная задача, линейная по структуре, минимаксная по существу, для системы уравнений в вариациях вдоль решения, найденного на предыдущем шаге, при вариации управлений, начальных условий и входных возмущений. На очередном к-ом шаге имеем такую вспомогательную задачу: среди всех управлений и=иС-)е1Г найти такое иж=и^СО, доставляющее
е*С1;13= "У^0^ т1п {¿»СиСО) | иСОе и},
^СиС-))= тах|срСЪ,;иС • 3 ,уС •) ,г„)) | уСО« V, г,® г,|,
с вектор-функцией г^С^ ;иС •) .уС •) следующего вида:
г,С г, ;иСО ,г,)= гСЬ, ;ик',>С-)У1",С-),г',1",)+
+ Б'1> [г, ,^;р.]С2,-г<,км>)+|з<к> [г, [встзсист)-и"""ст,ц))+
+ СС т) С уС т) -у<к"1' С т, ц)) ^ йт, С 14.18)
^Альбрехт Э.Г. Об оптимальном управлении движением квазилинейных систем // Дифференц.уравнения. 1969. Т.5. №3. С.430-442.
где Sct5[t,x;n] - фундаментальная матрица решений системы уравнений в вариациях С при w з и = 0) ^=(ACt)+ |i|2iCt.z<l.1)Ct;u<k",,CO.v<k">CO.z"'"))]6z +
+ B(t)w + CCtto,
полученной при вариации управления w=u( -)-u к"°С •), uCOeU, помехи №=vCO-v<l"1>CO , vCOeV, начального условия SzC-S) =zt-z\l''\ z,eZe,
Ck-i>, - (k-l)_ „ С к -! ) ,
и составленной вдоль движения z(t;u CO.v C-),z, ).
В итоге решение исходной квазилинейной задачи об оптимальном управлении является пределом решений некоторой последовательности линейных задач оптимального управления. Указываются условия регулярности, определяющие существование и единственность решения вспомогательной задачи. Сходимость приближенных методов построения оптимальных управлений обеспечивается достаточной малостью нелинейных добавок и условиями невырожденности и регулярности для системы линейного приближения. Тогда при к-> <а равномерно по fi CO<^sji0) имеет место сходимость по соответствующим нормам: и""с • ,ц)->и С • ,|i)eU, v""(-,p,)-» v°C ■ ,(J.)eV на [fl.t,]; t"+t\ z(,k>-* z0,« z,; s"' и,т;ц]-» S°[t,t;|i] для т < t <t,; s""c1;,)-> s°. В силу теорем 13.2, 13.3 движение z(t;u С • ,v°C ■ ,ц) ,z°t), К t Ct, системы С 12.1) является локально минимаксным равномерно по ц (0< ц, %), а из теоремы 13.4 следует минимаксность этого движения и, соответственно, оптимальность управления и(-,ц) в задаче 12.1 при 0< ц ед,.
В §13 указанный итерационный метод решения минимаксных задач оптимального управления применяется при отсутствии условия дифференцируемое ти малой нелинейности |iiCt,z) по фазовой переменной z.
В этом случае обоснование сходимости процедуры последовательных
7)
приближений опирается на свойства квазидифференцируемых функций.
^Демьянов В.Ф., Рубинов A.M. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 432 с.
♦
Решение задач оценивания состояний наблюдаемых квазилинейных систем по результатам измерений в присутствии неопределенных возмущений составляет главу 4. Рассматривается система вида С12.13, заданная на Т=СЪ0Д,]. Начальное условие zít^ и входные возмущения уС О неизвестны заранее. Однако предполагается, что по ходу процесса доступно измерение некоторой функции текущего состояния, описываемой уравнением
Неопределенные возмущения у(1;), £(1;) стеснены ограничением {у(-), £( ■)}«]?, где Г- выпуклое и слабо компактное множество в произведении пространств о_а(Т) х В-^СТ). Управление и(-) - известная функция (здесь и( ■)= 0).
Предположение 16.1. Система линейного приближения для (12.1)
1 т
(1(г,2)^0) вполне наблюдаема по сигналу (16.2) при у( •)=£( -)=0 на любом отрезке [т, ,та]с Т.
Пусть №(1,у*С-))= Ж!;,-) - информационное множество системы (12.1), совместимое с реализовавшимся сигналом у*(■), измеренным на [^Д], 1; ^ г,, в силу (12.1), (16.2) при ограничении {уС-),
Г. Обозначим гСтгу.г) решение системы С 12.1) на [^Д] при у= у(-) и с конечным условием zCt]=z.
Лемма 16.1. Включение 4K.tr') справедливо тогда и только тогда, когда выполняется условие г*« 4K.tr ¡г*), где №(1;,-|2*) есть информационное множество для системы
¿= А(т)2+цГ(т;,2;(т;у,2*))+ССт)у, уК^СОг; + г^тф, совместимое с реализовавшимся сигналом у*(•).
тт™ ^т,,™,™™,, г,г. 1 сг.1 • т "(-),£(•)) ^ V,
у(И= 0С«г(« + £«).
(16.2)
(17.1)
получим Сна основе принципа Лагранжа при дифференциальных связях)
рсе\жг,-|2*))=^1пг || [з'стдс-))[сст)уст|2*)+|хкт,2°ст))]-
ь.
- я'ст)5°ст|2*)+ */Ст)у?Ст)]с1т) зсгдс-)) = г|, С17.9)
где \СО« п.*СТЭ, 2°Ст) = гСт;у°С • |г*) ,г*),
у°Ст|г*) = Ш"Ст)с'Ст)р0СтДС-))Сс0СХС-)))""3,
Ст|г*) = -Ук"гН 'Ст) ЯСт) С бСЯС •)))".
т т
р°СтДС -))=|2[г,б;ц]с}'се)я,са)|1б, зСгДС-))=|У [т.еЮ'СбШййе,
г[т,5;ц], ЭСтг.е] - фундаментальные матрицы соответственно систем
<Зр°Ст)/с1т= -[дст)+ т• 3°Стг))]'рСтгэ,
и йв /йх= -з'АСт).
При ГСт,г)з о из С 17.9) получим опорную функцию информационного множества И<0,С1;,-) для системы линейного приближения:
рс?цт<0)сг,о)= г'сс«+ [•уг-ь2с1;)]"г(7ри)?]"\
где сС«= Р"СШСМ, РС«, <1С«. описаны в 2}.
Предположение 17.1. Сигнал у*С О, реализовавшийся при р. Ф О для исходной системы С 16.1) таков, что существуют постоянная 50>0 и достаточно малое число ц.5>0, что в области 0< ц выполняется неравенство V1- 1гС1;) $ б0.
Множество ТС(0)С1;.-), построенное при данном предположении, будет уже непустым.
Теорема 17.2. Пусть выполнены предположения 16.1, 17.1. Тогда при 0 <р, < (¿„: (1) информационное множество ИСЪ.О - выпуклое, замкнутое и ограниченное; (11) при ц +0 множество УГСЪ,-) сходится в хаусдорфовой метрике к О.
На основе леммы 16.1 и соотношений, определяющих С17.9), получена сходящаяся С при итерационная процедура построения последовательности областей W(tóct,yfc-)), т=0,1,2,..., аппроксимирующих информационное множество WCt.O с точностью ОСцГ".
Разработан и обоснован также иной способ описания информационного множества WCt,-) для квазилинейной системы С 12.1).
Теорема 17.3. Включение z« WC t, -) эквивалентно неравенству
mln. | ItCvC-),£CO)| ívCO.ECOJe ACy?CO,z) ] $ v.
Здесь ACyfCO.z)- множество всех пар ívCO.gC-)}, удовлетворяющих при некотором Ze ¡R° тождеству Сдля TeCtj.tD у fe тЭ = GCtDzCtD+ICt) , где zCT) - решение С 12.1) с конечным условием z(t)= z.
Теорема 17.5. Информационное множество V?Ct,-) при 0 < ц < ^ определяется неравенством
С z-cCt))'PCt)Сz-c(t)) + nr°Ct,z) ¡S v- tíct). Приводится соответствующее описание функции r°Ct,z).
Получена для данного способа итерационная процедура построения аппроксимирующих множеств W(ni,Ct.O.
Теорема 17.6. Пусть выполнены предположения 16.1, 17.1. Тогда при Скц<ц,0 X(nüCt,-), m=0,1,2,...,- непустые, выпуклые, замкнутые, ограниченные множества, причем для любых Шк", |К||=1 имеем:
pU|W(ii,0Ct,-)) = pCf|W<ieCt.O) + оси"").
p?|WCt,"))= pC?|W<e>(t,-)) + ОСИ,"").
В §18 рассматривается случай раздельных ограничений на неопределенные возмущения vC•), ECO, где на основе конструкции сведения к совместным ограничениям, по указанным схемам получено описание информационного множества для квазилинейной системы.
Проблема синтеза момента корректирования по данным измерений для квазилинейных систем, функционирующих в условиях неопределен-
ности по начальным данным и входным возмущениям, исследуется в главе 5. Задача коррекции рассматривается в минимаксной постановке . Решение этой проблемы основано на совокупной оптимизации процессов управления и наблюдения, причем предполагается, что процедуры наблюдения и управления разделены во времени, и первые предшествуют вторым.
Рассматривается система С12.1) с наблюдением С16.2) на [t0,t,]. Ограничения на управления и(-)«Р- интегральные С 1.3). Информация о возмущениях vC•),£(•) ограничивается заданием допустимых областей
их изменения: Tt CvC-), £(•))$ v1 С6.3). Пусть в момент t известна Ч
реализация сигнала y*C-|t) Спри иСт)н 0, т <t), по которой находится информационное множество WCt,y*C•|t)), позволяющее алосте-риорно оценить неизвестное нам истинное состояние системы С 12.1) к моменту t. Запись gC-|a,t) означает, что функция g(T) Ct0^ т ^ t,) рассматривается на [s,t3; при s=t0 будем писать gC-|t). Ка участке наблюдения полагается uCOsO.
Обозначим: ÄCT;u,W(t,-)), t^t^t, - ансамбль траекторий системы С 12.1), исходящих из F7(t,-), при фиксированном u=uC • |t,t,)eP и
всевозможных возмущениях v= vC-), совместимых с результатами изме-*
рений; YCT.y C-|t)) - множество допустимых продолжений сигнала у*С • 11) Спри t^t).
Качество процесса управления на отрезке [t.t,] будем оценивать величиной СЬ - заданный вектор в к"):
e°(t)= K2Ct,;u ,iVCt,0))=min {aX2Ct, ;u,WCt,-))) |u«5Pj, С 19.8)
4CZCt1;u,WCt,-)))= max |||z-b|| | z« 2(t, ;u,WCt,-))},
Под позицией системы С 12.1) будем понимать пару Ct, у*С ■ |t)>.
^Красовский H.H. Игровая задача о коррекции движения // Прикл. ма-тем. и мех. 1969. Т.33. Вып.З. С.386-396.
Определение 19.2. Стратегией корректирования U^U.Ct.y^ • |Ш называется правило, согласно которому в кавдой позиции it,y*C• |t3> принимается одно из двух решений:
(1) продолжать процесс наблюдения при иСО = 0 в С12.1); (Ü) прекратить наблюдение и перейти в С12.1) к программному управлению u= ui(-)t,t1De р, назначаемому стратегией для всего ансамбля траекторий ZQ -;u,WCt,•)) на оставшийся интервал времени.
Процесс принятия решения стратегией U начинается с некоторого заданного момента ta=t0+a < t,, а>0. Согласно определению 19.2, для каждого сигнала уС-)е YCt, ,у*( • |tp) и выбранной стратегии U существует однозначно определенный момент времени т^т^СуС О ,U.) с [t^t,], когда впервые принимается решение CID.
Введем обозначения: УСиС- |t,t,) |yC-|t)3=®CÄCt, ;иС- |t,t,),ffCt,yC- |t)))3, иС- |t,t,)«P;
сосусо,ир= ycu.c-i^.t^iyc-iV3'
Здесь функция ижС • It^.t,) выбирается стратегией U, в момент тж.
Задача 19.1.(задача коррекции) Найти оптимальную минимаксную стратегию if,, для которой при любом у*С-)е YCt,,y*C- |t0)) выполняются неравенства: для любых uC-|t,t,)« Р, t« [teA°]
uCy*C-),lf.) < «uC-It.t^D |y*C- |«Э;
для любых t« Ст° ,t, 3, т°= т#Су*С О ,tf,)
uCyVj.tf.) < sup min fCuC-lt.t^lyC-it)), yC-|t) uC-|t,t,3
yC- |tt« yCt,,y*C-|T^D, uC• |t,t,)« P.
Процедура, позволяющая построить оптимальную стратегию корректирования, и основной результат относительно гарантированной оценок
ки получены для линейных систем в . В соответствии с этой процедурой, находясь в позиции tt, у*С-|t)> и построив информационное
множество iVCt, •}, следует вычислить оценку e°(t) С19.8), являющуюся результатом оптимального управления ансамблем траекторий системы (12.1) на Ct,t,] из W(t,-). Кроме указанной оценки s°(t) нужно определить величину (t„$ t ^ т ^ t,)
s°(T,t)= sup min ®CÄct,:u(-),W(r,y(•)))), (19.13)
y(-) u( •)
y(-3« Y(T,y*(-|t)3, U(-)eP,
характеризующую прогноз гарантируемого результата управления на основе информации, полученной лишь к моменту t. Здесь WCt, у С О) есть информационное множество, порожденное некоторым возможным продолжением y(s) (t„^ s $t) сигнала y*(-|t).
Стратегию корректирования U". назовем экстремальной, если за момент окончания наблюдения тж=х#(у*( •) ,U|) для каждого из сигналов у*(-)е Y(t,y*( • |ta)) принимается минимальный корень уравнения
s(t)- s° = О, Ъ 2 t_, s°= min is°(t,t) | t< т ¡St,) и в качестве u„(• iT^.t,), назначаемого стратегией на Cx^.t, 1, выбирается функция и (т), разрешающая задачу (19.8) при t=
Тогда 23 экстремальная стратегия U) является оптимальной, гарантирующей результат: для любых у*(-)е Y(t,,y*(- |t„))
соСу*СО.и;з- «ÄCt1;u,C-|T,.V.WV»3 ^ Et • <19-15)
По итерационным схемам главы 3 получены в §§ 20, 22 оценки s°(t), s°(t,t). В §21 дается содержательное описание множества допустимых продолжений Y(T,y*(• |t)) для системы (12.1), (19.2).
Лемма 21.2. Для любого допустимого продолжения у(-|т) сигнала у*(- |t) системы (12.1), С 19.2) в области CK ц % выполняется т
v- h2(t)- (s)H'(s)i|)(s)da ^ -|еСцО|, б(ц)=о(1). t
Лемма 21.3. Пусть CKe<S0 есть произвольная постоянная (не за-
висящая от ц). Тогда при достаточно малом р,„> 0 любое допустимое продолжение уС • | т) сигнала у*( ■11) для системы линейного приближения С 12.9), С 19.2), удовлетворяющее в области 0<ц< |J,0 условию х
v- rfct)- J (|)'cs)H'Cs)tJ)Cs)ds £ е > О, t
является допустимым продолжением сигнала у*С ■|t) и для исходной системы С 12.1), (19.2).
Здесь i|)C •) определяются некоторыми соотношениями, устанавливающими взаимнооднозначное соответствие между продолжениями у(-[т) системы линейного приближения и функциями ф( •). Обозначим через Y*0jСт,у*С - (3 множество допустимых продолжений сигнала y*(-|t) для системы С12.1), (19.2), удовлетворяющих условиям леммы 21.3.
Теорема 22.2. Существуют постоянная 0 < s < S„ и число ц„> О такие, что в области 0 < |i ^ ц,0 справедливо равенство
е°СгД)= sup min ffC£Ct,;uC •) ,WCT,yC О))), ус • ] т) uC •)
уС-|Т)е У;„СТ.у*С-|«). UCOeP. Искомый момент коррекции т^ достигается путем непрерывного отслеживания области WC t, •) и оценок 8°, £°(t).
Итерационные методы решения минимаксных задач управления для сингулярно возмущенных квазилинейных систем, функционирующих в условиях неопределенности, изложены в главе 6. Рассматривается сис-
* * * в m
ма С1), представимая в виде: z = Сх ,у ), хе к , у«= к ,
А1(СЪ,Ц)Х + A13Ct,|i)y + B,Ct,|i)u + (if.Ct.x.y),
dv C25-1:>
|igr= Аз(сг,ц)х + A„ct,py + BjCt,|J.)u + nijCt.x.y),
где матрицы AuCt,|i), В^СЬ.ц), i,J=1,2, допускают регулярные по параметру ц разложения (в области Скр^, ц, достаточно мало).
Решение задачи 1.1 для системы (25.1) (при каждом фиксированном значении ц>0) определяется соотношениями: Ы äcpCzCt, ;uC-) ,za)),
,и.)= ш1п тах тах \г гСЪ, ;иС О,20) -ф*(й), (25 1 и(ОеР ( I 1
и(ОеР Ъйе
где ф*( О - функция, сопряженная к фСг); к"'; ЭфСг) - субдифференциал ф в точке г, аср(гС;и( •) .г,)) - выпуклый компакт в к"'", Оптимальное управление и(-) = и (■ ,ц) удовлетворяет условию:
г.
т!п
и(-)еР г
тах тах
• „о
|г°'н[г,,г;м„2<!]В(г,м.)(и(^-и(«)аг= о, (25.53
здесь максимум вычисляется по всем ъ , е ЗсрС ;ц .г")), удовлетворяющим фСгС 1;,;и ,а°)3=тах{ф(2(^:и°.г,))нсг.тгц.г0] -- фундаментальная матрица решений системы
(Аи.ц) + 3= Еп,„. (25.6)
В.^.ц)
А(г,ц) =
А, , сг.цз А12(г,|х)
1А21 it.fi)
в сг,ц)=
рем,уз | рг'.и.х.у)]'.
Приведенные результаты, определяющие точное решение указанной задачи, довольно часто не могут быть практически реализованы (например, из-за сложности и трудоемкости вычислений, приближенности интегрирования нелинейных дифференциальных уравнений). Наличие малого параметра позволяет применить асимптотические методы, практическая ценность которых связана с возможностью эффективного получения асимптотического приближения (по параметру) оптимального решения из более простых соотношений. Асимптотика указанной задачи для системы (25.1) определяется здесь на основе найденных в главе 1 аппроксимаций решения задачи 1.1 для линейной системы (1.1) (с заданной точностью о(|хЗ, 0<рдф.0) и итерационных схем для квазилинейных объектов (глава 33. При этом соответствующим образом транс-
формируются достаточные условия оптимальности Сдля квазилинейных систем), условия невырожденности и регулярности Сдля системы линейного приближения). Итерационная процедура построения оптимального решения состоит из следующих основных этапов.
(I) Начальный шаг. Решить предельную задачу (задача 3.1 при геометрических ограничениях (1.2) или задача 4.1 при интегральных ограничениях С1.3), включая различные варианты разложений по ц мат» « .. < 0 > , <0>
рицы В2(1;,|л0) и найти управление и^ (•), начальные условия г0 =
[со >' <0>' "I ' , , . <0),
х0 ,у0 I и соответствующую траекторию г(Ъ;и, С •) ,г0 ).
(II) к-ый шаг (к= 1,2,...). Решить вспомогательную задачу 25.1 (линейную по структуре, сингулярно возмущенную по существу): среди всех управлений и=и(-)е Р найти такое и^и^С •), доставляющее
е^сг, ,(!)= ^(^0)= т1п|л„(и(-)) | иСОер},
^(и( •))= тах^г^г,;^ О.г,)) | 20е 2Г0|,
где функция ;и( •) ,г0) определяется на каждой итерации:
г,с г, ;и,г0)= га, ;<""(•) .С'нн'1"' и, л кг0-<км,)+
+ |н""" ,тг]В(т,|1)(и(т)-и"'"Сг))с1г,
Ь.
Н1к_1>[г,т] - фундаментальная матрица для системы уравнений в вариациях (при т 0), составленной вдоль движения 2С1;;и"м>С •) ,
[АС -Ь, ц.) Ъ ,гС Ъ ги^"15 .г;""1' Э Э ] бг + В(г,ц)я
с начальным условием 52(1;,,)= г,^'", г„е . В результате вычисляются <к>(- ,ц), 2„к>, гС^и"'^"'). Приближения фундаментальной матрицы Нск~15[1;1,т] определяются из (2.18) поблочно. Для к=1 необходимые элементы подробно выписаны для различных типов ограничений Доказывается сходимость разработанной итерационной процедуры, указываются рекуррентные оценки, описываются свойства предельных
элементов, в частности, локальная минимаксность Сравномерно по ц, движения гС1;;и°С О , доказывается оптимальность построенного управления и С •).
В §28 приводится пример использования изложенных выше асимптотических методов решения сингулярно возмущенных задач оптимального управления для процессов, математические модели которых описываются уравнениями с большим параметром. Условие экспоненциальной устойчивости по быстрым переменным может отсутствовать.
В главе 7 исследуется проблема построения информационных множеств для сингулярно возмущенных квазилинейных систем С12.1) с наблюдением Сб.23 при ограничениях С6.3) на реализации неопределенных возмущений уС-З, ?С-3. Матрицы АС13. СШ, функция ГСI.г) имеют вид С7.13, С23.6), соответственно; да 0, Сх' ,у'У ¿я"*", х«ж", уео?"1, уеог". В отличие от итерационных схем построения информационного множества ?0,1\С •)), изложенных в главе 4 Си которые здесь не годятся, поскольку тогда нарушается асимптотическое представление для фундаментальнй матрицы г^.т] С 1.6) системы линейного приближения С6.1), найденное в главе 1) в данном разделе методы вычисления основываются на соотношениях, полученных в главе 2 для линейных сингулярно возмущенных систем, т.е. через множество возможных начальных состояний ?/0Ст\( •)). В §29 получено аналитическое описание этого множества, указана сходящаяся итерационная процедура построения множеств ^^Ст^С• 3), 1с=0,1,2,..., аппроксимирующих ^ТцСт^СО) с точностью оСц'), СХ)аф.0. Методы вычисления последовательных приближений для опорной функции информационного множества квазилинейной системы изложены в §30. На каждом шаге рассматривается вспомогательная задача, линейная по структуре, для системы уравнений в вариациях, составленной вдоль вычисленного на предыдущем шаге экстремального движения Спри вариации возмущений и начальных
условий). Решение вспомогательной задачи определяет по существу опорную функцию множества достижимости, совместимого с реализовавшимся сигналом наблюдения к данному моменту, но для проварьирован-ного движения и при возможных начальных состояниях из аппроксимирующего множества соответствующего порядка. При вычислениях используются формулы и оценки §7. Доказывается сходимость итерационной процедуры при условии, что система линейного приближения вполне наблюдаема и выполнено условие невырожденности наблюдаемого сигнала Спредположение 17.1). Указываются также дифференциальные уравнения, которым удовлетворяют элементы, определяющие решение вспомогательной задачи на текущем шаге процедуры.
На основе полученных в §30 соотношений реализуется итерационная схема решения сингулярно возмущенных задач апостериорного оценивания состояния по данным измерений (§31). При этом асимптотика опорной функции информационного множества находится в соответствии с результатами главы 2.
ЗАКЛЮЧЕНИЕ
Основные результаты. В диссертации развит и обоснован метод малого параметра для построения приближенных решений достаточно широкого круга задач математической теории оптимальных управляемых процессов. Результаты работы имеют теоретическое и прикладное значение, она носит конструктивный характер и разработанные в ней аналитические приближенные методы решения задач оптимального управления и наблюдения состояний динамических систем в условиях неопределенности могут быть положены в основу практически реализуемых алгоритмов, поскольку допускают численную реализацию на ЭВМ. При этом получены следующие результаты:
1. Для квазилинейных систем разработана и обоснована итераци-
онная схема решения минимаксных задач управления при неопределенных начальных данных и входных возмущениях. Ограничения на управления мэгут быть как геометрическими, так и интегральными квадратичными. Получены достаточные условия оптимальности. Доказана сходимость метода, описаны свойства предельных элементов. Данный итерационный метод применяется также для квазилинейной системы с не-дифференцируемой по фазовой переменной нелинейностью.
2. Для квазилинейных систем разработаны итерационные схемы построения информационного множества, множества возможных начальных состояний. Получены аналитические описания этих множеств, установлены их свойства. Задача апостериорного наблюдения рассматривается при интегральных квадратичных ограничениях Скак совместных, так и раздельных). Получены соотношения, связывающие характеристики информационных множеств с элементами описания множеств возможных начальных состояний. Найдены дифференциальные уравнения для этих элементов, определяющие динамику множеств возможных начальных состояний.
3. Для квазилинейных систем исследована задача синтеза момента коррекции по данным наблюдения. Для построения оптимальной стратегии корректирования разработаны итерационные схемы вычисления оценок, характеризующих гарантируемый результат управления ансамблем траекторий из текущей позициии и прогноз результата программного управления на основе полученной информации. Построена аппроксимация множества допустимых продолжений.
4. Для сингулярно возмущенных линейных систем с переменными коэффициентами указан итерационный способ блочного вычисления фундаментальной матрицы решений. При условии экспоненциальной устойчивости подсистемы быстрых переменных описана асимптотика фундаментальной матрицы.
5. Для сингулярно возмущенных систем исследованы асимптотиче-
ские свойства ансамбля траекторий, множеств достижимости, получены аппроксимации их опорных функций.
6. Для сингулярно возмущенных квазилинейных систем разработан итерационный метод решения минимаксных задач управления при неопределенных начальных данных. Терминальный функционал качества зависит как от медленных, так и от быстрых переменных. Ограничения на управления могут быть геометрическими или интегральными квадратичными. Доказана сходимость метода, описаны свойства предельных элементов. Установлены достаточные условия оптимальности для синг} лярно возмущенных систем. Полученная схема может быть использованг при различных постановках задач управления Смаксиминные, быстродействия, перевод из точки в точку при минимуме ресурсов и т.д.).
7. Для сингулярно возмущенных квазилинейных систем по разработанной итерационной схеме исследована задача фильтрации при интегральных квадратичных ограничениях на неопределенные возмущения. Построена асимптотика информационного множества. Указана предельная задача наблюдения, решение которой определяет начальное приближение. Использование этих соотношений позволяет существенно уменьшить объем вычислений по сравнению с прямым решением. Получены дифференциальные уравнения, решения которых определяют элементы описания множества возможных начальных состояний.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТВШ ДИССЕРТАЦИИ
1. Кремлёв А.Г. Об управлении системой второго порядка с большим параметром //Матем. записки. Тр. Урал, ун-та. 1979. Т.12. Л 1. С.63-88.
2. Кремлёв А.Г. Об управлении квазилинейной системой при неопределенных начальных условиях // Дифференц. уравнения. 1980. Т.16. * 11. С .1967-1979.
3. Кремлёв А.Г. 0 построении информационных множеств для квазили-
нейных систем // Cd. "Оценивание в условиях неопределенности". Тр. ИММ УНЦ АН СССР. Свердловск, 1982. С.70-83.
-4. Кремлёв А.Р. Квадратичная задача коррекции движения квазилинейной системы. Свердловск. 1982.- Деп. в ВИНИТИ 19.10.82, * 5208-82. 39 с.
5. Кремлёв А.Г. Задача коррекции движения квазилинейной системы при квадратичных ограничениях // Дифференц. уравнения. 1984. Т.20. * 8. С.1348-1359.
6. Кремлёв А.Г. Минимаксная квадратичная задача наблюдения квазилинейной управляемой системы. Свердловск. 1983.- Деп. в ВИНИТИ 23.12.83, » 8860-В88. 21 с.
7. Кремлёв А.Г. Построение информационных множеств для квазилинейных систем при раздельных квадратичных ограничениях //Об. "Оценивание динамики управляемых движений". Тр. ИММ УНЦ АН СССР. Свердловск, 1988. С.82-87.
8. Кремлёв А.Г. Об управлении движением квазилинейной системы в условиях неопределенности //Тез. докл. VI Всесоюзн. конф. "Управление в механических системах". Львов. 1988. С.83-86.
9. Кремлёв А.Г. О задаче управления квазилинейной системой при неопределенных начальных условиях // Сб. "Динамические задачи оценивания в условиях неопределенности". Тр. ИММ УрО АН СССР. Свердловск, 1989. С.55-63.
10. Кремлёв А.Г. Об управлении сингулярно возмущенной квазилинейной системой при неопределенных начальных условиях //Тез. докл. VII Всесовзн. конф. "Управление в механических системах". Свердловск. 1990. С.64.
И. Кремлёв А.Г. Аппроксимация решений-сингулярно возмущенных задач оптимальной стабилизации // Тез. докл. .Респ. семин;' "Моделирование и исследование устойчивости физических процессов". Киев. 1991. С.47-48.
12. Кремлёв А.Г. Об оптимальном управлении сингулярно возмущенной системой. Свердловск. 1991 .-Деп. в ВИНИТИ 23.03.91., Л 2119-В91.
13. Кремлёв А.Г. Минимаксная задача управления сингулярно возмущенной системой. Екатеринбург, 1991.- fen. в ВИНИТИ 12.12.91, J6 4606-В91.
14. Кремлёв А.Г. Асимптотика ансамбля траекторий управляемой .сингулярно возмущенной квазилинейной системы // Тез. докл. Респ. конф. "Моделирование и исследование устойчивости процессов". Киев. 1992. С.82.
15. Кремлбв А.Г. Асимптотические свойства ансамбля траекторий сингулярно возмущенной системы в задаче оптимального управления // Автоматика и телемех. 1993. * 9. С.61-78.
16. Кремлбв А.Г. Метод последовательных приближений в квадратичной задаче управления сингулярно возмущенной квазилинейной системой // Тез. докл. Межгосударств, науч. конф. "Динамические системы: устойчивость, управление, оптимизация". Минск. 1993. С.54.
17. Кремлбв А.Г. Об оптимальном управлении ансамблем траекторий сингулярно возмущенной квазилинейной системы // Дифференц.
; уравнения. 1994. Т.ЗО. J6 11. 0.1892-1904.
- 18. Кремлбв А.Г. Итерационный метод решения задач оптимального управления сингулярно возмущенными системами при квадратичных ограничениях // йурн. вычисл. матем. и матем. физики. 1994.
■ Т.34. * 11. С.1597-1616.
19. Кремлбв А.Г. Аппроксимация оптимального решения в минимаксной задаче управления сингулярно возмущенной квазилинейной системой //Изв. РАН, Техн/ кибернетика. 1994. * 6. 0.183-193.
20. Кремлбв А.Г. Об информационном множестве сингулярно возмущенной системы // Межвуз. сб. науч. трудов "Сложные динамические системы". Псков: Изд-во Псковского пед. ин-та, 1994. С.30-35.
21. Кремлбв А.Г. Асимптотика информационного множества сингулярно возмущенной системы // Тез. докл. Укр. науч. конф. "Моделирование и исследование устойчивости систем". Киев. 1994. 0.72.
22. Кремлбв А.Г. Асимптотические свойства информационных множеств в сингулярно возмущенных задачах оптимального управления // Тез. докл. III Меядунар. семин. "Негладкие и разрывные задачи управления. Оптимизация и их приложения". Санкт-Петербург. 1395. 4.1. С.70-73.
23. Кремлбв А.Г. О построении асимптотики информационных множеств для сингулярно возмущенных систем // Автоматика и телемэх. 1996. Л 7. С.32-42.
Подписано к печати /5".05.97. Формат 60x84 1/16. Объем 2,0 п.л. Тираж 100 экз. Заказ 026.
620083, Екатеринбург, ул. Тургенева, 4. РИО Обл. Фонда высшей школы.