О непрерывной зависимости от возмущений траекторий и оптимальных значений в задачах импульсного управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Андреева, Ирина Юрьевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
1998
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Введение
Глава 1. О непрерывности и дифференцируемости разрывных решений обыкновенного дифференциального уравнения как функций от параметров
1. Определение разрывного решения
2. Постановка задачи.
3. Теорема существования и единственности для вспомогательного уравнения.
4. Непрерывная зависимость аппроксимируемых решений от параметров
5. Дифференцируемость аппроксимируемых решений по параметрам
Глава 2. Непрерывная зависимость оптимальных значений функционала от возмущений в импульсных динамических задачах минимизации
6. Линейная задача оптимизации энергетического функционала
7. Непрерывность от возмущений энергетического функционала в линейной задаче минимизации
8. Нелинейная задача оптимизации с импульсным интегрально-ограниченным управлением.
Непрерывность функционала в нелинейной задаче оптимизации
Глава 3. Вырожденная линейно-квадратичная задача оптимизации для систем с временным запаздыванием
10. Постановка задачи и ее редукция . ?.
11. Решение вспомогательной задачи . . \.
12. Построение оптимального программного управления для исходной задачи.
13. Позиционный алгоритм управления.
14. Задача оптимизации на бесконечном промежутке времени. Постановка задачи и ее редукция.
15. Решение вспомогательной задачи.
16. Построение оптимального управления для исходной задачи
17. Позиционный алгоритм управления.
Ряд задач оптимизации из областей механики космического полета, движения шагающих роботов и манипуляторов, квантовой физики, экономики и биологии обладают нерегулярной структурой, то есть классические вариационные процедуры формально не позволяют найти оптимальные управления, которые носят импульсный характер. Этот и другие известные факторы приводят к необходимости построения динамических моделей, использующих понятие обобщенной функции. Такие модели описываются линейными или нелинейными дифференциальными уравнениями, содержащими в качестве коэффициентов обобщенные функции.
Подробное исследование дифференциальных уравнений, содержащих обобщенные функции в качестве коэффициентов, можно найти в [61] и [70]. Что же касается класса задач оптимального управления, формализуемых с помощью обобщенных функций, то это направление было открыто книгой H.H. Красовского [41]. Основные достижения в этой области отражены в работах Е.А. Барбашина [8], В.И. Гурмана [12], М.И. Гусева [13], В.Я. Дерра [14, 15], MX Дмитриева [17, 18], В.А. Дыхты [19]-[22], С.Т. Завалищина [23]-[31], [35], [70], A.B. Куржанского [43, 44], В.М. Миллера [48], Ю.С. Осипова [39], Ю.В. Орлова [51], А.Н. Сесекина [54, 55, 56, 57, 58], А.И. Субботина и H.H. Субботинной [59], Ф.Л. Черноусько [64].
Однако, не все вопросы качественной теории дифференциальных уравнений распространены на дифференциальные уравнения с импульсами. Исследование таких уравнений требует чаще всего иных методов, чем исследование уравнений с регулярными правыми частями, так как возникают определенные сложности, связанные с разрывностью исследуемых траекторий. Например, как уже было сказано выше, в таких
Уравнениях появляется произведение разрывной функции на обобщен-ф ную. И прежде, чем говорить о решении такого уравнения, исследовать его свойства, надо решить, в каком смысле следует понимать данное произведение. Существенный вклад в решение данной проблемы внесли В.Я. Дерр, В.А. Дыхта, С.Т. Завалищин, Б.М. Миллер, Ю.В. Орлов, А.Н. Сесекин. Было предложено несколько подходов к решению данной проблемы. Все они в итоге основываются на аппроксимации обобщенных воздействий обычными функциями. В теории оптимального управления важным стимулом для изучения свойств динамических систем с импульсным управлением является теория нерегулярных (вырожденных) [12, 35] оптимальных процессов. Ряд вариационных задач этой теории обладают следующими двумя особенностями, осложняющими их решение. Во-первых, искомое управление явно не входит в уравнение Эйлера-Лагранжа или входит линейно. Во-вторых, оптимальное управление, как выяснилось [35], может содержать импульсные составляющие. Здесь возникает проблема корректного определения движения управляемой системы, в математическую модель которой входят произведения разрывных функций на импульсные. Описанными выше особенностями обладают, например, задачи управления движением манипулятора, тел переменной массы, задачи управления квантово-механическими состояниями микрообъектов. Данная работа продолжает тему исследования качественных вопросов для дифференциальных уравнений с разрывной правой частью. Основные рассматриваемые вопросы следующие:
Первый вопрос - это вопрос о непрерывности и дифференцируемости решения возмущенного дифференциального уравнения с обобщенными функциями в качестве коэффициентов, понимаемого в смысле работы [35], как функции от параметра, входящего в правую часть системы дифференциальных уравнений.
Второй вопрос - это вопрос о непрерывной зависимости оптимальных значений функционала по отношению к возмущению условий задачи. Объект управления, рассматриваемый в этих задачах, может быть описан как системой дифференциальных уравнений с обобщенными функциями в качестве коэффициентов без последействия, так и системой аналогичных уравнений с последействием.
Перейдем к более подробному изложению работы.
В первой главе рассматривается вопрос о непрерывности и дифференцируемости по параметру решения задача Коши для системы нелинейных дифференциальных уравнений с обобщенным воздействием и с параметром ц в правой части, обеспечивающим возмущение системы. Решение такой системы уравнений будет некоторой разрывной функцией, которая также зависит от данного параметра /л, а именно /л). Такое решение, как и решение системы аналогичных дифференциальных уравнений, но без параметра, понимается в смысле работы [35]. А именно, под решением подразумевается аппроксимируемое решение, которое вводится как предел последовательности абсолютно непрерывных решеI ний дифференциального уравнения, порожденной последовательностью обычных функций, аппроксимирующих в смысле теории распределений обобщенные функции, входящие в дифференциальное уравнение в качестве обобщенных воздействий, если такой предел не зависит от способа аппроксимации обобщенной функции. Доказаны теоремы о непрерывности и дифференцируемости по параметру решения описанной выше задачи Коши при определенных условиях для правой части системы, входящей в данную задачу.
Вторая глава посвящена рассмотрению вопроса о непрерывной зависимости оптимального значения функционала от правых частей систем дифференциальных уравнений в двух задачах оптимизации: линейной и нелинейной.
Вопрос о непрерывной зависимости решения задачи оптимального управления играет в теории управления чрезвычайно важную роль, так как управление реальными системами осуществляется, как правило, в условиях неопределенности, обусловленной самыми разнообразными причинами, например, грубостью модели объекта управления, наличием неточно заданных внешних возмущений, их непредсказуемостью, погрешностями при выполнении программы управления, погрешностью исходной информации в практических задачах, которая является следствием ошибок в канале измерений, запаздывания, вызванного конечностью времени, необходимого для получения и обработки результатов измерений. Следствием этого является тот факт, что математическая модель приближенно описывает реальный объект. Отсутствие непрерывной зависимости от исходных данных и внешних возмущений зачастую делают невозможным использование таких систем в прикладных задачах. Поэтому для исследования и был выбран вопрос, сформулированный выше.
Рассматриваемая в этой главе линейная задача оптимизации заключается в том, чтобы за фиксированный промежуток времени перевести управляемый объект, описываемый линейным дифференциальным уравнением с обобщенной функцией в качестве управления, и правая часть которого зависит от параметра из фиксированного начального состояния х° в фиксированное конечное состояние х1 так, чтобы соответствующее управление имело бы наименьшую норму, то есть чтобы затрачиваемая энергетика была бы минимальной. Для данной линейной задачи оптимизации с фиксированными граничными условиями была установлена непрерывная зависимость оптимальных значений такого энергетического функционала от возмущений конечного состояния х1 и правых частей систем дифференциальных уравнений, то есть параметра ¡л. Аналогичный вопрос рассматривался ранее Т. Гичевым в работе [11]. Отличие состоит в том, что в данной работе все исследования проведены в терминах топологии поточечной сходимости, а в работе [11] - в метрике Хаусдорфа. Следует добавить, что сходимость по Хаусдорфу влечет за собой поточечную сходимость.
Нелинейная задача оптимизации, которая рассматривается далее, с импульсным интегрально-ограниченным управлением и свободным правым концом состоит в том, чтобы среди функций у(-) € и, где где БУт^о,^] -банахово пространство т-мерных функций ограниченной вариации, найти такую, которая минимизировала бы интегральный функционал вдоль траекторий системы нелинейных дифференциальных уравнений с обобщенной функцией в качестве управления. Данная задача называется далее невозмущенной.
Для установления факта непрерывности минимума интегрального функционала от возмущений граничных условий и правой части системы дифференциальных уравнений для сформулированной выше невозмущенной задачи оптимизации ей в соответствие была поставлена возмущенная задача, построенная следующим образом: возмущается правая часть системы уравнений, описывающих управляемый объект, возмущается отрезок времени, на котором рассматривается данная задача оптимизации, и возмущается подинтегральная функция в функционале и = {«(.) : и(.) € ВУт[гоЛ], уаг М) < а},
Тл
0.1) качества. Построенная таким образом задача в дальнейшем называется возмущенной. Показано, что оптимальные решения возмущенных за- » дач оптимизации при определенных условиях сходятся к оптимальному решению невозмущенной задачи.
Третья глава посвящена рассмотрению линейно-квадратичных задач оптимизации. Эти задачи, как известно [12], имеют важное прикладное значение. Это относится как к системам без последействия, так и к системам с последействием. Особенностью вырожденных линейно-квадратичных задач в системах без последействия является то, что решение в классе обычных функций существует и может быть найдено с помощью известных вариационных процедур лишь на некотором многообразии позиций [68]. Заметим, что факт вырожденности функционала является достаточно обычным для прикладных задач [12] и поэтому исследование таких задач представляется актуальным. Существенный рост интереса к таким системам объясняется, в частности, их разнообразным приложением в таких отраслях, как теория управления, автоматическое регулирование, механика, экономика, биология и многих других.
Наряду с обычными трудностями, которые встречаются при построении оптимального управления и которые присущи обыкновенным уравнениям, представляющим частный случай систем с последействием, исследование последних сопряжено и с рядом специфических особенностей. Одна из них - отсутствие простых выражений для оператора сдвига по траекториям системы. Вследствие этого представляется затруднительным распространение на системы с последействием некоторых результатов теории управления обыкновенными уравнениями, в частности неизвестен вид уравнения Веллмана для общих управляемых систем с последействием. Тем не менее для линейно-квадратичных задач управления системами с последействием использование методов динамического программирования позволяет построить синтез оптимального управления и определить минимальное значение критерия качества, что и было сделано в данной главе в случае наличия запаздываний в фазовых координатах, и при наличии вырожденного интегрального квадратичного функционала. Вопросы, касающиеся синтеза оптимального управления, рассматривались ранее В.Б. Колмановским, Т.Л. Майзен-берг, Р.Т. Янушевским. Р.Т. Янушевский в работе [65] рассматривал синтез оптимального управления в случае задачи минимизации квадратичного функционала на бесконечном промежутке времени вдоль траекторий системы с запаздыванием в фазовых координатах и управлении. В.Б. Колмановский и Т.Л. Майзенберг в работе [36] получили вид оптимального управления для квадратичной задачи оптимизации на конечном промежутке времени (также при наличии запаздываний в фазовых координатах и управлении). В данной же работе, как уже было сказано выше, представлено решение программной задачи минимизации вырожденного интегрального квадратичного функционала на конечном промежутке времени вдоль траекторий линейной системы дифференциальных уравнений с запаздыванием в фазовых координатах. На его основе построено импульсное позиционное управление. Формализованы возникающие в системе с позиционным управлением импульсно-скользящие режимы. Установлен факт непрерывной зависимости оптимального результата от возмущений правой части системы. Поставленные вопросы I для данной задачи ранее не рассматривались. Невырожденный вариант этой задачи рассматривался в [36, 65, 52]. Вырожденная линейно-квадратичная задача в случае отсутствия запаздываний исследовалась [33, 34]. В заключении также найдено программное управление, минимизирующее вырожденный интегральный квадратичный функционал на бесконечном промежутке времени вдоль траекторий линейной системы дифференциальных уравнений с запаздыванием в фазовых координатах. На его основе построено импульсное позиционное управление. Эта задача в случае отсутствия запаздываний рассматривалась в [34].
Основные результаты диссертационной работы опубликованы в [2]-[6], [66] и докладывались на семинарах сектора нелинейного анализа отдела оптимального управления ИММ УрО РАН, на семинарах кафедры прикладной математики Уральского Технического Университета, на "Республиканских чтениях по обыкновенным дифференциальным уравнениям" (Минск, 1990г.), на II Международном семинаре "Сингулярные решения и возмущения в управляемых системах" ( 26 - 30 июня 1995г.).