Линейно-степенная задача оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Кронин, Григорий Вадимович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1998
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
О?
^ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
КРОНИН Григорий Вадимович
ЛИНЕЙНО-СТЕПЕННАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Специальность 01.01.09 - математическая кибернетика
Автореферат диссертации на соискание учёной степени кандидата физико-математических наук
Санкт-Петербург - 1998
Работа выполнена в Санкт-Петербургском государственном Университете.
Научный руководитель:
профессор, чл.-корр. РАН В.А.Якубович.
Официальные оппоненты:
доктор технических наук И Е.Зубер,
кандидат физико-математических наук АЛ.Лнхтарников
Ведущая организация: Санкт-Петербургский государственный технический университет
Защита диссертация состоится бвКА^РА 1998 г. в 11 часо на заседании диссертационного совета К 063.57.49 по защите диссертаций н соискание ученой степени кандидата наук в Санкт-Петербургско! государственном университете по адресу: 198904, Санкт-Петербург, Стары. Петергоф, Библиотечная пл., д.2, математико-механический факультет.
С диссертацией можно ознакомиться в научной библиотек Санкт-Петербургского государственного Университета по адрес) Санкт-Петербург, 199034, Университетская наб., 7/9.
Автореферат разослан 13 ОКТЛ^РЯ 1998 г.
Учёный секретарь
диссертационного совета К 063.57.49
А.И.Шепелявый
Диссертация посвящена исследованию задачи оптимального управления линейным объектом с интегральным функционалом качества, содержащим возведение модулей векторов состояния и управления в высокую степень
Актуальность работы. Часто в прикладных и теоретических задачах построения систем управления минимизируется некоторый функционал, зависящий от состояния системы и от управляющего воздействия. При этом желательно не только знать, существует ли такой оптимальный процесс, но и получить его возможно более явное выражение через параметры системы. Наиболее удобным является представление оптимального процесса в виде регулятора - то есть оператора, который в любой момент времени по предыстории состояния объекта (или даже только по значению состояния в последний момент) определяет вектор оптимального управления в этот момент. Такое решение существует, вообще говоря, далеко не всегда.
В работе рассматривается задача минимизации степенного функционала, близкая в смысле практического использования к задаче минимизации максимального отклонения. Уравнение объекта управления предполагается линейным. Изучается возможность получить решение такой задачи в виде оптимального регулятора. Исследуется связь полученного решения с решением линейно-квадратичной задачи.
Доказано, что при определённых предположениях в линейно-степенной задаче существует единственный оптимальный процесс и получено его представление в виде оптимального регулятора. Отдельно рассмотрены случаи квазиоднородного и квадратично-степенного функционалов. Получены уравнения в частных производных, решение которых позволяет явно выразить оптимальный регулятор исходной задачи. Полученный регулятор обладает свойством универсальности в следующем смысле: он не зависит от начального состояния объекта. Это полезно, поскольку на
практике обычно начальное состояние объекта неизвестно или известно неточно.
Актуальность поставленных и решённых в диссертации задач обусловлена важностью исследования систем управления, где требуется минимизировать максимальное отклонение переменных состояния и управления от некоторых эталонных значений (обычно нулевых). Кроме того, актуальным является обобщение некоторых методов исследования задач оптимального управления на задачи более широкого класса, чем линейно-квадратичные.
Цель работы. Постановка и решение задачи минимизации степенного функционала для линейного объекта управления. Исследование связи с результатами для линейно-квадратичной задачи. Получение оптимального регулятора, не зависящего от начального состояния и исследование его свойств. Моделирование на компьютере оптимального управления с помощью построенного регулятора.
Методы исследования. В диссертации использованы методы теории оптимального управления, теории дифференциальных уравнений, математического анализа, компьютерное моделирование.
Научная новизна. Решена задача оптимального управления линейным объектом с минимизацией степеннбго функционала. Построено уравнение в частных производных, через решение которого выражается универсальный оптимальный регулятор в поставленной задаче.
Практическая ценность работы. Полученные в диссертации результаты могут быть использованы при решении задач минимаксной оптимизации для систем, описываемых дифференциальными уравнениями небольшого порядка путём замены целевого минимаксного функционала на степенной функционал (как правило, затруднительно непосредственно минимизировать сам минимаксный функционал). При помощи построенного регулятора
можно осуществлять управление системой, начальное состояние которой неизвестно.
Достоверность полученных результатов. Полученные результаты основываются на строгом использовании математических методов. Результаты компьютерного моделирования подтверждают теоретические выводы.
Публикации. Имеется 3 публикации [4][5][6].
Апробация работы. Основные результаты диссертации докладывались на ХК всероссийской конференции студентов и аспирантов в МГУ (Москва, 6-11 апреля 1997г.), 1-й международной конференции "Control of Oscillations and Chaos" (Санкт-Петербург, 27-29 августа 1997 г.), 1-й международной конференции "Tools for Mathematical Modeling" (Санкт-Петербург, СПбГТУ, 3-5 декабря 1997 г.), Российско-Шведской конференции по управлению (Стокгольм, 11-13 мая 1998 г.). На конференции "Control of Oscillations and Chaos" доклад [5] был признан финалистом конкурса молодых учёных.
Структура и объём диссертации. Диссертация состоит из введения, 8 глав, заключения, списка литературы и содержит 78 страниц машинописного текста.
Краткое содержание работы
Введение содержит краткий обзор литературы по линейно-квадратичной задаче и сжатое содержание всех глав диссертации. Даётся обзор истории развития теории линейно-квадратичной задачи, восходящей к работам А.И.Лурье, Р.Калмана, Н.Н.Красовского, А.М.Летова, и других.
Первая глава является вспомогательной. В ней вводятся обозначения, используемые на протяжении всей диссертации. Большинство из них являются общепринятыми в теории оптимального управления.
Вторая глава содержит постановку линейно-степенной задачи оптимального управления, которой и посвящена диссертация. Задача (в одном из вариантов) ставится следующим образом: среди всех пар функций (x(-),u(-))eW([0,T]-+R")xL4([(),T]—>Rm), удовлетворяющих уравнению объекта
х = A(t)x + B(t)u + f(t), (1)
и начальному условию
х(0 ) = а (2)
найти такую, на которой целевой функционал
Фр.,(х(-),и(-)) = ¿}{x(t)*C(t)x(t))Pdt + J (u(t)* r(t)u(t))q dt (3)
■^Р о 'Но
принимает наименьшее возможное значение. Здесь А(-),В(-),С(-),Г(-) -непрерывные матрицы-функции подходящих размерностей, C(t) и T(t) положительно определены при всех te[0,T]. f(-) - вектор-функция внешнего воздействия (обычно она тоже считается непрерывной). Вещественное число р>1 предполагается большим. Такая постановка задачи связана с тем хорошо известным свойством, что при р = 1 (линейно-квадратичная задача) оптимальный процесс может допускать кратковременные выбросы, нежелательные в практических приложениях. При возрастании р относительный вклад больших "всплесков" в функционал качества увеличивается, поэтому оптимальный процесс при большом р скорее всего будет свободен от этого недостатка. В этой же главе дан обзор результатов, полученных различными исследователями при рассмотрении аналогичных задач. Среди них следует особо отметить работу Barron, Ishii [9], в которой (при несколько иной постановке задачи) с помощью метода Беллмана получены важные результаты о сходимости оптимальных процессов для степенных функционалов к оптимальному процессу для соответствующей минимаксной задачи. В книге [8] рассмотрен ряд близких минимаксных задач
и получено условие, аналогичное принципу максимума Понтрягина для задачи минимизации недифференцируемого функционала вида тах g(x(t),u(t)) по всем допустимым управлениям и(-). К сожалению, как и
указано в [8], полученное условие весьма затруднительно для практического использования.
Тематика диссертации тесно связана с линейно квадратичной задачей, поэтому в третьей главе излагаются две теоремы о линейно-квадраггичной задаче [3] - на конечном и бесконечном интервале времени. Это необходимо для сравнения результатов, полученных для линейно-степенной задачи с аналогичными результатами для линейно-квадратичной задачи.
В четвертой главе доказывается теорема о "полуквадратичной" задаче Рт(рД ,о ,Т), то есть о задаче минимизации функционала (3) при ц = 1
1 т 1 т Фр,,(х(-),и(-)) = — /{х(1)*С(1)х(1))Р^+-/и(1)*Г(1)и(1)ск (4) ¿Р о о
на линейном объекте (1) с начальным условием (2). Доказано существование
и единственность оптимального процесса в задаче Рг(р,1,ог,Т) и доказано
также, что оптимальный процесс может быть получен замыканием уравнения
(1) регулятором, не зависящим от начального состояния а.
Теорема 4.1.
1) При любом ¡/еЯ" существует единственный оптимальный процесс для задачи Рг(р, 1, а ,Т).
2) На множестве П = [0,Т]хКп существует единственное решение К(-)еС1(П—>ИП) уравнения в частных производных
— = -А*И +- (х*Сх)р~1 С*Сх - ((Ах + ВГ"1В*К + ф > (5)
удовлетворяющее краевому условию
11(Т,х) = 0 Ухе Л0, (6)
3) Оптимальный процесс для задачи Рг(р,1,д,Т) при любом а е II" порождается регулятором
и = ь&х), (7)
где функция
ь(1,х)=г-1(1)ва),ках). (8)
не зависит от а е Ып . Здесь Щ-,-) - решение уравнения (5) с краевым условием (6).
щт,х) = о—, г
4 * * * ^ ' + ^ ^ X
Рисунок 1
В доказательстве теоремы 4.1 использована идея доказательства теоремы о линейно-квадратичной задаче на конечном интервале [3]. Сначала непосредственно доказывается существование и единственность оптимального процесса (с использованием выпуклости лагранжиана задачи), а затем, пользуясь тем, что уравнения принципа максимума здесь имеют липшицевые правые части, можно построить искомую функцию Я как композицию отображения последования уравнений принципа максимума по х и обратного отображения последования по сопряжённой переменной ц/. Существование и однозначность такого обратного отображения гарантируется существованием и единственностью решения рассматриваемой задачи.
В пятой главе рассмотрена более естественная задача Рг(р,р,а,Т) минимизации квазиоднородного функционала (3) при р = q и также получено решение в виде оптимального регулятора.
Пусть % - вспомогательная функция
g(tjV) = |r-lv(v*r-,v)"2^ при v^O (9)
[о при v = 0
Теорема S.2.
1) Существует единственный оптимальный процесс для задачи Рг(р,р,а,Т).
2) Пусть в задаче Рг(р,р,й,Т) a priori известно, что тождественно нулевое управление и=0не является оптимальным. Тогда на множестве П = [0,T]xRn существует единственное решение R(v)eC,(n~»Rn) уравнения в частных производных
£?R
— = -A*R+(xCxr1C,Cx-(VxR),(Ax4-Bg(t,B'R(t,x))+f(t))> (Ю)
удовлетворяющее краевому условию (6).
3)При любом aeR° оптимальный процесс для задачи Рг(р,р, а ,Т) порождается регулятором
u = h(t,x), (11)
где фунция
h(t,x) = g(t,B(t)*R(t,x)) (12)
не зависит от а. Здесь R(v) - решение уравнения (10) с краевым условием (6) (см. рисунок 1).
Доказательство теоремы 6.2 основано на методе функции Ляпунова -Беллмана. Вводится функция
1 т
V(t0,b) = ^ mfB — f ((x(t)'C(t)x(t))p +(u(t)T(t)u(t))")dt (13)
и с использованием выпуклости интегрального функционала доказывается её дифференцируемость (что в общем случае, вообще говоря, неверно). Далее функция R находится как градиент V по переменным состояния. Условие
неоптимальности нулевого управления обычно легко может быть проверено в каждой конкретной задаче.
В шестой главе рассмотрена стационарная линейно-степенная задача на бесконечном интервале времени. Для неё доказано существование и единственность оптимального процесса и получено уравнение в частных производных, которому должен удовлетворять оптимальный регулятор. К сожалению, в отличие от задачи на конечном интервале, это уравнение весьма затруднительно решать численно и оно, таким образом, представляет лишь теоретический интерес. Однако, в случае одномерных состояний и управлений можно представить регулятор в более явном виде и получить следующий результат
Теорема 6.2. Рассмотрим задачу минимизации функционала
1 ^
Фр,р(х(-),и(-)) = г- {(5ёп(а)|ах(1)|2р+|уи(1)|2р)(11 (14) £Р о
где у>0 на множестве числовых (а не векторных) функций, удовлетворяющих (1) с постоянными коэффициентами А и В * 0 и начальному условию (6). Тогда следующие условия равносильны.
1) При любом о е Я" в задаче существует оптимальный процесс.
2) При любом а е Лп в задаче существует единственный оптимальный процесс.
При выполнении условий (1)-(3) если (х(-),и(-)) - оптимальный процесс, то для него при всех 1е[0,+да) выполнено тождество
1 2р
и(0 = -|в£ (15)
где § - наибольший корень уравнения
Соотношение (15) задаёт линейный не зависящий от а оптимальный регулятор. Условие 3 теоремы 6.2 является аналогом частотного условия в линейно-степенной задаче. В диссертации доказано также (теорема 6.3), что
У |А|
при ос> при р -» +оо оптимальный процесс, полученный в теореме 6.2
равномерно сходится к некоторому оптимальному процессу для функционала Фтах(х(-),и(-)) = шах (шах(о|х(1)|,у|и(1)|)) (17)
В седьмой главе кратко рассмотрена дискретная постановка линейно-степенной задачи. Вместо дифференциального уравнения (1) фигурирует разностное уравнение
х(к +1) = А(к)х(к) + В(к)и(к) + ^к) (18)
и функционал качества вместо интегрирования содержит суммирование. Доказано существование и единственность оптимального процесса и существование решения задачи в виде регулятора, не зависящего от начального условия.
В восьмой главе проведено компьютерное моделирование полученных в диссертации регуляторов для некоторых модельных примеров. Для уравнения объекта (1) с матрицами
с
А =
О 4\ П1
-4 ОГ Ш
Вв о (19>
при различных р рассчитаны оптимальные регуляторы для минимизации функционала качества
1
Ф(х(),и()) = /((х,^)2 + х2(1)2)'+|и(1)|21> >11 (20)
и на основании их построены оптимальные процессы. Проведено сравнение оптимального процесса линейно-степенной задачи (р = 20) и линейно-квадратичной задачи (р - 1). Компьютерное моделирование (см. рисунок 2) подтверждает теоретический вывод - при возрастании р "всплески" в оптимальном процессе сглаживаются.
В восьмой главе указаны также разностные формулы, которые использовались при моделировании решения уравнения (10).
Автор признателен научному руководителю ВАЯкубовичу и всем, кто помогал при работе над диссертацией. Отдельная благодарность Н.Н.Уральцевой, которой автор обязан существенными замечаниями и уточнениями, академику А.Б.Куржанскому, указавшему на работу [9], Л.А.Оганесяну, давшему ряд полезных советов.
Литература
[1] В.А. Якубович. Частотная теорема в теории управления. Сиб. мат. жури., 1973, т. 14, № 2, с.384-420.
[2] А.С.Малгвеев, В.А.Якубович. Абстрактная теория оптимального управления. Санкт-Петербург, 1994.
[3] В.А.Якубович. Частотная теорема и теория аналитического конструирования регуляторов для периодических систем. В книге "Метод функций Ляпунова в исследовании динамических систем", Новосибирск, 1987, стр.281-290.
[4] G.V.Kronin. The optimal control problem with p-degree quality functional. Proc. of International Conference of students and post-graduates "Lomonosov-97", Moscow State University, Moscow, 1997, April 6-11.
[5] G.V.Kronin. The optimal control problem with p-degree quality functional. Proc. of "Control of Oscillations and Chaos", St-Petersburg, 1997, vol.1, p. 92-95.
[6] G.V.Kronin. Optimal control problem with linear object equation and non-quadratic homogenous gain functional. Proc. of "Tools for Mathematical modeling", St-PetcrsbuTg, 3-6 Dec. 1997, p.39-40.
[7] G.V.Kronin. Optimal regulators for the control problem with non-quadratic quality functional. Russian-Swedish Control Conference, Stockholm, 11-13 May 1998.
[8] Демьянов В.Ф. Негладкие задачи теории оптимизации и управления. Ленинград, 1982.
[9] E.N.Barron, H.Ishii. The Bellman equation for minimizing maximum cost. Nonlinear Analysis, Methods and Applications, v. 13, № 9, 1989, p.1067-1090.
^¿Я/- А*
¿'..у
САНКТ-ПЕТЕРБУРГСКИИ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
КРОНИН Григорий Вадимович
I
линейно-степеннАя задача
оптимального управления
Специальность 01.01.09 - математическая кибернетика
I
Диссертация на соискание учёной степени кандидата физико-математических наук
Научный руководитель д.ф.-м. наук, проф. В.А.Якубович
Санкт-Петербург 1998 '
Оглавление
ОГЛАВЛЕНИЕ...............................................................................................................................1
ВВЕДЕНИЕ.....................................................................................................................................2
1. ОБОЗНАЧЕНИЯ........................................................................................................................6
2. ЛИНЕЙНО-СТЕПЕННАЯ ЗАДАЧА. ПОСТАНОВКА И МОТИВИРОВКА.....................7
3. ЛИНЕЙНО-КВАДРАТИЧНАЯ ЗАДАЧА..............................................................................12
3.1. Линейно-квадратичная задача на конечном интервале времени................................12
3.2. Линейно-квадратичная задача на бесконечном интервале времени..........................16
4. ЗАДАЧА (Р,1) НА КОНЕЧНОМ ИНТЕРВАЛЕ....................................................................19
4.1. Задача(рД) на конечном интервале-формулировка результата. Связь с уравнениями Лурье-Риккати...................................................................................................20
4.2. Доказательство теоремы о регуляторе для задачи Ря(р, 1,а,Т)......................................22
5. ЗАДАЧА (Р,Р) НА КОНЕЧНОМ ИНТЕРВАЛЕ....................................................................33
5.1. Задача (р,р) на конечном интервале - формулировка результата. Отличие от задачи (1,Р).............................................................................................................................................34
5.2. Регулятор для задачи (р,р) на конечном интервале........................................................37
5 .3. Частный случай: одномерное пространство состояний..............................................43
6. ЛИНЕЙНО-СТЕПЕННАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НА БЕСКОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ............................................................................47
6.1. Решение задачи Рк(р,р,а,+оо) - доказательство теоремы..............................................49
6.2. частный случай задачи Рк(Р,Р,А,+оо): одномерное пространство состояний.............53
6.3. Частный случай задачи Ря(р,1,а,+оо): одномерное пространство состояний............58
• 1
7. ДИСКРЕТНАЯ ЛИНЕЙНО-СТЕПЕННАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ..............................................................................................................................62
7.1. Постановка дискретной линейно-степенной задачи...................................................62
7.2. Дискретная линейно-степенная задача: построение регулятора................................63
7.3. Дискретная линейно-степенная задача: формулировка результата...........................66
8. РЕЗУЛЬТАТЫ ЧИСЛЕННОГО МОДЕЛИРОВАНИЯ.......................................................68
8.1. Примеры. .............................................................................................................................68
8.2. Численное решение уравнения (5.5)................................................................................72
ЗАКЛЮЧЕНИЕ.............................................................................................................................75
ЛИТЕРАТУРА...............................................................................................................................76
Введение.
Раздел теории управления, изучающий конструирование оптимальных регуляторов - направление, возникшее исторически сравнительно недавно. В 60-е годы как в нашей стране, так и за рубежом появилась серия работ [1][2][3][4][12][13], заложивших основу и предвосхитивших многие глубокие результаты. Столь большая популярность теории конструирования регуляторов объясняется, на наш взгляд, двумя причинами:
- практической значимостью результатов,
- глубиной и нетривиальностью математического аппарата, созданного для их получения.
Методы решения задач математической теории оптимального управления столь общие и затрагивают столь широкий спектр математических дисциплин, что бывает нелегко провести границу там, где кончается математический и функциональный анализ и начинается теория управления, решающая задачи, возникающие в электродинамике, механике, экономике, химии, .... Таким образом, в этой отрасли
4С 55
математики счастливо сочетаются как красота чистои математики, так и
СС 55 г-> с/
польза прикладной. За последние несколько десятилетии эта теория стала инструментом решения инженерных задач. Многие специалисты-"техники", а вовсе не математики, хорошо владеют её результатами и применяют их в своей работе. Этим, в свою очередь, объясняется повышенный интерес самих математиков к теории конструирования регуляторов. Это - один из тех разделов математики, где "придумывание и доказательство новых теорем" может принести вполне реальную экономическую отдачу.
В диссертации получен ряд результатов о существовании оптимальных процессов и оптимальных регуляторов для большого класса задач, для которых автор взял на себя смелость ввести термин "линейно-степенные", то есть задач с линейным (непрерывным или дискретным) уравнением объекта и функционалом качества, содержащим возведение в степень (которая обычно предполагается большой). Хорошо
известна линейно-квадратичная задача о минимизации квадратичного функционала от процесса, удовлетворяющего линейному дифференциальному уравнению. В разных вариантах постановки линейно-квадратичной задачи её решение получено [2][3][4][12][13] в виде оптимального регулятора, не зависящего от начального условия. Диссертация посвящена исследованию задачи, в которой вместо квадратичного функционала фигурирует степенной, то есть содержащий
под интегралом возведение в степень (простейший пример:
т
|(|х(1)|2р+|и(0|2р)с!1). Постановка задачи восходит к линейно-квадратичной
о
задаче [14] [22] и при изложении (там, где это возможно) будет прослежена связь с линейно-квадратичной задачей. Оказывается, имеют место некоторые результаты, аналогичные (хотя и не полностью) теоремам о линейно-квадратичной задаче. Помимо того, что изучение минимизации степенного функционала представляет самостоятельный интерес, задача эта тесно связана с задачей минимизации максимального отклонения, часто встречающейся на практике. При больших степенях р в степенном функционале оптимальный процесс, как правило, близок к некоторому оптимальному или почти оптимальному процессу для минимаксной задачи. Подробнее мотивировка линейно-степенной задачи обсуждается в главе 2.
Глава 1 носит вспомогательный характер. В ней вводятся необходимые обозначения, используемые в диссертации. Большинство из них являются традиционными в теории оптимального управления.
В главе 2 обсуждается постановка задачи оптимального управления с минимизацией степенного функционала. Указана связь этой задачи с задачей минимизации максимума модуля выходного сигнала, в том числе с практическими задачами, рассмотренными рядом исследователей.
Поскольку тематика настоящей диссертации во многом связана с линейно-квадратичной задачей, то в главе 3 кратко приводится её постановка и решение для конечного и бесконечного ("частотная
теорема") интервала времени, сформулированное в виде, удобном для сопоставления с решением линейно-степенной задачи.
Глава 4 содержит постановку и решение линейно-степенной
СС ^ 59
полуквадратичнои задачи - то есть задачи минимизации интегрального функционала, в который управление входит с квадратом. Эта задача наиболее близка к линейно-квадратичной. В основном изложение следует работе автора [26].
В главе 5 поставлена и решена задача минимизации квазиоднородного степенного функционала на конечном временном промежутке - получено уравнение в частных производных, аналогичное уравнению Лурье-Риккати в линейно-квадратичной задаче. В основном результаты этой главы были получены автором и представлены в [25][27][28].
В 6-й главе поставлена задача минимизации степенного функционала при линейном стационарном уравнении объекта на бесконечном интервале временй. Как и в предыдущих главах, при ряде предположений доказано существование и единственность оптимального процесса и показана возможность реализовать оптимальный процесс в виде регулятора.
В 5-й и 6-й главах уделено также внимание частному случаю, когда пространства состояний и управлений одномерны. В этом случае получается наиболее явное представление полученных регуляторов и в ряде случаев удаётся дополнить общие результаты - в частности, распространить их на случай невыпуклого целевого функционала. Для "полуквадратичной задачи" на бесконечном интервале получен в явном виде нелинейный оптимальный регулятор.
В 7-й главе рассмотрена дискретная постановка линейно-степенной задачи и получены результаты, аналогичные результатам в непрерывном случае. Здесь также возможно представление оптимального процесса в виде регулятора, который является решением некоторой системы функциональных уравнений прогонки.
8-я глава посвящена примерам компьютерного моделирования результатов диссертации. На нескольких двумерных примерах проиллюстрирована возможность использовать найденные регуляторы для управления линейными объектами небольшой ' размерности. Поскольку уравнение в частных производных, решение которого требуется здесь строить, довольно специфическое, во избежание неясности указана разностная схема, которая использовалась при моделировании.
1.Обозначения.
Введём ряд обозначений, которые будут постоянно использоваться на
протяжении последующих глав. К - множество вещественных чисел, С -множество комплексных чисел. Для векторов уеИ" (или С") всегда, если не' оговорено противное, будем пользоваться евклидовой нормой и
отличие от норм в функциональных пространствах, которые будем обозначать двойными палочками ||-|| и всегда указывать, какая именно норма имеется в виду. N - множество натуральных чисел. Для m,neN через 1Гхп обозначим пространство всех вещественных матриц размера тхп (т строк, п столбцов). Норма матрицы также всюду обозначается ||-|| и предполагается евклидовой, если не оговорено другое. Единичную матрицу размена пхп обозначим 1п. Пусть Р, - топологические пространства. Множество всех функций из Р в С> обозначим Р(Р-><3). Будем также обозначать множество всех непрерывных функций, действующих из Р в через С°(Р-»(£). Аналогично будем пользоваться обозначениями Ск(Р->(}), Ьр(Р-^0>) (ке!Ч, р > 1) для множеств к раз дифференцируемых функций и функций, имеющих конечную Ьр-норму для тех пространств Р и где это имеет смысл. Кроме того, символом \¥р([0,Т]^-Кт) будем обозначать пространство Соболева, состоящее из таких непрерывных почти всюду дифференцируемых функций лу(-) из [0,Т] в 11т, что
обозначать её одинарными палочками
в
(1.1)
Аналогично определяется пространство Wp([0, +со)-»11т).
2.Линейно-степенная задача. Постановка и
мотивировка.
Перейдём к постановке линейно-степенной задачи и опишем причины, по которым её постановка представляется полезной и естественной. Рассматривается линейное уравнение объекта
с1х
— ^Афх + Вфи + ад (2.1)
с начальным условием х(0) = а, где А(-), В(-) - непрерьшные матрицы-функции подходящих размерностей, х(-) - состояние, и(-) -управление, £(•) - внешнее воздействие, а - начальный вектор состояния. Рассмотрим следующую задачу: среди всех пар функций (х(-), и(-)), удовлетворяющих (2.1) и начальному условию х(0) = а найти такую, на которой функционал
¥(х(.),и(-» = тахСтахОВ^^х^иВ,^)!) (2.2)
принимает наименьшее возможное значение (О^-), 02(-) - непрерьшные матрицы-функции подходящих размерностей). Здесь функции, стоящие под знаком максимума, могут пониматься как отклонения некоторых рычагов от среднего положения - в этом случае с прикладной точки зрения задача совершенно "естественна" - она состоит в отыскании управления, минимизирующего возможные нежелательные отклонения характеристик системы от некоторого среднего (нулевого) положения.
гр /-* V
1 аким образом, в этой постановке задачи минимизируется не интегральное (усреднённое), а наибольшее отклонение параметра. К сожалению, такую задачу намного легче поставить чем решить. В самом деле, функционал недифференцируемый и поэтому для него нельзя непосредственно применить такие методы абстрактной теории оптимального управления, как принцип максимума Понтрягина. С другой стороны, хочется всё же как-то воспользоваться аппаратом теории оптимального управления для решения поставленной задачи. Такие
задачи рассматривались в литературе [30][32][33], но в большинстве случаев точное решение получить не удаётся. В частности, в [30] рассмотрена похожая задача
х(0 = А(г)хф + ва)и(0; у(Ч) = С(0х(0, х(0) = а,
8ир|\У(1)(угеГ(0-у(1))|->тт,
ИО.Т]
где УгеКО - отслеживаемый сигнал, W(•) - весовая матрица. Указан метод априорной оценки сверху минимального значения целевого функционала, пользуясь которой, можно приближённо находить оптимальный процесс. Необходимо отметить, что постановка задачи в [30], хотя и близка, но всё же отличается от постановки минимаксной задачи, принятой в настоящей диссертации. Существуют аналоги принципа максимума для задач с недифференцируемым целевым функционалом. В книге [24] (глава 5) получено условие, аналогичное принципу максимума Понтрягина для задачи минимизации недифференцируемого функционала вида тах§(х(0,и(0)по всем допустимым управлениям и(-). К сожалению, как и
указано в [24], полученное условие весьма затруднительно для практического использования.
В настоящей работе предложен один из способов в каком-то смысле обойти недифференцируемость функционала Идея состоит в том, чтобы минимизировать не а некоторый другой функционал или семейство функционалов - интегральных, дифференцируемых, но "похожих" на Ч*, надеясь, что оптимальные процессы, найденные для них, можно будет рассматривать как "почти" или "достаточно" оптимальные и для Ч1. А именно, вместо предлагается рассматривать степенной функционал вида
1 т 1 т фм (*(■), и(0) = ^ДхОГс, (г)х(о)Р Ск+—Ди(1)*С2 (1)и(0)4 си, (2.3)
о Ч о
предполагая числа р и (или) q большими, а матрицы С)(-), С2(-) квадратными положительно определенными подходящей размерности. Поскольку возведение в большую степень существенно лишь там, где аргумент достаточно велик, то оптимальный процесс для функционала
Фрч при больших р и ч можно будет взять в качестве "достаточно" оптимального для функционала
Утверждение, содержащееся в предыдущей фразе - конечно лее, НЕ ТЕОРЕМА. Это лишь эвристика, в пользу которой - наши умозрительные рассуждения и результаты численных экспериментов (см. главу 8). Конечно, для любой непрерывной функции имеет место предельное соотношение [35]
но это, вообще говоря, не гарантирует, что оптимальный процесс для У будет пределом при р -»+со оптимальных процессов для соответствующих Фр>р - ведь сам оптимальный процесс тоже зависит от р. Более того, оптимальный процесс для минимаксного функционала Ч* может быть не единственным, и такая ситуация не является нетипичной [33]. Идея рассмотрения степенного функционала (2.3) сама по себе не нова [29][32] - в иностранной литературе она называется "Conventional approximation method", но в нашей постановке и в связи с линейно-квадратичной задачей, насколько нам известно, ранее не рассматривалась. Как правило, исследуется минимаксная задача при D2(t) = 0, возможно, с нелинейным уравнением объекта. В [32] такая задача рассмотрена в приложении к управлению траекторией летательного аппарата. В [32] утверждается (но не доказывается, хотя эмпирические результаты весьма удовлетворительны) возможность аппроксимировать оптимальный процесс минимаксной задачи оптимальным процессом для функционала высокой степени. Указана также возможность приближённо получать оптимальный процесс для функционала степени р+1, пользуясь в качестве начального приближения оптимальным процессом для степени р, начиная от р = 1, которое соответствует линейно-квадратичной задаче.
В работе [31] рассмотрен "беллмановскнй" подход к решению задачи минимизации максимума модуля для нелинейного объекта. Для оптимизационной задачи
x = f(x,x(x),u(x)) стандартным образом введено семейство функций Беллмана Vp (t, х) = inf{P^x (u(-)); по всем допустимым и(-)} . При естественных предположениях на функции f и h доказано существование поточечного предела lim Vp(t,x) = V°°(t,x) и его
совпадение с функцией Беллмана минимаксной задачи ess.sup|h(s,x(s),u(s))|-> min, которая определяется аналогично и явдяется
решением некоторого уравнения динамического программирования. Выводится также результат о сходимости последовательности оптимальных процессов при р -> +оо к оптимальному процессу минимаксной задачи. Таким образом, метод, применённый нами в главе 5 сродни методу, применённому в работе [31]. Однако, рассмотренная в диссертации задача отличается от рассмотренной в [31] и не является её частным случаем. Кроме того, в силу специфики линейных уравнений (наиболее часто встречающихся в приложениях) результат диссертации и процедура приближённого вычисления регулятора имеет более явный и простой вид, чем результат [31]. Даже для простейших нелинейных уравнений объекта решения в виде регулятора может не существовать и аналогия с линейно-квадратичной задачей теряется или, по крайней мере, сильно усложняется.
Задача минимизации ФР;Ч тесно связана с линейно-квадратич