Операторные подходы к линейно-квадратичной задаче оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Пак, Вадим Геннадьевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1998 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Операторные подходы к линейно-квадратичной задаче оптимального управления»
 
Автореферат диссертации на тему "Операторные подходы к линейно-квадратичной задаче оптимального управления"

СО

.__ СГ

^ оч о

, О САНКТ-ПЕТЕРКУРГОКИЙ ГОСУДАРСТВЕННЫЙ

I УНИВЕРСИТЕТ

На правах рукописи

Пак Вадим Геннадьевич

операторные подходы к линейно-квадратичной задаче оптимального управления

(01.01.09 - математическая кибернетика»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург 1993 г.

Работа выполнена на кафедре теоретической кибернетики математико-механияеского факультета Санкт-Петербургского государственного университета -

Научный руководитель.- доктор физико-математических наук, профессор Фомин Владимир Николаевич

Официальные оппоненты: доктор физико-математических

наук, профессор Дергузов Виктор Иванович.

кандидат технических наук,

доцент Андриевский Борис Ростиславич

Ведущая организация: Санкт-Петербургский государственный.

технический университет <г. С.-Петербург»

Защита состоится ■ года в /9. час.

?Р.тю. на заседании диссертационного совета К 06З.57.49 но защите диссертаций на соискание ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете по адресу: 1Э89Й4. г. Санкт-Петербург, Старый Петергоф, Библиотечная плоцадь, д. 2, математико-механический факультет Санкт-Петербургского государственного университета.

С диссертацией можно ознакомиться по адресу: г.Санкт-Петербург, Университетская набережная, д. 7/9. Научная библиотека С!ЮРУ.

Автореферат разослан " .Ф.".. 1998 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук, доцент

А. И. Шепелявый

Обцая характеристика работы Актуальность тепы

В теории оптимального управления наиболее полно изучена задача управления линейным объектом при квадратичном критерии качества управления (линейно-квадратичная задача <ЛКЗ) оптимизации, или задача Калмана - Летова). Эта задача в достаточно общей постановке может быть переформулирована как задача минимизации квадратичного функционала на подпространстве гильбертова пространства (абстрактный вариант задачи Винера». За последние года разработаны метода синтеза оптимального управления (регулятора) при различных постановках ЛКЗ управления. В "стационарном" случае многие из них доведены до эффективных алгоритмов, основанных, в частности, на операциях факторизации и сепарации дробно-рациональных матричных функций. В данной работе к исследованию ЛКЗ применены обще (операторные) подхода. Это позволяет ставить и решать разнообразные задачи оптимального управления (управление линейными стохастическими объектами, описываемыми разностными, обыкновэннными дифференциальными уравнениями либо уравнениями в частных производных при разнообразных квадратичных критериях оптимальности; управление на конечном либо бесконечном промежутке времени и т.д.>. Операторные подхода к ЛКЗ оптимизации заключаются в постановке задачи в абстрактной форме; ее решение получается в терминах операторов, действующих в абстрактных гильбертовых пространствах. Введение понятия линейной стохастической (в случае стохастической оптимизации) и нестохастической системы, включающего в себя наиболее общие свойства линейных объектов управления, рассматриваемых в задачах теории оптимального управления, позволяет абстрагироваться от их конкретных особенностей, несущественных в контексте общзй ЛКЗ.

Основная проблема в решении абстрактной задачи оптимизации заключается в эффективной < допускащей применение в практических приложениях) реализации операции обращения оператора на подпространстве гильбертова пространства. Для разрешения этой проблемы в стохастическом варианте разработан абстрактный

аналог известного в теории оптимальной фильтрации метода Винера, основанного на использовании операций факторизации и сепарации некоторых операторов, порождаемых той или иной ЛКЗ.

Для задачи оптимизации в нестохастическом варианте, которая в общем случае оказывается вырожденной, показано, что введение соответствущего фактор-пространства, связанного с нуль-пространством выроздащегося оператора, позволяет свести задачу к виду, допускавдему применение абстрактного аналога метода Винера. На примере ряда задач, в частности, абстрактной мшимакснной задачи оптимизации, показано применение разработанных операторных подходов.

Цель работы

Одной из основных целей данной работы является разработка методов решения абстрактной ЛКЗ оптимизации в стохастическом и нестохастическом вариантах, а также абстрактной минимаксной задачи оптимизации. На основе разработанной теории решить представляющие практический интерес задачи оптимального управления. Это предполагает, в частности, дальнейшее развитие эффективных методов решения ЛКЗ в различных постановках.

Научная новизна

В диссертации продолжается дальнейшее развитие методов синтеза оптимального регулятора в ЛКЗ и ее обобщениях (абстрактная ЛКЗ оптимизации).

Практическая ценность

Разработанные метода могут быть использованы непосредственно для решения разнообразных задач линейно-квадратичной оптимизации, встречающихся в приложениях.

Методы исследования

В работе используются метода функционального анализа, теории линейных операторов, теории функций комплексного переменного, теории вероятностей и теории оптимального управления.

Апробация работы

Результаты работы неоднократно докладывались и обсуждались на научных семинарах кафедры теоретической кибернетики СПбГУ (научный руководитель семинара - член-корреспондент РАН

профессор В. А.. Якубович».

Публикации

Основное содержание работы опубликовано в статьях [13], написанных в соавторстве с научным руководителем профессором в. Н. Фоминым. В этих статьях В. Н. Фоминым осуществлялась общая корректировка направлений исследования.

Структура и объел работы

Диссертация состоит из введения, трех глав, разбитых на пункты и подпункты, и списка литературы. Библиография содержит 30 наименований. Общий объем работы - пэ страниц.

Крагкоо содержание работы

Во введении дан краткий обзор литературы по теме диссертации, рассмотрена актуальность темы диссертации и приводится краткое содержание работы с основными результатами.

В первое главе диссертации исследуется следуищая абстрактная задача. Пусть Н', Н" - пара гильбертовых пространств со скалярпыми произведениями < ■, ■ >ц.. < •, - : Н - их прямое произведение: Н - Н' х Н". Скалярное произведение в Н определяется естественным образом. Вводится понятие линейной стохастической системы как тройки 1ь',/,г), где 5: Н Н' - линейный замкнутый оператор с плотным множеством определения з й, ? - случайный элемент со значениями в Н' (входной элемент системы) и а -выделенное множество случайных элементов (выходных элементов системы) со значениями в П. с вероятность!) 1 удовлетворяющих соотношении

Яг = ' (1)

где г е Ъ.

Введем дополнение системы (1 >. Примем, что на выделенное множество % решений уравнения (1) наложено дополнительное условие: кавдый элемент г « г должен с вероятностью 1 удовлетворять уравнению

7 л = (^н, (2)

где 7 е г, Г = <7> - выделенное множество линейных операторов, 7: Н -»■ Н"; 0гг..- - нулевой элемент в Н". Предполагается, что эле-

менты множества Г являются дополняющими оператор б в том смысле . что операторы [ ^ ]: Н Н имеют ограниченные обратные. Оператор

к - м-р = [ | ] (3)

назовем передаточным оператором системы <1), (2 >.

В силу обратимости оператора от 7> при 7 е Г система (1>, (2) разрешима и в силу (3) определяет единственный случайный элемент

*«7> = ю7> (у. (4)

Пусть / - случайный функционал, порождаемый случайным элементом / (/ а -- сг,а>д,, V а е Н'). Ставится следущая задача оптимизации. Предположим, что корреляционный оператор

Н' Н' случайного элемента ? существует и является ограниченным линейным оператором (Е - символ математического ожидания) . Пусть //: Н -<• Н - некоторый линейный ограниченный неотрицательный оператор, для которого с вероятности) 1 в силу < 4 > определена случайная величина <з(7> 7>>н с конечным математическим ожиданием, и

Лг(7>) = Е <л(7>,№г(7>>и =

=Е У У>н = (6)

задает на множестве Г неотрицательный функционал. Принимая функционал (5) в качестве критерия оптимальности, приходим к линейно-квадратичной задаче стохастической оптимизации ЛЮ ■* 1п£. (6)

где Й = *(Г> = Ш7>. те г>.

Если в задаче < 6) найден оптимальный передаточный оператор V е у , то для получения соответствующего решения г системы (1), (2) требуется определить оператор 7ор1, отвечающий передаточному оператору и . Процедура построения оператора 7ор1 по основана на следующей лемме.

Ленка 1.1. Предположим, что существует и известен некоторый допустимый передаточный оператор = № 7^. 70 е Г вида

системы (1>, < 2). Тогда соотношение

м = р/ Г 1н'

Ч *

°Н'Н" . <8)

определяет взаимно однозначное соответствие между множеством Я передаточных операторов системы (1), (2) и множеством щ х Ф линейных ограниченных операторов ^ ф, ф]: Н -<• Н \ определяемых соотношением

[ф . ф ] = [ о н..и.. /н.. ] V;1 мт> <9)

при таких операторах 7 ^ Г, что оператор ф: Н" -» Н' ограничено обратим. При этом

йГ' = I 1 = 1 I. (10)

[ ф ^-ф я + То) ] [ т ]

Далее предполагается, что множество ® * Ф является некоторым подпространством пространства ® * Ф линейных ограниченных операторов [ф . ф] : Н -> Н". При этом отмечается, что множество я не зависит от выбора оператора

Согласно лемме 1.1, если передаточный оператор Уор1 <= » является решением задачи (б>, то отвечающий ему оператор 7ор1С е г находится по формуле

7 = ф" <-ф 5 + у >, <11)

'ор1 тор1 тор1 »О

где

[Форг- Фор. ] = 1Н-]"Р ".и- <12>

Используя соотношение параметризации (8), критерий (Б) можно представить как квадратичный функционал от параметризующего оператора [ф, ф ] с а * ф. Причем оказывается, что функционал не зависит от оператора ф в силу того, что в правой части соотношения <2> стоит нулевой элемент.

На множестве Ф всех линейных операторов ф: Н' -» Н" при условии ограниченности и положительной определенности корреляционного оператора ~B.fi* случайного элемента ± можно ввести структуру гильбертова пространства (обозначим его Ь2 < Ф)) со скалярным произведением <ф-,ф->ф = Е<.г\ (ф'Уф *>н.. Запишем функционал (5> в виде

Лф) = «ф.Аф^ + 2 Я<кф.г>щ + р, (13)

где К: Ьг<Ф) ■» Ьг(Ш> - неотрицательный ограниченный оператор, - элемент из Ь2<®) и р - положительная величина, определяемые исходными данными задачи и оператором мо. В итоге получаем задачу

Лф) 1п£. ( 14)

феФ

Задача минимизации < 14) исследуется при различных пред-полоаениях об оператора я. Если я - положительно определенный оператор, то ее решение достаточно просто. Так. в случае, если Ф = Ь2(«>, то ее решение в этом случае едиаствено и может быть представлено в виде

ФорГ- - й'г. <15)

Оптимальный оператор 7ор1 теперь может быть найден по формуле <И), где фор1 - произвольный элемент множества Ф (см. формулу (12)>.

Задача <14) на подпространстве Шеф называется абстрактным аналогом задачи Винэра и сводится^ к предыдущей введением ортопроектора р на подпространство © = ЯВ. При этом для получения оптимального элемента фор1 необходимо произвести обращение оператора л на подпространстве Ш. Решение задачи при помощи абстрактного аналога метода Винера дано в виде леммы.

Леииа 1.2. Предположим, что оператор в квадратичной формы в <13) допускает представление я = и и,

где оператор и-. Ь2(Ш) -> Ь2(Ф> ограничено обратим, причем операторы v, и1 оставляет инвариантным подпространство Ф. (Здесь звездочка означает эрмитово сопряжение в Ь2(Ф>.> Тогда единственное решение задачи минимизации (14) может быть представлено в виде

Фор1 = -^рЦСиГ^.

(Напомним, что р - ортопроектор, рЬ2<Ш) = Ф. >

В пунктах 1.3-1.5 с использованием результатов п. 1.1 решены некоторые задачи оптимального управления: ЛКЗ управления дискретным и непрерывным стохастическими объектами, задача управления при дополнительном квадратичном ограничении, задача синтеза оптимального регулятора в классе нестабилизирующих обратных связей и др. Для дискретной и непрерывной задач даны их постановки в операторном виде.

Вторая глава посвящена ЖЗ оптимизации с известным возмущающим воздействием. В математическом плане это приводит К задаче минимизации неотрицательного функционала с 13 > с неотрицательным оператором д. В этом случае метод Винера неприменим, решение задачи оптимизации (14) нэединственао. В п. 2.1 поставлена и решена абстрактная ЛКЗ оптимизации с известным возмущающим элементом.

Пусть х, и - пара гильбертовых пространств со скалярными произведениями <•, •>х. <•- >и- соответственно. Определим линейный объект управления как совокупность (. где л-, х-*

х. В: и х - линейные замкнутые операторы с плотными множествами Боз) £ х, В(в> £ и определэния: предполагается, что нуль-пространство оператора а тривиально (ах = ох =» л- = - нулевой элемент пространства х>, ±' - произвольный фиксированный элемент гильбертова пространства х (входной элемент системы), х и и - выделенные линейные множества элементов л- и и пространств х и и соответственно, удовлетворяющих соотношению Ах + Ви = ^ (16)

Канал обратной связи описывается уравнением

аи + = (17)

где [р. а] = у е г, Г = {7} - выделенное множество линейных операторов 7 = [р. а ]: а: и •» и. р: х ■+ и - линейные замкнутые операторы с плотными множествами определения, оператор а обратимый; - нулевой элемент в пространстве и. При каждом фиксированном 7 в г система (16), (17) определяет (при условии ее разрешимости) единственный элемент

т = «т> (и-

где

= а]"- <18>

Оператор м7) (при фиксированном 7) назван передаточным оператором замкнутой системы управления (16), (17).

Ставится задача оптимизации. Пусть на множестве решений системы (16), (17) определен квадратичный функционал

ли) = <( и К- (19)

где N - линейный ограниченный неотрицательный оператор, действующий в пространстве Н = х х и, скалярное произведение в Н <•,->ц определяется естественным образом. Используя определение передаточного оператора (18) и лемму 1.1 о параметризации, функционал (19) можно привести к виду

Г7( ф) = ф'дф/^ + 2 Лй <1, + р. (20)

где * = (^Г^Г («£я,Гм£\

р = <£. (г/1>)*л'(^1>/>х; ыо = [ ^' • ] - передаточный оператор системы (16), (17>, отвечащай некоторому известному допустимому регулятору 7о е Г . I * Н, ((': ■* Н - ЭГО

блочные компоненты; ф: х -» и - линейный ограниченный оператор, ф е Ш, f - подмножество множества всех линейных ограниченных операторов, действувдих из х в и. Будем предполагать, что неотрицательный оператор J?: Н -» Н является положительно определенным. Кроме того, предположим, что он допускает факторизацию Я = if U, (21)

где и - линейный ограниченный оператор, имеющий обратный сГ1, причем операторы и и (Г* оставляют множество ® инвариантным, iJ® £ f, cr1® s Ш. тогда функционал (20) преобразовывается к виду

Лф) = + 2 Re <фг, + р - «7(ф), (22)

где ф = а|>, г - <и1)*г.

Приходам к задаче

.Лф) -> _inf. (23)

ф е Ш

Предполагается, что множество $ является подпространством банахова пространства В^ линейных ограниченных операторов, действувдих из IE а.

Задача (23) оказывается вырожденной с точки зрения метода Винера, поскольку функционал <22> в общем случае не является строго положительным. Однако, введя норму на фактор-пространстве множества Взш/$с>, где ®о - нуль-пространство квадратичной формы <фг, ®0 - {ф е В^ц: фГ = <?и>, МОЖНО ПОЛУЧИТЬ структуру гильбертова пространства на классах эквивалентности ф- = {ф ; ф = ф* + ф", ф" е Фо>, где ф' - порождающий класс Ш* элемент (т.е. Фо - линейное множество, выступающее в качестве нулевого класса эквивалентности).

Тогда (22) можно рассматривать как функционал, определенный на пространстве l3< В^) классов эквивалентности элементов ф, L2< Ф) - подпространство этого пространства, Lz<5b -

= Ш/Ф , ® = {ф е 35: ф/ =

о о г 7 и к

J(i) = сГ(ф) = <Ш,®> +2 Be <Ф,й> + р,

где ф - произвольный элемент из класса эквивалентности Фи/f -класс эквивалентности, порождаемый элементом г. Поэтому можно поставить задачу минимизации

ЛШ) -> inf. (24)

feL2(®>

где L2(8h - подпространство пространства классов эквивалентности V В^). Ее решение сформулировано в следующей теореме.

Теорема 2.1. Пусть оператор в положительно определен и допускает факторизацию (21). Тогда оптимальные элементы в зада-

48 (24) имеот вид ФорГ - СГ*Ф+ Фо-

где ф^ фо - произвольные элементы из классов эквивалэнтаостэй рд и Шо.

В третьей главе рассматривается минимаксная задача оптимизации линейных дискретных систем управления. Задача поставлена и решена в операторной форме. Применение разработанной теории продемонстрировано на примерах.

Объект управления задается так жэ, как и в задаче с известным возмущавдим элементом с тем отличием, что шее то элемента f задано множество I s х возмущающих элементов. В качестве множества I фиксируется замкнутой единичный шар в пространстве X: 1 - = {f е X : £ 1>.

Так же, как во второй главе, вводятся понятия передаточного оператора м, класс допустимых регуляторов Г. В качестве критерия оптимальности взят функционал

JW = sup Л«* Л = evp (у; N w ( у>н, . (25)

Минимаксная задача оптимизации формулируется как

л

JfW * ln£. (26)

ШИ

С помощью леммы l.i а факторизации положительного оператора R (25) ПРИВОДИТСЯ К ВИДУ

Jf(j>) = |<ф - /»)*(ф - г) + pj = Лф). (27)

где ф = i-ф, г - - (£/*>%, р = р - г г, и - оператор факторизации. R, г-, р определяются исходными данными задачи и оператором wo. Получаем задачу

J((j)> inf, (28)

феф

где функционал л ■ > определяется формулой <27), Ш - подпространство пространства линейных ограниченных операторов Ш, действующих из х в и. В качестве Ф фиксируется множество устойчивых (каузальных по отношении к введенным дискретным временным структурам и ограниченных) операторов. Введем обозначение

¡sup Лф; £) = inf |(ф - 2*)*<Ф - г) + pj = ф е Ф f ^ 1-х фе®

В п.п. 3.5, з.б отдельно рассматриваются два случая: невырожденный > ipi > и вырозденный фЛ = |р|>.

Приведем основное утверздение. содержащее решение минимаксной задачи в невырожденном случае.

Теорема 3.2. ДуСТЬ МШИМаКСНЗЯ Задача (28) в невырожденном случае разрешима. Тогда оптимальное значение функционала качества

11, = 1п£ |(ф- г)"(ф- г) + р| = р|

<ИЕ

определяется как корень ц = уравнения

1Г"Л1 -

где Г~ = ро 1Х- р'о >, г П^1. П^- спектральный фактор оператора р; ро, ра - ортопроекторы разложения единиц в пространствах ж, и; 1Х~ единичный оператор.

Теорема 3.2 дает оптимальное значение функционала качества. Условие для нахождения оптимального оператора (класса), если таковой существует, дает следущие теоремы.

Творена 3.3. Пусть задача (28) в невырожденном случае разрешима. Тогда любой оператор ф, доставляющий оптимальное значение функционалу качества, удовлетворяет условию

(Ти ~ рР - V ~ ^ = ®Ц"

где = Фдр,^1. г^ = гП^1. П^ - оператор спектральной

факторизации оператора ц/х- р при (А = I - собственный элемент оператора Г* Г~ , соответствущий собственному числу 1.

Теорема 3.4. Пусть задача (281 в невырожденном случае разрешима. Тогда любой оператор фор1. доставлящий оптимальное значение [1. функционалу качества, удовлетворяет условию

<*п - & <кр1 - (1х ~ * = V

где в - (гх - ро > в - собственный элемент оператора гу^, + р. соответствущий максимальному собственному числу

В случае неразрешимости задачи (28) можно построить оп-тимизирувдую последовательность операторов {фг_}, в пределе доставляющую функционалу качества значение (1„.

Для вырожденного случая найдено необходимое условие оптимальности, которое приведено в следующей лемме.

Лейка 3.3. Пусть задача (2в> в вырожденном случае разрешима. Для того, чтобы оператор фор1 был оптимальным, необходимо выполнение условия

(ф .- /->*(ф = 0, где г - собственный элемент оператора р, соответствующий ыакси-

мольному собственному числу, р г" = |р|

Оказывается, что решение задачи «2В> в вырозденном случае сводится к проблеме нахождения максимального собственного числа и соответствующего ему собственного элемента оператора р.

Для обоих случаев приведены примеры применения полученных результатов для стационарных операторов в пространствах Лебега.

Заключение

Основные результаты работы:

1. Исследование класса задач оптимального управления в стохастическом варианте в виде абстрактной ЛКЗ стохастической оптимизации (абстрактный вариант задачи Винера>.

2. Исследований абстрактной ЛКЗ оптимального управления при известном возмуцэщем элемента: разработка методики решения этих задач.

3. Исследование на основе операторных подходов варианта абстрактной задачи минимаксного управления.

Основные результаты, выносимые на завдту, опубликованы в следующих работах:

1> Пак В.Г.. Фомин В.Н. Линейно-квадратичная задача оптимального управления. Ч. 1. Абстрактный вариант линейно-квадратичной оптимизации. СПб.. 1996. деп. В ВИНИТИ 9.12.96. N 3573-В96.

2) Пак В.Г.. Фомин В.Н. Линейно-квадратичная задача оптимального управления. Ч. 2. Примеры задач линейно-квадратичной оптимизации. СПб.. 1996. Деп. в ВИНИТИ 06.01.97. N зе-В97.

3) Пак В.Г., Фомин В.Н. Линейно-квадратичная задача оптимального управления пря известном возмущающем воздействии. Ч. 1. Абстрактная линейно-квадратичная задача оптимального управления с известным возмущающим элементом. Ч. 2. Задача синтеза универсального регулятора при вырожденной стохастической помехе. СПб.. 1997. Деп. В ВИШИ 24.06.97 N 2067-В97.