Операторные подходы к решению линейно-квадратичной задачи оптимального управления

Рогулина, Юлия Валентиновна

Операторные подходы к решению линейно-квадратичной задачи оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Рогулина, Юлия Валентиновна АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

1992 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Операторные подходы к решению линейно-квадратичной задачи оптимального управления»

Автореферат диссертации на тему "Операторные подходы к решению линейно-квадратичной задачи оптимального управления"

САИКГ-ПЕГЕРЕУРГСКЙЙ Г0СУДШЗТВЕНН1Й УНИВЕРСИТЕТ

На правах рукописи

РОГУЛИНЛ Длил Валентиновна

ОПЕРАТОРНЫЕ ПОДХОД! К РЕ1ЕНИЭ ЛКНЕЙНО-КВАДкАТИЧНОЙ ЗАДЧИ СШШШОТО УПРАВЛЕНИЯ

Специальность 01.01.09 - Математическая

кибернетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-матеыа-тических наук

Санкт-Петербург 1992

Работа выполнена на кафедре теоретической кибернетики ттематкко-иеханического факультета Санкт-Петербургского государственного университета

Научный руководитель - доктор физико-математических наук,профессор В.Н.Фомин

Официальные оппоненты:

доктор физико-математических наук.профессор Н.Н.Петров кандидат физико-математических наук О.А.Петров

Ведущая.организация - Ленинградский электро-техничес-кий институт им.В.К.Ульянова (Ленина)

. & О

Защита состоится " М&ЦА 1992 г. в и

часов на заседании специализированного совета К 063.57.49 по присугденио ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете (198904.С-Петербург.Петродворец.Библиотечная пл.,д.2. Ма-гематкко-механическиЯ факультет СПб ГУ)

С диссертацией можно ознакомиться в Научной библиотеке к-.А.Ы.Горького университета (Санкт-Петербург.Университетская наб.7/9)

Автореферат разослан 1992 г.

Ученый секретарь специализированного совета кандидат физико-математических наук

А.. И. Шепелявый

' ОБЩ ХАРШЕШЯШ РАБОТЫ

Актуальность темы.Раздел теории управления динамическими объектами,связанный с линейно-иведраглчной задачей (ЛКЗ) управления (линейный объект управления (ОУ) + квадратичный (по состояниям,управляющим воздействиям и выходным переменным) функционал качества и исследованием условий ее разрешимости ,является центральным и наиболее разработанным.В значительной !чзре достижения в этой.области связаны с работами А.А.Воронова,ß.Н.Зубова,Р.Калкана,H.H.Красовского, А.Ы.Лето-Еа,А.И.Лурье.В.А.Якубовича по синтезу линейных систем.оптимальных по квадратичному критерию качества. Известны разнообразны з постановки ЛКЗ,имеющие существенные особенности; по -разному могут задаваться квадратичные критерии,*арактеризук>-ске качество используемой стратегии управления.Эффективность алгоритмов синтеза оптимального управления в значительной степени зависит от свойств помех.действующих на ОУ и в канале наблюдения. Разнообразие вариантов ЯКЗ весьма велико, что повлияло на выбор темы диссертации,где ЛКЗ управления поставлена в форка,охватывающей разнообразные способы задания ОУ и квадратичного функционала качества управления.

В работе предпринята попытка исследования задачи построения оптимального регулятора в терминах функционального анализа, когда последовательности состояний и управляющих воздействий рассматривается как элементы некоторого гильбертова пространства,минимизируемый функционал представляет собой квадратичную форму некоторого симметричного оператора,уравнение ОУ определяет при этом некоторое аффинное множество, которому должны принадлежать переменные квадратичной формы. В этих терминах ЛЬЗ приобретает хоропо известную форму задачи условной минимизации: требуется минимизировать квадратичную форму некоторого симметричного оператора при линейных ограничениях. Такая "операторная" трактовка задачи оптимального управления позволяет предложить прозрачные условия ее разре-пимости и. установить возможность представления оптимального управления в веде обратной связи,что щ многих прикладных задачах имеет ваяное значение.

Цэль работы состоит в исследовании возможности представления оптимального управления,полученного при решении ЛНЗ, в форме обратной связи.Существенной особенностью обратной связи является требование неупреждаемости описывающих ее операторов.

Методика исследования.Условия разрешимости ЛКЗ и алгоритмы построения оптимальной обратной связи тесно связаны с аналогам! частотных теорем,обеспечиваюциш положительность оператора квадратичной фор.« на подпространстве .порождаемом задачей управления.В частотных терминах естественным образом устанавливается искомое представление (неупревдзющая факторизация) оператора квадратичной формы,что определяет вид оптимальной обратной связи.

В работе используются методы функционального анализа,линейкой алгебры,вариационного исчисления,метод преобразования Фурье.

Науччял новизна.В диссертации широко используется операторный подход при исследовании задачи оптимального управления.В соответствующих операторных иерыинах сформулирована теорема разделения к получено решение задачи синтеза оптимального регулятора.Методом динамического программирования получены формует для вычисления коэффициента оптимальной обратной связи.

Операторный метод позволил рассмотреть задачу управления нестационарны; объектом, Дтя ОУ в стандартной форде.коэффициенты которого мало отличаются от постоянных величлн .предложен эффзктивкьй алгоритм построения разложений коэффициентов оптимальной обратной связл по степени малого параметра. Использование операторного подхода позволдет оценить величину параметрических возмущений,при которых оптшальнь.'й регулятор существует.

Практическая ценность работы.Предложенннй операторной подход к задаче оптимального управления позволяет резать разнообразные задачи оптимального управления линейным объектом при квадратичном критерии качества.При этом объект может описываться разностными уравнениями на конечном или бесконечном промежутке времени; квадратичный критерий - функционал качества - также может задаваться по-разяоыу.

Апробация работы. Результаты диссертации докладывались на научных заседаниях кафедры теоретической кибернетики Санкт-Петербургского университета и опубликовагга в работах [I] - £з].

Структура и обьем диссертации. Работа состоит из трех глав (первая включает ее краткое содержание), заключения,списка литературы.Объем - 107 страниц,библиография содержит 72 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

В пе-рзой главе обсуждается тема диссертации,приводится обзор литературы,кратко рассматривается содержание работы.

3 п.1 приводится общая постановка ЛКЗ управления. Принятого 0У функционирует в дискретном времени О,'/,... и описывается линейными разностными уравнениями

2Г4+1 « Ах* + , щ » Схь (I)

где , (Д - веп-ественныэ векторы переменных состояния,

управления и выхода в момент времени {, соответственно размерностей п, т, I ; х4€ й\ 1Цв I?"1, %е . А.ЗЬ, с, К -прямоугольные вещественные матрицы соответствующих размеров.

Вектор Х„ не предполагается известным.Примем,что I, является случайным гауссовым вектором с известными статистическими характеристиками

, К* =ИСа-£)(зс-хУ

,м ' . (2)

(П- символ математического опадания,звездочка означает

транспонирование соответствующей матрицы (вектора),в комплексном случае звездочка означает эрмитово сопряжение).Симметричная (Цхп ) - матрица предполагается невырожденной, (Ы. Ф 0 .Управляющие воздействия - векторы Ц^ - формируются по типу обратной связи

где для краткости обозначено

- , и*"1 "(и.....,11н)

и И^о - вещественные вектор-функции,определяющие закон управления.Последовательность

гго= (и0о>,и,(>, - > (4)

Лого] -z м

■W)

этих функций называется стратегией управления (СУ).Далее рассматривается лишь допустимые СУ,обеспечивающие выполнение неравенства

М Ж ( I xj^+luj*

t-0 ' (5)

где I-) - евклидова норма соответствующего вектора и усреднение производится по распределению случайного вектора Хс ■ Множество всех допустимых СУ обозначим и».

Предположим,что ка множестве 17» задан функционал

'2Л Ut »

, ЬI (6)

где м - симметричная матрица соответствующего размера. На уровне интерпретации понимается,что функционал (6), или критерий, определяет "потерн" используемой СУ V.°*(.~) € U®" . Задача линейно-квадратичной оптимизации состоит в вычислении величины

Ы J euro]

IL-l-HV* (7)

и установлении условий,при которых ета величина достигается на множестве U® .С прикладной точки зрения важной является задача нахождения СУ,на которой функционал (6) принимает наименьшее в множества значение.Если такая СУ существует, то ДКЗ называется разрешимой,а соответствующая СУ - оптимальной,последоваюльшстъ , порождаемая соотношения« (3) при оптимальной СУ,называется оптимальным управлением.

Далее для краткости формулировок примем,что ^*=(т. о. вектор состояния ОУ "подмоетьы каблвдается"). Случай не-полнкх наблюдений вектора состояний (при линейности "канала наблюдения" и при вшоляенки условия наблюдаемости) а определенном смысле сводится к случаю полных наблюдений»Сделанное предположение позволяет ограничиться рассмотрение»! квадратичного '{ivHtfUMOHMa , , .

где

М-

а *

7 -

О = 5 = !?"-, К-Я"1-«'".

Условие разрешимости такой задачи упрзвления удобно Привести в частотных терминах. В п.8 формулируется следующий хорошо известный результат.

Теорема I. Пусть задача

ТГС-ни» ,9)

имеет ряшение.Тогда при любом комплексном числе А, \X\-i, к любых комплексных векторах ОС« К"", IIе Я*1 связанных соотношением Х-АЛЭС+ХЗЬЦ. .выполнено неравенство

(3-е

(Ю)

Если неравенство (10) выполнено в усиленном емвеле

' (и) N ( и]п(1х1' + Гк1*)

4 ' (II)

при некотором £?(? ,пара матриц (А,В) стабилизируема и матрица А не имеет собственных значений на единичной окружности, (1л~2Л) 0 ,то задача оптимизации (9) разрешима. Более того, для функционала (6) справедливо представление

ЯгГ0)]-Ма?Нх.+ % МЧ-Кх/ь

где Н - симметричная (Н*= Н ) неотрицательная ( Н>0 ) матрица, удовлетворяющая уравнению Дурье

Н • А" НА - а'нь * ЭХ В'НВ+«ГЧ &*НА ^ *) +Ц

При этом матрица Д*ВК(М) устойчива (не имеет собственных значений в множестве IЯ1 ^ 1).

- в -

Из (12) непосредственно следует,что минимум функционала (6) достигается на управлении,порождаемом обратной связью

* (14)

Матрицу К=К(Н), определяемую формулой (13).называют (матричным) коэффициентом оптимальной обратной связи.

Таким образом,при выполнении условий теоремы,оптимальная СУ в классе произвольных обратных связей существует,имеет вид (14) и при этом

ш. ТСг1~(->]»Ма£Нл..

ЦГОеи*

(15)

Приведенный результат являлся в диссертации модельным при разработке операторного подхода к "абстрактной" ЛКЗ. Наиболее существенной особенностью этого результата является возможность представления оптимального управления в виде линейной обратной связи,определяемой оптимальным коэффициентом (С.

В первой главе рассмотрены возможные методы нахождения оптимального коэффициента К . Предпочтение отдается операторному подходу к решению поставленной задачи.который подробнее изучен во второй главе.

В п.1 приводится постановка абстрактной задачи минимизации квадратичного функционала в гильбертовом пространстве при ли"9йных ограничениях.Рассмотрим квадратичную форму Л"

(16)

в гильбертовом пространстве Н ,где &€.Н, М - линейный огра-н1-.ч-;.кн;й оперитор, Ы; Н^Н, М*=Л( . ^/нкционал X заданна аффинном множестве Й .определяемом соотношением

Н = , Ьг = тг] ,

(17)

где - линейный ограниченный оперэтор, |_:Н"*Н ,1Г6Н, Н" гильбертово пространство. Оператор I. и элемент ЧГ считаются "заданными".Изучается задача

£Н ' (18)

л»

где Щ ищется на афигогом множества Н . Будем предполагать выполненным условие

где Л - некоторое положительное число, I - единичный оператор в Н и - оператор,сопряженный в Н оператору Ь - Это условие обеспечивает ограниченную обратимость оператора и непустоту множества Н . Введем в Н ор-

топроектор

(Ы-иЧИТи.

(20)

который существует в силу условия (19). Условия разрепимости задачи (16) - (17* сформулированы в следующем утверждении.

Геотэема 0-6.Пусть выполнено условие (19) и при некотором у > 0 спгаведливо неравенство

Тогда существует элемент 2ср1 & П , на котором выполнено соотношение

(22)

и этот элемент находится по формуле

(23)

Таким образом.решение, задачи (16) - линейная функция элемента Vе И , который в конкретньх задачах управления определяется начальными данными и возмущающиш воздействиями.

В п.2 рассмотрена непосредственно задача управления как честный случай абстрактной задачи условной минимизации. Преимущество операторного подхода состоит в той,что он дг.от возможность постановки и рзгтенчя задачи оптимизации в форме, охватывающей разнообразный способы задания линейного ОУ и квадратичного функционала качества управления.

В операторных терминах объекты управления типа (I) с из-

- 10 -

вестными состояниями могут быть записаны в виде

у - Ах + Ьи + тг.

Зункционал (6) запишется в виде *

МиГи (а.

С 24)

(25)

где М - симметричный оператор в Н'ХН", N.

Ставится задача

Ли.)-* „

аеН"

и для ее решения удобно свести ее к абстрактной задаче (16)-(17), вводя элемент оператор 1_ -¡II"А , В11-

Условие (19) имеет смысл управляемости и принимает форму неравенства

(1-А)(1-А)*«-ВВ*>Л ,<¿>0.

(26)

В условиях теоремы 5-6 существует оптимальная пара = К 4 V ,

(27)

которая является линейной функцией элемента V .коэффициенты К,, К2 выражаются через параметры задачи.

Теоремы 7,8 дают алгоритмы нахождения коэффициентов

, К2.

Репейке задачи оптимального управления в терминах обращения некоторых операторов в соответствующих гильбертовых пространствах может вызвать определенные сложности,связанные с обращением операторов в бесконечномерном пространстве. Однако в роде случаев операторный подход позволяет избежать эти трудности.Дело в том,что ЯКЗ хорошо изучена в случае стационарного 0У и постоянной матрице квадратичной формы,так как допускает переформулировку в частотных терминах.Тогда можно воспользоваться спектральным методом, соответствующие операторы оказываются "диагональными" и их можно обращать без тру-

да. Основываясь ка этом факте,в работе рассмотрен квазистационарный случай,когда коэффициенты ОУ мало отличаются от постоянных величин.Использование операторного подхода позволяет предложить элективный метод построения разложений коэффициентов оптимальной обратной связи по степеням малого параметра

К=КШ = ?

ъ=о

и указать величину малости Ь ,при котором решение существует (соответствующие рядн сходятся).

Глава 3 посвящена синтезу оптимального регулятора. Алгоритмы, основанные на формулах типа (27), определяют управление Ц в вида "программы" по заданным начальным данным и помехам. т.е. элементу V & Н .В некоторых задачах такое представление алгоритма формирования управляющих воздействий неудовлетворительно (программное управление может оказаться чув-стзительшм к разного рода неучтенным возмущениям) и возникает проблема построения управлений в виде обратных связей,которые связывают оптимальные значения и

ii.pt = Kv.pt +ТИГ

(23) _

Важно,чтобы входящий в оптимальную обратную связь оператор К был каузальным (причитшм.неупреждающим) .Поясним,что понимается под каузальным оператором.для этого введем понятие причинного пространства.

Пусть э гильбертовом пространстве Н выделена временная структура.Это означает,что в Н выделено семейство ортопроек-торов РГ--{Р4] , -ц, пара-

метризованных вещественным параметром { ,пробегающим целочисленные значения от до . Это множество целых чисел рзремя дискретное) обозначим Т . Предполагается,что семейство

?т обладает свойствами полноты Pt *0, Р^ =1 .ортогональности Р^ОД^', *РЪ . Пару ( Н.Р-т ) назовем причинным пространством.

Пусть К - оператор,действующий в причинном пространство (Н,РГ), (Н,РГ)-»(Н,РТ) . Введем Обозначение ¡?и-» "Р^КР^ • Оператор Р назовем каузальным (причинным) если

- 12 -

выполнено соотношение -О , > {: ; строго каузаль-

ны.!,если ; антикаузальным.если

;строго антикаузальным.если -0 ,

и нейтральным,если ,

Для решения задачи об оптимальной обратной связи полезно специальное представление функционала (25). В п.З главы 3 сформулировано основное утверждение.

Теорема 9. Пусть выполнены условия: I.Оператор 1~А в формуле (24) обратим. 2.Операторы А, В строго каузальны.

3.Симметричный оператор Л/ нейтрален и положительно определен

N >р1 (29)

где р - некоторое положительное число, £, X - единичный оператор.

Тогда квадратичная форма на множестве Н (см.формулу (17)) допускает представление

ГиК

(30)

где X* = Ы) - некоторая постоянная. При этом оператора <1, р, £- - линейные ограниченные операторы в соответст-' вуприх прортранствах Н"-»Н", ^ '• Н И", С ■ Н -* Н и операторы $ - каузальные, Ь - строго антикаузальный.Кроме того,оператор Л ограниченно обратим (обратный оператор «Г* не обязан быть каузальным).

В работе показано,как находятся операторы £ по • операторам А, Ь, N , определяющим Ж©,методом динамического программирования.

На самом деле,в диссертации- сформулировано менее тривиальное утверждение.Дело в том,что учет временной структуры позволяет рассмотреть серив линейно-квадратичных задач , и для выполнения соотношения (30) достаточно потребовать положительности симметричного оператора N при каждом t.

Следствие. Пусть и=и(Х, V) - неупреждающая функция X и элемент V известен (в конкретных задачах это означает, что помимо начальных данных в каждый момент времени известны

- 13 -

прошлые и будущие значения возмущающих воздействий).Тогда из (30) непосредственно следует,что для оптимальной пары (27) выполнено соотношение •

(¿Ц/^Х + ПГ- . (32)

ти* (зз)

Мы пришли к оптимальному управлению в фйрме "обратной" линейной связи типа (28).Обратная связь (32) содержит неоднородный член ¿V" .определяемый начальными данными и помехой.Однако,если на ОУ помехи не действуют (элемент ЛГопределяется лишь начальными данными) и уравнение (32) порождается конечномерным разностным уравнением в стандартной <Ьорме,то в силу антикаузальности оператора & выполнено С1Г~ 0 и приходим к регулятору типа Ц^Кх • Заметим,что если оператор об - каузальный, то оператор К - каузальный и полученный регулятор физически реализуем. Однако оператор с*С не обязан быть каузальным в случае бесконечномерного пространства.

Недостаток полученного решения рассматриваемой ЛКЗ состоит в том,что часто помеха V" неизвестна и тогда регулятор (32) нереализуем.Однако и в этом случае знание операторов $ , & определяет структуру оптимального регулятора.

В л.З главы 3 для построения оптимального управления используется метод множителей Дагранжа.Оптимальный регулятор ьновь имеет вид (28). Этот результат сформулирован в теореме ■ 10. В теореме II сод<зр?кится услозив специального предстарлетая оператора Д/ квадратичной формы.

В п.4 использование теоремы 9 продемонстрировано на примере задачи программного управления стохастическим ОУ.

ОУ описывается разностным уравнением

Хн< * М + + , 4 '0,1,... .

Вектор 20 предполагается заданным .помеха 1Г- {%, "ОД... }-дискретный белый шум. Ыножество допустимых управлений состоит из последовательности детерминированных векторов Ц4е Я"1 такой,что выполняется неравенство

«•О ' • ' '

- 14 -

у - дисконтирующий мнокитель, ^ € (О, 4) .

Задача состоит в наховдении управления Ц. , минимизирующего функционал

(34)

характеризующий качество управления.

При виполнении условий теоремы 12 (п.4 главы 3) функционал (34) можно преобразовать к виду

Эг (а)= Г\-Т1) ? Г" ' Ш - К 7 Мэс* ![г * Н- Г) Я №

Г (35)

где ( гпхп)- матА чца, Ц- - положительная (т*яг) -матрица, (И^) - линейная функция возмущающих воздействий,. = {1^+1» ] - симметричная матрица, являющаяся решением соответствующего уравнения Лурье. Второе и третье слагаемые в правой части формулы (35) не зависят от выбора управления,поэтому оптимальное управление определяется соотношением

* = К г Ъ . '

(36)

Использование последовательности детерминированных П - векторов, определяемых рекуррентными соотношениями

зсж- А5,

позволяет определить рекуррентную форму обратной связи (36).

- 15 -

Использование дополнительных переменных существенно упрощает алгоритм формирования управляющих воздействий.

ЗШШЕНИЕ

Основные результаты,полученные в диссертации,могут быть сформулированы следующим образом:

1. Формализация ЛКЗ оптимального управления и ее интерпретация в операторных терминах.

2. Репение задачи синтеза оптимального регулятора для линейных объектов при нейтральном операторе квадратичного критерия оптимальности.

3. Решение задачи управления на бесконечном промежутке времени линейным стохастическим объектом в классе детерминированных программных управлений.

Основные результаты диссертации опубликованы в следующих работах:

1. Рогулина В.В.,Фомин В.Н. Обзор методов реиения задачи линейно-квадратичной оптимизации // Деп. в ВИНИТИ,№859- . В91 от 21 февраля 91 г.- 36 с.

2. Рогулина Й.В.,Фомин В.Н. Операторный метод исследования линейно-квадратичной задачи оптимизации// Деп.в ВИНИТИ, № 2330-В91 от 04 июня 91 г. - 62 с.

Рогулина Э.В..Фомин В.Н. Квазистационарный случай оптимального управления // Деп. в ВИНИТИ, № 2197-В91 от 27 мая 91 г. - 16 с.

Подписано к печати 09.03.92 . Бесплатно . ПМЛ СПГУ. 199034,

Заказ 107 Гирак 100 Объем 0,75 п.л. Санкт-Петербург,наб.Макароза,б.