Оптимальность и робастность линейных непрерывно-дискретных систем управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Сомова, Алиса Александровна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1998
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
Сомова Алиса Александровла
ОПТИМАЛЬНОСТЬ И РОБАСТНОСТЬ ЛИНЕЙНЫХ НЕПРЕРЫВНО-ДИСКРЕТНЫХ СИСТЕМ УПРАВЛЕНИЯ
(01.01.09 - математическая кибернетика)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
С анкт-Петер бург 1998 г.
Работа выполиспа на кафедре теоретической кибернетики мате-махико-механического факультета Санкт-Петербургского государственного университета.
Научный руководитель: доктор физико-математических наук,
профессор Фомин Владимир Николаевич
Официальные оппоненты: доктор физико-математических паук,
профессор ТЕРТЫЧНЫЙ В.Ю. кандидат физико-математических наук, ст.н. сотрудник ПЕТРОВ O.A.
Ведущая организация: Санкт-Петербургский государственный
технический морской университет
Защита состоится "....."............. 1998 года в ....час....мин. на заседании диссертационного совета К.063.57.49 по защите диссертаций на соискание ученой степени кандидата наук в Санкт-Петербургском государственном университете но адресу. 198904, Санкт-Петербург, Старый Петергоф, Библиотечная площадь, д.2, математико-механи-ческий факультет Санкт-Петербургского государственного университета.
С диссертацией можно ознакомиться в Научной библиотеке СПбГУ по адресу: Саша-Петербург, Университетская набережная, д. 7/9.
Автореферат разослан "..."............ 1998 г.
Ученый секретарь диссертационного совета кандидат физико-математических наук, доцент
А.И. Шепелявый
Общая характеристика работы
Актуальность тми,г.
В теории оптимального управления наиболее полно изучена задача управления линейным объектом при квадратичном критерии качества управления (линейно-квадратичная задача оптимизации или задача Калмава - Летова). Эта задача в достаточно общей постановке может быть переформулирована как задача минимизации квадратичного функционала на подпространстве гильбертова пространства (абстрактный вариант задачи Винера). За последние годы разработаны методы синтеза оптимального управления (регулятора) при различных постановках линейно-квадратичной задачи оптимального управления. В "стационарном" случае многие из них доведены до эффективных алгоритмов, основанных, в частности, на операциях факторизации и сепарации дробно-рациональных матричных функций.
Современный этап развития систем автоматического управления характеризуется массовым внедрением средств цифровой вычислительной техники в контуры управления непрерывными динамическими объектами и процессами, поэтому возникает проблема учета специфических особенностей, обусловленных наличием в контурах управления дискретных измерителей и вычислительных устройств. Задача выбора дискретного закона управления непрерывным динамическим объектом решается обычно одним из следующих способов:
1) Выбирается некоторый непрерывный закон управления, который затем заменяется дискретной аппроксимацией.
2) Дискретный закон управления находится по дискретной модели объекта.
Оба подхода обладают принципиальными недостатками. Поэтому для приложений весьма актуальной является проблема отыскания дискретных законов управления непосредственно по непрерывной модели регулируемого объекта.
В приложениях объект управления обычно зависит от некоторых параметров. При этом может оказаться, что оптимальное в том или ином смысле управление, рассчитанное на некотрое номинальное значение параметров, должно применяться в условиях, когда некоторые параметры отклоняются от номинальных значений. Естественно ожидать, что при малых отклонениях реальных параметров от расчетных качество оптимального управления изменится мало. Однако в некоторых случаях это не так. Поэтому естественным является вопрос получения достаточных условий робастности системы управления.
Цель работы
Основными целями данной работы являются развитие теории линейных абстрактных систем и формулировка основных ее свойств в терминах передаточного оператора; изучение свойства системы, описанной в достаточно общем виде, быть робастной и получение достаточных для этого условий; решение линейно-квадратичной непрерывно-дискретной задачи оптимального управления в различных постановках в зависимости от выбора множества допустимых управлений и установление робастности такой системы по отношению к малым вариациям моментои дискретизации выходного сигнала.
Научная повита
В диссертации продолжается дальнейшее развитие теории линейных абстрактных систем. Найдено достаточное условие ее робастности. В различных постановках решена линейно-квадратичная непрерывно-дискретная задача оптимального управления. Установлено, что она является робастной по отношению л малым вариациям моментов дискретизации.
Практическая ценность
Разработанные методы могут быть использованы непосредственно для решения разнообразных линейно-квадратичных непрерывно-дискретных задач оптимизации, встречающихся в приложениях.
Методы исследования
В работе используются методы функционального анализа, теории линейных операторов, теории функций комплексного переменного, теории вероятностей, теории оптимального управления и теории оптимальной фильтрации.
А пробац и.я работы
Результаты работы докладывались на международных конференциях "Control of Oscillations and Chaos", август 1997, С.-Петербург, "Differential Equations and Applications", июнь 1998, С.-Петербург, a также неоднократно докладывались и обсуждались на. научных семинарах кафедры теоретической кибернетики СПбГУ (научный руководитель семинара член-корреспондент РАН профессор В.А.Якубович)
Публикации
Основное содержание работы опубликовано в статьях [1-6], написанных п соавторстве с на,учпым руководителем профессором 13.Н.Фоминым. В этих статьях В.Н.Фоминым осуществлялась общая корректировка направлений исследования.
Структура и обвем работы.
Диссертация состоит из введения, трех глав, разбитых на пункты и подпункты, заключения и списка литературы. Библиография содержит 20 наименований. Общий объем работы - 83 страницы.
Краткое содержание работы.
Во введении дан краткий обзор литературы по теме диссертации, рассмотрена актуальность темы диссертации и приводится краткое содержание работы с основными результатами.
Первая глава диссертации посвящена разработке теории линейных абстрактных систем. Рассмотрим линейное уравнение
= /, (1)
где г, / - элементы гильбертова пространства Н, Ь : Н —> II линейный оператор с плотным множеством; определения О(Ь) С Н. Примем, что оператор Ь имеет тривиальное нуль-пространство,
Ьг = 0 г = 0. (2)
Уравнение (1) со свойством (2) будем называть линейной абстрактной системой, Ь - ее системным оператором. Условие (2) означает, что оператор £ осуществляет взаимно однозначное соответствие; между множеством определения Т>(ГЛ и множеством значений = ЬТ)(Ь). Тем самым на определен оператор
= Ь~1, (3)
обладающий свойством 1ЛУ = I (или \УЬ — I) на множестве Ю(Х), где I — единичный в Н оператор. Оператор IV назовем передаточным оператором линейной абстрактной системы (1) - (2). Если / £ Щ^), то определен элемент 2 = IV/, и этот элемент является решением уравиения (1).
В виде (1) можно записать абстрактную систему управления
Ах+Ви=}\ + = (4)
где х £ Н* - элемент состояния объекта управления; и £ Н„ -элемент управления; /', /" - элементы возмущающих воздействий
(соответственно в объекте управления и в канале обратной связи);
Ны гильбертовы пространства состояния и управления объектом, если принять Н = Нг х Н„ и использовать обозначении
А В
(1 а
(5)
Условие (2) позволяет говорть о передаточном операторе IV замкнутой системы управления (4),
IV
А В
¡3 а
(6)
Приведенное выше определение передаточного оператор;: замкнутой системы не обеспечивает, вообще говоря, неупреждаемости ре-
шения г — ^ п ^ замкнутой системы по отношению к возмущающему воздействию (что в прикладных задачах должно иметь место), т.е. передаточный оператор системы (1) не обладает свойством каузальности (причинно сгт). Для абстрактной линейной системы (1) понятие каузальности (причинности) системного и передаточного операторов связано с наделением пространства Н временной структурой.
Предположим, что выделено семейство Рг = {Ри1 £ Т} взаимно коммутирующих ортопроекторов Р( : Н —► Н, определенных на множестве Т С [¿¡¡,£/] С И, £ Т, обладающих свойствами монотонности (РгРг- = Р{' при I' < 4) и полноты —>.0 при < —> Р( —+ / при 4 —► £/). Кроме того, б каждой точке / £ Т, являющейся точкой сгущения для множества Т П ¿), семейство Рт предполагается непрерывным слева (Нт^+о Р(-г = Рг)- Все написанные пределы понимаются в сильном смысле. Множество Т интерпретируется как временное множество, на котором функционирует линейная система £/ - начальный и конечный моменты ее функционирования.) Семейство Рт с указанными свойствами называется разложением единицы, пара (Н,Рт) называется пространством, наделенным временной структурой (или причинным пространством).
Линейный оператор Ь : Н —*■ Н называется каузальным (точнее, Р«£-каузальным), если при каждом / и любом г £ Н, таком, что 2 и Р(г принадлежат множеству 0(1/), выполнено соотношение
Р,ЬРгг = ЬР±г. (7)
Хотя абстрактная система рассматривается в гильбертовом пространстве (и, следовательно, ее решения суть элементы гильбертова пространства), но если это пространство причинное, то можно определить понятие, ее устойчивости в терминах передаточного
оператора (и это определение будет соответствовать привычному понятию устойчивости замкнутых конечномерных систем упра.иле-нигг).
Определение 1 Линейная абстрактная система (1), в причинном гильбертовом пространстве (II,Рх), называется устойчивой, если се передаточный оператор (3) является ограниченным и каузальным. Всякий линейный непрерывный оператор, действующий в причинном гильбертовом пространстве и являющийся каузальным, будем называть устойчивым оператором.
Как хорошо известно, свойство устойчивости замкнутой системы управления может не сохраняться при малых вариациях ее коэффициентов. Это свидетельствует о полезности понятия грубости (робастности, структурной устойчивости) для абстрактной линейной системы. Предположим, что системный оператор Ь системы (1) зависит от абстрактного параметра изменяющегося в некотором множестве 3, которое будем считать нормированным пространством. Примем, что линейная система (1) рассматривается в причинном гильбертовом пространстве (Н, Рт), и системный оператор Ь = Ь^ при каждом £ € 2 определен на плотном в Н множестве и является Рт-каузальным. Предположим, что при некотором номинальном значении параметра £ передаточный оператор IV = 1¥(0 является устойчивым (в смысле определения 1). Нас: интересует сохранение свойства устойчивости оператора И^ при всех достаточно близких к номинальному значению £о. В связи с этим введем
Определение 2 Система (1) называется робастпой (или структурно устойчивой) в номинальной точке £о 6 2, если передаточный оператор IV = И^ является устойчивым при всех достаточно бл из-ких К
Сформулируем простое достаточное условие робастности линейной системы (1) в виде теоремы.
Теорема 1 Предположим, что при £ = передаточный оператор И,г£с устойчивый, причем для£, достаточно близких к , вы.полнено неравенство
(8)
Тогда система (1) робастна в точке ^о.П
В диссертации приведены примеры систем, каждая из которых неробасгна по отношению к своему множеству параметров. В качестве множества параметров взяты множество коэффициентов системы и ножество запаздываний в канале управления объектом.
Кроме, вопроса об устойчивости и робастности системы у крапления может возникнуть и другая задача, связанная и необходимостью синтезировать оптимальные робастные регуляторы. Эта ситуация возникает, когда задача оптимизации разрешима не единственным образом, и не все оптимальные регуляторы являются ро-бастными. Понятие универсального регулятора возникает, когда управление зависит от тех или иных параметров и требуется построить оптимальный регулятор, имеющий определенную структуру и не зависящий от этих параметров (один и тот же регулятор является оптимальным для различных значений параметров; таким образом, универсальность понимается по отношению к наперед заданному множеству параметров). В диссертации изложен метод построения универсального регулятора при полигармонической по-Л1ехе для дискретной линейно-квадратичной задачи оптимального управления.
Во второй главе диссертации обсуждается линейно-квадратичная непрерывно-дискретная задача оптимального управления. Особенностью этой задачи является то, что объект функционирует в непрерывном времени, а управление строится по дискретным наблюдениям за объектом. Такая постановка задачи обусловлена тем, что использование в цепи управления ЭВМ подразумевает дискретное поступление информации даже при непрерывно фукционирую-щем объекте. Довольно часто непрерывно-дискретная задача оптимального управления решается сведением ее к дискретной, и оптимальное управление ищется в классе кусочно-постоянных допустимых управлений. Но такой подход к решению указанной задачи не всегда удобен, поскольку интервалы между моментами поступления информации о состоянии объекта могут быть велики, а указанный выше тип управления оказывается слишком тривиальным.
Сформулируем непрерывно-дискретную задачу оптимального управления в абстрактном виде. Под абстрактной системой управления будем понимать линейную систему следующего вида:
' Ах + Ви = /[, х = + /2, < м = Ей + /а, (9)
у = С£ + ^
. ай + [)у = /5.
Здесь £ € х, а- 6 х, и е и, й £ й, у € у, Д € х, /2 6 х, /3 € и, /4 6 у, /г, £ й суть соответственно состояние и преобразованное состояния ОУ, управляющее и преобразованное управляющее воздействия, выход ОУ и возмущающие воздействия (/¿, к = 1,2,3,4,5), принадлежащие соответствующим множествам; эти множества предполагаются гильбертовыми пространствами. В системе (9) символы А, В, С, £>, Е, а, /3 обозначают линейные операторы, действую-
ирге п соответствующих гильбертовых пространствах (А : х —» х, В : и х, С : х —»y, Z? : х —> х, 25 : й и, о;: й —» й, /3 : у —» й), в общем случае эти операторы могут быть неограниченными, но их множества определения плотны в соответствующих пространствах. Операторы А, а предполагаются обратимыми. Первое уравнение системы (9) интерпретируется как уравнение ОУ. Преобразованное состояние, определяемое вторым уравнением системы, интерпретируется как результат дискретизации состояния ОУ, оператор D будем называть дискретизатором. По преобразованному (дис-кретизированному) состоянию с помощью четвертого уравнения системы вычисляется (дискретизированный) выход ОУ; это уравнение, таким образом, описывает "канал наблюдения". С помощью третьего уравнения по ди с к р е т из и р о в анно му управлению строится собственно управление. В типичных прикладных непрерывно-дискретных задачах управление является кусочно-постоянным во времени. Оно получается неупреждающей экстраполяцией соответствующих значений дискретизированного управления на интервалы времени между моментами дискретизации. Поэтому оператор Е в системе (9) естественно называть экстраполятором. Дискретизиро-ванное управление формируется по дискретизированным выходам ОУ с помощью пятого уравнения системы, описывающего обратную связь (регулятор) замкнутой системы (9). Дискретизированные величины в (9) отмечены знажом ~.
Пусть Н=ххххихухйи
(х\
X II
у
\и)
/ =
ал h h и \hj
zje н.
(10)
Предположим, что задано некоторое непустое множество и С и допустимых управлений. Качество допустимого управления характеризуется с помощью квадратичного функционала
1(2)=<г,т> Н, (11)
где < • >д - скалярное произведение в Н, N будем предполагать линейным ограниченным положительным оператором в Н х Н. Задача линейно-квадратичной оптимизации состоит в нахождении оптимального управления - допустимого управления, для которого функционал (11) минимален:
J(z)
inf.
neu
В диссертации приводятся возможные постановки линейно-квадратичной непрерывно-дискретной задачи оптимального управления
в случае конечномерной системы и ее решения. А именно, обсуждается задача оптимального управления па конечном промежутке времени, оптимальное управление в стационарном случае, оптимальное замкнутое управление, оптимальные программное и программно-замкнутое управления. Не все приводимые в этом разделе результаты являются новыми, но их отбор и методическая перс-работка позволяют лучше понять абстрактные построения.
Во всех указанных случаях линейный объект управления описывается стохастическим уравнением, причем внешнее воздействие (помеха) является стандартным винеровским процессом, реализации которого с вероятностью 1 непрерывны. В начальный момент времени вектор состояния считается заданным либо случайным вектором с известными средним значением и матрицей ковариаций. Задано множество моментов квантования (моменты измерения состояния объекта), причем в эти моменты доступна неполная зашумлен-ная информация о состоянии объекта, помеха в которой является стандартным дискретным белым шумом, стохастически независимым с помехой в объекте управления. Вводится понятие функционала качества, и,задача оптимального управления состоит в нахождении допустимого управления, гарантирующего минимальное значение функционалу качества. Таким образом, более полная постановка задачи оптимального управления связана с дополнительными предположениями о выборе множества допустимых управлений.
В случае управления на конечном промежутке времени кусочно-постоянное управление формируется при помощи обратной связи, и допустимыми считаются те управления, которые доставляют конечное значение квадратичному функционалу качества. Поставленная задача методом дискретизации (сведение уравнения, описывающего объект управления, функционирующий в непрерывном времени, к дискретному виду) сводится к задаче, подобной изученной ранее, и приводится ее решение.
Рассмотрен также важный специальный случай задачи оптимального управления в стационарном случае. Предполагается, что моменты квантования являются эквидистантными (равноотстоящими) и все коэффициенты системы от времени не зависят. Эта задача решается в двух предположениях о множестве допустимых управлений:
1) допустимые управления являются кусочно-постоянными и формируются при помощи обратной связи;
2) допустимыми являются липейные неупреждающие управления.
В первом случае решение линейно-квадратичной непрерывно-
дискретной задачи оптимального управления получено в окончательном виде, алгоритм формирования управления представлен
п рекуррентной форме, удобной для использования ЭВМ в цени обратной связи. Во втором случае достигается более высокое качество управления, но синтез обратной связи становится несколько более сложным.
Рассмотрим общий (нестационарный) вариант линейно-квадратичной непрерывно-дискретной задачи оптимального управления, где оптимальное управление ищется в классе замкнутых управлений.
Примем, что объект описывается стохастическим уравнением
dx(t) = A(t)x(t)dt + D(t)u(t)dt, + D(f)dw(t), t £ (0, oo). (12)
Здесь x(i) — вектор состояния объекта, u(t) — з'правляющее воздействие, w(t) - внешнее воздействие (помеха) в момент времени I. (;ф) G R", u(t) е R™, w(t) £ R', t e (0, со)). Будем предполагать, что ?/>(■) является стандартным гауссовым винеровским процессом со стохастически независимыми приращениями. Вещественные ма-тричпые функции Л(-). В(-), D(-) соответствующих размеров предполагаются детерминированными, непрерывными и ограниченными на (0, ос). При t = 0 вектор состояния предполагается заданным ( г'о G Ii") либо является случайным гс-вектором с известными средним значением и матрицей ковариаций:
М^о = х0, М(.г0 - - -fo)* = Rx0-
Введем обозначения
= x{tk), х = {хк, к £ Z+ = {0,1,2,...}}, й = {ик, к £ Z+}.
Примем, что в моменты времени
t = {tk, l-£ Z+, h =0} (13)
доступны наблюдению выходные переменные
ук = Скхк + Dkwk, к е Z+, ук 6 R,. (14)
Здесь Cjt, Dh — матрицы соответствующих размеров, известные при всех к € Z+; w — {ivt, к 6 Z+} - /-мерный дискретный белый шум с независимыми значениями. Предполагается, что временной ряд w ж помеха w = (w(i), t £ (0,оо)} стохастически независимы.
Предположим, что множество дискретов t известно зарапее, до начала процесса управления. Это означает, что гарантировано получение информации о состоянии ОУ в моменты it £ t (т.е. известны векторы уь при каждом к € Z+). Оптимальное управление в этом случае назовем з/шкпугпым, и оно может быть получено с
помощью так называемой теоремы разделения. В качестве U примем множество всех линейных неупр еж дающих обратных связей (не обязательно определяемых стационарным регулятором)
u(t) = U(t, ук,, к' < fc(t) = тах{Л : tk < t}). (15)
В качестве функционала качества примем
«>=& Ь[м{ $!) * ()<и- ^
Задача оптимального управления ставится следующим образом:
J(x,u) inf . (17)
«€XJt
В задаче (15) - (17) £/(■) - произвольная линейная и ноупреждающая по наблюдаемым величинам функция, определяющая стратегию управления. Предполагается, что существует хотя бы одна таз а я функция, обеспечивающая существование и конечность функционала /(х,и). Через Ut обозначено множество всех таких управлений, при этом указана его зависимость от набора t моментов измерения зашумленных выходов ОУ.
Теорема 2 Предположим, что в задаче (12) - (17) выполнены условия:
1) (т х тп)-матрица R(t) в представлении весовой матрицы I\r{t),
^W-^s*^) R(t)J>
положительна, при всех t £ (0, oo).
2) Матрицы, Dt, определяющие интенсивность помехи в канале наблюдения, удовлетворяют условию
DkDl > 0, k € Z+.
3) Уравнение Риккати
= -[A'(t)H(t) + H(t)A(t)} +
+ lH(t)B(t) + S(t)}irl(t)lH(t)B(t) + S(t)Y+Q(t) (18)
допускает неотрицательное матричное решение Н{-), ограниченное на интервале (0,оо).
Тогда оптимальное (в классе UtJ управление в непрерывно-дискретной задаче (12) - (17) определяется обратной связью
u(t) = K{t)x{t), (19)
где коэффициент усиления Л'(2) находится по формуле К{1) = К(1,Л(1)) = -ЙГ\1)[1ЩВ{1) + 5(«)Г
через неотрицательное матри чное решение Н(-) уравнения Рпккати (18). Оценки зг(/) п обратной спят (19) на промежутках лк;эк:ду измерениями выходных переменных определяются соотношениями
¿•(г) = Ф{Мь№), * е (**.**+]), к е г+,
Ф(/, .матричная функция, определяемая соотношениями
(Iп — единичная (п х п)-матрица).
Оценки % — я моменты, задаются соогннотг.пп.ями
И-к+1 = + + - + Вкщ)),
Ьк = ЩРь) =
= {АкРкА14- Я;,(к + Г))С1+1(С,п[Л,ПЛ14 /?0]С,+1 Рш = (1п-Ьк(Рк)Сш)(АьРкА1 + Н5(к + 1))(Гп-Ьк(Ръ)СшГ + + 1к(Рк)Вш01+1[Ьк(Рк.)}\ хо = О, Р0 = О,
где матрицы Ль, В к и аозльущающие воздействия и*. находятся по формулам
Г1к+1
Ак = Вк = / Ф^О^'Х
Jh
гш = ( М Л 6 (21)
Помеха а = к € является дискретным белым шумом с
независимыми значениями и матрицей корреляций
/■'4+1
= / Ф(«4+1,0Р(0[ОД*[Ф(*4+Ь *)]*<», (22) Jl^
бц? — символ Кроыекс.ра.П
В главе 2 рассмотрены еще два класса допустимых управлений - программные и программно-замкнутые управления. При построении программного управления информация о состоянии объекта
используется только в начальный момент времени и не предполагается дальнейшее измерение выходов. При построении программно-замкнутого управления предполагается, что моменты времени, в которые происходит измерение выходов объекта управления, не определяются предысторией процесса управления, т.е. в каждый данный момент времени будущие дискреты неизвестны. Предполагается лишь, что на любом интервале заданной длины по крайней мере один момент измерения содержится (когда он поступит, нам не известно, но при его достижении данные текущего измерения за-шумленного выхода объекта управления оказываются доступными и могут быть использованы для уточнения управления). В момент поступления информации о состоянии объекта (в виде неполного зашумленного его наблюдения) строится с учетом этой информации программное управление, рассчитанное на следующий интервал заданой длины. Если при реализации этого управления поступит новая информация о состоянии; объекта управления, то в момент поступления информации уточняется оценка состояния объекта управления и с ее учетом строится новое программное управление на последующий промежуток заданной длины. В обоих случаях получены алгоритмы построения оптимальных управлений и установлено, что на промежутках между измерениями выходов оптимальные управления всех трех классов (замкнутое, программное, программно-замкнутое) совпадают.
Третья глава диссертации посвящена изучению свойства ро-бастности линейно-квадратичной непрерывно-дискретной системы управления.
В приложениях объект управления обычно зависит от некоторых параметров. При этом может оказаться, что оптимальное в том или ином смысле управление, рассчитанное на нскотрое номинальное значение параметров, должно применяться в условиях, когда некоторые параметры отклоняются от номинальных значений. Естественно ожидать, что при малых отклонениях реальных параметров от расчетных качество оптимального управления изменится мало. Однако в некоторых случаях это не так. В первой части диссертации приведены примеры, когда оптимальная обратная связь, синтезированная для номинальных значений параметров, может привести к неустойчивости замкнутой системы управления при сколь угодно малых отклонениях реальных значений параметров объекта управления от расчетных. В этом случае говорят, что система управления чувствительна к малым изменениям параметров (не обладает свойством грубости, или робастности, но отношению, в данном случае, к свойству устойчивости замкнутой системы). Использование негрубых обратных связей в приложениях обычно недопустимо. Поскольку этот эффект довольно часто встречается в
задачах оптимизации, в последние годы большое внимание специалистов в области оптимального управления стала привлекать проблема грубости замкнутых систем управления.
В главе 3 диссертации исследуется робастность по отношению к малым отклонениям моментов квантования выходов объекта управления от их номинальных значений. Установлено, что если почти все реализации винеровского процесса ад(-) являются лилшецевыми порядка а с константой //,, где a, ¡i - случайные почти наверное конечные величины, то функционал качества управления непрерывен по отношению к малым вариациям моментов квантования.
В заключении подводится итог проделанной работы и формулируются основные результаты.
Заключение
Основные результаты работы:
1. получено достаточное условие робастности линейной абстрактной системы;
2. получены уравнения оптимальных регуляторов (теоремы 3-8) в линейно-квадратичной непрерывно-дискретной задаче оптимального управления в зависимости от выбора класса допустимых управлений;
3. доказано, что непрерывно-дискретная система управления является робастной по отношению к малым изменениям моментов дискретизации.
Основные результаты, выносимые на защиту, опубликованы в с ледующих работах:
1. Сомова A.A., Фомин В.Н. Дискретное управление линейными непрерывными объектами. СПб., 1990. Деп. в ВИНИТИ 14.02.96, N 483-В96.
2. Chercinensky G.A., Fomin V.N., Somova A.A. Stability and robustness of a linear abstract system // Proceedings of International Conference on Control of Oscillations and Chaos. 27-29 August, 1997. St. Petersburg, Russia, 1907. Vol. 2. P. 300-303.
3. Сомова A.A., Фомин В.H., Череменский A.Г. Устойчивость и робастность абстрактных систем управления // Нелинейные динамически е системы. Вьгп.1. Издательство С.-Петербургского Университета, 1997. Стр. 228-2G0.
4. Fomin V.N., Somova A.A. Stability and robustness of linear difference and deferential systems // Proceedings of Second International Conference on Differential Equations and Applications. 15-20 Jiuie, 1998. St. Petersburg, Russia, 1998. P. 34.
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
Сомова Алиса Александровна
ОПТИМАЛЬНОСТЬ И РОБАСТНОСТЬ ЛИНЕЙНЫХ НЕПРЕРЫВНО-ДИСКРЕТНЫХ СИСТЕМ УПРАВЛЕНИЯ
(01.01.09 — математическая кибернетика)
ДИССЕРТАЦИЯ на соискание ученой степени кандидата физико-математических наук
Научный руководитель: доктор физ.-мат.наук, профессор Фомин В л адимир Никол асвич
Санкт-Петербург 1998 г.
С о держание
Введение 4
Глава I. Линейная абстрактная система 12
1 Общие свойства линейной абстрактной системы 12
1.1 Передаточный оператор абстрактной системы .... 12
1.2 Абстрактная система управления........................12
2 Примеры систем управления 13
2.1 Система управления в дискретном времени............13
2.2 Непрерывная система управления на оси..............18
2.3 Дискретная система управления на ограниченном снизу временном множестве..............................21
2.4 Непрерывная система управления на полуоси .... 24
3 Причинное гильбертово пространство 29
3.1 Причинное гильбертово пространство. Введение временной структуры в гильбертовом пространстве . . 30
3.2 Каузальные операторы....................................30
3.3 Каузальность конечномерных систем управления . . 31
4 Устойчивость абстрактной системы 32
4.1 Каузальность передаточного оператора конечномерной системы управления и устойчивость ее характеристического полинома ....................................32
4.2 Устойчивость передаточного оператора................34
5 Робастность линейной системы 36
5.1 Робастность линейной абстрактной системы..........37
5.2 Комментарии к понятию робаст^сти..................38
5.3 Нарушение устойчивости системы при малых запаздываниях ......................................................41
6 Робастные универсальные регуляторы 45
6.1 Введение......................................................45
6.2 Постановка задачи..........................................47
6.3 Переформулировка задачи в частотных терминах . . 49
6.4 Робастность универсального регулятора..............49
Глава II. Непрерывно-дискретная задача оптимального управ ления 51
7 Постановка абстрактной задачи управления 51
8 Непрерывно-дискретная задача управления 52
8.1 Постановка задачи..........................................53
8.2 Управление на конечном промежутке времени .... 55
8.3 Оптимальное управление в стационарном случае . . 59
8.4 Оптимальное замкнутое управление....................66
8.5 Программные и программно-замкнутые управления 69
Глава III. Робастность линейной непрерывно-дискретной абстрактной системы 73
9 Робастность линейной непрерывно-дискретной абстрактной системы 74
10 Применение абстрактной теоремы
76
Введение
В теории оптимального управления наиболее полно изучена задача управления линейным объектом при квадратичном критерии качества управления (линейно-квадратичная задача оптимизации или задача Калмана - Летова). Эта задача в достаточно общей постановке может быть переформулирована как задача минимизации квадратичного функционала на подпространстве гильбертова пространства (абстрактный вариант задачи Винера). За последние годы разработаны методы синтеза оптимального управления (регулятора) при различных постановках линейно-квадратичной задачи оптимального управления. В "стационарном" случае многие из них доведены до эффективных алгоритмов, основанных, в частности, на операциях факторизации и сепарации дробно-рациональных матричных функций.
Современный этап развития систем автоматического управления характеризуется массовым внедрением средств цифровой вычислительной техники в контуры управления непрерывными динамическими объектами и процессами, поэтому возникает проблема учета специфических особенностей, обусловленных наличием в контурах управления дискретных измерителей и вычислительных устройств. Задача выбора дискретного закона управления непрерывным динамическим объектом решается обычно одним из следующих способов:
1) Выбирается некоторый непрерывный закон управления, который затем заменяется дискретной аппроксимацией.
2) Дискретный закон управления находится по дискретной модели объекта.
Оба подхода обладают принципиальными недостатками. Поэтому для приложений весьма актуальной является проблема отыскания дискретных законов управления непосредственно по непрерывной модели регулируемого объекта.
В приложениях объект управления обычно зависит от некоторых параметров. При этом может оказаться, что оптимальное в том или ином смысле управление, рассчитанное на некотрое но-
минальное значение параметров, должно применяться в условиях, когда некоторые параметры отклоняются от номинальных значений. Естественно ожидать, что при малых отклонениях реальных параметров от расчетных качество оптимального управления изменится мало. Однако в некоторых случаях это не так. Поэтому естественным является вопрос получения достаточных условий робастности системы управления. Данная работа посвящена изучению линейно-квадратичной непрерывно-дискретной задачи оптимального управления, установлению достаточного условия робастности этой системы.
Первая глава диссертации является разработкой теории линейных абстрактных систем. Абстрактная система определяется в причинном гильбертовом пространстве в наиболее общем виде.
/Л « и о ^
Оказывается, что такое свойство линеинои абстрактной системы, как устойчивость, удобно определить в терминах передаточного оператора системы. Именно для этого гильбертово пространство и оснащается временной структурой. В диссертации показано, что определение устойчивости абстрактной системы на языке передаточного оператора соответствует привычному понятию устойчивости замкнутых конечномерных систем управления.
Следующим естественным шагом является изучение свойства линейной абстрактной системы быть робастной (грубой) по отношению к малым изменениям ее параметров. В диссертации установлено достаточное условие робастности линейной абстрактной системы и в качестве примеров приведены две системы, каждая из которых неробастна по отношению к своему множеству параметров. В качестве множества параметров взяты множество коэффициентов системы и множество запаздываний в канале управления объектом.
Кроме вопроса об устойчивости и робастности системы .управления может возникнуть и другая задача, связанная с необходимостью синтезировать оптимальные робастные регуляторы. Эта ситуация возникает, когда задача оптимизации разрешима не единственным образом, и не все оптимальные регуляторы являются робастными. Понятие универсального регулятора возникает,
когда задача управления зависит от тех или иных параметров и требуется построить оптимальный регулятор, не зависящий от этих параметров (один и тот же регулятор является оптимальным для различных значений параметров; таким образом, универсальность понимается по отношению к наперед заданному множеству параметров). Разумеется, эта ситуация не является общей, в большинстве случаев оптимальный регулятор зависит от параметров (т.е. универсального регулятора не существует), тем более важны те частные случаи, когда удается доказать существование и синтезировать универсальный регулятор. В диссертации изложен метод построения универсального регулятора при полигармонической помехе для дискретной линейно-квадратичной задачи оптимального управления.
В первом разделе диссертации дается определение линейной абстрактной системы, ее системного и передаточного операторов.
Второй раздел содержит примеры записи конечномерных непрерывных и дискретных систем управления, функционирующих на бесконечном и полубесконечном интервалах времени, в абстрактном виде с изучением свойств передаточных операторов полученных систем.
В третьем разделе осуществляется введение временной структуры в гильбертовом пространстве и определение каузальности оператора. В качестве примера приводится случай каузальности системных операторов замкнутых конечномерных систем управления, функционирующих в непрерывном и дискретном времени.
В четвертом разделе вводится понятие устойчивости абстрактной системы как каузальности и ограниченности ее передаточного оператора и устанавливается соответствие введенного определения устойчивости привычному понятию устойчивости в случае замкнутых конечномерных систем управления.
В пятом разделе обсуждается робастность линейной абстрактной системы, достаточные условия ее робаотности и приводятся примеры неробастных систем управления.
В шестом разделе обсуждается проблема построения универсальных регуляторов и приводится пример построения универ-
сального регулятора в случае дискретной линейно-квадратичной задачи оптимального управления с полигармонической помехой.
Во второй главе диссертации обсуждается линейно-квадратичная непрерывно-дискретная задача оптимального управления. Особенностью этой задачи является то, что объект функционирует в непрерывном времени, а управление строится по дискретным наблюдениям за объектом. Такая постановка задачи обусловлена тем, что использование в цепи управления ЭВМ подразумевает дискретное поступление информации даже при непрерывно фукционирующем объекте. Довольно часто ([1]) непрерывно-дискретная задача оптимального управления решается сведением ее к дискретной, и оптимальное управление ищется в классе кусочно-постоянных допустимых управлений. Но такой подход к решению указанной задачи не всегда удобен, поскольку интервалы между моментами поступления информации о состоянии объекта могут быть велики, а указанный выше тин управления оказывается слишком тривиальным. Таким образом, непрерывно-дискретная задача оптимального .управления является содержательной.
Седьмой раздел диссертации содержит постановку линейно-квадратичной непрерывно-дискретной задачи оптимального управления в достаточно общем виде.
В восьмом разделе диссертации приводятся возможные постановки линейно-квадратичной непрерывно-дискретной задачи оптимального управления в случае конечномерной системы и ее решения. А именно, обсуждается задача оптимального управления на конечном промежутке? времени, оптимальное управление в стационарном случае, оптимальное замкнутое управление, оптимальные программное и программно-замкнутое управления. Не все приводимые в этом разделе результаты являются новыми (см., например, [1,2]), но их отбор и методическая переработка позволяют лучше понять абстрактные построения.
Во всех указанных случаях линейный объект управления описывается стохастическим уравнением, причем внешнее воздействие (помеха) является стандартным винеровским процессом, ре-
ализации которого с вероятностью 1 непрерывны. В начальный момент времени вектор состояния считается заданным либо случайным вектором с известными средним значением и матрицей ко-вариаций. Задано множество моментов квантования (моменты измерения состояния объекта), причем в эти моменты доступна неполная зашумленная информация о состоянии объекта, помеха в которой является стандартным дискретным белым шумом, стохастически независимым с помехой в объекте управления. Вводится понятие функционала качества, и задача оптимального управления состоит в нахождении допустимого управления, гарантирующего минимальное значение функционалу качества. Таким образом, более полная постановка задачи оптимального управления связана с дополнительными предположениями о выборе множества допустимых управлений. .
В случае управления на конечном промежутке времени кусочно-постоянное управление формируется при помощи обратной связи, и допустимыми считаются те управления, которые доставляют конечное значение квадратичному функционалу качества. Поставленная задача методом дискретизации (сведение уравнения, описывающего объект управления, функционирующий в непрерывном времени, к дискретному виду) сводится к задаче, подобной изученной ранее, и приводится ее решение.
Далее рассмотрен важный специальный случай задачи оптимального управления в стационарном случае. Предполагается, что моменты квантования являются эквидистантными (равноотстоящими) и все коэффициенты системы от времени не зависят. Эта задача решается в двух предположениях о множестве допустимых управлений:
1) допустимые управления являются кусочно-постоянными и формируются при помощи обратной связи;
2) допустимыми являются линейные неупреждающие управления.
В первом случае решение линейно-квадратичной непрерывно-дискретной задачи оптимального управления получено в окончательном виде, алгоритм формирования управления представлен
в рекуррентной форме, удобной для использования ЭВМ в цепи обратной связи. Во втором случае достигается более высокое качество управления, но синтез обратной связи становится несколько более сложным.
Далее рассмотривается общий (нестационарный) вариант линейно-квадратичной непрерывно-дискретной задачи оптимального управления и оптимальное управление ищется в классе замкнутых управлений. Предполагается, что множество моментов квантования известно заранее, до начала процесса управления, т.е. гарантировано поступление неполной зашумленной информации о состоянии объекта в фиксированные моменты времени. Оптимальное управление в этом случае может быть получено с помощью так называемой теоремы разделения. В качестве множества допустимых управлений выбирается множество всех линейных неупреждающих обратных связей (не обязательно определяемых стационарным регулятором).
Рассматриваются еще два класса допустимых управлений программные и программно-замкнутые управления. При построении программного управления информация о состоянии объекта используется только в начальный момент времени и не предполагается дальнейшее измерение выходов. При построении программное амкну того управления предполагается, что моменты времени, в которые происходит измерение выходов объекта управления, не определяются предысторией процесса управления, т.е. в каждый данный момент времени будущие дискреты неизвестны. Предполагается лишь, что на любом интервале заданной длины по крайней мере один момент измерения содержится (когда он поступит, нам не известно, но при его достижении данные текущего измерения зашумленного выхода объекта управления оказываются доступными и могут быть использованы для уточнения управления). В момент поступления информации о состоянии объекта (в виде неполного зашумленного его наблюдения) строится с учетом этой информации программное управление, рассчитанное на следующий интервал заданой длины. Если при реализации этого управления поступит новая информация о состоянии объ-
екта управления, то в момент поступления информации уточняется оценка состояния объекта управления и с ее учетом строится новое программное управление на последующий промежуток заданной длины. В обоих случаях получены алгоритмы построения оптимальных управлений и как следствие получено утверждение, что на промежутках между измерениями выходов оптимальные управления всех трех классов (замкнутое, программное, программно-замкнутое) совпадают.
Третья глава диссертации посвящена изучению свойства робастности линейно-квадратичной непрерывно-дискретной системы управления.
В первой части диссертации приведены примеры, когда оптимальная обратная связь, синтезированная для номинальных значений параметров, может привести к неустойчивости замкнутой системы управления при сколь угодно малых отклонениях реальных значений параметров объекта управления от расчетных. В этом случае говорят, что система управления чувствительна к малым изменениям параметров (не обладает свойством грубости., или робастности, по отношению, в данном случае, к свойству устойчивости замкнутой системы). Использование негрубых обратных связей в приложениях обычно недопустимо. Поскольку этот эффект довольно часто встречается в задачах оптимизации, в последние годы большое внимание специалистов в области оптимального управления стала привлекать проблема грубости замкнутых систем управления.
Понятие грубости (по отношению к свойству устойчивости на полубесконечном интервале времени) системы, описываемой дифференциальными уравнениями, восходит к А.А.Андронову (1937). Понятие грубости можно вводить не только по отношению к свойству устойчивости замкнутой системы управления. Общая постановка может включать и другие, важные в приложениях свойства замкнутых систем. Достаточно общая постановка задачи о робастности замкнутой системы управления может быть сформулирована, если задан функционал, характеризующий качество управления. Этот функционал, естественно, зависит от параме-
тров объекта управления. Тогда можно говорить о робастности системы, если функционал качества непрерывен при номинальном значен�