Численные методы минимаксного управления динамическими объектами тема автореферата и диссертации по математике, 01.01.11 ВАК РФ
Аль Саббаг Мухаммед Кхалил
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1993
ГОД ЗАЩИТЫ
|
|
01.01.11
КОД ВАК РФ
|
||
|
ОД
1 и шД ез
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
АЛЬ-САББАГ Мухаммед Кхалил
ЧИСЛЕННЫЕ МЕТОДЫ МИНИМАКСНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ
01.01.11 - системный анализ и автоматическое управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Санкт-Петербург. 1993
Работа выполнена в Санкт-Петербургском государственном университете
Научный руководитель: кандидат физико-математических наук Барабанов Андрей Евгеньевич
Официальные оппоненты: доктор технических наук, профессор Первозванский Анатолий Аркадиевич
кандидат физико-математических наук Соколов Андрей Арианович
Ведущая организация - Санкт-Петербургский государственный электро-технический университет
,гЗО
Защита состоится " II " мая 1993 г. в IV_ часов на заседании
специализированного совета 1С 063.57.49 по присуждению ученой степени кандидата физико-математических■наук в Санкт-Петербургском государственном университете по адресу: 198904, Санкт-Петербург, Старый Петергоф, Библиотечная пл., д.2.
С диссертацией можно ознакомиться в научной библиотеке Санкт-Петербургского университета (Санкт-Петербург, Университетская наб., д.7/9)
л у
Автореферат разослан " " 1993 г.
Ученый секретарь специализированного совета кандидат физико-математических наук, доцент
А.И.Шепелявый
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Игровые подхода к'задаче оптимального управления динамическим объектом управления, описываемым системой обыкновенных дифференциальных линейных уравнений с постоянными коэффициентами, в последние года становятся столь же популярными, как и стандартные линеЯно-КЕадратичные задачи. Постановка задачи «"-оптимального управления привлекает как грубостью решения по отношению к отклонениям спектральной плотности возмущений, так и гарантированной устойчивостью система с заданным запасом. Этим задачам посвящено большое количество литературы как по математическим, так и по прикладным и вычислительным проблемам.
Математические метода расчета «"-оптимальных регуляторов можно разделить на спектральные метода, методы пространства состояний и полиномиальный подход, не использукщий пространство состояний. Последний из этих методов был предложен X. Квакернааком и реализован в пакете программ ка языке ИАТЬАВ.
Надо отметить, что вычислительная сложность известных алгоритмов решения такова, что затрудняет интерпретацию промежуточных результатов, и это препятствует распространению полученных решений в приложениях, где важен конечный результат. Поэтому актуальной является задача поиска новых вычислительных методов решения этих задач.
. Цель работы состоит в разработке новых алгоритмов, вычислительных методов и программ решения задач «"-оптимального управления. Одновременно в работе решены некоторые новые задачи синтеза «""-оптимальных регуляторов.
Метод исследования. В диссертации применяются метода решения полиномиальных уравнений, методы линейно-квадратичной теории с дифференциальными-уравнениями Риккати и функциональные методы равномерно-частотной оптимизации.
Научная новизна. На защиту выносятся следующие результаты:
- полиномиальный алгоритм синтеза «"-оптимального управления по методу Квакернаака-Мейнсмы,
- уравнение для наихудшей спектральной плотности при полиномиальном описании объекта управления и спектральных ограничений на возмущения,
- условия реализуемости оптимального регулятора,
- вычислительная формула для решения максиминной задачи «""-оптимального управления,
- новый алгоритм полиномиальных преобразований для синтеза оптимального регулятора без перехода к пространству состояний,
- алгоритмы и программы матричного полиномиального исчисления, применяемые в алгоритмах синтеза оптимальных регуляторов.
Практическая и теоретическая ценность. Результаты могут быть использованы при решении прикладных задач синтеза оптимальных регуляторов с равномерно-частотным показателем качества. Полученные во временной области решения новых задач синтеза оптимальных регуляторов допускают распространение на нестационарные системы.
Аппробашя работы. Результаты доложены на семинарах кафедры теоретической кибернетики СПбГУ и кафедры механики и проблем управления СПбГТУ.
Публикации. Результаты работы отражены в статьях £1, 2J, принятых к публикации.
Структура и объем работы. Диссертация состоит из введения, четырех глав, приложения и списка литературы. Общий объем работы •170 страниц.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Первая глава носит, в основном, обзорный характер. Излагаются решения задачи, основанные на методах: пространства состояний; сведения к задаче Нехзри; полиномиальном подходе Квакернаака.'В
конце главы устанавливается связь линейно-квадратичной теории и »(""-оптимизации в матричном случае и сформулировано новое утверждение об уравнении, которому удовлетворяет наихудшая спектральная плотность.
Рассмотрим задачу оптимального управления объектом а(р) y(t) = й(р) u(t) + с{р) v(t), где матрица c(z) - квадратная, невырозденная и не имеет нулей в правой полуплоскости. Пусть С&О и z=col(y,u) - обобщенный выход объекта. Наблюдается вектор y(t) и требуется минимизировать функционал качества
I = sup -Г Jz(t)*Q z(t) dt i iv» . si ) (P)
v U L (0,ш) J
при нулевых начальных данных. Для формулировки результата введем ряд обозначений. Определим несократимую справа пару полиномиальных матриц (h,g) из условия ah-=bg; вектор I(Л,) = col(h(A.),g(X)); гурвицев полином П(Х), удовлетворяющий уравнению факторизации
П(Х)*П(\) = r(\>*Q и\), функцию
Ш) « (n*(\)Pí*(\)R И°(?1)Г(\), и ее антианалитическую часть Y+(X), т.е. матричную функцию, удовлетворяющую условиям: все полюсы Y+(M расположены в правой полуплоскости, матрица У(Л.)-У+(Х) не имеет полюсов в правой полуплоскости и Y+(M—*0 при А,—«о.
Лемма I.e. Наихудшей спектральйой плотностью является любая рациональная плотность Б(Х)=Г(Х)Г(Х)*, для которой выполнено сле-дуюпее условие:
■£г*г - r*ZT + тфг+, где - минимум функционала I,
S = с* ((a, -b) R-'col(a\ -b*))",
где - передаточная функция замкнутой системы от v(t) к z(t) при произвольном стабилизирующем регуляторе.«
Полиномиальный подход Х.Квакернаака изложен им для матричных систем с невырожденными шумами измерения. Сформулированный на основе этого подхода алгоритм непосредственно вычисляет полиномиальные матрицы Г (А.) и Х(М. для которых передаточная функция регулятора VbYJT* является оптимальной. Однако для реализации регулятора аи=ру необходимо вычислить левостороннюю факторизацию атой передаточной функции: W=a~*p. Для случая полного наблюдения в разделе 1.4 получен способ расчета матриц а и р, в котором сокращена размерность факторизуемых матриц. Пусть Q=I. Введем мат-, ричную функцию
г I - b(X)* M(X)-*b(\) -Ь(\)* М(\Г*а(\) 1
ПТ(Х) " [ -а(А,)* М(Л.)"*Ь(Л.> I - а(М* М(ХГ*а(Х) J'
где К(\) = а(Ма(М% b(X,)b(\>*- 7"*c(X)c(Ji)*.
Теорема I.S (зариант теоремы Квакернаака-Мейнсмы для полного наблюдения и левосторонней факторизации).
Следующие утверждения равносильны:
1). iWz/v(\)«œs 7,
2). (а(Х), (а(\), р(Х))* г 0 при Re(X) - О.-
Теорема 1.4 утверждает, что для достижимого значения т* функционала I матрица П^(А.) допускает J-спектральную факторизацию: Hy(\)=Z7(X)*JZ^(X), J «= (р—Э * ^Редели» множество
К ■= {к(\) - а(Х)-*р(Х,) I (а<Х),Э(\)) - (А^Ва))^*.)"1. • В(Х)-АСХГ1»^ S I , В(Х), А(Х), А(\)~* - устойчивые рациональные матричные функции}.
Теорема Х.5. I. Для любого уровня 7>0 стабилизирующий регулятор уровня 7 существует тогда и только тогда, когда любой из регуляторов множеотва К является стабилизирующим.
3. Множество всех передаточных функций стабилизирующих регуляторов уровня 7 совпадает с К.
3. Для невыровденной задачи «"-оптимизации оптимальный регу-■ лятор удовлетворяет условию
(а(\), рош-пуд.)-(а(\), р<;\.))* = 0 при 1?е(Л.) = 0.-
Во второй главе исследуются задачи ^-оптимизации для объекта, записанного в пространстве состояний:
X = АХ + Ви + СТ. Требуется минимизировать функционал (Р) при г=со!(В*х,и), 0=1 в • классе линейных регуляторов а(р)и(г) = р(р) х(г).
Как известно, решение этой задачи связано со свойствами матрица Гамильтона размерности 2п*2п:
н7 =
А 7-1СС*-ВВ*
Минимум функционала качества I равен где 7и1п - точная нижняя грань всех чисел 7>0, для которых выполнены два условия: Н^ не имеет собственных чисел на мнимой оси и базис соНХ^Д^) собственного подпространства размерности п, отвечающего собственным числам с отрицательной вещественной частью, обладает свойством: При 7—*-7т1л нарушается одно из этих двух условий. Известно, что если первое условие остается выполенным при 7=7п1п, то оптимальный регулятор строго реализуем, а если остается выполненным второе условие, то оптимальная передаточная функция имеет постоянную норму на мнимой сси. Полное решение задачи об условиях реализуемости и постоявтства нормы, в т.ч. при одновременном нарушении обоих условий, потребовало привлечения специального математического аппарата. Получен следующий результат.
Теорема 2.1. Следующие утверждения равносильны: ' I. Оптимальный регулятор существует и строго реализуем.
2. dat(Xt^,) es стремится к 0 при 7—►7mln+o.
S. оптимальный регулятор существует и передаточная функция замкнутой системы Vz/W обладает свойством
»W2/w(to)l * 7mln (ЬХгК).в
Далее во второй главе изучается игровая задача и°°-оптимиза-ции при ненулевом начальном векторе состояний и знакопеременной матрице Q в функционале качества. Наряду со стандартной минимако-ной задачей «"-оптимизации рассматривается максиминная задача с функционалом качества
« , г р s 1
I - вир Inf rz(t)*Q z(t) dt, о- .
ITIS1 и 5 L S* R J
где z=col<x,u), x(0)«xo«Rn. Матрица Q может быть знакопеременной, но выполнено необходимое частотное условие, при котором ï*-®. В отличив от известных подходов к решению задач (»"-оптимизации, так или иначе использующих спектральные методы, в данном случае удалось ограничиться повторным решением двух линейно-квадратичных задач в пространстве состояний и несколькими алгебраическими преобразованиями. Доказано также, что минимакс равен максимину. Получена простая в вычислительном отношении формула для оптимального регулятора, наихудшего возмущения и минимума функционала качества. Обозначим через H^iA.) матрицу Гамильтона, построенную для задачи »"-оптимизации при заданной квадратичной форме в функционале качества Jr(x,u)«z*Qa.
Теорема 2.2. Данная максиминная задача имеет седловую точку, которая может быть вычислена следующим образом:
1° = вир Inf Г ^(х,и) dt -
weBL (0,00) и«ХЛ(0,в>) ъ
' m '
-Inf вир f *(х,и) dt « inf а + X Х(*,)х„),
где U - класс неупревдапцих линейных обратных связей, Х(М - максимальное решение уравнения Риккати с матрицей Гамильтона Нда(М , л°-тт>о 1 3X(X)ïX(®)).
Пусть нижняя грань достигается при к~Ха>Л°. Тогда оптимальное управления определяется регулятором
u(t) « -BR"(B*X(A.°)+S*)x(t), а наихудшее возмущение - обратной связью w(t) - X"1C*X(X°)x(t).-
Третья глава посвящена полиномиальным методам решения задачи «"-оптимального управления. Объект управления описывается уравнением
а(р) y(t> = Ъ(р) u(t) +■ с(р) 7(t), где все величины у, u, г - векторные, p=d/dt. Требуется минимизировать функционал качества
I - sup f(y(t)*Qy(t) + u(t)*u(t)) dt msi о
при нулевых начальных данных в классе линейных регуляторов. В первых разделах главы приведено решение задачи при дополнительных ограничениях нь невязку модели v(t). Доказано, что при помощи S-процедуры задача сводится к аналогичной параметрической задаче без дополнительных о^аничений о последующей минимизацией по па-, раметрам, количество которых равно количеству дополнительных ограничений.
В следуицих разделах третьей главы изучаются алгоритмы минимизации функционала I без приведения системы управления к виду пространства состояний. Метод решения этой задачи, предложенный в монографии B.Prancls'a, содержит спектральную матричную факторизацию и затем решение задачи Нохари. Для решения задачи Нехари требуется проводить J-спектральную матричную факторизацию. В данной главе предложен алгоритм, содержащий ту же операцию спектральной матричной факторизации, но без решения задачи Нехари или J-спектральной факторизации, которые заменяются на решение системы линейных уравнений. Основной операцией предлагаемого метода
является решение матричного полиномиального уравнения вида
Va* + aV* - VQV* + bb* - 7~acc* = О (PRE)
относительно матричного полинома V(z), степень которого меньше степени a(z), которая далее обозначается через М. Здесь символ * означает транспонирование и замену знака у аргумента: x(z)*-xT(-z). Полученное уравнение внешне напоминает уравнение Риккэти и поэтому было названо полиномиальным аналогом уравнения Риккати (ПУР). Как и в решении методом пространства состояний, через найденное значение 7(e) непосредственно вычисляется переда-точпая функция субоптимального регулятора уровня 7.
Если матрица Q из функционала качества невырождена, то уравнение (РНЕ) можно переписать в виде
(V - аСГ* XKV-aCf1 )* » аСГа* + bb* - 7~*сс*. Отсюда видно, что нахождение решения 7(z) сводится к матричной факторизации. Как известно, уравнение факторизации имеет несколько решений. Далее устанавливается, какое из них соответствует максимальному решению уравнения"Риккати для соответствующей переформулировки задачи в терминах пространства состояний.
Лемма 3.2. Решение X является стабилизирующим тогда и только тогда, когда матрица
S(z) = a(z) - V<z)Q антиустойчива; т.е. все корни det(S(?.)) расположены в правой полуплоскости, в
Далее доказано, что через V(z> можно выразить матрицу Y=X_1, которая является решением сопряженного уравнения Риккати. Решение записывается в полиномиальном виде Y(z)=(I,zI,...,zM_1I)Y, т.е. блочная строка матрицы Y равна коэффициенту при соответствующей степени матрицы Y(z).
Теорема 3.2. Пусть существует решение V(z) уравнения (РВЕ). Тогда решение У уравнения сопряженного уравнения Риккати существует и определяется уравнением
Y(z) - V(z)(zL-a)(z)* (a(z)-V(z)Q)(z!i«V>(z)* +
+ b(z)(zli*b)(3)* - 7"*c(z)(zL.c)(z)*.-Далее устанавливается связь между частотным условием в уравнении факторизации и частотным условием на матрицу Гамильтона Н(7), которое требуется для решения уравнения Риккати.
Леша 3.3. Пусть 7>0 и det(Q)*0. Тогда следующие утверждения равносильны:
1. Матрица Гамильтона Н(7) не тлеет собственных чисел на мнимой оси.
2. Существует такое решение V(z) уравнения PRE, что матричный полином a(z)-V(z)Q антиустойчив.
3. Выполняется неравенство
det(aQ~V + bb* - 7"'сс*) * О (ГС)
на мнимой оси.'
Таким образом, из частотного условия следует существование стабилизирующих решений V(z) уравнения (PRE) и У«Х~* уравнения Риккати для пространства состояний. Это позволяет найти решение задачи »^-оптимизации в общем виде. Введем ряд обозначений.
Для произвольного квазиполинома p(z)=p_iczll+...+p1z1- определим операцию (■1+ взятия полиномиальной части:
tp(z)l+ - р„ + ... + PjZ1. Введем операцию • для произвольных полиномиальных матриц f(z) и g(z) соответствующих размерностей равенством
(Г-gHz) = [rT(z"*)g(z)l+, где Г и g - блочные столбцы из коэффициентов Г и g.
Теорема 3.3. Пусть 7>0 и выполнено условие (FC). Тогда каждый субоптимальный допустимый регулятор со свойством J<t", если такой существует, определяется уравнением
<yp)u(t) - Фу(р)уи) - <tv(P)v(t) + G(«(y,u,v)), (R)
где G - произвольная рациональная матричная функция со свойством •С«м<7.
Ф(У,и,У) - *rX(t) - <iyp)y(t> - ^(pMt) - «^(pmt). Полиномиальные матрицы определяются следующим образом: фу(г)=(К.а)(г), ф^гМК.оНгН!, «^(вМК.оНв). <iyz)=(a>.a)(z), фц(а)=(ае.Ъ)(а), ф^вМае.сИв) + I, полиномиальные матрицы К=К(з) и зе=ае(а) степени M определяются из уравнений К(0)=0, аг(0)=0 и
V<t£ + Ьф£ - т-'сф^ - (VQ-a)(K«V)*, (К)
Уф^ + Ьф^ - 7_гсф^ - (V0-a)(«.V)*. где V=V(z) - такое решение уравнения (PRE), что полином det(a(z)-V(z)Q) антиустойчив.»
Нахождение решений перечисленных выше линейных полиномиальных уравнений может оказаться нетривиальной задачей, хотя для этого существуют алгоритмы и программы, представленные в главе 4. Тем не менее, эти уравнения обладают спецификой, которую можно учесть для упрощения решения. В теореме 3.4 дан рекуррентный способ решения этих уравнений, не требующий обращения матриц, порядок которых больше размерности выхода y(t). В лемме 3.4 сформулирован итеративный метод поиска минимального значения функционала качества I.
В разделе 3.16 дано решение аналогичной задачи ^-оптимальной фильтрации. Пусть функция y(t) удовлетворяет уравнению
а(р) y(t)- - Ь(р) v(t), где v(t) - возмущение в объекте. Требуется оценить функция
r(t) - C*y<t), по наблюдениям
s(t) - D*y(t) + w(t), где w(t) - шум измерения. Матричные полиномы а(р), с(р) имеют соответствующие размерности. Начальные данные предполагаются нулевыми: y(t)=0, v(t)-0, w(t)«0 при t<0.
Требуется построить линейную неупревдапцую оценку r(t) выходной переменйой r(t) по наблюдениям в(-) так, чтобы минимизиро-
аать функционал качества » .
г «г-г«" . ,
I « sup J ---- , V,WeL (0,»), |Т| + |»|яО
I IYH + « W« ' J
где все нормы вычисляются в пространстве L2(0,«>).
Теорема З.Б. СуСоптимальная оценка r(t> удовлетворяет системе уравнений
r(t> - C*y(t),
a(p)y(t) - K(p)e(t) + g(p) 0(t), e(t) ■ s(t) - D*y(t), 0(t) - Rtel(t), »R«m<7. Полиномиальные матрицы К(а) и g(z) имеют вид
K(z) - V(B)D, g(z) - V(8)C, где V(z) - решение полиномиального аналога уравнения Риккати
-a(z)V(z)* - V(z)a(z)* + ъ(а)Ъ(г>* + V(z)QV(?.)* = о, и введено обозначение Q=»7~Ioc*-DD*.w
В последнем раздело 3.17 третьей главы рассматривается общая задача управления при неполном зашумленном наблюдении. Согласно принципу разделения решение этой задачи сводится к двум рассмотренным ранее задачам управления и фильтрации. Однако вычислитель-■ ный алгоритм существенно зависит от формы представления уравнения объекта, невырожденности матрицы Q и других особенностей спектральных методов, не использующих пространство состояний. Предлагаемый полиномиальный метод решения был распространен на общий случай, и в теореме 3.6 сформулирован полиномиальный алгоритм синтеза оптимального регулятора, имеющий ту же структуру, что и приведенные выше решения задач фильтрации и управления, л основанный на принципе разделения.
Глава 4 содержит описание программ и алгоритмов, по которым они работают. Важнейшие алгоритмы:
- решение полиномиальных матричных уравнений. Программа необходима в любых полиномиальных методах как в задаче »^-оптимизации, так и в линейно-квадратичных задачах оптимального
управления;
- приведение матричного полинома к диагональному виду. Это
требуется для решения полиномиальных уравнений и играет большую роль в полиномиальном исчислении;
- построение минимальной реализации матричной передаточной функции. Требуется при использовании алгоритма J-сгоктральной Факторизации, при решении задачи Нехари и при обычной спектральной матричной факторизации.
Кроме того, приведены описания большого количества вспомогательных программ полиномиального матричного исчисления на языке PASCAL.•
I. А.Е.Барабанов, М.К.Саббег. Реализуемость «""-оптимальных регуляторов. Вестник СПбГУ, 1993, вып.З.
a. A.E.Barabanov, M.Sabbagh. Polynomial approach to и"" control problem with additional constraints. Arabian Journal ol Control and Engineering, 1993.
Подписано к печати 23.(№.93 Заказ 133 Тира» 100 Объем 0,75 п.л.
ПМЛ СПГУ
199034, Санкт-Петербург,наб. Макарова,б.