Численные методы минимаксного управления динамическими объектами тема автореферата и диссертации по математике, 01.01.11 ВАК РФ

Аль Саббаг Мухаммед Кхалил АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1993 ГОД ЗАЩИТЫ
   
01.01.11 КОД ВАК РФ
Автореферат по математике на тему «Численные методы минимаксного управления динамическими объектами»
 
Автореферат диссертации на тему "Численные методы минимаксного управления динамическими объектами"

ОД

1 и шД ез

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

АЛЬ-САББАГ Мухаммед Кхалил

ЧИСЛЕННЫЕ МЕТОДЫ МИНИМАКСНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

01.01.11 - системный анализ и автоматическое управление

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург. 1993

Работа выполнена в Санкт-Петербургском государственном университете

Научный руководитель: кандидат физико-математических наук Барабанов Андрей Евгеньевич

Официальные оппоненты: доктор технических наук, профессор Первозванский Анатолий Аркадиевич

кандидат физико-математических наук Соколов Андрей Арианович

Ведущая организация - Санкт-Петербургский государственный электро-технический университет

,гЗО

Защита состоится " II " мая 1993 г. в IV_ часов на заседании

специализированного совета 1С 063.57.49 по присуждению ученой степени кандидата физико-математических■наук в Санкт-Петербургском государственном университете по адресу: 198904, Санкт-Петербург, Старый Петергоф, Библиотечная пл., д.2.

С диссертацией можно ознакомиться в научной библиотеке Санкт-Петербургского университета (Санкт-Петербург, Университетская наб., д.7/9)

л у

Автореферат разослан " " 1993 г.

Ученый секретарь специализированного совета кандидат физико-математических наук, доцент

А.И.Шепелявый

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Игровые подхода к'задаче оптимального управления динамическим объектом управления, описываемым системой обыкновенных дифференциальных линейных уравнений с постоянными коэффициентами, в последние года становятся столь же популярными, как и стандартные линеЯно-КЕадратичные задачи. Постановка задачи «"-оптимального управления привлекает как грубостью решения по отношению к отклонениям спектральной плотности возмущений, так и гарантированной устойчивостью система с заданным запасом. Этим задачам посвящено большое количество литературы как по математическим, так и по прикладным и вычислительным проблемам.

Математические метода расчета «"-оптимальных регуляторов можно разделить на спектральные метода, методы пространства состояний и полиномиальный подход, не использукщий пространство состояний. Последний из этих методов был предложен X. Квакернааком и реализован в пакете программ ка языке ИАТЬАВ.

Надо отметить, что вычислительная сложность известных алгоритмов решения такова, что затрудняет интерпретацию промежуточных результатов, и это препятствует распространению полученных решений в приложениях, где важен конечный результат. Поэтому актуальной является задача поиска новых вычислительных методов решения этих задач.

. Цель работы состоит в разработке новых алгоритмов, вычислительных методов и программ решения задач «"-оптимального управления. Одновременно в работе решены некоторые новые задачи синтеза «""-оптимальных регуляторов.

Метод исследования. В диссертации применяются метода решения полиномиальных уравнений, методы линейно-квадратичной теории с дифференциальными-уравнениями Риккати и функциональные методы равномерно-частотной оптимизации.

Научная новизна. На защиту выносятся следующие результаты:

- полиномиальный алгоритм синтеза «"-оптимального управления по методу Квакернаака-Мейнсмы,

- уравнение для наихудшей спектральной плотности при полиномиальном описании объекта управления и спектральных ограничений на возмущения,

- условия реализуемости оптимального регулятора,

- вычислительная формула для решения максиминной задачи «""-оптимального управления,

- новый алгоритм полиномиальных преобразований для синтеза оптимального регулятора без перехода к пространству состояний,

- алгоритмы и программы матричного полиномиального исчисления, применяемые в алгоритмах синтеза оптимальных регуляторов.

Практическая и теоретическая ценность. Результаты могут быть использованы при решении прикладных задач синтеза оптимальных регуляторов с равномерно-частотным показателем качества. Полученные во временной области решения новых задач синтеза оптимальных регуляторов допускают распространение на нестационарные системы.

Аппробашя работы. Результаты доложены на семинарах кафедры теоретической кибернетики СПбГУ и кафедры механики и проблем управления СПбГТУ.

Публикации. Результаты работы отражены в статьях £1, 2J, принятых к публикации.

Структура и объем работы. Диссертация состоит из введения, четырех глав, приложения и списка литературы. Общий объем работы •170 страниц.

КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Первая глава носит, в основном, обзорный характер. Излагаются решения задачи, основанные на методах: пространства состояний; сведения к задаче Нехзри; полиномиальном подходе Квакернаака.'В

конце главы устанавливается связь линейно-квадратичной теории и »(""-оптимизации в матричном случае и сформулировано новое утверждение об уравнении, которому удовлетворяет наихудшая спектральная плотность.

Рассмотрим задачу оптимального управления объектом а(р) y(t) = й(р) u(t) + с{р) v(t), где матрица c(z) - квадратная, невырозденная и не имеет нулей в правой полуплоскости. Пусть С&О и z=col(y,u) - обобщенный выход объекта. Наблюдается вектор y(t) и требуется минимизировать функционал качества

I = sup -Г Jz(t)*Q z(t) dt i iv» . si ) (P)

v U L (0,ш) J

при нулевых начальных данных. Для формулировки результата введем ряд обозначений. Определим несократимую справа пару полиномиальных матриц (h,g) из условия ah-=bg; вектор I(Л,) = col(h(A.),g(X)); гурвицев полином П(Х), удовлетворяющий уравнению факторизации

П(Х)*П(\) = r(\>*Q и\), функцию

Ш) « (n*(\)Pí*(\)R И°(?1)Г(\), и ее антианалитическую часть Y+(X), т.е. матричную функцию, удовлетворяющую условиям: все полюсы Y+(M расположены в правой полуплоскости, матрица У(Л.)-У+(Х) не имеет полюсов в правой полуплоскости и Y+(M—*0 при А,—«о.

Лемма I.e. Наихудшей спектральйой плотностью является любая рациональная плотность Б(Х)=Г(Х)Г(Х)*, для которой выполнено сле-дуюпее условие:

■£г*г - r*ZT + тфг+, где - минимум функционала I,

S = с* ((a, -b) R-'col(a\ -b*))",

где - передаточная функция замкнутой системы от v(t) к z(t) при произвольном стабилизирующем регуляторе.«

Полиномиальный подход Х.Квакернаака изложен им для матричных систем с невырожденными шумами измерения. Сформулированный на основе этого подхода алгоритм непосредственно вычисляет полиномиальные матрицы Г (А.) и Х(М. для которых передаточная функция регулятора VbYJT* является оптимальной. Однако для реализации регулятора аи=ру необходимо вычислить левостороннюю факторизацию атой передаточной функции: W=a~*p. Для случая полного наблюдения в разделе 1.4 получен способ расчета матриц а и р, в котором сокращена размерность факторизуемых матриц. Пусть Q=I. Введем мат-, ричную функцию

г I - b(X)* M(X)-*b(\) -Ь(\)* М(\Г*а(\) 1

ПТ(Х) " [ -а(А,)* М(Л.)"*Ь(Л.> I - а(М* М(ХГ*а(Х) J'

где К(\) = а(Ма(М% b(X,)b(\>*- 7"*c(X)c(Ji)*.

Теорема I.S (зариант теоремы Квакернаака-Мейнсмы для полного наблюдения и левосторонней факторизации).

Следующие утверждения равносильны:

1). iWz/v(\)«œs 7,

2). (а(Х), (а(\), р(Х))* г 0 при Re(X) - О.-

Теорема 1.4 утверждает, что для достижимого значения т* функционала I матрица П^(А.) допускает J-спектральную факторизацию: Hy(\)=Z7(X)*JZ^(X), J «= (р—Э * ^Редели» множество

К ■= {к(\) - а(Х)-*р(Х,) I (а<Х),Э(\)) - (А^Ва))^*.)"1. • В(Х)-АСХГ1»^ S I , В(Х), А(Х), А(\)~* - устойчивые рациональные матричные функции}.

Теорема Х.5. I. Для любого уровня 7>0 стабилизирующий регулятор уровня 7 существует тогда и только тогда, когда любой из регуляторов множеотва К является стабилизирующим.

3. Множество всех передаточных функций стабилизирующих регуляторов уровня 7 совпадает с К.

3. Для невыровденной задачи «"-оптимизации оптимальный регу-■ лятор удовлетворяет условию

(а(\), рош-пуд.)-(а(\), р<;\.))* = 0 при 1?е(Л.) = 0.-

Во второй главе исследуются задачи ^-оптимизации для объекта, записанного в пространстве состояний:

X = АХ + Ви + СТ. Требуется минимизировать функционал (Р) при г=со!(В*х,и), 0=1 в • классе линейных регуляторов а(р)и(г) = р(р) х(г).

Как известно, решение этой задачи связано со свойствами матрица Гамильтона размерности 2п*2п:

н7 =

А 7-1СС*-ВВ*

Минимум функционала качества I равен где 7и1п - точная нижняя грань всех чисел 7>0, для которых выполнены два условия: Н^ не имеет собственных чисел на мнимой оси и базис соНХ^Д^) собственного подпространства размерности п, отвечающего собственным числам с отрицательной вещественной частью, обладает свойством: При 7—*-7т1л нарушается одно из этих двух условий. Известно, что если первое условие остается выполенным при 7=7п1п, то оптимальный регулятор строго реализуем, а если остается выполненным второе условие, то оптимальная передаточная функция имеет постоянную норму на мнимой сси. Полное решение задачи об условиях реализуемости и постоявтства нормы, в т.ч. при одновременном нарушении обоих условий, потребовало привлечения специального математического аппарата. Получен следующий результат.

Теорема 2.1. Следующие утверждения равносильны: ' I. Оптимальный регулятор существует и строго реализуем.

2. dat(Xt^,) es стремится к 0 при 7—►7mln+o.

S. оптимальный регулятор существует и передаточная функция замкнутой системы Vz/W обладает свойством

»W2/w(to)l * 7mln (ЬХгК).в

Далее во второй главе изучается игровая задача и°°-оптимиза-ции при ненулевом начальном векторе состояний и знакопеременной матрице Q в функционале качества. Наряду со стандартной минимако-ной задачей «"-оптимизации рассматривается максиминная задача с функционалом качества

« , г р s 1

I - вир Inf rz(t)*Q z(t) dt, о- .

ITIS1 и 5 L S* R J

где z=col<x,u), x(0)«xo«Rn. Матрица Q может быть знакопеременной, но выполнено необходимое частотное условие, при котором ï*-®. В отличив от известных подходов к решению задач (»"-оптимизации, так или иначе использующих спектральные методы, в данном случае удалось ограничиться повторным решением двух линейно-квадратичных задач в пространстве состояний и несколькими алгебраическими преобразованиями. Доказано также, что минимакс равен максимину. Получена простая в вычислительном отношении формула для оптимального регулятора, наихудшего возмущения и минимума функционала качества. Обозначим через H^iA.) матрицу Гамильтона, построенную для задачи »"-оптимизации при заданной квадратичной форме в функционале качества Jr(x,u)«z*Qa.

Теорема 2.2. Данная максиминная задача имеет седловую точку, которая может быть вычислена следующим образом:

1° = вир Inf Г ^(х,и) dt -

weBL (0,00) и«ХЛ(0,в>) ъ

' m '

-Inf вир f *(х,и) dt « inf а + X Х(*,)х„),

где U - класс неупревдапцих линейных обратных связей, Х(М - максимальное решение уравнения Риккати с матрицей Гамильтона Нда(М , л°-тт>о 1 3X(X)ïX(®)).

Пусть нижняя грань достигается при к~Ха>Л°. Тогда оптимальное управления определяется регулятором

u(t) « -BR"(B*X(A.°)+S*)x(t), а наихудшее возмущение - обратной связью w(t) - X"1C*X(X°)x(t).-

Третья глава посвящена полиномиальным методам решения задачи «"-оптимального управления. Объект управления описывается уравнением

а(р) y(t> = Ъ(р) u(t) +■ с(р) 7(t), где все величины у, u, г - векторные, p=d/dt. Требуется минимизировать функционал качества

I - sup f(y(t)*Qy(t) + u(t)*u(t)) dt msi о

при нулевых начальных данных в классе линейных регуляторов. В первых разделах главы приведено решение задачи при дополнительных ограничениях нь невязку модели v(t). Доказано, что при помощи S-процедуры задача сводится к аналогичной параметрической задаче без дополнительных о^аничений о последующей минимизацией по па-, раметрам, количество которых равно количеству дополнительных ограничений.

В следуицих разделах третьей главы изучаются алгоритмы минимизации функционала I без приведения системы управления к виду пространства состояний. Метод решения этой задачи, предложенный в монографии B.Prancls'a, содержит спектральную матричную факторизацию и затем решение задачи Нохари. Для решения задачи Нехари требуется проводить J-спектральную матричную факторизацию. В данной главе предложен алгоритм, содержащий ту же операцию спектральной матричной факторизации, но без решения задачи Нехари или J-спектральной факторизации, которые заменяются на решение системы линейных уравнений. Основной операцией предлагаемого метода

является решение матричного полиномиального уравнения вида

Va* + aV* - VQV* + bb* - 7~acc* = О (PRE)

относительно матричного полинома V(z), степень которого меньше степени a(z), которая далее обозначается через М. Здесь символ * означает транспонирование и замену знака у аргумента: x(z)*-xT(-z). Полученное уравнение внешне напоминает уравнение Риккэти и поэтому было названо полиномиальным аналогом уравнения Риккати (ПУР). Как и в решении методом пространства состояний, через найденное значение 7(e) непосредственно вычисляется переда-точпая функция субоптимального регулятора уровня 7.

Если матрица Q из функционала качества невырождена, то уравнение (РНЕ) можно переписать в виде

(V - аСГ* XKV-aCf1 )* » аСГа* + bb* - 7~*сс*. Отсюда видно, что нахождение решения 7(z) сводится к матричной факторизации. Как известно, уравнение факторизации имеет несколько решений. Далее устанавливается, какое из них соответствует максимальному решению уравнения"Риккати для соответствующей переформулировки задачи в терминах пространства состояний.

Лемма 3.2. Решение X является стабилизирующим тогда и только тогда, когда матрица

S(z) = a(z) - V<z)Q антиустойчива; т.е. все корни det(S(?.)) расположены в правой полуплоскости, в

Далее доказано, что через V(z> можно выразить матрицу Y=X_1, которая является решением сопряженного уравнения Риккати. Решение записывается в полиномиальном виде Y(z)=(I,zI,...,zM_1I)Y, т.е. блочная строка матрицы Y равна коэффициенту при соответствующей степени матрицы Y(z).

Теорема 3.2. Пусть существует решение V(z) уравнения (РВЕ). Тогда решение У уравнения сопряженного уравнения Риккати существует и определяется уравнением

Y(z) - V(z)(zL-a)(z)* (a(z)-V(z)Q)(z!i«V>(z)* +

+ b(z)(zli*b)(3)* - 7"*c(z)(zL.c)(z)*.-Далее устанавливается связь между частотным условием в уравнении факторизации и частотным условием на матрицу Гамильтона Н(7), которое требуется для решения уравнения Риккати.

Леша 3.3. Пусть 7>0 и det(Q)*0. Тогда следующие утверждения равносильны:

1. Матрица Гамильтона Н(7) не тлеет собственных чисел на мнимой оси.

2. Существует такое решение V(z) уравнения PRE, что матричный полином a(z)-V(z)Q антиустойчив.

3. Выполняется неравенство

det(aQ~V + bb* - 7"'сс*) * О (ГС)

на мнимой оси.'

Таким образом, из частотного условия следует существование стабилизирующих решений V(z) уравнения (PRE) и У«Х~* уравнения Риккати для пространства состояний. Это позволяет найти решение задачи »^-оптимизации в общем виде. Введем ряд обозначений.

Для произвольного квазиполинома p(z)=p_iczll+...+p1z1- определим операцию (■1+ взятия полиномиальной части:

tp(z)l+ - р„ + ... + PjZ1. Введем операцию • для произвольных полиномиальных матриц f(z) и g(z) соответствующих размерностей равенством

(Г-gHz) = [rT(z"*)g(z)l+, где Г и g - блочные столбцы из коэффициентов Г и g.

Теорема 3.3. Пусть 7>0 и выполнено условие (FC). Тогда каждый субоптимальный допустимый регулятор со свойством J<t", если такой существует, определяется уравнением

<yp)u(t) - Фу(р)уи) - <tv(P)v(t) + G(«(y,u,v)), (R)

где G - произвольная рациональная матричная функция со свойством •С«м<7.

Ф(У,и,У) - *rX(t) - <iyp)y(t> - ^(pMt) - «^(pmt). Полиномиальные матрицы определяются следующим образом: фу(г)=(К.а)(г), ф^гМК.оНгН!, «^(вМК.оНв). <iyz)=(a>.a)(z), фц(а)=(ае.Ъ)(а), ф^вМае.сИв) + I, полиномиальные матрицы К=К(з) и зе=ае(а) степени M определяются из уравнений К(0)=0, аг(0)=0 и

V<t£ + Ьф£ - т-'сф^ - (VQ-a)(K«V)*, (К)

Уф^ + Ьф^ - 7_гсф^ - (V0-a)(«.V)*. где V=V(z) - такое решение уравнения (PRE), что полином det(a(z)-V(z)Q) антиустойчив.»

Нахождение решений перечисленных выше линейных полиномиальных уравнений может оказаться нетривиальной задачей, хотя для этого существуют алгоритмы и программы, представленные в главе 4. Тем не менее, эти уравнения обладают спецификой, которую можно учесть для упрощения решения. В теореме 3.4 дан рекуррентный способ решения этих уравнений, не требующий обращения матриц, порядок которых больше размерности выхода y(t). В лемме 3.4 сформулирован итеративный метод поиска минимального значения функционала качества I.

В разделе 3.16 дано решение аналогичной задачи ^-оптимальной фильтрации. Пусть функция y(t) удовлетворяет уравнению

а(р) y(t)- - Ь(р) v(t), где v(t) - возмущение в объекте. Требуется оценить функция

r(t) - C*y<t), по наблюдениям

s(t) - D*y(t) + w(t), где w(t) - шум измерения. Матричные полиномы а(р), с(р) имеют соответствующие размерности. Начальные данные предполагаются нулевыми: y(t)=0, v(t)-0, w(t)«0 при t<0.

Требуется построить линейную неупревдапцую оценку r(t) выходной переменйой r(t) по наблюдениям в(-) так, чтобы минимизиро-

аать функционал качества » .

г «г-г«" . ,

I « sup J ---- , V,WeL (0,»), |Т| + |»|яО

I IYH + « W« ' J

где все нормы вычисляются в пространстве L2(0,«>).

Теорема З.Б. СуСоптимальная оценка r(t> удовлетворяет системе уравнений

r(t> - C*y(t),

a(p)y(t) - K(p)e(t) + g(p) 0(t), e(t) ■ s(t) - D*y(t), 0(t) - Rtel(t), »R«m<7. Полиномиальные матрицы К(а) и g(z) имеют вид

K(z) - V(B)D, g(z) - V(8)C, где V(z) - решение полиномиального аналога уравнения Риккати

-a(z)V(z)* - V(z)a(z)* + ъ(а)Ъ(г>* + V(z)QV(?.)* = о, и введено обозначение Q=»7~Ioc*-DD*.w

В последнем раздело 3.17 третьей главы рассматривается общая задача управления при неполном зашумленном наблюдении. Согласно принципу разделения решение этой задачи сводится к двум рассмотренным ранее задачам управления и фильтрации. Однако вычислитель-■ ный алгоритм существенно зависит от формы представления уравнения объекта, невырожденности матрицы Q и других особенностей спектральных методов, не использующих пространство состояний. Предлагаемый полиномиальный метод решения был распространен на общий случай, и в теореме 3.6 сформулирован полиномиальный алгоритм синтеза оптимального регулятора, имеющий ту же структуру, что и приведенные выше решения задач фильтрации и управления, л основанный на принципе разделения.

Глава 4 содержит описание программ и алгоритмов, по которым они работают. Важнейшие алгоритмы:

- решение полиномиальных матричных уравнений. Программа необходима в любых полиномиальных методах как в задаче »^-оптимизации, так и в линейно-квадратичных задачах оптимального

управления;

- приведение матричного полинома к диагональному виду. Это

требуется для решения полиномиальных уравнений и играет большую роль в полиномиальном исчислении;

- построение минимальной реализации матричной передаточной функции. Требуется при использовании алгоритма J-сгоктральной Факторизации, при решении задачи Нехари и при обычной спектральной матричной факторизации.

Кроме того, приведены описания большого количества вспомогательных программ полиномиального матричного исчисления на языке PASCAL.•

I. А.Е.Барабанов, М.К.Саббег. Реализуемость «""-оптимальных регуляторов. Вестник СПбГУ, 1993, вып.З.

a. A.E.Barabanov, M.Sabbagh. Polynomial approach to и"" control problem with additional constraints. Arabian Journal ol Control and Engineering, 1993.

Подписано к печати 23.(№.93 Заказ 133 Тира» 100 Объем 0,75 п.л.

ПМЛ СПГУ

199034, Санкт-Петербург,наб. Макарова,б.