Синтез минимаксных регуляторов тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Барабанов, Андрей Евгеньевич АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1997 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Синтез минимаксных регуляторов»
 
Автореферат диссертации на тему "Синтез минимаксных регуляторов"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В.ЛОМОНОСОВА

РГ6 ол

На правах рукопвси

БАРАБАНОВ Андрей Евгеньевич

СИНТЕЗ МИНИМАКСНЫХ РЕГУЛЯТОРОВ

01.01.02 — Дифференциальные уравнения

05.13.16 — Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях.

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук

Москва 1997

Работа выполнена на кафедре теоретической кибернетики математико-механического факультета Санкт-Петербургского государственного университета.

Официальные оппоненты: доктор физико-математических наук,

профессор В.И.Благодатских; доктор физико-математических наук, профессор Н.А.Бобылев; доктор технических наук, член-корреспондент РАН, профессор С.К.Коровин. Ведущая организация: Институт математики и механики

УрО РАН.

Защита диссертации состоится (МоьиЯ 1997 г.

в ¿Г часов зо минут на заседании Диссертационного совета Д.053.05.37 при Московском государственном университете им. М.В.Ломоносова по адресу: 119899, Москва, Воробьевы горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, аудитория 685.

С диссертацией можно ознакомиться в библиотеке факультета вычислительной математики и кибернетики МГУ.

Автореферат разослан <6

1997 г.

Ученый секретарь Диссертационного совета доктор физико-математических наук,/О/ , /?

профессор

И.Моисеев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Современная теория синтеза регуляторов для динамических объектов управления имеет многочисленные приложения в задачах разработки электрических и механических систем и в то же время содержит ряд самостоятельных математических разделов. Математические задачи синтеза регуляторов являются основным предметом исследования на страницах многих нрупнейших международных журналов по теории управления и ряда регулярных конференций IEEE, IFAC и других организаций. Одна из центральных задач синтеза состоит в подавлении возмущений, присутствующих в модели динамического объекта. Эта задача, поставленная как оптимизационная, относится к теории дифференциальных игр, и ее изучение является основной целью данной работы.

Основы теории синтеза линейных оптимальных систем были заложены в работал; А.Н.Колмогорова, Н.Винера, А.М.Летова, Р.С.Бьюси, Ж.-Л. Лио-нса. Развитие математического аппарата и особенно вычислительных методов (В.Б.Ларин, Д.С.Юла, В.Н.Фомин, Б.Д.О.Андерсон и др.) привело к созданию линейно-квадратичной теории оптимального управления, являющейся разделом теории гильбертовых пространств. В данной работе исследованы линейно-квадратичные задачи с дополнительными ограничениями: сильной устойчивости регулятора, введенной М.Видьясагаром, и различных форм реализуемости, введенных В.А.Якубовичем.

Если возмущение ограничено в равномерной метрике, то оптимизационная задача синтеза становится игровой, а математический аппарат связан с анализом динамики совместимых множеств. В 70-е годы теория множественной идентификации и минимаксного управления была создана в работах А.В.Куржанского, Ф.Л.Черноусько, В.М.Кунцевича, В.А.Якубовича. По аналогии с линейно-квадратичной стохастической теорией автором в 1984 г. была рассмотрена минимаксная задача с показателем качества и ограничениями на возмущение, инвариантными относительно сдвига во времени [9]. В 1987 г. полностью аналогичный результат был опубликован М.Дахлехом и Дж. Пирсоном, и эта статья была признана лучшей статьей года в журнале IEEE Trans, on Automat. Control. В начале 90-х годов большое число публикаций в этом направлении оформило теорию i1-оптимального управления, которой в настоящее время посвящаются минисимлозиумы и секции на крупнейших конференциях по математической теории управления. Ей посвящена монография автора [8), состоящая почти целиком из новых результатов.

Математическая задача ¿'-оптимального управления для объекта в непрерывном времени состоит в минимизации нормы отображения, определяемого дифференциальным уравнением объекта, из пространства £°°(0, оо) в себя на классе допустимых стратегий управления. Метода изучения этих задач активно используют теорию двойствснности, теорему о седловой точке и относятся к бесконечномерному выпуклому анализу. Для задач с интегральными или терминальными функционалами качества эти методы были впервые применены в монографии А.В.Куржанского "Управление и наблюдение в условиях неопределенности" (М., 1977). Разработанная автором диссертации и представленная в главах 1-5 теория Р-оптимального управления представляет собой развитие этих методов для инвариантных относительно сдвига систем с равномерным функционалом качества.

Вторая часть диссертации в основном посвящена дифференциальным играм, относящимся к теории ^^-оптимального управления. Исследование запасов устойчивости и грубости систем автоматического управления привело в начале 80-х годов к созданию теории ^^-оптимального управления, которая по существу является минимаксным обобщением линейно-квадратичной теории синтеза регуляторов. Первые результаты в работах Дж.3еймса, М.Сафонова, ДжДойла были быстро подхвачены и развиты в многочисленных публикациях и на специальных конференциях, организованных научными обществами IEEE и IEE. Была найдена алгебраическая связь с задачами Неванлинны-Пика, проблемой наилучшего приближения аналитическими функциями, восходящей к полиномам Чебышева и методу моментов Маркова и включающей задачу Нехари, а также с последними аналитическими результатами в этой области, принадлежащими М.Г.Крейну, В.М.Адамяну, Д.З.Арову. В настоящее время известны несколько различных методов решения стандарту вой задачи 'Н00-оптимального управления: путем сведения к задаче Нехари (монография В.Френсиса), метод двух уравнений Лурье-Риккати (К.Гловер, Дж. Дойл), полиномиальный подход (Х.Квакернаак), метод неущербной факторизации (Х.Кимура). Начиная с работы А. ван дер Шафта эти методы переносятся на нелинейные системы управления. В главе 9 представлено новое решение этой задачи, связанное с понятиями полиномиального алгебраического уравнения Риккати и матричной полиномиальной факторизации с ограничением на степени. Одновременно найдена алгебраическая связь спектрального алгоритма и метода уравнений Лурье-Риккати.

В главе 7 автором была впервые поставлена минимаксная линейно-квадратичная задача управления как дифференциальная игра в классе позиционных стратегий. Позицией является вектор состояний объекта управления и оставшийся ресурс анергии у игрока, выбирающего возмущение. В соответствии с теорией позиционных дифференциальных игр, разработанной Н.Н.Красовским и А.И.Су бботашым, определены классы стратегий игроков, доказано существование цены игры, найдены явно оптимальные стратегии и исследованы их свойства непрерывности.

В Главе 8 задача ^^-оптимального управления поставлена в классе произвольных нелинейных липщицевых операторов в уравнении регулятора. В замкнутой нелинейной системе минимизируется константа Липшица в норме Цос от возмущений к выходным переменным. Эта задача занимает промежуточное положение между чисто линейными и общими нелинейными системами, однако утверждения являются безусловными и содержат полную параметризацию субоптимальных регуляторов, чего не удается достичь для нелинейных объектов.

Часть 3 содержит задачи адаптивного управления и оценивания, прикладные задачи синтеза регуляторов и задачи с дополнительными ограничениями. Системам адаптивного управления линейным объектом посвящено большое количество публикаций, начиная с работ В.А.Якубовича, В.Н.Фомина, Я.З.Цыпкина, Б.Н.Петрова, В.М.Кунцевича и др. В Глазе 10 изучается система адаптивного управления линейным скалярным объектом с идентификатором по методу наименьших квадратов (МНК). Свойства сходимости МНК с белым шумом в уравнении наблюдения изучаются на протяжении двух столетий. В монографиях Ю.В.Линника, Б.Д.О.Андерсона и др. сформулированы асимптотические свойства и скорость сходимости алгоритма при условии не-

зависимости регрессоров от обновляющего процесса. В системах адаптивного управления возникает мало исследованный случай: регрессоры зависят от предыстории и интерес представляет сходимость почти наверное. В главе 10 доказано, что траектории оценок МНК в этом случае могут не только не сходиться, но и быть п. н. неограниченными. Построены алгоритмы адаптивного управления, при которых сходимость гарантируется. В §10.3 ставится задача критериальной сходимости алгоритма адаптации, относящаяся к теории стохастической оптимизации, развитой в работах Б.Т.Поляка и Я.З.Цыпкина.

Задача оптимального адаптивного управления при равномерных ограничениях на возмущение исследована в главе 11. Первые результаты в в той теории принадлежат В.АЛкубовичу, А.Б.Куржанскому и В.М.Кунцевичу. Задача синтеза ¿'-оптимальной адаптивной системы управления впервые поставлена В.Ф.Соколовым и решена им для частных случаев. Адаптивные системы управления с идентификаторами всегда нелинейны, и задачи синтеза оптимальных регуляторов могут рассматриваться как нелинейные обобщения линейной теории 11- и №°-оптимальяого управления, рассмотренной в первых двух главах.

Цель работы. Многие практически важные задачи синтеза устройств, компенсирующих возмущения, могут быть поставлены как математические задачи оптимизации или дифференциальные игры. Различные вида ограничений на возмущения и различные типы показателей качества работы системы порождают задачи оптимизации, относящиеся к бесконечномерному выпуклому анализу, к теории гильбертовых пространств, к теории вероятностей и т. д. Решение возникающих дифференциальных или разностных игр было целью проведенной работы.

Построена теория ^-оптимального управления, являющаяся минимаксным аналогом стохастической линейно-квадратичной теории синтеза регуляторов для систем с равномерными ограничениями на возмущения. Решены новые задачи теории Н^-оптимального управления и теории адаптивного управления. Разработаны вычислительные алгоритмы, примененные в ряде задач управления, техническими, системами.

Научная новизна. Все утверждения и все математические идеи решения поставленных в работе задач являются новыми и принадлежат автору.

Практическая ценность. Следящие системы, системы автосопровождения, демпфирования и др. являются по существу системами подавления возмущений. Они широко распространены в электротехнике и механике и применяются всюду, где требуется повышение точности работы устройств. Точная формулировка ограничений в конкретной технической задаче осуществляется специалистом данной предметной области, а возникающая математическая задача должна иметь решение, доведенное до вычислительных алгоритмов. Данная работа представляет собой коллекцию таких математических задач и алгоритмов расчета решений.

Кроме того, подробно рассмотрены следующие задачи синтеза следящих систем: синтез авторулевого для линейной модели судна методами адаптивного ^-оптимального управления (§11.3) и 7Г°-оптимального управления (§11.4); компенсация скачков нагрузки в автономной системе энергоснабжения (§12.4); синтез адаптивной системы слежения при больших и неизвестных интенсив-ностях шума измерения (§12.5); синтез робота-велосипедиста (§1.5); синтез регулятора активной подвески автомобиля по простейшей модели с равномерно

ограниченной невязкой (§1-5).

Апробация работы. Основные результаты работы докладывались на следующих конференциях и семинарах: 3, 4 и 5 Ленинградские симпозиумы "Теория адаптивных систем" (Ленинград, 1976,1979, 1991), 4 и 8 Всесоюзные конференции по управлению в механических системах (Москва, 1982; Свердловск, 1990), 2 и 3 Всесоюзные летние школы "Метод функций Ляпунова и его приложения" (Иркутск, 1982 и 1985), Всесоюзная конференция "Теория адаптивных систем и ее приложения" (Ленинград, 1983), 2 Республиканская школа-семинар "Математическая теория систем и прикладные исследования" (Киев, 1984), 4, 5, 6 и 7 Всесоюзные школы-семинары " Непараметрические и робаг.твые методы статистики в кибернетике" (Томск, 1982 и 1987; Шушенское, 1985; Иркутск, 1990), 12 и 13 Всесоюзные пшолы-семинары по адаптивным системам (Могилев, 1984; Звенигород, 1986), 2 Симпозиум ИФАК по стохастическому управлению (Вильнюс, 1986), 12 Всесоюзная математическая школа по теории управления и исследованию операций (Ижевск, 1989), 11 Всесоюзное совещание по проблемам управления (Ташкент, 1989), Сешшар ИФАК по адаптивным системам и его приложениям (Тбилиси, 1989), Всесоюзная конференция "Применение статистических методов в производстве и управлении" (Пермь, 1990), Семинар института Эйлера "Нелинейныйи игровой синтез управления" (С.-Петербург, 1995), 2 и 3 Европейские конференции по управлению (Гронингев, Нидерланды, 1993; Рим, 1995), Азиатская конференция по управлению (Токио, 1994), симпозиум ИФАК по робастному синтезу управления (Рио-де-Жанейро, 1994), 33, 34 и 35 конференции IEEE по управлению и принятию решений (Флорида, 1994; Новый Орлеан, 1995; Кобе, 1996), 3 Международный семинар "Негладкие и разрывные задачи управления" (С.-Петербург, 1995), 1 и 2 Российско-шведские конференции по управлению (Линчелинг, 1992; С.-Петербург, 1995), Американская конференция по управлению (Сиаттл, 1995), Воронежская школа "Пон-трягинские чтения - 7" (Воронеж, 1996), 4 Международный семинар "Устойчивость и колебания нелинейных систем управления" (Москва, 1996), 3 Украинская конференция по автоматическому управлению (Севастополь, 1996), а также на семинарах Московского государственного университета, Института математики и механики УНЦ АН СССР (г. Свердловск), Института кибернетики (г. Киев), ЛО Математического института АН СССР (г. Ленинград), Ленинградского политехнического института, Института проблем управления (г. Москва), Московского института электронного машиностроения, университетов городов Лувд, Линчединг и Стокгольм (Швеция), и С.-Петербургского государственного университета.

Публикации. Результаты работы представлены в 52 публикациях.

Структура и объем диссертации. Диссертация состоит из введения, трех частей, разбитых в целом на 12 глав и 59 параграфов, заключения и списка литературы. Общий объем работы 482 страницы, список литературы содержит 240 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Основным объектом изучения в диссертации является линейное дифференциальное (или разностное) уравнение вида

ЧРМ«) = 6(РМ0 + С(РК0- О О,

где р — d/dt - оператор дифференцирования (соответственно, сдвига), а и А -полиномиальные матрицы, «а»-некоторые измеримые функции, называемые управлением и возмущением. Если фиксировать дополнительное уравнение

a(p)u(t) = P(p)y(t),

называемое уравнением регулятора, и если матрицы а{г) и a(z) - квадратные невырожденные, а начальные данные при t = 0 нулевые, то полученная система определяет линейное отображение W из некоторого множества функций V = {г(-)} в множество функций Y = {у(-)}-

Если V и Y - линейные нормированные пространства, то индуцированная норма отображения W может рассматриваться как показатель качества выбранного уравнения регулятора. Минимизация этой нормы по допустимым операторам а и 0 из заданного класса называется задачей синтеза минимаксного регулятора. В зависимости от выбранных норм и классов регуляторов различаются: теория ¿'-оптимального управления, если пространства V и Y снабжены топологией ¿°°(0, оо); теория Н^-оптимального управления, если V и Y снабжены топологией LJ(0, оо); линейно-квадратичная теория или теория 7i2-оптимального управления, если V состоит из линейных комбинаций обобщенных ¿-функций в нуле и их производных, а Y снабжено топологией L2(0, оо). В данной работе кроме упомянутых рассматриваются также задачи со смешанными нормами, с классами нелинейных отображений и с возмущениями в уравнении регулятора, а также с дополнительными ограничениями на класс регуляторов. В упомянутых трех теориях математический аппарат относится: к бесконечномерному выпуклому анализу для ^'-оптимизации; к теории аппроксимаций аналитическими функциями (задачи Неванлянны-Пика, Нехари и др.) для 7i°°- оптимизации; к численным методам минимизации в гильбертовых пространствах для ^-оптимизации.

Первая часть работы, включающая главы 1-5, посвящена теории i1 оптимального управления. Первый результат в этой области опубликован автором в 1984 г., затем повторен в статье М. А. Дахлеха и Дж.Пирсона в 1987 г., вызвавшей большое количество новых исследований и публикаций. Рассматривается скалярный объект управления в дискретном времени

a(<l)yt = b(q)ut + Vt, t = 1,2,...

где q - оператор сдвига назад, qxt = Xt-i, aab- фиксированные полиномы и все величины скалярные. При нулевых начальных данных и условии < 1 требуется минимизировать тах„maxi\yt\ в классе линейных уравнений регулятора вида o(g)u( = (9(q)yt, причем степени полиномов а и /? могут быть любыми, но a(0) f 0.

Эта задача была решена геометрически и сведена к преобразованию многогранников следующим образом. Пусть A(z) = b+(z)A_(z), где полином 6_(z) имеет все корни внутри, а полином b+(z) - вне единичного круга. Определим

последовательность yt уравнением b'_(q)i, = 0 при i > 0 с условием 70 = 1, у, = О при s < 0. Здесь b*_(z) = b_(z~l)zv - полином в обратных степенях, р = deg(b_) - степень i-(z). Фазовый вектор Г, = (71,... ,Jt-p+i)T удовлетворяет уравнению Г(+1 = ВГ(, в котором В - сопровождающая матрица полинома Ь_. Это уравнение устойчиво, и поэтому выпуклая симметричная оболочка К = co{±Ii} есть многогранник. Определим вектор L — (а(В))~1Го-

Теорема 1.1. Пусть луч {X~iL: А > 0} пересекает границу К в точке х 6 Rp, причем х = /¿Г', есть разложение х в выпуклую комбинацию вершин,

El, Ш =

Тогда минимальное значение функционала качества равно Ао, а оптимальный регулятор определяется полиномами a(z) = b+(z)/(z) с ß(z) = (/(z)a(z) — 1)/Ь_(г), причем последнее деление не имеет остатка, а

Основная идея решения состоит в преобразовании задачи управления к задаче выпуклой оптимизации в бесконечномерном линейном множестве передаточных функций замкнутой системы. Коразмерность втого множества в пространстве рациональных функций конечна, что позволило синтезировать аффективный алгоритм минимизации. Однако прямое обобщение на многомерный случай оказалось невозможным, так как коразмерность может быть бесконечной.

Следующим существенным шагом в развитии математического аппарата теории I1 -оптимального управления и в решении многомерных задач было применение метода динамического программирования. Задача управления в общем случае предварительно сводится к следующей: дапы п матричных полиномов а'(г),... ,an(z), а также полином с(г). Требуется среда всех решений (^'(г),... ,г"(г)) уравнения a1(z)i1(z) -f - • • 4 a"(z)x"(z) = c(z) найти то, которое минимизирует функционал

Я ОО Т1

■я*)=ЕЕ^нч=E^ik t=l ¡=0 i=l

где xk{z) = YZoxk,z\ xk = (г*)£o, 1 < k < n.

Минимальное значение J^ функционала J(-) зависит от коэффициентов полинома c(z). Эту зависимость обозначим S(с), где с - вектор коэффициентов с(г). Пусть 5лг(с) - минимальное значение того же функционала, в котором сумма заменена на ^Iq1- Усеченные функции Sn(-), N > 0, обрадуют последовательность, которая монотонна, сходится к функции S(-) и удовлетворяет уравнению динамического программирования. Геометрическая интерпретация одного шага алгоритма динамического программирования приводит к преобразованию многогранников.

Функция Sn(-) является нормой в пространстве коэффициентов c(z). Обозначим единичный шар этой нормы Qn и поляру к нему QaN. Предположим, что все полиномы a*(z) скалярные и не имеют общего корня. Пусть М - множество индексов для которых a'(Q) = aj ф О. Для таких индексов fc пара матриц (Ак,В) соответствует записи в пространстве состояний уравнения а¡¡(<7)2:, = О. По оставшимуся набору индексов аффективно определяются множества Р и G как пересечение нескольких полупространств.

Теорема 1.4. Последовательность множеств удовлетворяет, рекурсии кем

= я%п а, N>0, $ = {о}.

Множества С^^ - многогранники, не убывающие по включению. Поэтому они сходятся при №-»оок множеству по которому определяются оптимальные функции х1,...,х".

В §1.5 аналогичный подход реализован для систем в непрерывном времени а(р)у(г) = Ь(р>(<-т) + с(р)«(0,

¿(рМО = е(р)у(^+/(р)т(1),

где у(<) - выход объекта, и(<) - управление, - возмущение, г(£) - измеряемая величина, ха(1) - шум измерителя, все величины скалярные, р = ¿/<Й - оператор дифференцирования, о, Ь, с, е и / - полиномы, число т - фиксированное запаздывание в управлении. Предполагается, что полиномы Ь яd гурвицевы, а измеримые функции о и ш равномерно ограничены, |г;(<)| < С„, ¡1е(<)1 фик-

сированными числами Си и Ст. Требуется найти линейный неупреждающий оператор в пространстве обобщенных функций, для которого уравнение регулятора «(•) = Н1егг(-) определяет отображение (у,ч>) -* у, при котором достигает минимума максимальная по и и и> ¿""-норма функции у(Ь) при нулевых начальных данных.

Введем обозначения: А = а/, В = се, С = с/. Предположим, что пара (Л, В) взаимно проста и что степень т полинома А больше степеней В и С. Тогда (лемма. 1.8) минимум функционала качества управления J = б"ир„,ш |]!/1к°°(о,о<-.) равен минимуму функции Сг||хо|!у(о,т)+С«||х11ьЧо,«>)+С,"'11^1и,(о.<») по всем парам функций (х,Ф)> удовлетворяющим уравнению А(р)х(1) — В(р)^(0 = Со(р)^(0-Здесь функция Хо(0 определяется уравнением Л(р)хо(0 = ^(0 - еди-

ничный заряд в нуле, Со - полином степени не выше т — 1, вектор коэффициентов которого Со связан с вектором коэффициентов С полинома С условием Со —еЕлТС. Матрица- сопровождающая для полинома А, так что пара (А, е) реализует в пространстве состояний уравнение Л(р)г(<) = 0, т.е. Х(1) = ^Х^), х(г) = с'Х{1), и е = (0,...,0,1)". Пусть в есть вектор коэффициентов полинома В и Ат - старший коэффициент полинома А.

Для произвольного вектора 9=(<?,)^о1 и числа Т>0 обозначим через Т) минимум функционала С„||х||ь<(о,оо) + при ограничении А(р)хЦ) -

В(р)ф(1) = ф,г(<)+...+51г„_,гт-1(<) и х(0=0, ^(С)=0 при 1>Т. Это норма в Я™. Обозначим единичный шар этой нормы С}(Т), а поляру к нему - 0°{Т).

Теорема 1.8. Множество (}а(Т) есть облает* достижимости дифференциального включения

Х(з) 6 ГАХ(В) + Л-^-а, С»]е при фазовых ограничениях < С„ Ул € [0, Т]. □

Множества (¡°(Т) не расширяются с увеличением Т, и предельное множество (?°(оо) определяет минимум функционала качества в исходной задаче управления. Доказана теорема 1.9 о существовании седловой точки в обобщенной задаче оптимизации в пространстве мер (х,Ф)■ При помощи этой теоремы из

условия трансверсальности оптимальный оператор уравнения регулятора непосредственно вычисляется по крайней точке замыкания области достижимости С?°(оо), на которой максимизируется скалярное произведение с вектором

Со.

Для частных случаев множество (¡)°(оо) явно вычисляется в разделах 1.5.7 и 1.5.8. Оптимальный регулятор определяется уравнением интегро-дифференциального типа. В разделе 1.5.7 для модели робота-велосипедиста с запаздыванием в управлении и ограниченными возмущениями в измерении и в объекте явно выписано оптимальное значение функционала качества и оптимальный регулятор. В разделе 1.5.8 представлено полное решение задачи для системы второго порядка, охватывающей модель управления активной подвеской автомобиля.

Глава 2 посвящена моделированию возмущений. В ней построена теория минимаксного аналога стационарных случайных процессов. Вопрос о том, как обобщить стандартный нерегулярный процесс (единичный шар в пространстве £°°) на последовательности с зависимыми значениями, был впервые поставлен В.А.Якубовичем в связи с решением простейших задач оптимальной стабилизации минимально-фазового объекта. Оказалось, что линейные фильтры описывают класс процессов, не замкнутый относительно суммирования множеств. В глазе 2 предлагается другая модель, обладающая теми же важными свойствами, что и случайные стационарные процессы: определение через свойства своих элементов, а не аппроксимаций; линейность; возможность конечно-параметрических аппроксимаций; формализация понятия зависимых во времени значений.

Был выделен класс множеств "с забыванием информации", названных обновляющимися процессами, которые обладают всеми указанными свойствами. В частности, указаны два семейства конечнопараметрических аппроксимаций (теоремы 2.19 и 2.20). Одно из них, задаваемое выпуклыми разностными включениями или локальными ограничениями, особенно существенно, поскольку может быть построено по текущим данным наблюдения в реальном времени. Оно подробно изучено в главе 2. В частности, найдено следующее необходимое и достаточное условие обновляемости скалярного процесса, построенного по произвольному набору локальных ограничений: на диагонали порождающего множества должна быть хотя бы одна точка его собственной внутренности (теорема 2.11). Математические задачи главы 2 относятся к классификации выпуклых подмножеств пространства

Содержание Главы 3 можно рассматривать как обобщение теории ^-оптимального управления и распространение ее на модели, в которых возмущение принадлежит не обязательно нерегулярному, а произвольному обновляющемуся процессу. Математический аппарат этой главы связан с теорией меры и бесконечномерным выпуклым анализом. Методы теории двойственности, примененные А.В.Куржанским для синтеза оптимальных управлений с терминальными и интегральными функционалами качества, распространяются на бесконечномерные множества функций с Биргстит-нормой на бесконечном промежутке времени.

В теореме 3.1 доказано существование седловой точки. В теоремах 3.2 и 3.3 минимаксная задача управления сведена к вычислению одного значения опорной функции в множестве, размерность которого определяется исходными размерностями системы. Уравнение динамического программирования формули-

руется в геометрических терминах (лемма 3.9). В теореме 3.4 доказывается близость верхних и нижних аппроксимаций предельного множества, по которому восстанавливается оптимальная передаточная функция системы управления в соответствии с теоремой 3.3.

Следующий §3.6 посвящен геометрическим процедурам расчета выпуклых множеств в соответствии с уравнением динамического программирования. Окончательный алгоритм сформулировал в теореме 3.5. Для кусочно-линейной задачи, рассмотренной в §3.7, выпуклые множества становятся многогранниками, и в теореме 3.6 определен способ пересчета их вершин.

Глава 4 посвящена синтезу нелинейных оптимальных регуляторов для скалярной задачи минимаксной вариации выходной переменной. Основной вопрос состоит в следующем: при каких условиях линейный динамический регулятор обеспечивает не худшее значение функционала качества, чем любой нелинейный статический регулятор?

Лемма 4.1 утверждает, что класс статических нелинейных регуляторов (т.е. позиционных регуляторов) является не менее узким в смысле класса множеств достижимости и функционала качества, чем класс динамических линейных регуляторов. В §4.2 доказано, что в случае сильной неминимальной фазовости объекта управления линейный регулятор оптимален в классе всех неупрежда-ющих обратных связей.

По теореме 4.1 оптимальный статический нелинейный регулятор всегда существует. Затем в §4.3 описывается вспомогательная задача минимизации функции на бинарном графе при локальных ограничениях. Основным результатом является теорема 4.2, согласно которой оптимальность линейного регулятора равносильна существованию решения вспомогательной задачи поиска функции на графе при линейных ограничениях.

Главу 5 можно рассматривать как вспомогательную по отношению к предыдущим, и в монографии автора, объединяющей главы 1-5, она составляет приложение. В ней собраны разнообразные нетривиальные алгебраические утверждения из матричного полиномиального исчисления, применяемые в спектральной теории синтеза регуляторов.

В §5.1 анализируются диофантовы уравнения над кольцами функций. В теоремах 5.1 и 5.2 сформулированы различные необходимые и достаточные условия существования решений этих уравнений.

В §5.2 вводится новое понятие управляемости пары полиномиальных матриц, обобщающее понятие управляемой пары постоянных матриц, введенное Р. Калманом. Для дискретного времени это обобщение нетривиально, так как фазовый вектор динамического объекта можно определять по-разному при сохранении минимальности реализации. Однако некоторые реализации оказываются управляемыми и наблюдаемыми, а другие нет. Приведены примеры.

В теоремах 5.3 и 5.4 свойства управляемости и наблюдаемости связываются с существованием решений диофантовых уравнений. Некоторые специальные критерии оказываются необходимыми и достаточными условиями правильности работы вычислительных процедур синтеза регуляторов из главы 3.

Стандартная параметризация класса всех передаточных функций устойчивых замкнутых систем при произвольных линейных регуляторах сформулирована в §5.3. Впервые она была введена в работах В.В.Ларина и соавторов и независимо в работах Д.С.Юла и В.Н.Фомина. В теореме 5.5 из §5.3 дано си-

стематическое изложение теории параметризации над кольцом рациональных аналитических функций в некоторой области вместо обычного кольца полиномов.

В §5.4 даны необходимые и достаточные условия существования решения обратной задачи поиска регуляторов при заданной передаточной функции замкнутой системы при наличии дополнительных ограничений на порядок замкнутой системы.

Часть 2, объединяющая главы 6-9, посвящена синтезу оптимальных систем, в которых возмущение и выход измеряются в норме пространства 1_2(0, оо). Это линейно-квадратичная теория и ее минимаксное обобщение - теория оптимального управления.

Глава 6 посвящена спектральным методам синтеза линейных регуляторов с квадратичным критерием качества. При отсутствии возмущений или при стационарном случайном возмущении эта задача относится к линейно-квадратичной стохастической теории управления. В игровой постановке при произвольном стационарном возмущении с ограниченной дисперсией получается задача И^-оптимального управления.

В теореме 6.1 представлены явные формулы для передаточной функции оптимального регулятора в линейно-квадратичной задаче через матричные полиномы уравнений объекта и измерения. Они иногда удобнее в расчетах, чей алгоритмы синтеза, промежуточные данные в которых трудно интерпретировать.

При помощи полученных формул в §6.2 анализируются свойства грубости и реализуемости оптимальных регуляторов, введенные В.А.Якубовичем. Явные формулы для передаточной функции оптимального регулятора при наличии линейного слагаемого в функционале качества и при совокупном уравнении для объекта и измерения даны в теореме 6.2. В теореме 6.3 определена минимизирующая последовательность строго реализуемых регуляторов и дана явная формула приращения функционала качества на этой последовательности. Для двух частных случаев - регулятора в цепи обратной связи и регулятора как корректирующего звена - явно выписаны критерии грубости и реализуемости оптимального регулятора, решение линейно-квадратичной задачи, формула для минимума функционала качества и минимизирующая последовательность реализуемых регуляторов.

В §6.3 сформулирован алгоритм решения задачи М°°-оптимального управления спектральным методом, в целом повторяющий первый метод решения этой задачи, изложенный в монографии В.Френсиса. Новой является явная формула для абсолютного минимума квадратичного функционала качества (лемма 6.2). Стандартная задача ^"-оптимального управления рассмотрена в §6.4 как игровая. В леммах 6.3 и 6.4 устанавливаются свойства седловой точки. В лемме 6.5 приведена явная формула для передаточной функции оптимального регулятора для скалярного случая. Далее изложен вычислительный алгоритм. Явно выписаны условия реализуемости оптимального регулятора и седловая точка.

Глава 7 содержит решение игровых задач управления в непрерывном времени, связанных с постановкой задачи Н°°-отямального управления в пространстве состояний для конечномерного стационарного линейного объекта. Объект управления задается уравнением х = Ах 4- Ви + Ст с постоянными

матрицами А, В, С.

В §7.1 анализируется следующая стандартная задача Н°°-оптнмального управления для случая полной информации: допустимые регуляторы определяются уравнениями а(<//Л)и(4) = (¡(Л / ¿£)х(1) с произвольными полиномиальными матрицами а(-), /?(■), такими, что матрица а(-) невырождена, а замкнутая система устойчива; требуется минимизировать норму отображения ]¥ : ю —> г — ((Ох)',и)" из 1_2(0,оо) в 1.2(0,оо) при условии 1(0) = 0. В задаче субоптимального управления требуется при фиксированном уровне 7 > 0 дать параметрическое описание множества всех допустимых регуляторов, обеспечивающих неравенство Л — < 7.

В соответствии с известными результатами К.Гловера и Дж.Дойла для существования допустимого регулятора, при котором J < 1, необходимо и достаточно, чтобы были выполнены три условия: 1) все собственные числа матрицы Гамильтона

тт _ ( А Т7СС~-ВВ' \ —А" )

не находятся на мнимой оси, 2) верхняя половина базиса устойчивого подпространства (Ху^, Х^)* матрицы Гамильтона Щ невырождена, т.е. скЦХ^) ф 0, 3) стабилизирующее решение X, = Х2-,Х^ = Шс(Л^) уравнения Лурье-Риккати, определяемого матрицей Щ, неотрицательно в смысле квадратичных форм. При выполнении этих условий регулятор и — —В'Х^х является допустимым и в замкнутой системе 3 < 7.

Точная нижняя грань 7^ чисел 7, для которых выполнены все три условия, равна достижимому минимуму нормы отображения IV. Приведенные выше три условия не могут быть выполнены при 7 = 7т,-п, так кал неравенство } < 7т;п нарушается для любого регулятора. Легко проверить, что при 7 = 7тш нарушается либо первое, либо второе условие. В §7.1 доказана эквивалентность следующих условий: строгая реализуемость оптимального регулятора (имеющая прикладное значение), вырожденность предельного уравнения Лурье-Риккати (свойство известного матричного уравнения:) и свойство оптимальной передаточной функции замкнутой системы быть внутренней функцией класса Харди в правой полуплоскости (относящееся к теории равномерной аппроксимации аналитическими функциями и к спектральному методу в теории управления).

Теорема 7.1. Следующие утверждения равносильны:

1. Оптимальный регулятор существует и строго реализуем (т.е. функция а(х)~1Р(х) ограничена при х -+ оо).

2. (Ы^!-,) не стремится к нулю при 7 —» 7^ +. 0.

3. Оптимальный регулятор существует и передаточная функция замкнутой системы \Уг/т от и) к г не имеет постоянной нормы на мнимой оси, ¡И^д^тш)! 0 7^ при

Если одно из этих условий не выполнено, то не существует решения уравнения Лурье-Риккати, ассоциированного с матрицей Н-,ы„, и оптимальный регулятор не может быть записан в форме и ~ Кх. В §7.2 приведена явная формула для оптимального регулятора в этом случае, содержащая решение сопряженного уравнения Лурье-Риккати.

В §7.3 и §7.4 анализируется игровая линейно-квадратичная задача для того же объекта управления с ненулевым начальным данным 1(0) — х0. В §7.3 класс стратегий игрока ш состоит из произвольных функций из шара Ц'е радиуса

8 в пространстве 1>г(0,оо). Множество К — {[/} стратегий игрока, выбирающего и(£), состоит из неупреждающих (и, возможно, нелинейных) отображений (х(-), т(-)) -+ и(-), обладающих следующим свойством: для любой функции ы 6 Ь2(0, оо) замкнутая система имеет единственное решение х(4), и(4) и обе вти функции х,и квадратично суммируемы ва (0, оо). При заданном квадратичном функционале общего вида

_Г(г(-)ги(-)>= [ = + 2х'8и + и Ни,

./О

требуется решить максиминную и минимаксную задачи:

3 = зир ш£^(1(-), «(•))> 3 = М вир Т(х('),«(•))■

<и чей и<34

Будем предполагать, что выполнено частотное условие: Е(хи,й) > 0 при всех и 6 К, хш 6 С", й е С, связанных соотношением кох„ = Ахш + Вй. Нестрогое частотное условие необходимо для того, чтобы задача имела смысл, т.е. 3 ф —<х. Пограничный, случай, выполнения лишь нестрогого частотного неравенства обычно ведет к сингулярным оптимальным регуляторам и в данной работе не рассматривается:

Определим для каждого А > 0 матрицу Гамильтона

и т _ ( А - ВВг^Б- А-1СС* - ВВг*В'\

Стабилизирующее решение соответствующего уравнения Лурье-Риюсати

А'Х(А) + А'(А)А + Х-1Х{Х)СС'Х(Х} - (Х(А)В + 5)Я-1(5* + В'Х(А)) + <5=0

будем обозначать А"(А) — Шс(Ясо(А)). При А = оо матрицы Я00(оо) и Х(оо) формально определены (они соответствуют стандартной линейно-квадратичной задаче оптимального управления).

Теорема 7.2. Оптимальные значения функционала качества в минимаксной и махсиминноЧ задачах равны и выражаются следующим образом:

З_ = 3 =3°= аир щ£ /°°Г(х(г)ги(фЛ= Ы (Аг+а^Х(А)г0),

где Х(Х) = Шс(Я00(А)), Л° = Щ{А > 0 : ЭЯ"(А) > Х(оо)}.

Пуст> нижняя грань достигается при А = А0 > Л°. Тогда задача имеет седловую точку, оптимальное управление определяется уравнением

«(*) = -вг\в*х{ А0) + 5*)х(г),

а наихудшее возмущение гв(*) иа оптимальной траектории удовлетворяет уравнению

и>(г) = (\°)~гС"Х(\°)х{1).

а

Доказательство этой теоремы включает ряд новых утверждений из теории линейных стационарных систем оптимального управления в пространстве состояний. Сюда, в частности, относятся: фазовый портрет дифференциального

уравнения Риккати, ассоциированного с задачей внутренней минимизации (теорема 7.5), существование решений уравнения Лурье-Риккати в регулярном случае (теорема 7.6), решение задачи внутренней минимизации при разных множителях Лагранжа (лемма 7.7).

В §7.4 рассмотрена дифференциальная игра в позиционных стратегиях. Позицией является пара (х,8), в которой х - текущий вектор состояний объекта управления, a S- верхняя граница на квадрат нормы возмущения tu. Стратегия w{x, 8) - чистая позиционная, стратегия управления и(х, 8, ш) должна обеспечивать существование и единственность решения замкнутой системы. Основным утверждением является теорема 7.8 о цене игры и явных формулах для оптимальных стратегий. Предполагается, что Q > 0, 5 = О, R = 7, пара (A,Q) наблюдаема, пара (А, В) стабилизируема, пара (А, {В, С)) управляема и пара (Л — ВВ'Ы, НС) наблюдаема, где Н = Х(оо) - решение уравнения Лурье-Риккати для задачи без возмущений (с w(t) = 0).

Для каждого А > Ло определим матрицу У(А) как антистабилизирующее решение уравнения Лурье-Риккати

ЛУ(А) + У(Х)Л" + Y(\)QY(\) -(- А-'СС* - В В' = 0,

которое существует и единственно. При А=Ло антистабилизирующее решение У(Ао) существует и единственно, если матрица Гамильтона Нсх>(Л0) не имеет собственных чисел на мнимой оси. Если же собственные числа //»(Ло) попадают на мнимую ось, то антистабилизирующего решения не существует. Однако одно из решений последнего уравнения Лурье-Риккати при А — До есть предел решений У(А) при А —» Ло- Его и обозначим У(Ло), при этом матрица А" + QY(Aо) имеет собственные числа справа от мнимой оси и на мнимой оси. Очевидно, Л"(А) = У(А)-1 при А > Ло- Если матрица У(Ло) вырождена, то У(Ло)+ обозначает пссвдообратную к ней.

Пусть i € R" и 8 > 0. Доказано (теорема 7.7), что функция F(А) = íA+x*A'(A)a: имеет ровно один минимум на промежутке [Ло,оо]. Он назван оптимальным множителем Лагранжа A(x,S).

При А = Ло либо матрица Гамильтона Дх,(Ло) имеет собственные числа на мнимой оси, либо матрица У(Л0) вырождена, либо верно и то, и другое. Рассмотрим два основных случая:

A). Матрица Гамильтона НЖ(Ао) не имеет собственных чисел на мнимой оси, матрица У(Ло) вырождена и имеет ранг п — 1, где я - размерность х.

B). Матрица Гамильтона имеет собственные числа на мнимой оси и матрица У(Ло) невырождена.

Теорема 7.8. Пусть выполнены условия А или В. Тогда:

1. В поставленной игровой задаче управления в любой начальной позиции (x,S), где i = x(Q) € R", <5 > |М|£г(0оо), существует цена игры, которая равна

J(i,ó) =х*У(А)+г +А6,

где А = A(i,í) - оптимальный множитель Лагранжа.

2. Оптимальная стратегия игрока, выбирающего u(t), всегда существует. Она может быть определена следующим уравнением регулятора:

и = -В'У+г - U(w - r'CT+i),

где А = А(х,б) uY — К(А) соответствуют позиции (x,S), aU — U(x,6) - произвольная матричная функция, литиицева по обоим аргументам и удовлетворяющая условиям: ||{/||2 < А и если матрица Y вырождена, то VxBU = V±C, где Vi_ - проектор на нуль-пространство матрицы Y. Такая матричная функция U(x,6) существует.

S. Оптимальная стратегия -игрока, выбирающего w по позиции (x,S), существует в случае А и не существует в случае В. В случае А она определяется уравнением w = А-1 С'д, где g = g(x,6) g R" удовлетворяет условиям: Yg — х и g*Gg а

Оптимальная стратегия игрока ti разрывна, если матрица У(Ло) вырождена. Разрыв происходит на исключительном множестве позиций 2>, для которых А(а;, 6) = Ло. При фиксированном 6 > 0 это некоторый плоский эллипсоид в пространстве {г}. Однако, если позиция (г(4о), ¿(fo)) попадает в V в некоторый момент to, то при оптимальной стратегии игрока и позиция (z(í), S(t)) остается в 2> при t>io независимо от стратегии игрока из.

В случае А оптимальная стратегия игрока w неединственна на множестве 23. Пусть М. - нуль-пространство матрицы Y = У(Ло). Если тройка (х,д,6) удовлетворяет условиям g*G(Ло)<? = S и х = Yg, то в позиции (x,¿) оптимальная стратегия, указанная в утверждении 3 теоремы 7.8, имеет вид w = Aq1 С'д. Поэтому при фиксированных х, Ь в качестве д можно выбрать любой вектор из пересечения множества У+х + М и множества уровня S квадратичной функции g*G(A0)g в R". Если множество М одномерно, то имеются только 2 оптимальные стратегии, так как упомянутое пересечение состоит из двух точек, и множество оптимальных стратегий несвязно.

В главе 8 решается задача минимизации константы Липшица отображения от возмущения к выходной переменной в норме пространства Ljóc функций, квадратично суммируемых ва ограниченных интервалах. Объект управления задается уравнениями

(х - Ах + В^ + Я2и, г(0) = хо, q = С\Х, у = C2x + ri,

где A, Bi,B2, С\,С%- матрицы, пара (A, B-¡) стабилизируема, пара (Cj, А) детектируема. Фиксируем некоторые коэффициенты а, /3 > 0 и введем совокупные векторы возмущений w = ((T,^i)T)T и выходов г = (qT,cmr)T.

Введем обозначения. Сужение функции s : (0, оо) -+ R" на промежуток (0,í) обозначим st. Отображение F : LJ^. —> L{j,c назовем неупреждающим, если из (si)t = (s2)t следует (F(si))¡ ~ (F(s2))t для любых sj,s2 6 L^. и i > 0. Пусть S0 £ L^.. Множество лшшшцевых отображений Wl(So) определим как множество всех неупреждающих отображений F из S0 в Lj^, сужения которых Ff на L2(0, i) удовлетворяют условию Липшица в норме L2(0, t) при каждом t > 0. Константу Липшица обозначим Ct(F). Пространство Н есть множество всех отображений F £ Т1ь{Ц0С), для которых константы Липшица £¡(F) равномерно ограничены по i. Определим на Н полунорму

. |[F|[7í = sup{A(F),í>0}, FemdD-

Пусть So С L^, и F е Hi{Sa). Уравнение и = F(y) будем называть допустимой обратной связью (допустимым регулятором), если при всех ta 6 LJ,,. выполнены

условия: замкнутая система имеет решение, у (Е 5о и отображения ио —» г и хи —> у, обозначаемые ТГ*» и И^, соответственно, принадлежат И. При этих условиях решение единственно (лемма 8.7).

Задача минимизации константы Липшица состоит в том, чтобы найти допустимый регулятор, при котором 1У*м, 6 Ни константа Липшица ЦИ^Ци минимальна или не превосходит наперед заданного уровня. Далее множество отображений Р, для которых и = Р(у) - допустимый регулятор, обозначается V, а. множества соответствующих отображений И^ с нормой в Н меньше 7 обозначается И^). При линейном отображении .Р данная задача эквивалентна Н°°-оптимизации, а есть норма передаточной функции отображения Ц^ы в пространстве Харди Нм.

Решение X уравнения Лурье-Риккати АТХ + ХА + ХКХ + <3=0 называется стабилизирующим, если матрица А + ИХ гурвицева. Стабилизирующее решение обозначим X = Шс(Л, Д, Теорема 8.1. Пусть 7 > 0. Тогда

1. Множество И^) непусто тогда и только тогда, когда выполнены, три условия: 1)Хао = Шс(А^ВгВ^-а-^В^С^С!) > 0, 2)У<Х, = Ш^АТ,-Г-2С^С1-РС?СЬВ1В?) > 0 « 3) р(ХМ < 72.

2. Пусть И*(7) непусто. Тогда при любом ф е Л если \\Ql\n < 7/(аР)> то следующий регулятор допустим:

где Ди(4) = Ц[г(-)](<), функции г(4) и е(1) определяются наблюдателем:

¿(4) = (А + ч^В^Х^Щ) + В2и(г) + Ь^еЦ) + Моо Ди(<), ¿(0) = х0, ¿(0 = у{*)-С2Щ,

при ¿то = р-^УОЯ, М„о = а-^г^Вг, Я» = (1 - 7"2К00Х00)-1.

Такие регуляторы и только они в классе допустимых обратных связей удовлетворяют условию ЦИ^Цн < 7. а

Формулировка почти не отличается от соответствующей теоремы для линейных систем из статьи Дойла, Гловера, Френсиса и Каргонекера [ЕЕЕЕ Тгапз. АС, 1989], только произвольный параметр (} выбирается из единичного шара другого банаховою пространства. Общий план доказательства, состоящий в теореме о малом коэффициенте усиления, теореме разделения и теореме двойственности взят из той же статьи, но математический аппарат существенно отличается. В доказательстве теоремы 8.2 о малом коэффициенте усиления основную трудность представляет существование решений, которое доказано сведением к теореме о сжимающем отображении. Важная часть теоремы 8.3 о разделении оценивания и управления состоит в сюрьективности промежуточных нелинейных отображений, очевидной в линейном случае. Теорема 8.4 о двойственности оценивания и управления доказана непосредственным вычислением седловой точки и применением теоремы о минимаксе. Для линейных систем она очевидна ввиду существования прямой алгебраической эквивалентности задач оценивания и управления.

В §8.5 поставлены и решены задачи синтеза линейных 'К00-субоптимальных регуляторов при дополнительных квадратичных ограничениях (теорема 8.5). Решение основано на приеме, известном как ^-процедура в системах автоматического управления. Особенно существенным для прикладных задач является синтез оптимального регулятора при раздельных ограничениях на энергию

возмущения в объекте и шума в измерителе (теорема 8.6), так как вти системы обычно функционируют независимо. В §8.7 приводится краткая историческая справка по возникновению и развитию в 80-х годах теории Н°°-оптимального управления.

В главе 9 разрабатываются полиномиальные методы синтеза 7^°°-оптималь-ного регулятора для линейного объекта

а(рМ0 = хрМ0 + «0>М*).

где р = ¿¡а - оператор дифференцирования, а(г), Ь(г), с(г) - матричные полиномы. Предполагается, что начальные условия нулевые, что объект стабилизируем, т.е. пара (а, Ь) несократима слева в правой замкнутой полуплоскости, и что ранг с(г) максимален на мнимой оси. Требуется найти порядок и матричные коэффициенты линейного уравнения а((//Л)и(<) = ^{¿¡¿С)у^), определяющего регулятор, при котором в замкнутой системе

ПуЦГЯт + К')!2 - Ч2К0!2)Л < о

Ja

для любой ненулевой функции и 6 1_2(0, оо). Здесь матрица ф и число 7 фиксированы.

Начиная с 80-х годов разрабатывались различные алгоритмы решения данной стандартной задачи оптимального управления. Сюда относится метод сведения к задаче Нехари (Сафонов, Френсис), алгебраические уравнения Риккати (Дойл, Гловер), спектральный метод неущербной факторизации (Ки-мура), полиномиальный подход (Квакернаак). Полиномиальные и спектральные методы предпочтительны для специалиста в предметной области, так как дают ему возможность интерпретировать промежуточные данные вычислений и корректировать постановку задачи. Это, в частности, масштабирование или введение частотно-зависимых множителей для увязывания разнородных ограничений в нескольких спектральных полосах, например, в области низких частот, высоких частот и в районе частоты среза- Даже небольшое изменение степеней числителя и знаменателя передаточной функции, отражающее особенности в некоторой спектральной полосе, заметно изменяет размерности матриц в пространстве состояний, и разработчик получает совершенно новые по виду результаты вычислений, которые трудно сравнить с первоначальными. Этот недостаток канонических уравнений первого порядка отсутствует в спектральном решении задачи. Полиномиальный подход связывает алгебраически метод пространства состояний и спектральные алгоритмы расчета параметров уравнения регулятора.

§9.1 основные идеи полиномиального подхода Квакернаака Мейнсмы применяются для расчета левосторонней факторизации передаточной функции регулятора, т.е. полиномов а(г) и /?(г). При этом метод доказательства существенно отличается от примененного в теореме Квакернаака-Мейнсмы для правосторонней факторизации.

В §9.2 введены новые понятия: полиномиальное уравнение Риккати и ц-факторизация полиномиальной матрицы. Основным утверждением является теорема 9.6, связывающая эти понятия с уравнением Лурье-Риккати, ассоциированным с задачей И°°-оптимального управления и с наиболее распространенным алгоритмом матричной полиномиальной факторизации, состоящим в

последовательном сокращении множителей. Дадим соответствующие определения.

Введем обозначение: если F(z) - матричная функция, то функция F" определяется равенством F'(z) = F(—z)T. Пусть Щг) = R*(z) — полиномиальная матрица размерности mxm с вещественными коэффициентами, р = -

некоторый вектор неотрицательных чисел. Полиномиальная квадратная матрица П(г) будет называться /j-факторизующим множителем для R(z), если существует такая постоянная матрица Со, что

Д(*)=П*(*)СоП(*),

матрица Щг) имеет постоянный ранг m в замкнутой правой полуплоскости {Re(z)>0} и при всех к=1,..., m степень fc-ro столбца П(г) не превосходит /х*. Полиномиальным уравнением Риккати называется алгебраическое уравнение

V{z)a'{z) + a(z)V"(z) - V(z)QV'(z) + i(z)b'(z) - j-2c(z)c'(z) = 0

относительно полиномиальной матрицы V(z). Стабилизирующим называется такое решение V(z), что матрица a(z)~lV(z) правильная и матричный полином a(z) — V(z)Q не имеет нулей при Re(z) < 0.

Уравнение объекта управления можно также записать в виде х = Ах + Ви + Cv,y = етх. Назовем это представление (А, В, С, е)-реализацией тройки (а, Ъ, с) в пространстве состояний. Реализация называется минимальной, если размерность вектора х минимальна. Свяжем с такой реализацией матрицу Гамильтона

„{ Л 1-'ССт-ВВт\ \ —eQeT -Ат )

размерности 2N. Если Я не имеет собственных чисел на мнимой оси, то существует инвариантное подпространство размерности N, соответствующее собственным числам в левой полуплоскости. Его базис обозначим (Х^, Xf)T- Как известно, если матрица Хг невырождена, то матрица Y = Х\Х^Х является ан-тистабилизирующим решением уравнением Лурье-Риккати

AY + YAT +■ 7-2СС,т - ВВТ + YeQeTY = О,

которое которое будем называть сопряженным уравнением.

Наиболее эффективной процедурой полиномиальной матричной факторизации при ограничении на степени считается алгоритм последовательного сокращения множителей, предложенный М. Дэвисом для спектральной факторизации, усовершенствованный Ф. Каллиером, дополнившим его контролем за степенями сомножителей, и примененный X. Квакернааком для факторизации полиномиальных матриц с собственными числами различных знаков. Этот алгоритм описан в разделе 9.2.2. Он имеет несколько свободных параметров, и его свойства сходимости были ранее не известны. Исчерпывающая характеристика этого алгоритма дается в следующей теореме.

Теорема 9.6 (здесь сформулирована для частного случая невырожденной матрицы Q и ненулевых компонент вектора fi). Пусть рациональные функции a(z)-1b(z) « e(z)-1c(z) правильные, вектор ц = (/ijt)îUi состоит из степеней строк матрицы a(z) и матрица старших коэффициентов по строкам невырождена. Пусть матрица Q невырождена и рь ф О при всех к. Определим матричный полином

Щг) = a(z)Q-1a'(z) + ¿<z)6*(z) - 7"2c(z)c*(z).

Тогда следующие утверждения равносильны:

1. Ее существует стабилизирующего решения полиномиального уравнения Риккати

V(z)QV{z) - a(z)V'(z) - V(z)a\z) - b(z)b'(z) + -y-2c(z)c'{z) = 0.

S. He существует ¡¡-факторизации -матричного полинома R(z).

S. Либо R(z) имеет нули на мнимой оси, либо существует такой векторный полином /(г) = (fb(z))%-i размерности п, что deg(/*(г)) < Иk пРи 1 < к < п и матричная рациональная функция Д(г)_1/(г) не имеет полюсов в правой полуплоскости.

Для некоторой минимальной реализации (А,В,С,е) тройки (а,Ь,с) в пространстве состояний либо Н имеет собственные числа на мнимой оси, либо с стабилизирующем базисе матрицы, Гамильтона Л матрица Хч выро-

ждена.

5. Для любой минимальной реализации (А, В, С, е) тройки (а, Ь, с) в пространстве состояний либо Н имеет собственные числа на мнимой оси, либо в стабилизирующем базисе (Х[, Х£)Т матрицы Гамильтона Н матрица вырождена.

6. Алгоритм последовательного сокращения множителей для ¡i-факториза-ции матрицы R(z) обнаруживает сингулярный случай при любом выборе его свободных параметров, о

Доказано также, что решения уравнений Риккати и результат /¿-факторизации алгебраически связаны. А именно, П(г) = а(г) — V(z)Q - факторизующий множитель по лемма 9.1; V(z) = ¿(г)Уе - стабилизирующее решение полиномиального уравнения Риккати, где У - решение сопряженного уравнения Лурье-Риккати при некоторой минимальной реализации (А, В, С, е) в пространстве состояний, a £(z) — a(z)eT(zI — Л)-1 - полиномиальная матрица по леммам 9.5 и 9.11; и наоборот, по лемме 9.12

Г^/^ОЩФИс D=diag{(^

где h{z) = X'1 LT(z~1)(V(z),a(z), b(z)tc(z)), операция [•]_ означает взятие дробной (правильной) части рациональной функции, операция [-]о выбирает свободный член квазиполинома, A ={LT(i~1)i(^3]o.

Для задач 7^°°-оптимального управления с вырожденной матрицей Q введено вспомогательное понятие обобщенной /»-факторизации и в теореме 9.5 указан алгебраический способ сведения обобщенной ¡i-факторизации к обычной.

Известно, что уравнение регулятора, решающего поставленную задачу субоптимального управления при фиксированном уровне 7, записывается в виде и = —Кх, где х - вектор состояний объекта и множитель К удовлетворяет уравнению KY = В. Подстановка вместо Y алгебраического выражения через матричные полиномы У(г), a(z), b(z), c(z) приводит уравнение к искомому виду a(d/dt)u(t) — f}(djdt)y(t). В более общей форме это решение представлено в §9.3.

В 59.4 рассматриваются задачи с несколькими квадратичными ограничениями, и теорема 9.9 сводит их к стандартной задаче управления при помощи 5-процедуры. В §9.5 изложено решение задачи If- оптимального управления для скалярного объекта управления

a{d/di)y( 1) = b{d/dt)u{t - т) -f c(d/di)u(i), 1 > О,

в непрерывном времени и с чистым запаздыванием по управлению г > 0. Полиномы Ь(г) и с(г) гу-рвицевы. Требуется минимизировать норму 3 = отображения : и(-) —+ !/(-), индуцированную пространствами 1-2(0, оо). Допустимыми стратегиями будем считать линейные неупреждающие отображения I/ из 1_2(0,оо)х1.3(0,оо) в множество обобщенных функций, и(-) = и(у(■),"("))> п1т которых замкнутая система имеет решение .V 6 Ь2(0, оо) при любых v 6 1_2(0, оо) и асимптотически устойчива.

Поскольку фазовый вектор бесконечномерный, то невозможно использовать непосредственно методы уравнений Лурье-Риккати. В разделе 9.5.1 и теореме 9.10 дано решение задачи методом операторов Ганкеля.

Теорема9.10. Минимальное значение функционала качества 3 равно максимальному значению ¡7|, для которого существует такой полином .з(л) степени меньше степени а(г), что все корни полинома 71а(г)а(~г) — с(г)с(—г) являются нулями функции е~"с(—г)з{2)+-1а{г)з(—г). Передаточная функция оптимального регулятора, равна

1е-"д(-г)ЦгУ 9 <?\а[* - |е|» '

а

Для синтеза субоптимальных регуляторов заданного уровня применяются новые методы бесконечномерных уравнений Луръе-Риккати. Разобраны 'численные примеры.

Часть 3 диссертации посвящена задачам адаптивного управления и оценивания, прикладным задачам синтеза регуляторов, а также задачам со смешанными ограничениями, возникающими в приложениях.

Содержание Главы 10 можно отнести к приложениям теории вероятностей к задачам оценивания и адаптивного управления линейными динамическими объектами. Известно, что оценки метода наименьших квадратов (МНК) сходятся по распределению. Однако в замкнутом контуре адаптивного управления нужна не сходимость распределений, а сильная сходимость почти наверное. В обильной литературе по свойствам стохастической сходимости МНК предпринимались попытки проанализировать сильную сходимость при зависимых регрессорах, являющихся состояниями объекта управления. В разделе 10.1.3 показано, что сильной сходимости может не быть при независимых возмущениях в модели, но зависимых регрессорах. В теореме 10.2 приведен способ формирования регрессоров, зависящих от предыстории, при: котором оценки МНК не только не состоятельны, но и неограничены почти наверное. Этот пример ставит вопрос о дополнительных условиях, при которых оценки МНК состоятельны. В теореме 10.3 доказано, что при оценивании коэффициентов линейной регрессии даже для неустойчивого объекта оценки МНК всегда состоятельны. Общее утверждение о сильной состоятельности оценок МНК при слабых ограничениях на число обусловленности информационной матрицы сформулировано в теореме 10.1.

Рассмотрим задачу идентификации неизвестного вектора т е по наблюдению за скалярным процессом и векторным процессом (ФОйп связанными уравнением

Унг = т*Ф, + ени 4=1,2,..., где (е,)^ — стандартный белый шум. Процесс Фг будем предполагать измеримым относительно <т-алгебры ^ — <^{«1, • • •, Последовательность оценок

МНК для т обозначим (п)^. Информационную матрицу процесса оценивания обозначим Я( = До + ]С1=1 Ф(Ф^.

Теорема 10.1. Границы спектра матрицы. обозначим М± — ¡¡/¿¡И и т1 = ЦДГМГ1- Оустъ дифференцируемая положительная функция д(х), х € ~[те0,+оо), и последовательность -чисел удовлетворяют условиям

1- Р{т„ > д{Мк)Чк>Ц > 1

2. /~1/(5(<)0Л<оо.

3. При всех х Е [тоо,+оо).- д'{х) > ¿щ, где 0 < е < 1, Цх) = 1/(д(ЩЖ. Тогда при всех х > 0 и t > О

Р(||Дп+1||2 < ЩМк)(С! + х)Ук>1} > 1 -р, - Сф,

где

Функции д(х) = ха и д(х) — (1об(х))г+°, а > 0, удовлетворяют условиям 2 и 3 теоремы 10.1. Состоятельность оценок МНК следует из заключения теоремы 10.1, если —► 0 и"||Я(|| = Л?( —> оо при 1 —> оо п.н. Если известна скорость роста определяемая условием Р{||.й*|| > фк Ук>1} > 1 — ^ч, где и (А)"о —

детерминированные последовательности, фг —» оо и —► 0 при I —> оо, то при выборе х = к~'/:г(фс) получаем эффективную оценку скорости сходимости:

Р{\\Лтш1|2 < к'1г{фк){С^\фк) +1) С2Ъ.°1\ф,).

На основании этого утверждения в §10.2 описан алгоритм адаптивного оптимального управления линейным объектом с квадратичным функционалом ка честна. Необходимое свойство информационной матрицы доказано в теореме 10.5. В теореме 10.6 утверждается сильная сходимость к минимуму функционала качества и дается вероятностная оценка скорости этой сходимости. Приведен конкретный пример алгоритма адаптивного оптимального управления.

В §10.3 изучается система адаптивного управления линейным объектом с идентификатором по МНК и оптимальными регуляторами по критерию минимума дисперсии выхода. Известно, что в этой задаче информационная матрица всегда вырождается, если функционал качества управления стремится к минимуму. Поэтому состоятельности оценок МНК может не быть. Однако в теореме 10.6 доказано, что функционал качества все-таки стремится к минимуму, т.е. МНК обеспечивает критериальную сходимость оценок параметров, введенную и изучавшуюся в работах Б.Т.Поляка. Для этого были найдены новые вероятностные свойства случайных процессов, порождаемых системой оценивания по МНК, которые сформулированы в леммалс 10.5-10.8. Доказательство теоремы 10.6 проводится методом стохастических функций Ляпунова и априорных оценок для нестационарных квазилинейных систем.

В главе 11 изучается новая задача адаптивного управления линейным объектом с неизвестными коэффициентами и возмущениями, не имеющими устойчивых стохастических характеристик, а заданными классом возможных траекторий. Задача обеспечения гарантированного минимального значения для предельного функционала управления на бесконечном промежутке времени является естественным расширением задач ¿'-оптимального управления, рассмотренных в главе 1, и задач Н°°-оптимального управления, рассмотренных в

главах 6 и 9. Гарантированный результат по подавлению постоянно действующих на объект возмущений дополняется адаптивной настройкой модели по текущим наблюдениям. Настройка модели из класса адаптации проводится методами множественной идентификации, предложенными впервые в работах А.Б.Куржанского, Ф.Л.Черноусько, В.М.Кунцевича.

В §11.1 определяется цель адаптивного оптимального управления, которая имеет вид неравенства, а не минимизации какого-либо функционала* Смысл этого неравенства следующий: значение предельного функционала качества, вычисленного на реальной траектории замкнутой системы, должно быть не хуже, чем цена игры на любой модели из класса адаптации, совместимой с этой траекторией. В §11.2 предложен Алгоритм 1, обеспечивающий выполнение цели адаптивного управления (теорема 11.1). §11.3 посвящен адаптивному ¿'-оптимальному управлению. В разделе 11.3.1 описано общее решение этой задачи (лемма 11.1 и теорема 11.2). Вычислительные вопросы изучаются в разделе 11.3.2, где показано, что в памяти системы адаптивного управления достаточно хранить некоторое выпуклое множество фиксированной размерности. Его можно приближать, например, эллипсоидами.

В разделе 11.3.3 рассмотрен класс адаптации, состоящий из неминимально-фазовых объектов управления с известными нулями я вычетами в них у передаточной функции объекта управления и с нерегулярными возмущениями. Доказано (лемма 11.2), что вместо выпуклого множества адаптивная система управления может запоминать только одну "существенную" грань, что значительно уменьшает объем необходимой памяти. При помощи полученного эффективного алгоритма в разделе 11.3.4 проведено имитационное моделирование системы стабилизации курса судна на морском волнении.

Простейшая модель данамика курса судна описывается системой третьего порядка, содержащей курс судна ф, дрейф /3 и угловую скорость ш. Для пассажирского парома типа "Анна Каренина" на скорости 20 узлов уравнение типичной модели в дискретном времени можно записать следующим образом:

/9(+Д / 0.63 0.82 0.\ /Д\ /2.8\ ( 0.83 \

I = -0.28 0.83 0.1 I ш, 1 + { 2.9 [ и, 4 -0.15 I 6+ь фН1/ 0.15 0.94 1./ V1-5/ \-0.Q5/

где и( — угол поворота руля и (( — возмущение. Измеряется путевой угол у, = ф( — Д. Требуется минимизировать этот угол.

Возмущение & имеет волновую природу. Следующий формирующий фильтр выделяет наиболее существенную полосу частот:

& - 0.94£,_, + 0.736-2 - О.ЗЗи, - 0.12к,-1.

Важно отметить, что любые наблюдаемые данные (у*,и'_1) могут быть описаны указанными уравнениями, достаточно решить уравнение объекта относительно и затем уравнение фильтра относительно В частности, нелинейное уравнение движения и даже реальные данные измерения описываются ' выбранными уравнениями с некоторой последовательностью (и(). Это выгодно отличает данный подход от стандартных стохастических, в которых v, — белый шум, что никогда не соответствует реальным данным.

Рассмотрим задачу ^-оптимального управления: возмущение щ и выход у( измеряются в равномерной метрике, требуется минимизировать индуцированную Iх-норму отображения и —► у по допустимым линейным регуляторам. Для

данной модели минимум функционала качества равен 70 = 1.105. В уравнении оптимального регулятора а°(д)щ = Д°(<?)2/1:

а°(г) = 1 + 1.24г — 3.07-г2 •+- З.24г3 — 1.2&г4, 0°(г) = —1.09 + 2.79г — З.ббг3 + 2.43г3 — 0.75.И.

Предположим, что коэффициенты и даже порядок уравнений объекта и фильтра неизвестны и класс моделей задается уравнением

а(д)г/| = Ь(9)и1 + с(<г)г>(,

где 9 - оператор сдвига назад, в, 6, с - полиномы. В классе адаптации фиксируется: минимальное запаздывание (4(0) - 0, а(0) ф 0), неустойчивый корень 20 = 0.634 полинома Ь(г), значения а(0) и а(г0), а также коэффициенты полинома с(г) с точностью до общего множителя. Произвольно фиксируются максимальные степени полиномов а(г) и 6(г).

Выли проведены два вычислительных эксперимента. В первом количество настраиваемых коэффициентов совпадало с количеством "истинных" коэффициентов, во втором порядок модели был занижен. В частности, во втором случае "истинные" коэффициенты не могли быть идентифицированы. Начальные данные для вектора г настраиваемых коэффициентов выбирались нулевыми. Затем некоторое время модель настраивалась вне контура управления, т.е. объект был замкнут стабилизирующим регулятором, множество совместимых параметров модели вычислялось, но не влияло на выбор управления. Критерием окончания этого предварительного режима была степень невырожденности информационной матрицы, связанной с процессом оценивания. После этого система адаптивного управления замыкалась в соответствии с леммой 11.1 и теоремой 11.2.

Результаты вычислений показали, что через 30-40 итераций качество замкнутой системы близко к оптимальному. Подстройка параметров регулятора происходила в течение всего времени работы системы, через 90 тактов в первом эксперименте регулятор определялся полиномами а(г), /3(г), коэффициенты которых отличаются от оптимальных примерно на 10 %, что, однако, не сказывалось существенно на траектории системы. Во втором эксперименте с заниженным порядком класса моделей через 90 тактов

а{г) = 1 + 1.76г - 2.74г2 + 0.53г3, 0(г) = -1.16 + 2.29г - 1.90г2 + 0.64г3,

что отличается от пары а°(2),/?°(г) как порядком, так и коэффициентами. Однако траектории замкнутой системы близки к оптимальным.

Результаты показали эффективность общего алгоритма синтеза адаптивного ¿'-оптимального управления и возможность его применения для стабилизации курса судна с учетом волнения при большой начальной неопределенности в параметрах уравнения динамики судна и характеристиках волнения.

Адаптивная Н^-оптимальная система управления динамическим объектом в классе линейных моделей разрабатывается в §11.4. Ввиду того, что сам функционал качества и ограничения на возмущения, свойственные теории Н°°-оптимального управления, имеют предельный вид, а настройка осуществляется по конечному набору данных, сначала исходная задача преобразуется к

близкой задаче с равномерными ограничениями. Мера близости устанавливается в леммах 11.3 и 11.4. Получающиеся равномерные ограничения существенно отличаются от принятых в теории ¿'-оптимизации: вместо текущей величины возмущения в неравенство подставляются усредненная мощность с экспоненциально убывающим множителем. В разделе 11.4.2 показало, что адаптивная %°°-оптимальная система управления не требует запоминания неограниченного количества параметров. Как и в разделе 11.3.3, вместо выпуклого множества достаточно запоминать только одву его грань (Алгоритм 2 и теорема 11.3).

Имитационное моделирование замкнутой системы для той же задачи стабилизации курса судна проведено в разделе 11.4.3. Для тех же классов адаптации, что и в §11.3, но при ограничениях на энергию возмущений вместо равномерных ограничений была синтезирована адаптивная И°°-оптимальная система управления. Оказалось, что для класса адаптации заниженного порядка настройка происходит за 30 итераций, после чего процесс мало отличается от оптимального. Для системы полного порядка настройка заняла 60 итераций, а качество стабилизации курса можно считать удовлетворительным через 15-20 итераций.

Заключительная Глава 12 включает прикладные задачи синтеза оптимальных регуляторов и фильтров, а также ряд конкретных задач, решение которых основано на самостоятельных математических идеях. К прикладным задачам относятся: компенсация скачков нагрузки в автономной системе энергоснабжения (§12.4), адаптивная система сопровождения при наблюдениях, характерных для космических датчиков (§12.5), а также оптимальная фильтрация в системе преследования по измеряемым невязкам (§12.3).

В §12.1 изложено решение задачи синтеза минимаксного регулятора для скалярного объекта со смешанными возмущениями в двух вариантах: обновляющийся процесс с локальными ограничениями (см. главу 2) и возмущение ограниченной энергии, а также тот же обновляющийся процесс и случайный белый шум. Использование смешанных моделей возмущения устраняет существенные недостатки "чистых" постановок задач. В подходе ¿'-оптимального управления редкие выбросы возмущения воспринимаются как постоянно возможные, что существенно искажает (необоснованно расширяет) класс их допустимых реализаций в модели. Добавление белого шума или слагаемого с ограниченной энергией отделяет редкие выбросы от основного диапазона нерегулярных возмущений. Для скалярной задачи минимаксной вариации с одним неустойчивым нулем передаточной функции от управления к выхода' получены окончательные и аффективные формулы.

Новая задача синтеза оптимального устойчивого регулятора решена в §12.2 для скалярного объекта управления в дискретном и непрерывном времени. В стандартной линейно-квадратичной задаче оптимального управления линейным стационарным объектом поставлено дополнительное условие: регулятор должен описываться устойчивым дифференциальным уравнением, т.е. должен сохранять устойчивость как самостоятельный объект вне контура замкнутой системы. Оказывается, что оптимальная передаточная функция замкнутой системы существует в естественном замыкании класса конечномерных регуляторов, и эта функция содержит множителем внутреннюю сингулярную функцию класса Харди Н°°. В непрерывном времени объект управления описывается

уравнением

«(рЖ*) = КРМО+ "('). где а(г) и 6(г) — полиномы, р = ¿/<Й — оператор дифференцирования. Возмущение «(() предполагается случайным стационарным процессом (обобщенным) с нулевым средним и рациональной спектральной плотностью 5„(г) = |Г1(г)|а/|Г2(г)|2, где Г] и Г2 — полиномы. Требуется определить линейное уравнение регулятора а(р)и(<) = 6(р)у(2), которое удовлетворяет следующим условиям: 1) замкнутая система устойчива; 2) сам регулятор устойчив, т.е. полином о(г) гурвицев; 3) минимизируется функционал качества

/ = /(а,/3)==ед<)2 + Л(г)2),

вычисляемый при условии стационарности процессов ¡/(¿) и и(4).

Эта задача сводится к условной минимизации в классе Харди Н2(С+). Передаточная функция замкнутой системы = а/(аа—/ЗЪ) от V к у и искомая передаточная функция регулятора = /9/а однозначно связаны: IV = 1/(о — Ь(3/а), И*^ = (а\¥ — 1 )/Ъ. Поэтому задачу можно переформулировать в терминах функции IV: минимизировать по Ш квадратичную форму

1 Г°

1= — / ЭДШш^ПЩш))^,

где

F(a,Ь,^r) = 1И'|2[(к2|ар + \Ъ\2) -2к*аУ/+ ¿]/\Ь\\

Условие устойчивости замкнутой системы равносильно отсутствию у 1У(г) полюсов в замкнутой правой полуплоскости и условию IV(2;) = 1 /а(г.) для всех корней 2; полинома 6(г) в правой полуплоскости. Будем предполагать, что все эти корни различны и полином Ь(г) не имеет корней на мнимой оси. Условие устойчивости регулятора равносильно отсутствию нулей в правой замкнутой полуплоскости у функции Н'(г).

Теорема 12.8. Пусть — все вещественные положительные корни

полинома 6(г). Тогда для того, чтобы существовал какой-либо устойчивый стабилизирующий регулятор, необходимо и достаточно, чтобы все вещественные числа а(г,) были отличны от нуля и имели одинаковый знак, о

Таким образом, требуется минимизировать в классе Харди Нг(С+) квадратичный относительно IV(г) функционал I при фиксированных значениях в нескольких точках и при условии отсутствия нулей у Ш в правой полуплоскости. По условию, функция рациональная, но задачу можно расширить до произвольной функции из Н2(С+) в силу плотности региональных функций в этом пространстве.

Теорема 12.9. Пусть гь..., 2П — все корни полинома 6(г) и ¿1,...,зт — все корни п.олиномаТг(г). Пусть все эти корни простые и среди чисел2,-, г,"1, г^, з^1 нет равных. Пусть к. ф 0. Тогда оптимальная функция в расширенном классе имеет вид

где I, < п + т, г >0, гп! ut| — положительные числа, К(г) — полином, степей» которого меньше, чем п + т, и выполнены равенства: К{И1) = 0 при 1 <7 < Ь; И/0(21) = 1/а(г,) при 1 < » < п; = к2а(-з>)/(к2а(8>)а(-^) + 6(з,)&(-5,)) при

1 < j < m. Гурвицев полином X(z) определяется из уравнения факторизации X{z)X(—z) = K2a(z)a(—z) + b(z)b(—z). Минимум функционала качества, равен

/О = J. Г *2-H"MР ^

2тг /с2а(гш)а(—tw) 4- b(iu)b(-iw)

где

ф) = (И^(г)(к2а(г)а(-г) + 6(г)г>(-г)) - к2а(-г))/Ь(г).

а

Решение задачи основано на формулах факторизации внешней и внутренней сингулярной функций в классе Харди Н2(С+). Количество алгебраических уравнений в формулировке теоремы 12.9 совпадает с количеством неопределенных коэффициентов.

Двойственная задача оптимальной фильтрации поставлена и решена в §12.3. Предполагается, что система наблюдения движется за объектом в дискретном времени, пытаясь попасть в прогнозируемую точку. При атом измеряются не абсолютные координаты объекта преследования, а только ошибки фильтрации. Прогнозируемое значение положения объекта определяется линейным фильтром, который должен быть устойчив как самостоятельный динамический объект. Это ограничение на устойчивость не всегда выполнено для стандартных оптимальных фильтров. Если оно не выполнено, то решение задачи с ограничением на устойчивость вновь содержит внутреннюю сингулярную функцию класса Харда Н°°.

§12.4 целиком посвящен прикладной задаче синтеза компенсатора скачков в автономной системе энергоснабжения. Целью управления является поддержание частоты вращения двигателя, что является существенным требованием в основном режиме работы небольших (например, судовых) энергосистем. Рассмотрены 4 модели, характерные для разных условий работы. Это компенсация одного большого скачка, двух последовательных скачков, пуассоновского потока включения/отключения одного мощного потребителя и, наконец, компенсация постоянных изменешй нагрузки при равномерном ограничении на скорость изменения. В последнем случае применены результаты главы 1 о расчете ^-оптимальных регуляторов для дифференциальных уравнений, описывающих объект с чистым запаздыванием в управлении и при наличии шумов измерения. В первых трех моделях предложено ввести искусственную задержку включения/отключения в 1-2 секунды, в течение которых система подготавливается к скачку, и применить линейно-квадратичный регулятор. Имитационное моделирование показало уменьшение величины пика отклонения частоты вращения двигателя в 13 раз для модели одного скачка нагрузки.

В §12.5 рассмотрена задача автосопровождения в условиях, характерных для наблюдений за судном в открытом море при помощи космической системы GPS. Особенностью процесса наблюдения является несоизмеримость возмущений в объекте и уравнении измерения: погрешности измерения больше на два порядка. В то же время точность оптимального фильтра Калмана-Бьюси существенно зависит от правильного значения отношения шггенсивно-стей этих возмущений, которое входит в уравнения Риккати. Предлагается адаптивная система слежения, содержащая рекуррентную настройку этого параметра. Доказана теорема о сходимости в модели с белым шумом в объекте и в измерении. Доказательство основано на известной теореме Льюнга о

сходимости рекурсивных алгоритмов, которая сводит исследование сходимости алгоритмов типа стохастической аппроксимации к проблеме устойчивости детерминированной системы ассоциированных обыкновенных дифференциальных уравнений.

На защиту выносятся следующие результаты:

1. Решение скалярной задачи о минимаксной вариации (теорема 1.1). Построение минимизирующей последовательности ¿'-оптимальных регуляторов методом динамического программирования (§1.4). Геометрический метод расчета ¿'-оптимальных регуляторов (теоремы 1.4 и 1.6). Решение скалярной задачи синтеза ¿'-оптимального регулятора для систем в непрерывном времени и с запаздыванием в управлении (§1.5, теоремы 1.7-1.10, алгоритм расчета в п. 1.5.1). Применение метода расчета оптимального регулятора к задачам управления роботом-велосипедистом и активной подвеской автомобиля.

2. Разработка теории обновляющихся процессов. Определения и основные свойства (глава 2). Критерии обновляемости процессов с локальными ограничениями (теоремы 2.11, 2.15). Конечно-параметрические аппроксимации и опорная функция обновляющегося процесса (теоремы 2.19, 2.20).

3. Постановка общей минимаксной задачи стабилизации линейного объекта в дискретном времени. (§3.1, теорема 3.1 о седдовой точке). Сведение бесконечномерной игровой задачи к конечномерной выпуклой оптимизации (теоремы 3.2 и 3.3). Верхние и нижние аппроксимации цены игры (теорема 3.4). Итеративный алгоритм расчета минимизирующих последовательностей (теорема 3.5) и его эффективная реализация для кусочно-линейной задачи (теорема 3.6).

4. Оптимальность нелинейного регулятора для скалярной задачи минимаксной вариации при сильно неминимально-фазовом объекте (лемма 4.3). Теорема существования оптимального нелинейного регулятора (теорема 4.1) и проверка оптимальности линейного регулятора при помощи оптимизации на бинарном графе (теорема 4.2).

5. Теоремы 5.1 и 5.2 о разрешимости диофантовых уравнений над кольцами функций. Определение управляемости пар полиномиальных матриц (§5.2) и критерии управляемости и наблюдаемости (теоремы 5.3 и 5.4).

6. Явные формулы для линейно-квадратичного регулятора в полиномиальных терминах (теоремы 6.1 и 6.2). Синтез минимизирующей последовательности грубых регуляторов (теорема 6.3). Явная формула И^-оптимального регулятора в скалярном случае (лемма 6.5).

7- Реализуемость М°°-оптимального регулятора (теорема 7.1). Явное уравнение Н°°-оптимальвого регулятора (лемма 7.3). Вычисление цены игры в линейно-квадратичной задаче управления линейным динамическим объектом (теорема 7.2). Выпуклость решения уравнения Лурье-Риккати относительно множителя Лагранжа (теорема 7.7). Решение линейно-квадратичной игры в позиционных стратегиях (теорема 7.8).

8. Явное параметрическое уравнение класса всех субоптимальных регуляторов в задаче синтеза абсолютно липшицевых систем (теорема. 8.1). Теоремы о малом коэффициенте усиления (8.2), разделения (8.3) и двойственности (8.4). Синтез Н00-оптимальных регуляторов при квадратичных ограничениях (теоремы 8.5 и 8.6).

9. Полиномиальный алгоритм расчета №°-оптимальных регуляторов по методу Квакернаака-Мейнсмы (теоремы 9.1-9.3). Определение ^-факторизации

и модификация алгоритма последовательного сокращения множителей. Сведение обобщенной /(-факторизации к обычной (теорема 9.5). Алгебраическая связь решений полиномиального уравнения Риккати и алгебраического уравнения Лурье-Риккати (леммы 9.5 и 9.12). Полное описание свойств алгоритма последовательного сокращения множителей и эквивалентность полиномиальных, алгебраических уравнений Риккати и ^-факторизации (теорема 9.6). Прямой метод расчета субоптимальных регуляторов по передаточным функциям объекта управления (теорема 9.7). Синтез Т^-оптимальных регуляторов при нескольких ограничениях на возмущение (теорема 9.8). Синтез оптимального регулятора для скалярного объекта с чистым запаздыванием (теорема 9.10).

10. Сходимость оценок МНК как свойство информационной матрицы (лемма 10.1, теорема 10.1). Пример расходимости оценок МНК п.н. при невырожденной информационной матрице (теорема 10.2). Состоятельность оценок МНК для неустойчивого регрессионного уравнения (теорема 10.3). Синтез адаптивной оптимальной системы управления линейным стохастическим объектом с квадратичным функционалом качества (теоремы 10.4 и 10.5). Критериальная сходимость метода наименьших квадратов в стохастической задаче минимальной вариации для скалярного объекта управления (теорема 10.6).

11. Синтез алгоритма расчета адаптивного субоптимального гарантирующего регулятора (теорема 11.1). Общий подход к синтезу адаптивного (}-оптимального управления (теорема 11.2). Сведение общей задачи адаптивного ^-оптимального управления к минимизации стандартного функционала на выпуклом множестве. Применение алгоритма адаптивного Р-оптимального управления в задаче стабилизации курса судаа. Расчет адаптивных субоптимальных регуляторов (теорема 11.3). Применение адаптивного оптимального управления в задаче стабилизации курса судна.

12. Синтез гарантирующих регуляторов в смешанной задаче ¿'/Т^-мини-максной вариации (теоремы 12.1-12.4). Синтез устойчивых стабилизирующих регуляторов в дискретном и непрерывном времени (теоремы 12.6-12.9). Оптимальная фильтрация в задаче преследования по измеряемым невязкам (теорема 12.10). Применение линейно-квадратичной теории синтеза. регуляторов для компенсации мощного скачка нагрузки в автономной системе энергоснабжения (теорема 12.11). Применение последовательного оценивания и модели пуассо-новского потока скачков для компенсации нескольких скачков нагрузки (теоремы 11.12, 11.13). Применение теории ^-оптимального управления для компенсации дрейфа нагрузки в системе энергоснабжения. Применение адаптивного фильтра Калмаяа-Бьюси и метода ассоциированных дифференциальных уравнений Льюнга в задаче автосопровождения при малых отношениях интен-сивностей возмущения в объекте к шумам измерения (§12.5, теорема 12.14).

Основные публикации автора по теме диссертации.

[1] Барабанов А.Е. Оптимальное управление неминимально-фазовым дискретным объектом с произвольными ограниченными помехами. Вест-ннк ЛГУ, 1980, X» 13, с. 119-120.

[2] Барабанов А.Е. О сильной сходимости метода наименьших квадратов. Автоматика и телемеханика. 1983, X« 10, с. 119-127.

[3] Барабанов А.Е. Применение метода наименьших квадратов для построения адаптивного оптимального управления линейным динамическим объектом. Автоматика и телемеханика, 1983, Л"5 12, с. 57-65.

[4] Барабанов А.Е. Оптимальное управление линейным дискретным динамическим объектом с усредненным функционалом качества. Докл. АН СССР, 1990, т. 312, № 5, с. 1053-1057.

[5] Барабанов А.Е. Оптимальная фильтрация стационарного процесса по измеряемым невязкам. Теория вероятностей и ее применения. 1990, Л"» 2, с. 337-340.

[6] Барабанов А.Е. Управляемость многомерных полиномиальных линейных систем. Автоматика. Киев, 1991, № 3, с. 9-15.

[7] Барабанов А.Е. Обновляющиеся множества случайных процессов. Теория вероятностей и ее применения, 1992, т. 37, вып. 4, с. 766-768.

[8] Барабанов А.Е. Синтез минимаксных регуляторов. Изд-во С.-Петербургского ун-та, С.-Петербург, 1996, 222 с.

[9] Барабанов А.Е., Граничин O.E. Оптимальное управление линейным объектом с ограниченной помехой. Автоматика и телемеханика, 1984, Л» 5, с. 39-46.

[10] Барабанов А.Е., Иванова А.И. Минимаксное управление дискретным объектом при комбинированных возмущениях. Вестник ЛГУ. Сер. 2,

1990, № 1, с. 10-15.

[11] Барабанов А.Е., Иванова А.И. Минимаксное управление дискретным объектом при смешанных возмущениях. Автоматика в телемеханика,

1991, К* 4, с. 97-108.

[12] Барабанов А.Е., Лукомскчй Ю.А., Мирошникое А.И. Адаптивная фильтрация при неизвестной интенсивности возмущений и шумов измерений. Автоматика и телемеханика, 1992, № 11, с. 93-101.

[13] Барабанов А.Е., Первозванскай A.A. Оптимизация по равномерно-частотным показателям (Н-теория). Автоматяка и телемеханика. 1992. № 9, с. 3-32.

[14] Барабанов А.Е., Саббаг М.К. Реализуемость Н-опгимальных регуляторов. Вестник С.-Петербургского университета, серия 1 (математика, механика, астрономия^). Вып. 3, 1993, № 15, с. 3-7.

[15] Барабанов А.Е., Соколов A.A. Оптимальная стабилизация линейного даскретного объекта с нерегулярным шумом в объекте и измерении. Автоматика. Киев, 1991, № 5, с. 87-92.

[16] Барабанов А.Е., Якубович В.А. Синтез грубых реализуемых оптимальных регуляторов в стохастических задачах управления линейными стационарными системами. I. Известия вузов СССР. Приборостроение. 1984, № 9, с. 15-21.

[17] Barabanov A.E. Design of stable stabilizing regulators in LQ optimal control problem. Preprints of Second IFAC Symposium on stochastic control, Vilnius, USSR, May 19-23, 1986, p. 291-296.

[18] Barabanov A.E. Adaptive choice of linear model in classes with uniform and mean square restrictions. In: "Evaluation of adaptive control strategies in industrial applications", ed. by V.A.Lototsky. Pergamon Press, 1990, № 7, p. 95-98.

[19] Barabanov A.E. LQ optimal control by means of stable regulators. Systems and Control Letters, v. 17,1991, p. 351-356.

[20] Barabanov A.E. Minimax controller design in uniform metric. 34th IEEE Cord, on Decision and Control. New Orleans, December 14-16, 1995, p. 815816.

[21] Barabanov A.E. Adaptive il-optimal control for SISO plant. 34th IEEE Conl. on Decision and Control. New Orleans, December 14-16, 1995, p. 1376-1381.

[22] Barabanov A.E., Sokolov A.A. Minimax controllers for linear plants under ¿"-bounded disturbances. Proc. Evrop. Control Conf. Groningen, 1993, v. 2, p. 754-759.

[23] Barabanov A.E., Sokolov A.A. Geometrical solution to ^-optimization problem with combined conditions. Proc. Asian Contr. Conf. Tokyo, 1994, v. 3, p. 331-334.

[24] Barabanov A.E., Sokolov A.A. Solution to Ll-optimal control problem for SISO plants. Proc. IFAC Symposium on Robust Control Design, Rio de Janeiro, Brasil, September 14-16, 1994, p. 126-132.

[25] Barabanov A.E., Sokolov A.A. The geometrical approach to the 11-optimization problem. Proc. 33rd IEEE Conf. on Decision and Control. Florida, USA, December 14-16, 1994, v.4, p. 3143-3144.

[26] Barabanov A.E., Sokolov A.A. Generalized ¿'-optimization problem: reduction to a finite-dimensional convex minimization. Amer. Contr. Conf., Seattle, 1995, p. 946-950.

[27} Barabanov A.E., Sokolov A.A. Finite convergence conditions of iterative solution to the ¿'-optimization problem. Proc. Europ. Control Conf., 1995, Rome, Italy, v. 2, p. 1384-1388.

[28] Barabanov A.E., Sokolov A.A. Approximate solution to the generalized i1-optimization problem. Proc. Europ. Control Conf., 1995, Rome, Italy, v. 2, p. 1401-1405.