Алгоримты адаптивного управления неминимально-фазовыми и бесконечномерными системами тема автореферата и диссертации по математике, 01.01.11 ВАК РФ
Окмянский, Владимир Аркадьевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Нижний Новгород
МЕСТО ЗАЩИТЫ
|
||||
1995
ГОД ЗАЩИТЫ
|
|
01.01.11
КОД ВАК РФ
|
||
|
На правах рукописи
РГ8 ОД
' - НОЯ 1995
ОКМЯНСКИЙ Владимир Аркадьевич
АЛГОРИТМЫ АДАПТИВНОГО УПРАВЛЕНИЯ НЕМИНИМАЛЬНО-ФАЗОВЫМИ И БЕСКОНЕЧНОМЕРНЫМИ СИСТЕМАМИ
Специальность 01.01.11 — Системный аналио и автоматическое
управление
Автореферат диссертации на соискание ученой степени кандидата фпоико-математнческих наук
Нижний Новгород, 1995
Работа выполнена п Нижегородской государственной архитектурно-строительной академии.
Научный руководитель — доктор физико-математических наук, профессор В.А.Брусин.
Официальные оппоненты:
доктор физико-математических наук, профессор Колмановский В.В., кандидат физико-математических наук, старший научный сотрудник Коган М.М.
Ведущая организация — Нижегородский государственный технический университет.
у/
Защита состоится " 1995 года в ^^ час. на за-
седании диссертационного совета К 063.7701 в Нижегородском государственном университете по адресу: г.Н.Новгород, пр.Гагарина, 23, корп.2, конференц-зал
С диссертацией можно ознакомиться в библиотеке Нижегородского университета.
Автореферат разослан " ¿Ы? 1995 г.
Ученый секретарь диссертационного совета кандидат физико-математических наук,, доцент ,) | В.И.Лукьянов.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.
Актуальность. В 70-80-е годы теория адаптивного управления развивалась по пути расширения классов управляемых динамически* систем, поиска математического обоснования уже известных эвристических алгоритмов, уменьшения априорной и апостериорной информации, увеличения требовании к физической реализуемости алгоритмов управления (в том числе в реальном времени), улучшения качественных характеристик переходных процессов. Ю.Неймарк, В.Якубович, П.Монополп, Д.Ландау, К.Нарендра, Б.Петров, В.Ругковскпй, В.Колмановскпй, А.Фрадхов, В.Бру-син и другие авторы разработали алгоритмы управления конечномерными линейными объектами, включая задачи подстройки п слежения. Разработанные алгоритмы обеспечивали прп любых начальных условиях асимптотическое затухание лпбо приближение к эталонному сигналу вы-' ходного процесса объекта, прп использовании информации о параметрах объекта, сводящейся к его порядку и знаку старшего коэффициента числителя передаточной функции.
В то же время ряд требований к объектам управления, вытекающих из возможностей этих методов, сужают классы рассматриваемых объектов. К таким требованиям, в частности, относятся: измерение всего вектора состояния объекта, устойчивость объекта по входу (минпмально-фазовость), равенство единице относительной степени передаточной функции. Отрицательная особенность свойстванемпнпмально-фазовостп проявляется в возможности неограниченного роста управления прп одновременном достижении целей асимптотического затухания выходного процесса объекта. Однако реальные объекты управления часто являются одновременно неустойчивыми, неминимально-фазовыми и допускающими измерение только выходного процесса.
Одними из первых адаптивных динамических регуляторов по выходу стали регуляторы, предложенные в работах П.Монополп, К.Нарендра. Однако в этих работах выдвигаются апостериорные предположения о сходимости переходных процессов и по существу нет доказательств равномерной ограниченности управления и всего вектора состояния замкнутой системы. В работе В.Якубовича (1988) был предложен иной подход к синтезу адаптивного закона управления для конечномерных немпнпмально-фаоовых объектов. Но данный алгоритм был дискретным и предполагал возможность конечного числа "остановок" объекта. Позднее в работах Р.Лозано (1994) преодолены названные недостатки предыдущих работ, но прп этом предполагаются известными производные от выхода.
Таким образом, задача синтеза класса адаптивных регуляторов по вы-
Х0ДУ> работающих в реальном времени и вырабатываемых конечномерной реализуемой динамической системой, остается актуальной.
В последние годы также активно исследовались проблемы управления распределенными, бесконечномерными динамическими системами (Работы Р.Куртейн, М.Балаш, К.Ито, А,.Бутховского.). Однако лишь немногие авторы (Т.Кобаяши) пытались построить адаптивные регуляторы для бесконечномерных объектов. При этом законы управления, построенные в известных нам работах, были также бесконечномерными и обеспечивали цели управления при трудно проверемых условиях. Таким образом, задача построения конечномерного адаптивного регулятора для класса распределенных объектов является актуальной и малоисследованной. Кроме того, нас интересует постановка задачи, столь же "жесткая", как и в конечномерном случае: измеряется только выходной процесс объекта, закон управления реализуется конечномерной динамической системой, сами объекты могут быть неминимально-фазовыми и с относительной степенью передаточной функции, превышающей единицу.
Распространение методов управления конечномерными объектами на бесконечномерные системы является не просто "делом техники". Как правило, требуется доказать, что неучитываемые в законе управления старшие гармоники (пусть и устойчивые) не внесут в совокупности такой вклад в движение замкнутой системы (управляемый объект + регулятор), который сделает ее неустойчивой. Для решения этой специфической для теории управления бесконечномерными системами проблемы вводятся дополнительные предположения о свойствах описываемых объектов, об асимптотике собственных чисел на бесконечности; используются такие специальные методы анализа, как теория Со-полугрупп и ин-финитезимальных операторов. В адаптивном случае эти особенности бесконечномерных систем усугубляются также нелинейностью алгоритмов управления и негрубостью замкнутой системы в смысле Андронова - Понтрягина.
Важным с точки зрения приложений является также анализ грубости адаптивных систем по отношению к аппроксимациям идеального реле. В регуляторах, в том числе адаптивных, в целях оптимальности по быстродействию часто используют разрывные элементы типа реле1. Однако "идеальное" реле в соответствии с его математическим определением не может быть реализовано. Это только идеальная математическая модель, которая служит для обоснования некоторых глобальных свойств. На практике приходится сталкиваться с явлениями гистерезиса, запаздывания и другими неидеальностями при реализации закона управления,
1А.А.Андронов, А.А.Витт, С.Э.Хайкин. Теория колебаний. - М.: Наука, 1981.
содержащего реле. Возникает вопрос — как будут меняться свойства оамкнутой системы, еслп идеальное реле заменить на его реализуемую аппроксимацию?
Для систем с разрывными нелинейностямп Ю.Неймарк, В.Уткин исследовали проблемы существования скользящего режима и существования так называемого пограничного слоя около поверхностей разрыва. Эти исследования, однако, носпли локальный характер и проводились: в окрест- • ностп пограничного слоя (скользящего режима), на конечном промежутке времени, при начальных условиях из некоторой окрестности. В адаптивных системах ситуация осложняется их нелинейностью и негрубостью. Кроме того, требуются глобальные исследования при любых начальных данных и при t £ (0,оо).
Цель работы. Разработка математических методов управления, на ос- . нове которых получить новые адаптивные регуляторы по выходу в непрерывном времени для следующих классов динамических систем: 1) конечномерные неминимально-фазовые объекты, 2) бесконечномерные спектральные объекты, как минимально-фазовые, так и неминимально-фазовые, 3) волновые уравнения с граничным управлением и наблюдением, 4) конечномерные объекты с непомеряемым постоянно действующим возмущением, с анализом робастности по отношению к аппроксимациям идеального реле.
Методы исследований. В исследованиях использовались методы тео-
рии глобальных функций Ляпунова, полугрупп неограниченных линейных операторов, конечно-сходящиеся алгоритмы решения рекуррентных целевых неравенств, теория дифференциальных включений для систем с разрывной правой частью, техника априорных оценок для исследования устойчивости нелинейных интегральных уравнении, возникающих в данных классах задач.
Научная новизна. В диссертационной работе синтезированы новые алгоритмы управления указанными выше классами объектов. По-новому осмыслены понятия мпнимально-фазовости объекта управления, относительной степени передаточной функции. Даны определения этих понятий, единые для конечномерных и бесконечномерных систем. Сформулированы условия, при которых конечномерные адаптивные динамические регуляторы по выходу обеспечивают цели управления для класса бесконечномерных спектральных объектов. Разработан метод граничного управления волновым уравнением, с использованием алгоритмов алаптпвного управления дискретными и конечномерными непрерывными объектами. Полученные результаты являются новыми.
Практическая ценность работы. Результаты работы могут быть пс-
пользованы как для управления конечномерными, так и распределенными системами. Прп этом объекты управления могут быть подвержены не-пзмеряемому возмущению, а априорная информация может быть весьма необременительной. Немаловажно, что полученные регуляторы используют в качестве текущей информации, как правило, только скалярный выходной процесс объекта; это отражает реальные возможности, имеющиеся прп управлении многими сложными объектами. Изложенные здесь регуляторы работают в реальном времени и легко реализуемы компьютерной и аналоговой техникой, что также отвечает современным требованиям к управлению конкретными системами.
Апробация работы. Исследования по теме диссертации докладывались на всесоюзных и международных конференциях, в том числе на таких крупных конференциях по управлению, как Азиатская, Американская п Европейская конференции 1FAC.
Структура и объем работы. Диссертация состоит их пяти глав, включая введение и заключение, и списка литературы из 44 наименований. Объем работы - 80 страниц.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
В первой главе (Введение) обосновывается актуальность темы диссертации, определяются цели исследования, формулируется общая постановка задачи, излагаются достигнутые результаты и структура работы, а также даются основные определения.
Рассматриваемые динамические системы управления описываются, как правило, дифференциальным уравнением
i = Xi(a:,u,v\ l), х(0) = х0) у = X2(x,u,v; 1), (1)
где и - скалярное управление, у - скалярный выход объекта; v(t) - внешнее возмущение, I - вектор параметров. Вектор состояния может быть как конечномерным, так и бесконечномерным. Более общая формулировка понятия динамической системы дана в книге2.
Ставится задача построения регулятора, при любых начальных условиях стабилизирующего выходной процесс объекта в одном из следующих смыслов
lim y(t) = 0 (асимптотическое затухание) (2)
оо
' dt < оо, к = 1,2 (интегральная сходимость) (3)
о
2Р.Калман, П.Фарб, М.Арбив. Очерки по математической теории систем. - М.: Мир, 1971.
Iiirij2/(t)| <5, 5 > 0. (дисснпативность в пределе) (4)
1М|С < «5, 5 > о (сходимость в среднем) (5)
(норма ||-||е определена ниже). Аналогичные требования в большинстве случаев предъявляются к управляющему сигналу u(t).
При этом закон управления должен вырабатываться конечномерной реализуемой системой дифференциальных уравнений
u= V7i(w,3/,n;i), w = W2{w,y,u]I), w £ , (6)
на вход которой поступает, как правило, только текущее значение наблюдаемого процесса у(<). Здесь I условно обозначает используемую априорную информацию о параметрах.
Мшшмально-фазовость. В рамках качественных характеристик системы управления под ее мпнпмально-фазовостью понимают устойчивость системы по входу. Это означает, что в замкнутой автономной системе управления ограниченность выхода объекта влечет ограниченность управления, то есть выполнение неравенства типа ||tt|| < ci||j/|| -f- с2 в какой-либо норме пространства реализаций процессов y(t) и при любой реализации y(t). При этом наличие свойства миннмальпо-фазовостп не зависит от вида регулятора по выходу, замыкающего систему, а определяется свойствами самой системы.
Определение 1. Передаточная функция G(p) называется минимально-фазовой, если все ее нули расположены в левой полуплоскости: {RePi < 0, G(Pi) = 0 }.
Это определение равносильно следующему определению.
Определение 2. Передаточная функция G(p) будем называть минимально-фазовой, если существует к > 1, при котором для любого ц > 0
Z(G):=sup{|G(p)|, Rep>0}. (7)
Это определение включает в себя известное определение мпнпмально-фаэовостн мероморфной передаточной функции - устойчивость ее числителя. Мы вводим также понятия относительной степени передаточной функции и строгой мпннмально-фазовости.
Определение 3. Величину m(G{p)) будем называть относительной степенью коэффициента передачи G(p), если
(8)
Нетрудно убедиться, что значение m(G(p)) равно минимальному значению к, при котором выполняется условие (7).
Определение 4. Передаточную функцию О(р) будем называть строго минимально-фазовой, если ее относительная степень т((?(р)) = 1.
В конечномерном случае, когда (3(р) = М(р)/£>(р), где М, Б - полиномы, строгая мпнпмально-фазовость означает, помимо гурвицевости числителя М(р), также то, что степень числителя не более чем на единицу меньше степени знаменателя, то есть относительная степень б(р) равна единице. Как правило, именно это условие требуется при синтезе алгоритмов управления; рациональную дробь М/И в этом случае также называют строго правильной. Заметим, что случай большей чем 1 относительной степени путем модернизации алгоритма управления можно свести к случаю строгой минимально-фазовости, однако эта модернизация осуществляется ценой использования в регуляторе производных от выхода.
Перед расмотрением более сложных классов управляемых объектов, в главе II (§2.1) рассмотрена задача управления минимально-фазовой конечномерной динамической системой, подверженной действию постоянно действующего неизмеряемого возмущения
£>ш*) = М(р)и(1) + Щр)уЦ) + „(О, (р = Л/М) (9)
где у(£) - выход, - управление; г»(£) - параметрически неопределенное возмущение, 1/{Ь) - неизмеряемое возмущение, про которые известно следующее:
= К01 < си, (10)
1=1
где ограниченные функции «¿(¿) известны, параметры с; неизвестны. В отличие от и({) возмущение мы называем непараметрическим. Предполагается, что полиномы £>, М имеют вид £>(р) = р" 4- Я1рп_1 + ... 4- о„, М(р) = Ь 1рп~1 + ... + Ьп, 61 > 0, и полином М(р) гурвицев. Объект (9), таким образом, является строго минимально-фазовым , а относительная степень передаточной функции равна 1. Далее строится адаптивный закон управления, содержащий реле, и исследуется поведение системы при различных аппроксимациях этого реле.
1) Пусть ст, А{ (Л; ф при г ф - произвольные положительные числа, Щр) = П"=2(Р + -^) ~ гурвицев полином. Уравнение (9) эквивалетно системе уравнении (в смысле соотношений входа-выхода)
у + оу^^и + к-и] + ь>ц + £ О-1)
"«(') ._ Ш [ "М иг)
* . _ Ы I 0 . ' ( 1
р+ А2' Р4- р + А„
У и
где h - вектор обобщенных неизвестных параметров. (Здесь и далее запись x(t) = [-F_1(p)M0 обозначает любое решение уравнения F(p)x(t) = v(t).) Тогда В соответствпп с пзвестнымп алгоритмами адаптивного управления3 закон управления возьмем в впде
u(t) = h(t)w{t)-M$(y,t), М=С"Д,+ Ш, m > 0 (13)
Оо
h = -Sw(t)<${y, t), S = ST > 0 (14)
Здесь с„д := sup - константа, определяемая из величины с„ (10)
и уравнения (12); S - произвольная симметричная положительно определенная матрпца. Новым элементом по сравнению с предыдущими алгоритмами данного типа является введение вместо обычно используемых функций y(t), sign y(t) более широкого класса функцпп Ф(у, t), Ф(у, t), призванных исследовать поведение системы в условиях "реального" реле. Подстановка (13) в (11) дает уравнение
у + ау = h-w + + M$(y,t), h~h + bji (15)
2) Виды нелинейностей Ф, Ф. Определим однозначную функцию signs = {+1, s > 0; — 1, s < 0; 0, s = 0} и многозначные функцпп
фь(з) := { sign(s), И > А; [-1,1], М < Д }
фЦз) := { s, \з\ > Д; [0,±Д], « = ±Д; 0, |в| < Д } (16)
V-i(s) := { sign(i), |s| > Д; [0, ±1], 5 = ±Д; 0, \s\ < Д }
1
-..г
sign(s)
Лемма. Пусть функцпп Ф, Ф из (13), (14) входят в классы функций:
ф е к* = {Фау, Д1 >о}, ф е к* = {фл,фк,ф1-, Д > о}, (17)
х - вектор состояния замкнутой системы управления (11)- (14). Тогда эта система, рассмотренная как дифференциальное включение
^ 6 /ОМ), я?:=[у,т,НТ] (18)
3В.А.Брусин, М. В.Лапшина. Об одном классе непрерывных алгоритмов адаптивного управления // Автоматика и телемеханика, 1980. N 10, с. 81-90; N 12, с. 65-71.
фА(з) iPlis) Ш')
имеет решение, под которым понимается абсолютно непрерывная вектор-функция ж(4), удовлетворяющая включению (18) для всех 1, для которых существует производная ¿х/Л.
Эта лемма вытекает из теоремы 2.2.14 о существовании решения ж(£), удовлетворяющего включению (18) и начальному условию. Функции (16) и условие (17) таковы, что функция /(х, <) - правая часть (18) - является полунепрерывной и множество ее значений в каждой точке замкнуто, ограничено и выпукло. Таким образом, несмотря на то, что функции (16) являются разрывными, они обладают свойствами, необходимыми для существования решения дифференциального включения. Однако единственности решения в нашем случае может не быть.
Функцию sign(s) мы называем идеальным реле, а функции класса введены для его аппроксимации. Необходимость аппроксимации объясняется тем, что реализация в законе управления идеального реле возможна только приближенно. Каким бы сверхточным прибором не вырабатывалось реле, вряд лп возможно избежать явлений запаздывания, гистерезисов и других "незапланированных" нелпнейностей. В линейных и грубых системах управления такие неидеальности, если они малы, как правило, нивелируются запасом устойчивости замкнутой системы. В то же время нелинейные системы с обратной связью не всегда являются грубыми по отношению к таким явлениям, что в частности будет показано ниже. Это особенно относится к рассматриваемым нами адаптивным регуляторам в силу особенностей уравнений (14).
3) Идеальное реле в законе управления (13). Вначале рассматривается случай, когда в законе управления (13) действует идеальное реле
6 Фо{у)> а в уравнении подстройки (14) Ф(у,£) = Фо(у) = У- Хотя реле фо(у) не совпадает с функцией 51щп(у), его "идеальность" заключается в том, что неопределенность имеет место только при у(Ь) = 0, но не распределена в какой-либо полосе < А.
Теорема. Регулятор (12), (13), (14) при Ф 6 фо, Ф = ^о осуществляет цели управления (2), (3). При этом процессы ), у(<), и^) и весь вектор состояния замкнутой системы управления равномерно ограничены.
4) Вариант с двумя идеальными реле. В предыдущем пункте было рассмотрено действие регулятора с одним идеальным реле, при этом достигалась наиболее сильная цель управления. Рассмотрим вариант с двумя идеальными реле в уравнениях (13), (14): Ф £ фо, Ф £ фа- С одной стороны, в этом случае настройка регулятора при |у| > 0 происходит быстрее, и в целом характеристики переходного процесса лучше. Однако
4А. Х.Гелиг, В. А.Леонов, В.А.Якубович. Устойчивость нелинейных систем с неединствеиным состоянием равновесия. - М.: Наука, 1981. 400 с.
движение в скользящем режиме может сопровождаться неограниченным ростом управления.
Определим так называемую "доопределенную нелинейность" £](<)
ЦуШ) := т £ Фо(УШ (19)
Это означает, что при у = 0 функция принимает значения из отрезка [—1,1]; при этом является измеримой кусочно-непрерывной функцией I и однозначно доопределяется в каждый момент времени в замкнутой системе (18). Далее, пусть при í 6 [¿1, ¿г] !/(') = 0) У(0 — 0-Тогда мы можем получить из уравнения (15) явное выражение для £1:
6(<) = (Ь1М)"1К(4) + ЩюЦ) + £(*)] (20)
Введем функцию Ляпунова У(<) := |у(*)| + ^Ее производная, в силу (15), (14) и с учетом Ф(г/(г), ¿) = &(£) , при £ е [¿а, ¿зЗ имеет вид У(<) = -^(¿)ш(<)[ 1/д(<) + й(<)ю(£) + £(£)]. Отсюда впдно, что на тех промежутках времени, когда = — sign£l(í) = — в1дп[1'д(<) +
+£(£)], функция У(£) будет возрастать, а вместе с ней будут возрастать подстраиваемые коэффициенты Ь,{£) и управление и(<).
Аналогично можно показать, что регуляторы (13), (14), (12) при {Ф = фА1, Ф = или Ф = Д1 > Д} - также могут привести к неограниченному росту управления в скользящем режиме. Далее мы показываем, как можно исправить эту ситуацию.
5) Регулятор с "мертвой" ооной. Пусть
Цу^еФМ, *(»,*) Д>Д„ (21)
(к = 1,2). То есть предполагается, что все "непдеальности", возникающие при реализации сигнатуры и описываемые функцией <^д,(2/), сосредоточены в полосе }2/) < Д1; при этом "мертвая зона" |т/| < Д, внутри которой согласно выбору функции Ф (21) настройка коэффициентов /г(£) не производится, перекрывает зону неопределенности \у\ < Д1.
Теорема. Пусть регулятор описывается уравнениями (13), (14), (21). Тогда для любого 5 > Д выполняется цель управления (4). При этом процессы «/(£), у(£), «(£) и вектор состояния г(г) равномерно ограничены; суммарное время Тб ■= {£ : \у(Ь)\ > б}, в течение которого траектория находится вне полосы \у\ < 6, также ограничено.
6). Дополнительная априорная информация об обобщенных параметрах объекта. Пусть известны границы, в которых лежат компоненты вектора к Л¿: Л; € [Л, -, /г^]. Изменим настройку вектора Л(£) с (14) на следующую:
к = -5»Ф(у, 0 - 1), ы(0) € [-/1?, -Л?] (22)
где Р(к)т := ..., и функции -Р,- изображены на рис. 1.
^ Легко видеть, что штрафные функции ^(/ц) гарантируют включение {/ц(4) 6 (—е — — /г?), I > 0} независимо от характера процессов Ф(у). Преимущество уравнения настройки (22) с штрафными функциями для к[Ь) заключается в том, что в качестве функции Ф(у,<) теперь
как в
можно использовать любую из нелинейностей (16), а не только -г/^2, предыдущих разделах, поскольку ограниченность настраиваемых параметров Л(<) достигается независимо от характера движения в скользящем режиме.
1
-Н} -А? + е
Рис. 1
х{У> су)
3ЬУ ЗУ
Теорема. Регулятор (12), (13), (22) при любых функциях Ф, Ф из классов (17) обеспечаивает выполнение ЦУ (4), где 6 = тах{Дь Л}.
7) Возмущение, ограниченное в среднем. В предыдущих разделах рассмотрен вариант неизмеряемон, но при этом равномерно ограниченной помехи 1/(4). В уравнении регулятора (13) возмущение гасилось нелинейностью, амплитуда которой заведомо превышала уровень возмущения. Однако в случае сильно неоднородной помехи, когда относительно малые возмущения сочетаются с кратковременными всплесками различной амплитуды, использование алгоритма для равномерно ограниченной модели помехи может привести к избыточным затратам на управление и к установлению в асимптотике большого коэффициента усиления регулятора. Рассмотрим вариант неизмеряемой помехи v[t), ограниченной в среднем:
Т—>°о Т • О
Введем функции Фб(у), в(Т) и новую "индуцированную норму"
(23)
Ну
ад - {5
У, Ы > <5
М<5
в(Т):=)\Щу(ЩМ (24)
и предположим, что
где возмущение va{t) определено выше (12). Заметим, что для равномерно ограниченной помехи условие (25) всегда выполняется, а в случае стационарного случайного процесса невыплненпе (25) при выполнении (23) возможно только в практически игнорируемых случаях.
Закон управления возьмем в виде
u{t) = h(t)w(t) - 9(t)$A(y(t), t), Ф € Ф&Ш) (26)
h = -Sw(t)<$s(y{t)), в = |Ф,(у(<))|, 5>Д, 6(0) = 0 (27)
Теорема. Пусть выполнены оценки (23), (25), 5, Л - заданные положительные числа, 5 > Д. Тогда адаптпвный регулятор (12), (26), (27) обеспечивает выполнение цели управления (5) при ||и||с < оо.
Подчеркнем, что в отличие от вышеизложенных алгоритмов управления, закон управления данного раздела не использует точного значения константы С(/ (23), характеризующей уровень помехи v{t). Фактически константа М в (13) заменена здесь настраиваемой функцией 0(t) (26). Этот способ подавления помехи может быть применен п в случае равномерно ограниченной помехи с неизвестной верхней границей.
В §2.2 решена задача об адаптивном управлении классом немини-мально-фаэовых конечномерных объектов без возмущения;
D{p)y{t) = M(p)u(t) (р = d/dt) (28)
где D{p) = pn + dipn~1 -f ... + dn, M(p) = m\pk -f ... m,k+i - взаимно простые полиномы, к < п. В отличие от §2.1, здесь не предполагается, что к = п — 1 и полином М(р) гурвицев.
Обозначения: а := col(d!i,.. ,,dn,m\,..., mn) - вектор коэффициентов полиномов D(p), М(р). Предполагаются известными порядок объекта п, а также следующая априорная информация о векторе а. Заданы выпуклая замкнутая область W в пространстве R2n и число Д > 0 такие, что для всех а, для которых p{W,a) < 2Д, выполнено (D,M) = 1, где р(-,-) -расстояние между множествами; (•, •) - наибольший общий делитель.
Схема решения задачи об адаптивном управлении. 1) Неадаптивный стабилизирующий регулятор может быть взят в виде5
a(p)u(t) = (3(p)y(t) (р = d/dt), (29) где полином а(р) и полином /3(р) определяются из уравнения _Q(p) = Р(р)а(р) - М(рЩр), (30)
5В.А.Якубович. Адаптивная стабилизация непрерывных линейных объектов // Автоматика и телеме-t ханпка, 1988. N 4. С. 97-107.
(¿(р) - заданный гурвицев полином степени 2п. Если д. - вектор коэффициентов полиномов а(р), /Э(р), то соотношение (30) задает однозначное соответствие:
¿ = Т<2(а), (31)
с областью определения О (Гц) = {а | а) < 2Д}.
2) Заменим уравнения (28) и (29) эквивалентными уравнениями
y + <ry = (r,v) + Z, Ü = (fi,v) + Tj,
'S ö' z + ' l ' У + 0' У ' 0"
Z = 0 S 0 l u, v := и 1
L J z
(32)
(33)
где <т > 0 - число, S -.устойчивая матрица порядка п — 1; £(f) = eSi£(0), 7](t) — eSit](0) - экспоненциально затухающие процессы, вектора г, р, определяются взаимно-однозначными соответствиями
г = 5т(а) = Sn а + «т-г, Р- — S^d) (34)
3) Введем новые переменные a(i), r(i), ß(t), y(t), которые будем трактовать как "оценки" соответствующих процессов без "крышек", уравнениями
У + сгу = (f, v), ü = (ß,v), (35)
'a = S^{vy- Ф(а)), r=ST(a), ß = S^{Tq{a)), а(0) € W, (36) с произвольными начальными условиями,
lo, p{W,ä)<A
Здесь где матрица STi определена в (34), Р\у - оператор проектирования на область W, Ф(а) можно понимать как "штрафную" вектор-функцию, не позволяющую a(t) покинуть область W&.
Теорема. Адаптивный регулятор (33),(35)-(37) обеспечивает выполнение цели управления (2). При этом вектор состояния w := col(у,у, ..., t/(n-1';z; у; щ о) замкнутой системы равномерно ограничен.
В §2.3 проводится обобщение на случай действия на ОУ неиз-меряемых возмущений. Эти возмущения включают в себя: а) аддитивное возмущение передаточной функции, б) нелинейность секторного типа, зависящую от выходного процесса. Объект управления:
D(p)y(t) = (М(р) + L(p)G(p)) u(t) + К(р)ф(у),
(р = d/dt) (38)
Здесь функция G(p)u описывает выходной процесс некоторого устойчивого, возможно бесконечномерного, объекта с входом и и импульсной переходной функцией g(t), удовлетворяющей при некотором <5 > 0 условиям
|<7(f)| <с,еЛ |ff(t)| < сд*Гн, t> 0 (39)
Неиомеряемая функция </>(j/(t)) удовлетворяет при некотором с$ условию
Ш1 < сфЫ (40)
Полиномы L(p), К(р) имеют соответственно степени п, п — 1. Рассмотрим соотношения
Цр) = (Р + h)R(p) + ¿¿(р)> К(р) = kt Щр) + А К(р), (41)
где R(p) - выбранный вьппе полином с наибольшим корнем (—г) < 0. Обозначим через £(■) преобразование Лапласа.' Тогда, еслп /д(<) := L~l(AL/R), kj{(t) := £~Х(£\К/В), то выполняются неравенства
\lR(t)\<l2*-rt, \kR(t)\<k2e~rt, t> 0 (42)
Предполагается, что известна априорная информация
{ ¡1 :=max|/i|, l2, kj :=max|fc]|, к2) с/, сд, п, Д, W } (43)
При синтезе регулятора существенными являются следующие этапы:
1) Уравнение (38) в смысле соотношений входа-выхода эквивалентно уравнениям
y + ay = (r,v) + [cgit+lif + h+h + h+krfiy)] -К, (44)
ДО := Sg(t - r)u(T)dr, /j(f) := } g(t - r)u(r)dT,
t ° t° (45) Mt) := SlR(t - r)/(r)dr, /3(i) := rkR(t - т)ф(у(т^т
Уравнения (44) и й = (/i,v) + rj можно записать в виде
v = Pvv+F(, (46)
где Pv - матрица с характеристическим полиномом Q(p).
2) Если Vv - решение матричного уравнения Ляпунова
PjVv + VvPv = -21, (47)
то на компакте W& существует значение у*:
7* := (sup ЦК||) (48)
3) Закон управления описывается уравнениями
у + ау = (т, V) + [7о|и| + 71/х + 72/2 + 7з7з + 74М] • ^п(у) (49)
«=(£,»). У-=У~У А = 5ДГ(а)) т = 5т(о) (50)
71 + 67, = И % + г/2 = % + г73 = ъ\у\ (51)
70 -=с2д> 71 := + с/> Ъ'=сдЬ, (ъ)г-=Сфк2, 74 (52)
а также уравнениями (36),(37),(33).
Теорема. Пусть для объекта управления (38) выполняются условия (39), (40), (42), (43). Обозначим
(У)2 := То + 7? + 72 + 27а + 74 (53)
Тогда адаптивный регулятор (36),(37),(33), (49)-(52) обеспечивает выпол-ненпе цели управления (2), если выполнено условие
0 < 7 < 7* (54)
где число 7* определено в (48).
Эта теорема дает условие, при котором полученный регулятор приводит к цели управления (2). Фактически это условие на малость возмущения по сравнению с "запасом устойчивости" замкнутой автономной системы управления. Действительно, константа 7* (48) зависит только от параметров объекта и регулятора, в то время как константа 7 определяется главным образом параметрами возмущения и не зависит от параметров объекта.
ВIII главе решается ¡задача адаптивного управления классом бес конечномерных спектральных динамических систем, описывающп: ся линейным дифференциальным уравнением
х = Ах+Ви, у = С*х, х(0) = х0 (55)
в гильбертовом пространстве X, с неограниченным замкнутым оператором А, генерирующим Со-полугруппу. Среди собственных чисел А, оператора А конечное число неустойчивых, и при некоторых сг > 0, М+, с\ > 0 и в > 1 они удовлетворяют следующим соотношениям
Б.еА1 > ... ИеА^ > -а > 11еА^++1 > ... (56)
^Нт = сд ("регулярность на бесконечности") (57)
Дальнейшие предположения об ОУ (55) формулируются в зависимости от выполнения свойства мннимально-фазовостп.
1) В §3.2 рассматривается случай, когда передаточная функция С(р) := СЯ{р,А)В строго минимально-фазовая (определ.4). Пусть
а= lim pG(p), IpH°O
6= lim p(pG(p) - а).
|р|—»oo
(58)
Предполагается, что известно значение signa (a ф 0) и что |Ь| < оо.
Метод синтеза адаптивного регулятора обобщает теорию неадаптпв-ных конечномерных регуляторов для рассматриваемого класса объектов, отталикиваясь от одного из известных алгоритмов 6. Полученный закон управления имеет весьма простую структуру:
u{t) = 7(i)z!(f)+/3(0*2 {t)-c(t)y{t),
7 = -Piyzi, ¿1 = Ллг21 + hy, ¿2 = Л jyZ2 + InU,
ß = ~РгУг2, C=y
Pi,2 > 0
' -A -2A 0 .. . 0 ' 0
An := 0 -A -2A .. . 0 , In ■= 0
0 0 0 .. . -A 1
(59)
(60)
(61)
Теорема. Существует значение N > N+ (Iff (Е Rw, N+ - число неустойчивых гармоник (56)), при котором закон управления (59)—(61) обеспечивает выполнение цели управления (3) при к = 2, при этом /0°° u2(t)dt < оо, ||z(i)||2<ii < оо.
2) В § 3.3 решена задача адаптивного управления для класса неминимально-фазовых спектральных объектов. При этом используются результаты главы II (§ 2.2) по управлению классом конечномерных неминимально-фазовых объектов с немоделпруемой динамикой: роль немо-делируеомй динамики в данном случае выполняет функция, описывающая влияние бесконечномерной устойчивой части объекта. В отлпчпе от минимально-фазового случая, здесь не выполняется условие (8) и возможно, что а = 0 (58). В то же время здесь вводятся дополнительные предположения о различии всех собственных чисел (А; ф Aj при г ф j), об ограниченности операторов В, С и ограниченности по крайней мере одного из операторов {АВ, АС}. Используется также дополнительная информация о параметрах ОУ:
(sign(cn!>n), 0 < А* < |cn6n| < А I, п= 1, JV},
(62)
6M. J. Balas. Exponentially Stabilizing Finite-Dimensional Controllers for Linear Distributed Parameter Systems: Galerkin Approximation of Infinite Dimensional Controllers // J.Math. Anal. Appl.f 1986. V.117. P. 358-384.
где сп := (С, Ф„), b„ := (В, Фп), Фп - собственные вектора оператора А, (•, ■) - скалярное произведение.
Систему (55) можно представить в впде
DN(p) y{t) = ( MN{p) + Dir{p)GH{p) ) u{t) (63)
n=l 11—1 p — Л„ n=W+l P — лп
Как видим, уравнение (63) имеет вид (38) и может рассматриваться как уравнение конечномерного объекта под действием немоделируемой динамики Gf{(p)u. Системы такого типа обычно называют моделью с аддитивным возмущением7. Значок N подчеркивает неопределенную пока степень полиномов и квазиполиномов в (63).
В соответствии с определением §2.2 а - вектор коэффициентов полиномов Df{(p), Млг(р). В.этом случае область II определяется как Н = {о |3п £ {1,...,JV}, что спЬп = 0}. Далее соотношение (41) заменяется соотношениями
= (Р + Iin)RN(P) + AJMp). W ••= -С"1 ,
а функции f(t), fi{t), fi(t) по-прежнему определяется соотношениями (45) с заменой g(t) на gn(t) = £_1((?#(р))1 g(t) на <?tf(i). И для уравнения (63) получаем эквивалентное уравнение, аналогичное (44):
У + оу = (г, v) + csu + lwf + h + f2 + С. (64)
Теорема. Закон управления, оппсывающийся уравнениями и соотношениями (49)-(52) при /3 = 0, 7з = 74 = 0, а также соотношениями (33), (36), обеспечивает выполнение ЦУ (2), если при некотором N выполняется неравенство
0 < < 7*, Ы2-= 2То + 71 + 72, (65)
где 7ff определено в (48).
Далее исследуется, при каких условиях неравенство (65) выполняется при некотором N. В отличие от конечномерного случая (§2.3) здесь эта проблема является центральной. Мы свободны в выборе полиномов Лдг(р), Qx(p), однако далеко не каждый их выбор влечет выполнение (65). В диссертации получен следующий результат.
Теорема. Пусть 0 < г = rj < гг < гз < ... и
ЫР) •= "шр + rn), Qn(P) = Rn(p)Rn(P)(P + r)(p + а) (66)
n=l
ТР. Ioannou, A. Datta. Robust adaptive control: Design, analysis and robustness bounds / Lect.Notes in Contr. and Inf. Sciences (P.V.Kokotovic, Ed.). - Springet-Verlag, Berlin. 1991. V.160. P. 71-152.
Тогда, если
lim = сд, (67) .
N—oo NS
(где значения sncj совпадают с определенными в (57) ), то lim = О, I lim = const > 0. Этим определяется выполнение, начиная с некото-
JV—+оо
poro N, условия (65).
Таким образом, мы пришли к следующему выводу: для реализации ' целей управления полученным регулятором достаточно, чтобы асимптотика корней полиномов Rp¡(p), Qn{p) повторяла асимптотику на беско-, вечности собственных чисел оператора А.
В главе IV разработан новый метод граничного управления одномерным волновым процессом. При граничном управлении и наблюдении операторы при переменных управления и наблюдения являются -неограниченными, поэтому методы главы III для синтеза закона управления здесь неприменимы. Потребовалось создание нового класса алгоритмов управления.
Управляемый объект описывается волновым уравнением на отрезке
= 0 < х < 1 (68)
Л
w{x, т) = 0, -^-(х, т)= 0, -4а < т < 0 (69)
f)yj с) zu
-kw(0,t) + l~{0,t) = f{t)1 mw(l,t)+n-£{l,t) = u{t) (70)
Л*), ,0_1, „ "(*)
y{t) := w(0,t)
где u(t) - управление, /(<) - равномерно ограниченное возмущение:
m = íbiMt)+Mt), (и)
«=i
где /i(t), i = Í,N - известные ограниченные функции класса С!([0,оо)), /o(í) - неизвестная ограниченная функция класса С1([0,оо)). Рассматривается следующая цель управления с заданным значением 7 > 0
Hm |y(i)| < су < 7 • с/, cj := max{ |/0(í)|, |/о(<)1 : « > 0 > (72)
С помощью преобразования Лапласа мы получаем уравнение
r(t+a) = ú(t) + s(¿-a)-h?j(t) + vo(t), t> 0 (73)
/, Im+nk... km .. па~,.\ im+nfe... km . . , ,
<*)■= --Ь:=[Ь1«-'М. «(«)== fa,-,*«
v<(i) := - а) - mfi(t + «) - - а) + /¿(f + а)]).
В зависимости от имеющейся априорной информации и точек прпло женил управляющего воздействия получены следующие результаты.
1) Неадаптивная постановка. Теорема Пусть все параметры иовеса ны. Тогда регулятор
û(t) = -s(t-a)-(b,v{t)), u(0) = 0, (74
обеспечивает выполнение ЦУ (72) при у = Су(п + т/а)/1, где значение с определяется коэффициентами п, а, I, m, к.
2) Пусть теперь коэффициенты Ь{ из (71) неизвестны. Уравнение (73 можно рассматривать как разностное уравнение
rt = Щ-а + st_2a + (b,vt) t = 0,а,2а,... (75
где п := r(t), щ := û(i), 9t := v0(t), vt := v(t), st := s(t). К разностном; уравнению (75) можно применить алгоритм управления "Полоска-2", раз работанный для управления дискретными объектами8. Теорема. Адаптивный регулятор
û(t) = -s(t-a) + (b(t),v(t)), u(0)=0, (76
b(t - 2а), |r(t- а)| < сг
b(t-2a)-(l-P)^, \r(t — а)| > сг (77
О, г < а
где сг := с/(п + т/а)/р1, 0 < р < 1, обеспечивает выполнение (72) пр] 7 = Су-(п-\-т/а)/р1. При этом процесс ¿(¿) ограничен. Еслип = 0, к = С то процесс и(£) также ограничен.
Специфика регулятора (76), (77) в том, что будучи "дискретным" п форме, он действует в непрерывном времени.
3) Наблюдение на правой границе объекта. В реальных условиях прс цесс ги(0, £) может быть не доступен наблюдению. Пусть измеряется прс цесс г({) := и>(1,£) вместе с производными четвертого порядка г = 1,4. Молено получить дифференциальное уравнение 4-го порядке
8В. Н.Фомин, А. Л. Фрадков, В.А. Якубович. Адаптивное управление динамическими объектами. М.: Наука, 1981. 447 с.
связывающее процессы г(£) и у(£). Решая его относительно у(£), мы можем вновь применить алгоритм управления (76). В этом случае требование измерения четырех производных г(£) на правой границе (по сравнению с требованием измерения вторых производных у(£) в разделе 2)), по-видимому, является неизбежной платой за тот факт, что выходной процесс у(Ь) в данном случае не измеряется.
4) Управление на левом конце объекта. Рассмотрим уравнение (68) с начальными условиями (69) и краевыми условиями
дхи д
- кт(0,Ь)+1-^(0,г) = /(£)+щ(£), тпи;(1>0 + п^(1,0 = 0 (78)
Как видим, здесь нет запаздывания управления относительно управляемого выхода. Далее выводится уравнение, связывающее у и и:
1ау(0 + Ау(«) = -и(г) - и(4 - 2а) + (г, *(*)) + £(£), (79)
где г - вектор неизвестных параметров, ст(£) - вектор-функция измеряемых функций, зависящих от у(£|£ — 2а), у(£|£ — 2а), и(£|£ — 2а), /¿(£|£ — 2а), уь > 0 - произвольное чпсло, г/(£) определяется возмущением /о(£). За пс-ключенпем слагаемого и(£ — 2а), уравнение (79) имеет вид уравнения (11) и соответственно могут быть использованы алгоритмы управления §2.1. Рассмотрим один из таких алгоритмов, содержащий квазп-спгнатуру для подавления постоянно действующего возмущения 1/(£).
Теорема. Пусть 0 < т < гпх, п > пх > 0; величины тп\, П1, а, /V, с/ известны. Тогда С( := тах{|£(£)| : £ > 0} < 2с/(1 + /х + т1/(л1а)), верхняя оценка с^ известна, и алгоритм управления
-«(£) = «(£- 2а) + (?(£), <т(£))-(с< + Д)Х(у(£),|), Д > 0, (80)
* = -Я<г(*)х(г/(0,с,), *(0) = 0, Я>0, (81)
обеспечивает цель управления (72) для любого заданного су > 0. (Здесь вектор-функция сг(£) определяется процессами и(£), у(£), функция х(у(0> су) изображена на рис. 1.) При этом суммарное время Т* нарушения неравенства |у(£)| < су не превьииает величины (||т||2/2Д||Я||).
Заметим, что функция %(у(£), су) в (81) выбрана таким образом, чтобы управление «(£) принадлежало классу функций С1([0, оо)) и соблюдались условия существования решения в замкнутой системе управления (68), (69), (78), (80), (81).
Публикации по теме диссертации
1. Окмянскпй В.А. Граничное управленпе одномерной распределенной системой при неизвестной ограниченной помехе / Депонировано в ВИНИТИ N 5714 от 15.07.88 г. С. 204-213.
2. Окмянский В.А. О синтезе адаптивных регуляторов с использованием нелинейных элементов релейного типа / Динамика систем: Качественно-численное исследование динамических систем: Меж-вуз.тематич.сб.науч.тр. под ред.Ю.И.Неймарка. - Горький: Иод-во Горьк.гос.ун-та, 1988. С. 103-120.
3. Бруспн В.А., Окмянскип В.А. Адаптивная стабилизация линейных объектов в классе регуляторов по выходу непрерывного действия // Автоматика и Телемеханика, 1991. N 2. С. 111-119.
4. Бруспн В.А., Окмянскпй В.А. Спнтез конечномерных адаптивных стабилизирующих регуляторов для одного класса бесконечномерных динамических систем / Тезисы 5-го Ленинрадского симпозиума "Адаптивные и экспертные системы в управлении". - Ленинград, 1991.
5. Бруспн В.А., Окмянский В.А. Об управлении одномерными упругими колебаниями в условиях априорной неопределенности / Динамика систем: Динамика и управление: Межвуз.тематпч.сб.науч.тр. под ред.Ю.И.Неймарка. - Нижний Новгород, йзд-во Нижегор.гос.ун-та. 1991. С. 21-36.
6. Бруспн В.А., Окмянский В.А. Синтез регуляторов для бесконечномерных неминимально-фазовых систем с параметрической неопределенностью и немоделируемой динамикой / Управление нелинейными системами: Сб.трудов Института системного анализа РАН. - Москва, 1993.
7. Бруспн В.А., Окмянский В.А. Синтез конечномерных адаптивных стабилизирующих регуляторов для одного класса бесконечномерных динамических систем // Известия РАН. Техническая кибернетика, 1993. N 4. С. 87-93.
8. Brusin V. A., Okmyanskii V. A. Robust control for infinite dimensional non-minimum phase systems / Proc. of 1st Asian Control Conf. Tokyo, Japan, 1994. V. 3. P. 503-506.
9. Brusin V.A., Okmyanskii V.A. On Adaptive Boundary Control by Wave Plant on the Segment with Disturbances // Pioc. 33rd IEEE Conference on Decision and Control. Orlando, USA, 1994. V. 4. P. 3430-3431.
10. Brusin V.A., Okmyanskii V.A. Adaptive control for SISO system with, disturbances bounded on the average // Proc. Third European Control Conference. Roma, Italy, September 1995. V. 2. P. 1307-1311.