Алгоритмы адаптивного управления неминимально-фазовыми и бесконечномерными системами тема автореферата и диссертации по математике, 01.01.11 ВАК РФ

Окмянский, Владимир Аркадьевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Нижний Новгород МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
01.01.11 КОД ВАК РФ
Автореферат по математике на тему «Алгоритмы адаптивного управления неминимально-фазовыми и бесконечномерными системами»
 
Автореферат диссертации на тему "Алгоритмы адаптивного управления неминимально-фазовыми и бесконечномерными системами"

СП

ОКМЯНСКИИ Владимир Аркадьевич

АЛГОРИТМЫ АДАПТИВНОГО УПРАВЛЕНИЯ НЕМИНИМАЛЬНО-ФАЗОВЫМИ И БЕСКОНЕЧНОМЕРНЫМИ СИСТЕМАМИ

Специальность 01.01.11 — Системный аналпо п автоматическое

управление

Автореферат

диссертации па сонскапие упеной степени кандидата физико-математических паук

Нижний Новгород, 1995

Работа выполнена в Нижегородской государственной архитектурно-строительной академнп.

Научный руководитель — доктор физико-математических наук, профессор В.А.Брусин.

доктор физико-математических наук, профессор Колмановский В.Б., кандидат физико-математических наук, старшин научный сотрудник Коган М.М.

Ведущая организация — Нижегородский государственный технический университет.

седанип диссертационного совета 11 1)63.7701 в Нижегородском государственном университете по адресу: г.Н.Новгород, пр.Гагарина, 23, корп.2, конференц-оал

С диссертацией можно ознакомиться в библиотеке Нижегородского университета.

Официальные оппоненты:

Защита состоится

на оа-

Автореферат разослан

1995 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность. В 70-80-е годы теорпя адаптивного управления развп-залась по пути расширения классов^управляемых динамических систем, аоиска математического обоснования уже известных эвристических "ал-горптмов, уменьшения априорной и апостериорной информации, увеличения требований к физической реализуемости алгоритмов управления (в гом числе в реальном времени), улучшения качественных характеристик гереходных процессов. Ю.Небмарк, В.Якубович, П.Монополи, Д.Ландау, :С.Нарендра, Б.Петров, В.Рутковскпй, В.Колмановскпй, А.Фрадков, В.Бру-;ин и другие авторы разработали алгоритмы управления конечномер-1ымп линейными объектами, включая задачи подстройки и слежения. Разработанные алгоритмы обеспечивали при любых начальных условиях 1Спмптотическое затухание либо приближение к эталонному сигналу выгодного процесса объекта, при использовании информации о параметрах )бъекта, сводящейся к его порядку и знаку старшего коэффициента чп-:лителя передаточной функции.

В то же время ряд требований к объектам управления, вытекающих га возможностей этих методов, сужают классы рассматриваемых объ-;ктов. К таким требованиям, в частности, относятся: измерение всего >ектора состояния объекта, устойчивость объекта по входу (минимально-[жзовость), равенство единице относительной степени передаточной функ-шп. Отрицательная особенность свойства немшшмально-фазовостп прошляется в возможности неограниченного роста управления при одновре-юнном достижении целей асимптотического затухания выходного провеса объекта. Однако реальные объекты управления часто являются •дновременно неустойчивыми, неминимально-фазовыми и допускающими гамерение только выходного процесса.

Одними из первых адаптивных динамических регуляторов по выходу :тали регуляторы, предложенные в работах П.Монополи, К.Нарендра. Однако в этих работах выдвигаются апостериорные предположения о схо-(имости переходных процессов и по существу нет доказательств равно-герной ограниченности управления и всего вектора состояния замкнутой :истемы. В работе В .Якубовича (1988) был предложен иной подход к синтезу адаптивного закона управления для конечномерных немпнпмально-Ьазовых объектов. Но данный алгоритм был дискретным и предполагал юзможностъ конечного числа "остановок" объекта. Позднее в работах 3.Лозано (1994) преодолены названные недостатки предыдущих работ, [о при этом предполагаются известными производные от выхода.

Таким образом, задача синтеза класса адаптивных регуляторов по вы-

ходу, работающих в реальном времени п вырабатываемых конечномерно реализуемой динамической системой, остается актуальной.

В последние годы также активно исследовались проблемы управлени распределенными, бесконечномерными динамическими системами (Рабе ты Р.Куртейн, М.Балаш, К.Ито, А.Бутковского.). Однако лишь немноги авторы (Т.Кобаяпш) пытались построить адаптивные регуляторы дл бесконечномерных объектов. При этом оаконы управления, построенны в известных нам работах, были также бесконечномерными и обеспечг вали цели управления при трудно проверемых условиях. Таким образол задача построения конечномерного адаптивного регулятора для класс распределенных объектов является актуальной и малоисследованной. Кр ме того, нас интересует постановка задачи, столь же "жесткая", как и конечномерном случае: измеряется только выходной процесс объекта, зг кон управления реализуется конечномерной динамической системой, сам объекты могут быть неминимально-фазовыми и с относительной стеш нью передаточной функции, превышающей единицу.

Распространение методов управления конечномерными объектами н бесконечномерные системы является не просто "делом техники". Ка правило, требуется доказать, что неучитываемые в законе управлени старшие гармоники (пусть и устойчивые) не внесут в совокупности т; кой вклад в движение замкнутой системы (управляемый объект + рег] лятор), который сделает ее неустойчивой. Для решения этой специфх ческой для теории управления бесконечномерными системами проблем] вводятся дополнительные предположения о свойствах описываемых обт ектов, об асимптотике собственных чисел на бесконечности; испольо] ются такие специальные методы анализа, как теория Со-полугрупп и ш финитезимальных операторов. В адаптивном случае эти особенност бесконечномерных систем усугубляются также нелинейностью алгорит мов управления и негрубостью замкнутой системы в смысле Андронов - Понтрягина.

Важным с точкп зрения приложений является также анализ грубост адаптивных систем по отношению к аппроксимациям идеального рел В регуляторах, в том числе адаптивных, в целях оптимальности по бь стродействию часто используют разрывные элементы типа реле1. 0,1 нако "идеальное" реле в соответствии с его математическим определ< нпем не может быть реализовано. Это только идеальная математичеекг модель, которая служит для обоснования некоторых глобальных свойст: На практике приходится сталкиваться с явлениями гистерезиса, запа: дыванпя и другими неидеальностями при реализации закона управлени.

1А.А.Андронов, А.А.Витт, С.Э.Хайкин. Теория колебаний. - М.: Наука, 1981.

содержащего реле. Возникает вопрос — как будут меняться свойства замкнутой системы, если идеальное реле заменить на его реализуемую аппроксимацию?

Для систем с разрывными нелинейностямп Ю.Неймарк, В.Уткин исследовали проблемы существованпя"скользящего режима и-существования так называемого пограничного слоя около поверхностей разрыва. Эти исследования, однако, носили локальный характер п проводплись: в окрест- • ности пограничного слоя (скользящего режима), на конечном промежутке времени, при начальных условиях из некоторой окрестпостп. В адаптивных системах ситуация осложняется их нелинейностью и негрубостью. Кроме того, требуются глобальные исследования при любых начальных данных и при ( 6 (0, оо).

Цель работы. Разработка математических методов управления, на основе которых получить новые адаптивные регуляторы по выходу в непрерывном времени для следующих классов динамических систем: 1) конечномерные немпнимально-фаоовые объекты, 2) бесконечномерные спектральные объекты, как минимально-фазовые, так и немпнпмально-фазовые, 3) волновые уравнения с граничным управлением и наблюдением, 4) конечномерные объекты с неизмеряемым постоянно действующим возмущением, с анализом робастности по отношению к аппроксимациям идеального реле.

Методы исследований. В исследованиях использовались методы теории глобальных функций Ляпунова, полугрупп неограниченных линейных операторов, конечно-сходящиеся алгоритмы решения рекуррентных целевых неравенств, теория дифференциальных включений для систем с разрывной правой частью, техника априорных оценок для исследования устойчивости нелинейных интегральных уравнений, возникающих в данных классах задач.

Научная новизна. В диссертационной работе синтезированы новые алгоритмы управления указанными выше классами объектов. По-новому осмыслены понятия минимально-фазовости объекта управления, относительной степени передаточной функции. Даны определения этих понятий, единые для конечномерных и бесконечномерных систем. Сформулированы условия, при которых конечномерные адаптивные динамические регуляторы по выходу обеспечивают цели управления для класса бесконечномерных спектральных объектов. Разработан метод граничного управления волновым уравнением, с использованием алгоритмов алаптпвного управления дискретными п конечномерными непрерывными объектами. Полученные результаты являются новыми.

Практическая ценность работы. Результаты работы могут быть ис-

пользованы как для управления конечномерными, так и распределение системами. При этом объекты управления могут быть подвержены i измеряемому возмущению, а априорная информация может быть весы необременительной. Немаловажно, что полученные регуляторы нспох оуют в качестве текущей информации, как правило, только скалярш выходной процесс объекта; это отражает реальные возможности, име: щиеся при управлении многими сложными объектами. Изложенные оде регуляторы работают в реальном времени и легко реализуемы компь; терной и аналоговой техникой, что также отвечает современным треб ваниям к управлению конкретными системами.

Апробация работы. Исследования по теме диссертации докладывали на всесоюзных и международных конференциях, в том числе на таю крупных конференциях по управлению, как Азиатская, Американская Европейская конференции IFAC.

Структура и объем работы. Диссертация состоит их пяти глав, вкш чая введение и заключение, и списка литературы из 44 наименовани Объем работы - 80 страниц.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

В первой главе (Введение) обосновывается актуальность темы Д1 сертадии, определяются цели исследования, формулируется общая пост новка задачи, излагаются достигнутые результаты и структура работ] а также даются основные определения.

Рассматриваемые динамические системы управления описываются, к; правило, дифференциальным уравнением

х = Xi(x,u,v, /), ж(0) = хо) У = X2{x,u,v; I), (:

где и - скалярное управление, у - скалярный выход объекта; v(t) - внешш возмущение, I - вектор параметров. Вектор состояния может быть кг конечномерным, так и бесконечномерным. Более общая формулиров! понятия динамической системы дана в книге2.

Ставится задача построения регулятора, при любых начальных уел виях стабилизирующего выходной процесс объекта в одном из следуюиц смыслов

lim y{t) = 0 (асимптотическое оатухание) ('

* dt < ОО, к = 1,2 (интегральная сходимость) (1

О

'Р.Калман, П.Фарб, М.Арбив. Очерки по математической теории систем. - М-: Мир, 1971.

^ 5 > 0. (днссипативиость в пределе) (4)

1Ы|с < 6 > 0 (сходимость в среднем) (5)

(норма К-Це определена ниже). Аналогичные требования в большинстве случаев предъявляются к управляющему сигналу u(t).

При этом закон управления должен вырабатываться конечномерной реализуемой системой дифференциальных уравнении

u = Wi{w,y,u;I), w = W2{ui,y,u;I), ш 6 R", (6)

-7

на вход которой поступает, как правило, только текущее значение наблюдаемого процесса y(t). Здесь I условно обозначает используемую априорную информацию о параметрах.

Мшшмально-фазовость. В рамках качественных характеристик системы управления под ее мпнпмально-фаоовостью понимают устойчивость системы по входу. Это означает, что в замкнутой автономной системе управления ограниченность выхода объекта влечет ограниченность управления, то есть выполнение неравенства типа ||ы|| < ci||y|| + сг в какой-либо норме пространства реализаций процессов y(t) и при любой реализации y(i). При этом наличие свойства минпмально-фазовостп не зависит от вида регулятора по выходу, замыкающего систему, а определяется свойствами самой системы.

Определение 1. Передаточная функция G(p) называется миннмаль-но-фазовой, если все ее нули расположены в левой полуплоскости: {RePl- < 0, G(pi) = 0 }.

Это определение равносильно следующему определению.

Определение 2. Передаточная функция G(p) будем называть минимально-фазовой, если существует к > 1, при котором для любого р. > 0

Z(G):=sup{|G(p)|, Rep>0}. (7)

Это определение включает в себя известное определение минпмально-фазовостп мероморфной передаточной функции - устойчивость ее числителя. Мы вводим также понятия относительной степени передаточной функции и строгой минпмально-фазовостп.

Определение 3. Величину m(G(p)) будем называть относительной степенью коэффициента передачи G(p), если

Hm G(p)pm(G(p)) £ {0, оо} (8)

Нетрудно убедиться, что значение т(С?(р)) равно минимальному значению к, прн котором выполняется условие (7).

Определение 4. Передаточную функцию G(p) будем называть строх минимально-фазовой, если ее относительная степень m(G(p)) = 1.

В конечномерном случае, когда G(p) = M(p)/D(p), где М, D - п< линомы, строгая минимально-фазовость означает, помимо гурвицевост числителя М(р), также то, что степень числителя не более чем на ед1 ницу меньше степени знаменателя, то есть относительная степень G(j равна единице. Как правило, именно это условие требуется при синтес алгоритмов управления; рациональную дробь M/D в этом случае так» называют строго правильной. Заметим, что случай большей чем 1 о: носительной степени путем модернизации алгоритма управления може свести к случаю строгой минимально-фазовости, однако эта модерниз; ция осуществляется ценой использования в регуляторе производных о выхода.

Перед расмотрением более сложных классов управляемых объекто: в главе II (§2.1) рассмотрена задача управления минимально-фазово конечномерной динамической системой, подверженной действию пост< янно действующего неизмеряемого возмущения

D{p)y(t) = M{p)u{t) + N{p)v{t) + jy(t), (p = d/dt)

где у{1) - выход, «(г) - управление; г>(г) - параметрически неопределе! ное возмущение, - неизмеряемое возмущение, про которые извести следующее:

К') = Ё

¿=1

|i/(i)| <

где ограниченные функции V{(t) известны, параметры с,- неизвестны. ' отличие от v(t) возмущение v{t) мы называем непараметрическим. Пре; полагается, что полиномы D, M имеют вид D(p) — рп + aipn~l + ... + а, М(р) = 6ipn_1 + ... + Ьп, bi > 0, и полином М(р) гурвицев. Объект (9 таким образом, является строго минимально-фазовым , а относительна степень передаточной функции равна 1. Далее строится адаптивный з< кон управления, содержащий реле, и исследуется поведение системы пр различных аппроксимациях этого реле.

1) Пусть <х, Xi (А; ф Aj при г ф j) - произвольные положительнь: числа, R(p) = П"=2(р+Ai) - гурвицев полином. Уравнение (9) эквивалетв системе уравнений (в смысле соотношений входа-выхода)

у + ау = biu + h ■ w + uR + £

1

p + ' p H- A3 ' " ' ' p + A„

M*) i

R(P)

v(t) 0

(11

где h - вектор обобщенных неизвестных параметров. (Здесь и далее запись x{t) — обозначает любое решение уравнения F(p)x(t) = v(t).) Тогда В

соответствпп с известными алгоритмами адаптивного управления3 закон управления возьмем в виде

u{t) = h(t)w(t) - МЦу, t), М = Sili-t-il, т > о (13)

о о

h = -Sw{t)V(y,t), S = ST> 0 (14)

Здесь CvR := sup - константа, определяемая из величины си (10)

«

и уравнения (12); S - произвольная симметричная положительно определенная матрица. Новым элементом по сравнению с предыдущими алгоритмами данного типа является введение вместо обычно используемых функций y(t), sign y{t) более широкого класса функций Ф(у, £), Ф(у, t), призванных исследовать поведение системы в условиях "реального" реле. Подстановка (13) в (11) дает уравнение

y + <ry=:h-w + vR + €-M${y,t), h:=h + bih (15)

2) Виды нелинейностей Ф, Ф. Определим однозначную функцию sign 5 = {-f-1, s > 0; —1, s < 0; 0, s = 0} и многозначные функции

фл(з) := { sign(s), |s| > Д; [-1,1], |s| < Д } </'д(«) := { s, M > А; [0,±Д],« = ±Д; 0, |s| < Д } (16)

:= { sign(e), M > Д; [0, ±1], s — ±Д; 0, |s| < Д }

Лемма. Пусть функции Ф, Ф из (13), (14) входят в классы функций: Ф е-йГ* = {0дж; Л1>0}, Ф &К9 = {Фь,-ФЪ,ФЪ; А > 0}, (17)

х - вектор состояния замкнутой системы управления (11)- (14). Тогда эта система, рассмотренная как дифференциальное включение

$ в /(*,«), хТ:=[гиТ,КТ] (18)

3В.А.Брусин, М.В.Лапшина. Об одном классе непрерывных алгоритмов адаптивного управления // Автоматика и телемеханика, 1980. N 10, с. 81-90; N 12, с. 65-71.

имеет решение, под которым понимается абсолютно непрерывная вектор функция я(<), удовлетворяющая включению (18) для всех <, для которы: существует производная ¿ж/Л.

Эта лемма вытекает из теоремы 2.2.14 о существовании решения х(Ь) удовлетворяющего включению (18) и начальному условию. Функции (16 и условие (17) таковы, что функция /(ж,*) - правая часть (18) - являете полунепрерывной и множество ее значений в каждой точке замкнуто ограничено и выпукло. Таким образом, несмотря на то, что функции (16 являются разрывными, они обладают свойствами, необходимыми для су ществования решения дифференциального включения. Однако единствен ности решения в нашем случае может не быть.

Функцию 81дп(в) мы называем идеальным реле, а функции класса К, введены для его аппроксимации. Необходимость аппроксимации объясни ется тем, что реализация в законе управления идеального реле возможн только приближенно. Каким бы сверхточным прибором не вырабатыва лось реле, вряд ли возможно избежать явлений запаздывания, гистерези сов и других "незапланированных" нелинейностей. В линейных и грубы: системах управления такие неидеальности, если они малы, как правиле нивелируются запасом устойчивости замкнутой системы. В то же врем нелинейные системы с обратной связью не всегда являются грубыми П1 отношению к таким явлениям, что в частности будет показано ниже. Эт1 особенно относится к рассматриваемым нами адаптивным регулятора! в силу особенностей уравнений (14).

3) Идеальное реле в законе управления (13). Вначале рассматри вается случай, когда в законе управления (13) действует идеальное рел Ф(у,<) € Фо{у), а в уравнении подстройки (14) Ф(у,г) = ФКу) = у■ Хот: реле фо(у) не совпадает с функцией sigп(t/), его "идеальность" эаключа ется в том, что неопределенность имеет место только при у(Ь) = 0, но н распределена в какой-либо полосе |у| < Л.

Теорема. Регулятор (12), (13), (14) при Ф € фа, Ф = ^о осуществляв' цели управления (2), (3). При этом процессы у{1), у({), и(<) и весь векто] состояния замкнутой системы управления равномерно ограничены.

4) Вариант с двумя идеальными реле. В предыдущем пункт было рассмотрено действие регулятора с одним идеальным реле, при это» достигалась наиболее сильная цель управления. Рассмотрим вариант ^ двумя идеальными реле в уравнениях (13), (14): Ф 6 ^о, $ 6 фо- С одно] стороны, в этом случае настройка регулятора при |*/| > 0 происходи1: быстрее, и в целом характеристики переходного процесса лучше. Однак(

4А. Х.Гелкг, В. А.Леонов, В.АЛхубович. Устойчивость нелинейных систем с неединствеиным состс лнием равновесия. - М.: Наука, 1981. 400 с.

движение в скользящем режиме может сопровождаться неограниченным ростом управления.

Определим так называемую "доопределенную нелинейность" &(£)

------------------------------------то, о -ыо^фоош (19)

Это означает, что при у = 0 функция &(£) принимает значения из отрезка [—1,1]; при этом &(£) является измеримой кусочно-непрерывной функцией £ и однозначно доопределяется в каждый момент времени в замкнутой системе (18). Далее, пусть при £ € [£ь£г] 2/(0 = 0, 2/(0 = 0. Тогда мы можем получить из уравнения (15) явное выражение для

6(0 = (М^г'ы*) + М0Ч0 + £(0] (20)

Введем функцию Ляпунова К(£) := ¡'/(01 4- 2£-Лг(£)5-1Л(£)- Ее производная, в силу (15), (14) и с учетом Ф(у(£),= &(£) , при £ 6 [^»¿г] имеет вид У^) = -¿»(О^О^я^) + + Отсюда видно, что на тех

промежутках времени, когда 81дп[Л(0«>(0] = -sign£l(f) = ~5]§п[//д(£) + /г(0«/(£) + £(0]> функция У{1) будет возрастать, а вместе с ней будут возрастать подстраиваемые коэффициенты /г(£) и управление м(£).

Аналогично можно показать, что регуляторы (13), (14), (12) при {Ф = Фац Ф ~ ф\ или Ф = Д] > Д} - также могут привести к неограниченному росту управления в скользящем режиме. Далее мы показываем, как можно исправить эту ситуацию.

5) Регулятор с "мертвой" зоной. Пусть

Ф(г/,0 е<Ыг/), 6 фкл{у), Д>Дь (21)

(к = 1,2). То есть предполагается, что все "непдеальностп", возникающие при реализации сигнатуры signг/(í) и описываемые функцией фд,(у), сосредоточены в полосе |г/| < Д^ при этом "мертвая зона" |у| < Д, внутри которой согласно выбору функции "Ф (21) настройка коэффициентов ?г(£) не производится, перекрывает зону неопределенности |т/| < Дь

Теорема. Пусть регулятор описывается уравнениями (13), (14), (21). Тогда для любого 5 > Д выполняется цель управления (4). При этом процессы у(£), 2/(0, и(£) и вектор состояния ж(£) равномерно ограничены; суммарное время Т^ := {< : ¡2/(01 > ¿>}> в течение которого траектория заходится вне полосы |г/| < 5, также ограничено.

6). Дополнительная априорная информация об обобщенных параметрах объекта. Пусть известны границы, в которых лежат ком-гоненты вектора к /ц: /г,- £ [Л-,/1-]. Изменим настройку вектора /г(£) с '14) на следующую:

к = -БюЩу, 0 - ад, Л,-(0) € [-/»?, -Л?] (22)

где Р(к)т := [.Рь... и функции ^ изображены на рис. 1.

Легко видеть, что штрафные функции гарантируют включение

{/г,(4) 6 (—е — А?, е — А-), < > 0} независимо от характера процессов Ф(у). Преимущество уравнения настройки (22) с штрафными функциями для А(£) заключается в том, что в качестве функции Ф(у, ¿) теперь можно использовать любую го нелинейностей (16), а не только как I предыдущих разделах, поскольку ограниченность настраиваемых параметров А(£) достигается независимо от характера движения в скользящей режиме.

Х{у,су) /Т~

-А?-

-к\ -Ц + е

Рис. 1

Ас

-1-

2с ЗУ

Теорема. Регулятор (12), (13), (22) при любых функциях Ф, Ф из классов (17) обеспечивает выполнение ЦУ (4), где 6 = тах{Л1,Л}.

7) Возмущение, ограниченное в среднем. В предыдущих разделах рассмотрен вариант неизмеряемой, но при этом равномерно ограниченной помехи и{1). В уравнении регулятора (13) возмущение гасилоа нелинейностью, амплитуда которой заведомо превышала уровень возмущения. Однако в случае сильно неоднородной помехи, когда относительно малые возмущения сочетаются с кратковременными всплесками различной амплитуды, использование алгоритма для равномерно ограниченно! модели помехи может привести к избыточным затратам на управление и к установлению в асимптотике большого коэффициента усиления регулятора. Рассмотрим вариант неизмеряемой помехи ограниченной I среднем:

< с„,

(2з;

Введем функции 0(Т) и новую "индуцированную норму"

Ну

ад := {

б^П У, 0,

М><5 М<<5

в(Т):= /|Ф ,(»(«))|Л (24;

и предположим, что

1 т

где возмущение iопределено вьпне (12). Заметим, что для равномерно ограниченной помехи условие (25) всегда выполняется, а в случае стационарного случайного процесса невыплнение (25) при выполнении (23) возможно только в практически игнорируемых случаях.

Закон управления возьмем в виде ------- - -----------------------

u(t) = h{t)w(t) - 0(<)ФдШ, t), Ф 6 ФьШ) (26)

ft =-Sw(t)9s(y(t)), в = |Ф<(1/(0)|, 0(0) = 0 (27)

Теорема. Пусть выполнены оценки (23), (25), 5, Д - заданные положительные числа, S > Д. Тогда адаптивный регулятор (12), (26), (27) обеспечивает выполнение цели управления (5) при ||u|jc < оо.

Подчеркнем, что в отличие от вышеизложенных алгоритмов управления, закон управления данного раздела не использует точного значения константы с„ (23), характеризующей уровень помехи v(t). Фактически константа М в (13) заменена здесь настраиваемой функцией 0(t) (26). Этот способ подавления помехи может быть применен и в случае равномерно ограниченной помехи с неизвестной верхней границей.

В §2.2 решена задача об адаптивном управлении классом неминимально-фазовых конечномерных объектов без возмущения:

D(p)y(t) = M(p)u(t) (р = d/dt) (28)

где D(p) = рп + d\pn~l + ... + dn, М(р) = m\pk + •.. rrik+i ~ взаимно простые полпномы, к < п. В отличие от §2.1, здесь не предполагается, что к — п — 1 и полином М(р) гурвпцев.

Обозначения: а := col(di,..., dn, т\,..., mn) - вектор коэффициентов полиномов D(p), M{jp). Предполагаются известными порядок объекта га, а также следующая априорная информация о векторе а. Заданы выпуклая замкнутая область W в пространстве R2" и число Д > 0 такие, что для всех а, для которых p(W,a) < 2Д, выполнено (D,M) — 1, где р(-,-) -расстояние между множествами; (•, ■) - наибольший общий делитель.

Схема решения задачи об адаптивном управлении. 1) Неада-птпвнып стабилизирующий регулятор может быть взят в виде5

a{p)u{t) = (3(p)y(t) (p = d/dt), (29)

где полином а(р) и полином (3(р) определяются пз уравнения

_Q(p) = D(pHp) - М(р)Р(р), (30)

5В.А.Якубовпч. Адаптивная стабилизация непрерывных линейных объектов // Автоматика и телемеханика, 1988. N 4. С. 97-107.

Я(р) - заданный гурвицев полином степени 2п. Если (I - вектор коэффициентов полиномов а(р), /3(р), то соотношение (30) задает однозначное соответствие:

<* = Гв(а), (31)

с областью определения -£>(Гд) = {а | р(IV, а) < 2Д}.

2) Заменим уравнения (28) и (29) эквивалентными уравнениями

'S 0 z + ' 1 0'

Z — 0 5 0 У + 1

v :=

У 0

и , 1 := i

z 1

(32)

(33)

где а > 0 — число, 5 -.устойчивая матрица порядка п — 1; £(<) = е5'£(0), т}{1) = е^7](0) - экспоненциально затухающие процессы, вектора г, р, определяются взаимно-однозначными соответствиями

г = Sr(a) = STla -f sr2,

ц = S„(d)

(34)

3) Введем новые переменные о(£), г(£), /¿(¿), г/(<), которые будем трактовать как "оценки" соответствующих процессов без "крышек", уравнениями ^

у + сгу = (т,у), й-(р,,у), (35)

а = (ьу - Ф(а)), т=5г(а), Д = 5^(Гд(а)), о(0) € ^ (36)

с произвольными начальными условиями,

(a-pw(fi)),^^,. А < p(W,a) < 2Л

0,

(37)

p{W, а) < Л

Здесь где матрица STi определена в (34), Р\у - оператор проектирования на область W, Ф(а) можно понимать как "штрафную" вектор-функцию, не позволяющую a(t) покинуть область W&.

Теорема. Адаптивный регулятор (33),(35)-(37) обеспечивает выполнение цели управления (2). При этом вектор состояния w := col (у,у, у\ща) замкнутой системы равномерно ограничен.

В §2.3 проводится обобщение на случай действия на ОУ неио-меряемых возмущений. Эти возмущения включают в себя: а) аддитивное возмущение передаточной функций, б) нелинейность секторного типа, зависящую от выходного процесса. Объект управления:

D(P)y(t) = (М(р) + L(p)G(p)) u(t) + К(р)ф(у),

(р = d/dt) (38)

Здесь функция G(p)u описывает выходной процесс некоторого устойчивого, возможно бесконечномерного, объекта с входом и и импульсной переходной функцией g(t), удовлетворяющей при некотором 5 > 0 условиям

----------------------Ш\ < с/е"",------------\g{t)\ < cgc"st, t > 0 (39)

Непзмеряемая функция <j>(y(t)) удовлетворяет при некотором с$ условию

Иг/)1 < (40)

Полиномы L(p), К(р) имеют соответственно степени п, п — 1. Рассмотрим соотношения

L(p) = (р + h)R(p) + AL(p), К(р) = ЪЩр) + АК(Р), (41)

где R{p) - выбранный выше полином с наибольшим корнем (—г) < 0. • Обозначим через £(•) преобразование Лапласа." Тогда, если /r(í) := £-1(Д£/Л), k¡i(t) С~1(АК/Я), то выполняются неравенства

M*)l<*ae-rt, ¿>0 (42)

Предполагается, что известна априорная информация

{ l\ :=max|íi|, 12, k\ :=max|fci|, c$, с/, с,, n, Д, W } (43)

При синтезе регулятора существенными являются следз'ющие этапы:

1) Уравнение (38) в смысле соотношений входа-выхода эквивалентно уравнениям

y + ay={r,v)+ [cgu + hf + h + }2 + /з + fci^y)] +£, (44)

f(t) := fg(t - r)u(r)dT, /1 (í) :=}g(t - r)u(r)dr,

< ° t° (45) /2(<) := /М« " r)/(r)ár, /з(0 := JkR(t - T)^(»(r))dT

o o

Уравнения (44) nú= и) + т] можно записать в виде

v = Pvv + Fb (46)

где Pv - матрица с характеристическим полиномом Q(p)-

2) Если Vv - решение матричного уравнения Ляпунова

P?Vv + VvPv = -21, (47)

то на компакте W& существует значение 7*:

7* := Í sup i|V„|A (48)

\а6^д j

3) Закон управления описывается уравнениями

у + еу = {т, V) + [70М + пц7х + 72/2 + Тз7з + Т4М] • (49)

и =(£,»), у:=у-у Д = 5ДГ(а)) т = 5г(о) (50)

71+б71 = |п| % + г7г = 71 7 Ъ + г7з = 73 М (51)

То с5> 71 —с«,?! +С/, 72 :=с,/2, Ы)2'■= сфк2, 74 •'= сДь (52)

а также уравнениями (36),(37),(33).

Теорема. Пусть для объекта управления (38) выполняются условия (39), (40), (42), (43). Обозначим

"(т)2 := То + 7\ + 7г + 27з + Т42 (53)

Тогда адаптивный регулятор (36),(37),(33), (49)-(52) обеспечивает выполнение цели управления (2), если выполнено условие

0 < 7 < 7* (54)

где число 7* определено в (48).

Эта теорема дает условие, при котором полученный регулятор приводит к цели управления (2). Фактически это условие на малость возмущения по сравнению с "запасом устойчивости" замкнутой автономной системы управления. Действительно, константа 7* (48) зависит только от параметров объекта и регулятора, в то время как константа 7 определяется главным образом параметрами возмущения и не зависит от параметров объекта.

В III главе решается задача адаптивного управления классом бес конечномерных спектральных динамических систем, описывающи ся линейным дифференциальным уравнением

х = Ах + Ви, у = С* х, х(0) = ж0 (55)

в гильбертовом пространстве X, с неограниченным замкнутым оператором А, генерирующим Со-полугруппу. Среди собственных чисел А{ оператора А конечное число неустойчивых, и при некоторых а > 0, Л^, с\ > 0 и в > 1 они удовлетворяют следующим соотношениям

11еА1 > ... КеАлг+ > -а > КеАдг++1 > ... (56)

Цт г = сд ("регулярность на бесконечности") (57)

Дальнейшие предположения об ОУ (55) формулируются в зависимости от выполнения свойства минимально-фазовости.

1) В §3.2 рассматривается случай, когда передаточная функция в(р) := СЩр, А)В строго минимально-фазовая (определ.4). Пусть

lim pG(p),

Ь= lira p{pG{p) - а).

|р|—оо

(58)-

Предполагается, что известно значение sign а (а ф 0) п что < оо.

Метод синтеза адаптивного регулятора обобщает теорию неадаптивных конечномерных регуляторов для рассматриваемого класса объектов, отталикиваясь от одного из известных алгоритмов 6. Полученный закон управления имеет весьма простую структуру:

u(i) = %t)zx(t) + p{t)Zl(t) - c{t)y{t),

7 = -Piyzi, ij = Ajy^i + lNy, ¿2 = Адrz2 + ijfu,

P=~P2yz2, ¿=y

pi,2 > 0

■ -A -2A 0 . . 0 0 '

Aw := 0 -A —2A .. . 0 , lN := 0

0 0 0 . . -A 1

(59)

(60)

(61)

Теорема. Существует значение N > Ы+ 6 IV, - число неустойчивых гармоник (56)), при котором закон управленпя (59)—(61) обеспечивает выполнение цели управления (3) при к = 2, при этом /0°° и2(1)<И < оо, /0°°||х(<)||2^ < то.

2) В § 3.3 решена задача адаптивного управленпя для класса неминимально-фазовых спектральных объектов. При этом используются результаты главы II (§ 2.2) по управлению классом конечномерных неминимально-фазовых объектов с немоделируемой динамикой: роль немо-делпруеомй динамики в данном случае выполняет функция, описывающая влшшпе бесконечномерной устойчивой части объекта. В отлпчпе от минимально-фазового случая, здесь не выполняется условие (8) и возможно, что а — 0 (58). В то же время здесь вводятся дополнительные предположения о различии всех собственных чисел (Л; ф при г -ф ]), об ограниченности операторов В, С и ограниченности по крайней мере одного из операторов {АВ,АС}. Используется также дополнптельная информация о параметрах ОУ:

{sign(cA),0 < Ai < |cn6n| < ДI п = 1 ,N},

(62)

»M. J. Balas. Exponentially Stabilizing Finite-Dimensional Controllers for Linear Distributed Parameter Systems: Galerkin Approximation of Infinite Dimensional Controllers // J.Math.AnaLAppl., 1986. V.117. P. 358-384.

a

где сп := (С,ФП), Ьп := (£,Ф„), Ф„ - собственные вектора оператора А, (•, •) - скалярное произведение.

Систему (55) можно представить в виде

Dn{p) y(t) = ( mN{p) + 0„(р)0„(р) ) u(t) (63)

Л*(Р):=П(Р-А»), ¿MP) <МР) ■'= £ -Щ-

п=1 п=1 р — Л„ п=ЛГ+1 Р - лп

Как видим, уравнение (63) имеет вид (38) и может рассматриваться как уравнение конечномерного объекта под действием немодеппруемой динамики G/í(p)u. Системы такого типа обычно называют моделью с аддитивным возмущением7. Значок N подчеркивает неопределенную пока степень полиномов и квазиполиномов в (63).

В соответствии с определением § 2.2 о - вектор коэффициентов полиномов Dt/(p), Mff(p). В.этом случае область Н определяется как II = {а |3га £ {l,...,iV}, что спЬп = 0}. Далее соотношение (41) заменяется соотношениями

Dn(p) = (р + Iw)Rn(p) + ЛВД, lR(t) := С-1 ,

а функции /(í), fi(t), /г(£) по-прежнему определяется соотношениями (45) с заменой g(t) на <7jv(í) = £-1((?дг(р)), g(t) на gn{t). И для уравнения (63) получаем эквивалентное уравнение, аналогичное (44):

У + *У = {т, v) + сди + l1Nf + /i + /2 + 6 (64)

Теорема. Закон управления, описывающийся уравнениями и соотношениями (49)-(52) при /3 = 0, 7з = 74 = 0, а также соотношениями (33), (36), обеспечивает выполнение ЦУ (2), если при некотором N выполняется неравенство

0<7*<7ю (Tjv)2 := ^То + 7i + 7г> (65)

где 7ff определено в (48).

Далее исследуется, при каких условиях неравенство (65) выполняется при некотором N. В отличие от конечномерного случая (§2.3) здесь эта проблема является центральной. Мы свободны в выборе полиномов Rn(p), Qn{p), однако далеко не каждый их выбор влечет выполнение (65). В диссертации получен следующий результат.

Теорема. Пусть 0 < г = ri < г2 < г3 < • • ■ и

R¡f{p) := Ii (р + r„), QN{p) = RN(p)RN(p)(p + r)(p + о) (66)

n=l

ТР. loannou, A. Datta. Robust adaptive control: Design, analysis and robustness bounds / Lect.Notes in Conti, and Inf. Sciences (P.V.Kokotovic, Ed.). - Spiingej-Veilag, Berlin. 1991. V.160. P. 71-152.

Тогда, если

fe^ = (6?)

(где значения s и сд совпадают с определенными в (57) ), то lim 7» = О, ~ I lim 7jy| = const > Or Этим определяется выполнение, начиная с некото-

N—*oo

poro N, условия (65).

Таким образом, мы пришли к следующему выводу: для реализации целей управления полученным регулятором достаточно, чтобы асимптотика корней полиномов Rf¡(p), Qn(p) повторяла асимптотику на бесконечности собственных чисел оператора А.

В главе IV разработан новый метод граничного управления одномерным волновым процессом. При граничном управлении и наблюдении операторы при переменных управления и наблюдения являются неограниченными, поэтому методы главы III для синтеза закона управления здесь неприменимы. Потребовалось создание нового класса алгоритмов управления.

Управляемый объект описывается волновым уравнением на отрезке -,â2w, , d2w,

аw(x,t) = d^(x,t)' °<*<l (68)

dzv

W(X,t)= 0, ~(X,T) = 0, —4a < г < 0 (69)

dw ôiu

- kw(0,t) + l~(0,t) = f(t), mw(l,t)+n-^{l,t)=u(t) (70)

/(*), ,0_u(t)

. y(t) := w(0, t)

где u(t) - управление, f(t) - равномерно ограниченное возмущение:

/(o = í;w)+/o(i)> (n)

¡=1

где /¿(í), i = l,N - известные ограниченные функции класса Сх([0, оо)), f0{t) - неизвестная ограниченная функция класса С'([0,оо)). Рассматривается следующая цель управления с заданным значением у > 0

Ш\УШ <cy<7-Cf, cf := тах{ |/0(i)|, |/о(01 : * > 0 ) (72)

t—юо

С помощью преобразования Лапласа мы получаем уравнение

r(t + а) = ù(t) + s(t - a) + 77(f) + v0(t), t> 0 (73)

па.... lm + nk.,. km , ч , , ,,

r(t) •= y2/(<) + —¿f—m + v{t) := (ъ, v(t)),

/ na..,,s lm + nk., . km .... r, , , <t)~YyW--b:=K-M v(t):=[vu...,vj

M*) := -a) - "»/«(* + a) ~ MM* ~ a) + H* + «)])•

В зависимости от имеющейся априорной информации и точек прил< жения управляющего воздействия получены следующие результаты.

1) Неадаптивная постановка. Теорема. Пусть все параметры извес: ны. Тогда регулятор

ù(i) = -s(t - а) - {b,v(t)),

u(0) = О,

обеспечивает выполнение ЦУ (72) при 7 = Су(п + т/а)/1, где значение с определяется коэффициентами п, а, I, тп, к.

2) Пусть теперь коэффициенты 6; из (71) неизвестны. Уравнение (73 можно рассматривать как разностное уравнение

rt = Wt_a + st—2а + (Ь, vt) + et,

t = 0, a, 2a,...

(75

где rt := r(t), щ := ii(t), 0t := v0{t), vt := v(t), st := s(t). К разностном уравнению (75) можно применить алгоритм управления "Полоска-2", рас работанный для управления дискретными объектами8. Теорема. Адаптивный регулятор

м(0) = О,

| r(t-a)\<cr |r(t - a)| > сг

(76 (77

u{t) = -s{t- a) + (b{t),v{t)), b(t - 2а),

О, t < а

где сг '■= cf(n + m/a)/pl, 0 < р < 1, обеспечивает выполнение (72) npi 7 = с-, • (n + m/a)/pl. При этом процесс u(t) ограничен. Если п = 0, к = С то процесс u(t) также ограничен.

Специфика регулятора (76), (77) в том, что будучи "дискретным" и форме, он действует в непрерывном времени.

3) Наблюдение на правой границе объекта. В реальных условиях про цесс ш(0,t) может быть не доступен наблюдению. Пусть измеряется про цесс z(t) := w(l,t) вместе с производными четвертого порядка ¿(''(f) г = 1,4. Можно получить дифференциальное уравнение 4-го порядка

8В. Н.Фомин, A. JI. Фрадков, В.А. Якубович. Адаптивное управление динамическими объектами. М.: Наука, 1981. 447 с.

связывающее процессы г(Ь) и г/(£). Решая его относительно у{Ь), мы можем вновь применить алгоритм управления (76). В этом случае требование измерения четырех производных л(¿) на правой границе (по сравнению с требованием измерения вторых производных т/(£) в разделе 2)), по-видимому, является неизбежной платой за тот факт, ^что выходной-процесс у(£) в данном случае не измеряется.

4) Управленпе на левом конце объекта. Рассмотрим уравнение (68) с начальными условиями (69) и краевыми условпяш!

дъи ди)

- Ы(0, £) +/-^(0, £) = /(£)+ти,{1,1) + п~{ 1,г) = 0 (78)

Как видим, здесь нет запаздывания управления относительно управляемого выхода. Далее выводится уравнение, связывающее ути:

1ау{1) + Ау(г) = -иЦ) - и(г - 2а) + (г, <т(£)) + £(£), (79)

где т - вектор неизвестных параметров, сг(£) - вектор-функцпя измеряемых функций, зависящих от г/(£|£ — 2о), у(£|£ — 2а), и(£|£ — 2а), /,-(£|< — 2а), ц > 0 - произвольное число, р(£) определяется возмущением /о(£). За исключением слагаемого и(£ — 2а), уравнение (79) имеет вид уравнения (11) и соответственно могут быть использованы алгоритмы управления § 2.1. Рассмотрим один из таких алгоритмов, содержащий квазп-спгнатуру для подавления постоянно действующего возмущения г/(£).

Теорема. Пусть 0 < т < тпь п > п^ > 0; величины ттц, п1г а, N, с; известны. Тогда с^ := тах{|£(£)| : £ > 0} < 2сД1+/¿ + 7711/(7110)), верхняя оценка с^ известна, и алгоритм управления

-«(0 = «(«-2а) + (т(4),сг(0)-(с« + А)хЫ0.|). Л > (80) * = Цо) = о, (81)

обеспечивает цель управления (72) для любого заданного су > 0. (Здесь вектор-функцпя сг(£) определяется процессами и(£), т;(£), функция х{у{^),су) изображена на рис. 1.) При этом суммарное время Т* нарушения неравенства |у(£)| < Су не превьппает величины (||г||2/2А||Д||).

Заметим, что функция х(у(£), су) в (81) выбрана таким образом, чтобы управленпе и(£) принадлежало классу функций С1([0, оо)) и соблюдались условия существования решения в замкнутой системе управления (68), (69), (78), (80), (81).

Публикации по теме диссертации

1. Окмянский В.А. Граничное управленпе одномерной распределенной системой при неизвестной ограниченной помехе / Депонировано в ВИНИТИ N 5714 от 15.07.88 г. С. 204-213.

2. Окмянский В.А. О синтезе адаптивных регуляторов с использованием нелинейных элементов релейного типа / Динамика систем: Качественно-численное исследование динамических систем: Меж-вуз.тематич.сб.науч.тр. под ред.Ю.И.Неймарка. - Горький: Изд-во Горьк.гос.ун-та, 1988. С. 103-120.

3. Брусин В.А., Окмянский В.А. Адаптивная стабилизация линейных объектов в классе регуляторов по выходу непрерывного действия // Автоматика и Телемеханика, 1991. N 2. С. 111-119.

4. Брусин В.А., Окмянский В.А. Синтез конечномерных адаптивных стабилизирующих регуляторов для одного класса бесконечномерных динамических систем / Тезисы 5-го Лешшрадского симпозиума "Адаптивные и экспертные системы в управлении". - Ленинград, 1991.

5. Брусин В.А., Окмянский В.А. Об управлении одномерными упругими колебаниями в условиях априорной неопределенности / Динамика систем: Динамика и управление: Межвуз.тематич.сб.науч.тр. под ред.Ю.И.Неймарка. - Нижний Новгород, Изд-во Нижегор.гос.ун-та. 1991. С. 21-36.

6. Брусин В.А., Окмянский В.А. Синтез регуляторов для бесконечномерных неминимально-фазовых систем с параметрической неопределенностью п немоделпруемой динамикой / Управление нелинейными системами: Сб.трудов Института системного анализа РАН. - Москва, 1993.

Т. Брусин В.А., Окмянский В.А. Синтез конечномерных адаптивных стабилизирующих регуляторов для одного класса бесконечномерных динамических систем // Известия РАН. Техническая кибернетика, 1993. N 4. С. 87-93.

8. Brusin V. A., Okmyanskii V. A. Robust control for infinite dimensional non-minimum phase systems / Proc. of 1st Asian Control Conf. Tokyo, Japan, 1994. V. 3. P. 503-506.

9. Brusin V.A., Okmyanskii V.A. On Adaptive Boundary Control by Wave Plant on the Segment with Disturbances // Proc. 33rd IEEE Conference on Decision and Control. Orlando, USA, 1994. V. 4. P. 3430-3431.

10. Brusin V.A., Okmyanskii V.A. Adaptive control for SISO system with disturbances bounded on the average // Proc. Third European Control Conference. Roma, Italy, September 1995. V. 2. P. 1307-1311.