Алгоритмы робастного обращения нелинейных динамических систем тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Ильин, Александр Владимирович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1999
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
: Ц и - / / // А
« V V' г / е
/
московский государственный университет
им. м.в. ломоносова факультет вычислительной математики и кибернетики
На правах рукописи
ИЛЬИН Александр Владимирович
удк 517.925.54
АЛГОРИТМЫ РОБАСТНОГО ОБРАЩЕНИЯ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ
специальность 01.01.02 - дифференциальные уравнения
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель - член-корреспондент РАН,
доктор технических наук профессор Коровин с.К.
Москва - 1999
СОДЕРЖАНИЕ
Введение 4
Глава I. Обращение нелинейных динамических систем по состоянию
§ 1. Обращение нелинейных динамических систем при отсутствии неопределенности 13
§ 2 Робастное обращение скалярных нелинейных динамических систем по состоянию: метод модели 16
§ 3. Робастное обращение скалярных нелинейной динамической системы по состоянию: метод управляемой системы 17
§ 4. Робастное обращение скалярных нелинейных динамическых системы по состоянию при ММ-условии 19
§ 5. Примеры систем 25
Глава II. Обращение скалярных нелинейных динамических систем ранга 1 по выходу
Вспомогательные утверждения 29
§ 1. Обращение по выходу скалярных нелинейных динамических систем с относительным порядком г = 1 32
1.1. Локальное обращение 33
1.2. Обращение линейного объекта 35
1.3. Глобальное обращение 36
1.4. Алгоритм глобального обращения для линейного объекта 42
1.5. Метод модели при обращении линейного объекта ранга 1 43
§ 2 Робастное обращение по выходу скалярных нелинейных динамических систем ранга 1 45
2.1. Обращение при каскадном возмущении 46
2.2. Обращение линейного объекта при каскадном возмущении 48
2.3. Примеры систем 50
Глава III. Обращение скалярных нелинейных динамических систем произвольного ранга по выходу
§ 1. Вспомогательные утверждения 53
§ 2. Обращение полностью определенной системы при г = п. 57
§ 3. Обращение полностью определенной
системы при п > г > 1. 59
§ 4. Обращение линейной системы ранга г. 61
§ 5. Робастное обращение скалярной нелинейной динамической системы при М-условии 63
5.1. Робастное обращение систем ранга п при М-условии 65
5.2. Робастное обращение по выходу линейной системы ранга п при М-условии 69
5.3. Робастное обращение по выходу нелинейной системы произвольного ранга 72
5.4. Робастное обращение по выходу линейной системы ранга г < п при М-условии 74
§ 6 Робастное обращение скалярной нелинейной системы при каскадном возмущении 75
§ 7. Примеры систем 78
Литература 85
Введение
Обратные задачи динамики управляемых систем входят в круг основных задач теории управления. Решению этих задач посвящены многочисленные исследования как зарубежных, так и отечественных ученых. К этому ряду относится и задача обращения динамических систем, т.е. задача восстановления неизвестного управляющего воздействия, порождающего заданный выход динамической системы.
Решению этой проблемы были посвящены, в частности, работы зарубежных авторов [68], [70], [72], [74], [47], где исследовалась задача обращения линейных систем, а так же работы [52-53], [65-67], посвященные обращению нелинейных конечномерных динамических систем. В нашей стране большой вклад в эту проблематику внесли П.Д.Крутько [27-31], A.C. Галиуллин [5-9], Ю.С. Осипов и A.B. Кряжимский [32-33].
Важность задач обратной динамики управляемых систем обусловлена их значимостью при решении целого ряда практических задач, в частности, при планировании траекторий, в теории идентификации, в теории и практике измерений физических величин и т.д.
Задачи обращения условно можно разделить на два класса: расчетные задачи, т.е. задачи обращения системы по заранее известному выходу, и задачи, решаемые в реальном времени (on-line задачи). Несомненно, алгоритмы обращения для задач первого и, в особенности, второго типа, должны обладать определенной прочностью или, иначе говоря, должны непрерывно меняться при изменении параметров задачи в конечных диапазонах. Такие алгоритмы принято называть робастными. Именно о робастных алгоритмах обращения, решающих проблему в режиме реального времени, и идет речь в данной работе.
Следует отметить, что первые алгоритмы обращения (например, предложенные в работах [70-74]) не могли быть использованы для работы в режиме реального времени. В дальнейшем появились более реалистические алгоритмы (например в работах [32-33]), которые могут применяться для on-line расчетов. Область применения этих алгоритмов ограничена, однако, системами с полностью определенной динамикой (наличие шума измерений допускается) и полной информацией о векторе состояния системы. В случае же задача обращения по выходу с неточно известной собственной динамикой
объекта ситуация качественно меняется, поэтому многие известные алгоритмы не могут быть применены для обращения таких объектов, другие же нуждаются в серьезной доработке. Решение проблемы обращения в такой наиболее общей и сложной постановке задачи и составляет главное содержание диссертации.
Основная идея построения робастных алгоритмов обращения нелинейных динамических систем состоит в сведении задачи обращения к задаче стабилизации неопределенной системы по выходу. Это дает возможность использовать хорошо разработанные в последние годы методы стабилизации неопределенных систем [11-18], [39-45], [54-64], [75-77], что и позволило получить ряд новых алгоритмов обращения, решающих задачу робастно.
Под обращением нелинейной динамической системы понимается следующая задача: для ]Г)(/, Ь, К) - системы
Г * = /(*) +«*Ж*), (01)
I У = Кх) >
где х £ Кп, требуется по измерениям выхода Е К постро-
ить непрерывную оценку £(£) неизвестного входа £(£). Считаем, что для системы (0.1) выполнено
Предположение (П.1.): /, Ь - полные аналитические векторные поля, \Ь(х)\ > Ъ0 > 0, /(0) = 0, /г(0) = 0.
Кроме того, относительно неизвестного £(£) предполагается, что
т е ыР{е,е}= т ■■ ш < т) - < ^ - *2|>.
В начале как наиболее простой рассматривается случай обращения Ь, И) - системы по состоянию, т.е. при у = х. Основной подход к решению задачи обращения состоит в следующем. Для решения задачи выбирается скалярная функция Н{х) такая, что
ЬъЬ^Н{х) = 0, к = 1, ...,71 - 2 , х£
те/
п
1ьЬпГ1Цх)ф 0, ж 6 К™
(0.2)
Замена координат г = Т(х), где г^ = 1/г(ж), к = 1, ...,п, приводит систему (0.1) к виду
¿к = ¿к+1 , к = 1, ...,71 - 1 ,
¿п = а(г) + Р(г)ф), 0 < Д, < \р(х)\.
(0.3)
Для идентификации £(t) используется управляемая модель
Г zk = zk+1 , к = l,...,n- 1, \ ln = <2(2) + ,
где управление u(t) направляется на стабилизацию системы в отклонениях е = z — z:
( ¿i = , i = l,...,n- 1 ,
l ¿n=ß(z)(u-0-
Для синтеза стабилизирующего управления и используются методы теории систем переменной структуры (СПС) [11-18]. В новых координатах (е^сг), где а = се = с'г' -\-еп, е' — (ei,..., £n-i), система (0.4) примет вид
У ' (0.4*)
I а = с'А'е' + с'д'а + ß{u - £). V У
Так как det(sE—А') = 3n-1+cn,_isn~2-h..+ci, то спектр матрицы А' полностью определяется выбором вектора с'. Выберем с' так, чтобы А' была гурвицевой. В этом случае, очевидно, задача стабилизации в нуле векторной системы сводится к задаче стабилизации в нуле скалярной переменной а. Эту задачу решает управление вида
ц = + "'» ud = -Msgn(aß), M > (0.5)
Очевидно, что при таком управлении на поверхности <7 = 0 возникает, при идеальных переключениях в (0.5), идеальный скользящий режим, о — 0, либо, при неидеальных переключениях, реальный скользящий режим, когда |<т| < А.
В качестве оценки неизвестного входа £ используется скользящее среднее разрывной компоненты управления ud, а именно:
т = fj Ar)dr = 4 , (0.6)
t-т
имеет место
Теорема 1. Пусть для системы (0.1) у = х, выполнено предположение П.1. £ £ Ыр существует к{рс), удовлетворяющая (0.2). Тогда для £ из (0.6) с некоторого момента времени справедлива оценка:
{с1 гр
£тг- при (7 = 0,
А 2Д || л
Предложенный алгоритм является робастным, т.е. может быть использован и для обращения возмущенной системы
£ =/(аО + Д/(я) + • (0-1*)
Пусть возмущение А/ удовлетворяет М-условию, т.е.
Г ДДя) = ,
I |*>М1 <
(0.7)
Пусть, кроме того, возмущение cp(t) удовлетворяет при некотором Т > 0 строгому У-условию: <р? = 0 или У-условию: lim fT{t) — О,
t—юо
тогда верно
Следствие 1. Пусть для системы (0.1*) выполнены условия Теоремы 1, возмущение А/ удовлетворяет М-условию и строгому У-условию (У-условию). Тогда £ из (0.6) при М > + (р° приближает неизвестный входной сигнал £ £ -Lipl^0,^1} с конечного момента времени (асимптотически) с погрешностью (с установившейся ошибкой) Д(Т,£).
Дополнительную устойчивость к возмущениям предложенный алгоритм приобретает в случае, если обращаемая система эффективно управляема, т.е. вместо (0.1*) рассматривается система
x = f(x) + Af(x,t) + tf + u)b(x). (0.8)
Пусть А/ удовлетворяет М-условию:
Г А/(ж, t) = b(x)ip(x, t), l \<p(x,t)\ < <p°(x), <p\0) = 0.
При ил = — (М + ф0(х))8дп((3(г)а), М > , а = сх справедливо
Следствие 2. Пусть для системы (0.8) выполнены условия Теоремы 1, М-условие, £ Е Ыр{(° Тогда £ из (0.6) асимптотически приближает £ с погрешностью Д(Т, £).
При незначительных изменениях предложенный алгоритм решает задачу и в случае возмущений следующего типа. Пусть гапкА^х) = г, А¿(х) = зрап{Ь, ад/Ь, ...,ас1у~1Ь}. Если, кроме того, при всех г = 1 ,...,п — 1 выполнено условие [А/(х), А^(х)] Е А^(х), то такое возмущение называют каскадным или нижнетреуголъным. При этом преобразование координат г = Т{х) приводит систему к виду
( ¿{ = £¿+1 + ^¿(У), /г = 1,..., п — 1, \ ¿„ = а(г) + /3(г)(и + {) + <рп(г),
где г1 = со1(г В силу аналитичности системы и условия
А/(0) = 0 для всех г = 1,..., га — 1
Р»^*) = ^¿О'К, У» = (^гЬ-^гг)-
При известных мажорантах (р^- > г = 1,...,гг, ^ = 1,...,г
можно выбрать гиперплоскость сг = сг = с'г' + = 0 специальным образом, а именно, установить иерархию коэффициентов с^ следующим образом
а = с°{11п~г, г = 1, ...,п - 1,
где с- - коэффициенты какого-либо устойчивого полинома <£п-1(5) = виде
.«г
„п 2 _ а разрЫВНое управление и'1 определить в
ий = -(Мх |г| + М)здп((тр(г)),
|с(А + Ф°)|
М > £ ; М\ > вир
где А =
О Е' О О
ф0
5 П
* о
= - нижнетреугольная (га х га)
матрица, тогда будет верно
Следствие 3. Пусть для системы (0.8) выполнены условия Теоремы 1, - каскадное возмущение "линейного" роста; £ £
£ G Lip-f^0^1}. Тогда существует ¡л* такое, что при ¡i > ¡i* функция £ из (0.6) с некоторого момента времени приближает неизвестный вход £ с погрешностью Д(Т, £).
Предложенный подход распространен на случай, когда известен лишь скалярный выход управляемой системы
( х = f(x) + b(x)(£ + и), (ag)
1 У = Кх) >
Определение 1. Число г называют равномерным относительным порядком или рангом системы (0.9), если 1<г<пи при всех х G №п
LbL)h(x) = 0 , fc = 0,...,r-2, ЬъЬу1}!^) ф 0.
Определение 2. Распределение Ar(x) = span{b, adfb,..., ас^-1Ь} - инволютивно, если для всех А: и / таких, что 0 < k, I < г — 1, к ф I следует [ае^Ь, ad^b] G Аг-(ж).
В случае инволютивности Аг(х) существует глобальный диффеоморфизм
* = Т(яг) - соЦТ^х), ...,Тп{х)), Т{0) = 0 , приводящий систему (0.9) ранга г к виду
— , г — 1,..., г 1,
а i
¿I = a(z) + f3(z)(u + О, , У = zi ,
(0.10)
где 2: = ^ ^д у , £ К71 г, г1 £ Ег. Первое уравнение в (0.10) называется скрытой динамикой системы. Уравнение ¿° = /о(^°,0) = /оо(2°) определяет нулевую динамику системы. Если нуль этого уравнения асимптотически (экспоненциально) устойчив, то система (0.9) называется асимптотически (экспоненциально) минимально -фазовой.
Для систем ранга 1 рассмотренный диффеоморфизм приводит систему (0.8) (при отсутствии возмущений) к виду
Г ¿°=./о(*°,У), 6 Е-1,
I У = «(*)+/*«(« +О,
для минимально-фазовой XX/А Ч ~ системы решение задачи обращения сводится к стабилизации в нуле выхода у.
Обозначим /1(2°, у) = /о(г°,у) - /оо(^°)- Пусть при всех г° имеет место оценка
\Мг°,у)\<Цу\. (0.12)
Кроме того, известен знак /3(г), а в окрестности нуля
а
{г)\<<х1\г°\ + а2\у\1 аи<х2>0. (0.13)
Выберем стабилизирующее разрывное управление и = иа = ядп/Зх х(—ку — Мвдпу), М >
Теорема 2. Пусть для аналитической минимально-фаз о в ой системы (0.9) ранга 1, выполнено предположение П.1., £ £
выполнены оценки (0.12) и (0.13). Тогда при достаточно больших к > 0 £ из (0.6) локально (глобально, если (0.12) и (0.13) выполнены везде) решает задачу обращения с погрешностью Д(Т, £).
Условия обратимости, указанные в Теореме 2, можно ослабить, если применить более сложный алгоритм, использующий наблюдатель состояния. В этом случае управление и конструируется из двух частей и = щ + ис1, где
= и* = -М*дпу, М>£°.
/3(г)
В качестве наблюдателя используется
При выполнении оценок
||/о(Ду)-/о(Л!/)|<^||Д^0|| + /||Ду||,
\\а(г)-а(г)\\<Ьа\\Аг\\, (0.15)
\\№-М\\<Ыь*\\-
где А г = г — Аг° = — г°, А у = у — у, имеет место
Теорема 3. Пусть для аналитической экспоненциально минимально-фазовой системы (0.9) ранга 1 выполнено предположение П.1., (0.15), £ £ Тогда £ из (0.6) глобально решает
задачу обращения при при достаточно больших к > 0 с погрешностью Д(Т,£).
В работе показано, что предложенный алгоритм является робаст-ным по отношению к возмущениям, удовлетворяющим М-условию и "каскадным" возмущениям.
Кроме того, предложенный подход обобщен на случай систем с произвольным относительным порядком 1 < г < п.
Сначала, как более простая, рассмотрена задача обращения системы ранга г = п.
В этом случае скрытая динамика отсутствует и обращаемая система описывается уравнениями
Уг = У%+1 ,¿ = 1, ..;П- 1 ,
У„ = 0Ы(« + О + <*Й), (0-16)
У = У\ ,
где, как и раньше, г] = со1(ух, ...,уп).
Обратная связь, стабилизирующая систему (0.16) в нуле, имеет вид
и = -^-с^-Мздп(а), (0.17)
где о — сг\ = а + се, вектор с = (с', 1) выбирается из соображений гурвицевости полинома ) = в71'1 + сп_х5п-2 + ... + сх, а т) = со1(у1, ...,уп) - асимптотическая оценка вектора 77, вырабатывается наблюдателем
Г & = ^¿+1 -и{у1-у), г = 1,..., п - 1, г
I Уп = - - у),
где й = —с'г}' — Мвдп^сг).
Если параметры г = 1,...,п наблюдателя (0.18) образуют иерархию
и = ,г = 1, ...,п - 1,
где такие, что полином ро^в) = + + ... + I® - гурвицев.
Теорема 4. Пусть для аналитической минимально-фаз о в ой системы (0.10) ранга г = п выполнены предположения П.1.; £ Е £ 6 Тогда для £ из (0.6) при наблюдателе (0.18) при
¡1 —> сю начиная с некоторого момента времени будет справедлива оценка
Рассмотренный алгоритм обращения нелинейных динамических систем по выходу переносится на системы с произвольным рангом.
Показано также, что как и ранее, предложенный алгоритм обращения системы (0.9) по выходу устойчив к параметрическим возмущениям, удовлетворяющим М-условию или возмущениям нижнетреугольного типа.
Основные результаты
1. Предложен подход к робастному обращению нелинейных динамических систем, основанный на методах стабилизации динамических систем в условиях неопределенности.
2. Предложены алгоритмы робастного обращения скалярных аналитических нелинейных динамических систем постоянного ранга по состоянию и по выходу.
3. Исследованы асимптотические свойства динамических систем обращения при различных функциональных возмущениях и неиде-альностях в реализации законов управления.
4. Описаны новые наблюдатели состояния неопределенных динамических систем.
Основные результаты диссертации опубликованы в работах [19 -22], [24 -25].
Автор глубоко признателен члену-корреспонденту РАН, профессору С.К. Коровину за научное руководство и внимание, проявленное к работе.
Глава I. Обращение нелинейных динамических систем по состоянию
§ 1. Обращение нелинейных динамических систем при отсутствии неопределенности
Рассматриваем аналитическую 6)-систему
х = т+&(х) (1.1)
где / и Ь - полные аналитические векторные поля (/, Ь Е СШ(1П)), /(0) = 0, \Ъ(х)\ > 0 для всех ж Е Кп, ф) Е ¿Ф^1) = { Ш\ <
Пусть скалярная функция Н(х) Е СЩ(1П) такая, что
ЬьЬ)к{х) = 0 , к = 0,1, 2,... , п - 2 , ж Е Кп ,
а
ЬьЬ^Цх) ф 0 , при любом х Е . Тогда, согласно [73], в новых координатах
хк = Ь)~1К{х), к = ... ,п (1.2)
XX/, 6)-система будет описываться уравнениями
¿к - , к — 1, 2,... , п - 1,
¿п = Щ(х)+ЬъЬ1}-1к(х)£1
где а(г) = Ь^Т'1 (г)); (3(г) = Ьь^^Т'^г))- здесь Т(.) - диффеоморфизм, т.е. Т(х) = Таким образом имеем
( ^ = ' (1.3)
[ гп = а(г) +,
причем 1/3(^)1 > 0 для любого г Е
Для идентификации входа £(/) используем управляемую модель
= г = 1,... п — 1,
\ гп = а(г) + /3(г)и.
Для стабилизации в нуле системы в отклонениях
£ = z — z
описываемой уравнениями
• ■ . 1 9 = 1 Г) — 1
(1.4)
¿i = £i+1, г = 1,... п — 1
I еп = /3(г)(и - £),
применим методы теории систем переменной структуры (СПС) [12]. Именно, выбираем плоскость
а — се, с = (сь ... ,сп) = (с', 1) ,сп = 1 и переходим к координатам ( £ ), где е' - первые (га — 1) компоненты
а
j \
£, т.е. е = тогда вместо (1.4) имеем
I <7 = с'а'е' + с'д'о + /3(« - 0 ,
гдеА'= (°_cf ), = (О,...
Если матрица А' - гурвицева, то рассматриваемая проблема сводится к стабилизации в нуле второго скалярного уравнения в (1.5).
Если £(i) G Lip (£°, £1), то искомый алгоритм стабилизации можно определить в виде
U = J^+^o _ Msgn(*(3(z)). (1.6)
Действительно, в этом случае
& = -f3(z)[Msgn(af3)+at)},
и при выполнении неравенства
м > е (1-7)
функция а за конечное время обращается в нуль, и далее соотноше-
тття-п гс — П ттАттттапм/тгпраппг'а- т> пуп ттх. <хтттол/Г ТЛОМГТТЪ/ГА ТТ'ПрГ ЧТП1\/Г РПТ.ТТЯГ'-
II V ---II \ 1, , 1Л -у -1- V , У± и I . Л-Л-^ХЛ- ' ' "Ч * И-"-»^--*
но [19], эквивалентное значение разрывной компоненты управления (1.6) ил = —Мвдп^а/З) дается выражением
< - №
"ед
Как показано в [19, 20], при идеальных переключениях (сг = 0) скользящее среднее удовлетворяет соотношению
t * = ^ / ^м^ = ^ / ем^г =
г-т *-т
и, следовательно, приближает идентифицируемый сигнал, так как
(1-8)
При реальных переключениях (|сг| < А) вместо (1.8) имеем
2А е1Т --1- —
Т/3 о 2
1+ С1-9)
где 0 < /Зо < для любого г.
Таким образом доказана следующая
Теорема 1. Пусть для аналитической Ь)-системы, дей-
ствующей б выполнены следующие услов�