Свойства функции быстродействия и позиционное управление линейной нестационарной системой тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Николаев, Сергей Федорович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Ижевск МЕСТО ЗАЩИТЫ
1998 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Свойства функции быстродействия и позиционное управление линейной нестационарной системой»
 
 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Николаев, Сергей Федорович, Ижевск

ГОСУДАРСТВЕННЫЙ КОМИТЕТ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ВЫСШЕМУ ОБРАЗОВАНИЮ

УДМУРТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи УДК 517.977

НИКОЛАЕВ СЕРГЕЙ ФЁДОРОВИЧ

СВОЙСТВА ФУНКЦИИ БЫСТРОДЕЙСТВИЯ И ПОЗИЦИОННОЕ УПРАВЛЕНИЕ ЛИНЕЙНОЙ НЕСТАЦИОНАРНОЙ СИСТЕМОЙ

01.01.02 — дифференциальные уравнения

Диссертация на соискание учёной степени кандидата физико-математических наук

Научный руководитель —

доктор физико-математических наук,

профессор Е.Л. Тонков

еН »

Ижевск - 1998 г.

Оглавление

Введение.....................................................3

Глава 1. Докритические системы........................20

§ 1. Основные определения и вспомогательные утверждения ..............................................................21

§2. Докритичность и неосцилляция..........................25

§ 3. Свойства функции ег(£)...................................36

§ 4. Численный алгоритм построения функции сг(^)..........40

Глава 2. Структура множества управляемости докритических систем и вектор быстродействия.........49

§ 5. Структура множества управляемости....................50

§ 6. Структура расширенного множества управляемости .... 60 § 7. Численное моделирование границы множества управляемости ........................................................70

§ 8. Вектор быстродействия..................................78

Глава 3. Позиционное управление докритической системой.......................................................85

§ 9. Постановка задачи и пример П. Бруновского............86

§ 10. Позиционное управление докритической системой,

оптимальное в смысле быстродействия.........................90

§11. Уравнение Беллмана....................................97

§ 12. Позиционное управление нелинейной системой, близкой к докритической......................................103

Литература...............................................114

Введение

Теория оптимального быстродействия, основу которой составляет принцип максимума JI.C. Понтрягина [1]—[4], предоставляет принципиальную возможность построения оптимальных процессов во многих прикладных задачах. Наиболее полно изучена задача быстродействия для линейных стационарных систем (см. [2]-[7] и библиографию в [8]), для которых в ряде случаев удается построить позиционное управление [2, гл. 1, § 5], [5]. Если же изучаемая система оказывается нестационарной, то для таких систем, как правило, строится программное управление [9]-[12]. Вопросы существования и построения позиционного управления достаточно изучены для автономных систем [13] (в том числе для автономных систем с возмущением [14]), тогда как для неавтономных систем эти вопросы изучены достаточно мало [15, гл. 5, § 20], [16].

Рассмотрим задачу быстродействия для управляемой нестационарной системы

x = v(t,x,u), (t,x)eR1+n, и Elf, (0.1)

где U — компакт вГ, 0 £ U и v(t, 0,0) = 0. Пусть D = Rx D(t) — некоторая фиксированная область в пространстве М1+п, 0 £ intD(i).

Определение 0.1. Функцию u(t,x), определенную в области D и принимающую значения в U будем называть устойчивым к внешним возмущениям позиционным управлением, оптимальным в смысле быстродействия, если выполнены следующие четыре условия.

1. Для всякой точки (¿о, xq) £ © решение x(t;to,XQ) (понимаемое в смысле А.Ф. Филиппова [17, с. 40]) замкнутой системы

х — v(t, х, u(t, х)) определено и единственно при всех t ^ tq.

= 0.

2. Найдется такой момент времени что

x(t;tQ,x0)

3. Программное управление

u(t;to,xo) =u(t,x(t;to,xo)) является оптимальным для задачи быстродействия

$(«(•)) —>■ min, x = v(t,x,u), и G U, (0.2)

x(t0) = х0, x(t 0 + #)=0.

Время быстродействия для задачи (0.2) обозначим rn(to,xo).

4. Для всякого е > 0 найдется такое $ > 0, что каждой функции w(t,x) G О£(0), (t,x) G D, и любому rj > 0 отвечает функция w^t^x) G 0™(w(t,x)), (t,x) G 2), для которой любое решение xv(t;tQ,xo) (в смысле А.Ф. Филиппова) системы

X = v(t, X,u(t, х)) + Wq(t, х), (t,x)eD, (to,Xo) G 5), (0.3)

удовлетворяет равенству x^t; to, xo) |i=i = 0 при некотором -д^ = ^r,(to,xo) > 0, причём |^(i0,£o) - Tn(t0,x0)\ < e.

Последнее условие обычно не включается в определение позиционного управления, оптимального в смысле быстродействия, но это условие является важным с точки зрения приложений, поскольку обеспечивает непрерывную зависимость времени быстродействия от возмущений основной системы (0.1). Это условие близко к требованию универсальности стратегии в теории дифференциальных игр, которое впервые введенно H.H. Красовским [18] и подробно изучалось в работах H.H. Красовского и его учеников [19], [20].

Замечание 0.1. Поскольку всюду в этой работе рассматривается лишь устойчивое к внешним возмущениям позиционное управление, оптимальное в смысле быстродействия, то для краткости это управление будет называться позиционным управлением, оптимальным в смысле быстродействия или просто позиционным управлением.

Замечание 0.2. Для некоторых систем функция го(£,ж) может быть «большой». Как следует из сформулированной ниже теоремы 0.10, для класса систем, рассматриваемых в данной работе, эта функция должна удовлетворять лишь «односторонним» ограничениям. Так, для скалярного уравнения

х = и + IV(х), |и| ^ 1

управление

( 1, х<0

ЩХ) = <

[-1, я>0

является позиционным управлением, оптимальным в смысле быстродействия, если, например, и)(х) = —ж3 +втж.

Замечание 0.3. Предположим, что для нестационарной возмущенной системы вида (0.3) существует позиционное управление и(Ь,х), оптимальное в смысле быстродействия. Сложность синтеза такого, управления заключается в следующем. Для построения поверхностей переключения (которые обозначим Мп) необходимо решить при каждом фиксированном Ц задачу синтеза программного управления о5^о) Для £ ^(¿о)- Иными словами, для решения задачи синтеза необходима информация о состоянии системы в будущем, что не всегда возможно (например, в случае случайных возмущений «;(£,х)). Если же для позиционного управления я), оптимального в смысле быстродействия, основной (невозмущенной) системой и для возмущений этой системы выполнено четвертое условие определения 0.1, то, решив один раз задачу синтеза для основной системы, можно обеспечить (под действием полученного управления) ^-оптимальное поведение возмущенной системы.

В этой работе изучен класс линейных нестационарных систем вида

х = А(г)х + &(*)«, жеК", (0.4)

с одним входом, для которых существует позиционное управление, оптимальное в смысле быстродействия. Также изучается структура

множества управляемости и свойства функции быстродействия таких систем. Все результаты получены в предположении неосцилляции решений сопряженной системы

ф = -фА{г) (0.5)

относительно гиперплоскости, определяемой нормальным вектором &(£). Системы (0.4), для которых выполнено это условие, названы в [21] докритическими. Термин «докритичность» введен в 50-е годы Н.В. Азбелевым в работах, посвященных краевым задачам и дифференциальным неравенствам: так назывался максимальный интервал разрешимости фиксированного класса задач Валле-Пуссена. Оказалось, что вопрос о существовании оптимального в смысле быстродействия позиционного управления для системы (0.4) тесно связан с вопросом о разрешимости некоторого класса п-точечных задач.

Показано, что, независимо от гладкости А и 6, в любой окрестности нуля пространства (¿, ж)-переменных существуют (отличные от нуля) точки, в которых функция быстродействия теряет гладкость, но таких точек «достаточно мало». Более точно, в работе показано, что, в предположении докритичности, в расширенном фазовом пространстве (пространстве (¿, ж)-переменных) существует слабо инвариантное гладкое многообразие Мп размерности п, содержащее нуль и обладающее тем свойством, что в каждой точке (¿, х) £ Мп функция быстродействия не имеет производной. Далее, во всех точках (¿, х) множества £) = {(£,х) : ^ £ 1, тп^,х) < сг(£)} (ст(£) определяет интервал докритичности), не лежащих на многообразии Л/"", функция быстродействия имеет гладкость на единицу больше гладкости функции £ —> (А(£), &(£)), задающей систему (0.4).

Оказывается, что аналогичным образом функция быстродействия ведет себя на многообразии Л/'™: во всех точках многообразия ЛГ", за исключением точек, находящихся на некотором (слабо инвариантном) подмногообразии ЛЛ1-1 размерности п — 1, функция тп{Ь, х) непрерывно дифференцируема при (¿, х) Е И в направлении любого

вектора, лежащего в пространстве, касательном к Мп в точке х).

Многообразия Мк, к = 1 ,...,п, обладают тем свойством, что на них оптимальное в смысле быстродействия управление разрывно (управление переключается с +1 на — 1 или с —1 на +1), а конус допустимых векторов скоростей (который направляет оптимальное движение, если понимать такое движение в смысле определения А.Ф. Филиппова) касается одного из многообразий Мк (т. е. конус находится по одну сторону от касательного пространства и имеет с этим пространством общий вектор). Это обстоятельство позволяет корректно определить позиционное управление, оптимальное в смысле быстродействия. При этом позиционное управление достаточно задать только на многообразии М1+п максимальной размерности, так как движения (¿, ж(£)) (в смысле Филиппова) системы с разрывной по фазовым координатам правой частью не зависят от того, как определена правая часть на множествах, мера Лебега которых (в М1+п) равна нулю. Таким образом, наличие докритичности (факторизации Полиа-Маммана) влечет существование позиционного управления, оптимального в смысле быстродействия.

В работе описан класс таких допустимых возмущений основной докритической системы (0.4), что оптимальное в смысле быстродействия позиционное управление для основной системы доставляет в нуль каждое решение возмущенной системы (не обязательно за минимальное, но за конечное время), начинающееся в точках расширенного множества управляемости £).

Сконструированы и реализованы численные алгоритмы оценки интервала докритичности и моделирования многообразий Д^, к = 1,..., п — 1 и Мк, к = 1,..., п, приведены численные примеры и иллюстрации.

Результаты, представленные в диссертации, опубликованы в работах [21]—[25].

Ниже приведены формулировки основных результатов работы. Диссертация состоит из введения, трех глав, двенадцати параграфов

(нумерация параграфов сквозная), 31 рисунка и списка литературы. Объём диссертации 117 страниц.

В первом параграфе диссертации введены основные определения и понятия, используемые в работе.

Функцией быстродействия (t,x) —> rn(t,x) системы (0.4) называется функция, значение которой в каждой точке (¿о, ^о) определяется равенством

rn(tо, х0) = min {■& > 0 : x(t0 + £0, х0, «(•)) = 0},

и(-)еи

где U — совокупность измеримых функций со значениями в [—1,1], x{t\ ¿о, #0? и(')) — решение системы (0.4) при управлении и = u(t) и начальном условии х(¿о) = ^о- Если для некоторой точки (¿сь^о) не существует допустимого управления, переводящего решение в нуль за конечное время, то полагаем т„(£о,£о) = оо.

Множеством управляемости системы (0.4) на отрезке [¿о, ¿о + называется множество D$(to) = {х G rn(tQ,x) ^ Множеством управляемости системы (0.4) называется множество

D{tQ) = у Д,(*0).

Пусть ^i(i),... )ipn(t) — произвольная фундаментальная система решений сопряженной системы (0.5). Обозначим через <т(£о) точную верхнюю грань таких и > 0, что на полуинтервале [¿о,¿о + с) совокупность функций

6 M = Wt)b(t),... = ФпШг)

является чебышевской системой (Т-системой).

Определение 0.2. Система (0.4) называется докритиче-ской на интервале J, если для всех t £ J выполнено неравенство a(t) > 0.

Второй параграф посвящен исследованию условий докритичности системы (0.4). Доказаны следующие утверждения.

Теорема 0.1. Всякая система вида (0.4); приводимая невырожденным преобразованием = Ь(Ь)х (!/(£) непрерывно дифференцируема и йеЬЬ^) ф 0, I £ «/) к канонической системе

z = F(t)z + g(t)u,

докритична. Здесь

(fu(t) f12(t)

-т /22 w

F(t) = 0 -/ЗД

hn-\{t) hn{t)\

hn-\(t) hn(t)

/3,-1 W hn(t)

9(t) =

fm\

0 0

V о

\ о 0 ... -pn(t) fnn(t)J

причем функции fik(t), Pi(t) непрерывны и f3{(t) > 0 при всех t E J и i = 1,..., n.

Введем в рассмотрение следующие два условия. Условие 0.1. Для каждого % — 1,..., п + 1 функции t —>• qi(t), определенные равенствами

qi(f) = b(t),..., qi{t) = &_!(*) -

непрерывны, ограничены на некотором интервале J, и det Q(t) ф 0 при всех tej, где Q(t) = (qi(t),.. .,qn(t)).

Условие 0.2. Найдутся числа ..., vn_\ такие, что v\ ^ ^ ■ •• < i/n-i, и для корней Ai(i),..., Лn(t) уравнения det(AQ(t) — H(t)) = 0, где H(t) = (q2(t),..., qn+i(t)), при всех t выполнены неравенства

Ai(t) < i/i ^ X2(t) < ■ • • < i/„-i < An(t).

(0.6)

Теорема 0.2. Условие 0.1 достаточно (а в случае аналитичности функции £ —> (А(£),Ь(£)); задающей систему (0.4) гд необходимо) для докритичности системы (0.4) на интервале 3.

Формулируемая ниже теорема существенно использует результат работы [26].

Теорема 0.3. Если выполнены условие 0.1 на всей числовой оси и условие 0.2, то cr(t) = оо для всех t G M. Далее, если найдутся такие константы е > 0 и 6 ^ 0; что дополнительно к (0.6) при всех достаточно больших t выполнены неравенства 8 ^ Ai [t), 1/г_i + £ ^ Аг'(i) ^ Vi — е, % — 2,..., п — 1, то при всех t G Ш множество управляемости D(t) системы (0.4) совпадает с ]Rn.

В третьем параграфе исследованы некоторые свойства функции ¿о —> с (¿о) ? введено понятие минимальной линейной комбинации функций £i(£),..., £n(t) (см- СТР- 37) и приведены численные примеры, иллюстрирующие различные варианты поведения функции t0 o-(io).

В четвертом параграфе диссертации сформулированы два алгоритма численной оценки функции cr(i). Приведены некоторые результаты использования этих алгоритмов и иллюстрации.

Пятый параграф посвящен описанию структуры множества управляемости Dtf(to) докритической системы (0.4). В формулируемой ниже теореме показано, что в предположении докритичности граница множества управляемости есть объединение непересекающихся гладких многообразий N+(to,ê) и (гладкость на единицу выше гладкости функции t (A(t),b(t))), размерность к которых понижается с п — 1 до нуля, причём объединение многообразий, размерность которых повышается от нуля до к — 1, является общим краем замыкания объединения многообразий, размерность которых понижается с п — 1 до к. Многообразия определены следующим образом: iV* (i0,состоит из всех таких точек xq G для каждой из которых найдётся такая точка t(£q, ^o) G Mk('â), где

M\û) = {0},

MV) ={t = (r„_i) G M: 0 < rn_i < tf},

M\ê) = {t = (rn_k,..., r„_i) G^:0<r„4<-< < tf}, к = 1,... ,n — 1, что оптимальное управление жо), ¿о ^ t ^ ¿0 +

переводит точку x(to) = xq в точку x(tQ-\-$) = 0, имеет переключения только в моменты времени t = to + Ti(io,#o) и до первого момента переключения u(t,xо) = +1 (для многообразия Nt^o,^) до первого момента переключения u{t,xо) = —1).

Пусть функция t —> (A(t),b(t)), задающая систему (0.4), является функцией класса Сг.

Теорема 0.4. Пусть система (0.4) докритическая на М. Тогда для каждого $ ^ о"(£о) множество управляемости является строго выпуклым телом в R" (m. е. int D^(to) ф 0 и для любых x,xq Е dD$(to) и любого А Е (0,1) точка Хх + (1 — Л)^о Е int D#(to)). Граница dD$(to) множества D^(to) есть объединение непересекающихся гладких (класса Cr+1) многообразий и Nt_(to,$), к = 0,1,... , п — I, и объединение

/к—1 \ /к—1

U Jivi(to^)

\t=0 / \г=0

является общим краем многообразий cl iV*(io, г?) и cl Ntfo, Далее, всякой точке xq Е iV*(£o,$) отвечает единственное управление, переводящее точку х(tg) = Xq в точку x(to + $) — 0; причем программное управление u(t;to,xo) имеет ровно к переключений на интервале

В шестом параграфе диссертации доказана теорема о представимости расширенного множества управляемости 0 = Мх Ат(г) (0 в виде замыкания объединения слабо инвариантных многообразий и

9tL+n (которые, в свою очередь, являются объединениями слабо инвариантных гладких многообразий А±, размерность к которых понижается от n + 1 до единицы, причём многообразие размерности к служит краем замыкания многообразия размерности к + 1), описаны свойства этих многообразий, приведены примеры и иллюстрации.

Для каждого к = 0,1,... ,п и любого i € 1 определим многообра-

зия Mk(t), где M\t) = {0},

M\t) = {т = (rn_jfe+i,..., r„) : 0 < Tn^k+i <■ <тп< <r(i)}

и многообразия М1+к = R x Mk(t). Всякой точке (£,r) G М1+к поставим в соответствие точку (t,x), где х = 0 при к = 0, а при & ^ 1

п-1 ^^

ж = х(р) = - (-1 У'п+к J x(t, s)b(s) ds, = 0.

i=n~k t+n

Таким образом, для каждого к = 0,..., п задана функция (£, г) —>• F(i,r) = (t,x) с областью определения М.1л~к и областью значений = F(M1+k) (аналогично Л/2+* = -F(A41+*). Кроме того, в силу построения имеет место представление Л/2+А = M х Л/*± (i).

Теорема 0.5. Пусть система (0.4) докритическая. Тогда расширенное множество управляемости D = М. х (0 представимо в виде D = cl U ; где

K\+k = Я1+к U Як (J Як+'1 U • • ■ и ЛГ\

vt+k = лл^ил^у^и-.-ил^1,

к — 0,..., п. Многообразия слабо инвариантны, и для ка-

ждого к = 0,... , п, многообразие <У1к+ [J Vit является общим краем многообразий сШ^ и cl -

В седьмом параграфе сформулированы два алгоритма численного моделирования границы множества управляемости и алгоритм численного моделирования границы расширенного множества управляемости. Приведены численные примеры и иллюстрации. Восьмой параграф. Обозначим вектор

т

(t,x) = (п(£,ж),... ,г„(£,ж)), (0.7)

где £ + гг(£,ж) — моменты переключения программного управления, оптимального в смысле быстродействия для задачи управления в нуль системой (0.4).

В следующей теореме показано, что для каждого г = 1,..., п, число гг(£о,^о) является временем быстродействия в задаче о переводе точки £о £ А/*" (¿о) на многообразие ЛЛ^г(£о +

0(м(-))-> тт, и(-)еЫ, (0.8)

ж = А(£)ж + £0 < ^ < ¿о + (0.9)

х(*о) = + #) е + (°-10)

где вместо у{г) надо поставить знак «плюс», если г — четное и знак «минус», если г — нечетное число. Поэтому вектор (0.7) естественно называть вектором быстродействия.

Теорема 0.6. Пусть система (0.4) докритическая. Обозначим (и°(-),ж°(-)) — оптим