Синтез оптимальных и инвариантно-устойчивых систем управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Ружицкая, Елена Адольфовна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Минск
МЕСТО ЗАЩИТЫ
|
||||
1997
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
иГБ ОД
' э аня юз®«
• Белорусский государственный университет УДК 517.977
Ружицкая Елена Адольфовна
СИНТЕЗ ОПТИМАЛЬНЫХ И ИНВАРИАНТНО-УСТОЙЧИВЫХ СИСТЕМ УПРАВЛЕНИЯ
01.01.02 — дифференциальные уравнения
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Минск — 1997
Работа выполнена на кафедре методов оптимального управления Белорусского государственного университета.
Научный руководитель — доктор физико-математических наук,
профессор Р.Габасов
Официальные оппоненты: доктор физико-математических наук,
профессор В.М.Марченко
кандидат физико-математических наук, Н.В.Балашевич
Оппонирующая организация — Институт космических исследований Национальной академии наук и Национального космического агенства Украины
Защита состоится "43-" лиЛарА- 199^ года в 10 часов ш заседании совета но защите диссертаций Д. 02.01.07 в Белорусское государственном универсистете по адресу: 220050, Республика Бе ларусь, г. Минск, пр. Ф.Скорины, 4; главный корпус, ауд. 206.
С диссертацией можно ознакомиться в библиотеке Белорусско го государственного универсистета.
Автореферат разослан "Ш- 199_£г.
Ученый секретарь совета г
по защите диссертаций А.А.Килбас
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
1. Актуальность темы диссертации. Проблема синтеза обратных связей, обеспечивающих заданные свойства переходных процессов, таких как устойчивость, инвариантность, оптимальность и другие, является центральной в теории управления.
Длительное время задачи обеспечения перечисленных свойств исследовались каждая в отдельности (самостоятельно). В работах Летова^Калмана2 впервые решены совместно проблемы устойчивости и оптимальности. Совместное изучение устойчивости и инвариантности3 для детерминированных систем началось с работы Zames'a4. Отличительной особенностью работ этого направления является то, что в них структура обратных связей, как правило, задавалась заранее и не учитывались геометрические ограничения на управляющие воздействия.
В данной работе для построения обратных связей, обеспечивающих заданные характеристики переходных процессов, используются методы теории оптимального управления. Это позволяет не только не задавать структуру обратных связей, но и учитывать геометрические ограничения па значения управления, что является существенным для прикладных задач.
2. Связь работы с крупными научными программами, темами. Диссертационная работа выполнялась по темам научно-исследовательских работ в области естественных наук кафедры методов оптимального управления Белорусского государственного университета:
— "Дифференциальные уравнения: качественная теория устойчивости движения, синтез оптимальных систем управления, численные методы", № 01910056828, 27.35 (Приказы БГУ от 25.02.91 г. № 97-Д, 28.03.94 г. № 143-Д. Республиканская программа в области математики, математического моделирования);
1Л его б A.M. Аналитическое конструировали« регуляторов // Автомат, и те лемех. - I960,
№ 4. - С. 436-441; № 5. - С. 561-568; № 6. - С. 661-665.
3Калиан Р. Об общей теории систем управления // Тр. I Конгресса ИФАК. - М.: АН СССР, 1961. - Т. 1. - С. 521-547.
3Куяебакин B.C. Теория инвариантности автоматически регулируемых и управляемых систеи // Тр. I Международного конгресса Международной федерация по автоматическому управлению (ИФАК). Теория непрерывных истем. Специальные математические проблемы. - М.: Изд-во АН СССР, 1961. - С. 247-255.
4Zarnes G. Feedback and optimal sensitivity: model reference transformations, multiplicative seminorms, and approximate inverses // IEEE Trans. Automat. Contr. - 1981. - Vol. AC-26, № 2. - P. 301-320.
— "Качественная и конструктивная теория оптимизации стохастических и динамических систем (математическое моделирование, алгоритмы оценивания состояний, синтез оптимальных систем, методы решения негладких экстремальных задач и их приложения)", № 01910056832, 50.41 (Республиканская программа в области математики, математического моделирования);
— "Качественные, асимптотические и численные методы исследования и оптимизации динамических систем", 27.31.17 (Приказ ВГУ JV* 216-Д от 19.03.96 г. Программа AHB "Математические структуры" (19), "Алгоритм" (19));
— "Оптимизация непрерывных и дискретных процессов в режиме реального времени", 27.03.17. (Республиканская программа в области математического моделирования).
3. Цель и задачи исследования. На кафедре методов оптимального управления Белорусского государственного университета и в отделе теории процессов управления института Математики АН Беларуси в начале 90-х годов Р.Габасовым, Ф.М.Кирилловой, О.И.Костюковой5 разработав новый подход для решения проблемы синтеза оптимальных систем. Он был использован для построения стабилизирующих обратных связей. Цель настоящей работы — развить подход для решения проблемы синтеза инвариантно-устойчивых систем.
4. Научная новизна полученных результатов. В диссертационной работе для линейных стационарных динамических систем решены:
1) проблема синтеза оптимальных терминальных и оптимальных по быстродействию систем в классе ограниченных инерционных управлений;
2) задачи стабилизации систем в условиях постоянно действующих возмущений в классе безинерционных и инерционных управлений;
3) задача робастной стабилизации динамических систем с обеспечением дополнительных характеристик переходных процессов.
5. Практическая значимость полученных результатов. Полученные в диссертации результаты могут быть использованы при
5Га.ба.сов Р., Кириллова. Ф.М., Костюкова. О.И. О глинизация линейной системы управления а режиме реального времени // Изв. РАН. Техн. кибернет. - 1992, № 4. - С. 3-19.
ТЧбасов Р., Кириллова Ф.М., Костюкова. О.И. Построение оптимальных управлений тина обратной связи в линейкой задаче // Докл. АН СССР. - 1981. - Т. 320, № 6. - С. 1294-1299.
формировании общей теории управления динамическими системами, а также при решении ряда прикладных задач управления.
6. Экономическая значимость полученных результатов.
Выполненная работа имеет теоретическое значение. Экономический эффект от использования полученных результатов решения рассмотренных задач на данном этапе не определен.
7. Основные положения диссертации, выносимые на защи-гу. На защиту выносятся следующие результаты:
— критерий оптимальности для одной линейной полубесконеч-юй экстремальной задачи;
— синтез оптимальных систем по терминальному критерию качества в классе ограниченных инерционных управлений;
— синтез оптимальных по быстродействию систем в классе )грашгченных инерционных управлений;
— стабилизация динамических систем ограниченными инерционными управлениями;
— стабилизация динамических систем в условиях постоянно [ействующих возмущений;
— стабилизация динамических систем в условиях постоянно (ействующих возмущений ограниченными инерционными управле-[иями;
— робастнал стабилизация динамических систем;
— стабилизация динамических систем с обеспечением дополни-ельных свойств переходных процессов.
8. Личный вклад соискателя. Работы, на основании кото-1ых написана диссертация, выполнены совместно с научным ру-оводителем. Роль научного руководителя состояла в постановке ассматривае-мых в диссертации задач и анализе полученных ре-ультатов. Все результаты, изложенные в диссертации, получены ичпо соискателем.
9. Апробация результатов диссертации. Основные резуль-аты диссертации докладывались на: Международной математи-еской конференции, посвященной 25-летию ГГУ им. Ф. Скорины Проблемы математики и информатики" (Гомель, 1994 г.); Бело-усском конгрессе по теоретической и прикладной механике "Ме-аника -95" (Минск, 1995 г.); VII Белорусской математической энференции (Минск, 1996 г.); Международной математической шференции "Еругинские чтения — IV" (Витебск, 1997 г.); Меж-
дународной конференции "Control of Oscillations and Chaos" (St.Pe-tersburg, Russia, 1997); объединенном семинаре по конструктивным методам оптимизации кафедры методов оптимального управления Белгосуниверситета и отдела теории процессов управления института математики АН Беларуси (руководители: профессор Р.Габа-сов, чл.-корр. АН Беларуси, профессор Ф.М.Кириллова).
10. Опубликованность результатов. Результаты диссертации опубликованы в 3 статьях в научных журналах, 4 тезисах конференций.
11. Структура и объем диссертации. Диссертация состоит из введения, общей характеристики работы, 4 глав, списка использованных источников, включающего 158 наименований на 14 страницах, 29 иллюстраций (объемом 10 страниц), 1 таблицы.
Полный объем диссертации составляет 114 страниц.
ОСНОВНОЕ СОДЕРЖАНИЕ
Во введении содержится оценка современного состояния решаемой проблемы, обосновывается необходимость разработки и актуальность данной темы диссертации. Рассматриваются классические подходы к проблеме синтеза обратных связей, обеспечивающих устойчивость, инвариантность, оптимальность и другие свойства переходных процессов.
В первой главе дан критический обзор литературы последних лет, непосредственно примыкающих к проблемам, исследованным в диссертации. Названы вопросы, которые остались неразрешенными и, таким образом, определено место результатов автора в решении проблемы.
Во второй главе исследуется следующая задача максимизации линейного функционала по параметрам и управлению:
J(v) = с'х + [ c(t)u(t)dt -* max, Ах + f h{t)u(t)dt - g, (1) Jo Jo
dt < x < <f, /» < u(t) < /*, teT= [0,z],
где c(t), h(t), t € T, — непрерывные скалярная и m-векторная функции соответственно; u(t), t Е T, — кусочно-непрерывное управление; А = A(I,J) — тп x n-матрица; с = c(J), d* = dt(J), d* = = d*(J), x = x(J) — га-векторы; g = g(I) — ш-вектор; /*, f* — скалярные величины; I = {1,..., m}, J = {1,..., rc}.
Вводятся понятия: опоры Son = {Гот1, /<,„}, расширенного управления V = (х; u(i), t G Г), допустимого расширенного управления, оптимальпого расширенного управления и0, опорного управления {и, 5on} и невырожденного опорного управления.
Формулируется и доказывается следующий критерий оптимальности:
Теорема. Пусть Aj, j G Jh — J\Jon неопорные оценки, Д(г), t (z Т, — коуправление, построенное по опоре Топ. Для оптимальности допустимого расширенного управления v достаточно существования такой опоры Son, что для опорного управления {и, S'en} выполняются соотношения:
Aj > 0 при Xj = dtj\ Aj < 0 при Xj = d*;
Aj = 0' при dtj < Xj <d*j, je JK; A (t) > 0 при u(t) = /,; (2) A(t) < 0 при u(t) = /*; A(t) = 0 при /, < u(t) < /*, te T.
Пусть v — оптимальное расширенное управление, {и, >ÇCTl} — невырожденное опорное управление. Для оптимальности расширенного управления v необходимо, чтобы для опорного управления {tfjSon} выполнялись соотношения (2).
Рассматривается частный случай задачи (1), который сформулирован в виде следующей классической задачи терминального управления в классе ограниченных управлений с ограниченными производными:
J(u) = c'x(t*) —► шах,
х = Ах + Ви, х(0) = х0, Ех{?) - g, u(0) = и0, Du(t*) = d, (3)
L* < Ui(t,) < L*, < Lu * = Î7r; te Г,
(c, x € Rn, g G Rm, d<ERr, A G Rn*n, В G iîn*r, H € Rmxnt гапкЯ = = тп < n, гапк(6,А6,...,An_16) = n, D G Д?хг, rankD — q < r, uQ — заданный вектор, удовлетворяющий ограничениям L, < u0t < L*,
i = v).
Задача (3) в работе исследуется в классе кусочно-линейных управлений с периодом квантования v\
Ui(t) = щ(т) + Vi(r)(t - r), t G [r, r + t = kv, k = 0, jV — 1, t = Î7r.
Для задачи (3) кроме оптимального программного управления u°(t), t € Т, важную роль играют позиционные решения задачи
(3) (оптимальное управление типа обратной связи). Для определения оптимального управления типа обратной связи введем новые фазовые переменные a;n+i = ui,... ,xn+r = ur, новое управление v = й, обозначим у = (xn+i,.. .,хп+г). Полученная задача становится задачей оптимального управления в классе кусочно-постоянных функций с периодом квантования v, но с фазовыми ограничениями. Погрузим ее в семейство аналогичных задач, зависящих от позиции (r,z,p), т в Т„ = {т G R : т = ки, k = 0,JV- 1}, z € Rn, р £ Rr:
Ji(v) = c'x(t*) -> max, x = Ax + By, y=v, x(t) = z, у(т) - p, Hx(t*) = g, Dy{f) - d, (4) L* < Ui(t) < L\ K(i)| < Lu i = T7r; t € Тт = [т,Г].
Пусть t)°(i|r, z,p), t € TV, — оптимальное программное управление задачи (4) для позиции (г, z,p). Обозначим через Хт множество всех пар векторов (z,p) € Rn х RT, при которых задача (4) с х(т) = z, у(т) = р имеет решение.
Функция
v°(t,z,p) = vQ(rlr,z>P), (z,p) ex;, t € [r,r + r € Г„,
называется оптимальным (дискретным) управлением типа (классической) обратной связи.
Бе построение принято называть синтезом оптимальной системы. Проблема синтеза оптимальных систем представляет очень трудную математическую проблему и в теории управления пока не решена. В данной работе развивается подход, продложенный Р.Габасовым, Ф.М.Кирилловой, С.В.Пршцеповой6, в котором функция явно не строится, но описывается метод ее реализации в режиме реального времени для каждого конкретного процесса управления.
Результаты иллюстрируются на примере реализации оптимальной обратной связи для задачи перевода ограниченными инерционными управлениями двух материальных точек, соединенных упругой связью, из одного положения равновесия в другое с минимальным расходом топлива. Поведение такой системы при определенных значениях ее параметров описывается уравнениями:
¿1 = х2, ¿2 = — 9®i + 9хз. ¿з = xif ¿4 = 3ж1 - Зх3 + w + и, й = V (5)
'Gabasov R., Kirülova. F.M., Prischepova S.V. Optimal Feedback Control Lecture Notes ja Control aid Information Science«. Springer. — VeHag London Limited, 1995. •— Vol. 207. - 202 p.
где (ж1,®2,жз,®4,м,г;,щ7 Е К), Х1УХ3 — отклонение первой и второй точек системы от состояний равновесия 21 = х$ = 0; Х2,х^ — скорости этих точек; и — управляющее воздействие; и — скорость изменения управляющего воздействия; ш — возмущение, действующее па систему.
Изложенным выше методом исследуется и классическая задача быстродействия в классе ограниченных управлений с ограниченными производными:
г* —> тт, х = Ах + Ьи, ж(0) = хо, и(0) = ко, х(?) = 0, и(г*) = 0, |и(*)| < Ь, \й(г)\ < ¿1, 1> 0, (ж € Л", и € Я, гапк(6,АЬ,...,Ап~1Ъ) = п).
Результаты иллюстрируются на примере системы (5).
В третьей главе рассматриваются три задачи стабилизации динамических систем в классах инерционных и безинерционных управлений, без учета возмущений и в условиях постоянно действующих возмущений.
Первая задача — задача стабилизации динамических систем управлениями, ограниченными по значениям и производным.
Рассматривается система управления:
х = Ах + Ьи, (6)
где х = х(1.) — п-вектор состояния системы в момент времени А £ Дпхп — постоянная матрица, Ъ € Яп — постоянный вектор, и — и(<) — значение управляющего воздействия, гапк(6, АЬ,..., А"~Щ = п.
При выбранных числах V > 0, 0 < Ь < оо, 0 < Ь\ < оо, функпия и(1), t > 0, называется программным управлением, если она 1) непрерывна; 2) кусочно-линейна: и(£) = ы(г)+г(т)(£ — г), £ € [т,г + г/[, т = ки, к — 0,1,2,...; 3) ограничена: |и(<)| < Ь, г > 0; 4) имеет ограниченную производную: |и(г)| < /п, t> 0.
Наряду с системой (6) рассматривается система управления вида:
х~ Ах + Ьхп+1, ¿„+1 = г?. (7)
Функция v(t), > 0, называется программным управлением для системы (7), если она: 1) кусочно-постоянна: v(t) = г е [т,т + и[,
г = kv, к = 0, 1,2,...; 2) соответствующая ей компонента xn+i(t), t > 0, траектории системы (7) удовлетворяет неравенству: \xu+l(t)\ <L,t> 0; 3) \v(t)| <LU t> 0.
Пусть G — некоторая окрестность состояния равновесия х = 0 системы (6), и = 0.
Функция v(x,xn+i), х G G, |a;R+i| < L, называется стабилизирующей обратной связью, если: 1) г(0,0) = 0; |t?(a;,xn+i)| < L\, х € G, |®n+i| ^ L> 2) реализация v(t) = u(x(i),a:n+1(i)), t > 0, вдоль каждой траектории x(t), x„+i(i), t > 0, замкнутой системы
x = Ах + bxn+i, xn+i - v(x, xn+1), x(0) € G, K+i(Û)| < L, (8)
является программным управлением; 3) траектория x(t), xn+i(t), t > 0, системы (8) на промежутке \ki/,(k -(- \)v\, к = 0,1,2,..., совпадает с решением системы (7) приv(t) = v(x(kv),xn+i(ki/)), t G [kv,(k + 1)и[, к = 0,1,2,...; 4) система (8) асимптотически устойчива в G х [—L,L].
Из определения стабилизирующей обратной связи следует, что в процессе управления достаточно знать лишь значения v(t) = = v(x(t),xn+i(t)), t = kv, к = 0,1,2,..., вдоль стабилизируемой траектории x(t), хп+\(t), t > 0.
Устройство, которое при выбранном v способно в процессе стабилизации в режиме реального времени вычислять значения функции v(kv) = v(x(ki/)>xn+i(ku))i к — 0,1,2,..., называется дискретным стабилизатором.
Лля построения алгоритма работы стабилизатора привлекается следующая сопровождающая задача оптимального управления:
B(z,zn+i) = min / |zn+i(i)l J о
x = Ax + bu, ¿n+i = V, z(0) -- z, £„4.1(0) = zn+1, (9)
x(Nv) = 0, xn+i(Nu) = 0, |®»+i(i)| < L, |u(i)| <LU t€ [0,iW].
Пусть G — множество таких векторов z G Ra, при которых задача (9) имеет решение для начальных условий z Е G, |.zn+i| < L.
Методом функций Ляпунова доказывается, что функция
жя+1) = 1)°(а;,а;л+1), x € G, |a:n+i| < L, является стабилизирующей обратной связью.
Обратная связь явно (формульно, в замкнутом виде) не строится, но указывается алгоритм работы стабилизатора, который в каждом конкретном процессе управления способен строить (вычислять) в режиме реального времени соответсвующие значения оптимальной обратной связи.
Результаты иллюстрируются на задаче стабилизации ограниченными инерционными управлениями двух материальных точек, соединенных упругой связью. Поведение такой системы описывается уравнениями (5) при w = 0.
Вторая задача — задача стабилизации динамической системы в условиях постоянно действующих возмущений ограниченными управлениями.
Рассматривается динамическая система, поведение которой вместе с прилагаемыми к ней управлениями и действующими на нее возмущениями описывается на временной оси t > 0 уравнением
х - Ax + bu + dw (10)
{x,b,d<=Rn, u,w £ R, AzRn*n, rank(6, Ab,..., A^b) = n),
где x = x(t) — n-вектор состояния системы в момент t, и = u(t) —- значение скалярного управления, w = xv(t) — значение возмущения.
Относительно действующих на систему (10) возмущений предполагается, что они стабилизатору неизвестны, но известно, что в каждом процессе стабилизации могут реализоваться любые кусочно-непрерывные функции w(t), t > 0, удовлетворяющие неравенству |to(i)| <M,t> 0.
Пусть £ > 0 — любое сколь угодно малое положительное число, v > 0, L > 0 — фиксированные заданные числа, G — ограниченная окрестность состояния равновесия х — 0 системы (10), и = 0, w = 0. Функция u(t, х), х € G, t е [0, называется ограниченным стабилизирующим программно-позиционным управлением системы (10) в области <7, если 1) w(f, 0) = 0, t € [0,f[; 2) |«(i,i)| < L, x G G, t € [0, i/[; 3) траектория замкнутой системы
x = Ax + bu(t,x) + dw(t), x(0) = x0> xq 6 G, (11)
при фиксированном (реализующемся) возмущении w(t), t > 0, является непрерывным решением системы уравнений
х — Ах + bu(t) + dw(t), ж(0) = а?0,
где u(t) = u(t,x(kv)), t G [kv,(k + l)i/[, к = 0,1,...; 4) замкнутая система (11) без возмущений (u>(i) = 0, t > 0) асимптотически устойчива в G; 5) существует такое конечное число i(e), что каждое решение x(t)y t > 0, уравнения (11) обладает свойством ||x(f)|| < е при t > t(e).
Выберем вещественное число h > 0, натуральные числа N, тп (N > тп> п). Положим и = m/t, 0 = Nh.
По аналогии с предыдущей задачей, вводится специальная вспомогательная задача оптимального управления:
p(z) = min р,
х = Ах + Ьи, ж(0) = я(в) = 0, |u(t)| < р, t€T. (12)
Вводится множество G& = {z G Rn : \u°(t,z)\ < L, t G [0,i/]} .
Множество Gq обладает свойством: для любого е > 0 существует такое 0 > 0, что в е - окрестности множества Gq содержатся все состояния системы (10), которые можно перевести допустимыми управлениями в начало координат за конечное время.
Показывается, что при заданных е, G, М и соответствующем выборе параметров ©>0, у > 0, h > 0 задачи (12) обратная связь u(t,x) = n°(t,x), х G Gq, t € [0,i/[, будет удовлетворять всем требованиям определения ограниченного стабилизирующего программно - позиционного управления при G = G&.
Результаты иллюстрируются на задаче стабилизации ограниченными кусочно-непрерывными управлениями двух материальных точек, соединенных упругой связью. Поведение такой системы при определенных значениях ее параметров описывается уравнениями:
¿1 = Х2, ¿2 = -9X1 + 9Жз, Х3 = Xi, ¿4 = ЗЖ1 - Зжз + to + 10u,
где (xi,x2,x2,x4,u,w G R), xitx3 — отклонение первой и второй точек системы от состояний равновесия хг = х3 = 0; ®2>#4 — скорости этих точек; и — управляющее воздействие; w — возмущение, действующее на систему.
Третья задача — задача стабилизации динамических систем в условиях постоянно действующих возмущений управлениями, ограниченными по значениями и производным.
Рассматривается динамическая система (10).
Выберем числа h > О, О < L < оо, 0 < Ь\ < оо. Считая, что управление u(i), t > 0, системы (10) непрерывно и имеет кусочно-непрерывную производную, наряду с системой (10) рассматривается эквивалентная система:
х = Ах + Ьхп+1 + dto, xn+i = v. (13)
Функция v{t), t > 0, называется программным управлением для системы (13), если она: 1) кусочно - постоянна: v(t) = vy;,t G [г, т + h[, т = kh, к = 0, 1,2,... ; 2) соответствующая ей компонента a:re+1(i), t > 0, траектории системы (13) удовлетворяет неравенству: |*»+i(0l <L,t> 0; 3) |e(t)| <LU t> 0.
Пусть £ > 0 — любое сколь угодно малое положительное число, и > 0 — заданное число, G — ограниченная окрестпость состояния равновесия х — 0 системы (10), и = 0, w = 0. Функция v(t,x,xn+i), х G G, ¡Zn+il < L, t G [0,i4, называется ограниченным стабилизирующим программно-позиционным управлением системы (13) в области G, если 1) u(i,0,0) = 0, t G 2) \v(t, x, a;r.+i)| < < L\, x G G, \xn+i\ < L, t G [0,i4; 3) траектория замкнутой системы
x = Ах + + dw, xn+i = v(t,x,xn+l), (14)
a;(0) = x0, x0£ G, arn+i(0) = Uo, является непрерывным решением системы уравнений
х = Ах + bxn+1, xn+i = v{t), ж(0) = х0,
где v{t) = u(i,a;(fci/),xa+i(fci/)), i G [kv, (к + l)v[, к = 0,1,...; 4) замкнутая система (14) без возмущений (w(t) = 0, t > 0) асимптотически устойчива в G; 5) существует такое конечпое число t(e), что каждое решение x(t), xn+\(t), t > 0, уравнения (14) обладает свойством: ||a;(i)|| < £> 1г»+1(£)1 S £ ПРИ t > t(£)-
Для построения стабилизирующей обратной связи, по аналогии с предыдущими задачами, вводится специальная (сопровождающая) задача оптимального управления с фазовыми ограничениями:
p(z,zn+1) = min р,
х = Ах + 6®я+1, ¿„+1 = v, ж(0) = z, xn+i(Q) = zn+u (15) х(0) = 0, хп+1(в) = 0, ¡x„+1(t)l < р, |»(f)| < L\, t ÇlT — [0,0].
Введем множество <?е = {(г,г»+1) : г, л^ц)) < £ь |*»+1(01 < « € [0,1/]} .
Для задачи (15) строится оптимальная обратная связь и показывается, что она является ограниченным стабилизирующим программно-позиционным управлением системы (10) при <3 — С?©.
Результаты иллюстрируются на примере системы (5).
В четвертой главе в классе ограниченных управлений рассматриваются задачи робастной стабилизации динамических систем и стабилизации динамических систем с обеспечением дополнительных свойств переходных процессов.
Задача робастной стабилизации.
Рассматривается динамическая система, поведение которой при I > 0 описывается уравнением (6).
Предполагается, что доступная информация о параметрах А, Ь системы неточная: п х п-матрица А и п-вектор Ъ таковы, что
А = А0 + ДА, Ь = Ьа + Д6,
где Ао, Ьо — известные тг х п-матрица и п-вектор соответственно, ДА, ДЬ — неизвестные пхп-матрица и п-вектор, удовлетворяющие неравенств ам:
||ДА|| < а, ||АЬ|| < /3 (а, ¡3 > 0).
Пусть в — ограниченная окрестность состояния равновесия х — 0 системы (6). и = 0.
При заданном е > 0 и фиксированнных числах и > 0, Ь > 0 функция
и{г,х), х € С, г € М, (16)
называется ограниченным робастным стабилизирующим программно-позиционным управлением системы (6) в области б, если 1) и(М) = 0, * € [0,1/[; 2) |и(*,х)| < Ь, х € <7, г е [0,г/[; 3) траектория замкнутой системы
х — Ах + Ьи(Ь,х), ж(0) = ®о> хо £ (17)
является непрерывным решением уравнения х — Ах + Ьи(1), ж(0) = хо,
при u(t) = u(t - kv,x(ku)), t € [&i/,(fc + l)j/[, к = 0,1,...; 4) система (17) при A = Ao, b = bo асимптотически устойчива в G\ 5) существует такое число t(e) > 0, что каждое решение x(t), t > 0, системы (17) удовлетворяет условию ||x(i)|| < е, t > t(e).
Для построения стабилизирующей обратной связи (16) вводится вспомогательная задача оптимального управления:
p{z) = min р,
х = А0х + Ьйи, ®(0) = z, а(0) = 0, |u(i)| < Р, t<ET = [0,0], (18)
и множество G© = {z Е Rn : |u°(M)| < L, t Е [0,^]} .
Множество Ge обладает свойством: для любого е > 0 существует такое 0 > 0, что в е - окрестности множества Gq содержатся все состояния системы (6), которые можно перевести допустимыми управлениями |u(f)| < L, t 6 Т, в начало координат за конечное время.
Показывается, что при заданных е, G. а, ß и соответствующем выборе параметров 0>О, v > 0, h > 0 задачи (18) обратная связь
u(t,x) = u°(t,z), х € Ge, t E [0,i/[,
будет удовлетворять всем требованиям определения ограниченного робастного стабилизирующего программно-позиционного управления с G = Gq.
Результаты иллюстрируются на двух задачах.
Первая задача — задача демпфирования ограниченными кусочно-непрерывными управлениями колебаний двухмассовой системы.
Математическая модель такой системы имеет вид:
¿1 = х3, х2 ■= Х4, хз = (cixi + с2х2 + и)/тп, х4 = (cixх - (с2 + с2)х2)/М,
где m, М — массы объектов, ci, с2 — коэффициенты упругости пружин, гх — демпфирующее воздействие.
Вторал задача — задача стабилизации инерционным моментом математического маятника7 в верхнем неустойчивом положении равновесия.
Линеаризованная математическая модель такой системы имеет вид:
7Красовскаий H.H. Проблемы стабилизации управляемых движений // Малкия И.Г. Теория устойчивости движения. Издание 2-е, испр. - M.: Наука, 1066. - 530 с.
¿1 = Х2, ¿2 = XI + Х3, X3 = и,
где х\ — угол отклонения маятника от вертикали, х2 — угловая скорость маятника, хз — момент, приложенный к маятнику, и — скорость изменения момента (управлешш).
Задача стабилизации динамических систем с обеспечением дополнительных свойств переходных процессов.
Рассматривается динамическая система с управлением, поведение которой при í > 0 описывается уравнением (6)
Обозначим через у = Нх, Н € Итхп, тп-вектор выходных сигналов. Введем множества
¥{1) = <у< <?*(<)}, t > О,
где д*(1)> д*{1), -оо < <г*(0 < < °°> * > — заданные непрерывные ш-вектор-функции.
Пусть (7 С Яп — ограниченная окрестность состояния равновесия х = 0 системы (6), и = 0.
Определение 1. При фиксированных числах 1/>0,/г>0,£>0 функция
и,(г,х), з е [о,1/[, г > о, х ев, (19)
называется ограниченным стабилизирующим программно-позиционным управлением системы (6) в области (7, если 1) и4(^0) = 0, 5 е [0,г/[, г > 0; 2) |и,(г,х)| <¿,56 [0,И, * > 0, г £ (?; 3) траектория замкнутой системы
х — Ах + Ьщ(1,х), х(0) = х0) х0 € С, (20)
является непрерывным решением уравнения
х = Ах + Ьи{1), х(0) = хо,
при и{1) = и3{ки,х(ки)), з € [0,«/[, г £ [&/,(£ + 1)1>[, к = 0,1,...; 4) система (20) асимптотически устойчива в С.
Определение 2. Ограниченное стабилизирующее программно-позиционное управление (19) называется стабилизирующим программно-позиционным управлением со свойством А, если выходной сигнал у {С}, £ > 0, системы (20) содержится во множестве Ь > 0, где д*(1) — -аехр(-аг), д*(г) = аехр(-а^), а > 0. Число а > 0 называется степенью устойчивости переходного процесса.
Ограниченные стабилизирующие обратные связи с дополнительными свойствами строятся с помощью вспомогательных (сопровождающих) задач оптимального управления.
Первая вспомогательная задача оптимального управления для построения стабилизирующей обратной связи со свойством А имеет вид: q
B(t,z) — min I |u(f)|df, Jo
x = Ax + bu, «(0) = x(Q) = 0, (21)
g*(t+T)<Hx(t)<g*(t + T), |«(í)| < 1, ¿ € Г = [0,0].
Пусть G(0, т) — множество всех z € Rn, для которых задача (21) имеет решение.
Методом функций Ляпунова показывается, что при задапных 9*(t)i t > 0, и соответствующем выборе параметров © > 0,
V > 0, h > 0 задачи (21) обратная связь u,(t,x) — ti°(í, ж), з £ Th, х £ G(Q,t), t €Е Rv, удовлетворяет всем требованиям определения стабилизирующего программно-позиционного управления со свойством А. В качестве функции Ляпунова берется оптимальное значение критерия качества задачи (21).
Описывается алгоритм работы оптимального стабилизатора.
Результаты иллюстрируются на примере стабилизации колебательной системы8:
¿1 = Ж2, ¿2 = —Х\ + ХЗ, ¿3 = Х4, ¿4 — —х3 + и, (22)
где ^xi,X2,X3,Xi) — состояние системы, и — управляющее воздействие.
Полученные результаты сравниваются с ограниченной стабилизирующей обратной связью, полученной в [8] для системы (22) формульном виде:
fxi 1 /29,
и = — £sat I — + 2gsat ( + Хз + Xi'
где |u(f)| < £, sat(s) = sign(s)mm{|s¡, 1}.
Вторая вспомогательна задача оптимального управления для построения стабилизирующей обратной связи со свойствам А имеет вид:
р(т, z) = min р,
'Sussmann H.J., Sontag E.D., Yang Y. A general result on the stabilization of linear systems rising bounded controls // ШЕЕ TVansajctions on Automatic Control. - 189-4. - Vol. 39, № 12. - P. 2411-2425.
х = Ах + Ьи, ж(0) = г, г(Э) = О, + т) < Нх{1) < д*(1 + т), |ы(*)| < р, гет= [О, в].
Определение 3. Ограниченное стабилизирующее программно-позиционное управление (19) называется стабилизирующим программно - позиционным управлением со свойством В, если производные выходных сигналов у{1), £ > 0, соответствующие решению х{г), I > 0, системы (20), меняют знак в заданные моменты времени I — к/д, к = 1,2,.... Число д — степень колебательности.
Определение 4. Ограниченное стабилизирующее программно-позиционное управление (19) называется стабилизирующим программно-позиционным управлением со свойством С, если выходной сигнал ?;(<), I > 0, системы (20) удовлетворяет условиям: 2Л(0 > Рь t > 0, при у,-(0) > 0, р; < 0; у,-(<) < р,-, * > 0, при 2/;(0) < 0, р; > 0,г = 1 ,ш. Числа р;, г = 1,тп, называются степенями перерегулирования. Если р,- = 0, г = 1,т, то в замкпутой системе нет перерегулирования.
Определение 5. Ограниченное стабилизирующее программно -позиционное управление (19) называется стабилизирующим программно - позиционным управлением со свойством О, если производные выходных сигналов I > 0, системы (20) сохраняют постоянные знаки па промежутке % > 0.
На примере стабилизации колебательной системы (22) с помощью соответствующих вспомогательных задач оптимального управления строятся стабилизирующие обратные связи, обеспечивающие перечисленные свойства переходных процессов.
ВЫВОДЫ
В диссертационной работе на основе методов, разработанных Р.Габасовым, Ф.М.Кирилловой, О.И.Костюковой, исследованы задачи синтеза оптимальных и инвариантно-устойчивых систем управления. Согласно результатам выполненной работы, можно сделать следующие выводы:
1. Для линейной экстремальной задачи сформулирован и доказан критерий оптимальности.
2. Для задачи синтеза оптимальных и оптимальных по быстродействию систем в классе ограниченных непрерывных управлений с ограниченными производными обоснована реализация в режиме реального времени ограниченной обратной связи.
3. Для задач стабилизации динамических систем в классах ограниченных инерционных и безинерциоппых управлений без учета возмущений и в условиях постоянно действующих возмущений описана реализация в режиме реального времени стабилизирующей обратной связи.
4. Построены реализации обратных связей для задач робастной стабилизации и стабилизации динамических систем с обеспечением дополнительных свойств переходных процессов.
СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Ружицкая Е.А. Критерий оптимальности для одной линейной задачи оптимального управления с параметрами // Белорусский конгресс по теоретической механике "Механика - 95". Тез. докл.
- Минск, 1995. - С. 196.
2. Ружицкая Е.А. Критерий оптимальности для одной линейной полубесконечной экстремальной задачи // Вестник БГУ. Серия 1.
- 1997, № 1. - С. 44-47.
3. Ружицкая Е.А. Об одном подходе к ситезу инвариантно-устойчивых систем // Проблемы математики и информатики. Тез. докл. конф. - Гомель, 1994. - С. 60.
4. Ружицкая Е.А. Оптимизация динамических систем управлениями, ограниченными по значениям и производным // VII Белорусская математическая конференция. Тез. докл. - Минск, 1996.
- С. 185.
5. Ружицкая Е.А. Построение стабилизирующих обратных связей с реализациями, ограниченными по значениям и производ-яым // Международная математическая конференция "Еругинские чтения - IV". Тез. докл. конф. - Витебск, 1997. - С. 104-105.
6. Ружицкая Е.А. Стабилизация динамических систем управ-иепиями, ограниченными но значениям и производным // Вестник ВГУ. Серия 1. - 1997, № 2. - С. 61-65.
7. Gabasov R., Kirillova F.M., Ruzhitskaya Е.А. Amortization of Oscillating Systems by Optimal Control Methods // Control of Oscillations md Chaos. 1st International Conference. - St. Petersburg, Russia, 1997.
- P. 431-434.
РЕЗЮМЕ
Ружицкая Елена Адольфовна
СИНТЕЗ ОПТИМАЛЬНЫХ И ИНВАРИАНТНО-УСТОЙЧИВЫХ СИСТЕМ УПРАВЛЕНИЯ
Ключевые слова: синтез, стабилизация, обратная связь, динамическая система, оптимальное управление.
Для задачи максимизации линейного функционала по параметрам и управлению формулируется и доказывается критерий оптимальности. Для частного случая задачи, который сформулирован в виде классической задачи терминального управления, оп исыва-ются методы реализации оптимальных обратных связей, основанные на пошаговой коррекции оптимального программного управления, полученного с помощью решения в режиме реального времени специальных (сопровождающих) задач оптимального управления. Последний результат переносится на классическую задачу быстродействия в классе ограниченных управлений с ограниченными производными.
Для задач стабилизации динамических систем в классах инерционных и безинерционных управлений, без учета возмущений и в условиях постоянно действующих возмущений в режиме реального времени вычисляются значения стабилизирующих обратных связей.
В классе ограниченных управлений рассмотрены задачи ро-бастной стабилизации динамических систем и стабилизации динамических систем с обеспечением дополнительных свойств переходных процессов. Для построения стабилизирующей обратной связи в режиме реального времени использовались специальные (сопровождающие) задачи оптимального управления.
Все результаты иллюстрируются на примерах стабилизации динамических систем третьего, четвертого и пятого порядков.
РЭЗЮМЭ
Руяацкая Алена Адольфа^на
С1НТЭЗ АПТЫМАЛЬНЫХ 11НВАРЫЯНТНА-УСТОЙЛ1ВЫХ С1СТЭМ К1РАВАННЯ
Ключавыя славы: сштэз, стабшзадыя, адваротная сувязь, ды-нашчная сзстэма, алтымальнае гараванне.
Лля задачы макашзацьп лшейнага функцыянала па параметрах 1 юравант фармулюецца 1 даказваецца крытэрый аптымаль-насць Для прьшатнага выпадку задачы, яш сфармуляваны у выг-лядзе клаачнай задачы тэрмшалънага юраванпя, ашсваюцца ме-тады рэал1зацьп аптымальных адваротных сувязяу, заспаваныя на пакрокавай каррэкцьп аптымальнага праграмнага гаралання, атры-мапага з дапамогай рашэпня У рэжыме рэальнага часу спецыяль-ных (суправаджальных) задач аптымальнага юравання. Апош-ш вышк перапоацца на клаачнуга задачу хуткадзеяння у класе абмежаваных юравання^ з абмежаваным5 вытнорньол.
Для задач стабшзацьп дынам1чных астэм у класах шэрцыйных 1 безынерпыйных мравалпяу, без улжу адопленняУ 1 ва умовах пастаянна дзейных адхшенпяу у рэжьгме рэальнага часу вылзчва-юцца значэнна cтaбiлiзyюцыx адваротных сувязяу.
У класе абмежаваных мравання^ разгледжаны задачы рабаснай стабЫзацьп дыпашчных астэм 5 стабшзадьп дьшaмiчныx астэм з забеспячэннем дадатковых уласщвасцей пераходных прадеду. Для пабудовы стаб!л1зуючай адваротнай суняз! у рэжыме рэальнага часу выкарыстоувал^я спеныяльпыя (сунраваджаль-зыя) задачы тэрмшальпага юравання.
Усе вышн адлюстроуваюцца па прыкладах стабш1зацьп дына-.счных астэм трэцяга, чацвертага 1 пятага парадка^.
SUMMARY
Ruzhitskaya Elena Adolfovna
OPTIMAL AND INVARIANT-STABLE SYNTHESIS OF THE CONTROL SYSTEMS
Key words: synthesis, stabilization, feedback, dynamic systems, optimal control.
An optimal criterion for linear functional maximization on parameters and control has been formulated and determined. Optimal feedback realization methods, for a special case formulated as the terminal control classical problem, have been described on the basis of optimal programmable control step correction, obtained with the help of optimal control problems, solution being given in real-time. The last of the obtained results is transfered on a classical fast-action problem in the class of bounded controls with bounded derivatives. The values of stabilization feedbacks have been calculated for dynamic stabilization systems in the class of inertia! and inertia-free controls, without perturbations being taken into account and under constant perturbations.
The problem of dynamic systems robust stabilization and dynamic systems stabilization with additional properties of transitional processes being secured, have also been studied.
Special (accompanying) optimal control problems have been used for the construction of stabilization feedback in real-time.
The examples of the dynamic systems stabilization of the third, the forth and the fifth orders have been used to illustrate all the results.