Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Гомоюнов, Михаил Игоревич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2015
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи М Ко К^очО
ГОМОЮНОВ Михаил Игоревич
ЛИНЕЙНО-ВЫПУКЛЫЕ ЗАДАЧИ ОПТИМИЗАЦИИ ГАРАНТИИ ПРИ ЗАПАЗДЫВАНИИ В УПРАВЛЕНИИ
01.01.02 — дифференциальные уравнения, динамические системы и оптимальное управление
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
1»КйР 2015
005560614
Екатеринбург 2015
005560614
Работа выполнена в отделе динамических систем Федерального государственного бюджетного учреждения науки Института математики и механики им. Н.Н.Красовского Уральского отделения Российской академии наук.
Научный руководитель: Лукоянов Николай Юрьевич, доктор физико-
математических наук.
Официальные оппоненты: Ухоботов Виктор Иванович, доктор физико-
математических наук, профессор, ФГБОУ ВПО «Челябинский государственный университет», заведующий кафедрой теории управления и оптимизации математического факультета.
Зайцев Василий Александрович, кандидат физико-математических наук, доцент, ФГБОУ ВПО «Удмуртский государственный университет», доцент кафедры дифференциальных уравнений математического факультета.
Ведущая организация: ФГБУН Институт проблем механики им.
А.Ю.Ишлинского РАН.
Защита состоится 15 апреля 2015 года в 11 часов на заседании диссертационного совета Д 004.006.01 на базе Федерального государственного бюджетного учреждения науки Института математики и механики им. Н.Н.Красовского Уральского отделения Российской академии наук по адресу: 620990, г. Екатеринбург, ул. С.Ковалевской, 16.
С диссертацией можно ознакомиться в библиотеке и на сайте ИММ УрО РАН: http: //wwwrus.imm.uran.ru / C16/Diss/.
Автореферат разослан " 2- " мм-тц 2015 г.
Ученый секретарь диссертационного совета, доктор физико-математических наук
Костоусова Елена Кирилловна
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Предыстория и актуальность темы исследования. Реальные процессы управления протекают обычно в условиях неопределенности, неконтролируемых помех со стороны окружающей среды или же под влиянием сознательного противодействия. Целью управления часто является достижение некоторого качества процесса, которое во многих случаях удобно описывать с помощью подходящего показателя. Возникают задачи о формировании такого управления, которое обеспечивает показателю качества оптимальный гарантированный результат. Математической теорией, в рамках которой формализуются такие задачи, является теория дифференциальных игр.
Теория дифференциальных игр активно развивается с начала 1960-х годов. Становление этой теории в первую очередь связано с именами Н.Н.Красовского, Л.С.Понтрягина, Б.Н.Пшеничного, R.Isaacs, W.H.Fleming и A.Friedman. В частности, Н.Н.Красовским и его учениками была предложена и развита концепция позиционных дифференциальных игр1,2,3, в рамках которой выполнена данная диссертация.
В диссертации рассматривается следующая линейно-выпуклая задача об управлении с оптимальным гарантированным результатом. Движение динамической системы, подверженной воздействиям управления и помехи, описывается линейными по фазовому вектору дифференциальными уравнениями. Возможности управления и помехи стеснены геометрическими ограничениями. Промежуток времени процесса управления зафиксирован. Целью управления является минимизация значения показателя качества, включающего в себя оценку нормы совокупности отклонений движения системы в заранее заданные моменты времени от заданных целевых точек. Такая по существу нетерминальная структура показателя качества, то есть присутствие в нем оценки состояния динамической системы не только в конечный, но и в промежуточные моменты времени, составляет первую особенность рассматриваемой задачи. Вторая особенность заключается в наличии в системе запаздывания в управлении.
Нетерминальные показатели упомянутой «многоточечной» структуры используются при решении практических задач4. Дифференциальные игры с такими показателями изучались Н.Н.Красовским и А.Н.Красовским3.
Эффект запаздывания в управлении характерен для многих реальных процессов. Он может быть обусловлен различными задержками в каналах цепи обратной связи, а также временными затратами, необходимыми для
'Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
2Красовскпй Н.Н. Управление динамической системой. М.: Наука, 1985.
3Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhàuser, 1995.
4Бердышев Ю.И. Об одной задаче последовательного сближения нелинейной управляемой системы третьего порядка с группой движущихся точек // Прикл. математика и механика, 2002. Т. 66, вып. 5. С. 742-752.
формирования оптимального управления. Системы с запаздыванием в управлении активно исследуются начиная с середины ХХ-го столетия5,6,7. В основном, эти исследования посвящены задачам об устойчивости и стабилизации, управляемости и наблюдаемости таких систем, задачам оптимального управления. Дифференциальные игры с запаздыванием в управлении и терминальной платой изучались в работах Ю.С.Осипова и В.Г.Пименова8,9.
В диссертации методы теории позиционных дифференциальных игр2,3,9 развиваются применительно к линейно-выпуклым задачам оптимизации гарантии, в которых одновременно присутствует запаздывание в управлении, и показатель качества является по сути нетерминальным. При этом основное внимание уделяется разработке конструктивных методов решения.
Несмотря на то, что задачи оптимизации гарантии и дифференциальные игры имеют широкий круг приложений, возможности применения теоретических методов исследования во многом ограничены их принципиальной сложностью и трудоемкостью в реализации. Выписать решения в явном виде удается крайне редко, поэтому продвижение в этом направлении связано с развитием численных методов, ориентированных на использование современной высокопроизводительной вычислительной техники. Разрабатываемые в диссертации конструкции решения задач оптимизации гарантии восходят к методу выпуклых сверху оболочек3'10,11. Результатом его работы является репрезентативная формула для приближения величины оптимального гарантированного результата, которая позволяет методом экстремального сдвига на сопутствующие точки2,3 достаточно просто строить оптимальные законы управления. Это составляет одно из достоинств метода.
Самой трудоемкой частью метода является многократное построение выпуклых сверху (вогнутых) оболочек вспомогательных функций, а эффективность такой операции определяется прежде всего размерностью множества их определения. Из-за наличия в показателе качества оценок движения в промежуточные моменты времени эта размерность, вообще говоря, может
5KharatishviIi G.L. A maximum principle in external problems with delays // Mathematical Theory on Control. New York: Academic Press, 1967. P. 26-34.
6Artstein Z. Linear systems with delayed controls: a reduction // IEEE Trans. Autom. Contr., 1982. Vol. 27, № 4. P. 869-879.
7Delfour M.C., Karrakchou J. State space theory of linear time invariant systems with delays in state, control, and observation variables, I; II // J. Math. Anal. Appl., 1987. Vol. 125, № 2. P. 361-399; P. 400-450.
8Осипов Ю.С., Пименов В.Г. О позиционном управлении при последействии в управляющих силах // Прикл. математика и механика, 1981. Т. 45, вып. 2. С. 223-229.
9Пименов В.Г. Дифференциальная игра с фиксированным временем окончания для систем с последействием в управлении // Задачи позиционного моделирования. Свердл., 1986. С. 103-118.
10Красовский А.Н. Построение смешанных стратегий на основе стохастических программ // Прикл. математика и механика, 1987. Т. 51, вып. 2. С. 186-192.
иКрасовский H.H., Лукоянов Н.Ю. Задача конфликтного управления с наследственной информацией // Прикл. математика и механика, 1996. Т. 60, вып. 6. С. 885-900.
быть весьма большой даже при малой размерности фазового вектора системы. Однако, во многих случаях ее можно существенно понизить. Например, для задач без запаздывания, в случае позиционного показателя качества конструкции метода всегда можно редуцировать12'13 так, чтобы размерность переменных, по которым требуется проводить овыпукление, совпадала с размерностью фазового вектора системы. Такая редуцируемость обуславливает эффективность метода и составляет другую важную его особенность. Одной из основных задач диссертации является разработка подобных редуцированных конструкций для решения задач оптимизации гарантии с учетом запаздывания в управлении.
Несмотря на имеющуюся трудоемкость и ресурсоемкость метода выпуклых сверху оболочек в реализации, современный уровень развития вычислительной техники и технологий позволяет14 использовать его для эффективного численного решения достаточно широкого круга линейно-выпуклых задач управления и дифференциальных игр. Поэтому в диссертации этот метод и был выбран в качестве основы для решения рассматриваемых задач.
Целью диссертации является разработка эффективных методов для вычисления величины оптимального гарантированного результата и построения оптимальных законов управления в линейно-выпуклых задачах оптимизации гарантии с нетерминальными показателями качества «многоточечной» структуры и запаздыванием в управлении.
Методы исследования. Представленные в диссертации исследования опираются на подходы и методы из теории позиционных дифференциальных игр: подход, основанный на принципе гарантированного результата, функциональная трактовка процесса управления, метод экстремального сдвига, метод выпуклых сверху оболочек вспомогательных программных функций. Используются результаты современной теории дифференциальных уравнений и аппарат выпуклого анализа.
Научная новизна. Рассмотрена новая линейно-выпуклая задача оптимизации гарантии с учетом эффекта запаздывания в управлении при нетерминальном показателе качества процесса управления, оценивающем движение системы по совокупности отклонений в заданные моменты времени от заданных целевых точек. В зависимости от позиционной структуры показателя качества установлено существование оптимальных стратегий управления в подходящих классах стратегий обратной связи. Для приближенного вычисления величины оптимального гарантированного результата и нахождения
12Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикл. математика и механика, 1998. Т. 62, вып. 2. С. 188-198.
13Лукоянов Н.Ю. О построении цены позиционной дифференциальной игры // Дифференц. уравнения, 2001. Т. 37, X' 1. С. 18-26.
14Корнев Д.В. О численном решении позиционных дифференциальных игр с нетерминальной платой // Автомат, и телемех., 2012. № 11. С. 00-75.
оптимальных законов управления предложена процедура попятного построения выпуклых сверху оболочек вспомогательных функций. В случае позиционного показателя качества проведена редукция этой процедуры, основанная на оригинальных овыпукляющих свертках и существенно понижающая размерность областей определения овыпукляемых функций.
Теоретическая и практическая значимость работы. Диссертация носит теоретический характер. Полученные результаты могут быть использованы при дальнейшем исследовании задач оптимизации гарантии с нетерминальными показателями качества и запаздыванием в управлении, а также при разработке численных методов их решения.
Апробация работы. Результаты диссертации обсуждались на семинарах отдела динамических систем Института математики и механики им. Н.Н.Кра-совского УрО РАН и представлялись в докладах на 42-ой, 43-ей и 44-ой Всероссийских молодежных школах-конференциях «Современные проблемы математики» (Екатеринбург, 2011, 2012 и 2013), 5-ой и 6-ой Международных конференциях «Колмогоровские чтения. Общие проблемы управления и их приложения» (Тамбов, 2011, 2013), Международной конференции «Алгоритмический анализ неустойчивых задач» (Екатеринбург, 2011), Всероссийской научной конференции с международным участием «Математическая теория управления и математическое моделирование» (Ижевск, 2012), 10-th IFAC Workshop on Time Delay Systems (Boston, USA, 2012), 15-th IFAC Workshop on Control Applications of Optimization (Rimini, Italy, 2012), XII Всероссийском совещании по проблемам управления (Москва, 2014), 19-th IFAC World Congress (Cape Town, South Africa, 2014), Международной конференции «Динамика систем и процессы управления» (Екатеринбург, 2014).
Публикации. Основной материал диссертации опубликован в работах (1-4,9-18). Работы автора [5-8,19] не вошли в диссертацию, но имеют к ней непосредственное отношение.
Структура и объем работы. Диссертация состоит из введения, четырех глав, объединяющих шестнадцать разделов, заключения и списка литературы. Объем диссертации составляет 110 страниц, библиография включает 139 наименований, иллюстративный материал насчитывает 8 рисунков.
СОДЕРЖАНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
Во введении дан краткий обзор предыстории вопроса, обоснована актуальность темы исследования, сформулированы цели работы, приведена аннотация полученных результатов.
Глава I носит вспомогательный характер. В ней приводятся необходимые сведения из теории позиционных дифференциальных игр, на которые опирается изложение последующих глав.
В главе II рассматривается задача управления, описываемая уравнением движения
da:(i)/df = A(t)x(t) + B{t)u{t) + BT(t)u{t - г) + C(t)v(t), í0 < í < tf,
lEl", u€P CP", neQcr-, r = const >0, ^
и показателем качества процесса управления
7 = /x^Di(x(i?i)—ci),.. .,Dj»(i(fl«)-c«))+jf (a{t,u{t))+P{t,v{t)))dt. (2)
Здесь x фазовый вектор, t — текущий момент времени, и - вектор управления, v — вектор помехи; т — величина запаздывания; £о и ú — начальный и терминальный моменты времени соответственно; Р и Q — компактные множества; A(t), B(t), BT(t) и C(t) непрерывные на [ío>^] матрицы-функции; 19i € (fo.tf], i — Ii-^í ~ заданные моменты времени, -д, < г = 1, N — 1, и An = г9; Д - (c?¿ х п)-матрица, 1 < < п, г = 1, N\ c¡ е К", г = 1, N; fj,(lu ..., íjv) S К, (1г,..., lN) 6 х ... х — норма; q(í, и) 6 R, (í, u) е [£о>^] х Р, и /3(t,v) € К, (í, г») G [£о, х Q, — непрерывные функции.
Позицией системы (1) называется тройка (t,x,p(■)) € [£о>$] х К™ х "Р, где V — множество измеримых по Борелю функций S Р, £ G [—т, 0). При этом функция р(-) играет роль истории управления длины запаздывания г, сформировавшейся к моменту времени t: u(t + £) = Обозначим К =
х Мп х V. Допустимы измеримые по Борелю реализации управления u[f0[-]#) = {u(t) е Р, h ^ t < ti} и помехи v[t0[-]ti) = {v(t) eQ,t0^t < tf}. Из начальной позиции (¿cb£o>Po(")) е К такие реализации единственным образом порождают движение системы (1) — абсолютно непрерывную функцию = ix(t) € ¿o ^ t ^ г?}, которая удовлетворяет условию x(to) = хо и почти всюду на [í0, вместе с u(t) и v(t) удовлетворяет уравнению (1). При этом u(t) = po(t — to) при t е [to — т, ío)-
Цель управления — доставить показателю (2) как можно меньшее значение. При этом действия помехи неизвестны и, в частности, могут быть нацелены па его максимизацию.
Задача управления формализуется следующим образом. Стратегией управления [/(■) называется функция {/(í,i[to[-]í],p(-),e) € Р, (t,x[to[-]t],p(-)) 6 [£о,$] х C[io,í] х Р, £ > 0, где функция £[í0[-]t] играет роль истории движения системы (1), сложившейся к моменту времени t, е — параметр точности2, C[to,t] — множество непрерывных функций х(£) € М", £ 6 Стратегия
{/(■) действует на систему (1) на базе разбиения
Ак = Ajt{"r¿} = {т,- : Ti = to, tj < Tj+U j = 1, к, тш = г?} (3)
отрезка времени [<o,i?]. Тройка {{/(•),£, Д^} определяет закон управления, который по шагам разбиения Д/; в цепи обратной связи формирует кусочно-
постоянную реализацию u[io[-]i9) по правилу:
u(t) = U(Tj,x[t0[-}Tj},uTj{-),£), t€[Tj,Tj+1), j = hk, (4)
где uTj(-) = {wTj(0 = u(Tj + £), £ G [—r, 0)} — история управления, сформировавшаяся к моменту времени tj. Из начальной позиции (¿о, хо,Ро(-)) ё К в паре с допустимой реализацией помехи этот закон единственным
образом определяет движение системы (1). Соответствующее значение показателя (2) обозначим через ^(U(-), е, Ак; t)[i0[-]i?); t0,x0,p0(-)). Гарантированный результат для закона {[/(•),£, Д^} определятся равенством
Г„ [£/(•),£, Ал; *о,яо,Ро(-)] = SUP е, Ак; t0, х0,р0{-)),
v[to№
где супремум берется по всем допустимым реализациям помехи i>[io[-]i9). ■ Оптимальным гарантированным результатом называется величина
T°u(to,xo,po(-)) = inf lim lim supTu [*/(•),£, Ak; t0,x0,p0(-)],
U(-) £4-" "4-0
где супремум вычисляется по всем разбиениям Ак вида (3) с диаметром 5к — meix:)=Y|j(rj+i — Tj) ^ 6, а инфимум берется по всем стратегиям U(-). Если этот инфимум достигается, то соответствующая стратегия t/°(-) называется оптимальной. Для числа С > 0 закон управления {[/(•),£, Ак} называется (^-оптимальным, если выполняется неравенство
Г„[U{-),s, Л*; io,a:o,P0(-)] < (*о, ®о,Ро(0) + С-
Работа посвящена разработке методов вычисления оптимального гарантированного результата и построения ^-оптимальных законов управления.
Отметим, что в диссертации дополнительно рассматривается задача о формировании воздействий помехи, нацеленных на максимизацию показателя (2), и для этой задачи устанавливаются аналогичные результаты.
На основе функциональной трактовки процесса управления, восходящей к функциональному подходу11'15, исходная задача оптимизации гарантии (1), (2) сводится к вспомогательной линейно-выпуклой дифференциальной игре без запаздывания и с терминальной оценкой движения в показателе качества. Структура этой игры определяется на основе информационного образа
w(i,i[to[-]i],p(0) = {®i(i,a;[io[-]i].P(-)).---.«'w(i,a;[io[-]i],p(-))} е R3, (t,i[to[-]t],p(-)) е М X C[to,t] х V, d = £2=1*. который складывается из своеобразных прогнозов движения системы на каждый из оценочных моментов времени i1),:
Wi{t,x{t),p(-)), ie[fo.#i],
tüi(i,x[i0[-]i],p(-))= , n , „
15Красовский H.H. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959.
/4+г
АВД, оадж - 7- - - еж, (5)
где £) матрица Коши системы йх^/йЬ = А{Ь)х{£)\ х(1) — функция Хевисайда: х(0 = 0 при ( ^ О п = 1 при í > 0. Вспомогательная дифференциальная игра описывается уравнением движения
аад/аг = в (гад + с t0^t<д, г е ка, иеР, у е <5, (6)
и показателем качества
у = ф(0)-с)+ (а(1,иЦ))+р(1,ь(Щ<И, (7)
Jt0
где
в(о = {*!('),■••,«)}, сф = {ад,...,«)},
Вг{1) = Г>ДО4, Ь)В{£)х{$г - ¿) + * + г)вт(4 + г)х№ - 4 - т), ад = ДХ(<и)С(4)х(0{-*), с= {Г>1с!.....
Эта дифференциальная игра имеет2 цену р(Ь,г) и седловую точку из оптимальных стратегий и гГ°(4,г,е), (¿,г) 6 х е > 0.
Исходная задача (1), (2) и вспомогательная дифференциальная игра (6), (7) связаны следующим образом.
Теорема 4.1 Имеет место равенство
Г„(*о,жо,ро(-)) = Р (¿о>^(*о,жо,Ро(-))). Цо,х0,р0{-)) £ К.
Стратегия управления
(о)
. является оптимальной.
Для приближенного вычисления цены и построения оптимальных законов управления в дифференциальной игре (6), (7) применяется метод выпуклых сверху оболочек. Пусть Д^ = — разбиение вида (3), причем
6 Аь, Ъ-Т е Ак, если ^ -т € [г0,1?], г = 1,Ы. (9)
Положим
д= {Тека:^*(Т) ^ 1}, (ю)
где ¡л*{-) — норма, сопряженная к норме //(•) из показателя качества (2).
Для j = 1, к и 1 G Kd обозначим Atpj(\) = J mmmax((l,B(t)u + C(t)v)+a{t,u) + P(t,v))dt, (11)
где символ {•, •) означает скалярное произведение векторов.
Попятно по шагам разбиения Д^ определим функции ^,(1) € К, 1 € G, j = 1, к + 1, согласно следующему рекуррентному правилу. При j = к + 1 полагаем
Й+1(Т) = -<Т,С>, led. (12)
При j = 1, к определяем
Ш = ^(Т) = Д^(Т) + ^+1(Т), Те б, (13)
где символ {ф{-)}*а(■) означает выпуклую сверху оболочку функции -ф{■) на множестве G (минимальную вогнутую функцию, мажорирующую ip(-) на G). Рассмотрим систему величин
ЗД = шк(<Т,г)+&(!)), z е М3, j = 1, к + 1, (14)
leG
и стратегию управления и&к(-) в дифференциальной игре (6), (7), которая в моменты времени tj Е Ль определяется в согласии с методом экстремального сдвига на сопутствующие точки, выбираемые по этой системе величин:
uAk(Tj,z,e) е argmin((sju'(z, е), В(т^)и) + fju\z, s)a(rj, it)),
^p _J_ (15)
j = l,k, zeMd, e>0,
а в остальные моменты времени доопределяется произвольным образом. Здесь
Tju)(z,£) € argmaxf (T, z} + &•(!) - ф)у/\ + ||Tp), ф) = + (Tj - t0)e, TeG
символ || • || означает евклидову норму вектора.
С учетом соотношений (8) в исходной задаче (1), (2) рассмотрим стратегию управления
¿W*, x[to[-}t], р(-), е) = ийк (t, w (t, x[i0[-]i], р(-)), е),
t е [i0l ®[io[-]i] € C[t0, t], p(-) eV, £ > 0.
В согласии с теоремой 4.1 и методом выпуклых сверху оболочек имеют место следующие результаты.
Теорема 5.1 Для любого числа £ > 0 можно указать такое число 6 > 0, что, каковы бы ни были начальная позиция (£о> ^сь Ро(-)) £ К и разбиение Да вида (3), (9) с диаметром 5k ^ 5, будет справедливо неравенство
|ei(w(io,xo,po(-))) -Г°(г0,Яо,Ро(-))1
Теорема 5.2 Для любого числа £ > 0 найдутся такие число г* > 0 и функция 5„{е) > 0, е £ (О, е.], что, каковы бы ни были начальная позиция (to,xo,po(-)) 6 К, значение параметра точности е G (0, £*] и разбиение Д^ вида (3), (9) с диаметром 5k < ¿*(е)> закон управления {¿УдД-), £, Ajt} будет ^-оптимальным.
Основным недостатком процедуры (10) (13) является большая (пропорциональная числу N моментов из показателя качества (2)) размерность d множества определения овыпукляемых функций, что во многом ограничивает использование этой процедуры, особенно при численной реализации. Эта проблема размерности отчасти решается в последующих главах для показателей качества так называемой позиционной структуры.
Глава III посвящена дальнейшему развитию предложенного в главе II подхода к решению задачи (1), (2) в случае, когда показатель качества (2) удовлетворяет следующим дополнительным предположениям: во-первых, отсутствует интегральное слагаемое, то есть a(t,u) = 0 и ß(t,v) = 0, а во-вторых, можно подобрать нормы hi(U,..., In) £ К, (Ii,..., In) £ Rdi х ... х Rdw, i = l,N, и четные по v нормы а ¡(Ii, и) € R, (Ii, и) € I4 х 1, i = 1, JV - 1, так, чтобы выполнялись равенства
ц(1и. ..,lN)= ni(lu ..., lN), (h, ...,Ijv)GRd'x...x
/¿i(h, h+1, ■■■ ,In) = oi(U,hi+\(k+i,..., In)), (16)
(k,..., lN) € Rdi x ... x Rd~, i = 1,N-1.
Из этих предположений следует12, что показатель (2), принимающий вид
-y = Pi(p1(x(41)-c1),...,DN(x(0N)-cNj), (17)
является позиционным3.
Задача (1), (17) сводится к каскаду из N вспомогательных дифференциальных игр уменьшающейся размерности. Игра каскада, отвечающая оценочному моменту времени '0{ из показателя (17), определяется при помощи информационного образа
w^(t,x,p(-)) = {Wi(t,x,p{-)),... ,wN(t,x,p(-))} S RdH, (t,x,p(-)) е к, teV>i-x,di), = =
составленного из прогнозов движений и'л(-) (5), h = i,N, на этот и последующие оценочные моменты времени. Она описывается уравнением движения
v(t), io ^ t < z'®' € R ', и € P, v 6 Q, (18)
и показателем качества
7И = кЫЧв) ~ сИ), (19)
где
вй(0 = ...,вы{1)}, СИ(0 = {ст,... ,Сл(«)},
ей =
Эта дифференциальная игра имеет2 цену и седловую точку из оп-
тимальных стратегий иМ°(г, г®, е) и «и°(г, е), (Ь, гЩ е [¿0,1?] х е > 0.
Связь между задачей оптимизации гарантии (1), (17) и каскадом вспомогательных дифференциальных игр (18), (19) дается в следующей теореме.
Теорема 8.1 Имеет место равенство
Г2(*о,*о,ро(-)) = /'(¿0, н^о.яо.РоО))). («о, го,№(•)) е /Г.
Стратегия управления
(1,х,р(-)) € К, г>0, г = !7]7, 0О = (О,
является оптимальной.
Таким образом, в задаче (1), (17) существует оптимальная стратегия управления вида и^,х,р(-),е) € Р, (Ь,х,р(-)) € К, £ > 0, которая из всей истории движения :фо[-]£] системы (1), сформировавшейся к текущему моменту времени используют информацию только о текущем значении х(Ь) фазового вектора. В согласии с соотношением (4) закон управления {£/(•),Д;ь} на базе такой стратегии формирует кусочно-постоянную реализацию «[¿0[-]$) по правилу: и(г) = Ц(т^,х{т^,иТ,■(•),е), £ 6 [ТУ.ТУ+О. 3 =
Применяя для каждого г = 1,ЛГ в г-ой дифференциальной игре (18), (19) метод выпуклых сверху оболочек, на базе разбиения Д^ вида (3), (9) по формулам, аналогичным (10) (15), с учетом вида показателя (17) определим множество
см с Ка1'', функции е 1'*' = {Ь, • • • 1 € где 6
Н = г, Я, и величины е^'(гМ), г'*' € j = 1,/с+ 1, а также стратегию управления йдк(£, гМ, е), (£, г^) е х МаН, е > 0. Соответственно, в за-
даче (1), (17) рассмотрим стратегию управления
(1,х,р{-))еК, £>0, г = м7.
Справедливы следующие теоремы.
Теорема 9.1 Для любого числа £ > 0 можно указать такое число д > О, что, каковы бы ни были начальная позиция (^,хо,Ро(-)) & К и разбиение А к вида (3), (9) с диаметром ^ 6, будет справедливо неравенство
Теорема 9.2 Для любого числа ( > 0 найдутся такие число £» > 0 и функция 5t(e) > 0, е 6 (0, £■»], что, каковы бы ни были начальная позиция (to, хо,ро(-)) G К, значение napaxiempa точности е € (0, £,] и разбиение Дк вида (3), (9) с диаметром Sk < 5*(е), закон управления {£/дь(-),г, Д^} будет С,-отгтималы «¡ш.
На основе анализа связи между множествами и функциями Уу'(-) при разных значениях i = 1, JV процедуры их построения объединяются в следующую единую процедуру, разрешающую задачу (1), (17).
Рассмотрим функцию hi(t) = min{i = 1 ,N : t < t £ [¿o,^]- Через h\(t — 0) (hi(t + 0)) обозначим предел функции hi(t) в точке t £ слева
(справа), полагая при этом hi(to — 0) = /ti(io) = 1 и /ti(i? + 0) = /н($) = N.
Пусть Ак = Д*{т,} - разбиение вида (3), (9). Для j = и 6 К1""1', hi ■= h\{Tj + 0), обозначим
ГТ1 +1
ДФ j
(11М)= / и + с^гыаг. (21)
иеР ьеС)
По шагам разбиения Ак определим множества Ь^ С и функции
ф±(1[М^-±о)]) е 1[А1(т-л-±о)] 6 ь±> ^ = 1^ + 1, по следующему правилу. При j = к + 1 определяем
При ] = 1, к имеем
Ц = Ь7+1, Ф+(11Мч-н»]) = {ъ^у^ЦЫг,^ ф^М^+О)]) = Дф^М^+О)]) + ФТ^М^+О)]), 1М*>+°)1 е
Далее, если т3- ф Л1 = /11(т^), то есть момент времени т,- не совпадает ни с одним из моментов %){ из показателя качества (17), то определяем
Ь~=Ь+, = Ф/(1М), \MeLJ, (24)
Ьт = Ц^! е Ка1Л11 : + 0},
иначе полагаем
3 ' (1/,ИМ+Ч*)бЛ/1'ч1(11''1)) 3 у ' 1 1 " 3
Здесь
М^а14 = {/*„ • • •, М) = {(", ^+1]* = ■ • ■, &}) € К х Щ :
у > о, 1/) < 1, и = 1/г;, г = /11 + 1,лт|,
где <?*(•) —■ норма, сопряженная к норме ст,(-), г = 1, N — 1, из равенств (16). Оказывается, что имеет место равенство
е^иИ) = тах «^.г14) + ФГ(111])), ^ € К«1"1,
а стратегия £/д*(-) (20) может быть определена исходя из условий:
_ иеР
з = \,к, яеМ", р(-) е V, е>о,
где
1^](,,)(ж,р(-),£) 6 argmaxf(ll'í^!,ш^) + Ф+(11Л«1) - гАе)у/1 + ||1М||2У ИМе£+ 4 '
Л1 = Л!(г,-+0).
Таким образом, в силу теорем 9.1 и 9.2 решение задачи (1), (17) сводится к построению множеств Ь* и функций Ф*(-) в согласии с процедурой (21) (25). Уменьшающаяся с ростом индекса г размерность вспомогательных дифференциальных игр (18), (19) влечет уменьшающуюся с ростом индекса ] размерность множеств Ь^, что повышает эффективность процедуры по сравнению с разрешающими конструкциями из главы II.
В главе IV проводится редукция разрешающей процедуры (21)—(25), обеспечивающая дальнейшее понижение размерности переменных, по которым требуется проводить овыпукление.
Рассмотрим функцию /12(£) = тш{г = 1,^ + 1 : Ь + г ^ t б [¿о,^], где 1^+1 = $ + т. Через — 0) + 0)) обозначим предел функции /гг(£) в точке £ € слева (справа), полагая при этом /¡^(¿о — 0) = /^(¿о) и
Аа(0 + 0) = к2(д).
Пусть Д* = Дк{т~]} — разбиение вида (3), (9). Определим редуцированные информационные образы
х 6 К", р(-) 6 V, <1* = % + п, кч = ± 0), д = 1,2, 3 = 1, к + 1,
которые складываются из прогнозов движений Wi(-) (5) на оценочные моменты времени с индексами г = h\, /12 — 1 и прогноза
/t+T
X{0,Z)Br{Z)p(Z - т - i)x(tf - € Ä".
Положим
= f 1+1 minmax(l+, B,-(i)u + Cjit^dt, 1+ е , j = Ц (26)
где
B,(i) = {Bhi(t),..., Bh2-i(t), B0(t)}, Сj(t) = (Ckl(i),..., a2-i(i), CbW}. Bo(0 = X{fi, t)B(t)x(d -t)+ X{ß, t + r)BT(t + - t - r),
Co(i)=A-(i?,i)C(i)x(t?-i). Л, = Л9(т5±0), g = 172.
(27)
(28)
Для каждого ] = 1, к + 1 определим множества (З^ С и функции <р±(1±) € К, = {V .., /Л2_ь ¿0} € С*, где е к4, г = /ц, /12 — /о € К", Нч = ± 0), с/ = 1, 2, в согласии со следующей рекуррентной процедурой. При ] = к 1 определяем
= {^+1 = {^Л} е : /4М < Мо = 0}, ^+1(^+1) = Омсм), = {/дг, 1о} е С%+1.
При _7 = 1, А; имеем
^•(1+) = д^(1+) + </>7+10/), 1+'е с+.
Далее, полагая = д = 1,2, определяем:
Если 7} и г,- + т ф то
= срт(1т) = 17 еСт. (29)
Если 7} Ф и т,- + г = то
С- = {17 € рЛ : КЩ) ф 0}, ^7(17) = тах <,+(1+*), 1т е С~, (30) где
м,-(17 = ...,42_ь/о}) = {1+* = • ■ ■,Я2,е :
= г = ЛьЛг-1, /о = ^ + Х^ДО^}.
Если Tj = и Tj + r ф то
G- = {IT e : Mj(IJ) ф 0}, V7(17) = ^Г) - (i^Dhlchl), 1- G Gj, (31)
где
Mj(lj = {lhl,..., 1ь-и М) = {(*Л = Ui+i, l^-u ÍS» e R X G¡ :
Vh^hi, v) < 1, V > 0, ¿i = vil, ¿ = hl + 1,Л2 - 1, ío = fío}-
Если Tj = и Tj+T — i?ft2, то множество и функцию (^J(-) определяем по соотношениям (31), где
Mj(lj = {/„,,..., lh2-ul0}) = { {v, 1+* = {/д1+1,..., l*h2, Г0}) € IRxGt:
<(^,1/) < 1, 1/ > 0, U = vil, i = h 1 + 1,/12-Uo = Рассмотрим систему величин
и стратегию управления 1/дк(-), которая в моменты времени г,- € Д;с определяется исходя из соотношений:
Ubk{Tj,x,?(■),£) 6 argmin(sju)(a;,p(-),£),Bj(tj)u),
__ueP
j = i,k, x e К", p(.)e?, e > o,
а в остальные моменты времени доопределяется произвольным образом. Здесь
1]и)(л;,р(.),£) € argmaX((l/, w+(x,p(-))> + ^+(1+) - + Ц1+Ц2),
lj eGj
r+(e) = r,(£)v/(l + D^Mi+o)-^ D== max тахЦДгоЦ.
206R": II20IKI i=l,JV
Следующие теоремы устанавливают применимость редуцированной процедуры (26)-(31) для приближенного решения задачи (1), (17).
Теорема 12.1 Для любого числа £ > 0 можно указать такое число 6 > 0, что, каковы бы ни были начальная позиция Цо,Хо,Ро(-)) € К и разбиение А/с вида (3), (9) с диаметром 5& ^ 6, будет справедливо неравенство
|ef(wf (хо,ро(-))) - r°(to,zo,Po(-))l < 16
Теорема 12.2 Для любого числа (> 0 найдутся такие число е» > 0 и функция 5t(e) > 0, е G (0,е„], что, каковы бы ни были начальная позиция (£о,жо,ро(0) ^ К, значение параметра точности е € (О, г»] и разбиение вида (3), (9) с диаметром ^ <5*(е), закон управления {[/дк(-),е, Д^} будет С,-оптималъиъш.
Редуцированная размерность dt множеств определения G+ овыпукляе-мых функций во многих случаях оказывается существенно меньше соответствующих размерностей из процедур глав II и III. Часто она оказывается не зависящей от числа N оценочных моментов времени Например, когда = t0 + гт, г = 1, N, размерность dj" не превосходит 2п. В конце глав II, III и IV рассматриваются модельные примеры и приводятся результаты численного моделирования, иллюстрирующие работоспособность каждой из предложенных разрешающих процедур.
В заключение вынесены краткие формулировки полученных в диссертации основных результатов.
Работа выполнена при поддержке Программ Президиума РАН «Математическая теория управления» (09-П-1-1015) и «Динамические системы и теория управления» (12-П-1-1002), грантов РФФИ (09-01-00313-а, 12-01-00290-а, 12-01-31300-мол_а), а также гранта Президента РФ в рамках программы государственной поддержки ведущих научных школ (НШ-5927.2012.1).
ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, рекомендованных ВАК:
1. Гомоюиов М.И. К задаче оптимизации гарантии в системе с запаздыванием по управлению // Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2011. № 3. С. 21-36.
2. Гомоюиов М.И. Об оптимизации гарантии при запаздывании по управлению // Вестник Тамбовского университета. Сер. Естественные и технические науки, 2011. Т. 16, вып. 4. С. 1059-1060.
3. Гомоюиов М.И., Лукоянов Н.Ю. Оптимизация гарантии в функционально-дифференциальных системах с последействием по управлению // Прикл. математика и механика, 2012. Т. 76, вып. 4. С. 515-525.
4. Гомоюиов М.И. Об оптимизации гарантированного результата при запаздывании в управлении // Прикл. математика и механика, 2013. Т. 77, вып. 5. С. 643-656.
5. Гомоюиов М.И., Корпев Д.В. К вопросу вычисления цены дифференциальной игры в классе контрстратегий // Тр. Института математики и механики УрО РАН, 2013. Т. 19, № 1. С. 59-68.
6. Гомоюиов М.И., Лукоянов Н.Ю. Об устойчивости одной процедуры управления с оптимальной гарантией результата // Вестник Тамбовского университета. Сер. Естественные и технические науки, 2013. Т. 18, вып. 5-2. С. 2485-2487.
7. Гомоюнов М.И., Корпев Д.В., Лукоянов Н.Ю. О численном решении задачи управления па мшшмакс позиционного функционала // Тр. Института математики и механики УрО РАН, 2014. Т. 20, № 3. С. 58-75.
8. Гомоюнов М.И., Лукоянов Н.Ю. Об устойчивости одной процедуры решения задачи управления на мшшмакс позиционного функционала // Тр. Института математики и механики УрО РАН, 2014. Т. 20, № 1. С. 68-82.
9. Gomoyunov М. Guarantee optimization in functional differential systems with control delays // IFAC PapersOnLine, Proceedings of the 10-th IFAC Workshop on Time Delay Systems. Boston, USA, 2012. P. 209-214.
10. Gomoyunov M., Lukoyanov N. Dynamical optimization of systems with control delays // IFAC PapersOnLine, Proceedings of the 15-th IFAC Workshop on Control Applications of Optimization. Rimini, Italy, 2012. P. 100-105.
11. Gomoyunov M. Solution procedure for a problem of dynamical optimization with control delays // IFAC PapersOnLine, Proceedings of the 19-th IFAC World Congress. Cape Town, South Africa, 2014. P. 633-638.
12. Gomoyunov M., Kornev D. and Lukoyanov N. Game theory applications to guarantee optimization in dynamical systems with control delays // International Game Theory Review, 2014. Vol. 16, Л'« 2. P. 1440010-1-1440010-19.
Другие публикации:
13. Гомоюнов М.И. Об одной задаче оптимизации гарантии в системе с запаздыванием по управлению // Соврем, проблемы математики: Тез. 42 Всеросс. молодежной школы-конф. Екатеринбург, 2011. С. 23-25.
14. Гомоюнов М.И., Лукоянов Н.Ю. Об одной задаче динамической оптимизации гарантии при последействии в управлении // Алгоритмический анализ неустойчивых задач: тез. докл. Международ, конф., посвящен, памяти В.К.Иванова. Екатеринбург, 2011. С. 215.
15. Гомоюнов М.И. Об одной задаче управления системой с последействием // Соврем, проблемы математики: Тез. Междунар. (43 Всеросс.) молодежной школы-конф. Екатеринбург, 2012. С. 124-126.
16. Гомоюнов М.И., Лукоянов Н.Ю. Вычисление оптималыюго гарантированного результата в системах с запаздыванием в управлении // Известия Института математики и информатики УдГУ, 2012. Вып. 1. С. 38-39.
17. Гомоюнов М.И. Два подхода к решению одной задачи управления в системах с запаздыванием // Соврем, проблемы математики: Тез. Междунар. (44 Всеросс.) молодежной школы-конф. Екатеринбург, 2013. С. 92-95.
18. Гомоюнов М.И., Корпев Д.В., Лукоянов Н.Ю. К задаче позиционной оптимизации гарантии при запаздывании в управлении // Труды XII Всероссийского совещания по проблемам управления (ВСПУ-20Ц). Москва, 2014. С. 1268-1279.
19. Гомоюнов М.И., Лукоянов Н.Ю. Численное решение задач управления на минимакс-максимин позиционного функционала // Тез. докл. Международ, конф. «Динамик а систем и процессы управленияпосвящен. 90-летию со дня рождения ак. Н.Н.Красовского. Екатеринбург, 2014. С. 54.