Неравенства Гамильтона-Якоби в задачах оптимального управления дискретно-непрерывными системами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Сорокин, Степан Павлович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Иркутск
МЕСТО ЗАЩИТЫ
|
||||
2012
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
На правах рукописи
12
СОРОКИН СТЕПАН ПАВЛОВИЧ
НЕРАВЕНСТВА ГАМИЛЬТОНА-ЯКОБИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНЫМИ СИСТЕМАМИ
01.01.02 — Дифференциальные уравнения, динамические системы и оптимальное управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
3 МАЯ 2012
Иркутск - 2012
005016054
005016054
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте динамики систем и теории управления Сибирского отделения Российской академии наук (ИДСТУ СО РАН).
доктор физико-математических наук, профессор Дыхта
Владимир Александрович
доктор физико-математических наук, профессор , Арутюнов
Арам Владимирович, РУДН, зав. кафедрой;
кандидат физико-математических наук Бутин
Александр Алексеевич, ИрГУПС, доцент
Институт математики и механики УрО РАН (г. Екатеринбург)
Защита состоится 17 мая 2012 г. в 15:00 ч. на заседании диссертационного совета Д 003.021.01 в ИДСТУ СО РАН по адресу: 664033, Иркутск, ул. Лермонтова, 134.
С диссертацией можно ознакомиться в библиотеке и на официальном сайте www.idstu.irk.ru ИДСТУ СО РАН. :
Автореферат разослан 16 апреля 2012 г.
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
Ученый секретарь диссертационного совета д.ф.-м.н.
А.А. Щеглова
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Диссертация посвящена исследованию задач оптимального управления дискретно-непрерывными системами (ДНС). Эти системы, часто называемые «гибридными», состоят из конечного числа управляемых подсистем, связанных между собой правилами априорно не фиксированного последовательного включения по интервалам времени (возможно перекрывающимся) и общими ограничениями на траектории и управления. Таким образом, ДНС характеризуются переменным фазовым пространством и переплетением дискретной и непрерывной динамики. Указанные особенности стимулируют развитие методов вариационного анализа задач оптимального управления в дискретно-непрерывных системах. Дополнительный интерес к этим задачам вызывают прикладные модели оптимизации ДНС, которые, встречаются в различных областях механики, робототехники, оптики, экономики, экологии и т.д.
Для вариационного анализа задач оптимального управления ДНС в определенном смысле канонической оказалась задача динамической оптимизации с промежуточными (многоточечными) фазовыми ограничениями. На это обстоятельство и связь с задачами оптимального управления разрывными системами обратил внимание В.В. Величенко. Наиболее полные необходимые условия оптимальности в форме принципа максимума для гладких задач оптимального управления ДНС получены в работах Л.Т. Ащепкова (на пакете игольчатых вариаций.), A.B. Дмитрука и A.M. Кагановича (редукцией к классической задаче оптимального управления с не разделенными концевыми ограничениями методом «размножения» переменных Ю.М. Волина и Г.М. Островского), A.B. Арутюнова и А.И. Околевича (задачи со смешанными ограничениями) и др. «Гибридный» принцип максимума для различных классов негладких задач оптимального управления ДНС получен в серии работ Ф. Кларка и Р. Винтера, Г. Зуссмана, М. Гаравелло и В. Пиколли; на общей области применимости все эти принципы максимума совпадают. Достаточные условия оптимальности развиты в циклах работ, выполненных под руководством В.И. Гурмана (обобщение условий В.Ф. Кротова), A.B. Куржанского (метод динамического программирования с необходимыми условиями оптимальности синтеза в линейно-выпуклых задачах дискретно-импульсного управления), Ж.-П. Обена (квазивариационные неравенства Гамильтона-Якоби, функции тина Ляпунова), а также в работах Л.Т. Ащепкова, С. Хедлунда и А. Рантзера (условия типа Кротова), Р. Винтера и Г. Гелбрайта (квази-
вариационное неравенство Беллмана с алгоритмом оптимизации) и других авторов.
Однако анализ и примеры показывают', что условия оптимальности в ДНС, связанные с решениями неравенств и уравнений Гамильтона-Якоби, имеют ограниченную область применимости. Традиционных, даже обобщенных, решений, зависящих только от текущей позиции системы, оказывается ис достаточно при наличии многоточечных фазовых ограничений и функционалов типа Майера от мультинабора концевых значений траекторий подсистем. В этом случае необходимо введение параметрической зависимости от этого мультинабора. Подобная ситуация имеет место уже в классических задачах оптимального управления с ие разделенными концевыми ограничениями.
Указанный недостаток известных методов и условий оптимальности обуславливает актуальность данного исследования. В работе развивается каноническая теория оптимальности Гамильтона-Якоби1'2, адаптированная к специфике дискретно-непрерывных задач оптимального управления. Особое внимание уделено усилению принципа максимума Понтряпша до достаточного условия оптимальности в невыпуклых задачах оптимизации ДНС.
Цель работы состоит в получении необходимых и достаточных условий оптимальности дискретно-непрерывных процессов путем обобщения канонической теории оптпмалыюсти Гамильтона-Якоби на новые классы задач.
Объектом исследования являются задачи оптимального управления дискретно-непрерывными системами с включением в анализ базовых составляющих: классических и дискретных задач оптимального управления с общими концевыми ограничениями на траекторию.
Методы исследования базируются на свойствах сильной и слабой монотонности обобщенных решений неравенств Гамильтона-Якоби, оценках множеств соединимых точек управляемых систем, канонической теории оптимальности в оригинальных вариантах, принципе максимума Поитрягипа и теории экстремальных задач.
Научная новизна. Для качественного исследования оптимизационных и позиционных задач теории управления ДНС введен новый класс
'Milyutin A.A., Osmolovskii N.P. Calculus of Variations and Optimal Control. Providence, Rhode Island-Amer. Math. Soc., 1998. 372 pp.
2Дыхта В.А. Неравенство Ляиунова-Кротова и достаточные условия в оптимальном управлении / / Итоги науки и техники. Совр. .математика и ее приложения. 2006. Т. 110. С. 76 108.
бипозиционных решений неравенств (н уравнений) Гамильтона-Якоби, параметрически зависящих от начальной или финальной позиции управляемой системы. Доказано, что этот класс ¿-функций (типа Ляпунова) необходим для обоснования канонической теории оптимальности уже в классических задачах оптимального управления с не разделенными концевыми ограничениями. Полученные условия локальной и глобальной оптимальности дискретно-непрерывных процессов с множествами бипозиционных ¿-функций существенно усиливают известные аналоги. В частности, из них выводятся наиболее общие достаточные условия оптимальности в форме принципа максимума Понтрягина для дискретно-непрерывных задач оптимизации без априорных предположений выпуклости, нормальности исследуемой экстремали, единственности соответствующих ей наборов множителей Лагранжа. Представляют интерес необходимые и достаточные условия оптимальности, усиливающие принцип максимума для дискретных задач оптимального управления в линейных системах с управляемыми коэффициентами. Переход к бипозициоппым решениям неравенств Гамильтона-Якоби позволил получить способ построения субоптимальных бипозиционных управлений по нижней огибающей разрешающего множества ¿-функций, что невозможно в традиционном классе решений.
Достоверность и обоснованность полученных в диссертационной работе результатов обусловлены строгостью доказательств, применением апробированных методов исследования, сравнением с известными результатами, а также обсуждениями на научных конференциях и семинарах.
Теоретическая и практическая значимость работы. Развитые в работе методы могут применяться для качественного анализа и решения различных классов задач оптимального управления и для оценки достижимых состояний управляемых систем при общих концевых ограничениях. Исследованные многомерные модели оптимизации перехода экономики к новой технологии и распределения ресурсов иллюстрируют эффективность предлагаемых методов и условий оптимальности. Конструкция позиционного управления, экстремального к разрешающему множеству бипозиционных решений неравенств Гамильтоиа-Якоби, близка к традиционной и вполне реализуема в численных методах решения задач управления. Это относится и к необходимым условиям оптимальности с позиционными контруправлениями для задач оптимизации дискретных систем, линейных по состоянию.
Исследования по теме диссертации проводились в рамках проекта по
программе СО РАН «Нелокальные методы в теории управления динамическими системами» (№ гос. регистрации 01201001345), интеграционного проекта СО-УрО РАН № 85 «Качественный и численный анализ эволюционных уравнений и управляемых систем» и грантов РФФИ (проекты 07-01-00741-а, 11-01-00672-а, 09-01-16002-моб_з_рос, 10-01-09370-моб_з).
Соответствие диссертации паспорту научной специальности. В соответствии с паспортом специальности 01.01.02 в диссертации проведено теоретическое исследование свойств достижимости и управляемости систем нелинейных обыкновенных дифференциальных уравнений и днекретио-непрерывных систем; предложен и апробирован новый класс негладких бипозициониых решений квазивариационных неравенств (и уравнений) Гамильтоиа-Якоби для качественного исследования задач оптимального .управления непрерывными, дискретно-непрерывными и дискретными системами (пп. 3, 11, 12 области исследований).
Апробация работы. Результаты диссертационной работы представлялись на 22 международных, всероссийских и региональных конференциях, в частности, на Международной конференции «Актуальные проблемы теории устойчивости и управления» (Екатеринбург, 2009), Международных конференциях «Колмогоровские чтения. Общие проблемы управления и их приложения» (Тамбов, 2009, 2011), XI Международной конференции «Устойчивость и колебания нелинейных систем управления (конференция Е.С. Пятницкого)» (Москва, 2010), V Международном симпозиуме «Обобщенные постановки и решения задач управления» (Улан-Батор, Монголия, 2010), Международной конференции «Дифференциальные уравнения и смежные вопросы», посвященной памяти И.Г. Петровского (Москва, 2011), VIII Международном конгрессе ISAAC 2011 (Москва, 2011), V Международной научной конференции PhysCon 2011 (Леон, Испания, 2011), XV Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (Иркутск, 2011), I и II Школах-семинарах «Нелинейный анализ и экстремальные задачи» (Иркутск. 2008, 2010), 42-ой Всероссийской молодежной конференции «Современные проблемы математики» (Екатеринбург, 2011).
Результаты работы неоднократно обсуждались на семинарах в Институте-динамики систем и теории управления СО РАН.
Публикации и личный вклад автора. По теме диссертации опубликовано 11 работ, в том числе статьи [1- 6] в журналах, рекомендованных ВАК РФ для опубликования основных научных результатов диссертаций.
б
На защиту выносятся результаты, полученные автором самостоятельно. В работах [1, 2, 11] В.А. Дыхтой доказана негладкая версия канонических достаточных условий оптимальности и предложены модификации условий В.Ф. Кротова и К. Карагеодори с множествами ¿-функций, получен о обращение принципа максимума в достаточное условие оптимальности для невыпуклых задач импульсного управления. Автором диссертации в этих работах получены оценки интегральных воронок управляемых динамических систем, доказаны канонические условия оптимальности с бипозици-оипыми ¿-функциями и проведен их анализ. Часть статьи [5], написанная Г.Н. Яковенко, посвящена методам анализа управляемых систем на наличие у них общих групповых свойств. В статьях [5, 6] В.А. Дыхтой' введены производящие ¿-функции, определенные на траекториях канонической системы из принципа максимума, и указаны их приложения к задачам управления в непрерывных системах. Соискателем эти результаты распространены на задачи дискретного оптимального управления и апробированы на примерах.
Структура и объем диссертации. Работа состоит из введения, трех глав, заключения и списка литературы, содержащего 156 наименований. Общий объем диссертации составляет 154 страницы. Результаты главы 1 опубликованы в работах [1, 2, 5, 8, 11], главы 2 - в работах [2, 3, 7, 9], главы 3 — в работах ¡4, 6, 10].
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении приводится обзор и характеристика известных необходимых и достаточных условий оптимальности для дискретно-непрерывных задач оптимального управления, обосновывается актуальность диссертационного исследования.
Для управляемой системы
с процессами
а = (х(1), и{г) | < б Д = [¿о, € АС(А, К1) х ¿„(Д, и), непрерывной функцией ¡{г,х,и) и компактным множеством и С Я™ анонсируются необходимые понятия монотонности функций типа Ляпунова и соответствующие критерии в форме неравенств Гамильтона-Якоби для классических и негладких решений; указываются апробированные методы их решения и реализация разрывных позиционных управлений по Красовскому- Субботину.
Часть дальнейших результатов (внутренние оценки интегральных воронок и необходимые условия оптимальности) требует более жестких стандартных предположений:
1) функция /(£, х, и) непрерывна по совокупности переменных и локально липшицева по х равномерно но (t, и) € R х {/;
2) существует действительное число с > 0, такое что |/(i,x,n)| < с(1 -+-|ж|) на Rn+1 х U;
3) множество f(t, х, U) выпукло V(i, х) £ Rn+1;
4) множество U компактно.
Пусть G = (а, Ь) х R", а <Ь. Непрерывную функцию (р : G —► R называют сильно возрастающей на G, если она не убывает вдоль всех траекторий системы (5), проходящих по G. Если <р не убывает вдоль хотя бы одной траектории системы (S). начинающейся в произвольной начальной точке из G и проходящей по G, то (р называется слабо возрастающей па G. Типы монотонности имеют аналоги для убывающих функций, а также могут рассматриваться в обратном времени (относительно системы (—S))L<. Множества всех сильно возрастающих и слабо возрастающих в обратном времени функций обозначаются через L^ (G) и (G) соответственно.
Положим #(£, х, ф, и) - Ф ■ f(t,x,u), h(t,x, i>) = min{H(t,x,4>,u) [ и £ U], h(t, x,p) = pt + h(t, x,Px), где p = (pt,px) 6 Rx Rn. Для гладкой функции <p(t,x) через Vtp(i, x) обозначается ее градиент в точке (t.,x), а через dpip(t,x) и dPip{t,x) ■■■ проксимальные суб- и супердифференциалы'1' 1 функции (р в точке (t.x).
Для локально липшицевой или непрерывной функции включение <р е Lsj(G) эквивалентно следующим неравенствам Гамильтона-Якоби соответственно:
Щ х, Vip(t, х)) > О V (t, х) в G, h(t, X, р) > 0 Ур = (рирх) е dPip(t, х), V (i, х) eG. (1)
Для гладкой или непрерывной функции включение <р 6 L~^(G) эквивалентно следующим неравенствам Гамильтона-Якоби соответственно: h(t,x,\><p(t,x)) <0 V(t,x)eG,
h(t,x,p)< 0 \/p = {pupx)edPv{t,x), V(i,i)6G. (2)
Неравенства (1), (2) рассматриваются в точках с непустыми множествами dptp(t,x) и dpip(t,x).
Clarke F.H., Ledyaiv Yu.S., Stern R.J.. Wolenski P.R. Noiismooth Analysis and Control Theory. New York: Springer-Verlag, 1998. Vol. 178 of Grad. Texts in Math. 276 pp.
4 Vinter R.B. Optimal Control. Boston: Birkhäuser, 2000. 520 pp.
S
Приведены и другие инфинитезимальные критерии монотонности, используемые далее.
Первая глава посвящена условиям оптимальности в следующей классической задаче (Р) с не разделенными концевыми ограничением и целевым функционалом: минимизировать функционал
J[a] = l(q)
на множестве процессов системы (5), удовлетворяющих ограничению
q&Q-
Здесь функция I непрерывна, множество Q замкнуто, q = q(a) = (f0, x(t0); tu x(ti)) — концевой вектор процесса а = (x(t),u(t) |Д = [í0, ti]). Пусть £/ и E - непустые множества всех процессов системы (5) и допустимых процессов в задаче (Р) соответственно. Определение 1. Множество
К = {9 = (¿o,*o;íi,zi) € ñ2(n+1) | Э от 6 Е/ : x(t0) = х0, х(Ь) = ц} называется .множеством соединимых точек системы (S).
В §1.2 приводится базовый, негладкий вариант канонических достаточных условий оптимальности Гамильтона-Якоби1'2 (А'-достаточных условий) для задачи (Р)7 основанный на внешних оценках множества К. Эти оценки строятся с помощью произвольных семейств непрерывных L-функций Ф = {tfP{t,x) | с* е Л} С LsV Проведено сравнение А'-условий с негладкими модификациями достаточных условий К. Каратеодори и В.Ф. Кротова, также оперирующих множествами сильно возрастающих L-функций. Установлено, что /í-условия выполняются каждый раз, когда выполнены альтернативные достаточные условия, причем с теми же множествами разрешающих функций. Приведены примеры, показывающие, что запас разрешающих функций в смысле канонического подхода шире, чем для условий Каратеодори и Кротова. Кроме того, эти примеры указывают па необходимость введения нового класса бипозиционных ¿-функций, зависящих не только от текущей позиции (t,x) системы (S), но и от начальной (í0, х0) или конечной (h,xi).
Определение 2. Непрерывную функцию V(t, х; t0, х0) : Я2п+2 -» R назовем
' а) сильно возрастающей, если V(í0,x0) € ñrt+1 V{-, •; f0, x0) e LB. и V(t0,X0-,t0,x0) = 0;
б) слабо возрастающей в обратном времени, если V(í0 щ) £ Rn+1 , •; t0, .т0) £ Lwт и V(t0, х; t0, х0) < 0 \/х ф х0.
Для множеств бипозиционных функций вводятся обозначения типа У^, и
В §1.3 получены оценки множества соединимых точек К системы (5) с использованием неравенств с Оппозиционными функциями. Для некоторого множества бипознционных функций V вводятся множества
Е{У) = {(¿о,*0;¿ь^) € Д2(п+1) | К(4ы1;<в,ю) > 0},
Е+(У) = р| Е(У) и £_(У) = и Е(У).
УеУ УеУ
Теорема 1. а) Если У С У,т, то 11 с Е+(У).
б) Если V С У~г., то П 3 ¿-(V).
в) Если V е УяТ П то П = Е{У).
Из этой теоремы вытекают необходимые и достаточные условия оптимальности в задаче (Р). которые формулируются через конечномерные концевые задачи минимизации.
Теорема 2. Пусть для процесса а £ £ существует такое множество У С У,|, что вектор <? = (¡(а) глобально оптимален в задаче
/(9)-1ШЩ <7 6 (А,.(У))
Тогда процесс а глобально оптлшален в задаче (Р).
Теорема 2 допускает естественную локализацию на случай исследования сильного минимума на процессе а. Это достигается сужением задачи (Р) на некоторое открытое множество С С Я"+!, содержащее график траектории х(-). В этом случае монотонность функций из V требуется на С, а в концевую задачу (Л+(У)) следует добавить ограничения (¿о-^о) € (7, (£1,3:1) е (7.
Теорема 3. Пусть процесс а глобально оптимален .в задаче (Р). Тогда для любого множества V С выполнено неравенство
где справа стоит значение задачи
т-М) д€Я-(У)пд.. (А_(У))
Из теорем 2, 3 (или утверждения в) теоремы 1) вытекают смыкающиеся необходимые и достаточные условия оптимальности с одним решением уравнения Гамильтона-Якоби из У^ П У~р Однако его нахождение сопряжено с трудностями, неестественными для рассматриваемой задачи в
53десь и далее используются сокращенные обозначения типа тт(Р) — гашДЕ).
классе программных управлений, поэтому внимание на этой ситуации не акцентируется.
В §1.4 анализируются свойства разрешающего множества V, обеспечивающего выполнение достаточных условий теоремы 2. Показано, что в случае, когда задача (Р) локально не вырождена в точке а (т.е. дифференциальная связь существенна), а множество функций V полунепрерывно снизу в точке q, V содержит элементы, постоянные вдоль траектории х. Отсюда (с использованием результатов H.H. Субботиной), в частности, следует, что супердифференциал таких функций V С V вдоль х содержит коэкстремаль — решение сопряженной системы, удовлетворяющее вместе с ä условиям экстремальности из принципа максимума Понтряги-на. В конструктивном плане важно, что нижняя огибающая множества V - функция
V„(t, х\ t0, х0) = inf V(t, х; tQ,x0)
— тоже оказывается разрешающей. Возможность перехода от разрешающего множества к одной функции не имеет места в традиционном классе L-функций. Между тем этот переход дает ключ к проверке свойства раз-решаемости выбранного множества L-функций V, если достаточные условия теоремы 2 рассматривать как метод приближенного решения задачи без априори заданного исследуемого процесса. Для этого можно использовать естественную модификацию правила'экстремального прицеливания H.H. Красовского из динамического программирования0'7 с перебором бп-позиционных управлений w(t,x/,tq,xq), экстремальных к огибающей V*. На выходе эта процедура должна давать допустимый процесс о\,, концевой вектор которого сколь угодно мало отклоняется от вектора q — решения концевой задачи (Л+(У)) (в идеале совпадает с q). В этом случае полученный процесс будет приближенно удовлетворять концевым ограничениям задачи при малой разности | J[o\>] - l(q)\.
В §1.5 достаточные условия оптимальности с бипозициоиными функциями применены для исследования иеклассической линейно-квадратичной задачи с общей зависимостью терминальной части целевого функционала от x0,xi и присутствием линейных слагаемых в интегранте. Эти
6С'убб отнн А.И. Обобщенные решения уравнений в частных производных первого порядка.. Перспективы динамической оптимизации. Москва-Ижевск: Институт компьютерных исследований, 2003. 336 с.
7Кларк Ф., Леднев Ю.С.. Субботин А.И. Универсальное позиционное управление и проксимальное прицеливание в задачах управления в условиях возмущения и дифференциальных играх // Труды Математического ин-та им. В.А. Стеклова. 1999. Т. 224. С. 165-180.
особенности делают не применимым метод динамического программирования в традиционном варианте и порождают новые свойства оптимальных решений. Получены необходимые и достаточные условия глобальной оптимальности в терминах существования решения матричного дифференциального уравнения Риккати и решений ряда линейных систем. Эти решения определяют разрешающую бипозиционную функцию, линейно-квадратичную по паре (я,хо). Бппозиционное экстремальное управление получено в явном виде.
В §1.6 кратко описывается альтернативное расширение традиционных функций типа. Ляпунова до производящих функций S(t, х, 4'), определенных на решениях канонической системы из принципа максимума Понт-рягшга. Это расширение может быть использовано как для развития канонического подхода, так и построения обобщенного лагранжиана задачи с последующим переходом к соответствующей задаче сравнения (аналога двойственной). Оперирование производящими функциями иллюстрировано на примере, а в главах 2, 3 применения таких функций детально изложены для дискретно-непрерывных и дискретных задач оптимизации.
Во второй главе канонические условия оптимальности с бипозицион-ными ¿-функциями обобщаются на задачи управления дискретно-непрерывными (гибридными) системами, а гибридный принцип максимума усиливается до достаточного условия оптимальности. Основной здесь является следующая задача оптимального управления (Ph) с общими ограничением на концы траектории подсистем и целевым функционалом: i"(t) = fK(t,xK(t),uK(t)), uK(t) G Uк,
te Ак = [о*,Ь*], K=1,...,N, ^
qzQ, (4)
J = l(q) min.
Здесь моменты времени ак < Ък не фиксированы, размерности хк, ик равны пк, тк соответственно, функции /*, I непрерывны, множества Un произвольны, Q замкнуто, q = {q*1,..., 9'v} — концевой мультивектор, составленный из концевых векторов подсистем qK = (ак, хк, Ьк х?) а£ = а;к{ак), хЦ = хк{Ьк).
Набор процессов подсистем
а = {er* = (xK(t), uK(t) | t e А'г), к = 1,.IV}
назван мультипроцессом, а набор функций х(-) = (ж1(-),..., жлг(-)} — мулътитраекторией. Мультипроцесс а допустим в задаче (Ph), если для
него выполнено общее концевое ограничение (4). Фиксированный допустимый мультипроцесс. а исследуется как на глобальный, так и на сильный минимум.
Определение 3. Мультипроцесс а доставмет сильный минимум в задаче (Р/,), если для каждого к найдется такое открытюс множество G'- С Rx Rn'\ содержащее график траектории хк(-), что мультипроцесс а глобально оптимален в задаче (Ph}, дополненной ограничениями
(*, хЩ eGK V t G А", к = 1...., N. (5)
Условия (5) задают сужение (Ph(G)) задачи (Ph) на множество G := G1 х • ■ ••■х Gn. Мультитраекторня х(-) допустимого м.ультипроцесса о называется допустимой по множеству G, если выполнено условие (5).
Общее концевое ограничение (4), связывающее подсистемы из (3). формально выглядит статическим, но является очень емким и может отражать дискретную динамику гибридной системы. Например, в него вкладываются ограничения вида
хк+V+1) е F(aK,xK(aK), xK(bKj), к = 1,.... N, представляющие собой дискретную систему, а также различные правила переключения подсистем. Поэтому ограничение (4) названо дискретно-концевым.
Через 7ZK{GK) обозначается множество пар точек {ак, хЦ), (Ьк, х^) из GK, соединимых траекториями к-ой подсистемы из (3), допустимыми по G\ Положим 7Z{G) = ]\nK{GK) и назовем ЩС) множеством соединимых точек гибридной системы на G.
Определение 4. Набор функций V = {У1,..., VN} называется составной бипозиционной сильно возрастающей L-функцией системы (3) на множестве G, если для каждого к = N Vn € V^(GK). Множе-
ство всех таких наборов обозначается через
Аналогичным образом определено множество V.¡^(G) всех бипозици-онных функций гибридной системы (3), слабо возрастающих в обратном времени на множестве G.
В §2.2 с помощью составных бипозиционных функций получены внешние и внутренние оценки множества соединимых точек гибридной системы и соответствующие условия оптимальности.
Для V+ С V^(G) и V- С вводятся множества
— {q = {ql,-■ • ,9'v} eGxG|vvrev+ у*(<7")>о v«}, £-(V-) = {q= {ql,...,qN} eGxG|3VeV_: VK{qK) > 0 Vk}.
Тогда справедливы оценочные включения
£_(V_) С 7Z{G) С £+(V+), из которых вытекают условия оптимальности в задаче (Д). Теорема 4. Пусть для мулътипроцесса а существует такое множество V С что мультивектор q глобально оптимален в задаче /(<?)-> inf; q&£+{V)OQ. (B+(V))
Тогда и — глобально оптимальный мультипроцесс в задаче (Ph(G)). <?о-ставляющий сильный минимум в задаче (Рд).
Теорема 5. Пусть мультипроцесс а глобально оптимален в задаче (Ph(G)). Тогда для любого множества V С
J[a] < mf(5_(V)),
яс?е справа стоит значение задачи
l(q) inf; ? G £_(V) П Q. (B-(V))
Приведенные условия оптимальности для гибридных задач обладают аналогами свойств /^-условий для стандартной задачи (Р), установленных в первой главе.
В §2.3 получено обращение принципа максимума Понтрягина в достаточное условие оптимальности, наиболее общее из известных для задач типа (Ph).
Предполагается, что функции fK, I имеют непрерывные частные производные по qK, хк, t. Вводятся функции HK(t, хк, 4% ик) = ф£ ■ f*{t, хк, ик) и nK(t, хк, ф*) = max{HK(t, фкх, ик) \ик eUK}.
Процесс ак называется экстремалью к-ой системы на отрезке Дк, если для него существует нетривиальная коэкстремаль фк{Ь) — t € Дл, т.е. решение сопряженной системы
гх = -H'i{t,xK(t),uK(t)), ф? = -H?(t,xK(i),й'Щ, (6) обеспечивающее выполнение условий максимума
HK(t,x«(t),^x{t),u"{t)) + ф?(Ь) = 0 п.в. на Д*,
Тройка 7К = (фк,ак) называется в этом случае биэкстремалью к-ой системы, набор 7 = {71,... ,7^} — биэкстремалью гибридной системы, а набор ф — {ф1,...,^} — коэкстремалью мулътипроцесса о.
Пусть G — G' x ■ ■ ■ x Gn -- некоторое множество, где все GK С Rx Rn" связны (но не обязательно открыты). Множество G названо достаточным (для а), если из условия, что а ■ глобально оптимальный мультипроцесс в суженной задаче (Р/, (<?)), следует, что а доставляет, по крайней мере, сильный минимум в задаче (Ph). Биэкстремаль 7 = {71,...,УУ} называется допускающей продолжение, если найдется такое достаточное множество G, что каждую биэкстремаль подсистемы ук можно продолжить на промежуток времени IK = prtGK так, чтобы выполнялись условия (6) (7) с заменой в них Ah на 1К. Тогда соответствующая коэкстремаль ф мультинроцесса & также называется продолженной.
Пусть Ф(<т, G) Ф 0 множество продолженных коэкстремалей, соответствующих продолженной экстремали гибридной системы ст, (G*)' — сечение множества GK при фиксированном L Для ¿г, ф е Ф(ст) и достаточного множества G определяются следующие расширенные условия максимума.
Условие МН(ф, G). У к = 1,..., N п. в. на 1К
= max {HK(t,xK,rx(t),uK) + £(/) • | xK e (G'J, uK G U': j .
Условие МН(ф, G). V к = 1,..., N п. в. па I"
= max {nK(t,xK, tl£{t)) + • xK \ xK £ (G*)'} .
Пусть Ф+(ст, G) — множество всех коэкстремалей, обеспечивающих выполнение любого из условий МН(ф, G) или МЩф,С). Если это множество непусто, то любая ф б Ф+(ст, G) порождает составную функцию
У=У\ф] = {К1^,®1;«1,^...,^,^;^,^)}^] G V,"T(G)5 компоненты которой определены равенством
V«(t, x«; a«, xl) = ГАЬ) ■ (x«(t) - х") - ф«(а") ■ (*>«) - <), к = 1,..., N. Теорема 6. Пусть для мулътипроцесса а существует такое множество коэкстремалей Ф С $+(ff,G), что мультивектор q глобально оптимален в задаче
l{q) min; q £ Q,
V«[1>}{<f)> 0 \/ф£ Ф, (5о(ф))
<f£GKxG«, к=1 Тогда a — глобально оптимальный мультипроцесс в задаче (Ph(G)), доставляющий сильный минимум, в задаче (Ph).
В §2.4 с помощью достаточных условий в форме принципа максимума исследована построенная автором макромодель двухэтапной оптимизации структуры основных фондов экономики в условиях смены технологии после переходного периода достижения заданного уровня развития. Показано, что любая экстремаль Понтряпша в этой модели является ее глобальным решением.
Параграф 2.5 посвящен анализу связи канонических достаточных „условий оптимальности с гибридным принципом максимума Понтряпша". Показано. что градиенты разрешающих функций V е V, порождающих активные в точке q ограничения дискретно-концевой задачи (B+(V)), являются коэкстремалями.
В заключительном параграфе приведены возможные теоретические приложения полученных условий оптимальности к классическим задачам оптимального управления: а) с разрывными по времени правыми частями управляемых систем (сложными для вариационного анализа8); б) к исследованию экстремалей с разрывным управлением (иллюстрируется на модели гармонического осциллятора с ограничением на управление). Доказаны необходимые условия оптимальности для двухэтапной линейной по состоянию невыпуклой задачи оптимизации. Эти условия основаны на конструкции модифицированного лагранжиана с билинейными производящими функциями.
В третьей главе метод неравенств Гамильтоиа-Якоби и канонические условия оптимальности распространяются на задачи управления дискретными и некоторыми дискретно-импульсными системами. Помимо того, что результаты главы имеют самостоятельный интерес, они служат естественным дополнением к предыдущей главе, поскольку вспомогательные дискретно-концевые экстремальные задачи (В+(У)), (В_(У)); (В0(Ф)) в условиях оптимальности гибридных систем могут относиться к исследуемым здесь классам задач.
Рассматривается дискретная управляемая динамическая система
®(к + !) = /(«. х(к),и(к)), и(к) е UK, к = О, N — 1, (8) где N — заданное натуральное число, функция / конечна на ZN_X х Лп х •Rm, ZK := {0,1,..., к}, множества UK С Iim непусты.
Траектории и управления системы (8) — это любые конечные после-дователыюсти х = {s(«)}£U и v = {и(к)}^~0\ удовлетворяющие системе
8Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М.: Изд-во «Факториал», 1997. 256 с.
(8). Пары <j = (x,v) образуют процессы системы (8). Через (s G ZN) обозначаются подпоследовательности х отрезки траекторий, а через — множество отрезков с начальным условием x(s) = f.
Для системы (8) естественным образом вводятся сильно и слабо монотонные ¿-функции (р{к,х), критериями для которых являются дискретные аналоги неравенств Гамильтона-Якоби. Например, функция <р{к, х) : Zx х Rn —» R сильно возрастает, относительно системы (8), если
(V(s,£) G х Л") (VX|, € T,(0)j_
<р(к+ 1,х(к+ 1)) > <р(к,х(к)), к — s, N — 1. Множество всех сильно возрастающих функций обозначается через LfT.
В §3.2 с применением функций из Lf, получены внешние оценки множества соединимых точек системы (8) и достаточные условиям оптимальности в задаче (Pd) оптимального управления системой (8) с концевым ограничением па траекторию
<?:= (x(0),x(N)) S Q
и целевой функцией
J\<t] = l(q) —у min. Здесь множество Q С Я2п замкнуто, а функция I : R2n R непрерывна. Теорема 7. Пусть для допустимого процесса а найдется такое множество Ф С LdsV что вектор q глобально оптимален в задаче
l(xqi xn) inf; ip(N, xjv) — xo) > ü Vtp e Ф, (xn,xN) £ Q.
Тогда процесс ä глобально оптимален в задаче (Р({].
В §3.3 показано, что разрешающее множество Ф для этих условий обладает свойствами, аналогичными установленным в главе 1.
Параграф 3.4 посвящен доказательству достаточных условий оптимальности в форме дискретного принципа максимума без предположении выпуклости задачи (Pd) и локальной выпуклости вектограммы системы (8).
В §3.5 описываются приложения слабо монотонных ¿-функций. Доказано новое необходимое условие оптимальности - принцип минимума с контрстратегиями - для задач дискретного оптимального управления со свободным правым концом. Этот критерий формулируется в терминах множеств слабо монотонных функций и экстремальных к ним позиционных управлений. В теоретическом плане он смыкается с достаточными условиями оптимальности. Здесь же установлена нестандартная двой-
ственность для задач оптимизации линейных систем с управляемыми коэффициентами. Эта двойственность основана на использовании модифицированного лагранжиана с билинейными производящими функциями и приводит к необходимым и достаточным условиям оптимальности, допускающим естественную численную алгоритмизацию9.
В последнем параграфе главы рассмотрена задача дискретно-импульсного оптимального управления в нелинейной системе «с толчками» в априорно не фиксированные моменты времени. При выполнении так называемого условия согласования применение к этой задаче канонической теории естественным образом приводит к дискретному аналогу нелинейного преобразования Гоха2, существенно упрощающему задачу. Это преобразование иллюстрировано на многомерной дискретной динамической модели оптимального распределения ресурсов, которая преобразуется к «почти статической» задаче оптимального управления.
РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ
1. Доказаны достаточные условия сильного и глобального экстремума с бипозициониыми решениями неравенств Гамильтона-Якоби для классических, дискретных и дискретно-непрерывных задач оптимального управления с общими концевыми ограничениями и целевыми функционалами.
2. Получены достаточные условия оптимальности в форме принципа максимума Понтрягина для невыпуклых задач оптимального управления дискретными и дискретно-непрерывными системами.
3. Доказаны необходимые условия глобальной оптимальности с бипозициониыми и производящими функциями для классических, дискретных и дискретно-непрерывных задач оптимального управления.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Дыхта В.А., Сорокин С.П. Неравенства Гамильтона-Якоби и условия оптимальности в задачах управления с общими концевыми ограничениями // Автоматика и телемеханика. 2011. № 9. С. 13-27.
2. Дыхта В.А., Сорокин С.П. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. 2011. № 6. С. 48-63.
"Эти результаты являются дискретными аналогами принципа минимума с контрстратегиями и нестаидратной двойственности, установленными научным руководителем для непрерывных задач.
3. Сорокин С.П. Достаточные условия оптимальности в форме принципа максимума Понтрягина для задач управления гибридными системами // Сибирский журнал индустриальной математики. 2011. Т. 14, № 1. С. 102-113.
4. Сорокин С.П. Монотонные функции типа Ляпунова и условия глобальной оптимальности для задач управления дискретными системами // Известия Иркутского гос. ун-та. Сер. Математика. 2011. Т. 4, № 3. С. 132-145.
5. Дыхта В.А., Сорокин С.П., Яковенко Г.Н. Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры /,/ Труды МФТИ. 2011. Т. 3, № 3. С. 122-131.
6. Дыхта В.А., Сорокин С.П. О реализации нестандартной двойственности в задачах оптимального управления // Вестник Тамбовского ун-та. Сер. Естественные и технические науки. 2011. Т. 16, № 4. С. 1071-1073.
7. Сорокин, С.П. Достаточность гибридного принципа максимума '// Известия Иркутского гос. ун-та. Сер. Математика. 2009. Т. 2, Л'1 2. С. 37-40.
8. Сорокин С.П. Монотонные решения неравенств Гамильтона-Якоби в оптимальном управлении // Вестник Тамбовского ун-та. Сер. Естественные и технические науки. 2009. Т. 14, № 4. С. 800-802.
9. Сорокин С.П. Достаточные условия оптимальности для задач оптимального управления дискретно-непрерывными системами // Применение математических методов и информационных технологий в экономике: сб. науч. тр. Иркутск: Изд-во БГУЭП, 2009. Вып. 8. С. 43-50.
10. Сорокин С.П. Слабо монотонные L-функции и улучшение управления в задачах оптимизации дискретных динамических систем // Труды XV Байкальской междунар. школы-семинара «Методы оптимизации и их приложения». Т. 3: Оптимальное управление. Иркутск: РИО ИДСТУ СО РАН, 2011. С. 121-126.
11. Дыхта В.А., Сорокин С.П. Каноническая теория Гамильтона-Якоби в задачах с общими концевыми и многоточечными ограничениями на траектории // Proc. V Int. Symposium «Generalized Statements and Solutions of Control Problems-2010». Ulaanbaatar, Mongolia: MUST, 2010. C. 94-98.
Редакционно-издательский отдел Федерального государственного бюджетного учреждения науки Института динамики систем и теории управления СО РАН 664033, Иркутск, ул. Лермонтова, д. 134 E-mail: rio'Sicc.ru
Подписано к печати 09.04.2012 г. Формат бумаги 60x84 1/16, объем 1,2 п.л. Заказ 5. Тираж 130 экз.
Отпечатано в ИДСТУ СО РАН
61 12-1/893
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ ДИНАМИКИ СИСТЕМ И ТЕОРИИ УПРАВЛЕНИЯ СИБИРСКОГО ОТДЕЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК
На правах рукописи
СОРОКИН СТЕПАН ПАВЛОВИЧ
НЕРАВЕНСТВА ГАМИЛЬТОНА-ЯКОБИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНЫМИ СИСТЕМАМИ
01.01.02 - Дифференциальные уравнения, динамические системы и оптимальное управление
■V» V '....
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель: доктор физ.-мат. наук, профессор В.А. Дыхта
Иркутск - 2012
Оглавление
Введение 4
0.1 Монотонные ¿-функции: определения и критерии в форме
неравенств Гамильтона-Якоби ..................................12
1 Бипозиционные решения неравенств Гамильтона-Якоби в
классической задаче оптимального управления 23
1.1 Постановка задачи................................................23
1.2 Канонические достаточные условия оптимальности. Сравнение с альтернативными подходами ............................25
1.2.1 Базовые К-достаточные условия оптимальности ... 25
1.2.2 Модифицированные достаточные условия Кротова с множеством ¿-функций............ ^ ... 29
1.2.3 Модифицированные достаточные условия Каратеодори 36
1.3 Бипозиционные ¿-функции и канонические условия оптимальности ..........................................................39
1.3.1 Оценки и точное описание интегральных воронок . . 39
1.3.2 Оценки множества соединимых точек..................42
1.3.3 Необходимые и достаточные условия оптимальности . 45
1.4 Анализ достаточных условий оптимальности..................49
1.5 Условия оптимальности с бипозиционными ¿-функциями в неклассической линейно-квадратичной задаче оптимального управления........................................................52
1.6 Производящие функции и нестандартная двойственность . . 58
1.7 Примеры ..........................................................61
2 Канонические условия оптимальности в задачах управле-
ния дискретно-непрерывными системами 67
2.1 Постановка задачи................................................67
2.2 Необходимые и достаточные условия оптимальности с бипо-зиционными L -функциями......................................71
2.3 Достаточные условия в форме принципа максимума Понтря-гина................................................................73
2.4 Макроэкономическая модель оптимизации перехода к новой технологии ........................................................77
2.5 Связь общих достаточных условий оптимальности с биэкс-тремалями системы и принципом максимума Понтрягина . . 80
2.6 Теоретические приложения, обобщения и примеры............87
2.6.1 Задачи с разрывной зависимостью по времени .... 87
2.6.2 Исследование экстремалей с разрывным управлением 93
2.6.3 Использование производящих функций................98
3 Монотонность, достижимость и оптимальность в задачах
управления дискретными системами 102
3.1 Монотонные L -функции для дискретных систем..............102
3.2 Внешние оценки множества соединимых точек (Достаточные условия оптимальности..........................................106
3.3 Анализ достаточных условий оптимальности и примеры . . 108
3.4 Достаточные условия оптимальности в форме принципа максимума ..............................................................114
3.5 Необходимые условия оптимальности со слабо монотонными
и производящими функциями....................................118
3.5.1 Применение слабо монотонных L-функций............118
3.5.2 Производящие функции в задаче оптимизации, линейной по состоянию..........................................122
3.6 Оптимизация дискретно-импульсных систем..................127
Заключение 135
ЛИТЕРАТУРА 136
Введение
Актуальность работы. Дискретно-непрерывные динамические системы различной природы (составные, многоэтапные, импульсные) в последнее время стали объектом пристального внимания специалистов по динамике систем и оптимальному управлению. Объясняется это богатыми приложениями в механике, робототехнике, оптике, экономике, экологии и в других областях науки, которые потребовали применения сложных моделей, объединенных собирательным термином «гибридные». Системы этого широкого класса характеризуются наличием двух типов динамики — дискретной и непрерывной, и являются интересными с точки зрения математических свойств. Данная работа посвящена качественному исследованию задач оптимального управления дискретно-непрерывными системами.
Необходимые условия оптимальности в форме принципа максимума Понтрягина (ПМ) для различных классов гладких дискрет по непрерывных задач оптимального управления были получены в целой серии работ. Их систематическое изложение дано в монографии Л.Т. Ащепкова [9]. В ней в качестве базовой модели выбрана задача оптимального управления с промежуточными (многоточечными) фазовыми ограничениями. Она оказалась достаточно удобной и универсальной не только для дискретно-непрерывных задач динамической оптимизации, но и для задач оптимизации разрывных систем. На это впервые обратил внимание В.В. Вели-ченко; в указанной монографии этот факт последовательно раскрыт и реализован. Отметим, что в ней (и во многих других работах) доказательство ПМ основано на довольно трудоемкой технике многоточечного иголь-
чатого варьирования управления1. В недавних работах A.B. Дмитрука и А.М. Кагановича [26,122] детально показано, что намного более короткое и естественное доказательство принципа максимума может быть получено, если свести дискретно-непрерывную задачу оптимального управления к классической с общими (не разделенными) концевыми ограничениями. Это сведение достигается путем «размножения» фазовых и управляющих переменных, восходящего к работам Ю.М. Волина и Г.М. Островского [17], в комбинации с заменой времени. Иная техника вывода ПМ использована A.B. Арутюновым и А.И. Околевичем [103] для дискретно-непрерывных задач оптимизации со смешанными ограничениями (в отсутствие включения ueU).
Большая серия работ Ф. Кларка, Р. Винтера, Г. Зуссмана, М. Гаравелло, Б. Пиколли и др. [118,119,132,147,148] посвящена «гибридному» принципу максимума для негладких дискретно-непрерывных задач оптимального управления. Исследуемые в них модели обладают большой общностью и требуют изощренной техники негладкого и вариационного анализа. Однако в гладких вариантах этих моделей полученные принципы максимума сводятся к уже упомянутым выше (и, в конечном счете, к классическому ПМ).
Отметим также задачи оптимального импульсного управления, которые в некоторых постановках имеют дискретно-непрерывный (гибридный) характер, но весьма специфичны как по методам анализа, так и результатам (их достаточно обстоятельное изложение до уровня принципа максимума и обзор литературы см. в [68]).
Обратим внимание, что во всех работах по дискретно-непрерывным задачам оптимального управления вопрос об обращении ПМ в достаточное условие оптимальности рассматривается только для линейно-выпуклых задач и нормальных экстремалей (например, в [9,68]). Для гораздо более общих задач и экстремалей такое обращение получено в диссертации.
Достаточные условия оптимальности для различных классов задач оп-
1ПМ для задач управления с промежуточными фазоограничениями из [9] не вполне завершен: не установлено существование универсальных множителей Лагранжа, соответствующих оптимальному процессу задачи (что интерпретировалось как «явление распадения ПМ»). В последствии автор естественным образом модифицировал свое доказательство и устранил недостаток.
тимизации дискретно-непрерывных (гибридных) динамических систем получались путем обобщения метода В.Ф. Кротова [60,136] (в зарубежной литературе аналогичные результаты часто связываются с родственным методом проверочных функций К. Каратеодори [102,114,144,156]) и метода динамического программирования Р. Беллмана [16,115] — через использование квазивариационных неравенств для субрешений одноименного уравнения. Отметим здесь цикл работ, выполненных под руководством В.И. Гурмана [24], А.Б. Куржанского [54] (оптимальный синтез в линейно-выпуклых задачах), Ж.-П. Обена [104,105] (примыкающих по технике оперирования функциями типа Ляпунова), М.С. Браникки (M.S. Branicky) [111], а также Р. Винтера с Г. Гелбрайтом [131], Л.Т. Ащепкова [9] и др. [10,11, 24, 32, 34,110,131,133,134] (ввиду широты проблематики этот перечень отнюдь не полон).
Значительная часть диссертации выполнена в русле этих исследований, но отличается следующими особенностями:
• в соответствии с канонической теорией оптимальности Гамильтона-Якоби [3,29,33,35-38,123,140,141], достаточные и необходимые условия формулируются в терминах множеств функций типа Ляпунова (L -функций) — сильно и слабо монотонных решений соответствующих квазивариационных неравенств Гамильтона-Якоби (в общем случае не гладких); эти функции используются для построения внешних и внутренних оценок достижимых состояний управляемой динамической системы2;
• используется новый класс решений неравенств Гамильтона-Якоби, параметрически зависящих от начальной (или финальной) позиции.
В первой главе диссертации показано, что введение этого класса функций, названных бипозиционными, естественно уже для классических задач оптимального управления с общими концевыми ограничениями. В этой же главе установлено, что канонические достаточные условия оптимальности эффективнее условий Каратеодори и Кротова даже в модифицированных вариантах — с использованием множеств сильно монотон-
2Для классических задач оптимального управления с закрепленным концом траекторий близкий подход развивался в работах М.М. Хрусталева [99,100], а также В.И. Гурмана [24], Г.Н. Константинова [58] (в части достаточных условий), но с единственным решением неравенств Гамильтона-Якоби.
ных Ь -функций. Естественно, что это свойство должно наследоваться и дискретно-непрерывными задачами. Поэтому развитие канонических условий оптимальности для задач оптимизации дискретно-непрерывных систем является актуальным.
Цель диссертационной работы состоит в получении необходимых и достаточных условий оптимальности дискретно-непрерывных процессов путем обобщения канонической теории оптимальности Гамильтона-Якоби на новые классы задач.
Объектом исследования являются задачи оптимального управления дискретно-непрерывными системами с включением в анализ базовых составляющих: классических и дискретных задач оптимального управления с общими концевыми ограничениями на траекторию.
Поясним, что как гибридный принцип максимума, так и условия оптимальности кротовского типа характеризуют оптимальную непрерывную динамику задач управления гибридной системой, оставляя в тени дискретную (которая не допускает классического вариационного анализа)3. Чтобы нивелировать этот крен, в условиях оптимальности второй главы диссертации акцент сделан на анализе непрерывной динамики, а дискретная «снесена» во вспомогательную дискретно-концевую экстремальную задачу. В третьей главе (теми же методами) исследуются уже дискретные задачи оптимизации, которые охватывают возможные варианты дискретно-концевых задач4.
Методы исследования базируются на свойствах сильной и слабой монотонности обобщенных решений неравенств Гамильтона-Якоби, оценках множеств соединимых точек управляемых систем, канонической теории оптимальности в оригинальных вариантах, принципе максимума Понтрягина и теории экстремальных задач.
Научная новизна. Для качественного исследования оптимизационных и позиционных задач теории управления дискретно-непрерывными системами введен новый класс бипозиционных решений неравенств (и урав-
3Лишь в нескольких работах «перекос» сделан в сторону дискретной динамики.
4Конечно, не все; например, рассматриваемые в [75] задачи требуют специальных подходов.
нений) Гамильтона-Якоби, параметрически зависящих от начальной или финальной позиции управляемой системы. Доказано, что этот класс Ь-функций (типа Ляпунова) необходим для обоснования канонической теории оптимальности уже в классических задачах оптимального управления с не разделенными концевыми ограничениями. Полученные условия локальной и глобальной оптимальности дискретно-непрерывных процессов с множествами бипозиционных Ь -функций существенно усиливают известные аналоги. В частности, из них выводятся наиболее общие достаточные условия оптимальности в форме принципа максимума Понтрягина для дискретно-непрерывных задач оптимизации без априорных предположений выпуклости, нормальности исследуемой экстремали, единственности соответствующих ей наборов множителей Лагранжа. Представляют интерес необходимые и достаточные условия оптимальности, усиливающие принцип максимума для дискретных задач оптимального управления в линейных системах с управляемыми коэффициентами. Переход к бипозици-онным решениям неравенств Гамильтона-Якоби позволил получить способ построения субоптимальных бипозиционных управлений по нижней огибающей разрешающего множества Ь -функций, что невозможно в традиционном классе решений.
Теоретическая и практическая значимость работы. Развитые в работе методы могут применяться для качественного анализа и решения различных классов задач оптимального управления и для оценки достижимых состояний управляемых систем при общих концевых ограничениях. Исследованные многомерные модели оптимизации перехода экономики к новой технологии и распределения ресурсов иллюстрируют эффективность предлагаемых методов и условий оптимальности. Конструкция позиционного управления, экстремального к разрешающему множеству бипозиционных решений неравенств Гамильтона-Якоби, близка к традиционной и вполне реализуема в численных методах решения задач управления. Это относится и к необходимым условиям оптимальности с позиционными контруправлениями для задач оптимизации дискретных систем, линейных по состоянию.
Исследования по теме диссертации проводились в рамках проекта по
программе СО РАН «Нелокальные методы в теории управления динамическими системами» (№ гос. регистрации 01201001345), интеграционного проекта СО-УрО РАН № 85 «Качественный и численный анализ эволюционных уравнений и управляемых систем» и грантов РФФИ (проекты 07-01-00741-а, 11-01-00672-а, 09-01-16002-моб_з_рос, 10-01-09370-моб_з).
Основные результаты диссертации, выносимые на защиту.
1. Доказаны достаточные условия сильного и глобального экстремума с бипозиционными решениями неравенств Гамильтона-Якоби для классических, дискретных и дискретно-непрерывных задач оптимального управления с общими концевыми ограничениями и целевыми функционалами.
2. Получены достаточные условия оптимальности в форме принципа максимума Понтрягина для невыпуклых задач оптимального управления дискретными и дискретно-непрерывными системами.
3. Доказаны необходимые условия глобальной оптимальности с бипозиционными и производящими функциями для классических, дискретных и дискретно-непрерывных задач оптимального управления.
Структура и объем диссертации. Работа состоит из введения, трех глав, заключения и списка литературы, содержащего 155 наименования. Общий объем диссертации составляет 153 страницы.
Апробация работы. Результаты диссертации представлялись на следующих конференциях:
1) Школа-семинар «Нелинейный анализ и экстремальные задачи», Иркутск, 24 - 30 июня 2008 г.;
2) Конференция ИДСТУ СО РАН «Ляпуновские чтения», Иркутск, 19 -23 декабря 2008 г.;
3) Воронежская зимняя математическая школа «Современные методы теории функций и смежные проблемы», Воронеж, 27 января - 2 февраля 2009 г.;
4) Конференция аспирантов факультета экономической кибернетики БГУЭП, Иркутск, 8 апреля 2009 г.;
6
7
8 9
10
11 12
13
14
15
16
17
18 19
Всероссийская конференция «Математическое моделирование и вычислительно-информационные технологии в междисциплинарных научных исследованиях», Иркутск, 6-7 июня 2009 г.; Международная конференция «Актуальные проблемы теории устойчивости и управления», Екатеринбург, 21 - 26 сентября 2009 г.; Международная конференция «Колмогоровские чтения. Общие проблемы управления и их приложения», Тамбов, 5-9 октября 2009 г.; Конференция ИДСТУ СО РАН «Ляпуновские чтения», Иркутск, 21 -23 декабря 2009 г.;
XI Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям, Иркутск — пос. Старая Ангасолка, 15 - 21 марта 2010 г.;
XI Международная конференция «Устойчивость и колебания нелинейных систем управления (конференция Е.С. Пятницкого)», Москва, 1 -4 июня 2010 г.;
II Международная школа-семинар «Нелинейный анализ и экстремальные задачи», Иркутск, 28 июня - 4 июля 2010 г.;
V Международный симпозиум «Обобщенные постановки и решения задач управления», Улан-Батор, Монголия, 13 - 17 сентября 2010 г.; Конференция ИДСТУ СО РАН «Ляпуновские чтения», Иркутск, 20 -23 декабря 2010 г.;
42-ая Всероссийская Молодежная школ а-конференция «Современные проблемы математики», Екатеринбург, 30 января - 6 февраля 2011 г.; Международная конференция «Дифференциальные уравнения и смежные вопросы», посвященная памяти И.Г. Петровского, Москва, 29 мая - 4 июня 2011 г.;
Российско-монгольская конференция молодых ученых по математи