Обобщенный метод характеристик в решении задач оптимального управления с фиксированным моментом окончания тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Токманцев, Тимофей Борисович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2011
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
РОССИЙСКАЯ АКАДЕМИЯ НАУК УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
4844211
ТОКМАНЦЕВ Тимофей Борисович
Обобщенный метод характеристик в решении задач оптимального управления с фиксированным моментом окончания
01.01.02 - дифференциальные уравнения, динамические системы и оптимальное управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
2 1 ДПг 2011
Екатеринбург - 2011
4844211
Работа выполнена в отделе динамических систем Института математики и механики Уральского отделения РАН.
Научный руководитель: доктор физико-математических наук
Субботина Нина Николаевна Официальные оппоненты: доктор физико-математических наук
Гусев Михаил Иванович, кандидат физико-математических наук Вахрушев Виктор Александрович Ведущая организация: Московский государственный универси-
тет им. М.В. Ломоносова, ВМиК
Защита состоится 27 апреля 2011 г. в 13 часов на заседании специализированного диссертационного совета Д 004.006.01 по защите диссертаций на соискание ученой степени доктора наук при Институте математики и механики Уральского отделения РАН, расположенном по адресу: 620990, г. Екатеринбург, ул. С. Ковалевской, 16.
С диссертацией можно ознакомиться в библиотеке Института математики и механики УрО РАН.
Автореферат разослан ^¿у^м.— 2011 г.
Ученый секретарь
диссертационного совета,
доктор физико-математических наук
Н.Ю. Лукоянов
Общая характеристика работы
Актуальность работы. Работа посвящена исследованию свойств задачи оптимального управления с фиксированным моментом окончания и роли характеристик уравнения Гамильтона-Якоби-Беллмана в численном решении этой задачи. Предлагается конструкция сеточного оптимального синтеза и исследуется ее эффективность. Разработаны и протестированы на ряде модельных задач оптимального управления программные реализации предложенных алгоритмов. Рассмотрено приложение конструкции сеточного оптимального синтеза к исследованию макроэкономической модели.
Истоки теории оптимального управления восходят к работам JI. С. Понт-рягина1, R. Bellman2, Н. Н. Красовского3, R. Isaacs, W. Н. Fleming, A. Fridman.
Фундаментальный вклад в развитие теории оптимального управления внесли В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко, Б.Н. Пшеничный, H.H. Моисеев, Ф.Л. Черноусько, В.А. Якубович, Ю.Г. Евтушенко, L.D. Berkovitz, А.Е. Bryson, F.H. Clarke, G. Leitmann, Y.-C. Ho, R. Olsder, E.O. Roxin, J. Warga, R.J. Elliott, N.J. Kalton.
Существенное развитие теория получила в работах В.И. Зубова, Ф.М. Кирилловой, Р.Ф. Габасова, В.Ф. Кротова, A.A. Меликяна, A.A. Чи-крия, С.М. Асеева, A.A. Аграчева, Л.Д. Акуленко, A.B. Арутюнова, В.И. Бла-годатских, Н.Л. Григоренко, А.Я. Дубовицкого, A.B. Дмитрука, В.А. Дыхты, В.И. Жуковского, М.И. Зеликина, А.Д. Иоффе, Ю.С. Ледяева, A.A. Милютина, М.С. Никольского, Г.К. Пожарицкого, Е.С. Половинкина, H.H. Петрова, Л.А. Петросяна, В.М. Тихомирова, Е.Л. Топкова, В.И. Ухоботова, С.В. Чистякова.
1 Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Б. Ф. Математическая теория оптимальных процессов. Москва: Наука, 1961
2 Bellman R. Dynamic Programming. Princeton: Univ. Press, 1957
3 Красовский H.H. Теория управления движением. М.: Наука, 1968
Настоящая работа лежит в рамках концепции оптимального позиционного управления, предложенной и развитой в работах H.H. Красовского4.
Фундаментальный вклад в развитие теории позиционного управления, наблюдения, оценивания и динамической реконструкции внесли работы Ю.С. Осипова, А.Б. Куржанского, А.И. Субботина, A.B. Кряжимского, А.Г. Ченцова, В.Н. Ушакова, В.Е. Третьякова.
Большую роль в развитии теории оптимального позиционного управления сыграли работы Э.Г. Альбрехта, М.И. Гусева, С.Т. Завалищина, А.Ф. Клейменова, А.И. Короткого, Е.К. Костоусовой, А.Н. Красовского, Н.Ю. Лукоянова, В.И. Максимова, О.И. Никонова, B.C. Пацко, В.Г. Пиме-нова, А.Н. Сесекина, H.H. Субботиной, A.M. Тарасьева, Т.Ф. Филипповой, А.Ф. Шорикова, В.Я. Джафарова, Х.Г. Гусейнова и их учеников.
Ключевым понятием в теории оптимального позиционного управления является функция цены, которая начальному состоянию управляемой системы ставит в соответствие оптимальный гарантированный результат. Эта функция лежит в основе конструкции оптимального синтеза — оптимального управления по принципу обратной связи.
Как правило, функция цены в рассматриваемых задачах оптимального управления является негладкой. Хорошо известно, что в точках дифферсн-цируемости она удовлетворяет уравнению в частных производных первого порядка (уравнению Гамильтона-Якоби-Беллмана), связанному с изучаемой задачей управления. В современной теории обобщенных решений уравнений Гамильтона-Якоби доказано, что функция цены для задачи управления совпадает с единственным минимаксным5/вязкостным6 решением соответствую-
4 Красовский H. Н., Субботин А. И. Позиционные дифференциальные игры. Москва: Наука, 1974
5 Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. Москва; Ижевск: Институт компьютерных исследований, 2003
6 Crandall M. G., Lions P. L. Viscosity solutions of Hamiltion-Jacobi equations // Trans. Amer. Math. Soc. 1983. Vol. 277. Pp. 1-42.
щей краевой задачи Коши для уравнения Гамильтона-Якоби-Беллмана.
В случае, когда существует классическое (гладкое) решение задачи Коши для уравнения Гамильтона-Якоби-Беллмана, оно может быть построено с помощью классического метода характеристик Коши7. Этот метод сводит интегрирование уравнения в частных производных первого порядка к интегрированию системы обыкновенных дифференциальных уравнений, решения которой называются характеристиками. Как доказано в работах F.H. Clarke, N. Barron, S. Mirica, H.H. Субботиной8, использование классических характеристик уравнения Гамильтона-Якоби-Беллмана обеспечивает исследователя необходимыми и достаточными условиями оптимальности в классе программных управлений.
В современной теории обобщенных решений уравнений Гамильтона-Яко-би и соответствующих задач динамической оптимизации рассматриваются различные обобщения понятия характеристики. Новые подходы к определению обобщенных характеристик предложены в работах А.И. Субботина, А.Б. Куржанского, Ю.С. Ледяева, A.A. Меликяна, В.И. Благодатских, A.A. Толстоногова, А.Ф. Филиппова, А.И. Булгакова, J.P. Aubin, A. Cellina, H. Frankowska, G. Haddad.
Тем не менее, актуальной задачей остается использование классических характеристик для конструирования обобщенных решений и построения оптимального синтеза в соответствующих задачах оптимального управления.
К настоящему времени разработано большое количество численных методов решения задач оптимального управления. Среди них можно выделить две группы методов. К первой относятся методы, нацеленные на построение оптимального программного управления: методы, основывающиеся на решении
7 Курант Р. Уравнения с частными производными. Москва: Мир, 1964.
8 Subbotina N. N. The method of characteristics for Hamilton-Jacobi equations and applications to dynamical optimization. NY: Springer, 2006
двухточечной краевой задачи, следующей из принципа максимума Л.С. Понт-рягина; методы последовательных приближений; градиентные методы в пространстве управлений, методы, опирающиеся на конструирование областей достижимости. Разработке этих методов посвящены работы Ф.П. Васильева, В.Л. Гасилова, В.Б. Костоусова, Ю.И. Бердышева, Ю.Н. Киселева, H.H. Болотника, И.М. Ананьевского, Б.Н. Соколова, Н.В. Баничука, Д.В. Камзолки-на и многих других известных математиков.
Вторую группу составляют методы, наделенные на построение оптимального синтеза, основанные на методе динамического программирования и связанные с решением уравнения Гамильтона-Якоби. Существенный вклад в развитие этого направления внесли работы В.Н. Ушакова, B.C. Пацко, A.M. Тарасьева, А.Г. Пашкова, С.И. Кумкова, A.A. Успенского, P. Souganidis, М. Falcone. Численные алгоритмы конструкций позиционного оптимального управления успешно разрабатывались в работах В.А. Вахрушева, В.Л. Туро-вой, С.С. Кумкова, Д.А. Серкова, Л.Г. Шагаловой, А.П. Хрипунова.
Несмотря на обилие предложенных методов, исследование роли классических характеристик в конструкциях эффективных методов оптимального позиционного управления остается актуальной задачей.
Цели диссертационной работы. Исследование свойств функции цены задачи оптимального управления с непрерывными по времени и дифференцируемыми по фазовой переменной входными данными; разработка и обоснование численных методов аппроксимации функции цены и построения сеточного оптимального синтеза в рассматриваемой задаче оптимального управления на базе классических характеристик уравнения Гамильтона-Якоби-Беллма-на; программная реализация численных методов и решение модельных задач теории оптимального управления; приложение конструкций сеточного оптимального синтеза к анализу модели макроэкономической системы.
Методы исследования. Основным методом исследований является обобщение классического метода характеристик Коши. Для анализа минимаксных решений уравнений Гамильтона-Якоби применяются методы и аппарат негладкого анализа.
Для доказательства оптимальности предлагаемых конструкций сеточного синтеза применяются необходимое условие — принцип максимума Л.С. Понтрягина в гамидьтоновой форме, и достаточное условие в терминах супердифференциала функции цены, предложенное H.H. Субботиной.
При выводе оценки скорости сходимости процедуры построения аппроксимации функции цены были использованы методы теории рекурсии9. При этом для получения констант применялся пакет Matlab.
Предложенные численные алгоритмы реализованы автором в виде программы на языке С++ с использованием методов вычислительной геометрии.
Научная новизна. Предложен новый метод решения задачи оптимального управления с фиксированным моментом окончания, при котором для нахождения оптимальных траекторий решается краевая задача Коши, где краевые условия для фазовой и сопряженной переменных заданы в один и тот же конечный момент времени (в отличие от стандартной двухточечной краевой задачи в принципе максимума Л.С. Понтрягина). Предложены новые конструкции численной аппроксимации функции цены и сеточного оптимального синтеза, определенные в узлах адаптивных сеток, лежащих на численных решениях характеристической системы.
Получена оценка точности аппроксимации функции цены, которая линейно зависит от шага интегрирования (в отличие от сеточных методов, использующих равномерные сетки, где оценка точности линейно зависит от корня квадратного из шага интегрирования).
Получена оценка качества управления с помощью сеточного оптималь-
9 Грин Д., Кнут Д. Математические методы анализа алгоритмов. Москва: Мир, 1987.
ного синтеза (оценка эффективности), которая линейно зависит от шага интегрирования. При оценке эффективности сеточного оптимального синтеза применяется оригинальный подход на базе теории рекурсии.
Новым приложением конструкций сеточного оптимального синтеза является использование их для анализа динамики макроэкономической модели на основе накопленной дискретной статистики.
Теоретическая и практическая ценность. Предложенные методы могут применяться при решении достаточно широкого класса задач управления с терминально-интегральным функционалом, где обеспечены условия существования, единственности и продолжимости классических характеристик соответствующего уравнения Гамильтона-Якоби-Беллмана.
Основные результаты диссертации.
• Для задачи оптимального управления с фиксированным моментом окончания доказаны теоремы о структуре функции цены и супердифференциала функции цены в терминах классических характеристик уравнения Гамильтона-Якоби-Беллмана.
• Предложены численные методы аппроксимации функции цены и оптимального синтеза. Получены оценки численных аппроксимаций.
• Программные реализации численных алгоритмов разработаны и протестированы на решении модельных задач оптимального управления, а также применены к решению задачи идентификации макроэкономической модели.
Апробация работы Основные результаты диссертации докладывались на следующих конференциях: 37-ой, 38-ой региональных молодежных конференциях "Проблемы теоретической и прикладной математики" (Екатеринбург, 2006, 2007); научной конференции "Демидовские чтения на Урале" (Ека-
теринбург, 2006); научной конференции "Теория управления и математическое моделирование" (Ижевск, 2006); 9-ом Всероссийском съезде по теоретической и прикладной механике (Нижний Новгород, 2006); Всероссийской научной конференции "Математика. Механика. Информатика", посвященной 30-летию Челябинского государственного университета (Челябинск, 2006); 3-ей Международной конференции "Параллельные вычисления и задачи управления" памяти И.В. Прангишвили (Москва, 2006); Международном научной семинаре "Математическая теория оптимального управления и теория дифференциальных включений", посвященный 60-летию В.И. Благодатских (Москва, 2006); 14-ой Международной конференции по динамике и управлению (Москва — Звенигород, 2007); Международной конференции "Дифференциальные уравнения и смежные вопросы", посвященная памяти И.Г. Петровского (Москва, 2007); 9-ой Международной Четаевская конференции "Аналитическая механика, устойчивость и управление движением" (Иркутск, 2007); Международной конференции "Колмогоровские чтения. Общие проблемы управления и их приложения. Проблемы преподавания математики" (Тамбов, 2007); конференции SIAM по оптимизации (Бостон, США, 2008); 13-ом Международном Симпозиуме по динамическим играм и приложениям (Вроцлав, Польша, 2008); Международной конференции "Дифференциальные уравнения и топология", посвященной 100-летию Л.С. Понтрягина (Москва, 2008); Международной конференции "Дифференциальные уравнения. Функциональные пространства. Теория приближений", посвященной 100-летию С.Л. Соболева (Новосибирск, 2008); 10-ом Международном семинаре "Устойчивость и колебания нелинейных систем управления" имени Е.С. Пятницкого (Москва, 2008); Международной конференции "Алгоритмический анализ неустойчивых задач", посвященной 100-летию В.К. Иванова (Екатеринбург, 2008); 4-ой Международной конференции по физике и управлению (Катания, Италия, 2009); Международной конференции "Управ-
ление динамическими системами" (Москва, 2009); конференции, посвященной 60-летию A.B. Кряжимского (Москва, 2009); Международной конференции "Актуальные проблемы устойчивости и теории управления" (Екатеринбург, 2009); 3-ей и 4-ой Международных конференциях "Теория игр и менеджмент" (Санкт-Петербург, 2009,2010); 3-ей Международной конференции "Математическое моделирование социальной и экономической динамики", Российский Государственный Социальный Университет (Москва, 2010); Всероссийской конференции "Устойчивость и процессы управления" (Санкт-Петербург, 2010); семинаре отдела динамических систем ИММ УрО РАН; семинаре кафедры оптимального управления ВМК МГУ им. М.В. Ломоносова.
Список публикаций автора по теме диссертации. Материалы диссертации опубликованы в 30 печатных работах, из них 5 статей в журналах из списка ВАК ([1-5]), 2 статьи в иностранных журналах ([6, 7]), 7 статей в рецензируемых журналах и сборниках трудов конференций ([8-14]) и 16 тезисов докладов. Список основных публикаций приведен в конце автореферата.
Структура, объем и краткое содержание диссертации. Диссертация состоит из введения, 5 глав и библиографии. Общий объем диссертации 110 страниц, включая 28 рисунков. Библиография включает 56 наименований.
Известные результаты, использующиеся в данной работе, называются "утверждениями", в отличие от "теорем" — результатов автора.
Содержание работы
Во введении раскрываются цели и задачи работы, ее актуальность, а также кратко описываются основные результаты, полученные в диссертации.
В первой главе вводится задача оптимального управления, которая
является основной задачей для глав с первой по четвертую, приводятся известные утверждения, которые использованы в диссертации. Глава состоит из шести параграфов.
В первом параграфе приводится постановка задачи. Рассматривается динамическая управляемая система
на фиксированном отрезке времени Ь 6 [О,Г], фазовый вектор системы х £ ИТ1, на управление наложены геометрические ограничения и € Р, Р С К.т — компакт. Символы Пг и сШу обозначают полосы в пространстве Кп+1:
Символ ¿о 6 [0, Т], обозначает множество допустимых управле-
ний — измеримых функций и(-) : [¿о,Т] н->■ Р, называемых программами. Траектория динамической системы (1), выходящая из начальной точки
символом х(-) — x(';to,xo,u(-)) : [¿о,Г] >-> К".
Качество управления и(-) оценивается с помощью функционала Больца
т
Оптимальный программный результат (цена) V(ío, £о) Для произвольной начальной точки (ío,a;o) е с1Пг имеет вид:
(i)
Пг = (О, Т) х К", el Пг = [0, Т] х Ж".
(ÍQ,ГЕГ0) € с1Пг под воздействием управления и(-) 6 U(to,T), обозначается
V(to, х0)= inf I(t0, x0; u(-)).
(3)
Функцией цены в задаче (1)-(2) называется отображение
V: (tQ,x0)i-*V(to,Xo): с1Пг->К.
(4)
Во втором параграфе приведены стандартные требования А\-Ац на входные данные задачи оптимального управления (1)-(2).
В третьем параграфе введена эквивалентная задаче оптимального управления (1)-(2) задача Коши для уравнения Беллмана:
^^ + H(t, х, Dxv(t, х)) = 0, (t, х) 6 Пт, (5)
H(t, х,р) = nun[(p, f(t, х, и)) + g{t, х, it)j, (6)
Dv(t x)={dv(t'x} дг>(*>хЛ где краевое условие имеет вид
v(T,x) = er(x), Мх € К". (7)
В четвертом параграфе вводится характеристическая система задачи (5)-(7): § = DpH(t, х,р),
§ = -DsH{t,x,P}, (8)
='(p,DaH(t,x,p))-H(t,x,d,
с граничными условиями
х(Т, у) = у, р(Т, у) = Da(y), ЦТ, у) = а (у), Уу £ R". (9)
Решения {x{-,y),p{-,y),z{-,y)) системы (8) называются характеристиками задачи (5)—(7). Приведен классический метод характеристик Коши для построения гладкого решения в задаче (5)—(7).
В пятом параграфе приводится определение минимаксного (негладкого) решения задачи Коши для уравнения Беллмана. Приводится утверждение о совпадении функции цены задачи оптимального управления (1)-(2) с единственным минимаксным решением задачи (5)—(7). Приводится репрезентативная формула функции цены в терминах классических характеристик. Формулируется утверждение о необходимых и достаточных условиях
оптимальности в гамильтоновой форме, дополняющих принцип максимума Л.С. Понтрягина. Приводится определение оптимального синтеза согласно формализации Н.Н. Красовского и сформулировано утверждение о конструкции оптимального синтеза в задаче оптимального управления (1)-(2)
Шестой параграф содержит полезные сведения из негладкого анализа. Во второй главе приводятся результаты исследования задачи оптимального управления (1)-(2) при условиях А}~А'4 на входные данные. В первом параграфе формулируются предположения. А[. Функции /(£,£, и) и д(Ь,х,и) в (1), (2) определены и непрерывны на с1 Пг х Р, существуют непрерывные по (£, х, и) <Е Ит х Р частные производные ^Щ—1-, * е п> Э е п' ограниченные константой Ь\ > 0.
А!2. Терминальная функция платы а{х) в (2) определена и непрерывна на К" вместе со своими частными производными г 6 1 ,п.
А'3. Для любой точки (£, х) б сШт и вектора рбК™ множество
А^ тт| (р, /} + д: (/,<?) е [ {¡{г,х,и), д{г,х,и)) : и е
состоит из единственного элемента [/0(Ь,х,р),д°{Ь,х,р)).
А\. Существуют непрерывные по совокупности переменных и ограниченные в области 6 Пт х 8" частные производные ,
Условия А[—А!л обеспечивают существование, единственность и продолжимость решений характеристической системы (8)-(9).
Во втором параграфе доказываются теоремы о свойствах функции цены.
Теорема 1. Пусть в задаче (1)-(4) выполнены условия А^-А^. Функция цены У(Ь,х) может быть представлена в виде
аеА
где параметр а принимает, значения из метрического компакта А, функция u)(t,x, а) непрерывна на множестве сШу х А, существуют частные производные , г € 1, га, непрерывные на множестве сШу х А.
Теорема 2. Пусть в задаче (1)-(4) выполнены условия At^A'^. Функция цены V(t, х) (4) задачи имеет следующее представление
V{t,x)= min m,у), Y(t,x) = {yZRn:x(t,y)=x}, (10)
yÇY(t,x)
гдех(-,у), z(-,y) — характеристики (8), (9) уравнения Беллмана (5).
Для произвольного компактного множества Go С сШт введены в рассмотрение множество G(Go) С с1Пт и множество P(Gq) такие, что
G(Ga) = {(t,x) е с1Пт | Зх(-,у) - решения (8), (9), 3(i0,x0) £ G0 : (И) x(t0,y) = x0,x(t,y) = х}, P(G0) = {р = p(t, y)eR": (i, x(t, y)) 6 G(Go)}. (12)
Символ Bl = {y 6 R* : ||«/|| < e} обозначает шар радиуса e > 0. Рассматриваются множества G£(G0) = (G(G0) +B£n+1) и PS{G0) = (P(G0) + В®). Символом ??(•) обозначен модуль непрерывности для функций /°(-), <70(-)i г € i € M, на множестве G£(G0) х Pe(G0).
Теорема 3. При выполнении условий А[ • А'4 функция цены V(t,x) задачи (1)-(4) непрерывна по совокупности переменных. Для любой компактной области Go С сШт и любого е > 0 существуют такие константы L£(Go) > 0, Ci (Go) > 0, CI (Go) > 0, что имеет место оценка
| V{t',x') - V(t",x") | < L£(Go)\\x' - + Cf(G0)|i" - Ü | + Cf(GoMI*" - f|)
для всех (f, x'), (£", x") e Ge(G0) С Пт.
В третьем параграфе доказывается теорема 4 о структуре супердифференциала d+V(t, х) функции цены:
d+V(t,x) = {(а,р) е К х 1" : V{t + At,x + Дж) - V{t, х) < ct&t + (р, Ах) + о(||Дх|| 4- | Д*|) V(t + At,x + Ax)eBsn+1(t,x)},
где £ > 0, В5+1(уь) = {у 6 М"+1: [|y - г/0|! < е}.
Теорема 4. Если в задаче (1) - (4) выполнены условия то супердиф-
ференциал d+V(t,x) функции цены V(t,x) задачи (1)-(2) не пуст при всех (t, х) 6 cl Пг и имеет вид
d+V(t,x) = co^(-H{t,x(t,y),p{t,y)),p(t,y)y. x(t,y) =х,Щ,у) = V(t,x) j где (x(-,y),p(-,y),z(-,y)) — решения характеристической системы (8)-(9).
В третьей главе предложен и обоснован алгоритм построения аппроксимации функции цены, основанный на теоретических результатах главы 2.
В первом параграфе описываются алгоритм, который опирается на попятную процедуру численного интегрирования системы (8)-(9).
Рассмотрено разбиение Г = {tj, г = 0,1,..., JV} отрезка времени [to,T] с шагом At. В момент t = io рассмотрено компактное множество Gq С W начальных фазовых значений. Построено компактное множество G({t0} х Go) (11). Его сечение в момент t = ty обозначено символом Gjv-
На Gjv определена равномерная сетка Qn = {2лг},.7 = Ol, jn), с шагом по осям Ах. Через Qi С Rn обозначена сетка в момент i = Узлами сетки Qi являются точки х\, лежащие в момент t = U на характеристиках ж(-), которые в момент t = Т стартуют из точек хJN G Qjv-
Процедура численного интегрирования характеристической системы стартует в момент времени t = Т с краевыми условиями 2?(Т) = Р{Т) =
15
?(Т) = |7(Хдг), учитывая достаточные условия оптимальности. Точные решения системы (оптимали) обозначены символом а их численные аппроксимации — символом (5?(-), ;?(•), г-'(-)).
В момент времени £ = ¿лг-1 конструируется сетка <5дг_1 и аппроксимация функции цены для каждого фиксированного индекса согласно теореме 2 и аппроксимационной формуле:
9(и,х{)= тш (у{и+1,т>+1) + д°{т,х\т),^{т))йт\, (13)
г^рИ-З «</>- I }
где г = М — 1,рх>0 — параметр аппроксимации.
_Л)
В узлах сетки <Элг—1 строятся оптимальные направления:
где = ^'(¿лг-х) = 7(^-1, ^'"(¿лг-О =
Далее эта процедура рекуррентно повторяется на интервалах Строятся сетки С},, г = N — 1,..., 0 с узлами Щ . Выбираются р? = р''(и): Ц = ) = Щ . Если таких индексов з* находится несколько, то выби-
рается любой из них.
Узлы х\ сетки С^, I = N — 1,..., 0, в совокупности с р!, Ц являются краевыми условиями для интегрирования характеристической системы в обратном времени на интервале Результатом работы алгоритма при каждом Ь = и является совокупность — {{х\,Ц, //, д\)}, где Щ = У(и, х?), вектора определены в (14).
Во втором параграфе получена оценка точности аппроксимации функции цены. В дополнение к условиям -А^-Л^ вводится предположение:
А!ъ. Модуль непрерывности г\ в области Ое{Со) х Р£(Со) удовлетворяет условию 35о > 0: г](5) < М8, У5 6 (0,<$о], где константа М = М((?о) € (О, Ь\), константа Ь\ определена в условии А[.
Теорема 5. В задаче (1)-(2) при выполнении условий А\-А!ь для любой компактной области Gq С сШу и любого параметра £ > 0 существует константа Rs(Gq) > 0 такая, что для произвольного узла (ti,x6 Ge(Go) (11), U £ Г, xi € Qi, справедлива оценка:
\V(tux3)-V{ti,xj)\ <R£(G0)At.
В третьем параграфе приводятся примеры использования программной реализации алгоритма для решения модельных задач в случае одномерного и двумерного фазового пространства. В качестве результата работы алгоритма приведены графики аппроксимации функции цены.
В четвертой главе предложен и обоснован алгоритм построения сеточного оптимального синтеза.
В первом параграфе при U 6 Г, в узлах сеток х] € Qi определен сеточный оптимальный синтез х[). При этом используются оптимальные направления //,<?;?, построенные в узлах сеток:
ul(thx{) б Агйтт{||/(£;,^,и) - //|| + Ш,х{,и) -д{[}.
Далее описан алгоритм применения сеточного оптимального синтеза для произвольной начальной точки (t*,xt) 6 Gq С с1Пт, t„ G (to,t{). Пользуясь произвольным постоянным управлением м» £ Р находятся точки xi — х, + (ii — i»)/(i,,2:t,u,) и х2 ё Qu ближайшая к точке Х\\
da = \\xi — х2\\ = min ||a;i — ж||. (15)
xdQ i
На интервале [h,T] строится траектория х2(£) = x2(t;ti,x2) системы (1), стартующая из точки (t\,x2) и порождаемая сеточным синтезом Ыд(-), то есть кусочно-линейное движение по оптимальным направлениям
ff = f(ti,x2(ti),u%(ti,x2{ti))), gf = д(и,х2{и),и0А(и,х2{и))).
Из начальной точки строится пошаговое движение х\(-), порож-
даемое управлением «2(-) с помощью сеточного оптимального синтеза Ид(£,-) согласно правилу
и„ te[t„tl},
и°{и), при г е Мй-1),г е рм,
и°М е АщтпШ^х^ии) - //°|| + ц^),«) - /)|},
Во втором параграфе доказывается теорема об оценке точности алгоритма. Определяется результат реализации сеточного оптимального синтеза
г
тег, т=4 О
совпадающий с численной аппроксимацией функционала Iх^; (2). Теорема 6. В задаче (1)-(4)
при выполнении условий Л'^ ^Л1^ для любой компактной области Со С с1 Пу и любого параметра г > 0 существуют константы 77[(С?о) > 0, Щ(Оо) > 0 такие, что для произвольной точки (£«,ж*) € С£((?о) (И) справедлива оценка
\СТ(^,х*;и%)) - У{и,х.)| < АЩ(в0) +й0Щ(в0).
Здесь йо определено в (15).
В третьем параграфе приводятся примеры решения модельных задач оптимального управления с помощью сеточного оптимального синтеза.
В пятой главе исследуется модель макроэкономической системы, предложенная Э.Г. Альбрехтом10.
В первом параграфе описывается модель Э.Г. Альбрехта. Символ р обозначает конечный валовый продукт, q обозначает материальные затраты.
10 Альбрехт Э. Г. Методика построения и идентификации математических моделей макроэкономических процессов // Электронный журнал "Исследовано в России". 2002. Т. 5. С. 54-86
т
Предполагается, что прибыль к зависит только от валового продукта и материальных затрат, т.е. Л = (7(р, д). Функция в(р, д) называется макроэкономическим потенциалом системы.
Динамика рассматриваемая модели имеет следующий вид: йр дв(р, д) йд д)
Ъ = м=и2—дГ~ (16)
на временном интервале [0,Т]. Здесь щ, и2 — управляющие параметры, удовлетворяющие геометрическим ограничениям
Ы < ии \и2\ < 112, (17)
где У] > 0, и2 > 0 — константы.
Имеются статистические данные, а именно, таблица значений величин р, д, к, измеренных в моменты 6 [О, Т], г — 0,1,..., Ы, ¿о = 0, ^ = Т:
Ро> <7си • • • > <?№ Ло, • • ■,
Статистические данные (р*, д*) измерены с ошибками и известны оценки ошибок измерения
\р-рЦ<Ар, \д-д*\<Ад.
. Символами р*(-)> <}*(•) обозначаются линейные интерполяции статистических данных на отрезке [0,Т]. Вводится область допустимых движений I):
В = {(^р,д) е € [О,Г], \р-р*Ш < Ар, \g-rm < Ад}. (18)
Предполагается, что структура функции (7(р, д) имеет вид многочлена
С(р,д)=рд[а° + а1р + а2д]. (19)
Во втором параграфе ставится задача восстановления динамики системы по заданным статистическим данным.
Первым шагом является определение параметров макроэкономического потенциала, наилучшим образом соответствующим статистическим данным. Рассматривается задача идентификации параметров а0, а1, а2, определяющих вид макроэкономического потенциала С(р, д) (19). Для получения наилучшего соответствия статистическим данным применяется метод наименьших квадратов:
Далее ставится вспомогательная задача оптимального управления динамикой модели (16), где множество допустимых управлений определяется следующим образом ¿7(0, Т) = {Уи(-): [0,Т] —> Р — измерима}, а функционал платы имеет вид:
/(¿О,ро, до; «(•)) = №) - р(Т))2 + (Г (Г) - д(Т))2+
+
т _
т) - №?+(<тм - чШ+
ей, (20)
где е > 0 — параметр регуляризации. Величина вводится для
того, чтобы обеспечить выполнение условия А'% для рассматриваемой задачи оптимального управления. Функции !>*(•), д*(-) — линейные интерполяции статистических данных.
Ставится задача о нахождении оптимального синтеза — универсального позиционного управления, оптимального для всех заданных начальных состояний. Траектории, порождаемые оптимальным синтезом и содержащиеся в области допустимых движений, являются решением задачи о восстановлении динамики системы по заданным статистическим данным.
В третьем параграфе описывается алгоритм численного решения задачи о восстановлении движений модели.
В момент 4 = ¿дг = Т задается область <3N € К2 вида
= {(Р. 9)£К2: IР~ Р*мI < Ар, \д - < Дд},
на области Ом задается сетка С}(1м) с шагом Ам- Для узлов , д^') е С^^м) в обратном времени строятся траектории д(-;<?/) — оптимали систе-
мы (16), выходящие в момент Ьц = Т из состояний
Построенные траектории д(-; д^) используются для построения
оптимального сеточного синтеза в узлах сеток <2А = ЛГ,..., 1.
В момент í = 0 рассматриваются сечение ¿о € Ж2 области допустимых движение Б (18) и сетка с шагом До- Для узлов 6 0 а как для на-
чальных состояний в прямом времени строятся траектории р(-;р°), <?(•;<$) под управлением сеточного оптимального синтеза.
Затем среди движений <}{'',<]]) выбираются те, для которых вы-
полняется условие
Таких движений может быть несколько (если таких нет, то расширяем область допустимых движений В). Из них выбираются окончательно те, на которых функционал (20) достигает минимума. Эти функции р(-;р°), д(-;<7°) называются решениями задачи о восстановлении движений модели.
В четвертом параграфе задача численно решается при конкретных статистических данных.
Список основных публикаций
1. Субботина Н. Н., Токманцев Т. Б. Алгоритм построения минимаксного решения уравнения Беллмана в задаче Коши с дополнительными огра-
ничениями // Тр. Ин-та математики и механики УрО РАН. 2006. Т. 12, № 1. С. 208-215.
2. Субботина Н. II., Токманцев Т. Б. Оптимальный синтез в задаче управления с липшицевыми входными данными // Тр. МИАН. 2008. Т. 262, № 1. С. 240-252.
3. Субботина Н. Н., Токманцев Т. Б. Об эффективности сеточного оптимального синтеза в задачах оптимального управления с фиксированным моментом окончания // Дифференц. уравнения. 2009. Т. 45, № 11. С. 1651-1662.
4. Субботина Н. Н., Токманцев Т. Б. Оценка погрешности сеточного оптимального синтеза в нелинейных задачах оптимального управления предписанной продолжительности // Автоматика и телемеханика. 2009. Т. 9. С. 141-156.
5. Субботина Н. Н., Токманцев Т. Б. Классические характеристики уравнения Беллмана в конструкциях сеточного оптимального синтеза // Тр. МИАН. 2010. Т. 271. С. 259-277.
6. Subbotina N. N., Tokmantsev Т. В. On Solutions of Optimal Control Problems of Prescribed Duration on the Plane // Advances in Mechanics. Dynamics and Control: Proceedings of the 14th International Workshop on Dynamics and Control. Moscow: Nauka, 2008. P. 281-288.
7. Subbotina N. N., Tokmantsev Т. B. On Grid Optimal Feedbacks to Control Problems of Prescribed Duration on the Plane // Advances in Dynamic Games. Vol. 11 of Annals of the ISDG. 2011. P. 133-147.
8. Субботина H. H., Токманцев Т. Б. О вычислении оптимального результата в задачах управления на заданном отрезке времени // Тр. III Между-
22
народ, конф. "Параллельные вычисления и задачи управления". Москва: ИПУ, 2006. С. 101-112.
9. Токманцев Т. Б. О построении оптимального синтеза в задаче управления механической системой на фиксированном отрезке времени // Тр. IX Международ. Четаевской конф. "Аналитическая механика, устойчивость и управление движением". Т. 3. Иркутск: ИДСТУ, 2007. С. 231-239.
10. Субботина H. Н., Токманцев Т. Б. Численная аппроксимация минимаксного решения уравнения Беллмана в задаче Коши с дополнительными ограничениями // Тр. 37-й Региональной молодежной конф. Екатеринбург: УрО РАН, 2006. С. 357-361.
11. Токманцев Т. Б. О некоторых способах обработки и хранения информации при решении задач динамической оптимизации на заданном отрезке времени // Тр. 38-й Региональной молодежной конф. Екатеринбург: УрО РАН, 2007. С. 311-315.
12. Токманцев Т. Б. О численном решении задач оптимального управления предписанной продолжительности // Вестник Тамбовского Университета: Естественные и технические науки. 2007. Т. 12(4). С. 534-535.
13. Субботина H. Н., Токманцев Т. Б. Метод обобщенных характеристик в задаче оптимального управления с липшицевыми входными данными // Известия Института математики и информатики. 2006. С. 141-142.
14. Subbotina N. N., Tokmantsev Т. В. The Method of Characteristics in Macroe-conomic Modeling // Contributions to Game Theory and Management. Vol. 3. St. Petersburg: Graduated School of Management, 2009. Pp. 399-408.
Токманцев Тимофей Борисович
ОБОБЩЕННЫЙ МЕТОД ХАРАКТЕРИСТИК В РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ
Автореферат
Подписано в печать Формат 60x84 1/16. Объем 1 п.л. Тираж 150 экз. Заказ №
Отпечатано в типографии ООО «Издательство УМЦ УПИ» 620078, Екатеринбург, ул. Гагарина, 35а, оф. 2. тел. (343) 362-91-16,362-91-17
Введение
Глава 1. Задача оптимального управления.
1.1. Постановка задачи.
1.2. Предположения.
1.3. Уравнение Беллмана.
1.4. Классические характеристики уравнения Беллмана.
1.5. Свойства функции цены
1.6. Производная Гато.
Глава 2. Задача при ослабленных предположениях.
2.1. Ослабленные предположения.
2.2. Свойства гладкости функции цены.
2.3. Супердифференциал функции цены.
Глава 3. Численная аппроксимация функции цены.
3.1. Алгоритм построения аппроксимации функции цены.
3.2. Оценка численной аппроксимации функции цены.
3.3. Примеры численного построения функции цены.
Глава 4. Построение сеточного оптимального синтеза
4.1. Алгоритм построения сеточного оптимального синтеза.
4.2. Оценки результатов применения сеточного оптимального синтеза
4.3. Примеры численного построения сеточного оптимального синтеза
Глава 5. Задача идентификации макроэкономической модели
5.1. Макроэкономическая модель.
5.2. Задача восстановления динамики макроэкономической модели
5.3. Численный алгоритм решения.
5.4. Численное решение задачи.
Список публикаций
Актуальность работы. Работа посвящена исследованию свойств задачи оптимального управления с фиксированным моментом окончания и роли характеристик уравнения Гамильтона-Якоби-Беллмана в численном решении этой задачи. Предлагается конструкция сеточного оптимального синтеза и исследуется ее эффективность. Разработаны и протестированы на ряде модельных задач оптимального управления программные реализации предложенных алгоритмов. Рассмотрено приложение конструкции сеточного оптимального синтеза к исследованию макроэкономической модели.
Истоки теории оптимального управления восходят к работам JI.C. Понт-рягина [Ij, R. Bellman [2], H.H. Красовского [3], R. Isaacs, W.H. Fleming,
A. Fridman.
Фундаментальный вклад в развитие теории оптимального управления внесли В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко, Б.Н. Пшеничный, H.H. Моисеев, Ф.Л. Черноусько, В.А. Якубович, Ю.Г. Евтушенко, L.D. Berkovitz, А.Е. Bryson, F.H. Clarke, G. Leitmann, Y.-C. Ho, R. Olsder, E.O. Roxin, J. Warga, R.J. Elliott, N.J. Kalton.
Существенное развитие теория получила в работах В.И. Зубова, Ф.М. Кирилловой, Р.Ф. Габасова, В.Ф. Кротова, A.A. Меликяна, A.A. Чи-крия, С.М. Асеева, A.A. Аграчева, Л.Д. Акуленко, A.B. Арутюнова, В.И. Бла-годатских, Н.Л. Григорепко, А.Я. Дубовицкого, A.B. Дмитрука, В.А. Дыхты,
B.И. Жуковского, М.И. Зеликина, А.Д. Иоффе, Ю.С. Ледяева, A.A. Милютина, М.С. Никольского, Г.К. Пожарицкого, Е.С. Половинкина, H.H. Петрова, Л.А. Петросяна, В.М. Тихомирова, Е.Л. Тонкова, В.И. Ухоботова, C.B. Чистякова.
Настоящая работа лежит в рамках концепции оптимального позиционного управления, предложенной и развитой в работах H.H. Красовского [4].
Фундаментальный вклад в развитие теории позиционного управления, наблюдения, оценивания и динамической реконструкции внесли работы Ю.С. Осипова, А.Б. Куржанского, А.И. Субботина, A.B. Кряжимского, А.Г. Ченцова, В.Н. Ушакова, В.Е. Третьякова.
Большую роль в развитии теории оптимального позиционного управления сыграли работы Э.Г. Альбрехта, М.И. Гусева, С.Т. Завалшцина, А.Ф. Клейменова, А.И. Короткого, Е.К. Костоусовой, А.Н. Красовского, Н.Ю. Лукояпова, В.И. Максимова, О.И. Никонова, B.C. Пацко, В.Г. Пиме-нова, А.Н. Сесекина, H.H. Субботиной, A.M. Тарасьева, Т.Ф. Филипповой, А.Ф. Шорикова, В.Я. Джафарова, Х.Г. Гусейнова и их учеников.
Ключевым понятием в теории оптимального позиционного управления является функция цены, которая начальному состоянию управляемой системы ставит в соответствие оптимальный гарантированный результат. Эта функция лежит в основе конструкции оптимального синтеза — оптимального управления по принципу обратной связи.
Как правило, функция цены в рассматриваемых задачах оптимального управления является негладкой. Хорошо известно, что в точках дифферен-цирусмости она удовлетворяет уравнению в частных производных первого порядка (уравнению Гамильтона-Якоби-Беллмана), связанному с изучаемой задачей управления. В современной теории обобщенных решений уравнений Гамильтона-Якоби доказано, что функция цены для задачи управления совпадает с единственным минимаксным/вязкостным [5, 6] решением соответствующей краевой задачи Коши для уравнения Гамильтона-Якоби-Беллмана.
В случае, когда существует классическое (гладкое) решение задачи Коши для уравнения Гамильтона-Якоби-Беллмана, оно может быть построено с помощью классического метода характеристик Коши (см., например, [7, 8]). Этот метод сводит интегрирование уравнения в частных производных первого порядка к интегрированию системы обыкновенных дифференциальных уравнений, решения которой называются характеристиками. Как доказано в работах F.H. Clarke [9], N. Barron [10], S. Mirica [11], H.H. Субботиной [12], использование классических характеристик уравнения Гамильтона—Якоби-Беллмана обеспечивает исследователя необходимыми и достаточными условиями оптимальности в классе программных управлений.
В современной теории обобщенных решений уравнений Гамильтона-Яко-би и соответствующих задач динамической оптимизации рассматриваются различные обобщения понятия характеристики. Новые подходы к определению обобщенных характеристик предложены в работах А.И. Субботина [5], A.B. Куржанского [13], Ю.С. Ледяева [14], A.A. Меликяна [15], В.И. Благо-датских и А.Ф. Филиппова [16], A.A. Толстоногова [17], А.И. Булгакова [18], А. Cellina [19], J.P. Aubin и H. Frankowska [20], G. Haddad [21].
Тем не менее, актуальной задачей остается использование классических характеристик для конструирования обобщенных решений и построения оптимального синтеза в соответствующих задачах оптимального управления.
К настоящему времени разработано большое количество численных методов решения задач оптимального управления (см., например, [22—36] и библиографию к этим работам). Среди них можно выделить две группы методов. К первой относятся методы, нацеленные на построение оптимального программного управления: методы, основывающиеся на решении двухточечной краевой задачи, сле,лующей из принципа максимума Л.С. Понтрягина; методы последовательных приближений; градиентные методы в пространстве управлений, методы, опирающиеся на конструирование областей достижимости. Разработке этих методов посвящены работы Ф.П. Васильева, В.Л. Гаси-лова, В.Б. Костоусова, Ю.И. Бердышева, Ю.Н. Киселева, H.H. Болотника, И.М. Апаньевского, Б.Н. Соколова, Н.В. Баничука, Д.В. Камзолкина и многих других известных математиков.
Упомянем метод, предложенный И.А. Крыловым и Ф.Л. Черноусько [25] для задачи оптимального управления с терминальным функционалом. Метод основан на необходимом условии оптимальности — принципе максимума Понт-рягина. Рассматривается двухточечная краевая задача для управляемой и сопряженной систем. Для вычисления экстремальной траектории и управления применяется метод последовательных приближений.
Вторую группу составляют методы, нацеленные на построение оптимального синтеза, основанные на методе динамического программирования и связанные с решением уравнения Гамильтона-Якоби. Существенный вклад в развитие этого направления внесли работы В.Н. Ушакова, B.C. Пацко, A.M. Тарасьева, А.Г. Пашкова, С.И. Кумкова, A.A. Успенского, P. Souganidis, М. Falcone. Численные алгоритмы конструкций позиционного оптимального управления успешно разрабатывались в работах В.А. Вахрушева, В.Л. Туро-вой, С.С. Кумкова, Д.А. Серкова, Л.Г. Шагаловой, А.П. Хрипунова.
Классический численный метод построения функции цены и оптимального синтеза — метод динамического программирования Р. Беллмана [2, 22]. Он состоит в замене непрерывной задачи ее конечно-разностной аппроксимацией и применении попятной процедуры последовательного решения вспомогательных задач конечномерной минимизации.
H.H. Моисеев предложил [23] модификацию метода динамического программирования для задачи оптимального управления на заданном отрезке времени, который разбивается с заданным шагом. В моменты разбиения задаются сетки в фазовом пространстве, называемые шкалами состояний. Для соседних по времени шкал решаются локальные задачи оптимального управления, где в качестве начальной и конечной точек траектории берутся узлы шкал. Предлагается попятная процедура динамического программирования, использующая последовательно решения вспомогательных локальных задач.
В работах P. Souganidis[24], A.M. Тарасьева, A.A. Успенского, В.Н. Ушакова [37] предложены численные алгоритмы построения функции цены дифференциальной игры. Рассматривая фиктивного второго игрока, можно использовать алгоритм для построения функции цены задачи оптимального управления. Оптимальное позиционное управление строится с помощью метода экстремального прицеливания на множества уровня функции цены. Основой алгоритмов аппроксимации функции цены служат разностные операторы, базирующиеся на построении локальных выпуклых и вогнутых оболочек. Аппроксимация функции цены строится с помощью попятной процедуры на последовательности регулярных но пространству сеток. Получена оценка погрешности метода, имеющая порядок корня квадратного из шага интегрирования.
В работе Д.В. Камзолкина [38] задача оптимального управления с интегрально-терминальным функционалом решается в прямоугольной области [О, Т] х X С Ж. х Мп. Область разбивается на прямоугольные ячейки, каждой из которых ставится в соответствие постоянная величина — значение аппроксимации функции цены, которая подсчитывается согласно репрезентативной формуле функции цены, использующей характеристики уравнения Гамиль-тона-Якоби, приходящие в данную ячейку из заданной области К в конечный момент времени. Погрешность аппроксимации функции цены обратно пропорциональна числу ячеек.
Несмотря на обилие предложенных методов, исследование роли классических характеристик в конструкциях эффективных методов оптимального позиционного управления остается актуальной задачей.
Цели диссертационной работы. Исследование свойств функции цены задачи оптимального управления с непрерывными по времени и дифференцируемыми по фазовой переменной входными данными; разработка и обоснование численных методов аппроксимации функции цены и построения сеточного оптимального синтеза в рассматриваемой задаче оптимального управления на базе классических характеристик уравнения Гамильтона-Якоби-Беллма-на; программная реализация численных методов и решение модельных задач теории оптимального управления; приложение конструкций сеточного оптимального синтеза к анализу модели макроэкономической системы.
Методы исследования. Основным методом исследования является метод характеристик, который является обобщением классического метода Ко-ши для уравнения Гамильтона--Якоби. Для анализа минимаксных решений уравнений Гамильтона-Якоби применяются методы и аппарат негладкого анализа.
Для доказательства оптимальности полученных конструкций применяется необходимое условие - принцип максимума Понтрягипа в форме системы гамильтоновых включений, обоснованное Ф. Кларком [39].
Для разработки численных методов построения обобщенных решений краевых задач для уравнений Гамильтона-Якоби был использован предложенный ранее H.H. Субботиной подход, использующий попятные процедуры динамического программирования и локальную структуру решений в терминах классических характеристик.
При доказательстве утверждений о порядке сходимости численной процедуры построения аппроксимации решения задачи Коши для уравнения Гамильтона-Якоби была получена рекуррентная система оценок. Для ее решения была применена линеаризация и метод теории рекурсии, аналогичный методу решения системы обыкновенных линейных дифференциальных уравнений [40].
Для получения констант в оценке точности данного метода аппроксимации применялся пакет символьных вычислений из системы Matlab.
При программной реализации численных методов использованы методы вычислительной геометрии (триангуляция Делоне, диаграммы Вороного) [41].
Численные методы были реализованы автором в виде программы на языке С++ в среде Microsoft Visual С++ 2008 Express Edition. В программе использовались следующие библиотеки: для общих целей — библиотека BOOST (сайт проекта http://www.boost.org/); для геометрических вычислений в двумерном пространстве — библиотека алгоритмов вычислительной геометрии CGAL (сайт проекта http://www.cgal.org/); для численного интегрирования характеристической системы и использования метода наименьших квадратов — научная библиотека GNU (сайт проекта http://www.gnu.org/software/gsl/); для визуализации результатов — система OpenGL (сайт проекта http://www.opengl.org/); для создания иллюстраций — система преобразования из OpenGL в eps-файлы GL2PS (сайт проекта http://geuz.org/gl2ps/).
Научная новизна. Предложен новый метод решения задачи оптимального управления с фиксированным моментом окончания, при котором для нахождения оптимальных траекторий решается краевая задача Коши, где краевые условия для фазовой и сопряженной переменных заданы в один и тот же конечный момент времени (в отличие от стандартной двухточечной краевой задачи в принципе максимума JT.C. Понтрягина). Предложены новые конструкции численной аппроксимации функции цены и сеточного оптимального синтеза, определенные в узлах адаптивных сеток, лежащих на численных решениях характеристической системы.
Получена оценка точности аппроксимации функции цены, которая линейно зависит от шага интегрирования (в отличие от сеточных методов, использующих равномерные сетки, где оценка точности линейно зависит от корня квадратного из шага интегрирования).
Получена оценка качества управления с помощью сеточного оптимального синтеза (оценка эффективности), которая линейно зависит от шага интегрирования. При оценке эффективности сеточного оптимального синтеза применяется оригинальный подход на базе теории рекурсии.
Новым приложением конструкций сеточного оптимального синтеза является использование их для анализа динамики макроэкономической модели на основе накопленной дискретной статистики.
Теоретическая и практическая ценность. Метод может применяться при решении достаточно широкого класса задач управления, где обеспечены условия существования, единственности и продолжимости классических характеристик.
Структура, объем и краткое содержание диссертации.
Диссертация состоит из введения, 5 глав и библиографии. Общий объем диссертации 110 страниц, включая 28 рисунков. Библиография включает 56 наименований.
1. Понтрягин J1. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. Москва: Наука, 1961.
2. Bellman R. Dynamic Programming. Princeton: Univ. Press, 1957.
3. Красовский H. H. Теория управления движением. Москва: Наука, 1968.
4. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. Москва: Наука, 1974.
5. Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. Москва; Ижевск: Институт компьютерных исследований, 2003.
6. Crandall М. G., Lions P. L. Viscosity solutions of Hamiltion-Jacobi equations // Trans. Amer. Math. Soc. 1983. Vol. 277. Pp. 1-42.
7. Петровский И. Г. Лекции по теории обыкновенных дифференциальных уравнений. Москва: Изд-во МГУ, 1984.
8. Курант Р. Уравнения с частными производными. Москва: Мир, 1964.
9. Clarke F. Н., Vinter R. The relationship between the maximum principle and dynamic programming // S.I.A.M. J. Contr. Optimiz. 1987. Vol. 5. Pp. 1291-1311.
10. Barron E. N., Jensen R. The Pontryagin maximum principle from dynamic programming and viscosity solutions to first-order partial differential equations // Trans. Amer. Math. Soc. 1986. Vol. 298, no. 2. Pp. 635-641.
11. Mirica S. Extending Cauchy's method of characteristics for Hamilton-Jacobi equations // Stud. Cere. Mat. 1985. Vol. 37, no. 6. Pp. 555-565.
12. Subbotina N. N. The method of characteristics for Hamilton-Jacobi equations and applications to dynamical optimization. NY: Springer, 2006.
13. Куржанский А. Б. Избранные труды. Москва: Издательство МГУ, 2009.
14. Bessis D. N., Ledyaev Y. S., Vinter R. B. Dualization of the Euler and Hamil-tonian inclusions // Nonlinear Anal. 2001. Vol. 43. P. 861-882.
15. Меликян А. А. Сингулярные характеристики уравнений в частных производных первого порядка // Доклады РАН. 1996. Т. 382, № 2. С. 203-217.
16. Благодатских В. И., Филиппов А. Ф. Дифференциальные включения и оптимальное управление // Тр. МИАН. 1985. Т. 169. С. 194-252.
17. Толстоногов А. А. Дифференциальные включения в банаховом пространстве. Москва: Наука, 1986.
18. Булгаков А. И. Интегральные включения с невыпуклыми образами и их приложения к краевым задачам дифференциальных включений // Матем. сб. 1992. Vol. 183, по. 10. Pp. 63-86.
19. Aubin J.-P., Celina A. Differential Inclusions. Berlin: Springer-Verlag, 1984.
20. Aubin J.-P., Frankowska H. Set Valued Analysis. Boston: Birkhauser, 1990.
21. Haddad G. Monotone trajectories of differential inclusions and functional-differential inclusions with memory // Israel J. Math. 1981. Vol. 39. Pp. 83-100.
22. Васильев Ф. П. Численные методы решения экстремальных задач. Москва: Наука, 1988.
23. Моисеев Н. Н. Избранные труды. Гидродинамика и механика. Оптимизация, исследование операций и теория управления. Москва: Тайдекс Ко, 2003.
24. Souganidis P. Е. Approximation schemes for viscosity solutions of Hamilton-Jacobi equations //J. Diff. Eqns. 1985. Vol. 59. Pp. 1-43.
25. Черноусько Ф. JI., Баничук H. В. Вариационные задачи мехиники и управления. Москва: Наука, 1973.
26. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. Москва: Наука, 1973.
27. Первозванский А. А., Гайцгори В. Г. Декомпозиция, агрегирование и приближенная оптимизация. Москва: Наука, 1979.
28. Поляк Б. Т. Введение в оптимизацию. Москва: Наука, 1983.
29. Уткин В. И. Скользящие режимы и их применения в системах с переменной структурой. Москва: Наука, 1974.
30. Фрадков А. Л. Кибернетическая физика: принципы и примеры. С.-Петербург: Наука, 2003.
31. Тятюшкин А. И. Многометодная технология оптимизации управляемых систем. Новосибирск: Наука, 2006.
32. Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. Москва: Наука, 1982.
33. Полак Э. Численные методы оптимизации. Единый подход. Москва: Мир, 1974.
34. Нурминский Е. А. Численные методы выпуклой оптимизации. Москва: Наука, 1991.
35. Фурасов В. Д. Задачи гарантированной идентификации. Москва: Бином. Лаборатория знаний, 2005.
36. Марчук Г. И. Методы вычислительной математики. Москва: Наука, 1977.
37. Тарасьев А. М., Успенский А. А., Ушаков В. Н. Аппроксимационные схемы и конечно-разностные операторы для построения обобщенных решений уравнений Гамильтона-Якоби // Изв. РАН. Техн. кибернетика. 1994. Т. 3. С. 173-185.
38. Камзолкин Д. В. Методы решения некоторых классов задач оптимального управления и дифференциальных игр: Кандидатская диссертация / ВМК МГУ им. Ломоносова. 2005.
39. Кларк Ф. Оптимизация и негладкий анализ. Москва: Наука, 1988.
40. Грин Д., Кнут Д. Математические методы анализа алгоритмов. Москва: Мир, 1987.
41. Препарата Ф., Шеймос М. Вычислительная геометрия: Введение. Москва: Мир, 1989.
42. Crandall M. G., Lions P.-L. Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Am. Math. Soc. 1983. Vol. 277:1. Pp. 1-42.
43. Филиппов А. Ф. О некоторых вопросах теории оптимального регулирова-' ния // Вестник Моск. Ун.-та. 1959. № 2. С. 25-32.
44. Болтянский В. Г. Математические методы оптимального управления. Москва: Наука, 1969.
45. Пацко В. С. Поверхности переключения в линейных дифференциальных играх. Екатеринбург: ИММ УрО РАН, 2004.
46. Субботина H. Н. Обобщенный метод характеристик в задаче оптимального управления с липшицевыми входными данными // Изв. УрГУ: Математика и механика. 2006. Т. 4. С. 171-176.
47. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. Москва: Мир, 1979.
48. Варга Д. Оптимальное управление дифференциальными и функциональными уравнениями. Москва: Наука, 1977.
49. Шолохович Ф. А. Лекции по дифференциальным уравнениям. Екатеринбург: Уральское изд-во, 2005.
50. Понтрягин JI. С. Обыкновенные дифференциальные уравнения. Москва: Наука, 1974.
51. Clarke F. Н., Ledyaev Y. S., Stern R. J., Wolensky P. R. Nonsmooth Analysis and Control Theory. NY: Springer, 1998.
52. Субботина H. Н., Колпакова Е. А. Численное решение оптимизационных задач вибрационной механики с помощью метода характеристик // Прикладная математика и механика. 2010. Т. 74(5). С. 832-839.
53. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью. Москва: Наука, 1985.
54. Rockafellar R. Т., Wets R. J.-B. Variational Analysis. NY: Springer, 1997.
55. Джафаров В. Я., Субботина Н. Н. Достаточные условия для непрерывных е-оптимальных обратных связей в задачах управления с терминальной платой // Прикладная математика и механика. 2011. Т. 75(3). С. (в печати).
56. Альбрехт Э. Г. Методика построения и идентификации математических моделей макроэкономических процессов // Электронный журнал "Исследовано в России". 2002. Т. 5. С. 54-86.