Нелокальные улучшения в задачах оптимального управления с терминальными ограничениями тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Трунин, Дмитрий Олегович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Иркутск
МЕСТО ЗАЩИТЫ
|
||||
2009
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
□□34814Э8
На правах рукописи
Трунил Дмитрий Олегович
НЕЛОКАЛЬНЫЕ УЛУЧШЕНИЯ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
01.01.09 - дискретная математика и математическая кибернетика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Иркутск-2009
003481498
Работа выполнена в ГОУ ВПО «Бурятский государственный университет»
Научные руководители
Васильев Олег Владимирович
доктор физико-математических наук, профессор
Булдаев Александр Сергеевич
доктор физико-математических наук, доцент
Официальные оппоненты
Тятюшкин Александр Иванович
доктор технических наук, профессор
Терлецкий Виктор Анатольевич
кандидат физико-математических наук, доцент
Ведущая организация
Институт программных систем им. А.К. Айламазина РАН
Защита состоится 27 ноября 2009 года в 13-00 на заседании диссертационного совета Д 212.074.01 при Иркутском государственном университете по адресу: 664003, г. Иркутск, бульвар Гагарина, 20, Институт математики, экономики и информатики ИГУ.
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (г. Иркутск, бульвар Гагарина, 24).
Автореферат разослан 26 октября 2009 г.
Ученый секретарь диссертационного совета
канд. физ.-мат.наук, доцент -(у/Л ^— В.Г. Антоник
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Задачи оптимального управления с терминальными ограничениями часто встречаются в приложениях и возникают при моделировании физических, химических, медико-биологических, экономических и других процессов. Здесь помимо прямых поточечных ограничений на управление присутствуют ограничения на фазовую траекторию терминального типа.
Наиболее распространенными подходами к решению данного класса задач являются методы штрафов по терминальным ограничениям и методы модифицированных функционалов Лагранжа, сводящие исходную задачу к последовательности задач оптимального управления со свободным правым концом. При этом трудоемкость методов в основном зависит от требуемой точности удовлетворения терминальных ограничений.
Для решения задач оптимального управления со свободным правым концом разработан достаточно широкий спектр итерационных процедур.
Методы, базирующиеся на тех или иных условиях оптимальности и использующие различные аппроксимации элементов задач, развивались в работах A.B. Аргучинцева, В.А. Батурина, О.В. Васильева, Ф.П. Васильева, Р. Габасова, Е.Г. Гольштейна, В.И. Гурмана, В.А. Дыхты, Ф.М. Кирилловой, В.Ф. Кротова, Б.Н. Пшеничного, В.А. Срочко, A.C. Стрекаловского, Н.В. Третьякова, Ф.Л. Черноусь-ко и других исследователей.
Алгоритмическое и программное обеспечение методов оптимального управления вместе с численным решением задач прикладного содержания рассматривалось в работах Р.П. Федоренко, А.И. Тя-тюшкина и других.
Отдельный класс составляют методы на основе полной или частичной дискретизации задач оптимального управления с последующей редукцией к задачам математического программирования (Ю.Г. Евтушенко, Ю.М. Ермольев, H.H. Моисеев, Э. Полак и др.).
В последние годы в работах В.А. Срочко1 и A.C. Булдаева2 разработаны методы нелокального улучшения управлений в классе ли-
1 Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.
2 Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во БГУ, 2008.260 с.
3
нейных и полиномиальных по состоянию задач оптимального управления со свободным правым концом. Эти методы не используют операцию слабого или игольчатого варьирования управлений, что является существенным фактором снижения трудоемкости.
Представляется актуальным распространение данного подхода на класс полиномиальных по состоянию задач оптимального управления с терминальными ограничениями с целью осуществления нелокального улучшения на множестве допустимых управлений с сохранением всех терминальных ограничений.
Целью диссертационного исследования является разработка процедур нелокального улучшения для определенных классов полиномиальных по состоянию задач оптимального управления с терминальными ограничениями.
Основные задачи диссертационного исследования
1. Разработка и обоснование методов нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с частично закрепленным правым концом на основе краевых задач.
2. Разработка и обоснование методов возмущений для решения вспомогательных краевых задач и реализации условий улучшения в созданных процедурах нелокального улучшения.
3. Сравнительный анализ эффективности разработанных и известных методов решения рассматриваемых классов задач.
Общая методика исследования основана на использовании нестандартных формул приращения функционалов задачи, не содержащих остаточных членов, и модификации систем сопряженных переменных, позволяющих свести задачу улучшения управления к краевой задаче. Для решения возникающих краевых задач применяется широко известный в математике подход возмущений.
Основные результаты, выносимые на защиту
1. Показана принципиальная возможность осуществления нелокального улучшения с выполнением всех терминальных ограничений с помощью решения специальной краевой задачи. Эта краевая задача не содержит явно множителей Лагранжа и существенно проще, чем краевая задача принципа максимума.
2. На основе предлагаемых процедур нелокального улучшения получены усиленные по сравнению с принципом максимума необходимые условия оптимальности.
3. Разработаны методы возмущений для решения вспомогательных краевых задач в процедурах нелокального улучшения.
4. Созданы алгоритмы и программы для решения задач оптимального управления с терминальными ограничениями. Проведен сравнительный анализ эффективности разработанных и стандартных численных методов на ряде модельных задач.
Научная новизна
Для линейных и полиномиальных по состоянию задач оптимального управления с терминальными ограничениями разработаны новые процедуры нелокального улучшения с сохранением всех терминальных ограничений. Получены новые необходимые условия оптимальности, дополняющие и усиливающие принцип максимума в рассматриваемых задачах. Построены новые методы возмущений для решения рассматриваемых классов задач. Проведены численные эксперименты с помощью созданных алгоритмов и программ, демонстрирующие эффективность разработанных процедур.
Личный вклад автора состоит в разработке процедур нелокального улучшения допустимых управлений в классе полиномиальных по состоянию задач оптимального управления с терминальными ограничениями; построении методов возмущений для реализаций условий нелокального улучшения и решения вспомогательных краевых задач; проведении численных экспериментов.
Все основные результаты, включенные в диссертацию, являются новыми и получены лично автором.
Теоретическая и практическая значимость
Полученные результаты вносят определенный вклад в теорию и могут быть использованы для создания автоматизированных систем эффективного решения задач оптимального управления с терминальными ограничениями. Предлагаемые подходы открывают новые возможности построения эффективных методов численного решения задач оптимального управления с ограничениями на фазовую траекторию.
Отдельные результаты работы используются при проведении лекций и семинаров для студентов специальности «Прикладная математика и информатика» Бурятского государственного университета и Восточно-Сибирского государственного технологического университета.
Апробация работы
Основные результаты работы докладывались на - 3-й и 4-й Международных конференциях «Математика, информатика и управление» (Иркутск, 2004, 2005);
- 2-й и 3-й Международных конференциях «Математика, ее приложения и математическое образование» (Улан-Удэ, 2005, 2008);
- 13-й Международной Байкальской школе-семинаре «Методы оптимизации и их приложения» (Северобайкальск, 2005);
- 2-й Всероссийской конференции с международным участием «Ин-фокоммуникационные и вычислительные технологии» (Улан-Удэ, 2006);
- 9-й Международной Четаевской конференции «Аналитическая механика, устойчивость и управление движением» (Иркутск, 2007);
- 2-й Международной конференции «Оптимизация и оптимальное управление» (Улан-Батор, Монголия, 2007);
- 9-й школе-семинаре молодых ученых «Математическое моделирование и информационные технологии» (Иркутск-Ангасолка, 2007);
- научных конференциях Института динамики систем и теории управления СО РАН «Ляпуновские чтения» (Иркутск, 2006,2007);
- 4-м Международном симпозиуме «Обобщенные решения в задачах управления» (Улан-Удэ, 2008);
- Международной конференции «Информация и коммуникационные технологии» (Улан-Батор, Монголия, 2009);
- объединенных семинарах Улан-Удэнского филиала Института динамики систем и теории управления СО РАН и Бурятского государственного университета (Улан-Удэ, 2004-2008);
- научном семинаре Института программных систем РАН (Пере-славль-Залесский, 2008);
- научном семинаре по проблемам оптимального управления Иркутского государственного университета (Иркутск, 2008,2009);
- научном семинаре Института динамики систем и теории управления СО РАН (Иркутск, 2008);
- научных конференциях и семинарах Бурятского государственного университета (2001 - 2009).
Некоторые результаты диссертационного исследования вошли в отчеты по грантам Российского фонда фундаментальных исследований (проекты 05-01-00659,07-01-90101, 08-01-00945,09-01-90203). Публикации
По теме диссертации опубликовано 18 работ. Наиболее значимые результаты представлены в работах [1]-[1б]. В число указанных работ входят 3 статьи [1-3] из «Перечня ведущих рецензируемых журналов и изданий ВАК РФ 2008 г.», 2 статьи [4, 5] из «Перечня ведущих рецензируемых журналов и изданий ВАК РФ 2001-2006 гг.», 3
статьи [10, 13, 14] в научных сборниках, 2 статьи [15, 16] в зарубежных журналах, б полных текстов докладов [6-9, 11, 12] в материалах международных и всероссийских конференций. Работы [1-3, 15, 16] выполнены в нераздельном соавторстве с научным руководителем.
Структура н объем работы
Диссертация состоит из введения, трех глав, заключения и списка литературы из 133 наименований. Общий объем работы составляет 102 страницы, включая 6 таблиц и 24 рисунка.
СОДЕРЖАНИЕ РАБОТЫ
Во введении дается обоснование актуальности темы, проводится обзор литературы по численным методам оптимального управления, формулируются задачи диссертационного исследования и приводится краткое содержание диссертации.
В первой главе разрабатываются процедуры нелокального улучшения для полиномиальных по состоянию задач оптимального управления при наличии терминальных ограничений на фазовую траекторию. Предлагаемый подход основывается на точных (без остаточных членов) формулах приращения функционалов. Построенные процедуры позволяют осуществлять итерационный процесс улучшения на множестве допустимых управлений без трудоемкой операции слабого или игольчатого варьирования управления. Нелокальность улучшения обеспечивается за счет решения специальной краевой задачи, которая существенно проще, чем краевая задача принципа максимума.
Общая полиномиальная по состоянию задача оптимального управления с терминальными ограничениями-равенствами сводится с помощью введения дополнительных фазовых переменных к полиномиальной по состоянию задаче с частично закрепленным правым концом.
Предлагаемые методы иллюстрируются на примере квадратичной по состоянию задачи с частично закрепленным правым концом х = /(х,и,0, teT = [t0,t^],
*(*„) = и(()еи,
= {с, *(/,)} —» тт, = / = 1 ,т, т<п.
Функция f(x,u,t) является квадратичной по х и непрерывной по (u,t) на множестве R"xUxT. В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве U czRr
F = еРСГ(Т):u(t)еU, teT}.
Обозначим через x{t,u) фазовую траекторию, соответствующую доступному управлению u = u(t). Введем множество допустимых управлений
W = {uzV-.х^,и) = х;, г =
Составим нормальный функционал Лагранжа с множителями A, eR,i = \,m
m
Рассмотрим функцию Понтрягина
Н (p,x,u,t) = (р, f(x,u,t)),
и обозначим
\Щр, х, u,t) = H (р, х, v,t)-H (р, х, и, t) частное приращение этой функции по управлению.
Введем модифицированную сопряженную систему
p = -Hx(p,x,u,t)-^Hja(p,x,u,t)y,
M'i) = ~4> i = hm,
PJ(ti) = -cj> j = m + \,n.
Для доступных управлений (u°,v) обозначим через p{t,u°,v,X), t б Г решение модифицированной сопряженной системы при и = u°(t), х = x[t,и0), у = x(t,v)~x(t,u°).
В рассматриваемом классе задач имеют место альтернативные точные формулы приращения
А„Ди°Д) = - [ AmH(p(t, u°,v, Л), x{t, v),u°(t),t)dt, (2)
Д = -lAmH(p(t,v,u°,A),x(ty\u°(0,t)dt. (3)
Введем отображение
u(p,x,t) = aigmax.H(p,x,v,t), peR",xeRn,teT.
vcU
Предположим, что u\p,x,t) является кусочно-непрерывной вектор-функцией на множестве R" xRnxT.
Поставим задачу улучшения управления и° е W: найти управление veW с условием Ф(у)<Ф(и°).
Метод, основанный на формуле (2), имеет следующую форму.
Метод нелокального улучшения.
1. Найдем решение (*(0>/?(0)> 1 е Т краевой задачи
x = f(x,u(p,x,t),t), teT, p = -Hxip,x(t,u0),u0(t),t)-
-^Ha(p,x(t,u°),u\t),t)-(x~x(t,u0)), (4)
x(t0) = x°, xi(tl) = x,1, i — \,m,
Pj(ti) = -cJ,j = m + \,n.
2. Сформируем управление
v(t) = u(p(t),x(t),t),teT.
В случае разрешимости краевой задачи (4) показано, что выходные управления обеспечивают улучшение управления и0 с сохранением всех терминальных ограничений.
Краевые задачи улучшения в предлагаемых методах обладают следующими общими свойствами:
1) краевые задачи улучшения проще по свойствам гладкости, чем краевая задача принципа максимума;
2) краевые задачи улучшения для управления и0 е W, удовлетворяющего регулярному принципу максимума, всегда имеют хотя бы одно решение. Неединственность решения дает возможность строгого улучшения управления, удовлетворяющего принципу максимума;
3) в линейной по состоянию задаче оптимального управления (функция f{x,u,t) линейна по х) краевая задача улучшения сводится к системе алгебраических уравнений относительно неизвестных значений сопряженных переменных в конечный момент времени.
Для линейных по управлению задач разрабатываются проекционные методы нелокального улучшения. Нелокальность улучшения в данных процедурах определяется решением непрерывных краевых
задач, которые значительно проще, чем краевая задача принципа максимума.
Проекционные методы демонстрируются в рамках квадратичной по состоянию и линейной по управлению задачи с частично закрепленным правым концом
x = A(x,t)u + b(x,t), teT = [t0, /,],
x(t0) = x°, u(t)eU,
Ф(и) - (с, )) -> min,
*)(/[) = x-, i = 1 ,т, т < п.
Здесь матричная функция A(x,t) и вектор-функция b(x,t) являются квадратичными по х и непрерывными по t на R" х Г, множество U - компактно и выпукло.
Функция Понтрягина в задаче (5) имеет линейную структуру Н(р,х,и,0 = Н0(р,х,0 + (Я,(р,х,0, и), где H0(p,x,t) = (p, ¿0,0), Hl(p,x,l) = A(x,t)Tp.
Для доступного управления и параметра а > 0 введем вектор-функцию
ua{p,x,t) = Pu(u\t) + ccHl(<p,x,t)), peR",xsR", teT,
где Ри - оператор проектирования на множество U в евклидовой норме.
Проекционный метод нелокального улучшения. 1. Найдем решение (x(t),p(t)), teT краевой задачи
x = A(x,t)ua(p,x,t) + b(x,t), teT,
р = -Нх (р, x(t, и0),и0 (0, t)-]-Hxx (р, x(t,u°),u° (/), t)-(х- x(t, и0)),
__ (6)
x(t0) = x°, xl(t1) = xl\ i = \,m,
2. Сформируем управление
Показано, что выходное управление улучшает н° с оценкой
Д тф("°) ^ - — 1ко -(о|2 Л.
а 10
Проекционные процедуры позволяют получить новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач.
Обозначим множество управлений на выходе проекцион-
ного метода улучшения
У1а(и°) = {ие1¥:ы(0 = иа(рЦ,и°,и),х(1,и),/). ? е
Условие В\.
Для оптимальности управления и0 е ¡V необходимо, чтобы и0 являлось единственным управлением на выходе процедуры улучшения для всех а >0, т.е.
для всех а > 0.
Для сравнения приводится принцип максимума.
Для оптимальности управления и0 е IV необходимо, чтобы и0 являлось выходным управлением процедуры улучшения хотя бы для одного а >0, т.е.
ы° е У"(и°).
Понятно, что принцип максимума является следствием условия
Вь
С целью повышения качества разработанных процедур производится их модификация. Соответствующие процедуры строго улучшают любое управление, не удовлетворяющее принципу максимума. Модифицированные процедуры позволяют сформулировать новые условия оптимальности, усиливающие принцип максимума в рассматриваемых классах задач.
В главе приводятся примеры, иллюстрирующие свойство строгого улучшения управления, удовлетворяющего принципу максимума, в т.ч. особого.
Все построенные методы обобщаются на полиномиальные по состоянию задачи оптимального управления с запаздыванием.
Выделим основные особенности предлагаемых процедур:
1) нелокальность улучшения;
2) отсутствие операции слабого или игольчатого варьирования управлений;
3) строгое улучшение управлений, не удовлетворяющих принципу максимума;
4) возможность улучшения неоптимальных управлений, удовлетворяющих принципу максимума.
Во второй главе для решения вспомогательных краевых задач разрабатываются методы возмущений, которые иллюстрируются в рамках квадратичной задачи. Предлагаемый подход возмущений для квадратичной задачи легко обобщается на общий полиномиальный случай.
Подход возмущений иллюстрируется для краевой задачи (6) с одним терминальным ограничением.
Введем возмущенную краевую задачу с параметром е е [0, 1]
х^А(х,1)иа(р,х,0 + Ь(х,(), ¡еТ, р = -Нх{р,х{Ы),и\1), 0-
(7)
М^-С/. { = 2>п-
Исходная краевая задача (6) соответствует значению е = 1. При е = 0 задача называется невозмущенной.
Решение невозмущенной задачи сводится к решению алгебраического уравнения с одним неизвестным параметром.
Для решения возмущенной задачи при фиксированном ¿те(0,1] рассматривается следующий итерационный процесс с индексом к 2:0
хк+]=А{хк+\1)иа{рм,хк+1,» + Ь(хмЛ /еГ,
х'+1(,0) = х°, хГ(0 = х!,
рм=-//х(р*+1,х((У)У(0,0-
рм,(/,) = -с„ ¿ = Х~п.
В качестве начального приближения при к = 0 можно выбрать решение (х°,р°) невозмущенной задачи (г = 0). На каждой итерации процесса (8) решается задача, по трудоемкости аналогичная невозмущенной.
В главе приводятся условия разрешимости возмущенных краевых задач и сходимости итерационных алгоритмов возмущений к их решению.
Рассмотрим вспомогательную краевую задачу
х = А(х, t)ua (р, х, t) + b{x, t), te.T,
x(t0) = x°, xl(tl) = x{, (9)
p = -Hx(p,x(t,u°),u\t),t) + h(t),
PJ{t\) = ~cn У = 2,и, h e C(T).
Задача (9) сводится к алгебраическому уравнению. Сходимость итерационной последовательности (8) к решению возмущенной краевой задачи иллюстрируется следующей теоремой. Теорема 2.1.1 Пусть в задаче (5)
1) совокупность значений фазовых траекторий ограничена, т.е.
x(t,u)eX, we F, teT,
где X a R" — выпуклое компактное множество;
2) краевая задача (9) для достаточно малых а > 0 имеет единственное решение.
Тогда для достаточно малых а> 0 при 0 < s < е = [КМа ] 1, ссМ
К = const > О, М„ = M-—, Mа = const > О, M - const > 0 :
1 -аМ0
1) возмущенная краевая задача (7) имеет единственное решение;
2) итерационная последовательность (8) сходится в норме пространства непрерывных функций [| ■ || к решению возмущенной задачи.
При практических вычислениях итерационный процесс (8) осуществляется до первого улучшения управления м°. Для полученного управления строится новая краевая задача, и итерационный процесс возмущений повторяется.
Второй подход к возмущению краевых задач улучшения основан на возмущении задачи оптимального управления. Подход возмущений иллюстрируется в рамках задачи (5).
Выделим в задаче (5) линейную по состоянию часть и представим ее в форме
x = A0(u,t)x + b0(u,t) + fl(x,u,t), t&T = [t0, /,], x(t0) = x°, u(t) e U,
Ф(и) = (с, x(tl)} min, x, (i, ) = x,1.
Рассмотрим возмущенную задачу оптимального управления с параметром возмущения f е [0, 1]
х = (u,+ ¿0(м,+ ^(х,м,0, teT = [t0, /,],
x(t0)-x°, u(t)eU,
Ф(и) = (с, х(/,)) -» min, х, (t,) = х,1.
Соответствующую функцию Понтрягина
Не (р, х, u,t) = (p,A0{u, t)x + b0 (и, 0 ) + e(p,fx (х, и, 0) назовем возмущенной.
В силу линейности по и возмущенная функция Понтрягина имеет следующую структуру
Не(р,х,и, 0 = #£0 (а x,t) + (Hel (р, х, t),u).
Введем возмущенное отображение и° с помощью следующего соотношения
ift{p,x,t) = Pu(u°(t) + aHtl(p,x,t)), pzR",xeR",t<=T.
Краевую задачу улучшения в возмущенной задаче оптимального управления определим как возмущенную краевую задачу
x = A0(u"(p,xj),t)x + b0(u"(p,x,t),t) + efl(x,u°(p,x,t),t), teT, x(t0) = x\ xl(tI) = x';, (10)
p = -ffex(p,x(t,u°),u0(t),0-
Pi(t\) = -c» i = 2,n.
Значение s - 0 соответствует невозмущенному случаю. При этом невозмущенная краевая задача улучшения сводится к решению алгебраического уравнения с одним неизвестным параметром.
Для решения возмущенной краевой задачи (10) при е > 0 предлагается следующий итерационный процесс с индексом к > 0
+ ' еГ = [*0, л].
хк+\(0) = х°, Х^(11) = х\, (11)
рк+\0 = -сп 1 = 2Я
В качестве начального приближения (х°,р") при к = 0 можно выбрать решение невозмущенной задачи.
Трудоемкость каждой итерации процесса (11) определяется решением одного алгебраического уравнения относительно неизвестного параметра.
Приводится оценка сверху параметра возмущения е > 0, обеспечивающего при определенных условиях сходимость итерационной последовательности (11) к решению задачи (10) при достаточно малых а > 0.
Третий подход возмущений к краевой задаче улучшения (6) основывается на интерпретации проекционного параметра а > 0 как параметра возмущения. Значение а - 0 соответствует нейозмущенной задаче. Для случая а > 0 рассматривается итерационный процесс = А(хш,()иа(рк+',хш,() + Ь(хк+\0, 'еГ = [*0,
хк+\(о) = х°, хк+\и = х\, (12)
рм=-Нх{рк+\х(Ы),и\1),1)~
-\на{рм,х{1,и°),и\1Шхк-х{ии0)),
= 1 = 27п.
Даются условия сходимости итерационной последовательности (12) при достаточно малых а > 0.
Алгоритм возмущений по параметру а > 0 выгодно отличается от алгоритма возмущений с параметром е е [0, 1] тем, что в случае сходимости обеспечивает улучшение управления при любом значении параметра возмущения.
Предлагаемые методы возмущений обобщаются на класс полиномиальных по состоянию задач оптимального управления, в том числе с запаздыванием.
Расчет краевых задач проводится до первого улучшения управления. Далее строится новая краевая задача и алгоритм возмущений. Таким образом, метод возмущений для решения краевых задач порождает в целом метод возмущений для решения задач оптимального управления.
В третьей главе приводятся результаты сравнительного анализа эффективности построенных и известных методов на ряде модельных задач.
В качестве примера рассматривается квадратичная по состоянию задача оптимального введения иммуноглобулинов в рамках простейшей модели иммунного процесса при вирусном заболевании3.
В безразмерной форме управляемая модель имеет вид
х3 = А3х,х2-А5(х3-1), х4 = А6х,-А7х4, ?еГ = [0, х, (0) = х° > 0, х2(0) = 1, х3 (0) = 1, х4 (0) = 0 .
ФоОО^хДЭ-яшп, Ф,(м)= £х4(0Л-т = 0, т> 0.
Переменная х1 = х,(0 характеризует инфекционное начало (вирус), переменные х2 = х2(0, х3 = х3 (/) - защитные силы организма (антитела, плазмоклетки), х4 = х4 (/) - степень поражения организма, А, >0, /=1,8 - постоянные коэффициенты. Начальные условия имитируют ситуацию заражения организма малой начальной дозой вирусов х,° в начальный момент времени = 0.
Управление и(Г)е[о, м], ? е 71 = [0, с, ] характеризует интенсивность введения иммуноглобулинов.
Ставится задача с помощью введения иммуноглобулинов, нейтрализующих вирус, добиться минимальной концентрации вирусов к концу курса лечения на заданном интервале времени.
Интегральное ограничение введением дополнительной переменной по правилу
3 Марчук Г.И. Математические модели в иммунологии. Вычислительные методы и алгоритмы. М.: Наука, 1991. 304 с.
х5=х4, х5(0) = 0 сводилось к терминальному условию.
В итоге рассматривалась квадратичная по состоянию задача с частично закрепленным правым концом
Х5(/,) = И7, /я >0.
Коэффициенты для имитации рассматриваемого процесса имеют следующие значения:
/г, =2, ¿2 =0.8, /¡з =104, /г4 -0.17, Л5 =0.5, Л6 =10, 1ц =0.12, ^ =8, «2 = 0.1.
Начальная доза заражения х,° моделировалась значением Ю-6.
Максимальная интенсивность введения иммуноглобулинов моделировалась значением и = 0.5 . Временной интервал Т выбирался равным 20: г, = 20.
Для решения задачи применялись разработанный проекционный метод нелокального улучшения (МЗ) и метод штрафов с квадратичным по состоянию штрафным функционалом.
Для расчета вспомогательных задач со штрафным функционалом без ограничений на правый конец использовались следующие методы:
1) метод условного градиента (М1)4 с параметрическим поиском улучшающего управления в соответствии с правилом половинного деления;
2) метод игольчатой линеаризации (М2)1 , в котором параметрический поиск улучшающего управления производился по правилу половинного деления.
В качестве начального приближения во всех методах выбиралось и(1) = 0.
В качестве критерия остановки во всех методах выбиралось условие
|ф(г/+1) - Ф(и*)| < 10~5 |ф(и* )|,
где Ф(и) = Ф0(и) + 7Ф?(и) - штрафной функционал, у >0 - параметр штрафа.
4 Васильев О.В. Лекции по методам оптимизации. Иркутск: Изд-во ИГУ,
1994. 344 с.
Таблица 1
Метод Ф; ф; N
М1 2.686698 х 10'" 1.854861 х Ю-5 464
М2 1.142279 х Ю'20 5.844722 хЮ'5 167
МЗ 1.172261 х 10"20 1.534792 х Ю'5 88
В таблице 1 Ф* - расчетное значение целевого функционала задачи, Ф,* - расчетное значение терминального функционала, N -суммарное количество фазовых и сопряженных задач Коши.
Сравнительные результаты расчетов показывают, что в рамках рассматриваемой задачи построенный метод позволяет достигнуть заметного снижения трудоемкости решения по сравнению с известными локальными методами улучшения М1 и М2.
В заключении сформулированы основные результаты работы, ее новизна, теоретическое и практическое значение.
Показана принципиальная возможность осуществления нелокального улучшения на множестве допустимых управлений в классе задач оптимального управления с терминальными ограничениями. Предложенные методы нелокального улучшения позволили сформулировать новые необходимые условия оптимальности, дополняющие и усиливающие принцип максимума в рассматриваемом классе задач. Построены новые методы возмущений для решения рассматриваемых классов задач. Проведены численные эксперименты с помощью созданных алгоритмов и программ, демонстрирующие эффективность разработанных процедур.
Предлагаемые методы обеспечивают нелокальное улучшение допустимых управлений без процедуры слабого или игольчатого варьирования управления с выполнением всех терминальных ограничений задачи и имеют возможность улучшать управления, удовлетворяющие принципу максимума. Трудоемкость нелокального улучшения определяется решением специальных краевых задач, которые существенно проще краевой задачи принципа максимума. Эти свойства являются существенными факторами повышения эффективности решения задач оптимального управления с терминальными ограничениями.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Трунин Д.О. Методы возмущений в квадратичных задачах оптимального управления / A.C. Булдаев, Д.О. Трунин // Автоматика и телемеханика. - 2008. - Т. 69. - №3. - С. 135-145.
2. Трунин Д.О. Метод нелокального улучшения в полиномиальных задачах оптимального управления с терминальными ограничениями / A.C. Булдаев, Д.О. Трунин // Управление большими системами. - М.: Изд-во ИПУ РАН, 2008. - Вып. 22. - С. 51-69.
3. Трунин Д.О. Нелокальное улучшение управлений в линейных по состоянию системах с терминальными ограничениями / A.C. Булдаев, Д.О. Трунин // Автоматика и телемеханика. - 2009. - Т. 70. - №5. - С. 7-12.
4. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с частично закрепленным правым концом / Д.О. Трунин // Вестник Бурятского государственного университета. -Сер. 13. - Улан-Удэ: Изд-во БГУ, 2005. - Вып. 2. - С. 166-169.
5. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с запаздыванием при функциональных ограничениях / Д.О. Трунин // Вестник Бурятского государственного университета. -Сер. 13.-Улан-Удэ: Изд-во БГУ, 2006.-Вып. 3. - С. 162-166.
6. Трунин Д.О. Метод нелокального улучшения управлений в линейных задачах оптимального управления с функциональными ограничениями / Д.О. Трунин // Математика, ее приложения и математическое образование: материалы Всерос. конф. - Улан-Удэ: Изд-во ВСГТУ, 2005. - С. 223-225.
7. Трунин Д.О. Метод фазовой линеаризации в задачах оптимального управления с функциональными ограничениями / Д.О. Трунин // Методы оптимизации и их приложения: тр. 13-й Междунар. Байкальской школы-семинара. - Иркутск: Изд-во ИСЭМ СО РАН, 2005. - Т. 2. - С. 207-213.
8. Трунин Д.О. Проекционные процедуры нелокального улучшения в задачах оптимального управления с терминальными ограничениями / Д.О. Трунин // Инфокоммуникационные и вычислительные технологии: материалы II Всерос. конф. с междунар. участием. - Улан-Удэ: Изд-во БГУ,
2006.-С. 156-161.
9. Трунин Д.О. Метод нелокального улучшения в задачах оптимального управления с терминальными ограничениями / Д.О. Трунин // Аналитическая механика, устойчивость и управление движением: тр. 9-й Междунар. Четаевской конф. - Иркутск: Изд-во ИДСТУ СО РАН, 2007. - Т. 3. - С. 240-246.
10. Трунин Д.О. Метод фазовой линеаризации в задачах оптимального управления с терминальными ограничениями / Д.О. Трунин // Вестник Бурятского государственного университета. - Сер. 6. - Улан-Удэ: Изд-во БГУ,
2007. - С. 45-48.
11. Трунин Д.О. О разрешимости задачи для алгоритма возмущений в нелокальном улучшении в задачах оптимального управления с функциональными ограничениями / Д.О. Трунин // Математика, ее приложения и математическое образование: материалы Всерос. конф. - УлангУдэ: Изд-во ВСГТУ, 2008. - С. 305-310.
12. Трунин Д.О. Модификация метода нелокального улучшения в квадратичных по состоянию задачах оптимального управления с терминальными ограничениями / Д.О. Трунин // Обобщенные решения в задачах управления: материалы IV Междунар. симпозиума, посвящ. 80-летию академика РАН В.А. Ильина. - Улан-Удэ: Изд-во БГУ, 2008. - С. 119-122.
13. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с частично закрепленным правым концом / Д.О. Трунин // Вестник Бурятского государственного университета. - Улан-Удэ: Изд-во БГУ, 2008. - Вып. 9. - С. 56-60.
14. Трунин Д.О. Проекционная процедура нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с терминальными ограничениями / Д.О. Трунин // Вестник Бурятского государственного университета. - Улан-Удэ: Изд-во БГУ, 2009. - Вып. 9. - С. 52-57.
15. Trunin D.O. Method of non-local control improvement in linear optimal control problems with terminal constraints / A.S. Buldaev, D.O. Trunin // Mongolian mathematical journal. 2006. Vol. 10. P. 47-53.
16. Trunin D.O. Non-local improvement method in polynomial optimal control problems with terminal constraints / D.O. Trunin, A.S. Buldaev // Optimization. 2009. Vol. 58. No. 7. P. 771-779.
Свидетельство РПУ-У № 1020300970106 от 08.10.02
Подписано в печать 20.10.09. Формат 60x84 1/16. Усл.печл. 1,2. Тираж 100. Заказ № 541.
Издательство Бурятского госуниверситета 670000, г. Улан-Удэ, ул. Смолина, 24а
Введение
Глава 1. Процедуры нелокального улучшения
1.1. Полиномиальная задача оптимального управления
1.2. Линейная задача оптимального управления
1.3. Проекционные процедуры нелокального улучшения
1.4. Модифицированные процедуры нелокального улучшения
1.5. Задачи с запаздыванием
1.6. Примеры
Глава 2. Методы возмущений
2.1. Метод возмущений краевой задачи улучшения
2.2. Метод возмущений задачи оптимального управления
2.3. Метод проекционных возмущений краевой задачи улучшения
Глава 3. Численные эксперименты
3.1. Вычислительные аспекты
3.2. Управление иммунным процессом
3.3. Управление численностью скота
3.4. Стабилизация вращения спутника
3.5. Задача из электротехники
3.6. Оптимизация рекламной стратегии фирмы
Задачи оптимального управления возникают во многих областях научного знания. Прикладные задачи в области техники [35], [98]-[100], [110], биологии [14, 29, 36, 73, 116, 117], химии [100, 113], медицины [60, 108], а также в экономических и социальных пауках [14, 36, 37, 40, 41, 62, 126] все чаще формулируются как задачи оптимального управления.
Таким образом, актуальность разработки новых численных методов для решения задач оптимального управления обусловлена появлением достаточно большого числа задач прикладного содержания в различных областях естествознания.
Основой численных методов решения задач оптимального управления являются теоретические результаты, связанные с получением необходимых или достаточных условий оптимальности в различных классах задач. Данные методы используют различные конструктивные аппроксимации элементов задачи для построения методов численного решения.
Для решения задач оптимального управления в настоящее время разработано достаточно много различных методов и подходов. Большинство методов являются итерационными, цель итераций в которых состоит в получении лучшего по значению целевого функционала управления (релаксационные итерационные методы).
Традиционной моделью для разработки численных методов решения являются задачи оптршального управления со свободным правым концом. В этих задачах имеется только один (целевой) функционал и присутствуют поточечные ограничения на управление (как правило, простой структуры). Поэтому основные усилия при решении данного класса задач направлены на построение процедур улучшения целевого функционала, так как обеспечение допустимости управления здесь ие представляет принципиальных затруднений. i
Для решения указанного класса задач можно выделить методы последовательного улучшения управлений с использованием той или иной техники варьирования.
1. Градиентные методы развивались в работах О.В. Васильева, Ф.П. Васильева, В.А. Срочко, Р.П. Федоренко, А.С. Антипина pi других исследователей [5, 24, 25, 27, 74, 79, 100, 107, 132, 133].
2. Методы на основе принципа максимума JI.C. Понтрягина получили свое развитие в работах А.В. Аргучинцева, О.В. Васильева, Ф.П. Васильева, В.В. Дикусара, А.И. Егорова, Н.Е. Кирина, И.А. Крылова, А.А. Любушина, А.А. Милютина, В.А. Срочко, А.И. Тятюшкина, В.А. Терлец-кого, Р.П. Федоренко, Ф.Л. Черноусько и других исследователей [3, б, 17], [24]-[27], [39, 44, 52, 57, 59, 61, 74, 75, 100, 104, 118].
Следующую группу методов составляют методы на основе достаточных условий оптимальности В.Ф. Кротова [56]. Данные методы развивались в работах В.А. Батурина, В.И. Гурмана, В.А. Дыхты, В.Ф. Кротова, И.В. Расиной, Д.Е. Урбаиовича и других исследователей [14], [35]-[37], [40, 41, 56].
Следующий обширный класс методов составляют методы на основе полной или частичной дискретизации с последующей редукцией к задачам математического программирования, для решения которых разработаны эффективные численные методы. Данное направление получило развитие в работах Ю.Г. Евтушенко, Ю.М. Ермольева, Н.Н. Моисеева, Э. Полака, Б.Н. Пшеничного, Ю.М. Данилина, Ф.Л. Черноусько и других исследователей [43, 46, 51, 63, 67, 71, 103, 104, 127].
Методы решения задач с импульсными управлениями и разрывными траекториями развивались в работах Л.Т. Ащепкова, В.А. Дыхты, О.Н. Самсонюк и других исследователей [10, 40, 41, 101, 106].
Отдельную группу методов поиска позиционных оптимальных управлений для линейных и других классов систем, составляют методы в работах Р. Габасова, Ф.М. Кирилловой [11], [30]-[33].
Методы поиска глобального решения в певыпуклых задачах оптимизации развиваются в работах А.С. Стрекаловского [82]-[84], [114,121], [128]-[130].
Алгоритмическое и программное обеспечение методов оптимального управления вместе с численным решением тестовых и модельных задач рассмотрены в работах В.А. Батурина, В.И. Гурмана, В.А. Дыхты, Ю.Г. Евтушенко, А.И. Тятюшкина, А.Ю. Горнова, Р.П. Федоренко и других исследователей [14, 36, 37, 41, 43], [98]-[100].
Принцип максимума Понтрягина [68, 69] позволяет редуцировать исходную задачу оптимального управления к двухточечной краевой задаче для системы обыкновенных дифференциальных уравнений с разрывной правой частью (краевая задача принципа максимума). Вопросы существования и единственности решения таких систем рассматриваются в [101].
Теория решения дифференциальных уравнений с запаздыванием развивалась в работах [64, 105].
Для решения краевой задачи принципа максимума разработаны стандартные численные методы [15, 38, 55, 58, 66. 72, 111, 115, 120, 122].
Вопросы программной реализации основных численных методов интегрирования обыкновенных дифференциальных уравнений обстоятельно рассмотрены в работах [9, 12, 13, 102].
В работах [65, 109, 124] исследованы возможности применения методов возмущений для численного решения задач математической физики. Методы возмущений применительно к решению задач оптимального управления исследованы в работе А.С. Булдаева [20].
Основой методов возмущений является введение малого параметра (параметра возмущения) в исследуемую задачу таким образом, чтобы при некотором (нулевом) значении параметра задача (невозмущенная задача) имела достаточно простое решение Для решения возмущенной задачи при фиксированном ненулевом значении параметра возмущения конструируются итерационные процессы, на каждой итерации которых решается задача, по трудоемкости эквивалентная невозмущенной задаче. При этом в качестве начального приближения итерационного процесса обычно выбирается решение возмущенной задачи, полученное при меньшем значении параметра возмущения.
Достоинством методов возмущений является вычислительная устойчивость расчета, обусловленная поочередпым численным интегрированием фазовой ("слева-направо") и сопряженной ("справа - налево") задач Коши на каждой итерации методов.
Отметим, что основные вычислительные затраты при использовании стандартных численных методов оптимального управления дает организация процедуры варьирования управлений для обеспечения улучшения целевого функционала. При этом процедура игольчатого варьирования управлений может приводить к получению труднореализуемого па практике управления (например, наличие участков частого переключения управления с минимального на максимальное значение). Следует также отметить, что сходимость указанных методов по невязке принципа максимума делает невозможным улучшение управлений, удовлетворяющих принципу максимума.
В работах В.А. Срочко и его учеников [74]-[80] разработаны методы улучшения управлений, основанные на использовании фазовых вариаций функционалов задачи с использованием специальной техники варьирования. Конструкции соответствующих методов обеспечивают более высокий порядок аппроксимации, что определяет повышенную эффективность разрабатываемых методов. В классе линейно-квадратичных задач оптимального управления эти методы обладают свойством нелокальности улучшения, что является существенным фактором в плане снижения вычислительных затрат на каждое улучшение.
Прикладные задачи, возникающие при моделировании естественнонаучных и социальных процессов, часто приводят к постановкам задач оптимального управления с дополнительными ограничениями на фазовую траекторию. Здесь помимо прямых поточечных ограничений на управление присутствуют ограничения на фазовую траекторию, в том числе терминального типа. В связи этим множество допустимых управлений в данном классе задач имеет значительно более сложную структуру, чем в задаче оптимального управления со свободным правым концом. Здесь недостаточно улучшить целевой функционал: следует также обеспечить допустимость соответствующего управления.
Наиболее распространенными подходами к решению данного класса задач являются методы штрафов ([1, 14, 24, 27, 35], [98]-[100] и др.) по г функциональным ограничениям и методы модифицированных функционалов Лагранжа [16, 34, 98; 99], сводящие исходную задачу к последовательности задач оптимального управления со свободным правым концом. При этом трудоемкость методов определяется требуемой точностью удовлетворения функциональных ограничений.
Теоретические основы численных методов решения задач оптимального управления с ограничениями на фазовую траекторию разрабатывались в работах [4, 7, 8], [47]-[50], [74]-[76], [107].
В последние годы в работах В.А. Срочко [74], [80] и А.С. Булдаева [18]
20] разработаны методы нелокального улучшения управлений в классе линейных и полиномиальных по состоянию задач оптимального управления со свободным правым концом. Эти методы не используют операцию слабого илп игольчатого варьирования управлений, что является существенным фактором снижения трудоемкости. Представляется актуальным распространение данного подхода на класс линейных и полиномиальных по состоянию задач оптимального управления с функциональными ограничениями с целью осуществления нелокального улучшения на множестве допустимых управлений с сохранением всех функциональных ограничений.
В диссертации впервые разработаны методы нелокального улучшения в классе полиномиальных по состоянию задач оптимального управления с функциональными ограничениями, в том числе с запаздыванием, с сохранением всех функциональных ограничений на каждой итерации. Получены новые необходимые условия оптимальности, дополняющие и усиливающие принцип максимума в рассматриваемом классе задач. Проанализированы условия разрешимости возникающих краевых задач и построены алгоритмы возмущений для реализации условий нелокального улучшения. Сформулированы условия и доказаны соответствующие теоремы о сходимости методов к решению возмущенных задач. Созданы алгоритмы и программы, проведен сравнительный анализ эффективности разработанных и стандартных численных методов решения задач оптимального управления на ряде тестовых и модельных задач.
Целью диссертационного исследования является разработка процедур нелокального улучшения для определенных классов полиномиальных по состоянию задач оптимального управления с терминальными ограничениями.
Основные задачи диссертационного исследования:
1. Разработка и обоснование методов нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с частично закрепленным правым концом на основе краевых задач;
2. Разработка и обоснование методов возмущений для решения вспомогательных краевых задач и реализации условий улучшения в созданных процедурах нелокального улучшения;
3. Сравнительный анализ эффективности разработанных pi известных методов решения рассматриваемых классов задач.
Диссертация состоит из введения, трех глав, заключения и списка литературы, включающего 133 наименования.
Все основные результаты, включенные в диссертацию, являются новыми и получены лично автором.
Теоретическая и практическая значимость.
Полученные результаты вносят определенный вклад в теорию и могут быть использованы для создания автоматизированных систем эффективного решения задач оптимального управления с терминальными ограничениями. Предлагаемые подходы открывают новые возможности построения эффективных методов численного решения задач оптимального управления с ограничениями на фазовую траекторию.
Отдельные результаты работы используются при проведения лекций и семинаров для студентов специальности "Прикладная математика и информатика" Бурятского государственного университета и Восточно-Сибирского государственного технологического университета.
Некоторые результаты являются частью исследований в рамках грантов РФФИ (проекты 05-01-00659, 07-01-90101, 08-01-00945).
Заключение
В работе получены следующие основные результаты.
1. Показана принципиальная возможность осуществления нелокального улучшения с выполнением всех терминальных ограничений с помощью решения специальной краевой задачи. Эта краевая задача не содержит явно множителей Лагранжа и существенно проще, чем краевая задача принципа максимума.
2. На основе предлагаемых процедур нелокального улучшения получены усиленные по сравнению с принципом максимума необходимые условия оптимальности.
3. Разработаны методы возмущений для решения вспомогательных краевых задач в процедурах нелокального улучшения.
4. Созданы алгоритмы и программы для решения задач оптимального управления с терминальными ограничениями. Проведен сравнительный анализ эффективности разработанных и стандартных численных методов на ряде модельных задач.
Научная новизна.
Для линейных и полиномиальных по состоянию задач оптимального управления с терминальными ограничениями разработаны новые процедуры нелокального улучшения с сохранением всех терминальных ограничений. Получены новые необходимые условия оптимальности, дополняющие и усиливающие принцип максимума в рассматриваемых задачах. Построены новые методы возмущений для решения рассматриваемых классов задач. Проведены численные эксперименты с помощью созданных алгоритмов и программ, демонстрирующие эффективность разработанных процедур
Личный вклад автора.
Разработаны процедуры нелокального улучшения допустимых управлений в классе полиномиальных по состоянию задач оптимального управления с терминальными ограничениями, построены методы возмущений для реализации условий нелокального улучшения и решения вспомогательных краевых задач, проведены численные эксперименты.
1. Аваков Е.Р., Арутюнов А.В., Измайлов А.Ф. Точные штрафы для задач оптимизации с 2-регулярными ограничениями-равенствами //Ж. вычисл. матем. и матем. физ,- 2008 - Т. 48 - № 3 - С. 365-372.
2. Александров В.М. Итерационный метод вычисления в реальном времени оптимального но быстродействию управления //Сибирский журнал вычислительной математики.- 2007 Т. 10.- №1.- С. 1-28.
3. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление М.: Наука, 1979 - 432 с.
4. Антипин А.С., Васильев Ф.П. Методы регуляризации для решения неустойчивых задач равновесного программирования со связанными ограничениями //Ж. вычисл. матем. и матем. физ 2005.- Т. 45 - № 1.- С. 27-40.
5. Антоник В.Г., Срочко В.А. Вопросы сравнительной эффективности методов градиентного типа в задачах оптимального управления Серия: Оптимизация и управление.- Вып. 9. - Иркутск: Изд-во ИГУ, 2003. - 40 с.
6. Аргучинцев А.В.,"Васильев О.В. Итерационные процессы принципа максимума и их модификации в системах с распределенными параметрами // Дифференц. уравнения.- 1996.- Т. 32 №6.- С. 797-803.
7. Арутюнов А.В. Условия экстремума. Нормальные и вырожденные задачи.- М.: Факториал, 1997 256 с.
8. Арутюнов А.В., Тынянский Н.Т. О принципе максимума в задаче с фазовыми ограничениями //Изв. АН СССР. Сер. техн. кибернетика.-1984.- № 4 С. 60-68.
9. Арушанян О.Б., Залеткин С.В. Численное решение обыкновенных дифференциальных уравнений на Фортране М.: Изд-во МГУ, 1990.336 с.
10. Ащепков JI.T. Оптимальное управление разрывными системами.- Новосибирск: Наука, 1987 225 с.
11. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Вычисление оптимальных программы и управления в линейной задаче с фазовым ограничением //Ж. вычисл. матем. и матем. физ.- 2005.- Т. 45.- №12.- С. 2112-2150.
12. Бартеньев О.В. Современный Фортран М.: Диалог-МИФИ, 2000448 с.
13. Бартеньев О.В. Фортран для профессионалов. Математическая библиотека IMSL. Ч. 3.- М.: Диалог-МИФИ, 2001- 368 с.
14. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения Новосибирск: Наука, 1997 - 175 с.
15. Бахвалов Н.С., Жидков Н.П., Кобельков Г.М. Численные методы.-М.: Наука, 1987.- 600 с.
16. Бертсекас Д. Условная оптимизация и методы множителей Лагранжа.- М.: Радио и связь, 1987 400 с.
17. Болдырев В.И. Метод кусочно-линейной аппроксимации для решения задач оптимального управления //Дифференциальные уравнения и процессы управления 2004 - М - С. 28-123.
18. Булдаев А.С. Процедуры нелокального улучшения в полиномиальных по состоянию системах управления- Сер. "Оптимизация и управление".- Вып. 7 Иркутск: Изд-во ИГУ, 2002. - 46 с.
19. Булдаев А.С. Проекционные процедуры нелокального улучшения линейно управляемых процессов // Изв. вузов. Математика.- 2004-№ 1,- С. 18-24.
20. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем.- Улан-Удэ: Изд-во БГУ, 2008.- 260 с.
21. Булдаев А.С., Трунин Д.О. Методы возмущений в квадратичных задачах оптимального управления // Автоматика и телемеханика 2008.Т. 69.- № 3.- С. 135-145.
22. Булдаев А.С., Трунин Д.О. Метод нелокального улучшения в полиномиальных задачах оптимального управления с терминальиыми ограничениями //Управление большими системами 2008.- Вып. 22.-С. 51-69.
23. Булдаев А.С., Трунин Д.О. Нелокальное улучшение управлений в линейных по состоянию системах с терминальными ограничениями // Автоматика и телемеханика. 2009. Т. 70. №5. С. 7-12.
24. Васильев О.В. Лекции по методам оптимизации.- Иркутск: Изд-во ИГУ, 1994.- 344 с.
25. Васильев О.В., Срочко В.А., Терлецкий В.А. Методы оптимизации и их приложения 4.2. Оптимальное управление. Новосибирск: Наука, 1990.- 151 с.
26. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Ж. вычисл. матем. и матем. физ.- 1981.- Т. 21.- №6.- С. 1376-1384.
27. Васильев Ф.П. Численные методы решения экстремальных задач М.: Наука, 1980 - 418 с.
28. Вержбицкий В.М. Основы численных методов.- М.: Высшая школа, 2002.- 840 с.
29. Вольтерра В. Математическая теория борьбы за существование М.: Наука, 1976.- 286 с.
30. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов М.: Наука, 1971.- 508 с.
31. Габасов Р., Кириллова Ф.М. Оптимизация линейных систем.- Минск: Белорус.гос.ун-т, 1973 248 с.
32. Габасов Р., Кириллова Ф.М. Методы оптимизации.- Минск: Белорус.гос.ун-т, 1981.- 350 с.
33. Габасов Р., Кириллова Ф.М. Особые оптимальные управления М.: Наука, 1973.- 256 с.
34. Голынтейн Б.Г., Третьяков Н.В. Модифицированные функции Лагранжа- М.: Наука, 1989 400 с.
35. Гурман В.И. Принцип расширения в задачах управления.- М.:Наука, Физматлит, 1997 288 с.
36. Гурман В.И., Батурин В.А. Математические модели управления природными ресурсами.- Иркутск: Изд-во ИГУ, 1987.- 112 с.
37. Гурман В.И., Батурин В.А., Расина И.В. Приближенные методы оптимального управления Иркутск.: Изд-во ИГУ, 1983 - 180 с.
38. Джумамбаев Д.С., Темешева С.М. Метод параметризации решения нелинейных двухточечных краевых задач // Ж. вычисл. матем. и ма-тем. физ,- 2007.- Т.47 №1.- С.39-63.
39. Дикусар В.В., Милютин А.А. Качественные и численные методы в принципе максимума М.: Наука, 1989.- 144 с.
40. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных процессов.- Иркутск: Изд-во ИГЭА, 1995.- 186 с.
41. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями.- М.: Физматлит, 2000.- 255 с.
42. Дыхта В.А, Антипина Н.В., Самсонюк О.Н. Оптимальное управление в экономике: простейшие модели. Иркутск: Изд-во ИГУ, 1998 - 115 с.
43. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации.- М.: Наука, 1982.- 432 с.
44. Егоров А.И. Основы теории управления.- М.:Физматлит, 2004.- 504 с.
45. Егоров А.И. Обыкновенные дифференциальные уравнения с приложениями.- М.:Физматлит, 2005.- 384 с.
46. Ермольев Ю.М., Гуленко В.П., Царенко Т.И. Конечно-разностный метод в задачах оптимального управления.- Киев: Наукова думка, 1978.163 с.
47. Карамзин Д.Ю. К теории принципа максимума в задачах с фазовыми ограничениями //Вестник МГУ. Сер. 15. Вычисл. матем. и кибернетика 2002 - № 4.- С. 23-31.
48. Карамзин Д.Ю. Принцип максимума и необходимые условия второго порядка в задаче оптимального управления с фазовыми ограничениями //Теор. и прикл. задачи нелинейного анализа М.:ВЦ РАН, 2005.-С. 76-112.
49. Карамзин Д.Ю. Принцип максимума в задаче управления при ограниченных фазовых координатах //Автоматика и телемеханика.- 2007. -№ 2 С. 26-38.
50. Карамзин Д.Ю. Необходимые условия экстремума в.задаче управления с фазовыми ограничениями //Ж. вычисл. матем. и матем. физ.-2007,- Т. 47.- № 7,- С. 1123-1150.
51. Карманов В.Г. Математическое программирование.-М.: Наука, 1986285 с.
52. Кирин Н.Е. Вычислительные методы теории оптимального управления.- Л.: Изд-во ЛГУ, 1968.- 144 с.
53. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа М.:Наука, Гл. ред. физ.-мат.лит, 1989.- 624 с.
54. Коул Дж. Методы возмущений в прикладной математике М.: Мир. 1972.- 274 с.
55. Красников С.Д., Кузнецов Е.Б. Параметризация численного решения краевых задач для нелинейных дифференциальных уравнений //Ж. вычисл. матем. и матем. физ 2005 - Т. 45 - № 12 - С. 2148-2158.
56. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления.- М.: Наука, 1973.- 448 с.
57. Крылов И.А., Черноусько Ф.Л. О методе последовательных приближений для решения задач оптимального управления // Ж. вычисл. матем. и матем. физ 1962,- Т. 2 - №6 - С. 1132-1138.
58. Лионе Ж.Л. Некоторые методы решения нелинейных краевых задач.-М.: Мир, 1972 587 с.
59. Любушин А.А., Черноусько Ф.Л. Метод последовательных приближений для расчета оптимального управления // Изв. АН СССР. Техн. кибернетика 1983,- №2,- С. 147-159.
60. Марчук Г.И. Математические модели в иммунологии. Вычислительные методы и алгоритмы.- М.: Наука, 1991.- 304 с.
61. Милютин А.А., Илютович А.Е., Осмоловский Н.П., Чуканов С.В. Оптимальное управление в линейных системах.- М.:Наука, 1993.- 268 с.
62. Михайлов А.П. Моделирование системы " власть-общество".-М.:Физматлит, 2006.- 144 с.
63. Моисеев Н.Н. Элементы теории оптимальных систем М.: Наука, 1975.- 488 с.
64. Мышкис А.Д. Линейные дифференциальные уравнения с запаздывающим аргументом М.: Наука, 1972.
65. Найфэ А.Х. Методы возмущений М.:Мир, 1976.- 455 с.
66. Ортега Дж., Пул У. Введение в численные методы решения дифференциальных уравнений.- М.: Мир, 1986 288 с.
67. Полак Э. Численные методы оптимизации. Единый подход.- М.: Мир, 1974.- 376 с.
68. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов.- М.: Наука, 1976392 с.
69. Понтрягин JI.С. Принцип максимума в оптимальном управлении.- М.: Едиториал УРСС, 2004,- 64 с.
70. Пропой А.И. Элементы теории оптимальных дискретных процессов.-М.: Наука, 1973.- 255 с. .
71. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных задачах.- М.: Наука, 1975 319 с.
72. Самарский А.А., Гулин А.В. Численные методы.- М.: Наука, 1989432 с.
73. Свирежев Ю.М., Логофет Д.О. Устойчивость биологических сообществ.- М.: Наука, 1978.- 352 с.
74. Срочко В.А. Итерационные методы решения задач оптимального управления.- М.: Физматлит, 2000.- 160 с.
75. Срочко В.А. Вариационный принцип максимума и методы линеаризации в задачах оптимального управления.- Иркутск: Изд-во ИГУ, 1989.- 160 с.
76. Срочко В.А. Применение принципа максимума для численного решения задач оптимального управления с терминальными ограничениями // Кибернетика.- 1986.- №1 С. 73-77.
77. Срочко В.А. Модернизация методов градиентного типа в задачах оптимального управления // Изв. вузов. Математика.- 2002.- №12 С. 66-78.
78. Срочко В.А., Пудалова Е.И. Методы нелокального улучшения допустимых управлений в линейных задачах с запаздыванием // Изв. вузов. Математика 2000 - №12 - С. 78-88.
79. Срочко В.А., Ушакова С.Н. Метод полной квадратичной аппроксимации в задачах оптимального управления // Изв. вузов. Математика2004.- №1- С. 87-93.
80. Срочко В.А., Ушакова С.Н. Метод билинеаризации для решения задач оптимизации программных управлений //Изв. вузов. Математика.2005,- №12.- С. 63-69.
81. Срочко В.А. Некоторые вопросы численного интегрирования разрывных систем // Труды Второй Восточно-Сибирской зональной межау-зовской конференции по математике и проблемам ее преподавания в вузе.- ИркутскЖ Изд-во ИГПУ, 2003 С.206-208.
82. Стрекаловский А.С. О поиске глобального максимума выпуклого функционала на допустимом множестве //Ж. вычисл. матем. и матем. физ 1993.- Т. 33,- №3.- С.9-13.
83. Стрекаловский А.С. Элементы невыпуклой оптимизации Новосибирск: Наука, 2003.- 356 с.
84. Стрекаловский А.С. Задачи оптимального управления с терминальными функционалами, представимыми в виде разности двух выпуклых функций //Ж. вычисл. матем. и матем. физ.- 2007.- Т. 47.- №11.-С.1865-1879.
85. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с частично закрепленным правым концом. -Вестник Бурятского государственного университета.- Сер. 13 . Вып. 2. - Улан-Удэ: Изд-во БГУ, 2005.- С. 166-169.
86. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с запаздыванием при функциональных ограничениях.- Вестник Бурятского государственного университета-Сер. 13 .- Вып. 3.- Улан-Удэ: Изд-во БГУ, 2006.- С. 162-166.
87. Трунин Д.О. Метод фазовой линеаризации в задачах оптимального управления с функциональными ограничениями// Труды 13-й Международной Байкальской школы-семинара "Методы оптимизации и их приложения".- Иркутск: Изд-во ИСЭМ СО РАН, 2005.- Т. 2,- С. 207213.
88. Трунин Д.О. Метод фазовой линеаризации в задачах оптимального управления с терминальными ограничениями Вестник БГУ- Сер.6 .- Улан-Удэ: Изд-во БГУ, 2007,- С. 45-48.
89. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов при терминальных ограничениях // Материалы конференции "Ляпуновские чтения".- Иркутск: Изд-во ИДСТУ СО РАН, 2007.- С. 35.
90. Трунин Д.О. Нелокальное улучшение квадратичных по состоянию управляемых процессов с частично закрепленным правым концом.-Вестник Бурятского государственного университета Вып. 9.- Улан-Удэ: Изд-во БГУ, 2008.-С. 56-60.
91. Трунин Д.О. Проекционная процедура нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с терминальными ограничениями // Вестник Бурятского государственного университета. Вып. 9. Улан-Удэ: Изд-во БГУ, 2009. С. 52-57.
92. Тятюшкин А.И. Численныё методы и программные средства оптимизации управляемых систем.- Новосибирск: Наука, 1992 192 с.
93. Тятюшкин А.И. Многометодная технология оптимизации управляемых систем Новосибирск: Наука, 2006.- 343 с.
94. Федоренко Р.П. Приближенное решение задач оптимального управления М.: Наука, 1978 - 486 с.
95. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью М.: Наука, 1985 - 222 с.
96. Форсайт Дж., Мальколм М., Моулер К. Машинные методы математических вычислений М.: Мир, 1980.- 280 с.
97. Черноусько Ф.Л. Оценивание фазового состояния динамических систем.- М.: Наука, 1988.- 320 с.
98. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. Численные методы.- М.:Наука, 1973.- 283 с.
99. Эльсгольц Л.Э., Норкин С.Б. Введение в теорию дифференциальных уравнений с отклоняющимся аргументом.- М.: Наука, 1971.- 296 с.
100. Alvarez L. A Glass of Solvable Impulse Control Problems //Applied mathematics and optimization. 2004. Vol. 49. N 3. P. 265-295.
101. Antipin A.S. A gradient-type method for the equilibrium programming problem with coupled constraints //Yugo-slav J. Operat. Res. 2000. Vol. 10. P. 163-184.
102. Behncke H. The control of deterministic epidemics //Math. Appl. Sci. 1993. Vol. 3. P. 298-311.
103. Bonnans J.F., Shapiro A. Perturbation analysis of optimization problems. New York:Springer, 2000.
104. Bonnard В., Faubourg L., Launay G., Trelat E. Optimal Control with State Constraints and the Space Shuttle Re-entry Problem //Journal of dynamical and control systems. 2003. Vol. 9. N 2. P. 155-199.
105. Borevich E.Z. . Chistyakov V. M. Nonlinear Boundary Value Problems Describing Mobile Carrier Transport in Semiconductor Devices //Applications of mathematics. 2001. Vol. 46. N 5. P. 383-400.
106. Buldaev A.S., Trunin D.O. Method of non-local control improvement in linear optimal control problems with terminal constraints //Journal of Mongolian mathematical society. 2006. Vol. 10. P. 47-53.
107. Chipot M., Muniz M. A Free Boundary Problem Modelling the Electrolysis of Aluminium //Applied mathematics and optimization. 2002. Vol. 47. N 3. P. 231-252.
108. Egozcue J., Meziat R., Pedregal P. From a Nonlinear, Nonconvex Variational Problem to a Linear, Convex Formulation //Applied mathematics and optimization. 2002. Vol. 47. N 1. P. 27-44.
109. Eloe P.W. Maximum principles for a family of nonlocal boundary value problems// Advances in Difference Equations. 2004. N. 3. P. 201-210.
110. Haltar D., Mend-Amar M. The optimization model of exploitation of herd //Journal of Mongolian mathematical society. 2001. Vol. 5. P. 121-130.
111. Haltar D., Ankhbayar G., Demberel S. Optimal harvesting policis in models of animal population //Journal of Mongolian mathematical society. 2004. Vol. 8. P. 52-62.
112. Hartl R.F., Sethi S.P., Vickson R.G. A survey of the maximum principle for optimal control problems with state constraints //SIAM Rev. 1995. Vol. 37. P. 181-218.
113. Hlavacek I., Krizek M, On Exact Results in the Finite Element Method //Applications of mathematics. 2001. Vol. 46. N 6. P.467-478.
114. Jankowski T. Boundary Value Problems for Systems of Functional Differential Equations //Applications of mathematics. 2002. Vol. 47. N 5. P.427-458
115. Jongen H„ Stein O, Nonconvex Optimization: Gradient Flows and Deformation //Journal of dynamical and control systems 2001. Vol. 7. N 3. P.425-446.
116. Kubacek L. Linear Versus Quadratic Estimators in Linearized Models //Applications of mathematics. 2004. Vol. 49. N 2. P. 81-95.
117. Roberts S.M., Shipman J.S. Two-point boundary value problems: shooting methods. New York:Elsevier, 1972.
118. Sari T. Zerizer T. Perturbations for linear difference equations //Journal ofMathematical Analysis and Applications. 2005. N. 1, P. 43-52.
119. Schwartz A., Polak E, Chen Y. RIOTS95: A Matlab toolbox for solving optimal control problems: Manual.
120. Sethi S.P., Thomson G.L. Optimal control theory. Applications to management science. USA, Boston, 1981.- 370 p.
121. Shu C.-W. Total-variation-diminishing time discretizations//SIAM J. Sci. Statist. Comput. 1988. Vol. 9. N 6. P. 1073-1084.
122. Strekalovsky A.S., Tsevendorj I. Testing the R-strategy for a reverse convex problem //J. Global Optimizat. 1998. Vol. 13. N 1. P. 61-74.
123. Strekalovsky A.S., Vasiliev I.L. On global search for non-convex optimal control problems //Developments Global Optimization Nonconvex Optimizat. and Its Applic. Dordrecht:Kluwer Acad. Publ., 1997. P. 121133.
124. Strekalovsky A.S. On global maximum of a convex terminal functional in optimal control problems //J. Global Optimizati. 1995. N 7. P. 75-91.
125. Trunin D.O., Buldaev A.S. Non-local improvement method in polyno-mial optimal control problems with terminal constraints // Optimization. 2009. Vol. 58. No. 7. P. 771-779.
126. Vasiliev O.V. Optimization methods— World Federation Publishers Company, Atlanta, USA, 1996 276 p.
127. Zerrik E., Ghafrani F. Regional Gradient-Constrained Control Problem. Approaches and Simulations// Journal of dynamical and control systems. 2003. Vol. 9. N 4. P. 585-599.