Методы поиска и улучшения экстремальных процессов в невыпуклых задачах оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Розинова, Надежда Сергеевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Иркутск
МЕСТО ЗАЩИТЫ
|
||||
2011
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
005003953
Розинова Надежда Сергеевна
МЕТОДЫ ПОИСКА И УЛУЧШЕНИЯ ЭКСТРЕМАЛЬНЫХ ПРОЦЕССОВ
В НЕВЫПУКЛЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
01.01.09 — дискретная математика и математическая кибернетика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
- 8 ЛЕК 2011
Иркутск - 2011
005003953
Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Иркутский государственный университет»
Научный руководитель:
доктор физико-математических наук, профессор Срочко Владимир Андреевич
Официальные оппоненты: доктор физико-математических наук, профессор
Булдаев Александр Сергеевич
Ведущая организация:
кандидат физико-математических наук, доцент Терлецкий Виктор Анатольевич
Санкт-Петербургский государственный университет
Защита состоится 23 декабря 2011 г. в 14:00 часов на заседании диссертационного совета Д 212.074.01 при ФГБОУ ВПО «Иркутский государственный университет» по адресу: 664003, г. Иркутск, бульвар Гагарина, 20, Институт математики, экономики и информатики.
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (г. Иркутск, бульвар Гагарина, 24).
Автореферат разослан 22 ноября 2011 года.
Ученый секретарь диссертационного совета, канд. физ.-мат. наук, доцент
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. К настоящему времени оформились основные подходы к численному решению задач оптимального управления в обыкновенных динамических системах. Существенный прогресс в теории вычислительных методов связан, в первую очередь, с классическими задачами со свободным правым концом, которые являются приемлемой моделью для демонстрации и реализации различных идей и принципов построения итерационных процедур.
Разнообразие методов определяется характером используемых аппроксимаций функционала (игольчатая, фазовая, слабая вариации первого и второго порядков) и типом варьирования управлений (игольчатое, слабое, смешанное, внутреннее).
В задачах оптимального управления вычислительные методы по своему потенциалу позволяют, вообще говоря, находить допустимые управления, удовлетворяющие необходимым условиям оптимальности (экстремальные процессы в смысле принципа максимума и его следствий). В этой ситуации благоприятно выделяются выпуклые задачи, в которых принцип максимума является достаточным условием оптимальности, и методы вырабатывают минимизирующие последовательности управлений. Проблема поиска экстремальных режимов в невыпуклых задачах имеет вполне удовлетворительное обеспечение. В этой области определились разнообразные подходы и разработаны достаточно эффективные методы, систематичное изложение которых проведено, например, в недавнем обзоре
В последнее время заметно повысилась актуальность исследований, связанных с глобальным решением определенных классов невыпуклых задач, в которых принцип максимума выделяет экстремальные управления, подозрительные на оптимальность. На пути отыскания оптимальных процессов в таких обстоятельствах естественно возникает ключевая проблема улучшения экстремальных управлений (по значению целевого функционала) на основе дополняющих принцип максимума условий оптимальности, которые порождаются спецификой рассматриваемых задач.
Диссертационная работа выполнена в рамках указанной проблематики с ориентацией на следующие задачи оптимального управления:
• основная задача с линейной зависимостью от управления, которое ограничено с помощью выпуклого компактного множества;
• задача на максимум нормы конечного состояния относительно линейной системы с параллелепинедными ограничениями на управление и связанная с ней задача d.c.-оптимизации.
1Аргучннцев A.B., Дыхта В.А., Срочко В.А. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума // Изв. вузов. Математика. 2009. » 1. С. 3-43
Цель диссертационной работы - построение и обоснование методов локального и нелокального улучшения экстремальных процессов в определенных классах невыпуклых задач оптимального управления.
Методика исследования -
• конструктивный анализ билинейных аппроксимаций фазовой системы и целевого функционала в плане построения вспомогательных задач улучшения;
• реализация условий оптимальности экстремальных управлений в невыпуклых задачах с помощью методов нелокального характера.
Научная новизна полученных результатов определяется следующими факторами:
- работа с неклассическими билинейными аппроксимациями в основной задаче оптимального управления в рамках вспомогательных задач с параметром варьирования;
- технология улучшения экстремальных управлений с особыми участками;
- конструктивное использование дифференциальных свойств функции максимума для построения метода улучшения неособых экстремальных точек;
- разработка критерия оптимальности в задаче максимизации нормы на основе операции проецирования;
- выделение класса задач относительно билинейных систем специальной структуры со свойством оптимальности экстремальных управлений.
Теоретическая и практическая значимость работы. Разработанные методы и полученные условия оптимальности вносят определенный вклад в теорию и повышают качество вычислительного обеспечения многоэкстремальных задач оптимального управления. Результаты численной реализации открывают возможность использования предлагаемых алгоритмов для решения прикладных задач рассматриваемого типа.
Значительная часть диссертационного исследования проведена в рамках научной работы по грантам РФФИ (проекты 05-01-00187 и 08-0100709) и ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 г.г. и включена в соответствующие отчеты.
Некоторые результаты диссертации используются в учебном процессе кафедры вычислительной математики и механики ИГУ (курсовые и дипломные работы, дисциплины специализации).
Основные результаты, выносимые на защиту:
• метод фазовой линеаризации с билинейной системой, обладающий свойством улучшения неэкстремальных управлений; метод квадратичной аппроксимации со свойством улучшения особых экстремальных управлений, не удовлетворяющих условию оптимальности второт'о порядка;
• процедура улучшения особых экстремальных точек, метод скорейшего подъема для функции максимума на эллипсоиде со свойством сходимости по невязке экстремальности;
• критерий оптимальности экстремальных точек на основе квадратичной вспомогательной задачи; достаточное условие глобального максимума в задаче d.c.-оптимизации с полной линеаризацией целевой функции.
Апробация работы. Основные результаты диссертации докладывались на следующих научных собраниях:
- III международной конференции по проблемам управления (Москва, 2006);
- III межвузовской зональной конференции, посвященной памяти профессора Б.А. Бельтюкова, «Математика и проблемы ее преподавания в вузе» (Иркутск, 2007);
- V Всесибирском конгрессе женщин-математиков (Красноярск, 2008);
- XIV Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (Иркутск-Северобайкальск, 2008);
- Международной конференции «Дифференциальные уравнения и топология», посвященной 100-летию со дня рождения Л.С. Понт-рягина (Москва, 2008);
- Всероссийской конференции «Устойчивость и процессы управления», посвященной 80-летию со дня рождения В.И. Зубова (Санкт-Петербург, 2010);
- V Международном симпозиуме «Обобщенные постановки и решения задач управления» (Улан-Батор, 2010);
- XV Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (Иркутск, 2011).
Публикации и личный вклад автора. По теме диссертации опубликовано 14 работ. Наиболее значимые результаты представлены в работах [1-13]. В число указанных работ входят 6 статей [1-6] из Перечня ведущих рецензируемых журналов и изданий ВАК РФ (редакция 2011 г.), 2 статьи [8, 10] в научных журналах, 5 полных текстов докладов [7, 9, 11-13] в материалах международных и всероссийских конференций.
Результаты, представленные в совместных публикациях с научным руководителем, являются неделимыми. Из совместных работ с Антони-ком В.Г. и Ушаковой С.Н. в диссертацию включены результаты, полученные автором лично.
Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения и списка литературы, содержащего 118 наименований. Общий объем диссертации составляет 108 страниц, включая 12 таблиц.
СОДЕРЖАНИЕ РАБОТЫ Введение содержит обзор основных подходов к численному решению задач оптимального управления в обыкновенных динамических системах. Для каждой группы вычислительных методов охарактеризованы идейные схемы их построения, приведены соответствующие основополагающие работы и намечены перспективные направления дальнейшего развития. Содержание каждой главы диссертационной работы представлено общим описанием и сравнением с ранее известными результатами.
В первой главе рассматривается основная задача оптимального управления. Фазовая система линейно зависит от управления, которое ограничено с помощью выпуклого компактного множества. Для повышения потенциала улучшения методы конструируются на основе фазовой линеаризации и квадратичной аппроксимации целевого функционала. При этом вспомогательные задачи на минимум аппроксимаций необходимо решать в некоторой допустимой окрестности базового управления. Формирование этой окрестности производится в рамках выпуклой комбинации с параметром, который одновременно реализует процедуру варьирования и определяет семейство окрестностей. Вспомогательные задачи методов являются билинейными относительно пары "управление, состояние", что открывает возможность их эффективного решения с помощью методов нелокального типа. Предлагаемые итерационные методы позволяют улучшать допустимые управления, не удовлетворяющие принципу максимума и особые управления, не удовлетворяющие условию оптимальности второго порядка.
Определим основную задачу оптимального управления следующими соотношениями
Ф(и) = <p{x(ti)) —>• min, и € V,
x = f(x,u,t), x(t о) = ж0, (Р)
V = {и{-) 6 РС(Т) : u(t) elf, t еТ= [i0, ti]}-
Здесь t - время (независимая переменная), u(t) 6 Rm - вектор-функция управляющих переменных (управление), x(t) G R" - вектор-функция фазовых переменных (состояние). Внесем необходимые предположения:
• целевая функция ¡р{х) дважды непрерывно дифференцируема на Нп;
• вектор-функция /(х, и, £) линейно зависит от и 6 Я.™ и непрерывна по совокупности (а;, £) на Л" х Г вместе с производными по х до второго порядка включительно;
• множество и С Ят выпукло и компактно, начальное состояние х° и промежуток управления Т заданы.
Отметим, что вектор-функция /(х,и,Ь) может быть представлена в виде / = /и(х, Ь)и + /о(ж, ¿).
Класс допустимых управлений V в задаче (Р) определен как множество кусочно-непрерывных вектор-функций и(£), удовлетворяющих поточечному ограничению типа включения.
Введем стандартные конструкции для задачи (Р): функция Понтрягина (линейна по и) -
Н(ф,х,и,<) = (ф,/(х,и,ф, первая сопряженная система (векторная) -
Ф = -нх(ф,х,и,г), ф(и) = -1рх(х(ь)), вторая сопряженная система (матричная) -
Ф = -Я^Ф - Ф//^х - Нхх, Ф(4Х) = -ч>хх.
Пусть и(£), £ 6 Т - допустимое управление, х{Ь), ф(Ь), Ф(£) - соответствующие решения фазовой и сопряженных систем. Как известно, принцип максимума (ГШ) в линейной по управлению задаче (Р) представляется соотношением
и(£) = а^тах(#и(1/)(£),:г(£),£),г;), £ е Т.
ьеи
Это условие выделяет экстремальные управления которые претендуют на оптимальность в задаче (Р).
Пусть и;(£) = и(£) + Ди(1), £ € Т - допустимое управление с фазовой траекторией ж(£, ии) = х{1) + Дж(£).
Классическая аппроксимация функционала Ф на паре и, ги £ V определяется выражением
ФИ - Ф(и) = <50Ф(и, ш) + 770, % = о(||Ди||), (1)
<50Ф (гх,и>) =
&х = /,(!(£), и(4), ¿)5.-г + /и(а:(£), £)(Ц£) - Ц£)), = 0
и является основой для доказательства ПМ.
В диссертации (разделы 1.1, 1.2) для построения процедуры улучшения используется нестандартная аппроксимация функционала следующего вида
Ф(и>) - Ф(и) = <51Ф(и, w) + m, гП = о(||Дх||), (2)
¿1Ф(«,ш) = {ipx{x(ti),y(ti)),
у = jx{x{t)Mt),t)y + U<t),t)(w{t) - u{t)), y(i0) = 0.
Качество вариации Si$(u,w) в сравнении с ¿"оФ(и, w) подчеркивается следующими свойствами:
• если задача (Р) является линейной по состоянию, то аппроксимация (2), в отличие от (1), является точной (щ = 0, щ ^ 0);
• если u(t) - особое управление в задаче (Р) (Ни(ф(Ь), x(t), t) = 0, t 6 Т), то вариация ¿хФ, в отличие от (5оФ, не теряет свою информативность (¿оФ(м> w) = 0 Vw в V, ^Ф(и, w) Ф 0).
Для построения процедуры улучшения на основе вариации ¿1Ф необходимо использовать технологию доверительной области, т.е. сформировать вспомогательную задачу с параметром, который обеспечивает локальность варьирования.
Введем семейство управлений
uv.a(t) = u(t) + a(v(t) - u(t)), teT (3)
с условиями а е (0,1], v(-) е V.
Для заданного а вектор-функции и„,й(-) входят в некоторую допустимую окрестность исходного управления u(t):
Щ.а(') е IK<,a — II00 < a(diamU).
Фиксируя а е (0,1], сформулируем вспомогательную задачу на минимум вариации ¿"хФ(и, uVi„) на множестве допустимых управлений
(Px(z(ii)),y(<i)) min, veV, (Pi,a)
у = fx{x{t)^v,a{t),i)y + afu(x{t), t){v(t) - u{t)), y{to) = 0.
Полученная система является билинейной относительно совокупности (у, v) (матрица fx(x,u,t) линейно зависит от и).
Пусть va(-) - экстремальное управление в задаче (Pi n). Построим очередное управление
ua{t) = u{t) + a(va(t) - u(t)), teT (4)
и определим выбор параметра а 6 (0,1] условием улучшения в задаче
(Р): ФЫ < ФЫ-
Гарантия локального улучшения обеспечивается следующим утверждением.
Теорема 1.1 Если управление и 6 V не удовлетворяет принципу максимума в задаче (Р), то для достаточно малых а 6 (0,1] имеет место строгое улучшение: Ф(и„) < Ф(и).
Численное решение билинейной задачи (-Pi,a) (до уровня экстремальных управлений) эффективно проводится с помощью методов нелокального типа без параметрического поиска 2, либо методами сильного и слабого улучшения на основе принципа расширения 3.
Рассмотрен обобщенный вариант процедуры выпуклой комбинации
(3)
w,,iX(t) = u(t) + x(f)(w(i)-«(0). teT (5)
с функциональными элементами v(-) £ V, х{') £ Ха и семейством функций варьирования
Ха = {*(•) G РС(Т) : X(t) е [0,1], J X(t)dt = a{h - t0)}.
т
Комбинация (5) является допустимой относительно множества V и содержит как частные случаи процедуры слабого (%(£) = a, t € Т) и игольчатого (x(t) £ {0,1}) варьирования.
Образуем подмножество допустимых управлений
Wa{u) = -K,x(i) : v е V, х е ^а}-
Имеет место оценка (под знаком интеграла - векторная норма)
J IKiX(t) - u{t)\\dt <Ca WveV,xe Xa,
T
т.е. за счет параметра а обеспечивается локальность варьирования в норме пространства L\.
Вспомогательная задача метода с параметром а имеет вид
5хФ(и, w) —► min, weWa(u) (Лг.а)
и фактически решается относительно функций v{t), x(t)i t еТ на множестве V х Ха.
2Срочко В. А. Итерационные методы решении задач оптимального управления. М.: Физматлит, 2000. 160 с.
^Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск: Наука, 1997. 175 с.
Пусть пара (nQ(-), Ха(')) удовлетворяет принципу максимума в задаче (Р2,о)- Образуем управление
wa{t) = u(t) + ХаШгф) - u{t)), t e Т. (6)
Если Ф(ша) > то параметр а корректируется в сторону умень-
шения. В данном случае также справедливо утверждение о локальном улучшении неэкстремальных управлений.
Процедуры (4), (6) являются обобщением методов условного градиента и игольчатой линеаризации на случай фазовых систем с неразделенными переменными х, и в правой части.
В разделе 1.3 проводится построение и обоснование процедур улучшения для задачи (Р) в рамках квадратичной аппроксимации целевого функционала.
Возьмем за основу семейство управлений варьирования (3) с параметром а е [0,1]. Соответствующая фазовая вариация öx(t), t € Т определяется представлением Ax(t) = aöx(t) + о(а) и удовлетворяет линейной системе в вариациях
óx = fx[l;u}5x + /u[M¿](u - u(t)), Sx(Lq) = 0.
Здесь и далее запись [í, и] следует понимать как значение соответствующей функции на процессе (u(t),x(t)) с сопряженной траекторией ip(t). Введем обозначения
Q[t,u] = Hm¡,\t, и]Ф(£) + Hux[t, ti], 02Ф{и,у,а) =
= —a i {Hu[t, u],v(t) - u{t))dt -a1 I {Q\t, u]Sx(t), v(t) - u{t))dt. Jt Jt
Имеет место следующее представление
Ф(и„,а) - ф(и) = 52Ф(и, v, а) + о(а2),
в котором ¿¡гФ ~ квадратичная аппроксимация функционала на вариации управления (3).
Сформулируем вспомогательную задачу на множестве допустимых управлений
S2${u,v,a) —> min, v е V. (7)
Это билинейная задача относительно пары {v(t),5x(t,)) с параметром а. Приведем основные соотношения принципа максимума для задачи
(7):
функция Поптрягина с сопряженной вектор-функцией Stp(t) -h(5i),5x,v,t) = (6ф, fx[t,u}8x + fu[t,u}(v - u(t)))+ 10
+(Hu[t,u], v - u(t)) + a{Q[t, u]8x, v - u{t))\ сопряженная система -
= ap(t), t G T,
P = -fx[t, u]Tp - Q[t, u}T(v - u(t)), v{h) = 0; максимизирующее управление -
v(p, ôx, t) = argmax((#u[i, u],v) + a(fu[t, u]Tp + Q[t, u]Sx, v)); veU
проекционное управление -
v(p, ôx, t) = Pv(v(t) + Hu[t, u] + a(fu[t, u]Tp + Q[t, u]âx)).
Процедуры нелокального улучшения в задаче (7) для управления v € V с сопряженной траекторией p(t,v) представляются следующим образом:
1.1) сформировать вектор-функцию vt(5x,t) — v(p(t,v),ôx,t),
1.2) сформировать вектор-функцию v*(ôx,t) = v(p(t,v),ôx,t),
2) найти решение 5x(t) системы в вариациях
Sx = fx[t,u]5x + fu[t,u](vt(6x,t) - u(t)), Sx(t0) = 0,
3) вычислить улучшающее управление w(t) = v„(ôx(t), t), t £ T. Пусть va & V - решение вспомогательной задачи (7). Образуем управление ua(t) согласно формуле (4) и проведем обоснование свойства локального улучшения относительно функционала Ф.
Введем множество Я-максимизирующих управлений
V{u) = {veV : v{t) = argmax(Hu{t,u],w), t e T}.
meU
Принцип максимума для управления и 6 V равносилен включению и € V(u).
Условие оптимальности второго порядка определяется неравенством для второй вариации функционала
J (Q[t,u]Sx{t,v),v(t)-u(t))dt< 0, Vv € V{u). (8)
Рассмотрим основной случай, когда управление u(t) не удовлетворяет ПМ. Это значит, что
3v£V(u): J (Hu[t,u],v{t) -u{t))dt = ôi(u) > 0.
Свойство локального улучшения обеспечивается оценкой
Ф(иа) _ < -a5i(u) + о(а).
Пусть управление u[t) является экстремальным, но не удовлетворяет условию (8). Это означает, что
Эг) € V(u) : J (Q[t, u]öx{t, v), v{t) - u{t))dt = 62{u) > 0.
В этом случае локальное улучшение следует из неравенства ФЫ - Ф(и) < -а282{и) + о(а2).
Таким образом, вспомогательная задача (7) на минимум квадратичной аппроксимации функционала позволяет улучшать допустимые управления, не удовлетворяющие ПМ и особые управления, не удовлетворяющие условию (8).
С аналогичных позиций изучается задача без ограничений на управление и с функционалом вида
Ф+(и) = Ф(«) + ^ (ti(i),Gu(0)di
с условием G = GT, G > 0.
Отмстим, что в этом случае возникает необходимость коррекции вспомогательной задачи для улучшения неэкстремальных управлений.
Заключительный раздел первой главы содержит информацию по численной реализации полученных методов для приближенного решения некоторых задач, известных по литературе. Была проведена алгоритмическая проработка методов, выбрана стратегия поиска параметра варьирования. Результаты расчетов демонстрируют преимущество первого алгоритма (с операцией arg max) в сравнении с проективным вариантом. Во всех задачах улучшены итоговые значения целевых функционалов в сравнении с известными результатами.
Во второй главе рассматривается задача на максимум эллипсоидальной нормы на множестве конечных состояний линейной системы с двусторонними ограничениями на управление. С помощью множества достижимости задача переводится в фазовое пространство и исследуется в конечномерной интерпретации с целью разработки обоснованных процедур улучшения экстремальных точек множества достижимости.
Исследование проводится на основе следующих конструкций:
- вспомогательные задачи, связанные с необходимыми условиями оптимальности;
- множества решений и значения вспомогательных задач;
- экстремальные точки и соответствующие поверхности уровня целевой функции.
В результате построены процедуры, ориентированные на улучшение экстремальных точек в рамках методики скорейшего подъема и техники работы с особыми управлениями.
Определим основные элементы рассматриваемой задачи:
• линейная система
х = A(t)x + B{t)u, x(t0) = х° (9)
с непрерывными матричными функциями A(t), B(t), t G Т;
• множество допустимых управлений
V = {и € L'£(T) : u(t) € [tT, u+], te T}
с измеримыми вектор-функциями u(t), t G T при интервальных ограничениях;
• терминальный функционал квадратичного типа
Ф(и) = ^г)-а, С(х(Ь)-а))
с условием симметричности и положительной определенности матрицы С.
Сформулируем задачу в пространстве управлений
Ф (и) -* max, ueV. (10)
Введем множество достижимости управляемой системы в конечный момент времени
D = {х = x(thu), и & V} и переведем задачу в фазовое пространство терминальных состояний
tp(x) = ^(ж — а, С(х — а,)) —» max, х 6 D. (V)
В дальнейшем используем следующее обозначение для скалярного произведения с матрицей С
{х,у)к = {х, Су).
Вспомогательная задача с вектором у ф а получается в результате линеаризации целевой функции
('Vip(y), х — у) —> max, х € D. (Т\)
Пусть 0{у) - множество ее решений.
Согласно принципу максимума любое оптимальное управление = (щ^, у),.. .ит(1,у)), Ь £ Т задачи (7^) выражается по формуле
„г, <^,У).ь1'(0><О,
иЛ1'у)-\и+, №,у),Ь>®)> О,
и^,у)е[иг,и+], (ф(Ь,у),Ы{1)) = 0.
Здесь Ь>{£) - столбец матрицы £?(£), ] = 1, тп, ф^,у), ( 6 Т - решение сопряженной системы
ф = -А(Ь)тф, ф{Ь) = Ч<р{у).
Выделим участки неоднозначности
ад = 6 Г : №,у),Ы(1)) = 0}
и образуем множество оптимальных управлений
У(у) = {и 6 К : = «,-(*, у), * е Г\ад, 7 = 17^}.
При этом множество О(у) решений задачи (Тх) порождается управлениями из У{у):
Б(у) = {хеО-.х = а:{к,и),и е У{у)}.
Показывается, что задача максимизации линейной функции на 0(у) допускает элементарное решение в полной аналогии с (Р{).
Включение у € 0(у) есть необходимое условие оптимальности в задаче (V) (принцип максимума в задаче (10)). В этой связи введем множество экстремальных точек (которые порождаются экстремальными управлениями задачи (10)):
Ех1{Г) = {у ф а : у £ О(у)}.
Для поиска таких точек вполне приемлемой процедурой может служить, например, известный метод линеаризации целевой функции (метод условного градиента с единичным шагом)
у°еп\{а], ук+1еО(ук), к = 0,1,... (11)
со свойствами монотонности (<р(ук+1) > ¥?(уЛ)) и сходимости но невязке (||у*+1-у*||-0, /С- 00).
Сформулируем первое условие оптимальности на множестве ЕхЬ(Т>).
Лемма 2.1. Для оптимальности экстремальной точки у в задаче (V) необходимо, чтобы задача (Р1) имела единственное решение У ■ 0{у) = {у}.
Улучшение экстремальных точек, не удовлетворяющих условию единственности, проводится достаточно просто. Пусть у £ ЕхЬСР), С(у)\{у} ф 0. Последнее означает, что экстремальное управление у) имеет особые участки 7}(г/), ] £ 3 С {1,...,т} : теБТ^у) > 0. Изменяя управление и(4,у) на этих промежутках (например, в рамках двух значений и~, ] £ 3), получаем, вообще говоря, другую концевую точку у £ -О(у), у ф у со свойством улучшения: <£(у) > <р(у).
Введем в рассмотрение функцию максимума
д(у) = тах(У<р(у),х - у),
ХЕО
которая является значением задачи (Т\) и играет существенную роль в процессе решения задачи (V).
Сформулируем основные свойства д(у):
1) д(у) > 0 \/у 6 Д если д(у) = 0 для некоторого у 6 С\{а}, то у € Ех^ГУ,
2) если у(у) > 0 в некоторой точке у 6 й", то (р(х) > <р(у) Ух £ £>(у);
3) если д(у) < 0 для некоторого у £ Л", то VI 6 0(у) вектор (х — у) есть направление подъема функции д(-) в точке у.
В соответствии с леммой 2.1 выделим из Ех^Т) подмножество нормальных (неособых) экстремальных точек, порождающих единственное решение задачи (Т-^)
Ыех1{Г) = {увО: /%) = {у}}.
Сформулируем критерий оптимальности на этом множестве, используя методику и соответствующий результат из статьи 4.
Пусть г £ АГеж^'Р). Введем множество Лебега функции (/?(•) в точке
г
Ь{г) = {х £ Я" : <р(х) < <р(г)} и поверхность уровня (эллипсоид с центром в точке а)
1(2) = {хв Яп : = ф)}.
Обозначим: О - множество граничных точек из О.
4Стрекаловский А. С., Шаранхаева Е. В. Глобальный поиск в невыпуклой задаче оптимального управления. Журн. вычисл. матем. и матем. физ. 2005. Т. 45. К» 10. С. 1785-1800.
Теорема 2.1. Для оптимальности точки z 6 Next(P) необходимо и достаточно, чтобы
д(у) = 0 Уу в D П ¿(4 (12)
В разделе 2.3 представлена технология улучшения экстремальных точек со свойством единственности. Пусть получена точка z G Next(V). Это значит, что
D{z) = {г}, 9{z) = 0, Vg{z) = -Уф).
Выделим точку пересечения луча z(a) = z — aVtp(z), а > Ос эллипсоидом L(z):
Решим задачу (Pi) для у = z°, найдем некоторую точку x(z°) в D(z°) и вычислим значение g(z°). Если g(z°) > 0, то по свойству 2) имеет место улучшение: ip(x(z0)) > (p{z°) = <p(z), и необходимо перейти на метод линеаризации (11) с уй = для поиска очередной экстремальной
точки.
Рассмотрим основную ситуацию, когда улучшение отсутствует:
<p(x(z0)) < g(z°) < 0.
В соответствии с условием оптимальности (12) построим метод подъема для функции д(-) на эллипсоиде L(z). Проведем описание общего шага метода.
Пусть zk е L(z), g(zk) < 0, x(zk) € D{zk) и улучшение отсутствует: x{zk) € intL(,z), k = 0,1,... Согласно свойству 3) вектор (x(zk)—zk) есть направление подъема функции д(-) в точке zk. Образуем экстремальный луч
zk{a) = zk + a(x(zk) - zk), a> 0
и проведем проецирование точек zk(a) на эллипсоид L(z) в С-норме. В результате получаем кривую
zk(a) = а + № ~ а||в (/(а) - а), а > 0.
II2 Va) - Чс
Доказана оценка снизу для приращения функции д(-) на паре zk(a), zk g(zk(a))-g(zk)>Ak(a), Ak(a) = (x(zk) - a, zk(a) - a)c - (x{zk) - a, zk - a)c. 16
Выбор параметра а определим задачей на максимум оценки
Ajt(a) max, а > 0.
Решение задачи ак = 1 получено с помощью неравенства Коши-Шварца.
В результате построен метод скорейшего подъема для функции д(-) на экстремальном эллипсоиде L(z)
Обоснование метода определяется следующим утверждением. Теорема 2.2. Для метода (13) справедлива оценка
g(zk^)-g(zk)>Ak, Ak = ||zk- а||с||ф*) - а||с - (zk - a, x(zk) - а)с > 0.
со сходимостью по невязке коллинеарности: Д^ —► 0, к —* оо.
Представлены некоторые модификации и дополнения метода для особых случаев.
Замечание 1. Равенство Д^ = 0 равносильно условию коллинеарности
x(zk)-a = Pk(zk-a), Рк> 0.
Это приводит к остановке итерационного процесса (13): zk+l = zk, что в свою очередь означает нахождение экстремальной точки: x(zk) € Ext(V) без условия улучшения (x(zk) £ L(z)).
Замечание 2. Возможность улучшения экстремальной точки z заложена в оценке (14): если Д^ ф 0, то g(zk+1) > g{zk). При этом условие положительности g(zk+l) > 0 гарантирует улучшение: x(zk+1) ф L(z). Необходимое и достаточное условие улучшения описывается неравенством
g{zM) > ~\\x(zk+1) - zk+1fc,
т.е. может быть выполнено и для отрицательного значения g(zk+1).
В разделе 2.4 приводятся результаты расчетов по реализации предлагаемой методики улучшения экстремальных точек. Были использованы известные по литературе фазовые системы, относительно которых формировались тестовые задачи оптимального управления типа (V). В целом, полученные вычислительные результаты являются вполне удовлетворительными: во всех задачах были найдены глобальные решения. В разделе 2.5 вводится вспомогательная задача проективного типа
(Vip{y),x - у) - - у, х - у)с max, х € D. {V2)
Это задача выпуклого программирования, которая имеет единственное решение х{у). Функция максимума 9(1/) (значение задачи (Рг)) в данном случае является дифференцируемой в каждой точке у € Я.*1.
С помощью этой функции формулируется критерий оптимальности в задаче (V) и строится метод скорейшего подъема для поиска и улучшения экстремальных точек.
Связь между задачами {Тх), (Рг) состоит в следующем.
Лемма 2.3. у = х(у) <&у 6 0(у).
Лемма 2.4. Если у е Ех^Т), то значения задач (Т>\) и (Рг) равны пулю.
Достаточное условие оптимальности в задаче [V) представляется утверждением.
Теорема 2.3. Пусть г е Ех^Т). Если
д(у) = О УуеЬ ПЬ{г),
то г - глобальное решение задачи (V).
Метод скорейшего подъема для функции ц{у) использует направление {х(у) — у) и строится аналогично предыдущему.
В третьей главе диссертации исследуются специальные задачи невыпуклой оптимизации.
В разделе 3.1 рассматривается задача максимизации с1.с.-функции на выпуклом компакте. Показывается, что стандартное условие оптимальности (полная линеаризация целевой функции) эквивалентно условию с частичной линеаризацией по первой из составляющих функций. Представлены две процедуры поиска экстремальных точек. Достаточное условие оптимальности доказывается через редукцию к эквивалентной задаче выпуклой максимизации и формулируется в виде неравенства для производной целевой функции по направлениям в допустимых точках поверхности уровня. В данном случае опорные результаты представлены в монографии
Пусть £) С й" - выпуклое, компактное множество, гпЮ ф 0. Введем (¿.с.-функцию
у{х) = ч>1{х) - <р2{х), х е О с квадратичными, сильно выпуклыми образующими функциями
щ(х) = 1/2(х - а', С^х - аО), а'; € Я", С{ € Япхп,( = 1, 2,
где С,; - симметричная, положительно определенная матрица. Обозначим С = С\ — Это матрица вторых частных производных функции <р(х).
5Стрекаловский Л. С. Элементы невыпуклой оптимизации. Новосибирск: Наука, 2003. 356 с.
Будем рассматривать задачу d.с.-оптимизации
<р(х) —> шах, х £ D. (ф)
Предположим, что матрица С является невырожденной и неопределенной (квадратичная форма (х, Сх) принимает на сфере (х, х) = 1 как положительные, так и отрицательные значения).
Сформулируем необходимое условие локального максимума в задаче (ф) для точки у € D
(Vip{y),x-y) < 0 Vx&D. (15)
Лемма 3.1. Условие (15) су 6 D эквивалентно неравенству
(V^(y), х -у)< ¥>г(аО - Ыу) ^ е £>• (16)
Таким образом, в задаче (ф) действуют два варианта необходимого условия локального максимума: условие (15) с полной линеаризацией целевой функции и условие (16) с частичной линеаризацией. Введем соответствующие им задачи выпуклого программирования
(Vip{y),x) max, х £ D- (ФО
(Vípi{y),x) - max, x e D. (ф2)
Пусть Di(y) = Argma,x{ty¿) - множество решений задачи (фх), х(у) -единственное решение задачи (ф2).
Разница между условиями связана с потенциалом улучшения в случае их нарушения.
Пусть условие (15) нарушается, т.е. у ф Dy{y). Выделим произвольную точку у € Di(y). Тогда вектор (у — у) есть допустимое направление локального подъема функции ip(-) в точке у на множестве D.
Пусть не выполнено условие (16), т.е. у ф х(у). Тогда имеет место нелокальное улучшение точки у в задаче (ф): ip(x(y)) > р(у).
Основной результат данного раздела - достаточное условие оптимальности в задаче (ф) на основе неравенства (15).
Пусть Агдтах($5) - множество точек глобального максимума в задаче (ф). Для точки z е D введем множество L(z) = {ж : <р{х) = <p{z)}.
Теорема 3.1. Пусть z е D, ip(z) > min{(^(i), х е D}. Если
{V<p{y),x-y)<0 4xeD,yeDnL{z), (17)
то z Е Агдтах(У$).
В разделе 3.2 основные положения предлагаемого подхода реализуются для невырожденной задачи на максимум евклидовой нормы и полунормы. Для тестовой задачи максимизации нормы на параллелепипеде
предлагается схема глобального решения, которая может служить модификацией основного метода в рамках общей задачи на максимум нормы.
В заключительном разделе третьей главы проведено решение задачи
Ф(и) = (d,x(ti)) min (18)
на траекториях билинейной системы
х = {А + ubcT)x, x(t0) = х° ф 0 (19)
с модульным ограничением на управление
KOI < i,ieT = [io.il].
Билинейные системы вида (19) описывают математические модели целого ряда процессов в биологии, экономике, медицине, энергетике, являются объектом исследования в теории автоматического управления.
Принцип максимума в задаче (18) представляется соотношением
u(t) = sign[(M(i,u))(c,x(t,u))],t е Т.
Найдены условия на параметры рассматриваемой задачи, при которых ПМ является достаточным условием оптимальности.
Лемма 3.3. Пусть в задаче (18) выполнены следующие условия:
aij>bi\cj\, i,j = T7n, i^j b> 0, ei < 0, (b,d}<0. (20)
Тогда для любого решения ip(t, и) сопряженной системы выполнены свойства:
ф{г,и) > 0, (Ь,ф{1,и)> > 0, £ G Т.
Теорема 3.2. В задаче (18) с условием (20) принцип максимума представляется в виде
u(t) = sign (с, x(t, и)), teT (21)
и является достаточным условием оптимальности управления u(t).
Формула (21) допускает эффективную реализацию, что позволяет решить задачу (18) с условием (20) элементарно. Оптимальный процесс (и* (t), х* (t)), teT определяется следующим образом:
u*(t) = sign<c,x*(t)), t е Т, где x*{t) - решение задачи Коши
х = Ах + ö|(c, х) |, x(to) = х°.
В заключении сформулированы основные результаты диссертационной работы.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в журналах, рекомендованных ВАК
1. Розинова Н.С. Некоторые вопросы поиска экстремальных процессов в невыпуклых задачах оптимального управления / Н.С. Розинова, В.А. Срочко // Автоматика и телемеханика. - 2011.- № 6.-С. 140-150.
2. Розинова Н.С. Методы билинейных аппроксимаций для решения задач оптимального управления / Н.С. Розинова, В.Г. Антоник, В.А. Срочко // Известия Иркутского государственного университета. Серия «Математика». - 2011. - Т.4. - №3. - С. 146-157.
3. Розинова Н.С. Условия глобального экстремума в задаче d.c.-оптимизации на выпуклом множестве / Н.С. Розинова, В. А. Срочко // Вестник Бурятского государственного университета - Улан-Удэ : Изд-во Бурят, госун-та, 2010. - Вып. 9: Математика и информатика. - С. 68-72.
4. Розинова Н.С. Условия оптимальности в задаче максимизации разности двух выпуклых функций / Н.С. Розинова // Известия вузов. Математика. - 2010. -- № 10. - С.87-91.
5. Розинова (Ахмеджанова) Н.С. К решению задачи на максимум нормы терминального состояния линейной управляемой системы / Н.С. Розинова (Ахмеджанова), С.Н. Ушакова // Известия вузов. Математика. - 2009. - № 10. - С.63-67.
6. Розинова (Ахмеджанова) Н.С. Исследование и решение одного класса билинейных задач оптимального управления / Н.С. Розинова (Ахмеджанова), В.А. Срочко // Вестник Бурятского университета. Серия 13: Математика и информатика. - Вып. 2. - Улан-Удэ: Изд-во Бурятского госуниверситета, 2005. - С. 143 - 148.
Другие публикации
7. Розинова Н.С. К решению задач оптимального управления на основе методов квадратичной аппроксимации / Н.С. Розинова, В.Г. Антоник, В.А. Срочко // XV Байкальская международная школа-семинар «Методы оптимизации и их приложения». - Иркутск, 2011. - Т.З «Оптимальное управление». - С. 126-130.
8. Розинова Н.С. Условие оптимальности и метод поиска экстремальных точек в задаче на максимум эллипсоидальной нормы / Н.С. Розинова, В.А. Срочко // Известия Иркутского государственного университета. Серия «Математика». - 2010. - Т.З. - №3. - С. 93-104.
9. Розинова Н.С. Вопросы улучшения экстремальных процессов в невыпуклых задачах оптимального управления / Н.С. Розинова, В.А. Срочко // Устойчивость и процессы управления. Все-росс.конференция, посвященная 80-летию со дня рождения В.И. Зубова. - СПб, 2010. - С. 217-218.
10. Розинова (Ахмеджанова) Н.С. Задачи на максимум неполной нормы конечного состояния в линейной и билинейной системах / Н.С. Розинова (Ахмеджанова) // Известия Иркутского государственного университета. Специальный выпуск, посвященный 70-летию проф. О.В. Васильева. Серия «Математика». - 2009. - Вып. 2. - С. 299-303.
11. Розинова (Ахмеджанова) Н.С. Решение специального класса билинейных задач оптимального управления. / Н.С. Розинова (Ахмеджанова) // XIV Байкальская международная школа-семинар «Методы оптимизации и их приложения». - Иркутск, 2008. - Т.2 «Оптимальное управление». - С. 81-85.
12. Розинова (Ахмеджанова) Н.С. Применение локальных аппроксимаций для решения задач оптимального управления / Н.С. Розинова (Ахмеджанова) // V Всесибирский конгресс женщин-математиков. Материалы конференции. - Красноярск, 2008. - С.31-35.
13. Розинова (Ахмеджанова) Н.С. К решению задач оптимального управления на основе локальных аппроксимаций / Н.С. Розинова (Ахмеджанова), В.А. Срочко // Труды III межвузовской зональной конференции, посвященной памяти профессора Б.А. Бельтюкова, «Математика и проблемы ее преподавания в вузе». - Иркутск: Изд-во ИГПУ, 2007. - С. 111-113.
Подписано в печать 18.11.2011. Формат 60x84 1/16. Печать трафаретная. Усл. печ. л. 1,0. Тираж 100 экз. Заказ 61/11
Отпечатано в ООО "Фрактал" 664022, г. Иркутск, ул. Коммунистическая, 65 "А", тел. (3952) 248-288
Введение
ГЛАВА 1. Основная задача. Методы линейно-квадратичной аппроксимации
1.1 Основная задача. Фазовая аппроксимация.
1.2 Метод фазовой линеаризации.
1.3 Метод квадратичной аппроксимации
1.3.1 Задача улучшения. Нелокальные методы.
1.3.2 Обоснование свойств улучшения.
1.3.3 Задача без ограничений на управление.
1.3.4 Численная реализация.
ГЛАВА 2. Задача на максимум нормы конечного состояния.
Условия оптимальности и методы улучшения
2.1 Постановка задачи. Экстремальные точки.
2.2 Условия оптимальности.
2.3 Улучшение экстремальных точек
2.4 Численная реализация.
2.5 Квадратичная вспомогательная задача.
ГЛАВА 3. Избранные задачи невыпуклой оптимизации.
Специализированные методы
3.1 Задача (І-оптимизации и овия глобального эремума
3.1.1 Необходимое условие оптимальности.
3.1.2 Достаточное условие оптимальности.
3.2 Задача на максимум евклидовой нормы.
3.2.1 Метод скорейшего подъема
3.2.2 Максимизация нормы на параллелепипеде.
3.2.3 Задача максимизации полунормы.
3.3 Билинейная система специального вида.
В настоящее время теория оптимального управления имеет большое число различных приложений и является активно разрабатываемым разделом современной математики.
Проблема вычислительных методов оптимального управления имеет устойчивую актуальность, которая определяется, в первую очередь, потребностями надежного и обоснованного решения новых, всё более сложных прикладных задач (динамика полета, физико-технические процессы, экономические модели, экология, медицина и др.). С другой стороны, не менее важной является необходимость проведения фундаментальных исследований ио дальнейшему развитию теории вычислительных методов оптимального управления (расширение классов рассматриваемых задач, поиск глобальных решений в невыпуклых задачах, обоснованная работа с вырожденными задачами и др.).
Разработка вычислительных (итерационных) методов решения задач оптимального управления органично связана с условиями оптимальности и традиционно использует типовые конструкции, аппроксимации и процедуры варьирования, полученные в рамках качественной теории. Исторически в этой области определились и активно развиваются следующие подходы и направления исследований:
1) итерационные процедуры принципа максимума (ПМ) - локальные и нелокальные аппроксимации функционалов, вспомогательные задачи на максимум функции Понтрягина, разнообразные схемы игольчатого варьирования управлений, методы игольчатой и фазовой линеаризации, процедуры нелокального улучшения [25]-[28], [32], [41], [46], [53], [75], [89],[94],[95] ;
2) градиентные методы оптимального управления - классические и неклассические вариации функционалов, вспомогательные задачи на минимум вариаций, слабое варьирование управлений, квазиградиентные методы [29], [39], [75], [76], [90], [91], [114] ;
3) методы улучшения на основе достаточных условий оптимальности
- линейно-квадратичная реализация разрешающей функции, работа с дифференцируемой функцией Гамильтона и уравнением Риккати, варьирование управлений с помощью регуляризации основного функционала с целью обеспечения сильного и слабого улучшения [17], [38], [47], [113];
4) методы оптимального управления в режиме реального времени - опорные процедуры поиска программных решений, неклассическая технология решения проблемы оптимального синтеза [35], [36];
5) методы математического программирования в задачах оптимального управления - дискретные аппроксимации моделей оптимального управления, расчетные формулы для производных сложных функций по компонентам дискретного управления, адаптация методов конечномерной оптимизации к специфике дискретных задач, вопросы сходимости аппроксимаций [30], [42], [43], [54].
В качестве актуальных и перспективных проблем дальнейшего развития конструктивной теории оптимального программного управления можно выделить следующие направления:
• разработка и исследование специализированных методов (как минимум, нелокального характера) численного решения определенных классов задач оптимального управления (линейные, квадратичные и др.)
• разработка обоснованных схем и слабоэвристических стратегий поиска глобальных решений специальных классов невыпуклых задач (билинейные, <1.с.-задачи и др.), создание вычислительных методов со свойством улучшения экстремальных управлений в общих задачах;
• построение и использование нестандартных (с точки зрения качественной теории) аппроксимаций функционалов задачи, конструктивная формализация процедур варьирования, обоснованное построение и аналитическое решение вспомогательных задач на поиск элементов варьирования.
К настоящему времени оформились как в результативном, так и в методическом плане основные подходы к численному решению задач оптимального управления в обыкновенных динамических системах. Существенный прогресс в проблематике вычислительных методов связан, в первую очередь, с классическими задачами без смешанных, фазовых и терминальных ограничений, которые являются характерной моделью для демонстрации и реализации разнообразных идей и принципов построения итерационных методов с целыо их дальнейшего обобщения. В этих задачах фигурирует только один (целевой) функционал и присутствуют только поточечные (явные) ограничения на управление, поэтому процедуры улучшения имеют здесь однозначную направленность: построить допустимое управление с меньшим значением функционала. Разнообразие методов определяется характером используемых аппроксимаций функционала (игольчатая, фазовая, слабая вариации первого и второго порядка) и типом варьирования управлений (игольчатое, слабое, смешанное, внутреннее, комбинированное).
В первую очередь здесь закономерно выделяются методы и алгоритмы, связанные с необходимыми условиями оптимальности. Наиболее эффективным средством для построения вычислительных процедур служит принцип максимума Понтрягина [3], [11]-[15], [34], [45], [51]-[53], [55], [59], [60]. Первоисточником соответствующего класса методов являются, конечно, схемы последовательных приближений из [48], [49], которые наряду с результатом [112] заложили добротную основу конструктивного использования ПМ и стимулировали развитие методов игольчатого варьирования в задачах оптимального управления. Дальнейшие исследования в этом направлении привели к своеобразной технике варьирования управлений (в некоторой окрестности точки максимума по приращению функции Понтрягина, в области "максимальных"(выше среднего) значений определяющей функции, на специальных семействах множества варьирования и др.). В полуэвристическом плане указанные способы конструирования управлений были, по-видимому, впервые сформулированы в работах [25], [31], [32], [46], [87] и послужили активным стимулом совершенствования теории варьирования. В результате сформировался представительный цикл работ с доказательством сходимости последовательных приближений по определенным невязкам и со свойством монотонности по функционалу.
Основополагающий вклад в развитие методов ПМ внесли исследования Ф.Л. Черноусько и его учеников [48]-[50], [94], [95]. Например, можно подчеркнуть, что в известной монографии [95] приведено семь модификаций метода последовательных приближений для задачи оптимального управления со свободным правым концом, каждая из которых характеризуется тем или иным своеобразием.
Необходимо также выделить популярный вариант игольчатого варьирования, который был предложен О.В. Васильевым и связан с так называемым определяющим неравенством интегрального типа [24], [26], [118].
Приведенные разработки явились заметным достижением в области вычислительных методов оптимального управления. В результате сложился комплекс алгоритмов игольчатого варьирования с единой операцией поиска вспомогательного управления из условия максимума функции Понтрягина или ее модификаций. Определенный итог этому направлению исследований подведен в монографии В.А. Срочко [75], где обоснован оптимальный (по принципу наискорейшего спуска) способ варьирования управлений в методах игольчатого типа.
Наметим вычислительную схему метода для основной задачи оптимального управления
Ф(и) - (p(x(t\)) —» min, x = f(x,u,t), x(t0)=x°, u(t) eU, t eT =[tQ,ti];
• исходные данные u(t). x(t), ip(t), t ET;
• максимизирующее управление t) — arg max H(ip(t) ,x(t),v,t), vZÜ функция переключения g(t) = Н(ф(£), x{t),ü{t)A) - ЯОА(г), x(t), u(t), t) с крайними значениями
Ащіп = іпї{д(і), і є Т], А і тах 8ир{д(і): і є т};
• процедура варьирования и\(і) = и{і), ^(0 < А, Ці), д{і) > А;
• итерационный поиск параметра Л с ориентировкой на решение за
Следующую представительную группу методов численного решения составляют градиентные процедуры оптимального управления, имеющие в своей основе следствия ПМ (классические вариации функционалов, дифференциальный ПМ, условие стационарности гамильтониана) и использующие разноплановые варианты слабого варьирования управлений. Спектр задач, методов и технологий реализации в этой области необыкновенно широк, что образует богатую картину градиентного многообразия. На этом фоне выделим в качестве классических уже указанные монографии Р.П. Федоренко [91] и Ф.П. Васильева [30].
Для классических задач оптимального управления наряду с традиционными методами ПМ и градиентными схемами в последнее время разработан целый комплекс процедур улучшения и соответствующих итерационных методов, использующих нестандартные (в сравнении с классической техникой) аппроксимации функционалов вместе с конструктивной технологией варьирования [75], [77].
Общие характеристики данного подхода состоят в следующем: - в качестве базы для построения методов используются неклассические аппроксимации целевого функционала (квазивариации) , которые определены на паре допустимых процессов (два управления, две фазовые траектории) и обеспечивают более высокий порядок точности, чем стандартная вариация функционала; дачи
Цих) —> тіп, Л Є [Атіп, Атах].
- в билинейных и квадратичных задачах построенные аппроксимации являются точными (нелокальными), поэтому соответствующие процедуры и методы улучшения работают без варьирования управлений (без параметрического поиска), что является существенным фактором в плане вычислительных затрат;
- нестандартным элементом процедур варьирования является конструктивное использование специальных функций (вместо параметров), которые расширяют потенциал и повышают эффективность варьирования;
- реализация ряда процедур и методов улучшения связана с интегрированием дифференциальных систем с разрывным управлением, что является положительным фактором в плане возможного улучшения экстремальных режимов в невыпуклых задачах.
В качестве характерной иллюстрации отметим, например, процедуру смешанного варьирования, которая сочетает в себе участки слабого и игольчатого варьирования [77].
Образуется функция переключения с максимизирующим управлением й(£). Схема варьирования для Л > О представляется в виде и х)= I + д{1)< Л,
Ч' } \ Щ, д{1)> А;
Такое варьирование вполне уместно в задачах, когда оптимальное управление содержит внутренние и граничные участки относительно выпуклого множества и. Отметим, что данная процедура варьирования получена в результате решения специальной экстремальной задачи.
Очередная группа методов численного решения классических задач в той или иной мере связана с конструкциями и соотношениями условий оптимальности в формате В.Ф. Кротова и В.И. Гурмана. В этой области методы строятся по принципу сильного и слабого улучшения в первом и втором порядке. При этом порядок метода определяется характером аппроксимации разрешающей функции (линейная аппроксимация определяет первый порядок, квадратичная аппроксимация - второй порядок). Существенным фактором для обеспечения свойства улучшения основного функционала является систематическое использование стандартной выпуклой комбинации основного и вспомогательного функционалов. Для решения краевой задачи ПМ такого сорта комбинации использованы, например, в [19]. Если в качестве вспомогательного функционала выбрать среднеквадратичное отклонение по управлению, то речь пойдет о слабом улучшении. В противном случае, если использовать среднеквадратичную невязку по фазовым траекториям, то приходим к процедурам сильного улучшения.
Как взаимодействие разноплановых процедур улучшения из [75], [17] интересно отметить, что максимизирующие управления в первоначальном варианте вырабатываются в позиционной форме (как функции фазовых или сопряженных переменных) с последующей прогонкой через фазовые либо сопряженные системы. При этом, однако, в [75] приоритетными являются разрывные системы (с учетом возможного свойства улучшения), в то время как в [17] предпочтение отдается гладким уравнениям (дополнительное предположение). Основополагающие работы данного направления уже выделены [38], [47], [17], [18].
В диссертации рассматриваются определенные классы невыпуклых задач оптимального управления, которые являются многоэкстремальными в том смысле, что принцип максимума в данном случае не является достаточным условием оптимальности и выделяет экстремальные управления, которые всего лишь подозрительны на оптимальность. В этой связи на пути глобального решения невыпуклых задач естественно возникает проблема улучшения экстремальных управлений, в рамках которой и проводится диссертационное исследование. Первый подход к решению указанной проблемы связан с повышением качества используемых аппроксимаций.
В первой главе диссертации для задач, линейных по управлению, этот подход реализуется по следующей схеме: классическая вариация функционала => фазовая линеаризация задачи => квадратичная аппроксимация.
Для работы с более глубокими аппроксимациями возникает необходимость конструирования соответствующих методов на основе технологии доверительной области [44], [106] . Это означает, что вспомогательную задачу на минимум аппроксимации необходимо решать в некоторой допустимой окрестности рассматриваемого управления, которая формализуется с помощью определенного параметра. Такое требование отражает вполне очевидный факт, что любая аппроксимация хорошо моделирует функционал лишь в некоторой окрестности базового процесса. При этом уменьшение функционала реализуется на основе варьирования параметра окрестности, входящего во вспомогательную задачу.
В первой главе рассматривается основная задача оптимального управления без фазовых и терминальных ограничений. Динамическая система линейно зависит от управления, которое ограничено с помощью выпуклого компактного множества. Варьирование и формирование допустимой окрестности базового управления производится в рамках выпуклой комбинации с параметром, который одновременно реализует процедуру варьирования и определяет семейство окрестностей. Вспомогательные задачи метода конструируются на основе фазовой и квадратичной аппроксимаций функционала и являются билинейными относительно пары «вариация управления, вариация состояния». Такая благоприятная структура открывает возможность эффективного решения вспомогательных задач с помощью методов нелокального улучшения [75]. В случае фазовой вариации вспомогательная задача не вырождается на особом экстремальном управлении, что может обеспечить его улучшение. Метод квадратичной аппроксимации позволяет гарантированно улучшать допустимые неэкстремальные управления и особые экстремальные управления, не удовлетворяющие условию неотрицательности второй вариации функционала. Проведен численный эксперимент по реализации метода для решения некоторых задач прикладного содержания. Протестированы различные алгоритмы метода и выработана наиболее эффективная тактика изменения параметра окрестности. Улучшены известные результаты по итоговым значениям целевых функционалов.
В задачах оптимального управления вычислительные методы по своему потенциалу позволяют, вообще говоря, отыскивать допустимые процессы, удовлетворяющие необходимым условиям оптимальности (экстремальные процессы в смысле принципа максимума и его следствий). Благоприятное исключение составляют выпуклые задачи (линейная система, линейные терминальные ограничения, выпуклые по состоянию функции, определяющие критерий качества, в том числе линейная задача быстродействия), в которых принцип максимума является достаточным условием оптимальности и методы вырабатывают минимизирующие последовательности управлений. В общем случае вопрос об оптимальности итоговых управлений остается открытым и обоснованно говорить о решении задачи оптимального управления не приходится.
Не вызывает сомнений, что вычислительные достижения на пути решения невыпуклых задач связаны с успешным выделением (в частности, на основе прикладных постановок) определенных классов задач с последующим их анализом на основе нестандартных подходов и специализированных методов. Хорошей иллюстрацией этого утверждения могут служить, например, билинейные задачи (относительно пары "управление-состояние") и задачи терминального управления в линейных системах с ё.с.-функцией качества (с!.с. - разность двух выпуклых функций). Тем не менее, даже на этом уровне проблема вычисления оптимального управления находится еще в стадии разрешения и поэтому сохраняет в себе эвристические фрагменты.
Ключевым элементом в процессе глобального решения невыпуклых задач является проблема улучшения экстремальных управлений. В аналитическом плане такое улучшение (локальное) возможно на основе невыполнения соответствующих условий оптимальности, которые используют определенные особенности ситуации (точки переключения управления, его особые участки и т.п.).
Конструктивной основой для разработки теоретически полноценных и методов улучшения экстремальных процессов могут служить необходимые и достаточные условия оптимальности, учитывающие специфику рассматриваемого класса задач и допускающие разрешимость в рамках некоторого численного метода.
Для d.с.-задач математического программирования необходимые и достаточные условия оптимальности и некоторые их реализации в форме стратегий глобального поиска разработаны и суммарно представлены в монографии A.C. Стрекаловского [81]. В терминологии соответствующих задач оптимального управления линейными системами эти результаты были сформулированы в [82], [83] и получили дальнейшее развитие в [84], [85].
Во второй главе диссертации рассматривается задача на максимум эллипсоидальной нормы на множестве конечных состояний линейной системы с интервальными ограничениями на управление. С помощью множества достижимости (МД) задача переводится в фазовое пространство и исследуется в конечномерной интерпретации с целью разработки обоснованных процедур улучшения экстремальных точек МД (управлений, удовлетворяющих ПМ).
Задачи на максимум терминальной нормы возникли и долгое время изучались, по существу, на основе метода линеаризации целевой функции (фрагмент метода условного градиента, первый вариант итерационной процедуры принципа максимума), который весьма удачно вписался в структуру задачи (вспомогательное управление является улучшающим без необходимости его варьирования) и вполне очевидным образом обеспечивал монотонность по целевой функции и сходимость по невязке к экстремальным точкам задачи. Отметим, что в задачах максимизации нормы ПМ не является достаточным условием оптимальности, т.е. любое экстремальное управление (удовлетворяющее ПМ) в рамках глобального решения требует дополнительного анализа на предмет оптимальности либо улучшения. В этой связи отметим, что столь популярный в задачах на максимум нормы упомянутый метод линеаризации остается вполне приемлемой процедурой именно на стадии поиска экстремальных управлений. Тем не менее, в разделе 2.1 представлен альтернативный метод улучшения с матричной сопряженной системой без процедуры варьирования.
Следующий существенный шаг на пути исследования задач выпуклой максимизации связан с получением достаточных условий оптимальности в форме неравенства для производной по направлению на пересечении поверхности уровня целевой функции и множества достижимости управляемой системы [80], [100], [108]. Эти результаты послужили основой для построения стратегий и алгоритмов глобального поиска ([81], [98], [99], [102], [103]), существенным элементом которых являются различные процедуры дискретизации экстремальной поверхности уровня с последующим перебором значений функции максимума с целью проверки условия оптимальности. В [9] рассмотрена аналогичная задача с невырожденной системой управления, порождающей строго выпуклое (полной размерности) множество достижимости.
Во второй главе диссертации изучается общий случай линейной системы без условия строгой выпуклости МД. В этом случае вспомогательная задача (максимизация линейной функции на МД) имеет, вообще говоря, неединственное решение и функция максимума дифференцируема только по направлениям. Показывается, что множество решений вспомогательной задачи порождается особыми управлениями, которые действуют на участках обращения в нуль функций переключения. Такое описание позволяет элементарно (без итераций) решить задачу максимизации линейной функции на множестве решений вспомогательной задачи. Как следствие, реализуется возможность улучшения определенного класса экстремальных точек, которым соответствуют вспомогательные задачи с неединственным решением. Достаточное условие оптимальности представлено в форме равенства нулю функции максимума. Основная проблема использования этого условия связана с формированием стратегии поведения в области отрицательных значений данной функции. В этой части получены следующие результаты: определена траектория подъема функции максимума на экстремальной поверхности уровня, получена оценка снизу для ее приращения, решена задача на максимум этой оценки по параметру, построен метод скорейшего подъема со сходимостью по определенной невязке. Проведено тестирование метода в рамках некоторых задач, известных по литературе. В заключительном разделе второй главы эллипсоидальная задача изучается на основе операции проецирования на множество достижимости. В этом случае функция максимума (значение вспомогательной задачи) является непрерывно дифференцируемой. В результате получено новое условие оптимальности вместе с соответствующим методом скорейшего подъема.
Наконец, уместно отметить, что рассматриваемая задача выпуклой максимизации не является экзотичной и имеет свою историю и результаты, в первую очередь в рамках математического программирования (обзорное изложение см. в [81], [97], [102], [110]). По линии оптимального управления ее частный, но популярный вариант (на максимум евклидовой нормы) в аналитическом и вычислительном аспектах изучался, например, в [1], [2], [22], [33], [82], [88]. Задача имеет прикладное значение (отметим задачу о максимальном отклонении от программного движения вследствие возмущений [2]) и представляет теоретический интерес как характерный пример невыпуклой постановки, в которой принцип максимума Понтрягина не является достаточным условием оптимальности.
В третьей главе диссертации исследуются специальные задачи невыпуклой оптимизации, среди которых выделим задачу с с!.с.-целевой функцией квадратичного типа и задачу оптимального управления для одного класса билинейных систем. Задачи с1.с.-оптимизации имеют достаточно высокий уровень общности и образуют своеобразный класс невыпуклых структур [81], [107], [117]. Первая ступень исследования таких задач связана с выводом условий оптимальности, учитывающих специфику постановки и выделяющих множество экстремальных точек. Интересно отметить, что полученные в этой области результаты являются не только необходимыми, но и достаточными условиями глобальной оптимальности, что ранее было характерно только для выпуклых задач.
В разделе 3.1 рассматривается задача максимизации квадратичной с!.с.-функции на выпуклом компакте. Показывается, что стандартное условие оптимальности (полная линеаризация целевой функции) эквивалентно условию с частичной линеаризацией по первой из составляющих функций. Представлены две процедуры поиска экстремальных точек задачи. Расширение локального условия на все точки глобального максимума приводит к достаточному условию оптимальности, которое доказывается через редукцию к эквивалентной задаче выпуклой максимизации. В отличие от результата из [81] полученное условие не содержит параметра и формулируется в виде неравенства для производной целевой функции по направлениям в допустимых точках поверхности уровня.
В разделе 3.2 основные положения предлагаемого подхода реализуются для невырожденной задачи на максимум евклидовой нормы и полунормы. Для тестовой задачи максимизации нормы на параллелепипеде предлагается схема глобального решения, которая может служить модификацией основного метода в рамках общей задачи на максимум нормы.
В заключительной части третьей главы проведено решение задачи минимизации линейного терминального функционала на траекториях специальной билинейной системы х = Ах + иЪ(с,х). (0.1)
Билинейные системы вида (0.1) имеют немаловажное прикладное значение. Они описывают математические модели целого ряда процессов в биологии, экономике, медицине, энергетике, являются объектом исследования в теории автоматического управления (библиографию см. в [92], [93]). В частности, такие системы моделируют процесс лечения злокачественных опухолей (химиотерапия) путем задержки развития раковых клеток в определенной стадии [115], [116]. Ряд результатов качественного характера применительно к системе (0.1) (условия неотрицательности решений, свойства множества достижимости, оценка числа переключений экстремальных управлений) получен в [92], [93]. В разделе 3.3 выясняются условия, при которых принцип максимума становится достаточным условием оптимальности. Получены дополнительные условия типа линейной независимости определенной системы векторов, при которых оптимальное управление не содержит особых участков. В результате решение задачи проводится вполне элементарно, ценой однократного интегрирования фазовой системы (0.1) на релейном управлении сигнатурного типа.
Основные результаты диссертации опубликованы в работах [5]-[7], [61]-[74] и докладывались на следующих научных собраниях:
- III международной конференции по проблемам управления (Москва, 2006);
- III межвузовской зональной конференции «Математика и проблемы ее преподавания в вузе», посвященной памяти профессора Б.А. Бельтюко-ва (Иркутск, 2007);
- V Всесибирском конгрессе женщин-математиков (Красноярск, 2008);
- XIV Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (Иркутск-Северобайкальск, 2008);
- Международной конференции «Дифференциальные уравнения и топология», посвященная 100-летию со дня рождения Л.С. Понтрягина (Москва, 2008);
- Всероссийской конференции «Устойчивость и процессы управления», посвященной 80-летию со дня рождения В.И. Зубова (Санкт-Петербург, 2010);
- V Международном симпозиуме «Обобщенные постановки и решения задач управления» (Улан-Батор, 2010)
- XV Байкальской международной школе-семинаре «Методы оптимизации и их приложения» (Иркутск, 2011).
Материалы диссертации неоднократно обсуждались на семинарах кафедры вычислительной математики и механики ИГУ и отделения методов управления ИДСТУ СО РАН.
Некоторые результаты диссертации получены в рамках научной работы по грантам РФФИ и включены в соответствующие отчеты (проекты 05-01-00187 и 08-01-00709).
В диссертации используется стандартная система обозначений и ссылок. Формулы имеют двойную нумерацию: номер главы и порядковый номер формулы в главе. Ссылки на литературу оформляются квадратными скобками. Список литературы приведен в алфавитном порядке.
Автор выражает глубокую благодарность своему научному руководителю - доктору физико-математических наук, профессору Владимиру Андреевичу Срочко за постановку научной проблемы, всестороннюю и постоянную поддержку в каждом аспекте работы над диссертацией, внимание и помощь в решении возникших проблем.
Заключение
В диссертации с позиций итерационного решения исследованы некоторые классы невыпуклых задач оптимального управления, в которых принцип максимума не является достаточным условием оптимальности и выделяет экстремальные управления, подозрительные на оптимальность. В этой связи на пути глобального решения невыпуклых задач закономерно возникает актуальная проблема улучшения экстремальных управлений, в рамках которой и проведена диссертационная работа.
Основу исследования составляют два фактора:
• билинейные аппроксимации целевого функционала, порождающие вспомогательные задачи локального типа;
• реализация условий оптимальности в невыпуклых задачах с помощью методов нелокального характера.
Сформулируем основные результаты диссертации, представляемые к защите.
1. Основная задача оптимального управления
• метод фазовой линеаризации с билинейной системой и со свойством улучшения управлений, не удовлетворяющих принципу максимума;
• метод квадратичной аппроксимации с линейной системой в вариациях и со свойством улучшения особых экстремальных управлений, не удовлетворяющих условию неотрицательности второй вариации функционала.
2. Задача на максимум нормы конечного состояния
• метод скорейшего подъема для функции максимума на эллипсоиде со сходимостью по невязке экстремальности;
• необходимое и достаточное условие оптимальности экстремальных точек на основе операции проецирования на множество достижимости.
3. Специальные задачи невыпуклой оптимизации
• критерий оптимальности в задаче на максимум квадратичной с1.с.-функции конечного состояния;
• метод решения задачи оптимизации для билинейной управляемой системы.
В целом, предлагаемая технология улучшения экстремальных управлений на данном этапе развития не гарантирует отыскания оптимального решения в мпогоэкстремальных задачах, но выявляет дополнительные ресурсы и открывает новые перспективы для достижения глобальной цели.
1. Александров В. В. О накоплении возмущений в линейных системах по двум координатам / В.В. Александров // Вестник МГУ. Сер Мат., мех. 1968. - № 3. - С. 67-76.
2. Александров В. В. Оптимальное управление движением / В.В. Александров, В.Г. Болтянский, С.С. Лемак и др. М.:Физматлит, 2005. - 376 с.
3. Алексеев В.М. Оптимальное управление / В.М. Алексеев, В.М. Тихомиров, C.B. Фомин. М.: Наука, 1979. - 429 с.
4. Антоник В. Г. Процедуры нелокального улучшения в невыпуклых задачах оптимального управления / В.Г. Антоник, А.Л. Ветрова // Оптимизация, управление, интеллект. 2002. - № 6. - С. 36-42.
5. Антоник В.Г. Методы билинейных аппроксимаций для решения задач оптимального управления / В.Г. Антоник, Н.С. Розинова, В.А. Срочко // Известия Иркутского государственного университета. Серия «Математика». 2011. - Т.4., №3. - С. 146-157.
6. Антоник В.Г. Вычислительное сравнение методов градиентного типа в задачах оптимального -управления / В.Г. Антоник, Н.В. Мамонова, В.А. Срочко // Известия Иркутского государственного университета. Серия «Математика». 2007. - Т.1, №1. - С.275-290.
7. Антоник В.Г. Метод нелокального улучшения экстремальных управлений в задаче на максимум нормы конечного состояния / В.Г. Антоник, В.А. Срочко // Журн. вычисл. матем. и матем. физ. 2009. -Т.49, № 5. - С.791-804.
8. Аргучинцев A.B. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума / A.B. Аргучинцев, В.А. Дыхта, В.А. Срочко // Изв. вузов. Матем. 2009. -№1.-С. 3-43.
9. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи / A.B. Арутюнов. М.: Факториал, 1997. -256 с.
10. Арутюнов A.B. Принцип максимума Поптрягина. Доказательство и приложения / A.B. Арутюнов, Г.Г. Магарил-Ильяев, В.М. Тихомиров. М.: Факториал, 2006. - 144 с.
11. Арутюнов A.B. Необходимые условия оптимальности для дискретных задач оптимального управления / A.B. Арутюнов, Б. Марин-кович // Вестник МГУ, сер. ВМК. 2005. - № 1. - С. 43-48.
12. Афанасьев А.П. Необходимое условие в оптимальном управлении / А.П. Афанасьев, В.В. Дикусар, A.A. Милютин, С.А. Чуканов. -М.: Наука, 1990. 319 с.
13. Ащепков JI.T. Лекции по оптимальному управлению: Учеб. пособие / JI.T. Ащепков. Владивосток: Изд-во Дальневосточного у-н-та, 1996. - 208 с.
14. Балашевич Н. В. Численные методы программной и позиционной оптимизации линейных систем управления / Н. В. Балашевич, Р. Габасов, Ф. М. Кириллова // Журн. вычисл. матем. и матем. фйз. -2000. Т. 40, Л* 6. - С. 838-859.
15. Батурин В. А. Приближенные методы оптимального управления, основанные на принципе расширения / В. А. Батурин, Д. Е. Урба-нович. Новосибирск: Наука, 1997. - 175 с.
16. Батурин В.А. Приближенные методы решения задач оптимального управления на основе достаточных условий оптимальности В. Ф.
17. Кротова / В.А. Батурин // Тр. XI межд. Четаевской конф. «Аналитическая механ., устойчивость и управление движением» посвященной 105-летию Н.Г. Четаева. Т.З. Управление и оптимизация. Иркутск, 2007. -С. 30-47.
18. Болдырев В.И. Численное решение задачи оптимального управления / В.И. Болдырев // Изв. РАН. Теория и системы управления. -2000. № 3. - С. 85-92.
19. Брусникина Н.Б. Расчет опорной функции множества достижимости линейной управляемой системы с гарантированной оценкой погрешности / Н.Б. Брусникина // Вестн. МГУ. Сер. Вычисл. матем. и кибернетика. 2006. - № 1. - С. 42-48.
20. Брусникина Н.Б. Аппроксимация с гарантированной точностью множеств достижимости для линейной динамической системы, подверженной импульсным воздействиям / Н.Б. Брусникина, A.B. Лотов // Ж. вычисл. матем. и матем. физ. 2007. - Т.47, № 11. ^ С. 1855-1864.
21. Булатов В. П. Методы погружения в задачах оптимизации /
22. B.П. Булатов. Новосибирск: Наука. - 1977. - 160 с.
23. Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем / A.C. Булдаев. — Улан-Удэ: Изд-во Бурятского государственного университета. 2008. — 260 с.
24. Васильев О.В. Одно замечание к алгоритму последовательных приближений, основанному на принципе максимума / О.В. Васильев // Дифференц. и интегральные уравнения. Иркутск, 1980. - С. 167-178.
25. Васильев О.В. Об одном методе решения задач оптимального уравнения, основанном на принципе максимума / О.В. Васильев, А.И. Тятюшкин // Жури, вычисл. матем. и матем. физ. 1981. - Т.21, №6.1. C.1376-1384.
26. Васильев О. В. Лекции по методам оптимизации / О.В. Васильев. Иркутск: Изд-во ИГУ, 1994. - 344 с.
27. Васильев Ф.П. Методы решения экстремальных задач / Ф.П. Васильев. М.: Наука, 1981. - 400с.
28. Васильев Ф.П. Методы оптимизации / Ф.П. Васильев. М.: Факториал Пресс, 2002. - 824с.
29. Величенко В.В. Численный метод решения задач оптимального управления / В.В. Величенко // Журн. вычисл. матем. и матем. физ. -1966. Т.6, т. - С.635-647.
30. Габасов Р. Качественная теория оптимальных процессов / Р. Габасов, Ф.М. Кириллова. М.: Наука, 1971. - 508 с.
31. Габасов Р. Оптимизация линейных систем / Р. Габасов, Ф.М. Кириллова. Минск: Изд-во Белорус, ун-та, 1973. - 146 с.
32. Габасов Р. Принцип максимума в теории оптимального управления / Р. Габасов, Ф.М. Кириллова. Минск: Наука и техника, 1974. -272 с.
33. Габасов Р. Конструктивные методы оптимизации. 4.2. Задачи управления / Р. Габасов, Ф.М. Кириллова. Минск: Изд-во "Университетское", 1984. - 207 с.
34. Габасов Р. Оптимальное управление в режиме реального времени / Р. Габасов, Ф.М. Кириллова // Вторая межд. конф. по проблемам управления: Пленарн. докл. М.: Институт проблем управления, 2003. - С.20-47.
35. Груздева T.B. Локальный поиск в задачах с невыпуклыми ограничениями / Т.В. Груздева, A.C. Стрекаловский // Ж. вычисл. матем. и матем. физ. - 2007. - Т. 47, № 3. - С. 397-413.
36. Гурман В.И. Принцип расширения в задачах управления / В.И. Гурман М.: Наука, 1997. - 288 с.
37. Демьянов В.Ф. Приблиэюенные методы решения экстремальных задач / В.Ф. Демьянов, A.M. Рубинов. JL: Изд-во ЛГУ, 1968. -180 с.
38. Демьянов В. Ф. Введение в минимакс / В. Ф. Демьянов, В. Н. Малоземов. М.: Наука, 1972. - 368 с.
39. Дикусар В.В. Качественные и численные методы в принципе максимума / В.В. Дикусар, А. А. Милютин. М.: Наука, 1989. - 144 с.
40. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации / Ю.Г. Евтушенко. М.: Наука, 1982. - 432 с.
41. Ермольев Ю.М. Конечно-разностный метод в задачах оптимального управления / Ю.М. Ермольев, В.П. Гуленко, Т.Н. Царенко. Киев: Наук, думка, 1978. - 164 с.
42. Измаилов А.Ф. Численные методы оптимизации / А.Ф. Измаилов, М.В. Солодов. М.:Физматлит, 2005. - 304 с.
43. Иоффе А.Д. Теория экстремальных задач / А.Д. Иоффе, В.М. Тихомиров. М.: Наука, 1974. - 480 с.
44. Кирин Н.Е. Вычислительные методы теории оптимального управления / Н.Е. Кирин. Л.: Изд-во ЛГУ, 1968. - 144 с.
45. Кротов В.Ф. Методы и задачи оптимального управления / В.Ф. Кротов, В.И. Гурман. М.: Наука, 1973. - 448 с.
46. Крылов И. А. О методе последовательных приближений для решения задач оптимального управления / И. А. Крылов, Ф. Л. Черно-усько // Журн. вычисл. матем. и матем. физ. 1962. - Т.2, № 6. - С. 1132-1139.
47. Крылов И. А. Алгоритм метода последовательных приближений для задач оптимального управления / И. А. Крылов, Ф. Л. Чер-ноусько // Журн. вычисл. матем. и матем. физ. 1972. - Т. 12, № 1. -С.14-34.
48. Любушин A.A. Метод последовательных приближений для расчета оптимального управления / A.A. Любушин, Ф.Л. Черноусько // Изв. АН СССР. Техн. кибернетика. 1983. - №2. - С.147-159.
49. Матвеев A.C. Оптимальные системы управления: Обыкновенные дифференциальные уравнения. Специальные задачи: Учеб. пособие / A.C. Матвеев, В.А. Якубович. СПб.: Изд-во С.-Петербург, ун-та, 2003. - 540 с.
50. Милютин A.A. Принцип максимума в общей задаче оптимального управления / A.A. Милютин. М.: Физматлит, 2001. - 304 с.
51. Милютин A.A. Оптимальное управление в линейных системах / A.A. Милютин, А.Е. Илютович, Н.П. Осмоловский, C.B. Чуканов. -М.: Наука, 1993. 268 с.
52. Моисеев H.H. Элементы теории оптимальных систем / H.H. Моисеев М.: Наука, 1975. - 528 с.
53. Никольский М.С. О достаточности принципа максимума Понтрягина в некоторых оптимизационных задачах / М.С. Никольский // Вестник Моск. Ун-та. сер.15. Вычисл.матем. и киберн. 2005. -№ 1. - С. 35-43.
54. Овсеевич A.M. Явные формулы для эллипсоидов, аппроксимирующих области достижимости / A.M. Овсеевич, Ю.В. Тарабанько // Изв. РАН. Теория и системы управления. 2007. - № 2. - С. 33-44.
55. Овсянников Д.А. Моделирование и оптимизация динамики пучков заряженных частиц / Д.А. Овсянников. — Л.: Изд-во ЛГУ, 1990. — 312 с.
56. Овсянников Д.А. Моделирование интенсивных пучков заряженных частиц / Д.А. Овсянников, О.И. Дривотин. СПб.: Изд-во СПбГУ, 2003.- 174 с.
57. Понтрягин Л.С. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.: Физматгиз, 1961. - 391 с.
58. Понтрягин Л.С. Принцип максимума / Л.С. Понтрягин. М.: Фонд матем. образования и просвещения, 1998. - 70 с.
59. Розинова (Ахмеджанова) Н.С. Исследование специального класса задач оптимального управления / Н.С. Розинова (Ахмеджанова) // Вестник Иркутского университета. Специальный выпуск. Иркутск: Ир-кут. ун-т, 2005. - С. 96-97.
60. Розинова (Ахмеджанова) Н.С. Решение задач оптимального управления на основе билинейной аппроксимации / Н.С. Розинова (Ахмеджанова) // Вестник Иркутского университета. Специальный выпуск. Иркутск: Иркут. ун-т, 2006. - С. 88-89.
61. Розинова (Ахмеджанова) Н.С. Применение локальных аппроксимаций для решения задач оптимального управления / Н.С. Розинова
62. Ахмеджанова) // V Всесибирский конгресс женщин-математиков. Материалы конференции. Красноярск, 2008. - с.31-35.
63. Розинова (Ахмеджанова) Н.С. К решению задачи па максимум нормы терминального состояния линейной управляемой системы / Н.С. Розинова (Ахмеджанова), С.Н. Ушакова // Известия вузов. Математика. 2009. - № 10. - С.63-67.
64. Розинова Н.С. Условия оптимальности в задаче максимизации разности двух выпуклых функций / Н.С. Розинова // Известия вузов. Математика. 2010. - № 10. - С.87-91.
65. Розинова Н.С. Условие оптимальности и метод поиска экстремальных точек в задаче на максимум эллипсоидальной нормы / Н.С. Розинова, В.А. Срочко // Известия Иркутского государственного университета. Серия "Математика". 2010. - Т.З - №3. - С. 93-104.
66. Розинова Н.С. Некоторые вопросы поиска экстремальных процессов в невыпуклых задачах оптимального управления / Н.С. Розинова, В.А. Срочко // Автоматика и телемеханика. 2011. - № 6. - С. 140-150.
67. Срочко В. А. Итерационные методы решения задач оптимального управления j В.А. Срочко. М.: Физматлит, 2000. - 160 с.
68. Срочко В. А. Квазиградиентпые методы решения задач оптимального управления / В.А. Срочко // Труды Института математики HAH Беларуси. Минск, 2001. - Т.7. - С. 132-141.
69. Срочко В. А. Модернизаг^ия методов градиентного типа в задачах оптимального управления / В.А. Срочко // Изв. вузов. Математика. 2002. - №12. - С.66-78.
70. Срочко В.А. Метод полной квадратичной аппроксимации в задачах оптимального управления / В.А. Срочко, С.Н. Ушакова // Известия вузов. Математика. 2004. - № 1. - С. 87-93.
71. Срочко В.А. Метод билинеаризации для решения задач оптимизации программных управлений / В.А. Срочко, С.Н. Ушакова // Изв. вузов. Математика. 2005. - № 12. - С. 63-69.
72. Стрекаловский А. С. О невыпуклых задачах оптимального управления / A.C. Стрекаловский // Вестн. МГУ. Сер. 15. Вычисл. ма-тем. и кибернетика. 1993. - № 1. - С. 9-13.
73. Стрекаловский А. С. Элементы невыпуклой оптимизации / A.C. Стрекаловский. Новосибирск: Наука, 2003. - 356 с.
74. Стрекаловский А. С. Глобальный поиск в невыпуклой задаче оптимального управления / A.C. Стрекаловский, Е. В. Шаранхаева // Журн. вычисл. матем. и матем. физ. 2005. - Т. 45, № 10. - С. 17851800.
75. Стрекаловский А. С. Задачи оптимального управления с терминальными функционалами, представленными в виде разности двух выпуклых функций / A.C. Стрекаловский // Журн. вычисл. матем. и матем. физ. 2007. - Т. 47, № 11. - С. 1865-1879.
76. Стрекаловский A.C. К решению невыпуклых задач оптимального управления с терминальным целевым функционалом / A.C. Стрекаловский, М.В. Янулевич // Вычислительные методы и программирование. 2010. - Т.Н. - С. 269-280.
77. Сухарев А.Г. Курс методов оптимизации / А.Г. Сухарев, A.B. Тимохов, В.В. Федоров. М.: Наука, 1986.
78. Тарасенко Н.В. Один метод решения задачи оптимального управления на основе интегрального принципа максимума / Н.В. Тарасенко // Дискретные и распределенные системы. Иркутск. - 1981. -С.142-150.
79. Ткачев А. М. Геометрический метод решения задачи максимизации нормы вектора состояния системы на конечном интервале управления / А. М. Ткачев // Прикладная математика и механика -1990. Т. 54, вып. 6. - С. 1036-1039.
80. Тятюшкин А.И. Численные методы и программные средства оптимизации управляемых систем / А.И. Тятюшкин. Новосибирск: Наука, 1992. - 193 с.
81. Тятюшкин А.И. Многомерная технология оптимизации управляемых систем / А.И. Тятюшкин. Новосибирск: Наука, 2006. - 343 с.
82. Федоренко Р.П. Приближенное решение задач оптимального управления / Р.П. Федоренко. М.: Наука, 1978. - 488 с.
83. Хайлов E.H. О решении задачи оптимального управления с терминальным функционалом для однородной билинейной системы / E.H. Хайлов // Вестник МГУ, сер. 15. 1998. - №1. - С. 26-30.
84. Хайлов Е.Н. Об экстремальных управлениях однородной билинейной системы, управляемой в полоэ/сителъиом ортанте / Е.Н. Хайлов // Труды математического института РАН. 1998. - Т.220. - С. 217-235.
85. Черноусько Ф. JI. Вариационные задачи механики и управления (Численные методы) / Ф.Л. Черноусько, Н. В. Баничук. М.: Наука, 1973. - 238 с.
86. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов / Ф.Л. Черноусько. М.: Наука, 1988. - 320 с.
87. Aganovich Z. The successive approximation procedure for finite-time optimal control of bilinear systems / Z. Aganovich, Z. Gajic // IEEE Transactions on Automatic Control. 1994. - Vol. 39. - № 9. - P. 1932-1935.
88. Benson H.P. Concave minimization: theory, applications and algorithms / H.P. Benson. // Horst, R. and Pardalos, P.M. (eds.), Handbook of Global Optimization, Kluwer, Dordrecht, 1995. P. 43-148.
89. Chinchuluun A. Global minimization algorithms for concave quadratic programming problems / A. Chinchuluun, R. Enkhbat, P.M. Pardalos // Optimization. 2005. - Vol. 54. - N6. - P.627-639.
90. Chinchuluun A. A novel approach for nonconvex optimal control problems / A. Chinchuluun, R. Enkhbat, P.M. Pardalos // Optimization. - 2009. - Vol. 58. - N7. - P.781-789.
91. Clarke F.H. On Global Optimality Conditions for Nonlinear Optimal Control Problems / F.H. Clarke, J.B. Hiriart-Urruty, Yu.S. Ledyaev // J. of Global Optimization. 1998. - V. 13. - Issue 2. - P. 109-122.
92. Dorroh J.R. A multistate, multicontrol problem with unbounded controls / J.R. Dorroh, G. Ferreyra // SIAM J.Contr. and Optim. 1999. -Vol. 32. - № 5. - P. 1322-1331.
93. Enkhbat R. On Some Theory, Methods and Algorithms for Concave Programming / R. Enkhbat // Optimization and Optimal Control. World Scientific Publishing Co. 2003. - P. 79-102.
94. Enkhbat R. A Numerical Approach for Solving Some Convex Maximization Problems / R. Enkhbat, B. Barsbold, M. Kamada // J. of Global Optimization. 2006. - Vol. 35. - R85-101.
95. Fortin D. Piece adding technique for convex maximization problems / D. Fortin, I. Tseveendorj // Journal of Global Optimization, 2010. Vol. 48. - № 4. - P. 583-593.
96. Fortin D. Piecewise Convex Maximization Problems: Piece Adding Technique / D. Fortin, I. Tseveendorj // J. Optimization Theory and Applications., 2011. Vol. 148. - № 3. - P. 471-487.
97. Fukushima M. A Second-Order Algorithm for Continuous-Time Nonlinear Optimal Control Problems / M. Fukushima, Y. Yamamoto // IEEE. Trans. Automat. Contr. 1986. - Vol.31. - №7. - P.673-676.
98. Hiriart-Urruty J.B. Conditions for global optimality / J.B. Hiriart-Urruty // Handbook of global optimization. Edited by Horst R., Pandalos P.M. Kluwer Academic Publishers, 1995. Vol.2. - P. 1-26.
99. Hiriart-Urruty J.B. A note on the characterization of the global maxima of a (tangentially) convex function over a convex set / J.B. Hiriart-Urruty, Y.S. Ledyaev // J. Convex Anal., 1996. Vol.3. - № 1. - P. 55-61.
100. Hofer E.P. An iterative method for the finite-time bilinear-quadratic control problem / E.P. Hofer, B. Tibken // Journ. Optimiz. Theory and Applications. 1988. - Vol. 57. - № 3. - P. 411-426.
101. Horst, R. Introduction to Global Optimization. Vol. 3 of Nonconvex Optimization and its Applications / R. Horst, P.M. Pardalos, N.V. Thoai. -Kluwer Academic, Dordrecht. 1995. - 318 p.
102. Jones D.I. Comparison of optimization algorithms / D.I. Jones, J.W. Finch // Intern. Journal of Control. 1984. - Vol. 40. - № 4. - P. 747-761.
103. Kelly H.J. Successive approximation techniques for trajectory optimization j H.J. Kelly, R.E. Kopp, H.G. Moyer // Proc. Symp. on vehicle system optimization. New York. - 1961. - P.360-391.
104. Krotov V.F. Global methods in optimal control theory / V.F. Krotov. New York: Marrcel Dekker, 1996. - 408 p.
105. Pytlak R. Numerical methods for optimal control problems with state constraints / R. Pytlak // Lecture Notes in Mathematics. Springer-Verlag. 1999. - № 1707.
106. Swierniak A. Cell Cycle as an Object of Control / A. Swierniak // Journal of Biological Systems, 1995. Vol.3. - №1. - P. 41-54.
107. Swierniak A. Some Control Problems for Simplest Differential Models of Proliferation Cycle / A. Swierniak // Applied Math, and Computer Science, 1994. Vol. 4. - №2. - P. 223-232.
108. Tuy H. D.C. optimization: theory, methods and algorithms / H. Tuy // Handbook of global optimization. Edited by Horst R., Pardalos P.M. Kluwer Academic Publishers, 1995. Vol.2. - P. 149-216.
109. Vasiliev O.V. Optimization methods / O.V. Vasiliev. Atlanta: World Federation Publishers Company Inc., 1996. - 276 p.