Конечномерные методы в прикладных задачах оптимального управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Бондаренко, Наталия Валерьевна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Конечномерные методы в прикладных задачах оптимального управления»
 
Автореферат диссертации на тему "Конечномерные методы в прикладных задачах оптимального управления"

московский государственный университет имени М. В. Ломоносова

Факультет вычислительной математики и кибернетики

Специальность 01.01.02 - дифференциальные уравнения, динамические системы и оптимальное управление

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

На правах рукописи удк 519.6:621.384.83

Бондаренко Наталия Валерьевна

Конечномерные методы в прикладных задачах оптимального управления

4 АПР 2013

Москва, 2013

005051378

005051378

Работа выполнена на кафедре оптимального управления факультета вычислительной математики и кибернетики Московского государственного университета имени М.В. Ломоносова.

Научный руководитель: кандидат физико-математических наук,

доцент Хайлов Евгений Николаевич.

Официальные оппоненты: доктор физико-математических наук,

профессор Братусь Александр Сергеевич;

доктор физико-математических наук, профессор Разгулин Александр Витальевич.

Ведущая организация: Институт математики и механики УрО РАН.

Защита состоится «24» апреля 2013 г. в 15 час. 30 мин. на заседании диссертационного совета Д 501.001.43 при Московском государственном университете имени М.В. Ломоносова по адресу: 119991, ГСП-1, Москва, Ленинские горы, МГУ, 2-й учебный корпус, факультет вычислительной математики и кибернетики, ауд. 685.

С диссертацией можно ознакомиться в библиотеке факультета ВМК МГУ

имени М. В. Ломоносова.

Автореферат разослан « » марта 2013 г.

Ученый секретарь

диссертационного совета,

доктор физико-математических наук,

профессор

Е.В. Захаров

Общая характеристика работы

Актуальность темы

Центральным результатом теории оптимального управления является принцип максимума Понтрягина, дающий общее необходимое условие оптимальности управления [1|. Этот результат и связанные с ним исследования, проведенные Л.С. Понтрягиным и его учениками, послужили толчком для стремительного развития теории управления. В настоящее время теория оптимального управления является важной областью прикладной математики. Научно-исследовательская деятельность в оптимальном управлении рассматривается как источник многих полезных на практике инструментов, таких как, напрмер, оптимальные методы лечения в медицине и стратегии поведения в экономике. Методы теории оптимального управления представляют собой совокупность целого спектра математических результатов из разных областей.

Оптимальное управление и теория оптимизации уже нашли свое отражение во многих областях моделирования и управления в машиностроении [2], и в настоящее время активно используются в биологии и медицине [3,4]. экономике и финансах [5-11]. Конкретные примеры моделирования реальных задач из биологии, медицины и экономики иллюстрируют возможности теории управления, представляющие как теоретический, так и прикладной интерес. Так в работе [12] изучается математическая модель роста клеток костного мозга при химиотерапии, в которой в качестве управления рассматривается влияние лекарственных препаратов. В работах [13, 14] рассматривается математическая модель процесса лекарственного воздействия на растущую опухоль. Ставится задача об оптимальном выборе стратегии терапии, воздействующей на опухоль, с целью минимизации количества клеток опухоли к заданному моменту времени. В работах [15,16| рассматриваются вопросы управления иммунной системой человека, пораженной вирусом нммунодефи-

цита человека (ВИЧ), связанные с продлением жизни ВИЧ-инфицированных больных. В работе [17] рассматривается управляемый аналог модели А.Д. Ба-зыкина «хищник-жертва» и для него изучается задача оптимального быстродействия. В работе [18| рассматривается задача оптимального управления эпидемией путем вакцинации и изоляции с учетом латентного периода. Целью является минимизация затрат на погашение эпидемии при имеющихся ограничениях на управление и начальных условиях. В работе [19] исследуется множество достижимости нелинейной управляемой модели из микроэкономики.

Любая задача оптимального управления для системы обыкновенных дифференциальных уравнений является задачей отыскания экстремума функционала (целевой функции) при различных ограничениях в бесконечномерном функциональном пространстве (например, пространство всех ограниченных кусочно-непрерывных функции). Это сложная математическая задача [1].

Существует целый ряд подходов, которые позволяют свести решение задач оптимального управления к анализу конечномерных задач.

В настоящей диссертации предприняты попытки перенести идеи, развитые в работах [19. 20] на нелинейные трехмерные системы, моделирующие некоторые биологические процессы.

Цели диссертационной работы

В проводимых в диссертации исследованиях ставятся следующие цели:

1. Изучить математическую модель, представляющую собой нелинейную трехмерную управляемую систему дифференциальных уравнений, описывающую процесс биологической очистки сточных вод. Исследовать свойства множества достижимости указанной системы и на их основе построить параметрическое описание этого множества с помощью моментов переключений кусочно-постоянных управлений.

2. На основе параметризации множества достижимости рассматриваемой системы разработать алгоритмы решения задачи управляемости и за-

дач быстродействия. Для задачи быстродействия «из точки на плоскость» получить оценки времени оптимального быстродействия и предложить численный алгоритм поиска такого времени, а также, используя динамические свойства множества достижимости, исследовать число решений соответствующей краевой задачи принципа максимума. Для задачи быстродействия «из точки в точку» предложить численный алгоритм поиска моментов переключений экстремальных управлений.

3. Рассмотреть для изучаемой системы задачи оптимального управления с терминальным, интегральным и терминально-интегральным функционалами и исследовать соответствующие оптимальные управления, свести решения таких задач к задачам конечномерной оптимизации.

4. Изучить математическую модель, представляющую собой нелинейную трехмерную управляемую систему дифференциальных уравнений, описывающую процесс подавления ВИЧ-инфекции. Для некоторых задач оптимального управления предложить методы оценки числа переключении соответствующих оптимальных управлений. Использовать такие оценки для сведения исходных задач к задачам конечномерной оптимизации.

5. Для всех рассмотренных задач оптимального управления для математических .моделей, описывающих процесс биологической очистки сточных вод п процесс подавления ВИЧ-инфекции соответственно, привести на основе полученных задач конечномерной оптимизации расчеты при различных значениях начальных условий и параметров изучаемых моделей, интересных для приложений.

Теоретическая и практическая значимость работы

Работа носит теоретический и практический характер. Разработанные методы могут быть использованы для решения аналогичных задач оптимального управления и для разработки численных методов исследования подобного рода моделей.

Результаты расчетов для задачи управляемости в системе, описывающей процесс биологической очистки сточных вод, проводились по просьбе группы исследователей, возглавляемой А. Коробейниковым, из университета г. Лимерик (Limerick). Ирландия для получения экспериментальных данных управления аэротенком, находящимся в Киларпп (Killarney), Ирландия. Другие предложенные в диссертационной работе методы решения различных задач оптимального управления для рассматриваемой системы также могут быть использованы при подобных практических прогнозах работы очистных устройств.

Анализ решений задач оптимального управления в модели подавления ВИЧ-инфекции может быть использован при практическом подборе лекарственных препаратов и графика их приема пациентами.

Основные методы исследования

В работе используются современные методы оптимального управления, методы дифференциальных уравнений и математического анализа, топология, теория многозначных отображений, численные методы, а также методы оптимизации. Особую роль занимает центральный результат теории оптимального управления - принцип максимума Понтрягина.

Научная новизна работы

Основные результаты диссертации являются новыми и заключаются в следующем:

1. Проведен анализ управлений, отвечающих граничным точкам множества достижимости нелинейной трехмерной управляемой системы дифференциальных уравнений, описывающей процесс биологической очистки сточных вод. Для возникшей при таком анализе неавтономной квадратичной системы дифференциальных уравнений предложено новое достаточное условие продолжимости ее решении на заданный отрезок. Это позволило получить оценку числа переключений указанных управлении, применяемую при анализе

видов оптимальных управлений в задачах быстродействия «из точки на плоскость» и «из точки в точку».

2. Для анализа свойств множества достижимости введено вспомогательное множество, состоящее из концов траекторий исходной системы, отвечающих кусочно-постоянным управлениям с не более, чем тремя переключениях!!!. Для него установлен ряд важных свойств, таких как взаимная однозначность внутренности; единственность управлений, отвечающих граничным точкам; линейная связность дополнения вспомогательного множества до всего пространства. Эти свойства позволили обосновать совпадение вспомогательного множества и множества достижимости рассматриваемой системы, что, в свою очередь, привело к параметризации последнего моментами переключений кусочно-постоянных управлений. С помощью такой параметризации построена задача Коши для системы дифференциальных уравнений для нахождения моментов переключения экстремальных управлений в задаче быстродействия «из точки в точку».

3. Проведен анализ динамики множества достижимости рассматриваемой системы в зависимости от времени, на основании которой удалось получить оценку числа решений краевой задаче принципа максимума для задачи быстродействия «из точки на плоскость». Для указанной задачи также получены оценки времени оптимального быстродействия.

4. Для трехмерной нелинейной управляемой системы дифференциальных уравнений, описывающей процесс биологической очистки сточных вод. рассмотрены задачи минимизации концентрации загрязнений в конечный момент времени, а также суммарной концентрации на заданном отрезке времени. На основании анализа системы дифференциальных уравнений для функций переключений и вспомогательных функций найдены оценки на число переключений соответствующих оптимальных управлений. На основании этих оценок предложен численный ал-

горитм, сводящий исходные задачи оптимального управления к задачам конечномерной условной оптимизации.

5. Для указанной трехмерной нелинейной управляемой системы дифференциальных уравнений рассмотрены комбинированные и смешанные задачи оптимального управления: задача минимизации взвешенной суммы концентрации загрязнений в конечный момент времени и суммарной концентрации биомассы на заданной отрезке времени; задача минимизации взвешенной суммы концентрации загрязнений в конечный момент времени и суммарных концентраций кислорода и биомассы на заданном отрезке времени; задача минимизации взвешенной суммы суммарных концентраций загрязнений и биомассы на заданном отрезке времени; а также задача минимизации взвешенной суммы суммарных концентраций загрязнений, кислорода и биомассы на заданном отрезке времени. Как и ранее, на основании похожих систем дифференциальных уравнений для соответствующих функций переключений и вспомогательных функций найдены оценки на число переключений соответствующих оптимальных управлений. Использованы похожие численные алгоритмы, сводящие исходные задачи оптимального управления к задачам конечномерной условной оптимизации.

6. Для указанной трехмерной нелинейной управляемой системы дифференциальных уравнений рассмотрена задача минимизации энергозатрат при заданном ограничении на концентрацию загрязнений в конечный момент времени. Проведен анализ соответствующей краевой задачи принципа максимума в зависимости от значений множителей Лагранжа, найдены виды соответствующих оптимальных управлений. Предложен способ упрощения краевой задачи принципа максимума, для решения которой используется численный алгоритм, основанный на методе «стрельбы».

7. Для трехмерной нелинейной управляемой системы дифференциальных уравнений, описывающей процесс подавления ВИЧ-инфекции лекарственными препаратами, проведен анализ задачи минимизации концентрации зараженных клеток в конечный момент времени и суммарной концентрации зараженных клеток на заданном отрезке. Найдены замены для сопряженных переменных, которые упрощают анализ числа пулей функции переключений. Предложены два различных метода оценивания числа переключений оптимальных управлений, опирающихся на теорему Балле-Пуссена, обобщенную теорему Ролля и представление Полия-Маммана.

8. Для рассмотренных задач оптимального управления для математических моделей, описывающих процесс биологической очистки сточных вод и процесс подавления ВИЧ-инфекции соответственно, приведены расчеты при различных значениях начальных условий и параметров изучаемых моделей, интересных для приложений.

Апробация работы.

Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:

1. Воронежская весенняя математическая школа «Понтрягиновские чтения - XXII», посвященная памяти Ю.В. Покорного (Воронеж, май 2011);

2. Международная научная конференция «Дифференциальные уравнения и смежные вопросы», посвященная памяти И.Г. Петровского (Москва, июнь 2011);

3. Научная конференция «Тихоновские чтения 2011» (Москва, июнь 2011);

4. Четвертая международная научная конференция «Современные проблемы прикладной математики, теории управления и математической физики» (Воронеж, сентябрь 2011);

5. Научная конференция «Ломоносовские чтения 2011» (Москва, ноябрь 2011);

6. Научная конференция «Дифференциальные уравнения и оптимальное управление», посвященная 90-летию со дня рождения Е.Ф. Мищенко (Москва, апрель 2012);

7. Научная конференция «Ломоносовские чтення 2012» (Москва, апрель 2012);

8. Научные семинары кафедры оптимального управления «Игровые задачи управления» под руководством Никольского М.С., Григоренко Н.Л., Ровенской Е.А.. Камзолкнна Д.В. (факультет ВМК МГУ);

9. Научный семинар кафедры оптимального управления «Качественные вопросы оптимального управления» под руководством Киселева Ю.Н., Орлова М.В., Аввакумова С.Н. (факультет ВМК МГУ);

10. Научный семинар кафедры оптимального управления «Методы оптимизации в функциональных пространствах» под руководством Васильева Ф.П., Потапова М.М., Будака Б.А. (факультет ВМК МГУ).

Публикации. Основные результаты диссертации опубликованы в тринадцати работах: четыре статьи в изданиях, рекомендованных ВАК: |Ш]-[К4], три статьи в тематических сборниках: шесть тезисов докладов: [N8]-

[N13]. Полный список работ, в которых опубликованы результаты диссертации, приведен в конце автореферата.

Структура и объем диссертации.

Диссертация состоит из введения, трех глав, заключения и списка литературы. Текст изложен на 219 страницах, диссертация содержит 50 рисунков и 16 таблиц. Список литературы включает 120 наименований.

Краткое содержание работы

Во введении раскрывается актуальность темы работы, приводится краткое описание задач оптимального управления и результатов, относящихся к теме диссертации. Кратко излагается структура и содержание работы по главам.

Первая глава диссертации посвящена анализу множества достижимости нелинейной системой трех дифференциальных уравнений со скалярным управлением, описывающей процесс биологической очистки сточных вод на заданном отрезке времени.

В разделе 1.1 обосновывается актуальность задачи биологической очистки сточных вод, описывается общая схема работы очистного устройства, проводится обзор исследований, посвященных данной тематике.

В разделе 1.2 рассматривается математическая модель, описывающая указанный процесс, которая после «обезразмеривания» выглядит следующим образом:

¿(0 = ~х(1)у{1)г{Ь) + и{1){т - *(£))> t б [О, Г], № =

2(0) = х0, 2/(0) = г/о, г(0) = г0, х0 € (0, т), у0 > 0, г0 > 0.

Физически система описывает химическую реакцию трех реагентов: кислорода с концентрацией х((), загрязнений с концентрацией у{г), термофильной аэробной биомассы с концентрацией г{Ь).

Нелинейность системы обосновывается законом действующих масс [21].

Здесь и(€) характеризует подкачку кислорода в очистное устройство и является управляющей функцией, на которую наложено ограничение: 0 < «(£) < итах. Всевозможные измеримые по Лебегу функции, принимающие свои значения из этого ограничивающего отрезка, образуют множество допустимых управлений П(Т).

Задача Кошн (1) рассматривается на отрезке времени [0, Т) и включает начальные условия х0. у0% г„, которые подчиняются .ограничениям: концентрации в начальный момент времени положительны и существует ограничение сверху т на подкачку кислорода в начальный момент времени; т -

константа насыщения кислорода в устройстве.

Проводится анализ неуправляемой системы, который показывает, что даже при отсутствии подкачки кислорода в устройство, на некотором промежутке времени происходит снижение концентрации загрязнений.

В разделе 1.3 исследуются свойства фазовых переменных системы (1), для которых устанавливается справедливость следующего утверждения.

Лемма 1 Пусть задано произвольное управление и(-) 6 D(T). Тогда соответствующие решения x(t), y{t), z(t) системы уравнений (1) определены на всем отрезке [О, Т] и удовлетворяют неравенствам:

О < x(t) < хтах, 0 < y(t) < У max 1 0 < z(t) < Zmax„ t 6 (О, T], (2)

где хтах = т, утах = у0, zmax =

Затем для системы (1) вводится множество достижимости Х(Т). Оно оказывается компактным множеством в Я3, расположенным в положительном ортанте. Для исследования границы такого множества привлекается принцип максимума Понтрягина [22].

Делая замену переменных в сопряженной системе, получаем неавтономную линейную систему дифференциальных уравнений для функции переключений L(t) и некоторых вспомогательных функций G(t), P(t):

' L[t) = u(t)L(t) + y(t)z(t)G(t), t e [0,T], < G(t) = u(t)L(t) + d(t)G{t) + bP{t), (3)

[ P(t) = —x(t)y(t)G(t) + bP(t).

С помощью последовательных нелинейных замен переменных [25| система (3) приводится к почти диагональному виду (остаются диагональные и наддиагональные элементы, все остальные - обнуляются). Такой переход называется триангуляцией, а матрица такой линейной системы - триангулпро-

ванной.

Функции q{t) = (Ql(t), <h(t), <n(t))T, осуществляющие такие замены переменных, удовлетворяют квадратичной системе дифференциальных уравнений:

Ш = qT(t)Al(t)q(t) + bj(t)q(t) + Cï{t), Ш = qT(t)A2{t)q{t) + bj(t)q(t) + ф), (4)

Ш = 4T{t)A3{t)q(t) + bj(t)q{t) + c3(t);

где Ai(t), bi(t), Ci(t),i = 1,3 симметричные матрицы, векторы и функции, соответственно, зависящие от переменных и параметром системы (1). Знак т означает транспонирование.

Для системы (4) получено новое достаточное условие продолжимости ее решений на заданный отрезок, которое заключается в выполнении условия В2 - 4АС > 0, где А, В, С - некоторые положительные константы, зависящие от параметров системы (1) и ограничений (2) на фазовые переменные системы (1). Константы А, В, С позволяют получить дифференциальное неравенство для нормы ||ç(£)||:

d dt

(llî(Oll) < A\\q(t)\\2 + fl||g(f)|| +c,te Л, (5)

где Д - наибольший интервал существования решения ||д(4)||.

Далее, избавляясь от свободного члена С в неравенстве (5) и используя некоторую вспомогательную задачу Кошн, с помощью теоремы Чаплыгина о дифференциальных неравенствах [23] и следствия из Леммы о пепродолжа-емом решении [241, удается получить описанное выше достаточное условие продолжимости решений системы(4) на заданные отрезок [0,Т].

Тогда триангулированная система также определена на всем отрезке, и из ее анализа уже можно сделать вывод о количестве нулей функции переключений £(£), на основании которого формулируется следующее утверждение.

Теорема 1 Пусть точка ЦТ) = (х{Т),у{Т), г{Т))Т принадлежит гра-

нице множества достижимости Х{Т) системы (1). Тогда отвечающее этой точке управление ы(4) является кусочно-постоянной функцией, которая принимает значения {0; мтлг} и имеет не более двух переключений на отрезке [0,Т].

Для построения параметризации множества достижимости Х(Т) введено вспомогательное множество 2(Т), состоящее из концов траекторий исходной системы (1) ги{Т). отвечающих кусочно-постоянным управлениям вида (6).

Для это рассматривается множество Л(Т) = = (0ь02,#з)Т 6 : 0 < 01 < &2 < 6з < т} и для каждой точки 0 € Л(Т) определяется управление ид(-) е.О(Т) по формуле

Ug(t) = <

Umax ■. если 0 < t < в\,

0 . если 01 < г < 02,

Umax : есл" < i < 03,

0 , если е3 <t<T,

(6)

и отображение F(-, Т) : Л(Т) R3 определяется по правилу

F(0, Т) = we(T), 0еЛ(Т),

где iu9(t) = (ar0(t), 2re(i))T, t € [0, T] - решение системы (1), отвечающее управлению ue(t).

Тогда вспомогательное множество Z{T) определяется по формуле:

Z{T) = F(A{T),T).

Для Z(T) имеют место следующие утверждения.

Теорема 2 Выполняются равенства:

р(ша(т), Т) = тщт), г(дЛ{т),т) = эг{т), (7)

и сужение отображения Р{-,Т) на внутренность множества Л(Т) взаимно однозначно.

Здесь гпЫ3 и <9<2 обозначают внутренность и границу множества С}.

Из определения множества достижимости Х{Т) и вспомогательного множества г(Т), а также Теоремы 1 и Теоремы 2 следуют включения:

ЦТ) с х(Т), 5Х(Т) сэг{т).

Имеет место еле,дующее утверждение, позволяющее показать обратное включение Х(Т) С

Лемма 2 Множество Я3 \ г(Т) линейно-связное.

Указанные свойства множества г(Т) позволили обосновать следующее важное утверждение, которое, в свою очередь, привело к параметризации множества достижимости системы (1) Х(Т) моментами переключений кусочно-постоянных управлений.

Теорема 3 Для множества достижимости Х(Т) системы (1) и вспомогательного лшожества г(Т) имеет место равенство Х(Т) = 2(Т).

Попутно доказано еще одно интересное свойство множества достижимости А (Т). Оно утверждает единственность управлений, отвечающих граничным точкам этого множества, и является непосредственным следствием Теоремы 2.

Лемма 3 Пусть 0и 02 - различные точки множества дА(Т), а - отвечающие им управления, заданные на отрезке [0,7") 13

формулой (6), для которых

meas{t в [О, Г] : u0l{t) ф щ2{1)} > О.

Предположим, что управления u9l{t)., ug.2{t) отвечают одной и той же точке w границы множества Z(T). Тогда эти управления совпадают, то есть ue,{t) = ue2{t) для всех t € [О, Т].

Здесь meas - мера Лебега множества fí1.

На рисунках 1 - 2 приведены примеры множеств достижимости Х(Т) для системы (1), построенные в Matlab с использованием результатов Теоремы 3.

Рис. 1. Х{Т) для Хо = 1. да = 1, = Рис- 2. Х(Т) для х0 = 0.0011: уо =

1 m = 2 6=1, Umax = 4, Т = 1 38.3406, z0 = 0.1643, m = 0.0274, i =

0.24, uraax = 4, T = 6

Установленное параметрическое описание множества достижимости Х(Т) применяется в анализе его динамических свойств и при решении задач оптимального управления для системы (1), рассматриваемых во второй главе диссертации, для которых также предлагаются алгоритмы их решения и приводятся численные результаты, реализованные на С + + и визуализированные в МаИаЬ. Анализ некоторых представленных во второй главе диссертации задач оптимального управления также базируется на достаточном условии о продолжимости решения некоторых вспомогательных систем

дифференциальных уравнений, подобных (4), полученных в результате применения принципа максимума Поптрягипа.

Раздел 2.1 посвящен задаче управляемости в математической модели очистки сточных вод. Она заключается в отыскании момента времени Т и управления м(-) е D{T), которое переводит систему (1) из заданной начальной точки w0 = (z0, Уо, z0)T в заданную конечную точку ил = (хи уи zi)T.

В терминах множества достижимости рассматриваемая задача переписывается следующим образом. Требуется найти такой момент времени Т, для которого справедливо включение ил € Х(Т). Используя построенную параметризацию множества Х(Т), задача управляемости может быть переформулирована в задачу конечномерной минимизации вспомогательной функции G{0,T) = O.5-||F(0, Г)-wi||2 по переменным 0 = (0Ь 02, 0.ч)т е Л(Т) и Т > 0.

Вводится следующее предположение.

Предположение 1 Пусть существует момент времени Т и управление ы(-) е D(T) такие, что для соответствующих решений w{t) = fa), y(t), щ)Т системы (1) выполняется равенство и>(Т) = w\.

Лемма 4 Пусть выполнено Предположение 1. Тогда минимум функции G(0, Т) на множестве А(Т) х (0, +оо) равен нулю.

Липшицевость этой функции по соответствующим переменным обуславливает сходимость метода проекции градиента [26], применяемого для решения соответствующей экстремальной задачи.

Раздел 2.2 посвящен анализу задали быстродействия «из точки на плоскость». Задача заключается в отыскании такого управления ы(-) <5 D(T), что траектория (x(t), y(t), z(t))T переводит исходную систему из начального состояния Wo в конечное состояние «л, характеризующееся выполнением условия у(Т) = yi, yi < уо за минимальное время Т. Значение yv определяет заданный уровень концентрации загрязняющих веществ, которого требуется достичь.

Предположение 2 Пусть существует момент времени Т и управление й(-) е О(Т) такие, что для соотвстпствуюи^их решений х(г), у(Ь), ¿(г) системы (1) выполняется равенство у{Т) = у\.

С учетом Предположения 2 на основании проведенного анализа множества достижимости Х(Т) системы (1), применяя принцип максимума Понт-рягина [1] и проводя анализ возможных значений множителей Лагранжа, получен вид оптимальных управлений для рассматриваемой задачи:

О , если 0 < t < 0г,

"max : если 0, < t < Т,

где в, € [О, Т.) - момент переключения.

Рассматриваемая задача сводится к задаче конечномерной минимизации функции

С(в, Т) = ТЛ-1(в\ + {Т- вз)2 + ((F(0, Т), I) - У1))2).

по переменным в 6 Л(Т) иТб [Tmln, TmaJ. Здесь 7 - положительный весовой множитель, I = (О, 1,0)т.

Лемма 5 Пусть выполнено Предположение 2. Тогда минимум функции G(0, Т) на множестве А(Т) х [Tmin, Tmax] равен Т.

Липшицевость функции G{&, Т) по переменным в, Т обуславливает сходимость метода проекции градиента [2G], применяемого для решения соответствующей экстремальной задачи.

Здесь Tmin - нижняя оценка оптимального времени быстродействия. Tmin находится из анализа второго уравнения системы (1) как решение следующего уравнения:

Тету»т = J_ln (У°

mz0 \у\ 16

Tmax - верхняя оценка оптимального времени быстродействия. Поиск Ттах основан на решении следующей вспомогательной задачи:

min

по переменным 0 £ А(Т) и Т > Tmin. При условии, что выполняется Предположение 2, минимизируемая функция в рассматриваемой задаче равна нулю.

Проведен анализ динамики множества достижимости Х(Т) относительно плоскости П = {w = (х,у, z)T G Л3 : у = ?7l}, на основании которого получено следующее важное утверждение.

Лемма 6 Earn sup{T > Т, : Х{Т) П П ф 0} < +оо, то решения два: оптимальное и экстремальное. Если sup{T > Т» : Х(Т) П П ф 0} = +=>о. то решение одно - оптимальное.

В разделе 2.3 диссертации исследуется вопрос нахождения моментов переключений эктремального управления в задаче быстродействия «из точки в точку», которая заключается в переводе системы (1) из начальной точки w0 в конечную точку иц за минимальное время.

Используя Предположение 1 и привлекая построенную в первой главе диссертации параметризацию множества достижимости Х(Т) системы (1), предлагается численный алгоритм решения рассматриваемой задачи.

На нервом этапе решается описанная в разделе 2.1 диссертации задача управляемости системы (1), результатом которой является отыскание пары (0Т0), которая удовлетворяет равенству wi = F(0°, Т0) и включению 90 € intA(T0). Она и составляет начальное условие некоторой вспомогательной задачи Коши для моментов переключения, в решении которой и заключается второй этап алгоритма. Интегрирование такой задачи проводится справа налево путем сочетания разностной схемы для нахождения очередного приближения с коррекцией последнего методом Ньютона [2С|. Критерием окон-

чания вычислений является следующее соотношение:

тт{#1(Т), Т — вз(Т)} = О,

здесь Т - искомое время, для которого компоненты 0ДТ), г = 1,3 являются значениями моментов переключений экстремального управления и(4).

Раздел 2.4 посвящен анализу задачи минимизации концентрации загрязнений в конечный момент времени и задачи минимизации суммарной концентрации загрязнений на заданном временном отрезке для системы (1):

J(u) = у(Т) min , J{u)= I y{t)dt —> min w yv ' u(-)eD(T) Ja u()eD{T)

Для указанных задач в диссертации описаны виды оптимальных управлений. В первой задаче оптимальное управление имеет не более, чем одно переключение, и следующий вид:

«.(О

О , если 0 < t < 0t, "max если 0* < t < Т,

где 0, е [О, Т) - момент переключения.

Во второй задаче оптимальное управление либо имеет не более, чем одно переключение, и следующий вид:

ЭД =

где 0* е [О, Т) - момент переключения,

О ; если 0 < t < 0», ?imax , если 0* < t <Т,

либо является кусочно-постоянной функцией с двумя переключениями вида

где О [.О з € (О, Т) - моменты переключения.

В основе полученных результатов лежит анализ системы дифференциальных уравнений для функции переключений и вспомогательных функций, подобной системе (3), представленной в первой главе диссертации.

Далее в разделе 2.5 рассматриваются две задачи оптимального управления с комбинированными функционалами.

Первая задача оптимального управления заключается в минимизации взвешенной суммы концентрации загрязнений в конечный момент времени и суммарной концентрации биомассы на заданной отрезке времени

где 7 - заданное положительное число.

Вторая задача оптимального управления заключается в минимизации взвешенной суммы концентрации загрязнений в конечный момент времени и суммарных концентраций кислорода и биомассы на заданной отрезке времени

где а, (3 - заданные положительные числа.

Используя принцип максимума Понтрягнна и рассуждения, подобные представленным в первой главе, показано, что в первой задаче оптимальное

итах , если О<£<0;, ?Ц£) = 0 , если 0\<Ь<

Итах , если 0'2<Ь<Т,

управление имеет не более, чем одно переключение, и следующий вид:

и. («) =

О , если 0 <£<<?»,

«шах , если в, < £ < Т,

где О» 6 [О, Т) - момент переключения.

Для второй задачи оптимальное управление имеет либо не более, чем одно переключение, и один из следующих видов:

и,(£)

«шах , если 0 <t <

, если 0„ < Ь <Т.

О , если 0 <£<(?,, '«тах , если 0* < £ < Т.

где 0» € [О, Т] - момент переключения:

либо является кусочно-постоянной функцией с двумя переключениями видов

О , если 0 < £ < в\, итах , если в{ < £ < в\, «*(£) = • О , если #2 < £ < Г,

^тах , если 0 < £ < в\,

0 , если < £ < 0*2,

итах , если в 2 < £ < Т,

где 01,02 € (О, Т) - моменты переключения.

В основе полученных результатов лежит анализ системы дифференциальных уравнений для функции переключений и вспомогательных функций, подобной системе (3), представленной в первой главе диссертации.

Наконец, в разделе 2.6 диссертации изучены две смешанные задачи оптимального управления.

Первая задача оптимального управления заключается в минимизации взвешенной суммы суммарных концентраций загрязнений и биомассы на

заданном отрезке времени

гТ

7{и)= [ (у(4)+7*(*))Л

■) о

—> Ш1П .

«(•)еО(Г)'

где 7 - заданное положительное число.

Вторая задача оптимального управления заключается в минимизации взвешенной суммы суммарных концентраций загрязнений, кислорода и биомассы на заданном отрезке времени

Аи)= ГШ^ тт

Уо и(-)бО(Т)

где а, /3 - заданные положительные числа.

В первой задаче в зависимости от значения параметра 7 с помощью принципа максимума Понтрягина конкретизируется вид оптимального управления.

При 7 < 1 оптимальное управление либо имеет не более, чем одно переключение, и следующий вид:

й,(£) = 1

О , если 0 < £ < 0„ «шах , если < I < Т,

где 0, € [О, Т) - момент переключения;

либо является кусочно-постоянной функцией с двумя переключениями вида

«.(£) =

^тах , если 0 < £ < 0{,

0 , если 01 < £ < 0 2*

^та х , если в 1 < £ < Т,

где в 1, вп € (0. Т) - моменты переключения.

При 7 > 1 оптимальное управление либо имеет не более, чем одно переключение, и следующий вид:

и*(£) = <

"тах : если 0 < £ < в,. О , если 0, < £ < Т.

где 0, € (О, Т\ - момент переключения;

либо является кусочно-постоянной функцией с двумя переключениями вида

0 , если 0 < £ < 0{,

м.(£) = < "^гпах , если д\<1< д^

0 , если 0'2<г< т,

где 01,02 € (О,Т) -моменты переключения.

Во второй задаче при а < 1 оптимальное управление либо имеет не более, чем одно переключение, и следующий вид:

м,(£) = <

■Итах : если 0 < £ < 0,, О , если 0, < Ь <Т.

где в, 6 (О, Т] - момент переключения;

либо является кусочно-постоянной функцией с двумя переключениями вида

и, (£) = <

0 , если 0 < £ < 0\,

^шах , если п<г< о*2,

0 , если 0 2* < £ < Т,

где в\,в*2 € (О, Т) - моменты переключения;

либо является кусочно-постоянной функцией с тремя переключениями вида

¡.(О =

Umax , еСЛИ 0 < t < О J,

О , если 01 < t < 0*2,

г¿тах , если (>2<t<03,

О , если 0$ < t <Т,

где 0 {,0*,, 0 з е (О, Т) - моменты переключения.

При а > 1 оптимальное управление может иметь один из следующих видов:

u,{t) = <

^rnax

о

^max

о

, если о<г<<?;,

, если 0\<t<0*2,

u,(t) =

„если 0JU<t<C, . если 0*<t<T,

О , если Q < t < 0\, "max , если 0 \ < t < 0

, если в*к_х < t <

О , сели 0*к <t <Т,

где 0* € (О,Т) - соответствующие моменты переключений, т, к - число переключений в соответствующих задачах.

В основе полученных результатов лежит анализ системы дифференциальных уравнений для функции переключений и вспомогательных функций, подобной системе (3), представленной в первой главе диссертации.

Все задачи оптимального управления, изученные в разделах 2.5 - 2.6, можно рассматривать как свертки критериев в многокритериальных задачах минимизации.

Раздел 2.7 посвящен исследованию задачи оптимального управления, заключающейся в минимизации энергетических затрат, необходимых на подкачку кислорода, при условии снижения концентрации загрязнений до задан-

ного уровня Ух < т/о В конечный момент времени:

1 Г

J(u)=~ u2(t)dt—>■ min , у(Т) < ух.

Проведен анализ соответствующей краевой задачи принципа максимума в зависимости от значений множителей Лагранжа, оптимальное управление имеют либо не более, чем одно переключение, и следующий вид:

u,(t) = <

. если 0 < t < 0„ , если 0, < t <Т,

где е [0, Т) - момент переключения,

либо является непрерывной функцией одного из следующих видов:

= гшп{£(£); итах}, « € [О, Т), если 8{Ь) > 0 при всех £ <Е (0,Т];

«*(£) = <

0 , если 0 < t < 0„

min{<5(£); umax} , если 0t < t < Т,

если нашлось значение 0, € (0,Т), для которого 6(0.) = 0. Здесь - вспомогательная функция, зависящая от переменных и параметров системы (1), переменных сопряженной системы и множителя Лагранжа, в, - момент переключения.

Предложен численный алгоритм решения краевой задачи принципа максимума, основанный на методе «стрельбы».

Данный алгоритм реализован в среде С++. Графики оптимальных управлений для начальных данных и параметров системы (1) Хо = 2, у0 = 2, г0 = 0.1, тп = 2.5, 6 = 1, хк = 1.29, Ук = 1.99, гк = 1.53 представлены рисунках

3 - 5.

В третьей главе диссертации исследуются задачи оптимального управления в управляемой математической модели подавления ВИЧ-ннфекции.

В Разделе 3.1 обосновывается актуальность задачи подавления ВИЧ-инфекции, ставится математическая модель, представляющая собой управляемую систему трех нелинейных дифференциальных уравнений

, «О-gg®-*<"■ («)

z(t) = v(t) - dz(t),

x(0) = .то, y(0) = y0: ^(0) = 20; x0, y0, г0 > 0,

которая описывает процесс лечения ВИЧ-заболевания и основана на неуправляемой модели [15|.

В системе (8): x(t) - концентрация здоровых (нотифицированных) клеток, y(t) - концентрация инфицированных клеток, a z(t) - концентрация противовирусных препаратов в момент времени t.

Предполагаются, что регенерация здоровых клеток производится с постоянной скоростью Л. Слагаемые fix{t), 6y(t) описывают концентрации умерших здоровых и инфицированных клеток соответственно.

Управление иммунным ответом осуществляется с помощью функции v(t). Она задает интенсивность поступления лекарственных препаратов п подчи-

няется ограничениям: 0 < umin < v(t) < Umaxi t e [0; Ц. Препараты удаляются из организма пациента со скоростью dz(t).

Предполагается, что в отсутствие лечения уровень заболеваемости составляет 0x(t)y(t). Множитель (1 + pz(t))~l отражает торможение процесса заболеваемости под воздействием антиретровирусных препаратов.

Для удобства анализа задачи оптимального управления в системе (8) делается замена w = /3(1 + pz)~l и вводится новая управляющая функция u(t) = P~l(d + pv(t)) с соответствующими ограничениями: umin = P~l(d + pvmin), Mmax = p~l(d + pvmax) и определяется новое начальное условие ш„ = /3(1 + pzo)~l.

Тогда вместо системы (8) далее рассматривается задача Коши вида:

x{t) = ~x{t)y{t)w{t) - ,ix(t) + Л, t € [0,Т], y(t) = x(t)y(t)w(t) - Sy(t), w(t) = dw(t) - u(t)w2(t), x(0) = xq, y(0) = y0, w(0) = w0; x0: y0, w0 > 0.

Классом допустимых управлений D(T) являются всевозможные измеримые по Лебегу функции u(t), удовлетворяющие при почти всех t в [0, Т] неравенствам: 0 < umin < u(t) < umax.

Для системы (9) имеет место следующее утверждение.

Лемма 7 Пусть u(-) е D(T) - произвольное управление. Тогда соответствующие решения x(t), y{t), w{t) системы (9) определены на всем отрезке [0, Т] и удовлетворяют неравенствам:

xmin < x(t) < xmax, ymin < y(t) < ymax, Wmin < w(t) < Wmaxj t e [о, T], (10)

где величины xmin, xm&x, ymin, ymax, wmin, u>max - некоторые положительные константы, зависящие от начальных условий и параметров системы (9).

Для системы (9) рассматриваются две задачи оптимального управления. Первая задача заключается в минимизации концентрации зараженных клеток в конечный момент времени:

Вторая задача заключается в минимизации суммарной концентрации зараженных клеток на заданном отрезке времени:

Найдены замены для сопряженных переменных., которые упрощают анализ числа нулей функции переключений.

Для обеих задач в случае если 6 < ц оптимальное управление является постоянной функцией вида

Другими словами, в рассматриваемых задачах оптимального управления в случае, когда коэффициент смертности инфицированных клеток не превышает коэффициента смертности здоровых клеток, необходимо поступление лекарственных препаратов в организм пациента с максимальной интенсивностью.

Для обеих задач имеет место следующее утверждение.

Лемма 8 Существует такое значение т £ [О, Т), что на интервале (г, Т) функция переключений оптимального управления ы(£) положительна.

Это означает, что на отрезке [т, Т] оптимальное управление всегда больше нуля.

J(u) = -> шш .

•Д)еЛ(Г)

и,(Ь) = мтах, £ е [0,Т].

'тах

Для оценки числа переключений оптимальных управлений в рассматриваемых задачах в случае 6> ц предложены два различных метода, опирающихся на теорему Валле-Пуссена [27], обобщенную теорему Ролля [25] и представление Полия-Маммана [27|.

В результате для случая 6> ц в первой и во второй задаче оптимальное управление является кусочно-постоянной функцией следующего вида:

umin , если < t < 0*п.

«шах , если 0*m<t<T,

где в*, г - 1, т - моменты переключения, т - соответствующие полученные оценки на число переключений.

На основе найденных оценок реализованы численные алгоритмы приближенных решений двух рассмотренных задач. На рисунках С - 8 представлены графики функции y{t) для второй задачи оптимального управления для следующих начальных данных системы (8):

х0 = 5, i/o = 1, z0 = 10, d = 100, vrnin = 0.1, vmax = 5, /3 = 18, q = ц = 1.3, ¿ = 40, Л =13, 1.

Интервал времени [0, Т] для указанных начальных данных в реальной жизни соответствует 100 дням лечения пациента.

В заключение выражаю глубокую признательность своему научному руководителю, доценту Хайлову E.H. за постановки задач, терпение, поддержку и неоценимую помощь при подготовке диссертации. Хочу поблагодарить профессора Васильева Ф.П., профессора Никольского М.С., профессора Гри-горенко Н.Л., профессора Потапова М.М. за методические рекомендации и

28

Рис. 6. График у(£) при нулевом управлении

Рис. 7. График у(£) при постоянном максимальном управлении

Рис. 8. График у(Ь) при оптимальном управлении (3 переключения)

обсуждения результатов во время подготовки диссертационной работы.

Публикации по теме диссертации

[N1] Бондаренко Н. В. Решение задачи управляемости для системы дифференциальных уравнений, моделирующей процесс биологической очистки сточных вод // Биотехнология. 2012. 4. С. 71-73.

[N2] Grigorieva E.V., Bondarenko N.V., Khailov E.N., Korobeinikov A. Three-dimensional nonlinear control model of wastewater biotreatment // Neural. Parallel, and Scientific Computations. 2012. V. 20. P. 23-36. [N3] Бондаренко H.B., Григорьева Э.В., Хайлов Е.Н. Решение задачи управляемости для одной нелинейной трехмерной системы // Вестник Московского Университета. Секция ^..Вычислительная математика и кибернетика, 2012. Т. 36. 1. С. 9-14.

[N4] Бондаренко Н.В., Григорьева Э.В., Хайлов Е.Н. Задачи минимизации загрязнений в математической модели биологической очистки сточных вод // Журнал вычислит, математики и мат. физики. 2012. Т. 52. 4. С. 614-627. [N5| Grigorieva E.V., Bondarenko N.V., Khailov E.N., Korobeinikov A. Finite-dimensional methods for optimal control of autothermal thermophilic aerobic digestion // Industrial Waster, edited by K.Y. Show and X. Guo. InTech. 2012. P. 91-120.

[N6] Бондаренко H.B., Григорьева Э.В., Хайлов Е.Н. Множество достижимости трехмерной нелинейной системы, описывающей процесс очистки сточных вод // Проблемы Динамического Управления. Сборник научных трудов под ред. Осипова Ю.С., Кряжимского А.В. 2010. 5. С. 28-41. [N7] Бондаренко Н.В., Григорьева Э.В., Хайлов Е.Н. Некоторые задачи оптимального управления процессом биологической очистки сточных вод // Проблемы Динамического Управления. Сборник научных трудов под ред. Осипова Ю.С.. Кряжимского А.В. 2012. 6. С. 25-44.

[N8] Бондаренко Н.В., Григорьева Э.В., Хайлов Е.Н. О некоторых задачах оптимального управления // Международная конференция «Ломоносовские

чтения - 2011». Сборник тезисов «Ломоносовские чтения - 2011». 2011. С. 87-88.

[N9| Бондаренко Н.В. Параметризация множества достижимости одной нелинейной управляемой системы // Воронежская весенняя математическая школа «Понтрягиновскис чтения - 22». Сборник тезисов «Современные методы теории краевых задач. Материалы». 2011. С. 34-35.

[N10| Бондаренко Н.В., Григорьева Э.В., Хайлов E.H. О параметрическом описании множества достижимости трехмерной нелинейной управляемой системы // Международная конференция «ДУ и смежные вопросы» посвященная памяти Петровского. Сборник тезисов «23 совместное заседание Московского математического общества и семинара Петровского». 2011. С. 155. [Nll| Бондаренко Н.В., Григорьева Э.В., Хайлов E.H. О решении задачи управляемости для одной нелинейной трехмерной системы со скалярным управлением // Научная конференция «Тихоновские чтения 2011». 2011. Тезисы докладов научной конференции «Тихоновские чтения». С. 15-16. [N12] Бондаренко Н.В., Григорьева Э.Б., Хайлов E.H. О решении задачи быстродействия для одной нелинейной трехмерной системы со скалярным управлением //IV Международная научная конференция Воронеж. 2011 г. Сборник тезисов «Современные проблемы прикладной математики, теории управления и математического моделирования». С. 40-42. [N13] Бондаренко Н.В., Григорьева Э.В., Хайлов E.H. Задача минимизации энергозатрат в модели биологической очистки сточных вод // Научная конференция «Дифференциальные уравнения и оптимальное управление», посвященная 90-летию со дня рождения академика Е.Ф. Мищенко. 2012 г. С. 25-27.

Цитированная литература

[1] Поитрягин Л.С., Болтянский В.Г., Гамкрслидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов // Москва: Изд-во Наука, 1983.

[2] Сю Д., Мейер А. Современная теория автоматического управления и ее применение // Москва: Изд-во Машиностроение, 1972.

[3] Lenhart S., Workman J. Т. Optimal control applied to biological model // London: Chapman 2 hall/CRC, 2007.

[4] Братусъ А.С., Ножилов А.С., Платонов А.П. Динамические системы и модели в биологии // Москва: Изд-во Физматлит, 2010.

[5] Anita S., Arnautu V., Capasso V. An introduction to optimal control problem in life science and economics // Springer, New-York-Dordrecht-Heidelberg-London, 2011.

[6| Беленький В.З. Оптимизационные модели экономической динамики. Беллмановский подход // Москва: Изд-во Наука, 2007.

[7| Москеленко А.И. Оптимальное управление моделями экономической динамики // Новосибирск: Изд-во Наука, 1999.

[8] Косочев Ю.В. Экономико-математические модели эффективности финансово-промышленных структур // Москва: Изд-во Хогос, 2004.

[9] Асеев С.М., Кряжимский А.В. Принцип максимума Понтрягина и задачи оптимального экономического роста ,// Труды матиематического института им. В. А. Стеклова. Т. 257. Москва: Изд-во Наука, 2007.

[10) Sethi S.P., Thompson G.L. Optimal control theory: Applications to management science and economics // Kluwer Academic Publishers. 2003.

32

[11] Caputo M.R. Foundations of dynamic economic analysis // Optimal control. 2005.

[12] Lt'.dzcwicz U., Schattler H. Controlling a model for bone marrow dynamics in cancer chemotherapy // Mathematical Biosciences and Engineering. 2004. V. 1, № 1. P. 95-110.

{13j Братпусь А. С., Чумерипа E. С. Синтез оптимального управления в задаче выбора лекарственного воздействия на растущую опухоль /'/ Журнал вычислит, математики и мат. физики, 2008. 6. Т. 48. С. 946-966.

[14| Лнтпипов А.В., Братусь А.С. Математическая модель оптимальной стратегии химиотерапии с учетом динамики числа клеток неоднородной опухоли // Журнал вычислит, математики и мат. физики, 2009. 11. Т. 49. С. 1907-1919.

[15] Wodarz D., Christensen J., Thomsen A. The importance of lytic and nonlityc immune responce in viral infection // Trends in Immunology, 2002. 23. № 4. P. 194-210.

[16[ Величеико В.В., Притыкип Д.А. Управление лечением СПИДа // Автомат. и телемех. 2006. № 3. С. 166-185.

[17] Никольский М.С. Об одной задаче оптимального управления, связанной с общей моделью А.Д. Базыкина «хищник - жертва» //' Дифференциальные уравнения. 2011. Т. 47. № 11. С. 1638-1645.

[18] Овсянникова Н.И. Задача оптимального управления эпидемией с учетом латентного периода // Системы управления и информационные технологии, 2009. 2.1 (36). С. 166-170.

(19] Grigorieva E. V., Khailov E.N. Attainable set of a nonlinear controlled microeconomic model // Journal of Dynamical and Control Systems. 2005. 11. No 2. P. 157-176.

(20] Grigorieva E.V., Khailov E.N. Attainable Set of a Nonlinear Controlled System Describing the Process of Production and Sales of a Consumer Good // Проблемы Динамического Управления, Сборник научных трудов под редакцией Осипова Ю.С., Кряжимского А.В. 1. Москва: Изд-во МАКС ПРЕСС, 2005. С. 312-331.

(21] Краснов КС., Воробьев Н.К., Годнее И.Н. и др. Физическая химия. Электрохимия. Химическая кинетика и катализ // Москва: Изд-во Высшая Школа, 1995.

[22| Ли Э. В., Маркус Л. Основы оптимального управления // Москва: Изд-во Наука, 1972.

[23] Тихонов А.Н., Васильева А.В., Свешников А.Г. Дифференциальные уравнения // Москва: Изд-во Наука, 1980.

[24] Демидович В.П. Лекции по математической теории устойчивости // Москва: Изд-во Наука, 1967.

[25] Дмитрук А.В. Об одном обобщении оценки числа нулей решения линейного дифференциального уравнения // Труды ВНИИ системных исследований. 1990. j\a 1. С. 28-41.

[26] Васильев Ф.П. Методы оптимизации // Москва: Изд-во Факториал Пресс, 2002.

[27| Сансонс Док. Обыкновенные дифференциальные уравнения. Том 1 // Москва: Изд-во иностранной литературы, 1953.

Подписано в печать 18.03.2013 Формат 60x88 1/16. Объем 1.0 п.л. Тираж 75 экз. Заказ № 1304 Отпечатано в ООО «Соцветие красок» 119991 г.Москва, Ленинские горы, д.1 Главное здание МГУ, к. А-102

 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Бондаренко, Наталия Валерьевна, Москва

московский государственный университет имени м. В. Ломоносова

Факультет вычислительной математики и кибернетики Кафедра оптимального управления

04201355434 На правах рукописи

удк 519.6:621.384.83

Бондаренко Наталия Валерьевна

Конечномерные методы в прикладных задачах

оптимального управления

Специальность 01.01.02 - дифференциальные уравнения, динамические системы и оптимальное управление

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель доцент Е. Н. Хай лов

Москва, 2013

Оглавление

Введение 5

Глава 1. Управляемая математическая модель очистки сточных вод. Ее множество достижимости 28 §1.1. Задача очистки сточных вод...................28

1.1.1. Актуальность задачи....................28

1.1.2. Общая схема работы аэротенка..............32

1.1.3. Обзор исследований, посвященных процессу управления АТАБ...........................35

§ 1.2. Математическая постановка задачи очистки сточных вод . . 37

1.2.1. Исходная управляемая математическая модель.....37

1.2.2. Приведенная управляемая математическая модель ... 39

1.2.3. Анализ неуправляемой математической модели.....40

§ 1.3. Анализ управляемой математической модели .........46

1.3.1. Свойства фазовых переменных системы.........46

1.3.2. Множество достижимости приведенной системы и его свойства............................51

1.3.3. Примеры квадратичных дифференциальных уравнений, решения которых существуют на заданном отрезке . 62

1.3.4. Вспомогательное множество и его свойства.......66

1.3.5. Параметрическое описание множества достижимости приведенной системы ....................84

1.3.6. Численный анализ и построение множества достижимости приведенной модели .................86

Глава 2. Задачи управления в математической модели очистки

сточных вод 89

§2.1. Задача управляемости ......................89

2.1.1. Постановка и решение задачи управляемости......89

2.1.2. Численные результаты исследования...........91

§ 2.2. Задача быстродействия «из точки на плоскость» .......92

2.2.1. Постановка и решение задачи быстродействия .....92

2.2.2. Поиск нижней и верхней оценок времени оптимального быстродействия........................108

2.2.3. Численные результаты исследования...........112

§ 2.3. Нахождение моментов переключений экстремального управления в задаче быстродействия «из точки в точку» .......114

§ 2.4. Две задачи минимизации концентрации загрязнений.....121

2.4.1. Постановка задач оптимального управления.......121

2.4.2. Применение принципа максимума Понтрягина.....122

2.4.3. Свойства функций переключений.............125

2.4.4. Типы оптимальных управлений..............129

2.4.5. Решения задач оптимального управления........129

2.4.6. Результаты численных расчетов .............131

§ 2.5. Две задачи оптимального управления с комбинированными

функционалами............................132

2.5.1. Постановка задач оптимального управления.......132

2.5.2. Применение принципа максимума Понтрягина.....132

2.5.3. Свойства функции переключений в задаче (В).....135

2.5.4. Типы оптимального управления в задаче (В)......136

2.5.5. Решение задачи (В) ....................136

2.5.6. Свойства функции переключений в задаче (В).....137

2.5.7. Типы оптимального управления в задаче (В)......138

2.5.8. Решение задачи (В) ....................139

2.5.9. Результаты численных расчетов .............140

§ 2.6. Две смешанные задачи оптимального управления.......142

2.6.1. Постановка задач оптимального управления.......142

2.6.2. Применение принципа максимума Понтрягина.....143

2.6.3. Свойства функции переключений в задаче (S).....145

2.6.4. Типы оптимального управления в задаче (S)......148

2.6.5. Решение задачи (S).....................150

2.6.6. Свойства функции переключений в задаче (S) при а < 1150

2.6.7. Типы оптимального управления в задаче (S) при а < 1 154

2.6.8. Решение задачи (S) при а < 1 ..............155

2.6.9. Анализ задачи (S) при а>1...............155

§ 2.7. Задача минимизации энергозатрат при ограничении на концентрацию загрязнений в конечный момент времени.......158

2.7.1. Постановка задачи оптимального управления......158

2.7.2. Анализ задачи оптимального управления........159

2.7.3. Алгоритм решения задачи оптимального управления . 166

Глава 3. Задачи оптимального управления в управляемой математической модели подавления ВИЧ-инфекции 170 § 3.1. Постановка задачи подавления ВИЧ-инфекции........170

3.1.1. Актуальность задачи....................170

3.1.2. Постановка математической модели...........173

§ 3.2. Задача оптимального управления минимизации концентрации зараженных клеток в конечный момент времени ......177

3.2.1. Анализ оптимального управления при <т < ц......179

3.2.2. Анализ оптимального управления при а > ¡1......181

3.2.3. Решение задачи оптимального управления минимизации концентрации зараженных клеток в конечный момент времени.........................187

§ 3.3. Задача оптимального управления минимизации суммарной

концентрации зараженных клеток на заданном отрезке времени 188

Заключение 199

Введение

Центральным результатом теории оптимального управления является принцип максимума Понтрягина, дающий общее необходимое условие оптимальности управления [1]. Этот результат и связанные с ним исследования, проведенные Л.С. Понтрягиным и его учениками, послужили толчком для стремительного развития теории управления. В настоящее время теория оптимального управления является важной областью прикладной математики. Научно-исследовательская деятельность в оптимальном управлении рассматривается как источник многих полезных на практике инструментов, таких как, напрмер, оптимальные методы лечения в медицине и стратегии поведения и принятия решений в экономике. Методы теории оптимального управления представляют собой совокупность целого спектра математических результатов из разных областей.

Оптимальное управление и теория оптимизации уже нашли свое отражение во многих областях моделирования и управления в машиностроении [2], и в настоящее время активно используются в биологии и медицине [3,4,60-62], экономике и финансах [5-11,63], в моделях государственной безопасности [57], в квантовой динамике [58], в экологии [59]. Конкретные примеры моделирования реальных задач из биологии, медицины и экономики иллюстрируют возможности теории управления, представляющие как теоретический, так и прикладной интерес. Так в работе [12] изучается математическая модель роста клеток костного мозга при химиотерапии, в которой в качестве управления рассматривается влияние лекарственных препаратов. В работах [13,14] рассматривается математическая модель процесса лекарственного воздействия на растущую опухоль. Ставится задача об оптимальном выборе стратегии терапии, воздействующей на опухоль, с целью минимизации количества клеток опухоли к заданному моменту времени. В работах [15,16] рассматриваются вопросы управления иммунной системой человека, пораженной вирусом иммунодефицита человека (ВИЧ), связанные с продлением

жизни ВИЧ-инфицированных больных. В работе [17] рассматривается управляемый аналог модели А.Д. Базыкина «хищник-жертва» и для него изучается задача оптимального быстродействия. В работе [18] рассматривается задача оптимального управления эпидемией путем вакцинации и изоляции с учетом латентного периода. Целью является минимизация затрат на погашение эпидемии при имеющихся ограничениях на управление и начальных условиях. В работе [19] исследуется множество достижимости нелинейной управляемой модели из микроэкономики.

Любая задача оптимального управления для системы обыкновенных дифференциальных уравнений является задачей отыскания экстремума функционала (целевой функции) при различных ограничениях в бесконечномерном функциональном пространстве (например, пространство всех ограниченных кусочно-непрерывных функции). Это сложная математическая задача [1].

Существует целый ряд подходов, которые позволяют свести решение задач оптимального управления к анализу конечномерных задач.

1. Применение принципа максимума Понтрягина [1], который сводит задачу оптимального управления к анализу двухточечной краевой задачи принципа максимума. Эта краевая задача конечномерная, в том смысле, что ее решения, вектор фазовых и сопряженных переменных зависят от начального или терминального состояний, которые относятся к элементам конечномерного евклидова пространства. Оптимальное управление однозначно определяется по, так называемому, условию максимума. Из рассмотрения исключаются случаи существования особых управлений [66], а также ситуации, когда у управления существует бесконечное число переключений на конечном интервале времени [67]. Поэтому подходящее управление зависит от переменных, выбранных в качестве исходного или терминальных состояний фазового вектора и сопряженной переменных. Таким образом, задача оптимального управления сводится к конечномерной задаче, для решения которой известны различные методы [20,21].

2. Динамическое программирование [22-24], основанное на принципе оп-

тимальности Беллмана, который формулируется следующим образом: оптимальное управление обладает тем свойством, что каково бы ни было начальное состояние и управление в начале процесса, последующее управление должно быть оптимальным управлением относительно состояния, полученного после начальной стадии процесса. Исходная задача дискретизируется на выбранной сетке. Производные заменяются их разностными аналогами, интегралы - соответствующими интегральными суммами. Ключевая идея в динамическом программировании достаточно проста. Как правило, чтобы решить поставленную задачу, требуется решить отдельные части задачи (подзадачи), после чего объединить решения подзадач в одно общее решение. Часто многие из этих подзадач одинаковы. Динамическое программирование состоит в том, чтобы решить каждую подзадачу только один раз, сократив тем самым количество вычислений. Недостатком такого подхода, предполагающего численное вычисление, является рост объемов вычислений с измельчением сетки.

3. Третий и четвертый подходы предполагают сведение задач оптимального управления к задачам линейного [20] и нелинейного [21,25,26,65] программирования. Исходная задача дискретизируется на выбранной сетке. Производные заменяются их разностными аналогами, интегралы - соответствующими интегральными суммами. Сведение к задачам нелинейного программирования производится, когда решение исходной задачи оптимального управления осуществляется в классе кусочно-постоянных или кусочно-непрерывных управлений, число переключений фиксировано, но его выбор ничем не обоснован. Функционал задачи становится функцией конечного числа переменных - переключений функции управления. Недостаток - рост объема вычислений с увеличением числа переключений [27-30].

Преодоление указанных недостатков заключается в применении сразу несколь ких описанных выше подходов в совокупности: предварительном аналитическом анализе рассматриваемой задачи оптимального управления для получения оценки числа переключений оптимального управления и информации о его структуре с помощью принципа максимума Понтрягина, а затем исполь-

зование методов численного анализа и нелинейного программирования. Для билинейных систем подобный анализ проводился в [31-33,64], в том числе для прикладных задач биологической очистки в [34,35], для задач оптимального управления экономической динамикой в [36]. Подобный подход для решения задачи очистки сточных вод, моделируемой нелинейной трехмерной системой дифференциальных уравнений, рассмотрен во второй главе настоящей диссертации, для решения задачи лечения ВИЧ-инфекции - в третьей главе настоящей диссертации.

Для сведения задачи оптимального управления к конечномерной задаче бывает полезным параметризовать множество достижимости рассматриваемой системы дифференциальных уравнений, то есть описать его конечным числом параметров. Существует различные способы такого описания: пиксельный метод [105-107] и set-oriented метод [108,109]. Отдельно выделим описание множества достижимости (его границы и внутренности) с помощью моментов переключений кусочно-постоянных управлений. Для линейных систем с различными ограничениями на управления такое описание рассматривалось в работах [38-40]. Для билинейных систем применение этой параметризации к решению задач оптимального управления описано в работах [41-47], для нелинейных управляемых систем на плоскости - в работах [19,48-50].

В настоящей диссертации предприняты попытки перенести идеи, развитые в работах [19, 50] на нелинейные трехмерные системы, моделирующие некоторые биологические процессы.

В проводимых в диссертации исследованиях ставились следующие цели:

1. Изучить математическую модель, представляющую собой нелинейную трехмерную управляемую систему дифференциальных уравнений, описывающую процесс биологической очистки сточных вод. Исследовать свойства множества достижимости указанной системы и на их основе построить параметрическое описание этого множества с помощью моментов переключений кусочно-постоянных управлений.

2. На основе параметризации множества достижимости рассматриваемой системы разработать алгоритмы решения задачи управляемости и задач быстродействия. Для задачи быстродействия «из точки на плоскость» получить оценки времени оптимального быстродействия и предложить численный алгоритм поиска такого времени, а также, используя динамические свойства множества достижимости, исследовать число решений соответствующей краевой задачи принципа максимума. Для задачи быстродействия «из точки в точку» предложить численный алгоритм поиска моментов переключений экстремальных управлений.

3. Рассмотреть для изучаемой системы задачи оптимального управления с терминальным, интегральным и терминально-интегральным функционалами и исследовать соответствующие оптимальные управления, свести решения таких задач к задачам конечномерной оптимизации.

4. Изучить математическую модель, представляющую собой нелинейную трехмерную управляемую систему дифференциальных уравнений, описывающую процесс подавления ВИЧ-инфекции. Для некоторых задач оптимального управления предложить методы оценки числа переключений соответствующих оптимальных управлений. Использовать такие оценки для сведения исходных задач к задачам конечномерной оптимизации.

5. Для всех рассмотренных задач оптимального управления для математических моделей, описывающих процесс биологической очистки сточных вод и процесс подавления ВИЧ-инфекции соответственно, привести на основе полученных задач конечномерной оптимизации расчеты при различных значениях начальных условий и параметров изучаемых моделей, интересных для приложений.

Работа носит теоретический и практический характер. Разработанные методы могут быть использованы для решения аналогичных задач оптимального управления и для разработки численных методов исследования подобного рода моделей.

Результаты расчетов для задачи управляемости в системе, описывающей процесс биологической очистки сточных вод, проводились по просьбе группы исследователей, возглавляемой А. Коробейниковым, из университета г. Лимерик (Limerick), Ирландия для получения экспериментальных данных управления аэротенком, находящимся в Киларни (Killarney), Ирландия. Другие предложенные в диссертационной работе методы решения различных задач оптимального управления для рассматриваемой системы также могут быть использованы при подобных практических прогнозах работы очистных устройств.

Анализ решений задач оптимального управления в модели подавления ВИЧ-инфекции может быть использован при практическом подборе лекарственных препаратов и графика их приема пациентами.

В работе используются современные методы оптимального управления, методы дифференциальных уравнений и математического анализа, топология, теория многозначных отображений, численные методы, а также методы оптимизации. Особую роль занимает центральный результат теории оптимального управления - принцип максимума Понтрягина.

Публикации автора по теме диссертации представлены в конце настоящей работы [121-133].

Автор выражает глубокую признательность своему научному руководителю, доценту Хайлову E.H. за постановки задач, терпение, поддержку и неоценимую помощь при подготовке диссертации, а также поблагодарит профессора Васильева Ф.П., профессора Никольского М.С., профессора Григоренко Н.Л., профессора Потапова М.М. за методические рекомендации и обсуждения результатов во время подготовки диссертационной работы.

Первая глава диссертации посвящена анализу множества достижимости нелинейной системой трех дифференциальных уравнений со скалярным управлением, описывающей процесс биологической очистки сточных вод на заданном отрезке времени.

В разделе 1.1 обосновывается актуальность задачи биологической очист-

ки сточных вод, описывается общая схема работы очистного устройства, проводится обзор исследований, посвященных данной тематике.

В разделе 1.2 рассматривается математическая модель, описывающая указанный пр�