Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Булдаев, Александр Сергеевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Улан-Удэ
МЕСТО ЗАЩИТЫ
|
||||
2005
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
На правах рукописи
Булдаев Александр Сергеевич
НЕЛОКАЛЬНЫЕ УЛУЧШЕНИЯ И МЕТОДЫ ВОЗМУЩЕНИЙ В ПОЛИНОМИАЛЬНЫХ И ДРУГИХ НЕЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
01.01.09 - дискретная математика и математическая кибернетика
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук
Иркутск - 2005
Работа выполнена в Бурятском государственном университете
Официальные оппоненты
Аргучинцев Александр Валерьевич доктор физико-математических наук
Гурман Владимир Иосифович доктор технических наук, профессор
Шутяев Виктор Петрович
доктор физико-математических наук, профессор
Ведущая организация: Санкт-Петербургский государственный университет
Защита состоится 11 ноября 2005 г. в 11 часов на заседании диссертационного совета Д 212.074.01 в Иркутском государственном университете по адресу: 664003, г. Иркутск, ул. Карла Маркса 1, Институт математики, экономики и информатики
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (бульвар Гагарина, 24)
Автореферат разослан « ? » октября 2005 г.
Ученый секретарь диссертационного совета,
М.А. Аргучинцева
\1G\Z
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Современное многообразие методов оптимального управления обусловлено непрерывно возникающими потребностями приложений во многих областях науки, техники и экономики. Прикладные задачи отличаются друг от друга различными особенностями, такими как размерность пространства состояний, типы нелинейностей, структура ограничений, многоэкстремапьность, вырожденность и т.д. Трудно ожидать появления универсальной вычислительной процедуры, являющейся достаточно эффективной для расчета разнообразных задач управления. Поэтому оправдана и актуальна разработка специализированных методов оптимального управления, ориентированных на учет особенностей классов прикладных задач.
Исторически развитие вычислительных методов в задачах оптимального управления тесно связано с теорией необходимых и достаточных условий оптимальности, а также с получением различных конструкций и аппроксимаций целевых функционалов. Из существующих подходов в этой области можно выделить следующие основные направления:
1) Методы улучшения в пространстве управлений, характеризующиеся операцией слабого или игольчатого варьирования управления (градиентные процедуры, методы принципа максимума, методы принципа расширения);
2) методы варьирования управляемого процесса в пространстве переменных состояния и управления, к которым можно отнести методы решения краевой задачи принципа максимума, квазиградиентные процедуры и методы фазовых аппроксимаций функционала;
3) методы конечноразностной аппроксимации на основе частичной или полной дискретизации задачи по управлению и состоянию с редукцией к технологии математического программирования.
Эти направления развивались в работах A.B. Аргучинцева, В.А. Батурина, О.В. Васильева, Ф.П. Васильева, Р. Габасова, В.И. Гурмана, Ю.М. Данилина, В.Ф. Демьянова, В.В. Дикусара, Ю.Г. Евтушенко, Ю.М. Ермольева, Ф.М. Кирилловой, Н.Е. Кирина, В.Ф. Кротова, И.А. Крылова, A.A. Любушина, A.A. Милютина, H.H. Моисеева, А.И. Москаленко, Д. Пшеничного,
A.M. Рубинова, В.А. Срочно, Р.П. Федоренко, Ф.Л. Черноусько, D.Q. Mayne, Е. Polak, K.L. Тео и многих других исследователей.
В качестве альтернативных направлений отметим:
группу неклассических методов поиска программных и позиционных оптимальных управлений для линейных и других классов систем, предложенных в трудах Р. Габасова, Ф.М. Кирилловой;
методы решения задач с импульсными управлениями и разрывными траекториями (В.И. Гурман, В.А. Дыхта, С.Т. Завалищин, Б.М. Миллер, А.Н. Сесекин и др.);
методы глобальной оптимизации в невыпуклых задачах специальной структуры, построенные в работах A.C. Стрекаловского;
вариационные методы решения некоторых классов задач математической физики, представляемых как задачи оптимального управления начально-краевыми условиями (В.И. Агошков, Ж.-Л. Лионе, Г.И. Марчук, В.П. Шутяев и др.).
Алгоритмическое и программное обеспечение методов оптимального управления вместе с численным решением тестовых и модельных задач рассматривалось в работах А.Ю. Горнова, Н.И. Грачева, Ю.Г. Евтушенко, А.И. Тятюшкина, Р.ГТ. Федоренко и др.
Аппарат теории управления возник, развивался и непрерывно совершенствовался в связи с техническими системами. Вместе с тем новые области применения теории управления постоянно стимулировали интенсивное развитие ее идей и методов, разработку специфических приемов анализа новых систем. Одной из областей, привлекающей к себе внимание математиков, является быстро прогрессирующая последние десятилетия иммунология, что обуславливается необходимостью скорейшего разрешения важнейших медицинских проблем: рак, пересадка органов и тканей, инфекционные болезни, иммунотерапия. О важности изучаемой проблемы свидетельствует ставшее уже традиционным проведение международных конференций, посвященных математическому моделированию в иммунологии и медицине.
С 1975 г. под руководством Г.И. Марчука был построен и исследован ряд математических моделей иммунного процесса при инфекционных заболеваниях, описываемых системами обыкновенных дифференциальных уравнений с запаздыванием. Результаты выполненных ~меатедований показали пригодность
i «-«»»'■* J
. г Ю
используемых модельных принципов для адекватного описания динамики иммунного ответа. Эти результаты являются основой для перехода к следующему этапу моделирования - построению моделей конкретных заболеваний с целью их практического применения для решения задач прогноза и управления иммунным процессом в ходе шболевания. Проведенные исследования определили интерес к задачам оптимального управления иммунным процессом, где управления рассматриваются как функции от времени, отражающие возможные фармакологические или физиологические воздействия на иммунный процесс с целью лечения заболевания. Методология оптимального управления на настоящем этапе математического моделирования в иммунологии выступает как средство исследования моделей, доказательства их непротиворечивости и адекватности реальным процессам, проверки гипотез, решения проблем управляемости и т. д. Положение дел здесь таково, что в целом вопросы об адекватности введения управлений и выборе критериев оптимизации при постановке задач оптимального управления процессами иммунного ответа еще нуждаются в дальнейших исследованиях. В связи с этим представляется актуальным разработка специализированных методов вместе с алгоритмическим и программным обеспечением для эффективного решения класса задач оптимального управления, ориентированного на характерные особенности моделей управления иммунным процессом. Данное обеспечение может являться инструментом автоматизации исследований и основой мобильных экспертных автоматизированных систем принятия решений, не требующих трудоемкой экспериментальной настройки оптимизационных методов на конкретную задачу.
Характерными особенностями рассматриваемого класса задач управления иммунным процессом являются:
полиномиальность (2-5 порядка) управляемой системы и функционалов по вектору состояния;
простая структура функциональной зависимости управляемой системы и функционалов по вектору управления и управляющим параметрам (как правило, линейность по управлению);
относительно большая размерность управляемой системы по вектору состояния (4-15 переменных) и малая размерность по вектору управления (как правило, скалярные функции времени);
простая структура множества значений управления и управляющих параметров системы (как правило, параллелепипедные ограничения);
жесткость управляемой системы, обусловленная различием на несколько (2 - 3) порядков характерных времен изменения переменных состояния;
наличие постоянных запаздываний (от 1 до 5) в управляемой системе по вектору состояния;
нефиксированный момент окончания процесса управления, наличие функциональных ограничений (как правило, от I до 2).
Эти особенности обуславливают высокую трудоемкость численного решения задач указанного класса известными итерационными методами локального улучшения, где на каждой итерации производится параметрический поиск улучшающего управления, включающий контроль выполнения функциональных ограничений задачи. При этом операция параметрического варьирования управления может приводить к труднореализуемым на практике расчетным управлениям, а локальность улучшения - к неудовлетворительным значениям показателей качества управления. Отметим, что сходимость указанных методов по невязке принципа максимума делает невозможным улучшение экстремальных управлений (удовлетворяющих принципу максимума).
В последние годы в работах В.А. Срочко и его учеников разработаны методы нелокального улучшения управлений в линейных по состоянию системах, основанные на нестандартных формулах приращения функционала без остаточных членов разложений (точные формулы). Трудоемкость нелокального улучшения определяется ценой решения двух задач Коши. Отсутствие операции параметрического варьирования управления на каждой итерации и возможность улучшения экстремальных управлений обуславливают повышенную эффективность построенных методов. Представляется актуальным и перспективным развитие этого направления по пути построения методов нелокального улучшения для класса квадратичных и общих полиномиальных по состоянию задач оптимального управления, в частности - при моделировании иммунного процесса.
Цели работы и задачи исследования. Основными цепями диссертационной работы являются:
конструирование специализированных методов для численного решения полиномиальных по состоянию задач оптимального управления;
модификация и применение разработанных методов в модельных задачах управления иммунным процессом с учетом их специфических особенностей;
создание алгоритмического и программного обеспечения для решения рассматриваемого класса задач оптимального управления.
Диссертационная работа состоит из двух частей. В первой части (главы 1-5) специальные методы разрабатываются и обосновываются в классе полиномиальных по состоянию задач оптимального управления без функциональных ограничений на фиксированном интервале времени. Эти задачи являются определяющими для проблем управления экологическими, медико-биологическими процессами и обычно рассматриваются в качестве типовых вспомогательных задач. Разработанный подход распространяется на общий класс нелинейных задач оптимального управления без функциональных ограничений (основные задачи).
В диссертации впервые разработаны методы, в которых нелокальность улучшения обеспечивается в квадратичной задаче оптимального управления и достигается ценой решения краевой задачи для обыкновенных дифференциальных уравнений. Такая краевая задача улучшения значительно проще краевой задачи принципа максимума и сводится к двум задачам Коши в линейном случае. Предложенный подход к нелокальному улучшению на основе решения краевой задачи был обобщен на полиномиальный по состоянию класс задач оптимального управления, в том числе с запаздыванием.
Структура предложенной краевой задачи нелокального улучшения допускает очевидное выделение линейной по состоянию части, которая решается с помощью двух задач Коши и совпадает с краевой задачей в линейном случае. Это свойство позволило применить и обосновать известный в вычислительной математике метод возмущений для ее эффективного решения. Рассматриваемый подход не содержит операцию параметрического поиска последовательных приближений и в целом формирует новые методы возмущений для нелокального улучшения в задачах оптимального управления.
Суть предлагаемых методов возмущений состоит во введении параметра в исследуемую задачу так, чтобы при некотором значении параметра задача, называемая невозмущенной, имела простое или очевидное решение. Как правило, невозмущенная задача соответствует нулевому значению параметра возмущения. Для решения возмущенных задач при фиксированном ненулевом значении параметра возмущения строятся итерационные алгоритмы, в которых на каждой итерации решается задача, аналогичная по сложности невозмущенной задаче. При этом, в качестве начального приближения итерационного процесса, используется решение возмущенной задачи, полученное при меньшем значении параметра возмущения.
Построенные методы возмущений не гарантируют релаксацию по целевому функционалу на каждой итерации, но компенсируют это свойство отсутствием операции параметрического поиска улучшающего управления, получением практически приемлемых решений, простотой реализации и настройки метода на конкретную задачу. Эти свойства являются существенными факторами повышения эффективности решения нелинейных задач оптимального управления.
Во второй части диссертации (главы 6, 7) проводится адаптация разработанных методов к специфике задач оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями - неравенствами.
Численные эксперименты, проведенные в работе, в целом продемонстрировали лучшие количественные (число решенных задач Коши, значение целевого функционала) и качественные (реализуемость управления, аппроксимация оптимального управления) показатели расчетов тестовых и модельных задач построенными методами возмущений по сравнению со стандартными методами локального улучшения.
Выделим основные задачи диссертационного исследования.
1. Разработка и обоснование:
методов нелокального улучшения и методов возмущений без параметрического варьирования последовательных приближений в полиномиальных по состоянию задачах оптимального управления и оптимизации управляющих параметров;
методов возмущений для решения основных задач оптимального управления и оптимизации управляющих параметров.
2. Постановка и классификация задач оптимального управления иммунным процессом при инфекционных заболеваниях на основе математических моделей.
3. Адаптация и применение методов нелокального улучшения и методов возмущений в задачах оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями - неравенствами.
4. Создание алгоритмического и программного обеспечения для разработанных методов.
Основные результаты диссертации, выносимые на защиту.
1. В нелинейном полиномиальном по состоянию классе задач ошимального управления, включающих системы с запаздыванием, построены конструктивные формулы приращения функционала, не содержащие остаточных членов разложений. На основе этих формул разработаны методы нелокального улучшения. Получены новые необходимые условия оптимальности управления, усиливающие принцип максимума в рассматриваемом классе задач.
2. Для решения вспомогательной краевой задачи нелокального улучшения в пространстве состояний и эквивалентного условия улучшения в пространстве управлений сконструированы методы возмущений, которые не содержат операцию параметрического варьирования последовательных приближений. Получены и обоснованы условия сходимости итерационных процессов методов возмущений.
3. В классе основных задач оптимального управления, включающих системы с запаздыванием, построены методы возмущений для решения краевой задачи принципа максимума и проекционного необходимого условия оптимальности. Проанализирована сходимость методов и проведены сравнительные расчеты тестовых задач.
4. В задачах оптимизации управляющих параметров (управлений) полиномиальных по состоянию систем, включающих системы с запаздыванием и с кусочно-постоянными управляющими функциями (дискретными управлениями), построены конструктивные формулы приращения целевой функции, не содержащие остаточных членов разложений. На основе полученных
формул разработаны методы нелокального улучшения управляющих параметров и дискретных управлений. Получены новые необходимые условия оптимальности управляющих параметров и дискретного управления, усиливающие дифференциальный принцип максимума в рассматриваемом классе задач.
5. Для решения вспомогательной задачи о неподвижной точке в процедурах нелокального улучшения управляющих параметров разработаны методы возмущений без операции варьирования последовательных приближений. Сконструированы методы возмущений для поиска управлений, удовлетворяющих дифференциальному принципу максимума и эквивалентному проекционному условию оптимальности в классе основных задач оптимизации управляющих параметров. Даны условия сходимости итерационных процессов методов возмущений.
6. Поставлены и классифицированы задачи оптимального управления иммунным процессом при инфекционных заболеваниях организма на основе математических моделей, разработанных под руководством Г.И. Марчука. По ограничениям на управление задачи интерпретируются как задачи лечения заболевания.
7. Методы нелокального улучшения и методы возмущений адаптированы для решения полиномиальных по состоянию задач оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями -неравенствами. Создано алгоритмическое и программное обеспечение предложенных методов для численного решения рассматриваемого класса задач. Проведен сравнительный анализ разработанных и стандартных методов численного решения модельных задач управления иммунным процессом.
Научная новизна.
Все полученные теоретические результаты являются новыми, вносят существенный вклад в конструктивную теорию оптимального управления и определяют перспективное направление исследований в плане разработки нелокальных методов для численного решения нелинейных задач. Проведенный анализ открывает новые возможности для эффективного применения метода возмущений в рамках задач оптимального управления, когда в качестве объектов параметризации предлагается использовать краевую задачу улучшения и необходимые условия оптимальности.
Рассмотрены новые нестандартные постановки задач оптимального управления на основе математических моделей иммунного процесса, которые интерпретируются как задачи оптимального лечения при заболеваниях. Разработано математическое и программное обеспечение для численного решения этих задач.
Теоретическая и практическая ценность.
Показана принципиальная возможность осуществления нелокального улучшения в нелинейном полиномиальном по состоянию классе задач оптимального управления с помощью решения краевой задачи для обыкновенных дифференциальных уравнений, которая значительно проще краевой задачи принципа максимума. Предложенные методы нелокального улучшения позволили обосновать новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. Разработан новый подход к численному решению нелинейных полиномиальных по состоянию и основных задач оптимального управления, включающих задачи с запаздыванием, с функциональными ограничениями - неравенствами, на основе процедуры возмущений условий нелокального улучшения и условий оптимальности управления. Предлагаемые методы возмущений не требуют параметрического поиска улучшающего приближения на каждой итерации, имеют возможность строго улучшать неоптимальные управления, удовлетворяющие принципу максимума и получать реализуемые на практике управления. Указанные особенности методов позволяют существенно повысить эффективность решения нелинейных задач.
Разработаны постановки задач управления иммунным процессом на основе математических моделей, интерпретируемых как задачи лечения инфекционных заболеваний. Создано алгоритмическое и программное обеспечение решения задач построенными методами нелокального улучшения и методами возмущений, которое позволяет практически находить экстремальные управления в рассматриваемых моделях и давать им содержательную интерпретацию. Данное обеспечение является инструментом автоматизации исследований и может использоваться в экспертных автоматизированных системах принятия решений. Результаты численных экспериментов показывают принципиальную возможность использования методов оптимального управления для
исследования процессов иммунного ответа при инфекционных заболеваниях. Содержательные результаты исследования моделей иммунных процессов с помощью методов оптимального управления могут быть рекомендованы для анализа, имитации и интерпретации реальных данных, проверки гипотез и планирования экспериментов.
Полученные результаты используются в учебных спецкурсах «Численные методы оптимального управления», «Дополнительные главы оптимального управления», для выполнения курсовых и дипломных работ студентов специальности «Прикладная математика и информатика» Бурятского государственного университета и Восточно-Сибирского государственного технологического университета.
Результаты диссертации являются частью исследований в рамках грантов Российского фонда фундаментальных исследований (проекты 05-01-00477,05-01-00659).
Личный вклад автора. Все основные результаты, включенные в диссертацию, получены автором лично. В совместных работах [14 -16] соавтору А Д. Мижидону принадлежит разработка и постановка задач оптимизации управляющих параметров виброзащитных систем. В совместной работе [21] О.В. Васильевым написано общее введение и поставлена задача нелокального улучшения управлений в квадратичных системах. Указанные результаты соавторов в диссертационную работу не включены.
Апробация работы. Основные результаты работы докладывались и обсуждались на
международном рабочем совещании «Математическое моделирование в иммунологии и медицине» (Киев, 1989); International Conference «Modelling and Computer methods in Molecular Biology and Genetics» (Новосибирск, 1990); 11-й, 12-й, 13-й международных Байкальских конференциях «Методы оптимизации и их приложения» (Иркутск, 1998, 2001, 2005);
международной конференции «Математика в восточных регионах Сибири» (Улан-Удэ, 2000);
1-й, 2-й международных конференциях «Идентификация систем и задачи управления, SICPRO» (Москва, Институт проблем управления РАН, 2000, 2003);
4-м Сибирском конгрессе по прикладной и индустриальной математике, ИНПРИМ - 2000 ( Новосибирск, 2000);
- 5lh IFAC Symposium «Nonlinear Control Systems, NOLCOS'Ol» (Санкт-Петербург, 2001);
International Conference of Mathematics (Улан-Батор, Монголия, 2001);
1-й, 2-й международных конференциях «Математика, ее приложения и математическое образование» (Улан-Удэ, 2002, 2005);
International Conference on Optimization and Optimal Control (Улан-Батор, Монголия, 2002);
International Congress of Mathematicians (Пекин, Китай, 2002);
всероссийской конференции «Инфокоммуникационные и
вычислительные технологии и системы» (Улан-Удэ, 2003);
3-й международной конференции «Математика, информатика и
управление, МНУ - 2004» (Иркутск, 2004);
IFAC Workshop «Generalized Solutions in Control Problems, GSCP-
04» (Переславль-Залесский, Институт программных систем РАН,
2004);
семинаре «Математическое моделирование в иммунологии и медицине» Института вычислительной математики РАН г. Москва (рук. д-р.физ.-мат.наук, проф. А.А Романюха, 2003); объединенном семинаре Улан-Удэнского филиала Института динамики систем и теории управления СО РАН и Бурятского государственного университета (рук. д-р.физ.-мат.наук, проф. В.А. Батурин, 2004, 2005);
семинаре Института динамики систем и теории управления СО РАН (рук. чл.-корр. РАН, проф. С.Н. Васильев, 2005); семинаре кафедр методов оптимизации, вычислительной математики и механики Иркутского государственного университета (рук. д-р.физ.-мат.наук, проф.В.А. Срочко, 2004,
2005);
научных конференциях и семинарах Восточно-Сибирского государственного технологического университета (1995-2002), Бурятского государственного университета (2002 - 2005). Публикации. Список печатных работ по теме диссертации насчитывает более 50 наименований. Основными являются работы [1-29]. Из них 8 статей опубликованы в журналах и изданиях, включенных в «Перечень ведущих научных журналов и изданий, выпускаемых в Российской Федерации, в которых должны быть
опубликованы основные научные результаты диссертации на соискание ученой степени доктора наук» [1-8].
Структура и объем работы. Диссертация состоит из введения, семи глав, заключения и списка цитируемой литературы. Общий объем диссертации составляет 260 страниц, включая 6 рисунков и 10 таблиц. Список литературы содержит 308 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во введении дается обзор методов оптимального управления, обосновывается актуальность работы, формулируются цели и задачи исследования, приводится ее краткое содержание.
Первая глава посвящена разработке и обоснованию методов нелокального улучшения в полиномиальном по состоянию классе задач оптимального управления без функциональных ограничений, в том числе с запаздыванием по состоянию. Иллюстрирующей для рассматриваемого класса является квадратичная по состоянию задача без запаздывания
Ф(и) = (p(x(ti)) + f F(x(i),u{t),t)dl -»mill, (1)
«и net'
x{i) = /ШМОЛ X(tn) = x\ u(t)eU, /е Г = [*„,/,], (2) в которой x(t) = (х,(/),...,хя(/)) - вектор состояния, !/(/) = («,(/), ...,и, „(<)) - вектор управления. Функции /(x,u,t), F(x,u,t) являются квадратичными по х и непрерывными по совокупности и, t на множестве R"xUxT, функция ср(х) квадратична на R". Допустимые управления u(t), t е Т принадлежат множеству V кусочно-непрерывных функций со значениями в компактном множестве U с R". Начальное состояние л" и промежуток управления Т заданы.
С помощью модификации стандартных векторной и матричной сопряженных систем в работе построены формулы приращения целевого функционала, которые не содержат остаточных членов разложений. На основе полученных точных формул сконструированы методы нелокального улучшения, характеризующиеся отсутствием операции параметрического поиска улучшающего управления. Нелокальность улучшения управления достигается ценой решения двухточечной краевой задачи для
системы обыкновенных дифференциальных уравнений, с возможной разрывной по состоянию правой частью. Такая краевая задача улучшения значительно проще краевой задачи принципа максимума и сводится к двум задачам Коши в линейном по состоянию случае.
В качестве характерных приведем два метода нелокального улучшения в рамках квадратичной задачи (1), (2). С помощью функции Понтрягина
H(y/,x,u,l) = (y/,f (x,u,t)) - F(x,u,t)
определим модифицированную векторную сопряженную систему относительно вектор-функции p(t) и управления w(t)
) - )) - ^ 9« (*(/, ))у0,) •
Для допустимых управлений и. v обозначим x(l,v), /еГ -решение системы (2) при u(t)-v(t); p(t,u,v), teT - решение системы (3) при w(t) = u(t), х(() = х(/,м), y(l) = x(l,v)~x(t,u).
Для линейной по состоянию задачи (I), (2) (функции <р(х), f(x,u,f). F(x,u,t) линейны по х на множестве R"xUxT) модифицированная сопряженная система (3) совпадает со стандартной сопряженной системой
= -Я, (^(/),х(/), w(t),t), yr{tt) = -<px(x(t,)). Обозначим y/{t,v). icT - решение этой системы при w(/) = v(О, x(t) = x(t,v). Очевидно, что p(t,v,v) = i//(t,v), te Т.
Получены две симметричные точные формулы для приращения Л,Ф(м) = Ф(у)-Ф(м) функционала (1)
Д,.Ф(м) = -\i \v)H(p{t,u,v\x(t,v),u(t)J)<H, (4)
АгФ(м) = -| \nH{p(t,v,u\x(i,u),u{t\l)dt, (5)
где Л, H(p,x.u,t) = H(p,x,v,t)~ H(p,x,u,t) - частное приращение функции Понтрягина по управлению. С помощью отображения
u*(y/,x,t) = argmaxH(<//,x,wJ) , y/eR", xtR", l еГ (6)
Mel!
принцип максимума для управления и е V представляется в виде
и(0 = и'(ИЛ«).*('.и).0, /еГ. (7)
Поставим задачу улучшения управления и е F по функционалу (1): найти управление v е F с условием O(v) < Ф(м).
Метод нелокального улучшения управления и е V в квадратичной по состоянию задаче (I), (2), основанный на формуле (4) и операции на максимум функции Понтрягина (6), имеет следующий вид.
Первый метод нелокального улучшения.
1. Найдем решение (*(/),/>(/)), / еГ краевой задачи
х(<) = /(х«1и'(р(<и(0Л0, х(еп) = х\ (8)
/Ч'|) = (*(/,, и))- )-Щ,"))- (9)
2. Сформируем управление v(t) = u\p{t),x{t\t), teT. Выходное управление veK обеспечивает улучшение исходного
управления «еК.
Аналогично строится метод нелокального улучшения управления и е V на основе формулы (5).
Разработаны модификации предложенных методов, которые позволяют строго улучшать допустимые управления, не удовлетворяющие принципу максимума.
Второй метод нелокального улучшения ориентирован на линейную по управлению задачу (I), (2)
Ф(и) = )) + | ({a(x(t),t),u{')) + d(x{l),t))dt min, (10)
x(t) = A{x(l),l)u(t) + b(x(l),t), x(tn) = x\ u(t)eU, (еГ. (II) Матричная функция A(x,t), векторные функции b(x,l), a(x,t), функции <p(x). d(x,i) являются квадратичными по x и
непрерывными по t на множестве R" хТ. Множество U с: R'" выпукло и компактно.
В задаче (10), (11) функция Понтрягина имеет следующую структуру
H(y/,x,u,t) = H„(y/,x,t) + (Ht(y/,x,l),u), Ha{y/,x,l) = {4sMx,t))-d{x,t), H,(ys,xJ) = A' (x,t)y/-a(x,t).
Отображение и представляется в форме
и {у/, х,t) = arg max (Я, (у/,x,t), w).
не//
Для управления и еУ введем векторную функцию и" с параметром а > О
и" (y/,xj) = У»;(и(/) + а//,(^,*,/)), xeR", (/еГ, teT, (12) где Р„ - оператор проектирования на множество U в евклидовой норме.
С помощью функции и" принцип максимума (7) для управления и е V в линейной по управлению задаче (10), (11) можно записать в виде
u(t) = u"(y(t,u),x(t,u),t), íeT. (13)
Формулы (4) и (5) приращения целевого функционала в задаче (10), (11) принимают следующий вид
Л,.Ф(и) = -1 <Я, (/>(/, и, v), х((, v), í), v(/) - и{1 ))dt, (14)
А,.Ф(») = -1 (Я, (/;(/,V,M),*(/,«),О,v(/) - М(/))Л. (15)
С помощью формул (14), (15) в работе построены методы нелокального улучшения для управления и е V на основе операции проектирования (12).
Первый проекционный метод нелокального улучшения.
1. Для заданных и е V и а > 0 определим соответствующее отображение и" и найдем решение (л" (/), р"{()), I е Т краевой задачи
x{t) = f{x{t\ua{p(t\x(t)J)J Ь *(/„) = Л (16)
p(t) = -Я, (/>(/), *(/, "), и(0,0-~ Я„ (/;(/), *(/, и), и(/),*Х*(0 - х(1, и)),
PÍO = -<pt(x(í,, и» ■- (*(',, г/)Хх(/,) - *(/,, м)). (17)
2. Сформируем управление v"(/) = u"(p"(t),xa(t),l), i е Т.
Выходное управление v" е V. а > 0 обеспечиваег невозрастание целевого функционала с оценкой
Ф(у") - Ф(м) < -- [ ||v"(/) - «(0|f dt. (18)
Проанализированы свойства разработанных методов. Приведены примеры, демонстрирующие возможность строгого улучшения управлений, удовлетворяющих принципу максимума. Полученные методы обобщают на квадратичный уровень известные методы нелокального улучшения для линейных по состоянию задач оптимального управления, рассмотренные в работах В.А. Срочко. Предлагаемые процедуры улучшения позволили получить новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом нелинейном по состоянию классе задач, в том числе в задачах с запаздыванием.
Характерной иллюстрацией является усиленное условие оптимальности управления, полученное с помощью первого проекционного метода нелокального улучшения с использованием оценки (18).
Условие А. Для оптимальности управления иеУ в задаче (10), (11) необходимо, чтобы пара (х(1,и),у/(1,и)), I е Т была единственным решением краевой задачи (16), (17) для всех а > 0.
Принцип максимума (13) в рамках краевой задачи (16), (17) формулируется следующим образом.
Принцип максимума. Для оптимальности управления и е V в задаче (10), (11) необходимо, чтобы пара (х(1,и),у/(1,и)), I е Т была решением краевой задачи (16), (17) хотя бы для одного а > 0.
Очевидно, что принцип максимума является следствием условия А. Это дает возможность первому проекционному методу строго улучшать управления, удовлетворяющие принципу максимума и не удовлетворяющие условию А.
Основными свойствами разработанных методов являются:
1) нелокальность улучшения управления (улучшаемое и улучшающее управления не характеризуются мерой близости);
2) отсутствие процедуры параметрического варьирования управления в процессе улучшения;
3) возможность строгого улучшения экстремальных управлений.
Во второй главе построены методы возмущений для решения краевой задачи улучшения в пространстве состояний и эквивалентного условия улучшения в пространстве управлений, возникающих в предложенных нелокальных процедурах.
Необходимость разработки специализированных методов обусловлена возможной разрывностью краевых задач улучшения по
18
фазовым переменным, нелинейностью и большой размерностью по состоянию, жесткостью системы, наличием запаздываний, что характерно для задач оптимального управления иммунным процессом. Эти особенности приводят к вычислительной неустойчивости стандартных методов решения нелинейных краевых задач (метод стрельбы, метод линеаризации, конечно-разностный метод).
Проиллюстрируем метод возмущений для ^ решения проекционной краевой задачи улучшения управления и е V (16), (17) при фиксированном параметре проектирования а > 0 и метод возмущений для решения эквивалентного условия улучшения в пространстве управлений, имеющего вид
¿'Ц) = Р11Ш + аН,(р(1,иУ\х(1У\1)), /еГ. (19)
Введем возмущенную краевую задачу улучшения с параметром возмущения ее[0,1]
х(0 = /Ш,и"(р((%х(0Л0, х(1„) = х°, (20) р(() = -Я, (/>(/), х(1,и),и(0,0 - с-Н„(р(1), х(1,и),и(1Шх(0~ х(1,и)),
/>(', ) = '<Р,(*(', ,и))-е^<рхх(дс(/,,и)\х{1,)-*(/,,и)). (21)
Невозмущенная краевая задача получается из возмущенной (20),
(21) при е - 0 , исходная - при е -1 .
Невозмущенная краевая задача распадается на две независимые задачи Коши для сопряженной и фазовой подсистем задачи. Для решения возмущенной краевой задачи при фиксированном е > 0 строится итерационный процесс с индексом к > 0
хк+,«) = /(хш(0,иа(рМ(()У+\1ии), = Л (22)
= -ЯД//*'(/),*(/, "),"(>),0 ~
рк+\0 = -<рх (Л'(/, (х(1{, и)Ххк (/,) - х(1л ,и)). (23)
Переход к к +1 реализуется через последовательное решение двух задач Коши: р -система, х-система.
В качестве начального приближения для итерационного процесса
(22), (23) в процедуре улучшения управления не К, не
19
удовлетворяющего принципу максимума, можно выбрать решение невозмущенной задачи.
Доказаны теоремы о разрешимости возмущенных задач и сходимости итерационных процессов. Обозначим С(Т) пространство непрерывных на Т вектор-функций с нормой
114 =тах|И/)||.
Теорема 2.1.4. Пусть в задаче (10), (11) выполнено условие ограниченности фазовых траекторий: x(t,u) е X, t еТ, и eV, где
X с R" - выпуклое компактное множество. Тогда для достаточно
- ^ \-аМп
малых а>0 при 0<е<е = С0--, С„ = const >0,
2 аМ(1
М0 -- const > 0
1) возмущенная краевая задача (20), (21) имеет единственное решение х" е С (Г), р" еС(Т);
2) umepaifuommu процесс (22), (23) сходится в норме ||-|| к решению (х", р" ) возмущенной задачи (20), (21) для любого начального приближения х° е С(Т), р° е С(Т).
В качестве следствия получаем, что для управления и е V, удовлетворяющего принципу максимума, возмущенное решение при малых а > 0 совпадает с невозмущенным в силу единственности.
Следствие 2.1.1. В условиях теоремы 2.1.4 при достаточно малых а > 0
1) возмущенная задача (20), (21) при е = 1 имеет единственное решение х" с- С(Т). р" е С(Т) ;
2) итерационный процесс (22), (23) при е -1 с любым допустимым начальным приближением х° е С(Т), р° е С(Т) сходится в норме |||(. к решению (х", р").
В разделе 2.2 предложен метод последовательного преобразования возмущенных краевых задач, позволяющий при определенных условиях обеспечивать сходимость решений возмущенных задач к решению исходной задачи.
Применительно к условию улучшения (19) метод возмущений рассматривается на множестве допустимых управлений V = {и eC(T):u(l)e U, t&T)
с выпуклым компактным множеством II с Я". Проиллюстрируем метод, когда в качестве параметра возмущения условия (19) принимается параметр проектирования а > О. Невозмущенное условие получается из возмущенного (19) при а- 0 и имеет очевидное решение у(1)-и(1), 1&Т. Для решения возмущенного равенства (19) при фиксированном а> О предложены явный и неявный итерационные процессы
\>1+>(1) = Ри(и(0 + аЩр(''"У)М1УМ), (еТ, (24) у'+Ч/) =+ /е7\ (25)
На начальной (нулевой) итерации задается начальное приближение v0 е V .
Теорема 2.5.1. Пусть семейство фаювых траекторий в задаче (10), (11) ограничено: хЦ, и)е X, / е Г, и еУ, где X с: Я" - выпуклое компактное множество. Тогда для достаточно малого параметра проектирования а > 0
1) во змущенное соотношение (19) имеет единственное решение
2) итерационный процесс (25) сходится в норме к решению
\>" для любого начального приближения V0 е V.
Аналогичное утверждение о сходимости справедливо для явного итерационного процесса (24).
В качестве следствия отметим, что при выполнении условий теоремы 2.5.1 решение возмущенного соотношения (19) для управления и € V, удовлетворяющего принципу максимума, совпадает в силу единственности с и.
Для итерационных процессов (24), (25) с управлением иеУ, не удовлетворяющим принципу максимума, можно выбрать начальное приближение V0 = и. При этом для достаточно малых а > 0, согласно теореме 2.5.1 и оценке улучшения (18), гарантируется строгое улучшение управления иеУ.
Аналогично рассматриваются методы возмущений для решения краевой задачи улучшения (8), (9) в пространстве состояний и эквивалентного условия улучшения, построенных на основе операции на максимум функции Понтрягина. Обоснованы утверждения о разрешимости возмущенных задач и сходимости итерационных процессов.
Отметим, что метод возмущений для проекционного условия улучшения (19) с параметром возмущения а> О выгодно отличается от методов возмущений с искусственным параметром ¿■е[0,1] тем, что управление меК улучшается решением возмущенной системы (19) для любого параметра возмущения а > О. Решение возмущенных задач в методах с параметром возмущения О < е < 1 в общем случае не гарантирует улучшения и.
В реальных вычислениях итерационные процессы возмущений применяются до первого улучшения управления. Для полученного улучшающего управления строится новая возмущенная задача и процесс повторяется.
Выделим основные свойства разработанных методов возмущений.
1. Отсутствие операции параметрического поиска улучшающего управления.
2. Нелокальность улучшения, обусловленная фиксированностью параметра возмущения.
3. Возможность улучшения управлений, удовлетворяющих принципу максимума.
4. Практическая реализуемость получаемых управлений ввиду отсутствия операции параметрического слабого или игольчатого варьирования управления.
Построенные методы возмущений без принципиальных изменений обобщаются на полиномиальные по состоянию задачи оптимального управления, в том числе с запаздыванием.
В третьей главе методы возмущений конструируются для реализации краевой задачи принципа максимума в пространстве состояний и условий оптимальности в пространстве управлений. Рассматривается основная задача оптимального управления
Ф(к) = <p(x(t.)) + f F(x(t),u{t),t)dt -> min, (26)
Jl «е*
x(t) = f(x(t),u(l),l\ x(t0) = x\ u(t) eU,teT = [/„,/,], (27) в которой x(t) - (х, (/),•••,*„(/)) - вектор состояния, u(t) = (n{(t),...,um(t)) - вектор управления. В качестве допустимых управлений и(/), / е Т, как и ранее, рассматривается класс кусочно-непрерывных на Т функций со значениями в выпуклом компактном множестве U с Rm. Начальное состояние х° и промежуток управления Т заданы.
Введем следующие предположения (ДПМ-условия):
1) функция <р(х) непрерывно дифференцируема на R", функция F(x,u,l), векторная функция f(x,u,t) и их производные Fr(x,u,t), F„(x> » fx{x,u,t), fu(x,u,t) непрерывны по
совокупности аргументов x,uj на множестве R" xUxT;
2) функция f(x,u,i) удовлетворяет условию Липшица по х на
R" х (7 х Г с константой L > О
\\f(x,uj)-f{y,i,,t)\<L\\x~y\\.
ДПМ-условия гарантируют существование и единственность" решения x(/,v), / е Т системы (27) для любого допустимого управления v е V. Кроме того, в этих условиях в задаче (26), (27) справедлив дифференциальный принцип максимума.
С помощью отображения и* принцип максимума для управления u&V записывается в форме
u(t) = u'(r(t,u),x(t,u),t), teT. (28)
Краевая задача принципа максимума имеет вид
¿(0 = /«/),">('),*(/),'),<), x(t0) = x\ (29)
= = (30)
В общем случае правые части краевой задачи (29), (30) разрывны по переменным состояния x, iff. Краевая задача (29), (30) в пространстве состояний эквивалентна соотношению (28) на множестве допустимых управлений.
В ДПМ-условиях из принципа максимума (28) следует дифференциальный принцип максимума
(//„(<//(/,и),х((,и),u(t),t),w- и(/)) < 0, и>е{7, teT. (31)
Дифференциальный принцип максимума (31) для управления и е V с помощью оператора проектирования Pv можно представить в форме
м(0 = /?,(и(0 + «Я„(^(/,м),дг(^м),м(0,0Х «>°- (32)
Метод возмущений предлагается применить для решения соотношения принципа максимума (28) и необходимого условия оптимальности (32).
В качестве иллюстрации рассмотрим метод возмущений для проекционного условия оптимальности (32). Параметр а > 0 принимается в качестве естественного параметра возмущения.
23
Невозмущенному условию при а = 0 удовлетворяет любое допустимое управление. Для решения поточечного соотношения (32) построены явный и неявный итерационные процессы
vt+'(/) = Pv(vk(l) + aHNOHíy%x(ty),v*,0), *е7\ (33) И*Ч0 = ^(Л0 + «ЯДИ'УХ4/У+,)У,/)), /еГ. (34)
На начальной (нулевой) итерации задается начальное приближение v° е V.
Исследован вопрос о сходимости итерационных процессов (33), (34) на множестве допустимых управлений
V = {ueC(T):u(t)eUjeT}.
Теорема 3.3.1. Пусть
1) семейство фазовых траекторий в задаче (26), (27) ограничено: x(l,u)e X, teT, ueV, где XczR" - выпуклое компактное множество;
2) векторная функция f(x,u,í), функции F(x,u,t), (р{х) дважды непрерывно дифференцируемы по совокупности переменных x.u,t на множестве R" xUxT;
3) для вектор-функции Ни (y/,x,uj) выполняется условие
(и - V, Hlt(p,x,u,t) - H„(q,y,v,n) < -К\и - v|f, u,veU, p,qeP, x,yeX, íeT,
где К - const >0, PczR" - выпуклое компактное множество, ограничивающее семейство сопряженных траекторий: i//(l, ы) е Р, teT, ueV.
Тогда для достаточно малого параметра проектирования а > 0
Í) соотношение (32) имеет единственное решение v" е V ;
2) итерационные процессы (33), (34) сходятся в норме || ||( к
решению v" для любого начального приближения v° е V.
Метод возмущений на основе операции проектирования с параметром возмущения а > 0 имеет преимущество перед альтернативным методом возмущения с искусственным параметром возмущения ¿:е[0,1] тем, что экстремальное управление определяется условием (32) при любом значении параметра возмущения а> 0.
Основное отличие указанного метода проекционных возмущений от стандартных проекционных методов состоит в том, что параметр
24
проектирования а > 0 фиксируется в итерационном процессе последовательных приближений. В методах проекции градиента этот параметр варьируется на каждой итерации для обеспечения улучшения управлений.
Построенные в главе методы возмущений не гарантируют релаксацию по целевому функционалу в отличие от градиентных методов, но компенсируют это свойство отсутствием операции параметрического поиска улучшающих приближений и получением реализуемых на пракгике управлений. Эти свойства обуславливают повышенную вычислительную эффективность решения нелинейных задач оптимального управления.
Численные расчеты тестовых задач предложенными методами продемонстрировали значительное снижение трудоемкости и повышение качества реализуемости решения по сравнению со стандартными методами (условного градиента, проекции градиента, игольчатой линеаризации).
Для примера приведем сравнительные результаты решения известной задачи оптимального управления шаговым электродвигателем
Ф(и) = | (х,2 + Л, и, + к2и2 + к3щ )dt -> min , , х,(0) = л73,
2 71 2я
х2 = -ахг - b(ut sin(2x,) + и2 sin(2x, + —) + щ sin(2x, - —)), х2 (0) = 0,
и, =м,(Ое[0,16], / = 1,2,3, fe Г = [0,0.05]. Здесь х, - положение вала двигателя, л:2 - его скорость, компоненты управления и,, м,, щ соответствуют квадратам токов в обмотках. Критерий качества управления определяется требованием приведения положения вала к нулю при минимальных энергозатратах. Значения параметров: к, =0.001, / = 1,2,3, о = 50, /> = 1000.
В таблице 3.4.1 (Ф* - наилучшее расчетное значение функционала, N - суммарное количество решенных задач Коши) приведены известные результаты решения задачи методом условного градиента (МУГ), первым и вторым методами условного квазиградиента (МУК-1 и МУК-2). Полученные этими методами итоговые управления содержат колебательные участки частых
переключений, что делает их неудовлетворительными в плане практической реализации.
В диссертации эта задача решалась методом (33) проекционных возмущений условия оптимальности (МПВУО) при значении параметра возмущения а = \0г. Условием остановки расчета задачи выбиралось неравенство
|Ф(м*+')-Ф(м*)|^10"4 |Ф(м*)|.
В рамках рассматриваемой задачи метод МПВУО, в отличие от сравниваемых методов, позволяет получить реализуемое на практике управление (без колебательных участков) с лучшим значением по функционалу. При этом итерационный процесс (33) имеет не релаксационный характер.
Таблица 3.4.1.
Метод Ф* N
МУГ 0.00817 617
МУК-1 0.00988 410
МУК-2 0.00792 287
МПВУО 0.00779 309
В четвертой главе разработаны методы нелокального улучшения управляющих параметров (управлений) в полиномиальных по состоянию задачах оптимизации, включающих задачи с запаздыванием и с дискретными управлениями. Нелокальность улучшения достигается ценой решения задачи о неподвижной точке вспомогательной вектор-функции в пространстве управлений. В результате получены процедуры со свойством нелокапьности и возможностью улучшения управлений, удовлетворяющих дифференциальному принципу максимума.
Характерной для построения методов является квадратичная по состоянию задача оптимизации управляющих параметров без запаздывания
Ф(н) = рСх(/,))+ Г Лх(/),и,/>Л-»тн1, (35)
*(/) = /(*(/),И,О. х(10) = х°, иеи, /еГ = [/„,/,], (36) где *(/) = (*,(/),...,*„(/)) - вектор состояния, и = (м|,...,мт) - вектор управляющих параметров, II с: Я'" - компактное множество.
Предположим, что функции f(x,u,t\ F(x,u,l) являются квадратичными по л' и непрерывными по совокупности u,t на множестве R" х U х Т, функция <р(х) квадратична на R".
В задаче (35), (36), в полной аналогии с (4), (5), справедливы точные формулы приращения целевой функции на допустимых управлениях и, v . Возьмем за основу первую формулу
А, Ф(и) = -1 Л, Н{р(1,и, v),x{t, v),u,t)dt. (37)
Введем отображение W/*(î/,v) = argmax | H(p(t,u,v),x(t,v),w,t)dl, ueU,veU. (38)
и е/1 •*/
На основе формулы (37) получено достаточное условие оптимальности управления ме(/
u = W'(u,v% veU.
В случае дифференцируемости функции H по и и выпуклости множества U дифференциальный принцип максимума для управления и е U в задаче (35), (36) имеет вид
M = argmax [ (Hu(i/(t-,u),x(t,u),u,l),w)di. (39)
tief/
Выделим важный для приложений подкласс линейных по управлению задач
Ф(и) = ^(д:(/,))+ j {(a(x(t),t),u) + d(x(t),t))dt mm , (40)
x(t) = A{x{l),t)u + b{x(t),t), *(/„) = jc°, ueU,teT, (41) где матричная функция A(xj), векторные функции a(x,t), b(x,t), функции <p{x), d(x,t) являются квадратичными по x и
непрерывными по t на множестве R"xT, множество U cz Rm выпукло и компактно.
В задаче (40), (41) дифференциальный принцип максимума (39) для управления и е V с помощью отображения (38) представляется в форме
u-W'(u,u).
Формула приращения целевой функции (37) и отображение fV*(u,v) принимают вид
AMu)^-(l^(P(t,u,v),x(t,v),t)di,v-u), (42)
W'(u,v) = argmax^ Hl(p(t,u,v),x(t,v),l)dt,\i^ , ueU, vsU.
Ht(4/,xj) = А1 (x, / V - a(x,t),
Проиллюстрируем метод нелокального улучшения управления ueU в задаче (35), (36), основанный на формуле (37) и операции на максимум интеграла от функции Понтрягина (38).
Первый метод нелокального улучшения: для данного и ei/ найдем решение v = v(u) уравнения
v = W'(u,v). (43)
Поскольку W\u,v)e U, то полученное управление v = v(u) является допустимым (v е U ) и обеспечивает улучшение управления «ei/.
Модификация этого метода строго улучшает любые допустимые управления, не удовлетворяющие дифференциальному принципу максимума.
Другой иллюстрирующий метод нелокального улучшения ориентирован на линейную по управлению задачу (40), (41). Метод основывается на точной формуле (42) и операции проектирования
Для допустимого управления и е U определим проекцию и",а > 0 с помощью соотношения
и" = , (м + а | //, (y(t, u),x(t,u),t)dt).
Дифференциальный принцип максимума (39) для управления и е U на основе свойства проекции представляется в форме
« = «", а>0. (44)
Для заданного а > 0 определим отображение W" по формуле W"(г/,v)-P(l(u + a| Я,(p(t,u,vlx(l,v),l)cit), u<=U,veU. (45)
С помощью отображения (45) на основе формулы (42) получено достаточное условие оптимальности для допустимого управления и е U в задаче (40), (41)
u = W"(u,v), veU.
Это условие достаточно проверить хотя бы для одного а > 0.
Необходимое условие оптимальности (44) для управления ugU с помощью отображения (45) представляется в виде
u = Wa{u,u), а>0.
Первый проекционный метод нелокального улучшения: для заданных а>0 и иеС1 найдем решение Vя -Vй(и) уравнения
г = !Га(и, V). (46)
Управление у" обеспечивает уменьшение целевой функции с оценкой
Ф(у") - Ф(м) < 1| - м||2. (47)
Таким образом, методы нелокального улучшения управляющих параметров заключаются в поиске неподвижной точки вспомогательной вектор-функции.
Отметим, что проекционные методы, в отличие от методов, основанных на операции на максимум, не требуют ограниченности множества и. В частности, при II = Ят получаем методы нелокального улучшения для задачи (40), (41) без ограничений на управление.
Проанализированы свойства полученных методов нелокального улучшения и приведены иллюстрирующие примеры. В частности демонстрируется строгое улучшение управления и е и, удовлетворяющего дифференциальному принципу максимума. С помощью разработанных методов получены усиленные по сравнению с дифференциальным принципом максимума необходимые условия оптимальности в рассматриваемом классе задач.
В качестве иллюстрации сформулируем следующее условие оптимальности, полученное с помощью первого проекционного метода нелокального улучшения.
Условие В. Для оптимальности управления и е С/ в задаче (40), (41) необходимо, чтобы вектор и был единственной неподвижной точкой отображения IV" для всех а > 0.
Дифференциальный принцип максимума. Для оптимальности управления и е И в задаче (40), (41) необходимо, чтобы вектор и был неподвижной точкой отображения Ж" хотя бы для одного а > 0.
Отметим, что дифференциальный принцип максимума является следствием условия В. Это значит, что проекционные методы нелокального улучшения имеют возможность улучшать управления, удовлетворяющие дифференциальному принципу максимума в
задаче (40), (41). Эта возможность связана с неединственностью неподвижных точек отображения IV".
Разработанные методы нелокального улучшения указывают на принципиальную возможность осуществления нелокального улучшения управляющих параметров в рассматриваемом классе задач. Трудоемкость построения улучшающего вектора управляющих параметров определяется решением задачи о неподвижной точке введенных отображений в указанных методах. Отметим, что отображения, построенные с помощью операции проектирования, являются как минимум непрерывными векторными функциями параметров.
В пятой главе для решения задачи о неподвижной точке в процедурах улучшения конструируются методы возмущений. Предложенный подход далее распространяется на необходимое условие оптимальности в основной задаче оптимизации управляющих параметров. Построенные методы возмущений характеризуются отсутствием вариационного поиска улучшающих параметров на каждой итерации и возможностью улучшения экстремальных управлений.
В качестве иллюстрации рассмотрим задачу о неподвижной точке (46), представленную в форме
у = /»Ди + л| Н,(р(1,и^),х(1,ЛОЖ). (48)
Проекционный параметр а>0 рассмотрим в качестве параметра возмущения, задачу (48) назовем возмущенной. Невозмущенная задача получается из задачи (48) при а = 0 и имеет очевидное решение у-и.
Итерационный процесс решения возмущенной задачи (48) имеет
вид
V*= 1],(и + а | Я, (/;(/,и, V4),х{1, х"),()Л), к > О . (49)
Сходимость метода (49) описывается утверждением, аналогичным теореме 2.5.1.
Начальным приближением итерационного процесса (49) для управления ие[/, не удовлетворяющего принципу максимума (39), можно выбрать решение невозмущенной задачи у0 = и . При этом для достаточно малых а > 0, согласно оценке улучшения (47), гарантируется строгое улучшение управления и.
Решение задачи (48) позволяет улучшать управление и е U для любого значения параметра возмущения а > 0.
Метод возмущений для решения соотношения (43) основывается на выделении в задаче (35), (36) специальной линейной по состоянию части и параметризации с помощью ее[0,1] нелинейного остатка. Получаемая возмущенная задача оптимизации
ф, (") = {с0. *(<! )) + Щ (*(>,)) +
+ f ((a0(t),x(t)) + d0(u,t) + eF,(x(t),u,t))dt -> min,
•»/ Л ' neU
x{t) = 4,(0^(0 + b0(u,t) + ef^x(t),u,t), x(t0 ) = x°, teT определяет соответствующую возмущенную задачу о неподвижной точке.
Итерационные процессы для возмущенных задач о неподвижной точке формируют в целом методы возмущений в задаче оптимизации управляющих параметров. Выделим основные свойства предлагаемого подхода к улучшению управляющих параметров в полиномиальном классе задач оптимизации.
1. Нелокальность улучшения вектора управляющих параметров, обусловленная фиксированностью параметра возмущения.
2. Отсутствие операции параметрического поиска улучшающего управления, характерной для градиентных методов.
3. Возможность строгого улучшения неоптимальных управлений, удовлетворяющих дифференциальному принципу максимума.
Далее конструируются методы возмущений для поиска управлений, удовлетворяющих дифференциальному принципу максимума и эквивалентному проекционному условию оптимальности в основной задаче оптимизации управляющих параметров
Ф(и) = $»(*(/,))+ f F(x(t),и,t)dtmin, (50)
« »ei/
x(l) = f(x(i),uj), x{t„) = x(>, t G Г = (51)
с выпуклым компактным множеством U с R'". В задаче предполагается выполненным набор ДПМ-условий.
Дифференциальный принцип максимума для управления и eU в задаче (50), (51) имеет вид
и = arg max( f H,X^(Lu),x{t,u),u,t)di,w ). (52)
не// «'/ '
Условие (52) с помощью оператора проектирования Ри представляется в эквивалентном виде
м = /»Ди + а|#ж(^(/,ы),*(/,и),«,/>#), а> 0. (53)
Стандартные методы условного градиента и проекции градиента решения задачи (50), (51) основываются соответственно на дифференциальном принципе максимума (52) и проекционном условии (53), и обеспечивают сходимость к нулю невязки дифференциального принципа максимума. Достоинством этих методов являются вычислительная устойчивость расчета фазовой и сопряженной систем, а также релаксация по целевой функции (50) на каждой итерации методов. Релаксация обеспечивается при малых значениях параметра, регулирующего область варьирования управления. Этот параметрический поиск является наиболее трудоемкой частью итерационного процесса.
В главе построены итерационные методы возмущений для решения соотношения дифференциального принципа максимума (52) и проекционного условия оптимальности (53), не содержащие операцию поиска улучшающего управления, характерную для релаксационных методов.
Для иллюстрации рассмотрим метод проекционных возмущений для условия оптимальности (53), когда в качестве параметра возмущения выбирается параметр проектирования а > 0.
Итерационный процесс решения возмущенной задачи (53) имеет
вид
=Р„(у> +а1н,(у,«У),х«У)У,М), к>0. (54)
Утверждение о сходимости итерационного процесса (54) в евклидовой норме аналогично теореме 3.3.1.
Решение соотношения (53) для любого параметра возмущения а > 0 удовлетворяет дифференциальному принципу максимума (52).
В шестой главе формализован класс задач управления иммунным процессом при инфекционных заболеваниях на основе математических моделей, интерпретируемых как задачи лечения.
Иллюстрирующей является модель противовирусного иммунного ответа Марчука-Петрова, базирующаяся на современных представлениях о процессах развития защитных реакций, которая в безразмерной форме имеет вид
Я, -Д2А/1Я,Е + Йз( 1-ЯД
Ё = *1Ч<?(ю)А/, (/ - я20)ЯД/ - я20 )£(/ - я20) ~ £21М,Д,£ - Й22С,.£ -
Я = g2¿(m)Mt (t-^í2t>)Hh(t-gz6)B(t-g2ь)-g27M,.Hl,B + g2SQ-B), Р = (/ -£10)ЯД/ -£10)й(/ + (1 -А
Здесь С,. - инфекционное начало, (М„, Я(,, ЯЛ, £, б, Р, У7) -вектор защитных сил организма, т - степень поражения органа, >О, / = 1,38 - постоянные коэффициенты, при этом Яни 82О' 8зп - запаздывания, характеризующие время созревания защитных клеток. Функция учитывает снижение
защитной активности из-за поражения организма. Это невозрастающая функция, причем 0 < <%(т) < I, £(0) = I, £(1) = 0 (в линейном приближении = 1 -т). Достижение состояния т = 1 интерпретируется как летальный исход в рамках модели. Начальные условия имитируют заражение организма в момент /0 малой
начальной дозой вируса > 0. В связи с этим полагается, что до
момента заражения (0 система находится в стационарном состоянии, характеризуемом отсутствием вирусов, которое интерпретируется как состояние здорового организма.
В диссертационной работе рассматриваемые модели модифицируются с целью формализации задач оптимального воздействия на иммунный процесс^Дри этом требуется:
К системе (55) присоединены начальные условия
у,00) = V, М, (О = С, (/0) = т(10) = 0, Л/ДО = 0, I < /, ЯДО = ЯД/0) - Е(10) = В{10) = Р(/0) = /Д<0) -1.
о'
адекватно ввести управляющие воздействия в коэффициенты и правые части уравнений модели;
формализовать в рамках модели конечную цель управления, т.е. ю состояние процесса, которое должно быть достигнуто в конечный момент времени;
определить в модели ограничения, которые не должны нарушаться в процессе управления;
задать критерий оптимальности управления. Для иллюстрации рассмотрим известную модель противовирусного иммунного ответа с учетом величины I степени отека. Она имеет вид (55), где коэффициенты взаимодействия клеток - эффекторов Е с вирусами У} и зараженными клетками С,
заменяются произведением этих коэффициентов на функции от I 82 82Г(1) , #22 ~> 822Г(1), Яч, 8мГ(0 , /V) = 1 + 8^.
ХМ. ёп ~> , 7(0 = 1 + Я«} ■ (56)
Функция -\-т заменяется по правилу
£(*»)-» #«)*(/), *(/) = !(57) В модифицированную модель введем дополнительное уравнение динамики для величины отека
/ = + (58)
в котором и = «(/), /е 7" = [/„,/,] - управление с областью значений и-[0,м], отражающее стимулирующее воздействие на процесс отека. Возможность скачкообразного изменения управления в отдельные моменты времени практически нужна, например, для моделирования изменения концентрации препарата в крови после инъекции. Ограничения на область значений управления учитывают неотрицательность управления и физиологически допустимые дозы применения препарата.
Конечная цель управления, интерпретируемая как цель лечения, в рамках моделей формализуется как достижение состояния практического выздоровления. Достижение состояния практического выздоровления в разных модельных ситуациях трактуется по-своему.
При имитации острой формы заболевания в условиях сильной иммунной системы организма под выздоровлением в рамках (55) моделировалось достижение критически низких значений
инфекционного начала: <?>0.
-*1"' > , * 34
. ; I <Й . ' •
При этом может задаваться ограничение на допустимую критическую суммарную нагрузку поражения организма в форме
условия | < а, а > О .
В результате возникает базовый класс задач управления с запаздыванием и с терминальными ограничениями-неравенствами.
При моделировании заболевания с вялой динамикой в условиях сильной иммунной системы практическое выздоровление понимается не только как достижение состояния .9Л ~\у, < < |, но и удержание в этом состоянии в течение
определенного времени, достаточного для формирования иммунитета к повторному заражению организма. Так выделяется специальный класс задач управления с запаздыванием, с фазовыми ограничениями специального вида и дополнительными терминальными ограничениями-неравенствами.
При имитации циклической хронической формы заболевания с выраженными клиническими симптомами в условиях слабой иммунной системы в качестве цели лечения ставится удлинение интервалов ремиссий, моделируемых интервалами колебаний, на которых выполняется условие т(() < т, где т> 0 - допустимый критический порог поражения органа. Такая цель управления определяет специальный класс задач управления колебаниями системы с запаздыванием и дополнительными фазовыми ограничениями-неравенствами.
Седьмая глава посвящена адаптации и применению разработанных в предыдущих главах методов нелокального улучшения и методов возмущений к специфике задач управления иммунным процессом с учетом запаздывания, нефиксированного конечного момента времени и функциональных ограничений.
В разделе 7.1 конструируются методы нелокального улучшения и метод возмущений в полиномиальной задаче оптимального управления с терминальными ограничениями.
В разделах 7.2 - 7.4 рассматриваются методы возмущений для необходимых условий оптимальности в задачах управления иммунным процессом.
В разделе 7.5 численно исследуются некоторые задачи оптимального введения иммуноглобулинов при вирусном заболевании, вначале без ограничений, затем с терминальным ограничением. Сравнение с известными методами условного
градиента, проекции градиента и метода игольчатой линеаризации в целом показало более высокую эффективность разработанных методов возмущений.
В разделе 7.6 численно анализируется модельная задача (55) -(58) стимулирования отека при вирусном гепатите с различными условиями на управляющее воздействие.
В частности, рассматривается задача достижения состояния практического выздоровления, характеризующегося критически низкими значениями инфекционного начала V/, С\
)) = СД/,) + V, (/,) - S = 0, S > 0 (59)
за наименьшее время
Фц(м) = /, -> min (60)
wel
при ограничении
Ф,(м)= \m(t)dt<a, Г = [0,*,], а>0. (61)
При численном моделировании задачи использовались известные имитационные данные иммунного ответа при острой форме вирусного гепатита. В работе [1] для расчета задачи применялся модифицированный для систем с запаздыванием метод возможных направлений (MBH), на каждой итерации которого осуществлялась релаксация по функционалу (60) при выполнении ограничения (61).
В данной главе эта задача решалась методом проекционных возмущений условия оптимальности (МПВУО).
Отметим, что не при всех допустимых управлениях гарантируется достижение условия (59), определяющего момент окончания процесса управления.
При численном исследовании задачи была идентифицирована активность ограничения (61). Это позволило свести задачу с ограничением к вспомогательной задаче без ограничения (61) с квадратичным штрафным функционалом
Ф(г/) = Ф„(м) + .Р(Ф, (и) - а)2, Р> 0. (62)
Для решения задачи (55) - (59), (62) использовался метод МПВУО.
Условия расчета выдерживались идентичными условиям, приведенным в работе [1]. Значения вычисленных управляющих, фазовых и сопряженных переменных в процессе расчета запоминались в узлах равномерной сетки Q с шагом дискретизации 0.02 на временном интервале [0,20].
Подбор штрафного параметра Р> 0 производился с точностью до порядка. В таблице 7.6.1 приведен ход итераций расчета задачи при Р - 105. При этом проекционный параметр возмущения а > 0, обеспечивающий сходимость МПВУО, выбирался равным 10".
Условие остановки расчета задачи, аналогично [I], определялось неравенством Ек < 10", где Ек - невязка необходимого условия оптимальности.
Таблица 7.6.1.
к Фо("*> Ф («')
1 13.626 0.4583 2518 0.050000
2 14.121 0.2779 62.95 0.050000
3 13.152 0.3185 47.49 0.010025
4 13.251 0.3101 23.49 0.000684
5 13.351 0.3038 14.82 0.000000
Качественные и количественные показатели решения задачи в сравнении с [1] представлены в таблице 7.6.2. Трудоемкость метода измерялась суммарным количеством N решенных фазовых и сопряженных задач Коши.
Таблица 7.6.2.
Метод Ф; ф; N Управление
MBH 13.58 0.2954 14+9=23 и = й: [8.2,10.4] и [1U,]
МПВУО 13.351 0.3038 6+5=11 г/ <0.01: [0,7.2]; и = й: [8.8,/,]
Момент i, соответствует окончанию процесса управления по условию (59). Управление, полученное методом MBH [1], принимает граничное значение и = 0.3 и равно нулю вне указанного в таблице множества. Значения управления, полученные в результате операции проектирования методом МПВУО, монотонно возрастают на отрезке [7.2,8.8] с практически минимального до максимального значения.
В рамках рассматриваемой модельной задачи с ограничением и нефиксированным временем окончания процесса управления метод МПВУО позволяет уменьшить трудоемкость расчета с достижением лучших показателей расчета по сравнению с методом MBH. При этом управление, полученное методом МПВУО, качественно лучше аппроксимирует оптимальное решение задачи, имеющее одну точку переключения с минимального на максимальное значение. Итоговое
управление, полученное методом MBH в работе [1], представляет собой кусочно-постоянную функцию на сетке дискретизации с двумя интервалами воздействия максимальной интенсивности.
В заключении сформулированы основные результаты работы, ее новизна, теоретическое и практическое значение.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Булдаев A.C. Численный метод оптимизации управления в системах с запаздываниями при моделировании иммунного ответа // Журн. вычислит, математики и мат. физики. - 1990. - Т.30, № 9. - С. 1307 -1322.
2. Булдаев A.C. Управление колебаниями в системах с запаздываниями при моделировании заболеваний // Математическое моделирование.
- 1991. - № 6. - С. 10-21.
3. Булдаев A.C. Нелокальное улучшение управлений в динамических системах, квадратичных по состоянию // Изв. вузов. Математика. -2001.-№12.-С. 3-9.
4. Булдаев A.C. К оптимизации динамических систем по управляющим параметрам // Изв. вузов. Математика. - 2002. - № 12. - С. 30 - 38.
5. Булдаев A.C. Нелокальное улучшение управлений в системах с запаздыванием //Журн. вычислит, математики и мат. физики. - 2003.
- Т.43, № 2. - С. 176-185.
6. Булдаев A.C. Процедуры нелокального улучшения управления в квадратичных по состоянию задачах управления // Изв. РАН. Теория и системы управления. - 2003. - № 2. - С. 76 - 85.
7. Булдаев A.C. Проекционные процедуры нелокального улучшения линейно управляемых процессов // Изв. вузов. Математика. - 2004. -№ 1. - С. 18-24.
8. Булдаев A.C. Модификация метода проекций в задачах параметрической оптимизации квадратичных по состоянию систем // Вестник Бурятского университета. Серия 13. Математика и информатика. - Улан-Удэ: Изд-во Бурятского ун-та, 2004. - С. 70 -76.
9. Булдаев A.C. Численный метод оптимизации управления в системах с запаздываниями: Препринт ВЦ СО АН СССР № 863. -Новосибирск, 1989. - 30 с.
10. Булдаев A.C. Численные алгоритмы оптимизации в задачах управления для систем с запаздываниями: Препринт ВЦ СО АН СССР № 875. - Новосибирск, 1990. - 26 с.
П.Булдаев А.С. Алгоритм оптимизации управления колебаниями в системах с запаздываниями: Препринт ВЦ СО АН СССР № 894. -Новосибирск, 1990.-21 с.
12. Булдаев А.С. Оптимизация управлений в системах с запаздываниями // Тр. 11-й Байкальской межд. конф. «Методы оптимизации и их приложения». Т.2. Оптимальное управление. - Иркутск, 1998. - С. 50-53.
13. Булдаев А.С. Моделирование устойчивых режимов вирусных инфекций // Оптимизация, управление, интеллект. ИДСТУ СО РАН,
1999.-№3.-С. 110-120.
14. Булдаев А.С., Мижидон А.Д. Параметрическая оптимизация динамических систем // Математика в восточных регионах Сибири. Материалы межд. конф. - Улан-Удэ, 2000. - С. 97 - 98.
15. Булдаев А.С., Мижидон А.Д. Двухэтапный параметрический синтез динамических систем // Материалы Четвертого Сибирского конгресса по прикладной и индустриальной математике (ИНПРИМ -2000). - Новосибирск: ИМ СО РАН, 2000. - С. 10-11.
16. Булдаев А.С., Мижидон А.Д. Об одном подходе к параметрической идентификации динамических систем // Тр. межд. конф. «Идентификация систем и задачи управления». - М.: ИПУ РАН,
2000. - С. 2200 - 2204.
17. Булдаев А.С. Оптимизация управлений в динамических системах, квадратичных по состоянию // Тр. 12-й Байкальской межд. конф. «Методы оптимизации и их приложения». Т.2. Оптимальное управление. - Иркутск, 2001. - С. 78 - 82.
18. Buldaev A.S. Optimization of Nonlinear Systems in Controlling Parameters // Proceedings of 5th IFAC Symposium «Nonlinear Control Systems» (NOLCOS'OI ). - Saint-Petersburg, 2001. - P. 306 -309.
19. Булдаев А.С. Оптимизация квадратичных систем по управляющим параметрам. // Scientific Transaction of National University of Mongolia, School of Mathematics and Computer Sciences, Institute of Mathematics. - Ulaanbaatar, 2001. - № 8 (186). - P. 53 - 58.
20. Булдаев А.С. Процедуры нелокального улучшения управляющих параметров в линейных по состоянию системах // Математика, ее приложения и математическое образование. Материалы межд. конф. Т. 1. - Улан-Удэ: Изд-во ВСГТУ, 2002. - С. Il I - II8.
21. Булдаев А.С., Васильев О.В. Нелокальная оптимизация нелинейных управляемых систем // Математика, ее приложения и математическое образование. Материалы межд. конф. Т.1. - Улан-Удэ: Изд-во ВСГТУ, 2002. - С. 118 - 124.
22. Булдаев А.С. Процедуры нелокального улучшения в полиномиальных по состоянию системах / Серия: Оптимизация и управление. Вып. 7. - Иркутск: Иркут. ун-т, 2002. - 46 с.
23. Buldaev A.S. Regularization of the Procedures of Nonlocal Parameter's Optimization in Quadratic Systems // The International Conference on Optimization and Optimal Control. - Ulaanbaatar, 2002. - P. 36 - 41.
24. Булдаев А.С. Регуляризация нелокальных процедур улучшения в квадратичных задачах управления // Оптимизация, управление, интеллект. ИДСТУ СО РАН, 2002. - № 6. - С. 84 - 93.
25. Булдаев А.С. Нелокальное улучшение дискретных управлений в квадратичных по состоянию динамических системах // Тр. межд. конф. «Идентификация систем и задачи управления». - М.: ИПУ РАН, 2003.-С. 707-713.
26. Булдаев А.С. Нелокальное улучшение управляемых процессов методом возмущений / Серия: Оптимизация и управление. Вып. 10. -Иркутск: Иркут. ун-т, 2004. - 52 с.
27. Buldaev A.S. On One Approach to Solving the Problem of Optimal Basis of the Method of Perturbations // Proceedings of the IF AC Workshop GSCP-04 «Generalized Solutions in Control Problems», Pereslavl-Zalessky, Russia, September 21 - 29, 2004. - Moscow: Fizmatlit, 2004. -P. 32 - 37.
28. Булдаев А.С. Методы проекционных возмущений для расчета экстремальных управлений динамических систем // Математика, ее приложения и математическое образование. Материалы всероссийской конф. с межд. участием. Т.1. - Улан-Удэ: Изд-во ВСГТУ, 2005. - С. 44 - 47.
29. Булдаев А.С. Методы возмущений для нелокального улучшения управления в квадратичных по состоянию системах // Тр. 13-й Байкальской межд. конф. «Методы оптимизации и их приложения». Т.2. Оптимальное управление. - Иркутск, 2005. - С. 111 - 116.
Подписано в печать 01.09.05. Усл. печ. л. 2,325. Тираж 120 экз. Заказ № 1440
Отпечатано в издательстве Бурятского государственного университета, 670000, г. Улан-Удэ, ул. Смолина 24а
г
V
»178 96
РНБ Русский фонд
2006-4 17612
Введение.
Глава 1. Методы нелокального улучшения управлений в полиномиальных по состоянию системах.
1.1. Полиномиальная по состоянию задача оптимального управления.
1.2. Формулы приращения функционала.
1.3. Методы нелокального улучшения управлений на основе векторных сопряженных переменных.
1.4. Модифицированные методы нелокального улучшения управлений.
1.5. Квадратичная по состоянию задача оптимального управления.
1.6. Методы нелокального улучшения управлений на основе матричных сопряженных переменных.
1.7. Проекционные методы нелокального улучшения управлений.
1.8. Квадратичная по состоянию задача оптимального управления с запаздыванием.
1.9. Примеры.
Глава 2. Методы возмущений в полиномиальных по состоянию задачах оптимального управления.
2.1. Метод возмущений для краевой задачи улучшения. ф 2.2. Метод преобразования возмущенных краевых задач улучшения.
2.3. Полиномиальная по состоянию задача оптимального управления с запаздыванием.
2.4. Метод возмущений для условия улучшения в пространстве управлений.
2.5. Метод проекционных возмущений для условия улучшения.
Глава 3. Методы возмущений в основной задаче оптимального управления. щ 3.1. Основная задача оптимального управления.
3.2. Метод возмущений принципа максимума. ч 3.3. Метод проекционных возмущений для условия оптимальности.
3.4. Численное решение тестового примера.
Глава 4. Методы нелокального улучшения управляющих параметров полиномиальных по состоянию систем.
4.1. Полиномиальная по состоянию задача оптимизации управляющих параметров.
4.2. Методы нелокального улучшения управляющих параметров.
4.3. Модифицированные методы нелокального улучшения.
4.4. Схема поиска неподвижных точек в методах нелокального улучшения.
4.5. Проекционные методы нелокального улучшения.
4.6. Квадратичная по состоянию задача оптимального дискретного управления.
4.7. Примеры.
Глава 5. Методы возмущений в задачах оптимизации управляющих параметров.
5.1. Метод возмущений для задачи о неподвижной точке.
5.2. Метод проекционных возмущений для задачи
Ф о неподвижной точке.
5.3. Метод нелокальных возмущений для оценивания коэффициентов квадратичных по состоянию систем.
5.4. Основная задача оптимизации управляющих параметров. 172 Щ 5.5. Метод возмущений дифференциального принципа максимума.
5.6. Метод проекционных возмущений для условия оптимальности.Ill
Глава 6. Математические модели и задачи оптимального управления иммунным процессом.
6.1. Базовые модели иммунного процесса.
6.2. Постановка класса задач управления иммунным процессом.
6.3. Нестандартные задачи управления иммунным процессом.
6.4. Примеры.
Глава 7. Методы возмущений в задачах оптимального управления иммунным процессом.
7.1. Задача управления с терминальными ограничениями.
7.2. Задача достижения заданного множества состояний системы.
7.3. Задача достижения и удержания системы в заданном множестве состояний.
7.4. Задача управления колебаниями системы.
7.5. Численное решение задачи введения иммуноглобулинов при заболевании.
7.6. Численное решение задачи стимулирования отека при вирусном гепатите.
Актуальность разработки новых методов оптимального управления обуславливается непрерывно возникающими прикладными задачами в различных областях науки, техники и экономики, для эффективного решения которых существующих методов оказывалось недостаточно. Исторически развитие методов связано с теорией необходимых и достаточных условий оптимальности в задачах управления, а также с получением различных конструкций и аппроксимаций целевых функционалов.
К настоящему времени определились разнообразные подходы к численному решению задач оптимального управления в системах обыкновенных дифференциальных уравнений. По структуре соответствующие методы являются итерационными, причем на каждой итерации рассматривается вспомогательная задача, решение которой в определенном смысле лучше, чем на предыдущей итерации. Объектом для разработки численных методов традиционно выбирается задача оптимального управления со свободным правым концом, которая по ряду причин называется основной [80,81,225].
В первую очередь можно выделить методы улучшения в пространстве управлений, характеризующиеся операцией слабого или игольчатого варьирования управления.
Представителями соответствующего класса методов являются градиентные процедуры [39, 80, 90, 120, 131, 145, 181, 190, 192, 201, 202, 209, 251, 265, 268, 272, 274, 282 - 284, 286, 290, 295, 297, 300]. Обстоятельный численный анализ методов градиентного типа в процессе решения прикладных задач проведен Федоренко Р.П. [251]. Вопросы обоснования градиентных методов в задачах оптимального управления (сходимость, регуляризация) рассмотрены в монографии Васильева Ф.П. [90].
К этому же классу относятся методы принципа максимума, начало развития которых заложил метод последовательных приближений Крылова И. А., Черноусько Ф.Л. [152, 153]. Дальнейшие исследования в этом направлении позволили обеспечить свойство релаксации по функционалу и сходимость по невязке принципа максимума (Милютин А.А., Илютович А.Е., Дикусар В.В. [122, 184], Любушин А.А., Черноусько Ф.Л. [163-165, 264], Кирин Н.Е. [146, 147],
Васильев О.В., Аргучинцев А.В., Тятюшкин А.И., Терлецкий В.А., Бельтюков Н.Б. [6 - 8, 28, 80 - 87, 124, 181, 308], Mayne D.Q., Polak Е. [294], Тео K.L., Yeo L.T. [305] и др.). Определенный итог этому направлению исследований подведен в работах Срочко В.А. [224, 225], в которых обоснован оптимальный способ игольчатого варьирования управлений в методах, основанных на принципе максимума.
Градиентные процедуры и методы принципа максимума связаны с необходимыми условиями оптимальности. Достаточные условия оптимальности в форме Кротова В.Ф. [149, 150] послужили источником для построения группы методов принципа расширения (Гурман В.И., Москаленко А.И., Батурин В.А., Урбанович Д.Е., Фельдман И.Н. [21, 117, 118, 150, 151, 194, 200] и др.).
Нестандартные необходимые и достаточные условия в невыпуклых задачах специальной структуры являются конструктивной основой для построения методов глобальной оптимизации в работах Стрекаловского А.С.[237 - 239, 301-303].
Следующее направление основано на применении методов нелинейного программирования к конечномерным аналогам задач оптимального управления, полученным с помощью частичной или полной дискретизации задачи по управлению и состоянию. Подход на основе полной дискретизации [127, 129, 209, 213] обстоятельно реализован в монографии Евтушенко Ю.Г. [127].
Предлагаемый в [250, 251] метод линеаризации также использует процедуру дискретизации на уровне линейной модели, что приводит к задаче линейного программирования на каждом шаге итерационного процесса.
Методы, построенные в [110-112], используют частичную дискретизацию задачи по управлению с подсчетом производных функционала по точкам дискретизации.
Методы вариации в фазовом пространстве [154, 189, 191, 192, 264] основаны на сочетании операции дискретизации фазового пространства и методов улучшения в пространстве управлений.
Среди отдельных направлений следует выделить группу неклассических методов поиска программных и позиционных оптимальных управлений для линейных и других классов систем, развиваемых в работах Габасова Р., Кирилловой Ф.М.[99 -105].
Направление, связанное с построением методов для решения задач с импульсными управлениями и разрывными траекториями инициируется задачами моделирования процессов, состояние которых может меняться скачкообразно (Гурман В.Щ117, 118], Дыхта В.А., Самсонюк О.Н.[4, 125, 126], Завалищин С.Т., Сесекин А.Щ130], Миллер Б.М[183] и др.).
Научная школа Зубова В.И. [132, 133] известна фундаментальными и прикладными исследованиями в области теории дифференциальных уравнений, теории устойчивости, теории управления, теории колебаний, моделирования и оптимизации динамики пучков заряженных частиц (Демьянов В.Ф., Рубинов A.M. [120], Кирин Н.Е [146,147], Овсянников Д.А. [201, 202], Петров Ю.П. [204] и др.).
Алгоритмическое и программное обеспечение методов оптимального управления вместе с численным решением тестовых и модельных задач рассмотрены в работах Федоренко Р.П. [251], Евтушенко Ю.Г. [127], Грачева Н.И. [115], Тяттошкина А.И. [246 - 248], Горнова А.Ю. [113] и др.[26, 27, 182].
Другое направление развития методов оптимального управления связано с варьированием управляемого процесса в пространстве переменных состояния и управления.
К данному классу молено отнести методы решения краевой задачи принципа максимума, которая трактуется как задача решения нелинейных уравнений относительно краевых условий [32, 90, 91, 192, 251]. Альтернативный подход к решению краевой задачи принципа максимума основывается на переносе граничных условий [1, 192, 251].
Последние годы в работах Срочко В.А. и его учеников [5, 225 - 236] активно развиваются методы, использующие нестандартные фазовые аппроксимации функционала управления вместе с техникой одновременного варьирования переменных состояния и управления в пространстве управляемых процессов. Более высокое качество аппроксимаций функционала по сравнению со стандартными обуславливает повышенную эффективность разрабатываемых методов. В частности в линейных по состоянию, билинейных и квадратичных задачах оптимального управления эти методы обладают свойством нелокальности улучшения, что является существенным фактором в плане снижения вычислительных затрат на каждое улучшение.
В данной диссертационной работе проводится дальнейшее развитие указанного направления по пути построения методов нелокального улучшения в полиномиальном по состоянию классе задач оптимального управления. Предпринимавшиеся ранее попытки построения методов нелокального улучшения в квадратичных по состоянию задачах на основе решения задач Коши аналогично линейному случаю в общем случае не увенчались успехом. В диссертации впервые разработаны методы, в которых нелокальность улучшения обеспечивается в квадратичной задаче и достигается ценой решения специальной краевой задачи для системы обыкновенных дифференциальных уравнений. Полученная краевая задача улучшения значительно проще классической краевой задачи принципа максимума и сводится к двум задачам Коши в линейном случае. Предложенный подход к нелокальному улучшению на основе решения краевой задачи был обобщен на полиномиальный по состоянию класс задач оптимального управления, в том числе с запаздыванием.
Структура предложенной краевой задачи нелокального улучшения допускает очевидное выделение линейной по состоянию части, которая решается с помощью двух задач Коши и совпадает с краевой задачей в линейном случае. Это свойство позволило применить и обосновать в диссертационной работе известный метод возмущений для ее эффективного решения. Предлагаемый подход обеспечивает свойство нелокальности улучшения, не содержит операцию параметрического поиска последовательных приближений на каждой итерации и в целом формирует новые методы возмущений для нелокального улучшения в задачах оптимального управления.
Основы теории возмущений для решения задач математической физики были сформулированы в трудах Пуанкаре А. и Ляпунова A.M. Дальнейшее развитие математическая теория возмущений получила в работах Фридрихса К. [257], Като Т. [143], Боголюбова Н.Н. и Митропольского Ю.А. [31], Васильевой А.Б. и БутузоваВ.Ф. [92], Вишика М.И. и Люстерника Л.А. [96], ЛионсаЖ.-Л. [158, 159], Ломова С.А. [160], Моисеева Н.Н. [187, 188], Маслова В.П. [179], Треногина В.А. [243 - 245], Беллмана Р. [22], Найфе А. [195], Van Dyke M.D. [307], Murdock J.A. [296] и многих других. Целью исследования в этих работах, как правило, являлась возможность разложения решения по малому параметру и обоснование сходимости полученного ряда к точному решению задачи.
Новые подходы в теории возмущений связаны с построением сопряженных операторов в нелинейных задачах, где требуется найти не само решение, а некоторый функционал от него, оценить вариации функционала в зависимости от вариаций входных параметров. Эти методы плодотворно развиваются Марчуком Г.И. и его научной школой в различных областях математики и ее приложениях к проблемам диффузии, моделям охраны окружающей среды, теории климата и его изменений и др. [2, 12, 33, 34, 135, 169 - 171, 173 - 175]. В работах Марчука Г.И, Агошкова В.И., Шутяева В.П. [174, 175, 269] соответствующие методы возмущений разработаны в нелинейных задачах усвоения данных, представляемых как задачи оптимального управления начально-краевыми условиями в системах дифференциальных операторных уравнений.
Применительно к задачам оптимального управления в системах обыкновенных дифференциальных уравнений методы возмущений рассматривались для анализа асимптотики решений задач в работах Васильевой А.Б. и Дмитриева М.Г. [93, 123], Ильина А.М. и Данилина А.Р. [119, 137, 138] и других исследователей [9, 10, 23, 139, 148, 155, 223, 253, 291, 296]. Для численного решения задач оптимального управления разрабатывались модификации метода последовательных приближений Черноусько Ф.Л. с помощью малого параметра [263].
В задачах математического программирования методы возмущений с целью анализа свойств решений при малых возмущениях систематически изложены в монографии Левитина Е.С. [157]. Вопросы зависимости оптимального решения от малого возмущения задачи исследовались в разных направлениях: теория устойчивости [18, 91, 141, 241, 242,], асимптотические методы в оптимизации [156, 187, 188], параметрическое программирование [18, 109, 203, 212, 252, 285, 287] и ДР.
В теории и практике оптимизации можно выделить различные методы продолжения по параметру [14, 15, 136, 266], которые применяются на этапе перехода от решения возмущенной по параметру задачи к решению исходной задачи. Возмущению (параметризации) подвергают либо исходную оптимизационную задачу, либо условия оптимальности. В частности, для решения краевых задач принципа максимума в качестве параметров продолжения могут использоваться время и граничные условия [121, 193, 298, 299].
В диссертации впервые построены методы возмущений для нелокального улучшения управления в классе полиномиальных задач оптимального управления. Предложенный принцип возмущений краевых задач улучшения и эквивалентных условий улучшения в пространстве управлений далее распространяется на краевую задачу принципа максимума и необходимые условия оптимальности в общей нелинейной задаче оптимального управления. На этой основе в диссертационной работе впервые разработаны методы возмущений для поиска экстремальных управлений (удовлетворяющих необходимым условиям оптимальности).
Суть предлагаемых методов возмущений состоит во введении параметра возмущения в исследуемую задачу так, чтобы при некотором значении параметра задача, называемая невозмущенной, имела простое или очевидное решение. Как правило, невозмущенная задача соответствует нулевому значению параметра возмущения. Для решения возмущенных задач при фиксированном ненулевом значении параметра возмущения строятся итерационные алгоритмы их решения, где на каждой итерации решается задача, аналогичная по сложности невозмущенной задаче. При этом в качестве начального приближения итерационного процесса используется решение возмущенной задачи, полученное при меньшем значении параметра возмущения.
Построенные методы возмущений не гарантируют релаксацию по целевому функционалу на каждой итерации, но компенсируют это свойство отсутствием операции параметрического поиска улучшающего управления, получением реализуемых на практике решений, простотой реализации и настройки метода на конкретную задачу. Эти свойства являются существенными факторами повышения эффективности решения нелинейных задач оптимального управления.
Методы теории управления находят широкое применение при анализе технических, биологических, медицинских, экономических и других систем. Каждая из этих областей применения имеет свои специфические особенности. Например, многие технические системы имеют относительно небольшое число переменных и параметров, а связи между ними почти всегда можно определить в ходе экспериментального исследования системы, или в ходе ее конструирования и разработки. В биологических и медицинских задачах число существенных переменных, как правило, очень велико, а связи между ними, характер влияния одной переменной на другую часто неясны. Аппарат теории управления возник, развивался и непрерывно совершенствовался параллельно с развитием технических систем. Вместе с тем новые области применения задач управления постоянно стимулировали интенсивное развитие идей и методов этой теории, разработку специфических приемов анализа новых систем.
Полиномиальными по состоянию системами обыкновенных дифференциальных уравнений традиционно описывают модели эколого-экономических [185, 186, 196], биологических [166, 199, 205 - 208, 219, 221], химических [271] процессов, в том числе с запаздываниями - модели иммунологических процессов [167, 168, 293], модели динамики ядерных реакторов [114]. Следует отметить, что в целом вопросы об адекватности введения управлений и выборе критериев оптимизации при постановке задач оптимального управления медико-биологическими и экологическими процессами еще нуждаются в дальнейших исследованиях. Состояние дел здесь таково, что аппарат методов оптимального управления на настоящем этапе выступает как средство исследования моделей, показа их непротиворечивости и адекватности реальным процессам, проверки гипотез, решения проблем управляемости, т. е. перевода процесса из одного состояния в другое. В связи с этим представляется актуальным разработка специализированного алгоритмического и программного обеспечения для эффективного решения класса задач оптимального управления, обладающего характерными особенностями. Данное обеспечение может являться инструментом автоматизации исследований и основой мобильных экспертных автоматизированных систем принятия решений с интеллектуальной поддержкой, не требующих трудоемкой экспериментальной настройки оптимизационных методов на конкретную задачу. В настоящее время автоматизация интеллектуального обеспечения методов решения задач оптимального управления является новым научным направлением развития теории управления [26, 27, 88, 89, 248]. и
С 1975 года и по настоящее время под руководством Г.И. Марчука активно развиваются работы по анализу и применению математических моделей инфекционных заболеваний в иммунологии и медицине [13, 24, 25, 35, 140, 167, 168, 176 - 178, 180, 197, 205 - 208, 214 - 218, 275, 276, 293]. Построение моделей стимулировало развитие эффективных методов численного анализа жестких систем дифференциальных уравнений с запаздываниями [24, 36 - 38, 168, 275], методов согласования моделей и реальных данных [97, 134, 135, 168, 214 - 216, 306], анализа чувствительности решений и функционалов от решений к вариациям параметров [12, 33, 34, 97, 168]. В рамках моделей было смоделировано и проанализировано влияние температуры [13], биостимуляции [25], отека [176] и других воздействий на иммунный процесс. Математический анализ хронических бессимптомных форм инфекционных заболеваний позволил обосновать адекватные критерии оптимальности противоинфекционной защиты организма в норме [207,217-218].
Результаты выполненных исследований показали пригодность используемых модельных принципов для адекватного описания динамики иммунного ответа при инфекционных заболеваниях. Эти результаты являются основой для перехода к следующему этапу моделирования — построению моделей конкретных заболеваний с целью их практического применения для решения задач прогноза и оптимального управления иммунным процессом в ходе заболевания. Накопленный опыт построения количественных моделей позволил обоснованно подойти к исследованию модельных задач оптимального лечения неблагоприятных форм заболеваний на основе модуляции иммунной реакции с помощью физиологических и лекарственных препаратов [40 - 45, 49, 50, 54, 56].
Характерными особенностями рассматриваемого класса задач управления иммунным процессом являются:
- полиномиальность (2-5 порядка) управляемой системы и функционалов по вектору состояния;
- простая структура функциональной зависимости управляемой системы и функционалов по вектору управления и управляющим параметрам (как правило, линейность по управлению);
- относительно большая размерность управляемой системы по вектору состояния (4-15 переменных) и малая размерность по вектору управления (как правило, скалярные функции времени);
- простая структура множества значений управления и управляющих параметров системы (как правило, параллелепипедные ограничения);
- жесткость управляемой системы, обусловленная различием на несколько (2 - 3) порядков характерных времен изменения переменных состояния;
- наличие постоянных запаздываний (от 1 до 5) в управляемой системе по вектору состояния;
- нефиксированный момент окончания процесса управления, наличие функциональных ограничений (как правило, от 1 до 2).
Для задач оптимального управления иммунным процессом характерна значительная количественная трудоемкость численного решения итерационными методами локального улучшения, где на каждой итерации производится параметрический поиск улучшающего управления и возможная настройка вычислительных параметров метода для учета функциональных ограничений задачи. При этом операция параметрического варьирования управления может приводить к труднореализуемым на практике расчетным управлениям, а локальность улучшения - к неудовлетворительным результатам по критерию качества и ограничениям. Специфика рассматриваемых задач управления иммунным процессом обуславливает возможные подходы к их решению.
Методы конечно-разностной аппроксимации с редукцией к специальной задаче математического программирования ввиду большой размерности вектора состояния требуют значительных вычислительных ресурсов и затрат. Методы стрельбы и методы линеаризации для решения краевой задачи принципа максимума в пространстве состояний приводят к вычислительной неустойчивости расчета, обусловленной жесткостью системы, наличием положительных вещественных частей собственных чисел матрицы Якоби системы, возможной разрывностью правых частей системы по вектору состояния.
В работах [40 - 53, 55, 57] для решения поставленных задач оптимального управления иммунным процессом применялся и модифицировался известный аппарат численных методов и теории оптимального управления [3, 11, 16, 17, 29,
30, 91, 94, 95, 106 - 108, 116, 128, 131, 141, 142, 144, 162, 181, 198, 210, 220, 222, 226, 236, 240, 255, 256, 258 - 262, 267, 270, 273, 289].
В задачах рассматриваемого класса, где правые части системы линейны по управлению, оптимальное неособое управление будет принимать граничные значения из множества допустимых. В этом случае методы принципа максимума, основанные на игольчатых вариациях управления [181, 226, 236], дают возможность приближения к оптимальному управлению в классе граничных управлений, что представляется удобным. При этом простая структура множества значений управления U и малая размерность вектора управления позволяют эффективно организовать решение вспомогательных задач оптимизации на каждой итерации методов, учитывающих прямые и терминальные ограничения на управление. Именно такой подход был выбран за основу в работах [40 - 53, 55, 57] при решении задач оптимального управления. Рассматривались различные модификации методов принципа максимума, разработанные и адаптированные для систем с запаздыванием.
Достоинством предлагаемых в указанных работах методов являлась вычислительная устойчивость расчета, обусловленная поочередным численным интегрированием фазовой («слева - направо») и сопряженной («справа - налево») жестких задач Коши на каждой итерации методов. Наиболее трудоемкой частью указанных методов являлся параметрический поиск улучшающей вариации управления в локальной окрестности улучшаемого управления. Трудоемкость численного интегрирования задач Коши, связанная со специфическими особенностями рассматриваемых задач (большая размерность по вектору состояния, жесткость системы, наличие запаздываний), приводила к тому, что процедура параметрического поиска улучшающего управления фактически определяла трудоемкость всего итерационного процесса. При этом локальность улучшения обуславливала быструю потерю практической сходимости к оптимальному управлению при неудачном выборе начального приближения, а процедура слабого или игольчатого варьирования управления приводила к получению труднореализуемых на практике расчетных управлений. Отметим также, что сходимость указанных методов по невязке принципа максимума делала невозможным улучшение экстремальных управлений.
В диссертации впервые разработаны методы нелокального улучшения и методы возмущений, учитывающие прикладную специфику задач оптимального управления иммунным процессом, в том числе запаздывание, нефиксированное условие окончания процесса управления, функциональные ограничения. Проведены апробация и сравнительный анализ эффективности предложенных методов на модельных задачах управления иммунным процессом при заболеваниях.
Основными целями диссертационной работы являются:
- конструирование специализированных методов для численного решения полиномиальных по состоянию задач оптимального управления;
- модификация и применение разработанных методов в модельных задачах управления иммунным процессом с учетом их специфических особенностей;
- создание алгоритмического и программного обеспечения для решения рассматриваемого класса задач оптимального управления.
Диссертационная работа состоит из двух частей. В первой части (главы 1-5) специальные методы разрабатываются и обосновываются в классе полиномиальных по состоянию задач оптимального управления без функциональных ограничений на фиксированном интервале времени. Эти задачи являются определяющими для проблем управления экологическими, медико-биологическими процессами, химическими и ядерными реакциями и обычно рассматриваются в качестве типовых вспомогательных задач. Разработанный подход распространяется на общий класс нелинейных задач оптимального управления без функциональных ограничений с фиксированным временем (основные задачи).
Во второй части (главы 6, 7) проводится адаптация разработанных методов к специфике задач оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями.
Численные эксперименты, проведенные в работе, в целом продемонстрировали лучшие количественные (число решенных задач Коши, значение целевого функционала) и качественные (реализуемость управления, аппроксимация оптимального управления) показатели расчетов тестовых и модельных задач построенными методами возмущений по сравнению со стандартными методами локального улучшения.
Выделим основные задачи диссертационного исследования.
1. Разработка и обоснование:
- методов нелокального улучшения и методов возмущений без параметрического варьирования последовательных приближений в полиномиальных по состоянию задачах оптимального управления и оптимизации управляющих параметров;
- методов возмущений для решения основных задач оптимального управления и оптимизации управляющих параметров.
2. Постановка и классификация задач оптимального управления иммунным процессом при инфекционных заболеваниях на основе математических моделей.
3. Адаптация и применение методов нелокального улучшения и методов возмущений в задачах оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями -неравенствами.
4. Создание алгоритмического и программного обеспечения разработанных методов.
Структура работы соответствует поставленным целям. Диссертация состоит из введения, семи глав, заключения и списка литературы. Каждая глава разбита на разделы, нумерация разделов двойная и производится по главам. В номере формулы первая цифра указывает на главу, вторая - на раздел.
Выводы. Пример демонстрирует возможность применения прямого метода возмущений принципа максимума (МВПМ) для расчета модельных задач с ограничениями-неравенствами на фиксированном интервале времени.
Слабым местом метода МВПМ является точность выполнения функциональных ограничений задачи. Например, применение метода МВПМ к решению задачи (6.1.2), (7.6.1) - (7.6.4) с нефиксированным временем окончания управления дает сходимость метода к решению задачи без ограничения (6.1.2), (7.6.1) - (7.6.3).
По результатам численных экспериментов решения методами возмущений модельных задач с функциональными ограничениями и нефиксированным временем можно сделать следующие общие выводы.
1. Для применения методов возмущений в задачах с нефиксированным временем необходимо выполнение условия окончания процесса управления в окрестности значений параметра возмущения. Например, в возмущенной по параметру s е[0,1] задаче (6.1.2), (7.6.1) - (7.6.4) при 0<£<0.2 условие (7.6.2) не выполняется при и = 0. Это обуславливает отсутствие сходимости метода возмущений при 0 < s < 0.2 и невозможность дальнейшего последовательного решения возмущенных задач, начиная с приближения, полученного в предыдущей возмущенной задаче.
Условие окончания процесса управления заведомо выполняется в задачах с фиксированным временем, что обеспечивает сходимость методов возмущений при достаточно малых параметрах возмущения в задачах с фиксированным временем.
Указанное необходимое условие обеспечивается свойствами операции проектирования в методе проекционных возмущений для системы условий оптимальности (МПВУО) при малых параметрах возмущения а > 0. Это приводит к устойчивой работе метода МПВУО в задачах с ограничениями и нефиксированным временем окончания процесса управления. При этом метод МПВУО позволяет получать экстремальные управления при любых параметрах возмущения.
2. Метод возмущений принципа максимума (МВПМ) в случае сходимости дает хорошие приближения управления как по значению целевого функционала, так и по качеству реализуемости и близости к оптимальному управлению, но проигрывает по точности выполнения функционала ограничения. Последнее свойство обуславливается отсутствием операции контроля за нарушение функционального ограничения на итерациях метода МВПМ.
В целом метод МВПМ недостаточно точно учитывает функциональные ограничения и на практике может использоваться в качестве метода получения допустимого начального приближения управления в задачах с функциональными ограничениями.
Метод возможных направлений (МВН) по сравнению с методами возмущений при прочих равных параметрах настройки расчета имеет дополнительный важный настроечный параметр точности выполнения терминального ограничения -неравенства, определяющего активность ограничения, а также параметр допуска нарушения ограничения, влияющего на качество сходимости метода. Оценка эффективности сравниваемых методов в целом, включая затраты пробных расчетов по подбору параметра «активности ограничения» и параметра допуска ограничения, на практике вычислений дает преимущество методам возмущений, свободным от такой операции контроля ограничения. При этом отметим, что количество указанных дополнительных настраиваемых параметров метода МВН увеличивается пропорционально количеству ограничений-неравенств.
Заключение
В работе получены следующие основные результаты:
1. В нелинейном полиномиальном по состоянию классе задач оптимального управления, включающих системы с запаздыванием, построены конструктивные формулы приращения функционала, не содержащие остаточных членов разложений. На основе этих формул разработаны методы нелокального улучшения. Получены новые необходимые условия оптимальности управления, усиливающие принцип максимума в рассматриваемом классе задач.
2. Для решения вспомогательной краевой задачи нелокального улучшения в пространстве состояний и эквивалентного условия улучшения в пространстве управлений сконструированы методы возмущений, которые не содержат операцию параметрического варьирования последовательных приближений. Получены и обоснованы условия сходимости итерационных процессов методов возмущений.
3. В классе основных задач оптимального управления, включающих системы с запаздыванием, построены методы возмущений для решения краевой задачи принципа максимума и проекционного необходимого условия оптимальности. Проанализирована сходимость методов и проведены сравнительные расчеты тестовых задач.
4. В задачах оптимизации управляющих параметров (управлений) полиномиальных по состоянию систем, включающих системы с запаздыванием и с кусочно-постоянными управляющими функциями (дискретными управлениями), построены конструктивные формулы приращения целевой функции, не содержащие остаточных членов разложений. На основе полученных формул разработаны методы нелокального улучшения управляющих параметров и дискретных управлений. Получены новые необходимые условия оптимальности управляющих параметров и дискретного управления, усиливающие дифференциальный принцип максимума в рассматриваемом классе задач.
5. Для решения вспомогательной задачи о неподвижной точке в процедурах нелокального улучшения управляющих параметров разработаны методы возмущений без операции варьирования последовательных приближений. Сконструированы методы возмущений для поиска управлений, удовлетворяющих дифференциальному принципу максимума и эквивалентному проекционному условию оптимальности в классе основных задач оптимизации управляющих параметров. Даны условия сходимости итерационных процессов методов возмущений.
6. Поставлены и классифицированы задачи оптимального управления иммунным процессом при инфекционных заболеваниях организма на основе математических моделей, разработанных под руководством Г.И. Марчука. По ограничениям на управление задачи интерпретируются как задачи лечения заболевания.
7. Методы нелокального улучшения и методы возмущений адаптированы для решения полиномиальных по состоянию задач оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями - неравенствами. Создано алгоритмическое и программное обеспечение предложенных методов для численного решения рассматриваемого класса задач. Проведен сравнительный анализ разработанных и стандартных методов численного решения модельных задач управления иммунным процессом.
Научная новизна.
Все полученные теоретические результаты являются новыми, вносят существенный вклад в конструктивную теорию оптимального управления и определяют перспективное направление исследований в плане разработки нелокальных методов для численного решения нелинейных задач. Проведенный анализ открывает новые возможности для эффективного применения метода возмущений в рамках задач оптимального управления, когда в качестве объектов параметризации предлагается использовать краевую задачу улучшения и необходимые условия оптимальности.
Рассмотрены новые нестандартные постановки задач оптимального управления на основе математических моделей иммунного процесса, которые интерпретируются как задачи оптимального лечения при заболеваниях.
Разработано математическое и программное обеспечение для численного решения этих задач.
Теоретическая и практическая ценность.
Показана принципиальная возможность осуществления нелокального улучшения в нелинейном полиномиальном по состоянию классе задач оптимального управления с помощью решения краевой задачи для обыкновенных дифференциальных уравнений, которая значительно проще краевой задачи принципа максимума. Предложенные методы нелокального улучшения позволили обосновать новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. Разработан новый подход к численному решению нелинейных полиномиальных по состоянию и основных задач оптимального управления, включающих задачи с запаздыванием, с функциональными ограничениями - неравенствами, на основе процедуры возмущений условий нелокального улучшения и условий оптимальности управления. Предлагаемые методы возмущений не требуют параметрического поиска улучшающего приближения на каждой итерации, имеют возможность строго улучшать неоптимальные управления, удовлетворяющие принципу максимума и получать реализуемые на практике управления. Указанные особенности методов позволяют существенно повысить эффективность решения нелинейных задач.
Разработаны постановки задач управления иммунным процессом на основе математических моделей, интерпретируемых как задачи лечения инфекционных заболеваний. Создано алгоритмическое и программное обеспечение решения задач построенными методами нелокального улучшения и методами возмущений, которое позволяет практически находить экстремальные управления в рассматриваемых моделях и давать им содержательную интерпретацию. Данное обеспечение является инструментом автоматизации исследований и может использоваться в экспертных автоматизированных системах принятия решений. Результаты численных экспериментов показывают принципиальную возможность использования методов оптимального управления для исследования процессов иммунного ответа при инфекционных заболеваниях. Содержательные результаты исследования моделей иммунных процессов с помощью методов оптимального управления могут быть рекомендованы для анализа, имитации и интерпретации реальных данных, проверки гипотез и планирования экспериментов.
Полученные результаты используются в учебных спецкурсах «Численные методы оптимального управления», «Дополнительные главы оптимального управления», для разработки курсовых и дипломных работ студентов специальности «Прикладная математика и информатика» Бурятского государственного университета и Восточно-Сибирского государственного технологического университета.
Результаты диссертации являются частью исследований в рамках грантов Российского фонда фундаментальных исследований (проекты 05-01-00477, 05-0100659).
1. Абрамов А.А. О переносе граничных условий для систем линейных обыкновенных дифференциальных уравнений // Журн. вычислит, математики и мат. физики. 1961. - Т. 1, №3. - С. 542-545.
2. Агошков В.И., Дубовский П.Б., Шутяев В.П. Методы решения задач математической физики. М.: Физматлит, 2002. - 320 с.
3. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979. - 432 с.
4. Антипина Н.В., Дыхта В.А. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума // Изв. вузов. Математика. 2002. - №12. - С. 11-22.
5. Антоник В.Г., Срочко В.А. Вопросы сравнительной эффективности методов градиентного типа в задачах оптимального управления. Иркутский университет. Серия: Оптимизация и управление. Вып. 9. - Иркутск: 2003. - 40 с.
6. Аргучинцев А.В. Оптимальное управление начально-краевыми условиями гиперболических систем. Иркутск: Изд-во Иркут. гос. ун-та, 2003. - 156 с.
7. Аргучинцев А.В., Васильев О.В. Итерационные процессы принципа максимума и их модификации в системах с распределенными параметрами // Дифференц. уравнения. 1996. - Т.32, №6. - С. 797 - 803.
8. Аргучинцев А.В., Крутикова О.А. Оптимизация полулинейных гиперболических систем с гладкими граничными управлениями // Изв. вузов. Математика. 2001. - №2. - С.З -10.
9. Арутюнов А.В. Расширения и возмущения задач оптимального управления // Тр. МИРАН. 1998. - Т.220. - С.27-34.
10. Арутюнов А.В. Условия экстремума. Нормальные и вырожденные задачи. -М.: Изд-во «Факториал», 1997. 256 с.
11. Арушанян О.Б., Залеткин С.В. Численное решение обыкновенных дифференциальных уравнений на Фортране. М.: Изд-во МГУ, 1990. - 336 с.
12. Асаченков A.JI. Об одном алгоритме решения обратных задач на основе теории сопряженных уравнений. Препринт ОВМ АН СССР №119. - М.: 1986.-24 с.
13. Асаченков А.Л. Простейшая модель влияния температурной реакции на динамику иммунного ответа // Математическое моделирование в иммунологии и медицине. Новосибирск: Наука, 1982. - С. 40-44.
14. Афанасьев А.П. Линейные по управляющим воздействиям задачи оптимального управления. Препринт ВНИИСИ. - М., 1980.
15. Афанасьев А.П. Продолжение решений в вариационных задачах с неравенствами // Динамика неоднородных систем. М.: ВНИИСИ, 1982. - С. 96- 109.
16. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.А. Необходимое условие в оптимальном управлении. М.: Наука, 1990. - 319 с.
17. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теорияконструирования систем управления. М.: Высшая школа, 1988. - 574 с.
18. Ашманов С.А. Линейное программирование. М.:Наука, 1981.
19. Ащепков Л.Т. Оптимальное управление разрывными системами.
20. Новосибирск: Наука, 1987. 225 с.
21. Бартеньев О.В. Фортран для профессионалов. Математическая библиотека IMSL. Ч.З. М.: Диалог-МИФИ, 2001. - 368 с.
22. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск: Наука, 1997.-172 с.
23. Беллман Р., Калаба Р. Квазилинеаризация и нелинейные краевые задачи. М.: Мир, 1968.
24. Белых JT.H. Математическая модель бииифекции и лечения хронических форм обострением // Математическое моделирование в иммунологии и медицине. -Новосибирск: Наука, 1982. С. 33-40.
25. Белышев Д.В., Гурман В.И. Интеллектуальные процедуры оптимального управления // Автоматика и телемеханика. 2002. - №5. - С. 147-155.
26. Белышев Д.В., Гурман В.И. Программный комплекс многометодных интеллектуальных процедур оптимального управления // Автоматика и телемеханика. 2003. - №6. - С. 60-67.
27. Бельтюков Н.Б. Одна модификация метода второго порядка решения задач оптимального управления // Вопросы устойчивости и оптимизации динамических систем. Иркутск: Изд-во Иркут. гос. ун-та, 1983. - С. 35-42.
28. Бертсекас Д. Условная оптимизация и методы множителей Лагранжа. М.: Радио и связь, 1987. - 399 с.
29. Благодатских В.И. Введение в оптимальное управление. М.: Высшая школа, 2001.-239 с.
30. Боголюбов Н.Н., Митропольский Ю.А. Асимптотические методы в теории нелинейных колебаний. М.: Наука, 1974.
31. Болдырев В.И. Численное решение задачи оптимального управления // Изв. РАН. Теория и системы управления. 2000. - №3. - С.85-92.
32. Бочаров Г.А. Сопряженные уравнения и анализ чувствительности математических моделей. Деп. в ВИНИТИ № 2858-В94. - М., 1994.
33. Бочаров Г.А., Гольдман Н.Б. Математическое исследование асимптотической динамики экспериментальных вирусных инфекций // Вычислительная математика и математическое моделирование. Труды международной конференции. М.: ИВМ РАН, 2000.
34. Бочаров Г.А., Марчук Г.И. Прикладные проблемы математического моделирования в иммунологии // Журн. вычислит, математики и мат. физики. Т.40, №12. - 2000. - С. 1905-1920.
35. Бочаров Г.А., Романюха А.А. Численное решение дифференциальных уравнений с запаздывающим аргументом на основе методов Рунге-Кутта-Фельберга. Препринт ОВМ АН СССР №99. - М., 1985.
36. Бочаров Г.А., Романюха А.А. Численное решение дифференциальных уравнений с запаздывающим аргументом на основе линейных многошаговых методов. Аппроксимация, устойчивость и сходимость. Препринт ОВМ АН СССР №116.-М., 1986.
37. Бочаров Г.А., Романюха А.А. Численное решение дифференциальных уравнений с запаздывающим аргументом на основе линейных многошаговых методов. Алгоритм и программа. Препринт ОВМ АН СССР №117. - М., 1986.
38. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972.-544 с.
39. Булдаев А.С., Кузин В.А. Теоретическая оптимизация противовирусного иммунного ответа. Препринт ВЦ СО АН СССР № 496.- Новосибирск, 1984. -18 с.
40. Булдаев А.С. Теоретическая оптимизация иммунного процесса с помощьютемпературы и биостимуляции. Препринт ВЦ СО АН СССР № 603. -Новосибирск, 1985.-33 с.
41. Булдаев А.С. Оптимизация управления иммунным процессом с помощью температуры и биостимуляции // Математические модели в эндокринологии. -Каунас, 1985.-С.137-138.
42. Булдаев А.С., Погожев И.Б. Оптимизация иммунного процесса по критерию минимума индекса тяжести заболевания. Препринт ВЦ СО АН СССР № 604. - Новосибирск, 1986. - 26 с.
43. Булдаев А.С. Численное решение задач оптимального управления иммунным процессом // Математическое моделирование в иммунологии и медицине. -М.: ОВМ АН СССР, 1986. С.157-177.
44. Булдаев А.С. Оптимизация иммунного ответа с помощью регулирования процесса отека // Материалы Международного рабочего совещания «Математическое моделирование в иммунологии и медицине». Киев, 1989. -С.15-16.
45. Булдаев А.С. Численный метод оптимизации управления в системах с запаздываниями. Препринт ВЦ СО АН СССР № 863. - Новосибирск, 1989. -30 с.щ
46. Булдаев А.С. Алгоритм оптимизации управления колебаниями в системах с запаздываниями. Препринт ВЦ СО АН СССР № 894. - Новосибирск, 1990. -21 с.
47. Булдаев А.С. Численный метод оптимизации управления в системах с запаздываниями при моделировании иммунного ответа. // Журн. вычислит, математики и мат. физики. 1990. - Т.ЗО, №9. - С. 1307-1322.
48. Булдаев А.С. Управление колебаниями в системах с запаздываниями при моделировании заболеваний // Математическое моделирование. 1991. - №6. -С.10-21.
49. Булдаев А.С. Оптимизация управлений в системах с запаздываниями // Труды XI Байкальской межд. конф. «Методы оптимизации и их приложения». Т.2. -Иркутск, 1998.-С. 50-53.
50. Булдаев А.С. Оптимизация управления в системах с запаздываниями // Сборник научных трудов. Серия: Математика. Выпуск 2. Улан-Удэ: Изд-во ВСГТУ, 1998.-С. 39-41.
51. Булдаев А.С. Численные методы управления колебаниями в системах с запаздываниями // Сборник научных трудов. Серия: Математика. Вып. 2. -Улан-Удэ: Изд-во ВСГТУ, 1998. С. 41-43.
52. Булдаев А.С. Моделирование устойчивых режимов вирусных инфекций // Оптимизация, управление, интеллект. ИДСТУ СО РАН, 1999, № 3. С. 110120.
53. Булдаев А.С. Об одном методе последовательных приближений для оптимизации систем с запаздываниями, основанном на фазовой аппроксимации // Сборник научных трудов. Серия: Математика. Выпуск 4. -Улан-Удэ: Изд-во ВСГТУ, 1999. С. 28-34.
54. Булдаев А.С. Моделирование иммунотерапии при вирусных инфекциях // Сборник научных трудов. Серия: Математика. Выпуск 5. Улан-Удэ: Изд-во ВСГТУ, 2000. - С. 80-87.
55. Булдаев А.С. Алгоритмы улучшения для одной задачи оптимального управления с краевыми условиями // Сборник научных трудов. Серия: Математика. Выпуск 5. Улан-Удэ: Изд-во ВСГТУ, 2000. - С. 158-165.
56. Булдаев А.С., Мижидон А.Д. Параметрическая оптимизация динамических систем // Математика в восточных регионах Сибири. Материалы международной конференции, 28-30 июня 2000 г., Улан-Удэ, 2000. С. 97-98.
57. Булдаев А.С., Мижидон А.Д. Двухэтапный параметрический синтез динамических систем // Материалы Четвертого Сибирского конгресса по прикладной и индустриальной математике (ИНПРИМ 2000). - Новосибирск: ИМ СО РАН, 2000. - С. 10-11.
58. Булдаев А.С., Мижидон А.Д. Об одном подходе к параметрической идентификации динамических систем // Труды межд. конф. «Идентификация систем и задачи управления» М.: ИПУ СО РАН, 2000. - С. 2200-2204. -ISBN 5-201-09605-0.
59. Булдаев А.С. Численная оптимизация скалярных управлений // Вестник ВСГТУ. Улан-Удэ: Изд-во ВСГТУ, 2001. - №3 - С.157-163.
60. Булдаев А.С. Оптимизация управлений в динамических системах, квадратичных по состоянию // Труды XII Байкальской межд. конференции «Методы оптимизации и их приложения». Т. 2. Иркутск, 2001. - С. 78-82.
61. Булдаев А.С. Оптимизация квадратичных систем по управляющим параметрам // Scientific Transaction of National University of Mongolia, School of mathematics and computer sciences, Institute of Mathematics. Ulaanbaatar, 2001. -№8(186).-P. 53-58.
62. Булдаев А.С. Нелокальное улучшение управлений в системах с запаздыванием // Изв. вузов. Математика. 2001. - №12. - С.3-9.
63. Булдаев А.С. Параметрическая оптимизация квадратичных динамических систем // Сборник научных трудов. Серия: Математика. Выпуск 6. Улан-Удэ: Изд-во ВСГТУ, 2002. - С. 3-11.
64. Булдаев А.С. Фазовая регуляризация процедур параметрической оптимизации динамических систем // Сборник научных трудов. Серия: Математика. Вып. 6. -Улан-Удэ: Изд-во ВСГТУ, 2002. С. 12-18.
65. Булдаев А.С. Процедуры нелокального улучшения управляющих параметров в линейных по состоянию системах // Математика, ее приложения и математическое образование. Материалы межд. конф. Т.1. Улан-Удэ: Изд-во ВСГТУ, 2002.-С. 111-118.
66. Булдаев А.С., Васильев О.В. Нелокальная оптимизация нелинейных управляемых систем // Математика, ее приложения и математическое образование. Материалы межд. конф. Т.1. Улан-Удэ: Из-во ВСГТУ, 2002. -С. 118-124.
67. Булдаев А.С. Процедуры нелокального улучшения в полиномиальных по состоянию системах управления: Науч. изд. Серия: Оптимизация и управление. Вып. 7. Иркутск: Иркут. ун-т, 2002. - 48 с.
68. Булдаев А.С. Регуляризация нелокальных процедур улучшения в квадратичных задачах управления // Оптимизация, управление, интеллект. ИДСТУ СО РАН, 2002, № 6. С. 84-93.
69. Булдаев А.С. К оптимизации квадратичных по состоянию динамических систем // Изв. вузов. Математика. 2002. - №12. - С.30-38.
70. Булдаев А.С. Нелокальное улучшение дискретных управлений в квадратичных по состоянию динамических системах // Труды межд. конф. «Идентификация систем и задачи управления». М.: ИПУ РАН, 2003. - С. 707-713. - ISBN 5201-14948-0.
71. Булдаев А.С. К идентификации параметров квадратичных по состоянию динамических систем // Инфокоммуникационные и вычислительные технологии и системы. Материалы Всероссийской конференции. Т.1 Улан-Удэ: Изд-во Бурятского ун-та, 2003. - С. 71-75.
72. Булдаев А.С. Нелокальное улучшение управлений в системах с запаздываниями // Журн. вычислит, математики и мат. физики. 2003. - Т.43, №2.-С. 176-185.
73. Булдаев А.С. Процедуры нелокального улучшения управления в квадратичных по состоянию задачах управления // Изв. РАН. Теория и системы управления. 2003. - №2. - С.76-85.
74. Булдаев А.С. Нелокальное улучшение управляемых процессов методом возмущений: Науч.изд. Серия: Оптимизация и управление. Вып. 10. -Иркутск: Иркут. ун-т, 2004. 52 с.
75. Булдаев А.С. Модификация метода проекций в задачах параметрической оптимизации квадратичных по состоянию систем // Вестник Бурятского университета. Серия 13. Математика и информатика. Улан-Удэ: Изд-во Бурятского ун-та, 2004. - С. 70-76.
76. Васильев О.В. Лекции по методам оптимизации. Иркутск: Изд-во ИГУ, 1994. -339 с.
77. Васильев О.В., Аргучинцев А.В. Методы оптимизации в задачах и упражнениях. М.: Физматлит, 1999. - 208 с.
78. Васильев О.В., Бельтюков Н.Б., Терлецкий В.А. Алгоритмы оптимизации динамических систем, основанные на принципе максимума // Вопросы кибернетики. Модели и методы анализа больших систем. М.: 1991. - С. 1738.
79. Васильев О.В., Дыхта В.А., Срочко В.А. Задачи оптимального управления: вариационный принцип максимума и методы численного решения // Нелинейная теория управления и ее приложения. М.: Физматлит, 2000. - С. 194-280.
80. Васильев О.В., Срочко В.А., Терлецкий В.А. Методы оптимизации и их приложения. 4.2. Оптимальное управление. Новосибирск: Наука, 1990. - 151 с.
81. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журн. вычислит, математики и мат. физики. 1981. - Т.21, №6. - С. 1376-1384.
82. Васильев О.В., Тятюшкин А.И. Опыт решения задач оптимального управления на основе необходимых условий оптимальности типа принципа максимума // Вопросы устойчивости и оптимизации динамических систем. Иркутск: Изд-во Иркут. гос. ун-та, 1983. - С. 43-64.
83. Васильев С.Н. К интеллектному управлению // Нелинейная теория управления и ее приложения. М.: Физматлит, 2000. - С. 57 - 126.
84. Васильев С.Н., Жерлов А.К., Федосов Е.А., Федунов Б.Е. Интеллектное управление динамическими системами. -М.: Физматлит, 2000. -352 с.
85. Васильев Ф.П. Методы решения экстремальных задач. М.: Наука, 1981. - 399 с.
86. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1980.-518 с.
87. Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973.
88. Васильева А.Б., Дмитриев М.Г. Сингулярные возмущения в задачах оптимального управления // Мат. анализ (Итоги науки и техники). Т. 20. М.: ВИНИТИ, 1982. - С. 3 -77.
89. Вайнберг М.М. Функциональный анализ. М.: Просвещение, 1979. - 128 с.
90. Вержбицкий В.М. Основы численных методов. М.: Высшая школа, 2002. -840 с.
91. Вишик М.И., Люстерник Л.А. Некоторые вопросы возмущений краевых задач для дифференциальных уравнений в частных производных // ДАН СССР. -1959. Т. 129, № 6. - С. 1203-1206.
92. Вычислительные процессы и системы. Вып.З / Под ред. Г.И.Марчука. М.: Наука, 1985,- 254 с.
93. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. -М.: Наука, 1971.-508 с.
94. Габасов Р., Кириллова Ф.М. Конструктивные методы оптимального управления // Изв. АН СССР. Техн. кибернетика. 1983. - №2. - С. 169-185.
95. Габасов Р., Кириллова Ф.М. Конструктивные методы оптимизации. 4.2: Задачи управления. Минск: Университетское, 1984. - 207 с.
96. Габасов Р., Кириллова Ф.М. Методы оптимизации. Минск: Белорус.гос.ун-т, 1981.-350 с.
97. Габасов Р., Кириллова Ф.М. Оптимизация линейных систем. — Минск: Белорус.гос.ун-т, 1973. -248 с.
98. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М.: Наука, 1973.-256 с.
99. Габасов Р., Кириллова Ф.М., Костюкова О.И., Ракецкий В.М. Конструктивные методы оптимизации. 4.5. Нелинейные задачи. Минск: Университетское, 1998.-390 с.
100. Габасов Р., Кириллова Ф.М., Тятюшкин А.И. Конструктивные методы оптимизации. 4.1: Линейные задачи. Минск: Университетское, 1984. -214 с.
101. Гермейер Ю.Б. Введение в теорию исследования операций. М.: Наука, 1971. -383 с.
102. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М.: Мир, 1985. -509 с.
103. Гольштейн Е.Г., Третьяков Н.В. Модифицированные функции Лагранжа. М.: Наука, 1989.-400 с.
104. Гольштейн Е.Г., Юдин Д.Б. Новые направления в линейном программировании. -М.: Наука, 1966.
105. Горбунов В.К. Метод параметризации задач оптимального управления // Журн. вычислит, математики и мат. физики. 1979. - Т.19,№2. - С.292-303.
106. Горбунов В.К. О сведении задач оптимального управления к конечномерным // Журн. вычислит, математики и мат. физики. 1978. - Т.18,№5. - С.1083-1095.
107. Горбунов В.К., Лутошкин И.В. Развитие и опыт применения метода параметризации в вырожденных задачах динамической оптимизации // Изв. РАН. Теория и системы управления. 2004. - №5. - С.67-84.
108. Горяченко В.Д. Методы исследования устойчивости ядерных реакторов. М.: Атомиздат, 1977.-295 с.
109. Грачев Н.И., Евтушенко Ю.Г. Библиотека программ для решения задач оптимального управления // Журн. вычислит, математики и мат. физики. -1979.-№ 2.-С. 367-387.
110. Турецкий X. Анализ и синтез систем управления с запаздыванием. М.: Машиностроение. - 1974. - 247 с.
111. Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977.-304 с.
112. Гурман В.И. Принцип расширения в задачах управления. М.: Наука, 1985. -287 с.
113. Данилин А.Р., Ильин A.M. Асимптотика решения задачи о быстродействии при возмущении начальных условий // Техн. кибернетика. № 3. - 1994. - С. 96-103.
114. Демьянов В.Ф., Рубинов А.М. Приближенные методы решения экстремальных задач. Д.: ЛГУ, 1968. - 179 с.
115. Дикусар В.В., Кошька М., Фигура А. Метод продолжения по параметру при решении краевых задач в оптимальном управлении // Дифференц. уравнения. -2001. Т. 37, № 4. - С. 453 - 457.
116. Дикусар В.В., Милютин А.А. Качественные и численные методы в принципе максимума. М.: Наука, 1989. - 144 с.
117. Дмитриев М.Г. Теория сингулярных возмущений и некоторые задачи оптимального управления // Дифференц. уравнения. 1985. - Т. 21, № 10. - С. 1693- 1698.
118. Дубовицкий А .Я., Милютин А.А. Теория принципа максимума // Методы теории экстремальных задач в экономике. М.: Наука, 1981. - С.6 - 47.
119. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных процессов. Иркутск: Изд-во ИГЭА, 1995. - 186 с.
120. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: Физматлит, 2000. - 255 с.
121. Евтушенко Ю.Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982. - 432 с.
122. Егоров А.И. Уравнения Риккати. М.: Физматлит, 2001. - 320 с.
123. Ермольев Ю.М., Гуленко В.П., Царенко Т.И. Конечно-разностный метод в задачах оптимального управления. Киев: Наукова думка, 1978. - 163 с.
124. Завалищин С.Т., Сесекин А.Н. Импульсные процессы: модели и приложения. -М.: Наука, 1991.-256 с.
125. Зойтендейк Г. Методы возможных направлений. -М.: ИЛ, 1963. 176 с.
126. Зубов В.И. Лекции по теории управления. М.: Наука, 1975. - 495 с.
127. Зубов В.И. Теория колебаний. М.: Высшая школа, 1979. - 400 с.
128. Зуев С.М. Определение параметров моделей по данным наблюдений // Вычислительные процессы и системы. Вып. 3. М.: Наука, 1985. - С. 80-107
129. Зуев С.М. Статистическое оценивание параметров математических моделей заболеваний. -М.: Наука, 1988. 192 с.
130. Измаилов А.Ф., Солодов М.В. Численные методы оптимизации. М.: Физматлит, 2003. - 304 с.
131. Ильин A.M. Согласование асимптотических разложений решений краевых задач. М.: Наука, 1989.
132. Ильин A.M., Данилин А.Р. Асимптотическое поведение решения задачи быстродействия для линейной системы при возмущении начальных данных // Докл. РАН. 1996. - Т. 350, № 2. - С. 155- 157.
133. Калинин А.И. Метод возмущений для асимптотического решения квазилинейной задачи оптимального быстродействия // Дифференц. уравнения. 1990. - Т. 26, № 4. с. 585- 594.
134. Каркач А.С. Романюха А.А. Энергетический критерий качества иммунной защиты и патогенность микроорганизмов. // Автоматика и телемеханика. -2003.-№6.-С. 141-151.
135. Карманов В.Г. Математическое программирование. -М.: Наука, 1986.-285 с.
136. Карташев А.П., Рождественский Б.Л. Обыкновенные дифференциальные уравнения и основы вариационного исчисления. -М.: Наука, 1986. -272 с.
137. Като Т. Теория возмущений линейных операторов. М.: Мир, 1972.
138. Каханер Д., Моулер К., Нэш С. Численные методы и программное обеспечение. М.: Мир, 1988. - 575 с.
139. Келли Г. Метод градиентов // Методы оптимизации с приложениями к механике космического полета. М.: Наука, 1965. - С. 101-116.
140. Кирин Н.Е. Вычислительные методы теории оптимального управления. JL: Изд-во ЛГУ, 1968. -144 с.
141. Кирин Н.Е. Методы последовательных оценок в задачах оптимизации управляемых систем. Л.: Изд-во ЛГУ, 1975. - 160 с.
142. Киселев Ю.Н. Линейная теория быстродействия с возмущениями. М.: Изд-во МГУ, 1986.
143. Кротов В.Ф. Основы теории оптимального управления. М.: Высшая школа, 1990.-429 с.
144. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.-448 с.
145. Кротов В.Ф., Фельдман И.Н. Итерационный метод решения задач оптимального управления // Изв. АН СССР. Техн. кибернетика. 1983. - №2. -С.160-168.
146. Крылов И.А., Черноусько Ф.Л. Алгоритмы метода последовательных приближений для задач оптимального управления // Журн. вычислит, математики и мат.физики. 1972. - Т.12, №1. - С.14-34.
147. Крылов И.А., Черноусько Ф.Л. О методе последовательных приближений для решения задач оптимального управления // Журн. вычислит, математики и мат.физики. 1962. - Т.2, №6. - С. 1132-1138.
148. Крылов И.А., Черноусько Ф.Л. Решение задач оптимального управления методом локальных вариаций // Журн. вычислит, математики и мат.физики. -1966. Т.6, №2. - С. 203-217.
149. Курина Г.А. Об одной вырожденной задаче оптимального управления и сингулярных возмущениях // ДАН СССР. 1977. - Т. 237, № 3. - С. 517 - 520.
150. Левитин Е.С. Об асимптотическом методе решения задач оптимизации, содержащих малые параметры // Модели и методы оптимизации. Вып. 7. М.: ВНИИСИ, 1990. - С. 28- 42.
151. Левитин Е.С. Теория возмущений в математическом программировании и ее приложения. М.: Наука, 1992. - 360 с.
152. Лионе Ж.Л. Некоторые методы решения нелинейных краевых задач. М.: Мир, 1972.-587 с.
153. Лионе Ж.Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. М.: Мир, 1972.
154. Ломов С.А. Введение в общую теорию сингулярных возмущений. М.: Наука, 1981.
155. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов. М.: Наука, 1986. - 232 с.
156. Лутманов С.В. Курс лекций по методам оптимизации. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. - 368 с.
157. Любушин А.А. Модификации и исследование сходимости метода последовательных приближений для задач оптимального управления // Журн. вычислит, математики и мат.физики. 1979. - Т. 19, № 6. - С. 1414-1421.
158. Любушин А.А. О применении модификации метода последовательных приближений для решения задач оптимального управления // Журн. вычислит, математики и мат.физики. 1982. - Т. 22, № 1. - С. 30-35.
159. Любушин А.А., Черноусысо Ф.Л. Метод последовательных приближений для расчета оптимального управления // Изв. АН СССР. Техн. кибернетика . -1983. №2.- С.147-159.
160. Марри Дж. Нелинейные дифференциальные уравнения в биологии. Лекции о моделях. М.: Мир. - 1983. - 397 с.
161. Марчук Г.И. Математические модели в иммунологии. М.: Наука, 1985. - 240 с.
162. Марчук Г.И. Математические модели в иммунологии. Вычислительные методы и алгоритмы. М.: Наука, 1991. - 300 с.
163. Марчук Г.И. Методы расчета ядерных реакторов. М.: Атомиздат, 1961.
164. Марчук Г.И. Численное решение задач динамики атмосферы и океана. Л.: Гидрометеоиздат, 1974.
165. Марчук Г.И., Михайлов Г.А., Назаралиев М.А. и др. Метод Монте-Карло в атмосферной оптике. Новосибирск: Наука, 1976.
166. Марчук Г.И. Математическое моделирование в проблеме окружающей среды. -М.: Наука, 1982.
167. Марчук Г.И. Методы вычислительной математики. М.: Наука, 1989. - 608 с.
168. Марчук Г.И. Сопряженные уравнения и анализ сложных систем. М.: Наука, 1992.-335 с.
169. Марчук Г.И., Агошков В.И., Шутяев В.П. Сопряженные уравнения и алгоритмы возмущений в нелинейных задачах математической физики. М.: Наука, 1993.
170. Марчук Г.И., Петров Р.В. Вирусное поражение органа и имму но физиологические реакции защиты (математическая модель). Препринт ОБМАН СССР №51. -М., 1983.
171. Марчук Г.И., Романюха А.А., Бочаров Г.А. Математическое моделирование противовирусного иммунного ответа при вирусном гепатите В II Математические вопросы кибернетики. Вып. 2. / Под ред. С.ВЛблонского. -М.: Наука, 1989.-С.5-70.
172. Марчук Г.И., Романюха А.А., Бочаров Г.А. Математическая модель противовирусного иммунного ответа при гриппе. Препринт ОВМ АН СССР. -М., 1990.
173. Маслов В.П. Теория возмущений и асимптотические методы. М.: Изд-во МГУ, 1965.
174. Математическое моделирование в иммунологии и медицине / Под ред. Г.И. Марчука и JI.H. Белых. М.: Мир, 1986. - 310 с.
175. Методы решения задач математического программирования и оптимального управления / Ащепков Л.Т., Белов Б.И., Булатов В.П. и др. Новосибирск: Наука, 1984.-232 с.
176. Методы улучшения в вычислительном эксперименте / Гурман В.И., Батурин В.А., Москаленко А.И. и др. Новосибирск: Наука, 1988. - 184 с.
177. Миллер Б.М. Условия оптимальности в задачах обобщенного управления // Автоматика и телемеханика. 1992. - №5. - С.50-58.
178. Милютин А.А., Илютович А.Е. Осмоловский Н.П., Чуканов С.В. Оптимальное управление в линейных системах. М.: Наука, 1993. - 268 с.
179. Модели управления природными ресурсами / Под ред. В.И. Гурмана. — М.: Наука, 1981.-264 с.
180. Моделирование и управление процессами регионального развития / Под ред. С.Н. Васильева. М.: Физматлит, 2001. - 432 с.
181. Моисеев Н.Н. Асимптотические методы нелинейной механики. М.: Наука, 1969. - 379 с.
182. Моисеев Н.Н. Математические задачи системного анализа. -М.: Наука, 1981.
183. Моисеев Н.Н. Методы динамического программирования в теории оптимальных управлений. I-II. Журн. вычислит, математики и мат.физики. — 1964. - Т. 4, №3. - С. 485-494; - 1965. - Т.5, №1. - С. 44-56.
184. Моисеев Н.Н. Численные методы в теории оптимальных систем // М.: Наука, 1971.-424 с.
185. Моисеев Н.Н. Численные методы теории оптимального управления, использующие вариации в пространстве состояний // Кибернетика. 1966. -Т.5, №3. - С. 1-23.
186. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука, 1975. - 488 с.
187. Монастырный П.И. О сходимости метода интервальной пристрелки // Журн. вычислит, математики и мат. физики. 1978. - Т. 18, № 5. - С. 1139 - 1145.
188. Москаленко А.И. Методы нелинейных отображений в оптимальном управлении. Новосибирск: Наука, 1983.-222 с.
189. Найфе А. Введение в методы возмущений. М.: Мир, 1984. - 585 с.
190. Недорезов JI.B. Курс лекций по математической экологии. Новосибирск: Сибирский хронограф, 1997. - 158 с.
191. Нисевич Н.И., Марчук Г.И., Зубикова И.И., Погожев И.Б. Математическое моделирование вирусного гепатита. М.: Наука, 1981. - 352 с.
192. Новиков В.А., Новиков Е.А. Явные методы для решения жестких систем обыкновенных дифференциальных уравнений. Препринт ВЦ СО АН СССР № 629 . - Новосибирск, 1985. - 21 с.
193. Новосельцев В.Н. Теория управления и биосистемы. М.: Наука, 1978.- 319 с.
194. Новые методы улучшения управляемых процессов / Гурман В.И., Батурин В.А., Данилина Е.В. и др. Новосибирск: Наука, 1987. - 184 с.
195. Овсянников Д.А. Математические методы управления пучками. JL: ЛГУ, 1980.-228 с.
196. Овсянников Д.А. Моделирование и оптимизация динамики пучков заряженных частиц. Л.: ЛГУ,1990. - 312 с.
197. Первозванский А.А., Гайцгори В.Г. Декомпозиция, агрегирование и приближенная оптимизация. М.: Наука, 1979.
198. Петров Ю.П. Вариационные методы теории оптимального управления. Л.: ЛГУ, 1977.-280 с.
199. Погожев И.Б. Беседы о подобии процессов в живых организмах. М.: Наука, 1999.-222 с.
200. Погожев И.Б. Интенсивность взаимодействий в жидких средах организма. -М.: ОВМ АН СССР, 1989. 150 с.
201. Погожев И.Б. Применение математических моделей заболеваний в клинической практике. М.: Наука, 1988. - 192 с.
202. Погожев И.Б., Акишев Т.Х. Определение и анализ персональных параметров системы регулирования сахара в крови. Препринт ИВМ РАН № 282. - М., 1991.-48 с.
203. Полак Э. Численные методы оптимизации. Единый подход. М.: Мир, 1974. -376 с.
204. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976. - 392 с.
205. Пропой А.И. Элементы теории оптимальных дискретных процессов. М.: Наука, 1973.-255 с.
206. Пропой А.И., Ядыкин А.Б. Параметрическое квадратичное и линейное программирование. I, II // Автоматика и телемеханика. 1976. - №2. - С. 102 — 112; 1978. - №4.-С. 136- 143.
207. Пшеничный Б.Н., Данилин Ю.М. Численные методы в экстремальных задачах. -М.: Наука, 1975.-319 с.
208. Романюха А.А. Математическая модель вирусного гепатита В. Анализ данных. Построение блочной модели. Препринт ОВМ АН СССР №115. - М.,1986.
209. Романюха А.А., Бочаров Г.А. Построение начального приближения для решения задачи идентификации коэффициентов математической модели противовирусного иммунного ответа. Препринт ОВМ АН СССР №160. - М.,1987.
210. Романюха А.А., Бочаров Г.А. Идентификация коэффициентов математической модели противовирусного иммунного ответа. Острое течение вирусного гепатита В. Препринт ОВМ АН СССР №161. - М., 1987.
211. Романюха А.А., Руднев С.Г. Математическое моделирование иммуновоспалительных процессов в легких. Поиск оптимальности // Вычислительная математика и математическое моделирование. Труды международной конференции. М.: ИВМ РАН, 2000.
212. Романюха А.А., Руднев С.Г. Вариационный принцип в исследовании противоинфекционного иммунитета на примере пневмонии // Математическое моделирование. 2001. - Т. 13, №8. - С.65-84.
213. Рубин А.Б., Пытьева Н.Ф., Ризниченко Г.Ю. Кинетика биологических процессов. М.: Изд-во МГУ, 1987. - 299 с.
214. Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989. - 432 с.
215. Свирежев Ю.М., Логофет Д.О. Устойчивость биологических сообществ. М.: Наука, 1978.-352 с.
216. Сеа Ж. Оптимизация. Теория и алгоритмы. М.: Мир, 1973. - 244 с.
217. Соболев В.А. Сингулярные возмущения в линейно-квадратичной задаче оптимального управления // Автоматика и телемеханика. 1991. - № 2. - С. 53 -64.
218. Срочко В.А. Вариационный принцип максимума и методы линеаризации в задачах оптимального управления. Иркутск: Изд-во Иркут. гос. ун-та, 1989. -160 с.
219. Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. - 160 с.
220. Срочко В.А. Применение принципа максимума для численного решения задач оптимального управления с терминальными ограничениями // Кибернетика. -1986.-№1.-С. 73-77.
221. Срочко В.А. Метод фазовой линеаризации в задачах оптимального управления со свободным правым концом // Изв. вузов. Математика. 1992. - №7. - С. 7077.
222. Срочко В.А. Метод квадратичной фазовой аппроксимации для решения задач оптимального управления // Изв. вузов. Математика. 1993. - №12. - С. 81-88.
223. Срочко В.А. Модернизация методов градиентного типа в задачах оптимального управления // Изв. вузов. Математика. 2002. - №12. - С. 66-78.
224. Срочко В.А., Антоник В.Г. К решению задач оптимального управления на основе методов линеаризации // Журн. вычислит, математики и мат. физики. -1992. Т.32, №7. - С. 979-991.
225. Срочко В.А., Антоник В.Г. Метод проекций в линейно-квадратичных задачах оптимального управления // Журн. вычислит, математики и мат. физики. -1998. Т.38, №4. - С. 564-572.
226. Срочко В.А., Захарченко B.C. Метод приращений для решения квадратичных задач оптимального управления // Изв. РАН. Теория и системы управления. -1995.-№6.-С. 145-154.
227. Срочко В.А., Пудалова Е.И. Методы нелокального улучшения допустимых управлений в линейных задачах с запаздыванием // Изв. вузов. Математика. -2000.-№12.-С. 78 88.
228. Срочко В.А., Пудалова Е.И., Душутина С.Н. Регуляризация принципа максимума и мектодов улучшения в квадратичных задачах оптимального управления // Изв. вузов. Математика. 1998. - №12.- С. 82 - 92.
229. Срочко В.А., Ушакова С.Н. Метод полной квадратичной аппроксимации в задачах оптимального управления // Изв. вузов. Математика. 2004. - №1. - С. 87- 93.
230. Срочко В.А., Хамидуллин Р.Г. Метод последовательных приближений в задачах оптимального управления с краевыми условиями // Журн. вычислит, математики и мат. физики. 1986. - Т.26, №4. - С. 508-520.
231. Стрекаловский А.С. О невыпуклых задачах оптимального управления // Вестник МГУ. Сер. 15. Вычислительная математика и кибернетика. 1993. -№1.-С. 9-13.
232. Стрекаловский А.С. О поиске глобального максимума выпуклого функционала на допустимом множестве // Журн. вычислит, математики и мат. физики. 1993. - Т.ЗЗ, №3. - С.9-13.
233. Стрекаловский А.С. Элементы невыпуклой оптимизации. Новосибирск: Наука, 2003. - 356 с.
234. Сухарев А.Г., Тимохов А.В., Федоров В.В. Курс методов оптимизации. М.: Наука, 1986. - 328 с.
235. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979.
236. Тихонов А.Н. О методах регуляризации задач оптимального управления // ДАН СССР. 1965. - Т. 162, №4. - С. 763-765.
237. Треногин В.А. Глобальная обратимость нелинейных операторов и метод продолжения по параметру // ДАН РАН. -1996. Т. 350, №4. - С. 455-457.
238. Треногин В.А. Развитие и приложения асимптотического метода Люстерника-Вишика // УМН. 1970. - Т.25, вып. 4. - С. 123-156.
239. Треногин В.А. Функциональный анализ. М.: Наука, 1980.
240. Тятюшкин А.И. О численном решении задач оптимального управления // Дифференциальные уравнения и численные методы. Новосибирск: Наука, 1986.-С. 208-217.
241. Тятюшкин А.И. Численные методы и программные средства оптимизации управляемых систем. Новосибирск: Наука, 1992. - 192 с.
242. Тятюшкин А.И. Многометодная технология для расчета оптимального управления // Изв. РАН. Теория и системы управления. 2003. - №3. - С.59-67.
243. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М.: Наука, 1981.-367 с.
244. Федоренко Р.П. Метод проекции градиента в задачах оптимального управления. Препринт Ин-та прикл.математики АН СССР № 45. - М., 1975. -70 с.
245. Федоренко Р.П. Приближенное решение задач оптимального управления. -М.: Наука, 1978.-486 с.
246. Фиакко А., Мак-Кормик Г. Нелинейное программирование. М.: Мир, 1972.
247. Филатов А.Н. Асимптотические методы в теории дифференциальных и интегродифференциальных уравнений. Ташкент: Фан, 1974.
248. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. -М.: Наука, 1985.-222 с.
249. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978. 318 с.
250. Форсайт Дж., Мальколм М., Моулер К. Машинные методы математических вычислений. М.: Мир, 1980. 280 с.
251. Фридрихе К. Возмущение спектра операторов и гильбертовом пространстве. -М.: Мир, 1969.
252. Харатишвили Г.Л. Оптимальные процессы с запаздыванием. Тбилиси: Мецниереба, 1966. — 84 с.
253. Хейл Дж. Теория функционально-дифференциальных уравнений. М.: Мир, 1984.-421 с.
254. Хофер Э., Лундерштедт Р. Численные методы оптимизации. М.: Машиностроение, 1981.-191 с.
255. Цирлин A.M., Балакирев B.C., Дудников Е.Г. Вариационные методы управляемых объектов. М.: Энергия, 1976. - 448 с.
256. Чезари Л. Асимптотическое поведение и устойчивость решений обыкновенных дифференциальных уравнений. М.: Мир, 1964. - 478 с.
257. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988.-320 с.
258. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. -М.: Наука, 1973.-235 с.
259. Черноусько Ф.Л., Колмановский В.Б. Вычислительные и приближенные методы оптимального управления // Мат. анализ. Итоги науки и техники. Т. 14. -М., 1977. С.101-166.
260. Шалашилин В.И., Кузнецов Е.Б. Метод продолжения решения по параметру и наилучшая параметризация. М., 1999.
261. Шаманский В.Е. Методы численного решения краевых задач. Киев: Наукова думка, 1966.
262. Шатровский Л.И. Об одном численном методе решения задач оптимального управления // Журн. вычислит, математики и мат. физики. 1962. - Т.2, №3. -С. 488-491.
263. Шутяев В.П. Операторы управления и итерационные алгоритмы в задачах вариационного усвоения данных. -М.: Наука, 2001. 238 с.
264. Эльсгольц Л.Э. Норкин С.Б. Введение в теорию дифференциальных уравнений с отклоняющимся аргументом. М.: Наука, 1971. - 296 с.
265. Эмануэль Н.М., Кнорре Д.Г. Курс химической кинетики. М.: Высшая школа, 1974.-399 с.
266. Энеев Т.М. О применении градиентного метода в задачах теории оптимального управления // Косм.исслед. 1966. - ТА, №5. - С. 651-669.
267. Янушевский Р.Т. Управление объектами с запаздыванием. М.: Наука, 1978. -416 с.
268. Bala Krishnan A.V. On a new computing technique on optimal control // J. SLAM Control. 1968. - V.6, N 2. - P. 421-432.
269. Bocharov G.A., Marchuk G.I., Romanyukha A.A. Numerical Solution of LMMs of Stiff Delay Differential systems modeling an immune response // Numer. Math. -1996.-V.3.-P. 131-148.
270. Bocharov G.A. Modelling the dynamics of LCMV infection in mice: conventional and exhaustive CTL responses // J. Theor. Biol. 1998. - V. 192. - P.283-308.
271. Buldaev A.S. Optimization of Nonlinear Systems in Controlling Parameters // Proceedings of 5th IF AC Symposium «Nonlinear Control Systems» (NOLCOS'Ol). Saint - Petersburg, Russia, 2001. - P. 306-309.
272. Buldaev A.S. Optimization of the Controls in Quadratic Dynamical Systems // Proceedings of the International Congress of Mathematicians. Beijing, China. August 20-28, 2002. - P. 244.
273. Buldaev A.S. Regularization of the Procedures of Nonlocal Parameter's Optimization in Quadratic Systems // The International Conference on Optimization and Optimal Control. Ulaanbaator, Mongolia, August 13-17, 2002. - P. 36-41.
274. Clarke F.H., Hitiart-Urruty J.-B., Ledyaev Yu.S. On Global Optimality Conditios for Nonlinear Optimal Control Problems // J. of Global Optimization. 1998. -N13. -P. 109 -122.
275. Dunn J.C. A projected Newton method for minimization problems with nonlinear inequality constraints // Numer. Math. 1988. - Vol.53. - P.377-409.
276. Dunn J.C. On L2 sufficient conditions and the gradient projection method for optimal control problems // SIAM J. Control and Optimization. 1996. - Vol.34, №4. -P.1270-1290.
277. Fiacco A.V. Introduction to sensitivity and stabiblity analysis in nonlinear programming. New York: Academic Press, 1983.
278. Fukushima M., Yamamoto Y. A second-order algorithm for continuoustime nonlinear optimal control problems // IEEE. Trans. Automat. Contr. 1986. Vol. AC-31, №7. -P.673-676.
279. Guddat J., Jongen H.Th., Kummer В., Nozicka F. (eds) Parametric Optimization and related topics // Math. Research. 1987. - V.35. - Berlin: Academic - Verlag.
280. Himmelblau D.M., Jones C.R., Bischoff K.B. Determination of rate constants for complex kinetics models // Ind. Eng. Chem. Fund. 1967. - V.6 №4. - P.539-543.
281. Jacobson D.H. New second-order and first-order algorithms for determinining optimal control. A differential programming approach // J. Optimiz. Theory and Applications. 1968. - V. 2, N 4. - P. 411-440.
282. Jones D.I., Finch J.W. Comparison of optimization algorithms // Intern. Journal of Control. -1984. -V.40, N4. P.747-761.
283. Kokotovic P.V., Khalil H. K., O'Reily J. Singular Perturbations Methods in Control. Analysis and Design. New York: Academic Press, 1986.
284. Ladas G.E., Lakshmikantham V. Differential Equations in Abstract Spaces. New York: Academic Press, 1972.
285. Marchuk G.I. Mathematical models of immune response in infections diseases. -Dordrecht: Kluwer Press., 1997.
286. Mayne D.Q., Polak E. First order strong variation algorithms for optimal control // J. Optimiz. Theory and Applications. 1975. - Vol.16, №3-4. - P.277-301.
287. Miele A. Recent Advances in Gradient Algorithms for Optimal Control Problems. -J. Optimiz. Theory and Applications. 1975. - V.17, N 516. - P. 241-248.
288. Murdock J.A. Perturbations Theory and Methods. New York, Academic Press, 1986.
289. Pytlak R. Numerical Methods for Optimal Control Problems with State Constraints.- Springer. Lecture Notes in Mathematics, №1707, 1999. 215p.
290. Roberts M., Shipman J.S. Extension of a perturbation technique for nonlinear two-point boundary value problem // J. Optimiz. Theory and Applic. 1973. - VI2, N5.- P. 459 470.
291. Roberts M., Shipman J.S. The Epsilon Variation method in two-point bpundary value problem // J. Optimiz. Theory and Applic. 1973. - V.12, N2. - P. 137 - 151.
292. Sakawa Y., Shindo Y. On global convergence of an algorithm for optimal control // IEEE Trans. Automat. Contr. 1980. - V.256, №6. -P.l 149-1158.
293. Strekalovsky A.S. On global maximum of a convex terminal functional in optimal control problems // J. of Global Optimization. 1995. -N7. - P. 75-91.
294. Strekalovsky A.S. On global Optimality Conditions for Nonconvex Optimization // J. of Global Optimization. 1998. - v.13. -P.109-122.
295. Strekalovsky A.S., Vasiliev I.L. On global search for non-convex optimal control problems // Developments in Global Optimization and its Applications .- Kluwer Academic Publishers. 1997. - P. 121-133.
296. Takeuchi Y., Adachi N., Tokumara H. The stability of generalized volterra equations // J. Math. Anal. Appl. 1978. - V.62 - P.453-473.
297. Teo K.L., Yeo L.T. On the computational methods of optimal control problems // Intern. Journ. Systems Science. 1979. - V.10, N1. -P.51-76.
298. Usmanov R.N., Zuev S.M. Parameterization in mathematical models of disease // Russ. J. Numer. Anal. And Math. Model. 1993. - V. 8, N3. - P. 275-284.
299. Van Dyke M.D. Perturbation Methods in Fluid Mechanics. New York: Academic Press, 1964.
300. Vasiliev O.V. Optimization methods. World Federation Publishers Company, Atlanta, USA, 1996. -276 p.