Функциональные уравнения типа Гамильтона-Якоби и задачи управления с наследственной информацией тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Лукоянов, Николай Юрьевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2004
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
РОССИЙСКАЯ АКАДЕМИЯ НАУК УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
На правах рукописи
ЛУКОЯНОВ Николай Юрьевич
ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ ТИПА ГАМИЛЬТОНА-ЯКОБИ И ЗАДАЧИ УПРАВЛЕНИЯ С НАСЛЕДСТВЕННОЙ ИНФОРМАЦИЕЙ
01.01.02 - дифференциальные уравнения
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Екатеринбург - 2004
Работа выполнена в отделе динамических систем Института математики и механики Уральского отделения РАН
Ведущая организация: Московский государственный институт электроники
и математики
Защита состоится 1С марта 2005 года о 11 часов на заседании диссертационного совета Д 004.006.01 по защите диссертаций на соискание ученой степени доктора физико-математических наук при Институте математики и механики Уральского отделения РАН по адресу: 620219, г. Екатеринбург, ГСП-384, ул. С.Ковалевской, 16.
С диссертацией можно ознакомиться в библиотеке Института математики и механики Уральского отделения РАН.
Научный консультант:
академик РАН Н.Н. Красовский
Официальные оппоненты:
член-корреспондент РАН А.А. Меликян
доктор физико-математических наук, профессор В.И. Максимов
доктор физико-математических наук,
В.Г. Пименов
Автореферат разослан
2005 г.
Ученый секретарь диссертационного совета кандидат физ.-мат. наук
А.А. Успенский
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Предыстория и актуальность темы. Диссертация посвящена проблеме развития для экстремальных задач п наследственных динамических системах конструкций и методов, связанных с уравнениями Гамильтона-Якоби. Объектом исследования являются задача управления наследственными динамическими системами в условиях неконтролируемых помех или конфликта и функциональное дифференциальное уравнение типа Гамильтона-Якоби с коинвариаптными производными.
Начиная с вариационных принципов классической механики, в современной теории динамических систем сложились два основных, взаимно дополняющих друг друга подхода к решению экстремальных задач. Первый подход связан с непосредственным вычислением экстремального движения при фиксированном начальном состоянии. Фундамент этого подхода составляет принцип максимума JI.C. Понтрягина. В диссертации рассматривается второй подход, связанный с поиском функции цены, которая каждой точке пространства состояний системы ставит в соответствие оптимальный результат (или, в случае наличия помех, - оптимальный гарантированный результат), достижимый из нее, как из начальной. Этот подход приводит к дифференциальным уравнениям типа Гамильтопа-Якоби с частными производными первого порядка. В задачах оптимального управления - это уравнение Белл-мана, в дифференциальных играх - уравнение Айзекса. Аналогичные уравнения возникают в 1"еометрической оптике - уравнение эйконала, в газовой динамике - предельное уравнение Бюргерса-Хопфа, и т.д. Эти уравнения также можно интерпретировать в свете решения соответствующих экстремальных задач. В рамках первого подхода решаются задачи оптимального программного управления. В русле второго - на базе функции цены строятся позиционные стратегии оптимального управления по принципу обратной связи, что особенно важно в приложениях и принципиально в задачах управления в условиях неопределенности или конфликта.
Современная математическая теория динамических систем и оптимальных процессов охватывает широкий круг актуальных задач, включает большое число разнообразных методов управления, наблюдения, оценивания и реконструкции, имеет прочные связи с другими разделами математики и многочисленные приложения. Ее становление относится к середине XX-го столетия и связано с именами отечественных и зарубежных математиков H.H. Красовского, J1.C. Понтрягина, Р. Айзекса (R. Isaacs), Р. Веллмана (R. Bellman), У. Флеминга (W.H. Fleming). Существенный вклад в ее развитие внесли Э.Г. Альбрехт, В.Д. Батухтин, В.Г. Болтянский, Р.Ф. Габа-сов, Р.В. Гамкрелидзе, П.Б. Гусятников, А Я. Дубовицкий, С.Т. Завалищин, М.И. Зеликин, Ф.М. Кириллова, A.B. Кряжимский, А.Б. Куржанский, A.A. Меликян, A.A. Милютин, Е.Ф. Мищенко, Ю.С. Осипов, H.H. Петров, JT.A. Петросян, Б.Н. Пшеничный, А.И. Субботин, В.М. Тихомиров, В.Е. Третьяков, А.Г. Ченцов, Ф.Л. Черноуеько, A.A. Чикрий, В.А. Якубович, J.P. Aubin, M. Bardi, E.N. Barron, T. Basar, P. Bernhard, A.E. Bryson,
F.H. Clarke, M.G. Crandall, R.J. Elliot, L.C. Evans, A. Friedman, Ho Yu-Chi, R.E. Kaiman, N.J. Kalton, G. Leitman, P.L. Lions, G.J. Olsder, E. Roxin, P. Varaiya, J. Warga и многие другие ученые. Тематика диссертации примыкает к той части этой теории, и которой изучаются качественные свойства функций оптимального результата и способы построения оптимальных позиционных стратегий управления н связи с конструкциями динамического программирования и уравнениями Гамильтона-Якоби (Г-Я).
Классическое уравнение Г-Я имеет источником аналитическую механику, где искомая функция, как правило, является гладкой (непрерывно дифференцируемой) и удовлетворяет этому уравнению во всех точках области определения Известное в теории оптимальных процессов и дифференциальных игр уравнение Гамильтона-Якоби-Айзекса-Бсллмапа (Г-Я-А-Б) выводится для функции цены в предположении, что она также является гладкой В действительности же эта функция напротив, как правило, таковой не является и названное уравнение не имеет подходящего классического решения. С другой стороны, по всех тех точках, где функция цепы дифференцируема, она удовлетворяет данному уравнению и в этом смысле может рассматриваться как его обобщенное (негладкое) решение. Однако только этого свойства, без дополнительных условий, характеризующих функцию цепы в точках негладкости, не достаточно для ее однозначного определения. Поэтому требуется соответствующее уточнение понятия обобщенного решения. Аналогичная ситуация имеет место в задачах математической физики, где содержательные негладкие решения удовлетворяют естественным физическим закономерностям, строгая формализация которых также приводит к задаче корректного определения обобщенного решения соответствующих уравнений типа Г-Я.
Все это стимулировало активные исследования в области построения теории обобщенных решений уравнений Г-Я и других типов нелинейных дифференциальных уравнений с частными производными (УЧП) 1-го и 2-го порядка. С математической точки зрения вопрос заключался в том, чтобы ввести понятие такого обобщенного решения этих уравнений, которое бы, во-первых, было корректно для широкого круга начальных и краевых задач, во-вторых, естественным образом согласовывалось с классическим понятием решения, и в-третьих, которое бы отвечало содержательному смыслу этих уравнений, выявленному на конкретных примерах вышеупомянутых задач из теории оптимального управления, дифференциальных игр и математической физики.
В 1950-1970 годы в работах Н.С. Вахвалова, И.M Гельфанда, O.K. Годунова, O.A. Ладыженской, O.A. Олейник, Б.Л. Рождественского, A.A. Самарского, С.Л. Соболева, А.Н. Тихонова, L.C. Evans, W.H Fleming, Е. Hopf, P. Lax и многих других известных математиков изучались слабые решения квазилинейных УЧП. Эти исследования в основном опирались на интегральные методы и интегральные свойства обобщенных решений. В то же время, уже в этот период закладываются основы целенаправленного привлечения к исследованию обобщенных решений конструкций выпуклого и негладкого
анализа. В этой связи отмстим результаты С.Н. Кружкова1, устанавливающие для уравнений Г-Я с выпуклым по импульсной переменной гамильтонианом корректность решения задачи Коши-Дирихле в классе локально слабо вогнутых функций. Позднее было показано, что такое решение уравнения Беллмана однозначно определяет функцию оптимального результата. D это же время F.H. Clarke2 предложил использопать для исследования негладких решений уравнения Беллмана обобщенные производные по направлениям. Дальнейшее развитие негладкого анализа позволило применять в исследованиях задач динамической оптимизации и уравнений типа Г-Я новые подходы и методы, основанные на обобщениях понятия дифференцируемое™.
Своеобразный подход к обобщенному решению уравнений Г-Я-Б развивается В.П. Масловым и его сотрудниками на базе идемпотенткого анализа3.
Существенное продвижение в построении современной теории обобщенных решений уравнений Г-Я связано, с одной стороны, с понятием вязкостного решения (viscosity solution), которое в начале 1980-х годов ввели M.G. Crandall и P.L. Lions4, а с другой - с понятием минимаксного решения, которое было предложено примерно в это же время А.И. Субботиным5,6.
Понятие вязкостного решения идейно восходит к методу "изчезающей вязкости" из математической физики, ранее последовательно применявшемуся для изучения уравнений Г-Я, например, в работах С.Н. Кружкова. Этот метод первоначально использовался при доказательстве существования вязкостного решения. Однако само определение этого решения не содержит сингулярных предельных переходов в соответствующих параболических уравнениях и по своей сути основано7 па замене уравнения парой неравенств относительно суб- и суперградиентов рассматриваемого решения В рамках теории вязкостных решений были сформулированы и доказаны теоремы единственности и существования для различных типов начальных и краевых задач и различных типов УЧП 1-го и 2-го порядка. Была изучена связь понятия вязкостного решения с условиями оптимальности в задачах детерминированного и стохастического управления. Большое внимание уделяется вопросам разработки аналитических и численных методов построения вязкостных решений. Важная роль в этих исследованиях принадлежит V. Barbu, M. Bardi, E.N. Barron, M.G. Crandall, G. Da Prato, I C. Dolcetta, L.C. Evans, M. Falcone, W.H. Fleming, H. Ishii, R. Jensen, P.L. Lions, H.M. Soner, P.E. Souganidis.
'Кружков С H Обобщенные решения нелинейных уравнений первого порядка со многими независимыми переменными// Матем. сборник, 1966 Т.70. № 3 С. 394-415.
2Clarke F.H Generalized gradients and applications// 7hm«. Amer. Math Society, 1975. Vol 205. pp. 246-262.
3Колокольцов В H., Маслоп В.П. Идемпотсптный анализ и его применения в оптимальном управлении. М.: Наука, 1994.
4Crandall M G , Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations// Trans. Amer. Math. Society, 1983, Vol. 277, No. 1. pp. 1-42.
'Субботин А.И. Обобщение основного уравнения теории дифференциальных игр// Доклады АН СССР, 1980. Т. 254. № 2. С. 293-297.
6Субботин А.И. Минимаксные неравенства и уравнения Гамилътона-Якоби. M.: Наука, 1991.
'Crandall M.G., Evans L.C , Lions P.-L Some properties of viscosity solutions of Hamilton-Jacobi
equations// Trans. Amer. Math. Society, 1984. Vol. 282. pp. 487-502.
Истоки минимаксного решения уравнений Г-Я лежат в теории позиционных дифференциальных игр, развитой в научной школе H.H. Красовско-го8,9и базирующейся на минимаксных оценках и операциях. Фундаментальный вклад в труды этой школы по теории позиционного управления, наблюдения и восстановления динамики внесли A.B. Куржапский, Ю.С. Осипов, А.И. Субботин, A.B. Кряжимский, В.Е. Третьяков, А.Г. Ченцов. Актив-пая роль в этих исследованиях принадлежит Э.Г. Альб[>ехту, Б.И. Ананьеву, В.Д. Батухтину, Ю.И. Бердышеву, С.А. Брыкалову, В.Л. Гасилову, М.И. Гусеву, Х.Г. Гусейнову, C.II. Завалищину, A.B. Киму, А.Ф Клейменову, А.И. Короткому, А.Н. Красовскому, В.И. Максимову, О.И. Никоиову, B.C. Пацко, В.Г. Пимеиову, А.Н. Сесекину, И.Ф. Сивсргиной, H.H. Субботиной, A.M. Та-расьеву, В.Н. Ушакову, Т.Ф. Филипповой, Г.И. Шишкину, А.Ф. Шорикову и их ученикам.
В теории позиционных дифференциальных игр было введено понятие и- и и-стабильиых функций, которые соответственно мажорируют и минорируют функцию цены. Последняя оказывается единственной непрерывной функцией, одновременно являющейся и- и v-стабильной и удовлетворяющей естественному краевому условию, которое указывает показатель качества дифференциальной игры. В точках дифференцируемое™ она удовлетворяет уравнению Г-Я-А-Б. Таким образом, свойства и- и v-стабильности однозначно определяют корректное обобщенное решение соответствующей задачи Коши для этого уравнения. Это решение является, с одной стороны, минимальной «-стабильной функцией, а с другой - максимальной и-стабилыюй. Поэтому, такое решение уравнений типа Г-Я было позднее названо минимаксным, а и- и и-стабильные функции стали соответственно называть верхними и нижними решениями. В рамках конструкций унификации дифференциальных игр10, было показано, что свойства и- и «-стабильности могут быть выражены только в терминах гамильтониана управляемой системы. Были получены различные инфшштезимальные критерии м- и «-стабильности негладких функций5,11.
На этой основе в дальнейшем было показано6,12,что данный подход может быть применен не только к уравнениям Г-Я-А-Б, возникающим в задачах управления и дифференциальных игр, но и к другим УЧП 1-го порядка. Для уравнения Г-Я общего вида были построены семейства характеристических обыкновенных дифференциальных включений (характеристические комплексы) и через свойства стабильности относительно этих включений введеио понятие его минимаксного решения. Были даны различные спосо-
'Красовский Н Н. Игровые задачи о встрече движений. М.: Наука, 1970.
'Красовекий Н Н , Субботин А И Позиционные дифференциальные игры М.: Наука, 1974
10Красовский Н Н К задаче унификации дифференциальных игр// Доклады АН СССР, 1976. Т 226. № 6. С. 1260-1263
иГуссйиов ХГ, Субботин А.И., Ушаков В.Н Производные многозначных отображений и их применение в игровых задачах управления// Проблемы управления и теории информации, 1985 Т. 14. № 3. С. 1-14
I2Subbotm A.I Generalized Solutions of First-Order PDEs: The Dynamical Optimization Perspective. Boston etc.: Birkhäuser, 1995.
>
бы определения минимаксного решения, в том числе, в инфинитезимальной форме, при помощи производных но направлениям, конусов касательных направлений, субдифс1>е[>сиц,иалов и других средств негладкого анализа.
Конструкции и методы минимаксного решения уравнений Г-Я оказались естественным образом связанными с широким кругом разнообразных задач современной теории динамических систем и математической физики. В частности, определение минимаксного решения можно интерпретировать как естественное обобщение классического метода характеристик Коши. Отметим, что метод характеристик является одним из основных способов конструктивного исследования и построения решений УЧП. Обобщения этого метода применительно к различным задачам рассматривались в работах Ю.С. Ледя-ева, A.A. Меликяна, H.H. Субботиной, F.H. Clarke, H. Frankowska, S. Miricä и многих других исследователей. Условия стабильности минимаксного решения по отношению к характеристическим дифференциальным включениям можно переписать в терминах слабой инвариантности его надграфика и под-графика относительно этих включений. Слабо и сильно инвариантные множества и их приложения изучались, например, в работах A.B. Куржанского,
B.Н. Ушакова, Т.Ф. Филипповой, J.P. Aubin, G. Haddad, M. Nagumo.
В теории минимаксных решений УЧП 1-го порядка доказаны достаточно общие теоремы существования, единственности и непрерывной зависимости решения от начальных данных, обоснована содержательность понятия минимаксного решения, разработаны конструктивные и численные методы построения минимаксных решений, в том числе - итерационные и сеточные методы. В приложении к задачам управления и дифференциальных игр отличительная особенность данных методов состоит в том, что они не только направлены на построение функции цены, но и на эффективное построение соответствующих оптимальных стратегий управления. Результаты теории минимаксных решений активно развиваются и применяются в приложении к различным задачам в работах В.А. Вахрушева, Г.Г. Гарныше-вой, C.B. Григорьевой, Х.Г. Гусейнова, В.Я. Джафарова, Л.В. Камневой,
C.С. Кумкова, A.C. Лахтина, A.A. Незнахина, В.Ю. Пахотинских, H.H. Субботиной, A.M. Тарасьева, A.A. Успенского, В.Н. Ушакова, А.П. Хрипунова, Л.Г. Шагаловой. Отдельно отметим, что именно в рамках теории минимаксных решений был доказан принципиальный для современной теории обобщенных решений УЧП 1-го порядка факт эквивалентности понятий вязкостного и минимаксного решений.
Таким образом в настоящее время можно говорить о единой теории обобщенных решений уравнений Г-Я, которая имеет прочные связи со многими областями математики и механики И многочисленные приложения в различных прикладных задачах. Инициированная актуальными проблемами теории управления и математической физики, она в свою очередь во многом способствовала существенному продвижению в развитии адекватного математического аппарата и создании единообразных методов и подходов для их корректного исследования и эффективного решения.
Возвращаясь к теме представляемой диссертации, заметим, что упомя-
нутые выше результаты этой теории в части приложения к экстремальным задачам в динамических системах касаются, в основном, тех систем, движение которых описывается обыкновенными дифференциальными уравнениями. Принципиальным свойством таких систем является то, что их поведение в будущем однозначно определяется их текущим мгновенным состоянием и никак не зависит от их поведения в прошлом, то есть от того, каким образом сложилось данное текущее состояние. Однако многие реальные (физические, химико-технологические, теплоэнергетические, биологические, социально- и эколо1-о-экономические и т.д.) процессы протекают согласно более сложным закономерностям, когда будущее зависит не только от настоящего, но и от прошлого. Математическое моделирование таких процессов приводит к понятию наследственных динамических систем, движение которых описывается при помощи дифференциальных уравнений с последействием, называемых также уравнениями с запаздыванием, дифференциально-разностными или функционально-дифференциальными уравнениями (соответствующие примеры и библиографию можно найти, например, в монографиях13,14). К наследственным динамическим системам приводят исследования процессов с неполной и недостоверной информацией, которую приходится восстанавливать по наблюдаемой истории движения15.Информацию об истории движения часто оказывается целесообразно использовать в цепи обратной связи для улучшения качества управления динамической системой (пусть даже исходно обыкновенной)9'16.Чтобы подчеркнуть это обстоятельство в диссертации используется термин дифференциальные системы (задачи управления, дифференциальные игры) с наследственной информацией.
Первые примеры дифференциальных уравнений с последействием были уже у Вернулли, Эйлера, Лапласа, позднее у Вольтерра, но целенаправленное исследование таких уравнений началось в 1950-х годах и связано с именами H.H. Красовского, А.Д Мышкиса, R. Bellrnan, K.L. Cook, J.K. Hale. Большой вклад в становление и развитие качественной теории наследственных динамических систем внесли Н.В. Азбелев, Р.Ф. Габасов, A.M. Зверкин, Г.А Каменский, Ф.М Кириллова, В Б. Колмановский, A.B. Кряжимский, А Б. Куржан-ский, A.A. Мартынюк, В.М. Марченко, Г.И. Марчук, Ю.А. Митропольский, С.Б. Норкин, В.Р. Носов, Ю.С. Осипов, B.C. Разумихин, А.Л. Скубачевский, С Н. Шиманов, Г.Л. Харатишвили, Л.Э. Эльсгольц, Н.Т. Banks, Т.A. Burton, С. Corduneanu, M.С. Delfour, R.D. Driver, A. Halanay, H.J. Kushner, V. Lakshmi-kantham, V. Volterra, T. Yoshizawa и многие другие авторы. Эти исследования показали, что уравнения с последействием обладают существенными особенностями и к ним неприменимы напрямую результаты, полученные для обыкновенных дифференциальных уравнений. С другой стороны, было показа^
13Андреева Е А., Колмановский В.Б , Шайхет Л.Е Управление системами с последействием. M : Наука, 1992.
uKolmanovskii V., Myshkis A Applied Theory of Functional-Differential Equations. Dordrecht. Kluwer Acad. Publish. Group, 1992
15Куржанский А В Управление и наблюдение в условиях неопределенности М.: Наука, 1977.
16Krasovskii A.N., Kraaovskii N.N. Control under Lack of Information Berlin etc.: Birkhäuser, 1995.
но, что при должном осмыслении поведение наследственных систем можно характеризовать на основе методов и конструкций, во многом аналогичных наработанным в теории обыкновенных дифференциальных систем.
Принципиальным шагом в построении качественной теории наследственных динамических систем стал функциональный подход H.H. Красовского, предложи пшего17рассматривать эволюцию таких сис-гем в пространстве историй движения. Тогда можно перейти к описанию этих систем при помощи обыкновенных дифференциальных уравнений, но уже в подходящем функциональном фазовом пространстве. Это позволило перенести на наследственные системы основные классические результаты теории устойчивости по Ляпунову с использованием в качестве функций Ляпунова подходящих функционалов от истории движения. Функциональный подход к задачам управления движеиием наследственных динамических систем во многом способствовал эффективному построению стратегий с памятью, учитывающих в цепи обратной связи историю движения. В том числе, в работах Ю.С. Осипова и его сотрудников для задач конфликтного управления системами с последействием были развиты основные конструкции и результаты теории позиционных дифференциальных игр.
В рамках теории программного управления для дифференциальных систем с последействием исследовались необходимые условия оптимальности в форме принципа максимума Л.С. Понтрягина1®.Первые результаты в этом направлении были получены Г.Л. Харатишвили. В дальнейшем, принцип максимума и его обобщения были сформулированы и доказаны для различных классов задач оптимального управления с запаздыванием для систем как с гладкой, так и с негладкой динамикой, а также, для систем, описываемых функционально-дифференциальными включениями.
Таким образом, построение единой теории обобщенных решений уравнений Г-Я и эффективность ее приложения к экстремальным задачам в обыкновенных дифференциальных системах - с одной стороны, и развитие теории дифференциальных систем с последействием и их активное применение в математическом моделировании реальных эволюционных процессов - с другой, обусловили актуальность и подготовили необходимый фундамент для развития теории Г-Я в наследственных динамических системах. Требовалось осмыслить, какие уравнения являются для таких систем естественным аналогом обычных уравнений Г-Я, в какой форме эти уравнения могут быть записаны, что понимать под их решением, какую пользу из них можно извлечь. Эти вопросы и определили направление исследований, представленных в диссертации. Логика развития теории обобщенных решений уравнений Г-Я подсказывала искать ответы на них в изучении качественных свойств величины цены и соответствующих конструкций динамического программирования в задачах управления с наследственной информацией.
Первые результаты по методу динамического программирования в систе-
17Красовский Н.Н Некоторые задачи теории устойчивости движения. М : Фиэматгиз, 1959.
18Понтрягйн Л С., Болтянский В Г., Гамкрелидае Р.В , Мищенко Е Ф. Математическая теория оптимальных процессов. М.: Наука, 1961.
мах с последействием были получены10 и затем развиты13'20,21,22 для задач оптимального управления линейно-квадратичного типа, составляющих один из тех немногих классов экстремальных задач, в которых функция цены (а для рассматриваемого случая систем с последействием - соответствующий функционал от истории движения) обладает подходящими свойствами гладкости. С разви тием негладкого анализа были рассмотрены23,24 некоторые обобщения этих результатов для задач оптимального управления с негладким функционалом цепы. В исследованиях дифференциальных игр систем с последействием0,25 были установлены нелокальные свойства и- и v-стабильности функционала цепы, В отмеченных работах прослеживается два подхода к формализации принципов динамического программирования для наследственных систем и выводу соответствующих функциональных аналогов уравнений Г-Я-А-Б. Один из них непосредственно опирается на переход к описанию наследственных динамических систем при помощи обыкновенных дифференциальных уравнений в подходящем функциональном фазовом пространстве, в кото1юс укладываются возможные истории движения системы Этот подход приводит к функциональным уравнениям Г-Я с частными производными Фрешс. Такие уравнения достаточно подробно изучались в связи с задачами оптимального управления бесконечномерными дифференциальными системами. В основном, исследования были посвящены развитию соответствующей техники вязкостных решений. Приложения полученных в этом направлении результатов к задачам оптимального управления системами с последействием рассмотрел Н.М. Soner23. В рамках такого подхода P.R.. Wolenski24 получил для функционала цены необходимые и достаточные условия оптимальности в форме уравнения для нижних производных Дини.
Следует однако заметить, что подход, основанный на описании эволюции историй движения наследственной системы посредством обыкновенных дифференциальных уравнений в функциональных пространствах, связан, с одной стороны, с сужением множества допустимых начальных историй до достаточно гладких функций, а с другой, наоборот, - с подходящим расширением функционального фазового пространства до, например, суммируемых функций, что влечет определенную потерю общности и ограничивает область корректного применения этого подхода. В диссертации последовательно разви-
19Красовский Н.Н Об аналитическом конструировании оптимального регулятора в системе с запаздываниями времени// Прикладная математика и механика, 1962 Т 26 Вып 1 С. 39-51
'"Ким А В. i-Гладкий анализ и функционально-дифференциальные уравнения Екатеринбург: Изд-во УрО РАН, 1996.
21Delfour U.C., McCalla С, Mittcr S.K. Stability and the infinite time quadratic cost problem for linear hereditary differential systems// SIAM J Control, 1975. Vol 13. No 1 pp. 48-88.
"Kushner H.J., Baxnea D.I On the control of a linear functional-differential equation with quadratic cost// SI A it J. Control, 1970 Vol. 8 No. 2 pp. 257-275
23Soner H.M On the Hamilton-Jaœbi Bellman equations in banach spaces.// J. Opttm. Theory and Appl- 1988. Vol. 57. No. 3. pp. 429-437
24 Wolenski P.R. Hamilton Jacobi theory for hereditary control problems// Nonlinear Anal - 1994 Vol 22. No. 7. pp. 875-894.
г5Осипов Ю С Дифференциальные игры систем с последействием// Доклды АН СССР, 1971. Т. 196. » 4. С. 779-782.
вается другой подход. Он также опирается на функциональную интерпретацию наследственных динамических систем, но не использует явного перехода к их описанию при помощи обыкновенных дифференциальных уравнений в функциональном пространстве. Это позволяет избежать упомянутых выше осложнений, связанных с таким переходом, и охватить более широкий класс систем и более широкий круг задач, включая задачи управления в условиях неконтролируемых помех или конфликта, рассматриваемые в теории дифференциальных игр. Этот подход основан17,19 на изучении свойств функционала цены при сдвиге вдоль возможных траекторий движения наследственной динамической системы. При выводе соответствующих такому подходу уравнений динамического программирования в форме Г-Я классический аппарат функциональных производных оказывается неудобным. Поэтому рассматриваются специальные понятия дифференцируемое™ функционалов от истории движения и используются адекватные этим понятиям производные, такие как инвариантные и коинвариантпые производные, используемые в работах A.B. Кима20, или, например, близкие к ним Clio-производные, введенные в недавней работе J.P. Aubin и G. Haddad20. Таким образом, данный подход приводит к новому классу функциональных уравнений типа Г-Я. Согласованность этого подхода с конструкциями теории дифференциальных игр систем с последействием9,25 позволяет естественным образом развить для таких уравнений теорию минимаксных решений.
Цель работы - построение теории минимаксных решений функциональных уравнений типа Г-Я с коиивариантными (ci-) производными и ее приложение к задачам управления наследственными динамическими системами, включая задачи управления в условиях неконтролируемых помех или конфликта. Методы исследования. Представленные в диссертации исследования опираются на подходы и методы из качественной теории дифференциальных уравнений, теории позиционных дифференциальных игр и теории обобщенных решений УЧП 1-го порядка в сочетании с подходящей функциональной трактовкой процесса управления в наследственных динамических системах. Используются результаты из функционального анализа, аппарат дифференциальных включений с последействием, конструкции негладкого анализа и аппарат инвариантного дифференциального исчисления функционалов. Научная новизна. В связи с вопросами формализации и обоснования для задач управления наследственными динамическими системами метода динамического программирования рассмотрен новый класс функциональных дифференциальных уравнений типа Г-Я с ci-производными и развита теория обобщенных (минимаксных) решений таких уравнений: дано определение минимаксного решения (MP) через нелокальные свойства стабильности относительно подходящего семейства характеристических дифференциальных включений с последействием; обоснована согласованность данного понятия обобщенного решения с содержательным смыслом рассматриваемых
26Aubin J.P., Haddad G History path dependent optimal control and portfolio valuation and management// Positimty, 2002. Vol. 6. pp. 331-358.
уравнений и с определением их решения в классическом смысле; сформулированы и доказаны теоремы существования, единственности и непрерывной зависимости МР от начальных данных для задач Коши с условием на правом конце; введено понятие производных функционала по многозначным направлениям и дано эквивалентное определение МР, основанное на замене уравнения нарой функциональных дифференциальных неравенств для таких производных; показано, что данные неравенства являются инфипитезимальной формой выражения свойств стабильности МР; получены формулы производных но многозначным направлениям для кусочно-сьгладких функционалов, а также, для огибающих семейств Ы-гладких функционалов и приведены соответствующие уточнения вида указанных неравенств в этих типичных для обобщенного решения случаях; показано также, что инвариантные суб- и су-перградиепты МР удовлетворяют неравенствам, определяющим его как вязкостное решение рассматриваемых уравнений.
Приведена формализация задачи управления динамическими системами с последействием в условиях пскотчюлирусмых помех как дифференциальной игры с наследственной информацией. Функционал цены этой игры указывает оптимальный гарантированный результат управления, достижимый в классе стратегий с памятью - детерминированных функций истории движения Показано, что если этот функционал оказывается сьгладким, то он удовлетворяет уравнению типа Г-Я-А-Б с «-производными, причем соответствующие стратегии экстремального прицеливания в направлении его с\-градиепта оптимальны. В общем случае показано, что функционал цены совпадает с МР данного уравнения и развиты соответствующие методы построения оптимальных стратегий управления: метод экстремального прицеливания в направлении «-градиентов вспомогательных функционалов типа Ляпунова, подходящие модификации метода экстремального прицеливания на стабильные мосты и метода экстремального сдвига на сопутствующие точки.
Как следствие этих результатов, установлено существование цены и седло-вой точки в дифференциальной игре с наследственной информацией, получены новые условия оптимальности в задачах управления наследственными системами, в том числе - инфииитезимальные критерии и- и «-стабильности негладких функционалов, определяемые дифференциальными неравенствами для их производных по многозначным направлениям и эффективно проверяемые в указанных выше типичных случаях.
По аналогии с положениями теории динамических систем, описываемых обыкновенными дифференциальными уравнениями, полученные результаты дают основание заключить, что рассмотренный класс функциональных дифференциальных уравнений с «-производными естественно трактовать как обобщение уравнения Г-Я для наследственных динамических систем. Теоретическая и практическая ценность. Работа носит теоретический характер. Развитый в ней математический аппарат и полученные результаты открывают перспективы эффективного исследования экстремальных задач в наследственных динамических системах и дальнейшего развития теории минимаксных решений для новых типов функциональных дифференциальных
уравнений. Эти результаты могут также быть положены в основу анализа конкретных задам управления эволюционными системами с последействием, они могут служить фундаментом для разработки и обоснования алгоритмов построения управлений, разрешающих эти задачи.
Апробация работы. Результаты диссертации обсуждались на семинарах отдела динамических систем ИММ УрО РАН, расширенных семинарах кафедры теоретической механики УрГУ; докладывались на заседаниях Ученого совета ИММ УрО РАН, на научной сессии общего собрания УрО РАН (Екатеринбург, 2002); представлялись в докладах на всероссийских и международных конференциях по теории дифференциальных уравнений, динамической оптимизации и их приложениям к задачам механики, оптимального управления и дифференциальных игр, в том числе - на международной конференции, посвященной 90-летию со дня рождения JI С. Понтрягииа (Москва, 1998), IPAC Conference "Nonsmooth and Discontinuous Problems of Control and Optimization" (Челябинск, 1998), 11-th IFAC Workshop "Control Applications of Optimization" (Саикт-Петербург, 2000), 10-th International Symposium "Dynamic Games and Applications" (Санкт-Петербург, 2002), IFAC Workshop "Time-Delay Systems" (INRIA, Rocquencourt, France, 2003), на Всероссийской конференции "Алгоритмический анализ неустойчивых задач" (Екатеринбург, 2004). Публикации. Результаты диссертации опубликованы в работах [1-15]. Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, объединяющих семнадцать разделов, приложения и списка литературы. Общий объем диссертации составляет 239 страниц, библиографический список включает 296 наименований, иллюстративный материал насчитывает 14 рисунков.
СОДЕРЖАНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
Во введении дан краткий обзор предыстории вопроса, обоснована актуальность темы исследования, сформулированы цели работы, приведена аннотация полученных результатов.
В приложение вынесены используемые в работе результаты, касающиеся вопросов существования, единственности и непрерывной зависимости от начальных данных решений дифференциальных уравнений и дифференциальных включений с последействием.
Глава I состоит из трех разделов. В разделе 1 рассматривается задача управления, описываемая уравнением движения:
x[t) = /(f,x[t,[-]t],u{t\,t»M), h<t0<t° <t<T, . .
i[i]er, u[i]eUcKfc, u[i]evcr, K)
начальным условием:
x{t,[.}t°] = x°[i.[-]i°] e C([U,t%R"), (2)
и показателем качества процесса управления:
7 = 7({*Н, «[•].«[•]}) = " / h(t, x[t,[-]i],и[<],v\t])At. (3)
Здесь t - обменная переменная, x[i] и x[t] = dx[i]/d< - значение фазового вектора и скорость его изменения в текущий момент времени t, £[<»[•]<] = {х[т], t, <r<t}~ история движения, сложившаяся к моменту t, u[t] - текущее воздействие управления, r[t] - воздействие неконтролируемой помехи, U и V известные компакты. Отрезок [î»,îq] трактуется как промежуток времени априорного накопления предыстории, а момент времени как момент начала рассмотрении процесса управления. Моменты времени i», ¿о и Т заданы (¿о < Т), начальный момент <° и начальная история x°[<,[-]i°] известны. Допустимы измеримые реализации управления и помехи u[-] : [t°,T) HÜn «[•] : [i0,^1) V. Движением системы (1) при начальном условии (2) является функция х[-] € C([t,, T], R"), совпадающая с на [i,,i°], абсолютно
непрерывная на [t°,T] и при почти всех t € Т] удовлетворяющая уравнению (1). При этом история движения ®[t*[-]f] - сужение этой функции на [<», <]. Тройка {х[-], «[•], и[-]} символизи!)ует реализацию процесса управления.
Цель управления - доставить показателю (3) как можно меньшее значение. Действия помехи непредсказуемы и могут быть нацелены на максимизацию этого показателя. В рамках теоретико-игрового подхода8'9,25 эти две задачи обмдиняются в антагонистическую дифференциальную игру с наследственной информацией. Воздействие управления и трактуется как действие 1-го игрока, а воздействие помехи v - как действие 2-го. Согласно функциональному подходу17 рассматривается эволюция пар g = {£, называемых позициями игры. Определяется пространство возможных позиций:
G :-{д = {t, *[«,[•]«]} : « е [*о,П *['»№] € C([t., *],**)},
с метрикой
P{9u9l) = тахр*(5,+1,52_,), д} = С G, j = 1,2,
p'(gl+1,92-i) = , max min - rtf + |И+1>[£] - xM[r,W.
Здесь и далее || • || - евклидова норма вектора. Предполагается, что (А.1) следующие отображения непрерывны:
G х U х V э (g = {t, i[t.[-]t]}, «, v) м- f(g, и, v) = f(t, *[«,[•]*],*, G x U x V Э (g = {t, x[t,[-)t}}, u, v) ^ h(g, u, v) = h(t, x[U[-]t], u, v) e R;
(A.2) справедлива оценка
Il/G,, и, v)f + h\g, u, v) < L\g), (g = {t, x[t.["№. «) 6 G x U x V,
где
L{g) = Z,(t,z[t,[-M) := c(l + max ||х[т]||), с = const > 0; (4)
t.<T<t
(A.3) для любых g = {t, x[t,[-]i]} £ G и s € R" имеет место равенство
minmaxKs, f(g,u,v))~ h(g,u,v)] = neu не»
maxmin[(s,/(<7, ti, v)) — h(g,u,v)] := #($,s); w
w€v u€l)
(А.4) для любого ограниченного замкнутого D С C([t,, Т], Ж") существует такое А = A(D) > 0, что при всех t € [<0,Т], и € U, v е V и !*[•],е D выполняется следующее условие Липшица:
(11/(5*,«, v) - f(g„ и, V)||2 + (h(g\u, v) - h(g„u, v))2)1/2 < A max4||ar*[r]-a;,[r]||,
где g* = {<, ®*(M-]«]}, 9* = {«.*.[*.[•]<]};
(A.5) функционал <r(a;[ioMTl) определен и непрерывен на C([io,T],R").
В (5) и далее символ {•, •) обозначает скалярное произведение векторов. Условия (А.1), (А.2) и (А.4) обеспечивают существование и единственность движения системы (1) для любой начальной позиции д° = {£°, z°[<«[-]£0]} g G, задающей начальное условие (2), и при любых допустимых реализациях «[•] и «[•]. Условие (А.З), называемое в теории дифференциальных игр условием седловой точки в "маленькой игре" или условием Айзекса, позволяет рассматривать далее только чистые (детерминированные) стратегии. Функционал H(g,s) = H(t, i[t,[-]t], s) : G X 1" И 1, определенный в (5), называется гамильтонианом системы управления (1), (3).
Наряду с общим случаем условий (А.1)-(А.5), в работе также рассматриваются следующие два подслучая. Первый характеризуется тем, что в показателе качества (3), и следовательно, в (А.1)-(А.4) полагаем h(t, x[t»[-]t],ii, v) = 0. Тогда, гамильтониан (5) будет положительно однородным по переменной з. Этот подслучай называем случаем однородного гамильтониана. Во втором предполагается выполненным более сильное, чем (А.4), условие Липшица: (А.4*) для любого компакта D С C([t»,T],№1) существует такое число А — A(D) > 0, что при всех t € [to, Г], it € U, г/ € V и £*[•], ж,[■] € D справедливо неравенство
\\f{g\u,v) - f(g.,u,v)\\2 + (h(g',u,v) - h{gt,u,v)f <
* (Si И**И - *.M!|2dr + \\х'Щ - x.MIl2) ,
где g* = {f, x*[i,[-]t]}, g, — {<, x»[i,[-]i]}. Данное условие характерно для систем с распределенным последействием. Для систем с сосредоточенными запаздываниями оно, в отличии от (А.4), вообще говоря, не выполняется. Этот подслучай называем случаем распределенного последействия.
Стратегиями управления и помехи являются произвольные функции U{g) = U(tyx[u[-]t}) е и, Via) = V(t,*[t,[-]t]) 6V,3 = {«,*[«.[■]*]} 6 G. Они действуют на систему (1) в дискретной по времени схеме на базе некоторого разбиения отрезка времени [f°, Т]. Пусть взяты стратегия управления £/(•) и разбиение As = {f; : tx = t°, 0 < t,+i - i,- < 6, i - 1,..., N, tN+1 = T}. Пара {i/(-), Д4 определяет закон управления, который в цепи обратной связи, последовательно по шагам разбиения Aj формирует кусочно-постоянную реализацию «[•] согласно правилу: u[t] = U(t„ rc[i,[-]i,]), t E [/,, i,+i), г = 1, N. Из начальной позиции g° = £°[£»[-]£0]}, в паре с какой-либо реализацией «[■] помехи, этот закон однозначно порождает соответствующую реализацию
процесса управления, обозначаемую {х[-], «[•], vf-] | д°; [/(•), А^; и[']}- Исходя из самых неблагоприятных с точки зрения цели управления обстоятельств, определяется гарантированный результат стратегии U(-):
Ги(,Д [/(■)) := lim sup 7({*M,«[•],«[•] I <Л Ш Ь; «[•]»■
Оптимальным га[>ангпированным результатом управления будет Г°и(д°) :=infru(ga,U(.)).
Аналогично, с понятными изменениями определяются гарантированный результата выбранной стратегии помехи V(-):
r.(p°,v(-)) := lim inf; 7(W-1, «[•],«[•] I /;«[■]; П-), M) ¿40 Ai,u[ ]
и оптимальный гарантированный результат помехи:
Гl(g°) :=BapTvtf,V{-)).
V()
Соответственно, оптимальными стратегиями будут U°(-) и V°(-): W) = г„0Д = Г„(д°, V(-)).
Величины Г° и Г° связаны неравенством Г°(р°) > Г°(р°). Если в нем достигается равенство, то рассматриваемая дифференциальная игра с наследственной информацией (1)-(3) имеет цену Г°(д°) := Г°(р°) = а пара оптимальных стратегий {{/"(•), V°(-)} составляет седловую точку игры. Величина цены зависит от начальной позиции, поэтому можно определить функционал цены: G Э g° = {t°, x0[i,[-]t0]} и- Г°(?°) = ro(<0,s0[i,[-]i0]) € К.
Наряду со стратегиями i/(-) и V(-), рассматриваются также так называемые е-стратегии Uc(-) и Ve(-). где е > 0 трактуется как параметр точности. Значение этого параметра выбирается заранее и в ходе процесса управления не изменяется. В соответствии с предыдущим, е-стратегии U°(-) и V°(-) оптимальны, если выполняются соотношения
ТЦд0) = limsuprи(д°, ££(.)), ГЦд0) = liminf Г„(<Д ВД).
ciO Ф
Задача состоит в том, чтобы доказать, что данная дифференциальная игра имеет цену, исследовать свойства функционала цены и найти оптимальные стратегии или е-стратегии. Она решена в главе IV на основе результатов исследования уравнений типа Г-Я с ci-производными, проведенного в главах II и III. В главе I показано, что именно такие уравнения имеет смысл рассматривать в дифференциальных играх с наследственной информацией.
В разделе 2 вводится понятие ci-дифференцируемости функционалов
с э j = {t, *[«.[•№ * via) = *[*♦№]) е R
Пусть д — {t, x[i»[-]i]} £ G, t < Т и Lip(<?) - множество функций j/[ ] € C([i«,T],R"), совпадающих с x[£«[-]i] на [£,, £] и липшицевых на [£, Т].
Определение 1 Функционал <р является коиивариаптпно (ci-) дифференцируемым в точке д, если существуют такие dt<p(g) € R и Vip(g) £ R", что для любых у{-] € Lip(g) и S £ (О, Т — t] имеет место равенство
¥>(< + <5, y[t.W + <5]) - <p(t, *[*.[■]*]) = dtip(g)5 + {V<p(g),y[t + ¿1 - + °y[
где о^[](<5) зависит от выбора у[-] € Lip(</), оу^(&)/8 —f 0 при S | 0.
Величины dt<p(g) и V^>(<?) называются с [-производной not и ci-градиентом. Функционал ip называем а-диф<]>еренцируемым, если он ci-дифференцируем в каждой точке g = {t, ж[i,[■]£]} € G,t < Т, и ci-гладким, если он непрерывен, ci-дифференцируем и его ci-производные dt<p(g) и Vip(g) непрерывны.
Коиниариантные производные удобны тем, что в их терминах полная производная ci-гладкого функционала вдоль движений системы (1) (в силу этой системы) записывается в привычной для обыкновенного случая форме:
dip(t, x[U[-]t))/dt = dt<p(t, x[U[-]i]) + <Vv»(i, ®[i.[-]<]), f(t, ®[M-]i],«W, «М)>.
На основе этой формулы, в разделе 3 проведены гладкие оценки гарантированных результатов и показано, что в случае, когда функционал цены дифференциальной игры с наследственной информацией оказывается ci-гладким, он описывается следующим уравнением типа Г-Я с ci-производными:
д#>(д) + H(g, V<p(g)) = 0, g = {t, *[«,[■]«]} €G,t<T, (6)
при условии на правом конце
V5(T,x[i,[.]T]) = ir(x[io[-]T]), *[it[-]T] = x[-]eC([i,,T],R"). (7)
Теорема 1 Пусть выполняются условия (А.1) ~(А.5) и ci-гладкий функционал <р : G К удовлетворяет (б), (7). Тогда этот функционал является функционалом цены дифференциальной игры г наследственной информацией (1)-(3), то есть Г° = у?, а оптимальные стратегии U°(-) и V°(-) могут быть построены следующим образом:
U°(g) = p(g, V<f{g)), p{g,«) e argmiri{maxx(s, u, v, s)}, (8)
ueu tiev
V°(g) = q(g, Vip(g)), q(g, s) € argmax{minx(ir,«, v, s)}, (9)
v6V uev
где x(9,u,v,s) := (s,f(g,u,v)) - h(g,u,v), g = {t,x{tt[]t)} e G, t<T.
Функции Gx$°9(j,s)h p(g,s) e U и G X R" Э ($,s) H- q(g,s) € V, определяемые в (8) и (9) на основе произвольного выбора, называют соответственно минимаксной и максиминной предстратегиями.
Теорема 1 устанавливает, что уравнение (6) с гамильтонианом (5) естественно рассматривать как подходящий функциональный аналог уравнения Г-Я-А-Б, известного для задач управления обыкновенными дифференциальными системами. К сожалению, как и в обыкновенном случае, задачи, в
которых фуикциопал цены обладает подходящими свойствами гладкости, составляют скорее исключение, чем правило. Поэтому требуется рассматривать обобщенные решения задачи (6), (7).
Главы II и III посвящены развитию для функциональных уравнений вида (С) теории минимаксных решений. Рассматриваемые конструкции не предполагают, что для гамильтониана Н этих уравнений и мест- место представление (5) и носят самостоя'гсльный характер.
Глава II объединяет разделы 4-10. В разделе 4 рассмотрены обобщенные характеристики уравнения (6) и показано, что по своей сути это уравнение выражает стабильность своих классических решений относительно данных характеристик. Предполагаются выполненными следующие условия: (В.1) функционал (3 х К" Э (д - {£, [']<]}>«) Н(д, «) Е К непрерывен; (В.2) имеет место условие Липшица по в:
|Н(д,з') - Н(д,в")| < А 9 = {«, «[«.[■]*]} € О, в', а" £ К";
(В.З) справедлива оценка: |Я(<?,0)| < Ь{д), д — {£, [-]<]} €
Здесь Ь(д) задается равенством (4). Отметим, что условия (В.1)-(В.З) заведомо выполняются для гамильтониана (5) в силу (А.1)-(А.З). Обозначим
Е(д, В) := {(/, Л) б К" X К : ||/|| < 1(д), к = (/, в) - Н(д, в)}, , >
5 = {*,*[<.[■]<]} е о, «ек". и ;
Пусть зафиксированы д° = {<0,ж°[<»[']<0]} £ С, г° € М и 5 6 К". Рассмотрим дифференциальное включение с последействием
(¿И, Щ) Е Е{1, *[*,[•]*], в), (хЩ, *[*]) € К" х М, и < *о < < * < Т (И) при начальном условии
х[т] = х°[т], г[т] = при и< т< (12)
Решения записанной задачи - функции (¡с[-],г[-]) Е С([£,,Т],КП х К), которые удовлетворяют начальному условию (12), абсолютно непрерывны на
Т] и при почти всех t Е Т\ удовлетворяют включению (11), назовем характеристиками уравнения (6). Множество всех таких характеристик обозначим через СН(д°, я). Оно непусто и компактно в С([<», Т], К" х К) для любых {<7°, г°, в} 6 £7 х К х К". Дифференциальное включение (11) будем называть характеристическим дифференциальным включением (ХДВ).
Определение 2 Функционал (р : (7 н4 К назовем стабильным относительно ХДВ (11), если для любых д° = {<°, х%[-]г0]} 6 <7, <° < Т, и в е К" существует такая характеристика (х0[*], г0[-]) Е СН(д°, <р(д°), для которой выполняется равенство г0\р\ — г0[£,[•]£]), £ Е [£°, У].
Утверждение 1 Пусть с\-гладкий функционал р : С И 1 удовлетворяет уравнению (6). Тогда он является стабильным относительно ХДВ (11).
Утверждение 2 Пусть функционал tp : G И R стабилен относительно ХДВ (11) и ci-дифференцируем в точке g* = {i°, x°[i.[-]t°]} £ G, t° < Т. Тогда в этой точке он удовлетворяет уравнению (6).
Из утверждений 1, 2 вытекает, что для ci-гладких функционалов <р уравнение (С) и укачанное свойство стабильности эквивалентны. Однако, в отличие от уравнения, данное свойство корректно рассматривать не только для ci-диффереицируемых, по и для лишь непрерывных функционалов. Поэтому обобщенные решения уравнений вида (G) естественно искать именно в классе непрерывных стабильных функционалов. По аналогии с обычными уравнениями Г-Я такой подход приводит к минимаксным решениям6,12.
В разделе 5 показано, что стабильность относительно ХДВ (11) можно определить при помощи следующих неравенств:
sup inf И^х^Нф-гИ-^0)) < 0, (13)
(s°,i,«) ММ1)
inf sup > О, (14)
GAM) (*[-),*(])
где / = {i°,x0[i,[.}t0l} eG,t° <T,te (t°,T],e eR",(*[•],*[•]) e CH(g°,o,s).
Утверждение 3 Непрерывный функционал ^ : G И К является стабильным относительно ХДВ (11) тогда и только тогда, когда он одновременно удовлетворяет неравенствам (13) и (14).
Более того, пусть Р и Q некоторые непустые множества. Рассмотрим многозначные отображения
GxQB(g = {*,*[*.[■]«]}. i) E'(g,g) = E'(t,x[tt[-]t],q) cK"xR, G x P э (g = {i,x[t,[•]*]},p) •-> E.(g,p) = E,(t,x[tt[-]t],p) с R" x R.
Потребуем, чтобы
(C.l) для любых фиксированных р € Р и q £ Q они были выпукло компакт-нозначны, полунепрерывны сверху по включению и удовлетворяли подходящему условию подлинейного роста;
(С.2) для любых (g = {f, ®[t,[•]*]},p,g) € G х Р х Q и (/, h) £ E'{g,q) U Е,(д,р) выполнялось неравенство ||/|| < Ь(д), где L - из условия (В.2); (С.З) для любых д = [t, z[i,[-]i]} £ G и s 6 R" были справедливы равенства
Н(д, a) = sup min [(/, a)-h] = inf max [(/, а) - Л], ееQ U№E"(9,q) р£Р (М)е£.(г,р)
Пару {Q, Е*}, удовлетворяющую перечисленным требованиям, назовем верхним характеристическим комплексом (ХК) уравнения (6), а пару {Р, Е,} -нижним ХК. Совокупность всех верхних ХК обозначим через £*(Н), нижних - через €,{Н). При условиях (В.1)-(В.З) совокупности £*{Н) и £,{Н) непусты. Например, при Р — Q = R" требования (С.1)-(С.З) выполняются для E'{g,r) = E,(g,r) = Е(д,г), где Е- из (10), так что {W,E} 6 £*{Н) и
{R", E} 6 £,(H). Если Я - гамильтониан (5), то ХК можно также определить следующим образом:
Q = V, E* = E"(g,v):=co{(f,/i) = (f(g,u,v),h(g,u,v))\ueV}, , . P = U, E, = Ev(g,u):=co{(f,h) = (f(g,u,v),h(g,u,v))\veV}, ^
где со А означает выпуклую замкнутую оболочку множества А в R™ х R. Включения {V, Е"} £ £*(#) и (U, Е,,} 6 £,(Н) будут справедливы в силу условий (А.1) (А.4) Возьмем любые ХК {Q, Е*} £ £*(Н) и {Р, Е,} £ £t{H). Пусть зафиксированы д° = {f°, x'°[t,[-]i0]} £ G, z° £ R и p € P, q € Q. Символом CH*(g°,z°,q) обозначим множество всех возможных решений дифференциального включения (x[t], ¿[i]) £ E*(t, x[i«[-]f], q), t E T], которые удовлетворяют начальному условию: х[т] — х°[т], z[r] = z° при г £ [£,, <°]. Через CH,(gtt, z°,p) обозначим множество удовлетворяющих этому условию решений дифференциального включения (x[i],i[£]) £ E,(t,x[t,[-]t],p), t £ [i°,T]. В силу (С.1) множества CH*(g°,z°,q) и CHt(g0,z0,p) - непустые компакты в C([i„71],Rn х R). Рассмотрим неравенства
sup inf Ш, х*{Ц-Щ) - г*[г] - <р(д0)] < О, (16)
inf sup M<,z.[M-M)-Mt]-¥>(s°)]>0, (17)
в которых д° = {i0,x°[i,[-]t0]} £ G, t° < T, t £ (t°,T], p £ P, q £ Q и («*[•].**[•]) G CH'(g°,0,q), Ы-lz.l-}) £ С1Цд°, 0,p). В случае ХК (15) данные неравенства выражают так называемые свойства и- и ^-стабильности9'25 функционала цены дифференциальной игры с наследственной информацией (1) (3). При Р = Q = R" и Е* = Е, = Е они обращаются соответственно в неравенства (13) и (14). Оказывается, что и при любом другом выборе ХК {Q,E*} £ £*{Н) и {Р, Е,} £ £,{Н) условия (1С) и (17) обеспечивают выполнение неравенств (13) и (14)
Теорема 2 Пусть выполняются условия (B.l) (В.З). Тогда для непрерывного функционала <р : G у-* R следующие высказывания эквивалентны: i) <р является стабильным относительно ХДВ (11); И) <р удовлетворяет неравенствам (13) и (14); Hi) (р удовлетворяет неравенствам (16) и (17) при некоторых {Q, Е'} £ £*(Н) п {Р, Et} £ £,(#).
Далее минимаксные решения уравнений вида (6) определяются при помощи неравенств (16) и (17) относительно подходящих ХК.
В разделе 6 исследуется случай распределенного последействия. В добавление к условиям (ВЛ)-(В.З) предполагается, что
(В.4) для любого компакта D С C([i»,T],R") существует такое число Л = Л(£>) > 0, что при всех t £ [¿о,Т], х*[-],х,[-] £ D и s £ R" выполняется следующее условие Липшица по
\H(t,tf[U[-]t],8) - H{t,x.[t.[•]<], в)| < A(1 + N|) (fi ||x*M - x.[r]||2dr + |И<] - xt[t}\?)1'2. (18)
Для гамильтониана (5) это требование обеспечивается условием (А.4*).
Определение 3 Верхним решением задачи (С), (7) назовем полунепрерывный снизу функционал ¡р ■ С К, удовлетворяющий неравенству
?(т,х[М.]П) > ФЫ-)Т\), х[и[.]Т] = *[■] е СМ.*1)
и, при некотором верхнем ХК {<2,.£*} € £"(Н), условию (1С).
Определение 4 Нижним решением задачи (0), (7) назовем полунепрерывный сверху функционал >р : й н* К, удовлетворяющий неравенству
<р(Т, *[М-]Т]) < х[и[.]Т] = *[•] б С([<»,Т],К")
и, при некотором нижнем ХК {Р,Е^} 6 8,{И), условию (17).
Определение 5 Минимаксным решением задачи (6), (7) назовем функционал (р : б К, который одновременно будет верхним и нижним решением этой задачи.
Из определения 5 и теоремы 2 вытекает, что минимаксное решение задачи (6), (7) совпадает с непрерывным функционалом <р, который удовлетворяет требуемому условию на правом конце и является при этом стабильным относительно ХДВ (11). В силу утверждений 1, 2 отсюда следует согласованность рассматриваемого обобщенного решения с понятием решения в классическом смысле. Задача (6), (7) может не иметь классического решения. В противовес этому минимаксное решение данной задачи всегда существует и единственно. Доказательство этого факта проводится, в основном, по схеме, разработанной ранее6,12 для УЧП 1-го порядка. Сначала устанавливается, что минимальное верхнее решение не превосходит максимального нижнего решеиия и эти решения задачи (6), (7) существуют, а затем доказывается, что любое нижнее решение не превосходит любого верхнего решения
Теорема 3 Пусть выполнены условия (В 1)-(В.4) и краевой функционал а : С^о.Т],®") 1-4 К непрерывен. Тогда задача (6), (7) имеет одно и только одно минимаксное решение в смысле определения 5.
Доказательство теоремы 3 существенно опирается на условие (В.4). Это условие естественно для случая распределенного последействия. В общем же случае, например, уже при сосредоточенных запаздываниях, оно может не выполняться. Для решения в смысле определения 5 здесь возникают затруднения с обоснованием единственности. Обойти эти затруднения удается за счет некоторого (вполне естественного и не обременительного) усиления требований, предъявляемых к минимаксному решению, путем уточнения множества допустимых ХК. Исследование общего случая проведено в разделах 7,8.
В разделе 7 рассматриваются уравнения вида (6) с однородным гамильтонианом, а именно при следующих условиях:
(D.1) функционалы Я : G х R" »->. R и a : C([i0, T], R") 1-4 R непрерывны; (D.2) выполняется условие Липшица по s:
IН(д, s') - Н(д, s")| < L(g)\\s' - g ~ {t, x[tt[]t)} £ G, s', s" 6 R",
где L(g) определяется согласно (4);
(D.3) для любого д = £ G функция R" Э s И H(g,s) £ R
положительно однородна, то есть H(g,as) = aH(g,s), а > 0; (D.4) для любого компакта D С C([i,,T],K") существует такое число А = A(D) > 0, что для всех < £ [io,T], а;*[-],а:4 ] € D и s £ R" : |js|| = 1, справедлива оценка (условие Липшица по ®[i«[-]i])
\H(t,x%{-}t],s) - H(t,x,[tt{-]t},s)\ < А КМ -*.[т]||. (19)
По сравнению с условиями (B.I) (В.4) здесь условие Липшица (18) заменено более слабым условием (19), но добавлено условие однородности гамильтониана по переменной s. Пусть Р и Q - непустые множества. Рассмотрим многозначные отображения
GxQ Э (<7= (i,a;[i.[-]i]},</) F*(g,q) = С К",
G X Р В (д = Ъ(9,р) = Ft{t,x[tt[-}t],p) С R»,
которые удовлетворяют следующим требованиям:
(Е.1) для любых (g,p,q) 6 GxPxQ множества F*(g,q) и F,(g,p) являются непустыми выпуклыми компактами, меняющимися полунепрерывно сверху по включению при изменении д £ G;
(Е.2) существует число Ъ > 0 такое, что имеет место оценка
sup{||/|| I / £ F'(g,q) U F.(g,p)} < b( 1 + max ||x[r]||);
te^T^t
(E.3) для любых g = {t, x[t,[•]£]} £ G и s € R" справедливы равенства sup min (s, f) = inf max (s, /) = H{g, s).
qiQ №Ы) PZP feF,(.g,p)
Через !F*{H) и T,(H) соответственно обозначим совокупности всех пар {Q,F*} и всех пар {Р, Ft}, которые удовлетворяют этим требованиям. При условиях (D.1)-(D.4) имеем Т*(Н) ф 0, Т,{Н) ф 0. Например, требования (Е.1)-(Е.З) выполняются для
Р-О-П» F,(g>= V € F^ Ü * «)>» (20)
P-Q- R, F.(g,P) = {feF(g):(f,p)<H(g,p)}, ^
где F(g) = {/ £ Rn : ||/|| < V2L(g)}, L(g) - из условия (D.2).
Пусть {Q,F*} £ Г{Н), {P,Ft} £ Tt{H) и Etfg.q) = F*(g,q) x {0}, E%(9,p) = F*{g,p) X {0}- Сопоставляя условия (С.1)-(С.З) и (Е.1)-(Е.З), получаем, что имеют место включения
{Q, Е'0} £ Г(Н), {Р, И0,} € £,(Я). (21)
С учетом этого, н рассматриваемом случае конструкция определения минимаксного решения уточняется следующим образом. Для фиксированных 5° = (<0,x°[t,[]f0]) € G, р€ PuqeQ символами X'(g°,q) и Х,(д°,р) соответственно обозначаем множества удовлетворяющих начальному условию z[i,[-]t°] = решений дифференциальных включений с последействи-
ем x[i] € F*{t,x[t, [•]<], q) и x(i] е F,(t, s[t.[-]t],p), t° <t<T. Эти множества непусты и компактны в C([i,,T],R") для любых допустимых д°, р и q.
Определение 6 Минимаксным решением задачи (6), (7) с однородным гамильтонианом назовем непрерывный функционал tp : G И- R, удовлетворяющий условию (7) и, при некоторых {Q, F'} £ ^'(Я), {Р, F,} 6 F,{H), паре неравенств
sup ЫШх%[Щ-<р(д0)] < 0, (22)
УМ)
mf sup[y>(£, as.[t.[-]t]) - > °> (23)
У**) *.(]
где g° = {t°, x°[i4-]i0]} 6 G, t € [<°,T], p € P, q 6 Q, **[•] € X*(g°,q), *.[•] e Xt(g°,p).
Теорема 4 При условиях (D.1)-(D.4) задача (6), (7) имеет одно и только одно минимаксное решение в смысле определения 6. Это решение удовлетворяет неравенствам (22) и (23) при всех {Q, F*} 6 Т*(Н) и {Р, Р»} €
Отметим, что в силу (21) по теореме 2 рассматриваемое здесь минимаксное решение по-прежнему является непрерывным функционалом, стабильным относительно ХДВ (11).
В разделе 8 исследуется общий случай неоднородных уравнений вида (6), характеризуемый следующими условиями:
(F.1) для любою s € R" функционал G Э g ьч H(g, s) Gl непрерывен; (F.2) для любых (д, s)eGx R™ существует конечный предел
limrH(j>e/r) = fl0(ff,S), (24)
г-10
причем для любого s 6 Rn функционал G Э д Н°(д, s) 6 R непрерывен; (F.3) для любых д - {t, x[i,[-]i]} е G, s', s" 6 R" и положительных г', г" € R справедливо неравенство
\i~'H(<?, s'/r') - г"Н(д, s"/r")| < L{g)j\\s'-s»\\i+(r'-r»)\
где L(g) определяется согласно (4);
(F.4) для любого компакта D С C([t„Tj, R") существует такое А > 0, что для всех t 6 [t0,T], [•].«•[■] G Ö и (s,r) 6 R" X R : ||s||2 + г2 = 1,г > О, справедлива оценка
г | H(t, x*[t.[-]t], s/r) - H(t,x,[t.[]t), s/r)\ < Am» || x*[t) - х,[т]||.
Для гамильтониана (5) эти условия выполняются в силу (А.1) (А.4). Отметим также, что при условиях (Р.1) (Р.4) автоматически выполняются условия (В.1)-(В.4). Обозначим
Я(Р,5,г):=[ ИЯ^ уИ), если г ф О, ' ' Н (д, я), если г = О,
где (д = еСхГхЕи Н°(д, я) - из условия (Р.2). Отмстим,
что
Н(д,з,-1) = Н(д,з). (25)
Рассмотрим многозначные отображения
б х С? Э (р = 0, х[и [•]<]}, Я) ^ Т(д, Ч) = Тц, х[Ц-Щ, д)сГх К, ОхРэ{д= {*, ®[*.[-]«]>,Р) Р.(9,Р) = С К" х К,
где Р и <2 - некоторые непустые множества. Потребуем, чтобы
(С.1) для любых (д,р,я) £ й х Р х <5 множества Р (д, д) и Ь\{д,р) были
непустыми выпуклыми компактами в К" X К, меняющимися полунепрерывно
сверху по включению при изменении д € (7;
(С.2) при некотором Ь > О выполнялась оценка
S"p{\/||/||2 + /i2 I (/, ft.) £ F'(g,q) U F,(fl,p)} < 6(1 + max ||*[т]||);
(G.3) для любых (g, s, r) £ G x 1" x R было справедливо равенство
sup min [(s, /) + rh] = inf max [(s, /) + rh] = H(g, s, r). «e<3 (/,/i)eT(ga) (f,h)€F.(e,p)
Совокупности пар {Q, F } и пар {P, P,}, удовлетворяющих этим требованиям, обозначим соответственно через Т (Н) и !F,(H). Сопоставляя условия (С.1)-(С.З) и (G.1)-(G.3), с учетом (25) получаем вложения
Т(Н) С £*{Н), У.(H) с £,(Н).
Определение 7 Минимаксным решением задачи (6), (7) с неоднородным гамильтонианом назовем непрерывный функционал <р i-4 R, удовлетворяющий условию (7) и, при некоторых ХК {Q, Е*} € ^*(Я), {Р, £,} £ .^«(Я), неравенствам (16), (17).
Теорема 5 Пусть гамильтониан Н задачи (6), (7) удовлетворяет условиям (F.1)-(F.4) и краевой функционал а : C([fo,T],Rn) >->• R непрерывен. Тогда эта задача имеет одно и только одно минимаксное решение в смысле определения 7. Это решение удовлетворяет условиям (16) и (17) при всех ХК {Q, Е*} е Т{Н) и {Р, Е.} € У.(Н).
В разделе 9 доказана непрерывность зависимости минимаксного решения задачи (G), (7) от исходных данных.
Теорема 6 Пусть <70,07. : С([<о, Т], R") 1-4 R непрерывные функционалы, Н0, Ht : G X R" t-4 R - гамильтонианы, удовлетворяющие условиям (F 1)-(F.4), Щ, Я" определены по Я0, Я*. согласно (24), k — 1,2,... Предположим, что при к —> оо; ст*. -> <т0 равномерно па любом компакте из C([io,T],R");
з) -)• Ho{-,s), Я°(-,s) -)• Hq(-,s) для любого s € R" и любого компакта D С C([<t,T],R") равномерно на множестве
G(D) := {<7 = {«,*(«.[■]<]} : * б [io,T],rr[-] е Л}.
Пусть <pk : G Н- R - минимаксные решения задач Коши
Г dt<p(g) + Hk(g, V^)) = 0, g = {t, *[t,[-]t]} € G, t < T, , ,
X tp(T, z[i,[-]T]) = ff4(x[i„[-]T]), x[tt[}T\ = *[•] € <?([«., T], R"),
Тогда (р^ —> y>o при k —у оо для любого компакта D С C([i,, Т], R") равномерно на G(D) Предельный функционал <ро : G н-» R будет минимаксным решением задачи Коши (26о).
В разделе 10 показано, что минимаксное решение задачи (6), (7) можно аппроксимировать минимаксными решениями подходящих задач для УЧП 1-го порядка относительно функций конечномерного аргумента возрастающей размерности. Из результатов раздела 10 также следуег, что в вырожденном случае отсутствия последействия минимаксное решение уравнения (6) (функционального в данном случае лить формально) однозначно определяется минимаксным решением соответствующего обычного уравнения Г-Я.
Глава III посвящена изучению инфинитезимальных свойств негладких минимаксных решений уравнений вида (б). Она состоит из разделов 11-14.
В разделе 11 для функционалов tp : G н> R вводится понятие верхних и нижних производных по многозначным направлениям и приводятся формулы для вычисления таких производных в некоторых частных случаях
Пусть t < Т, g = {<,x[i,[-]i]} £ G, F - непустой выпуклый компакт из К™,
€ Lip(g), е > 0, [F]£ - замкнутая е-окрестность F в R". Обозначим
ГШ I »[•]> д+М9) I »[•]}
d-M<7) I П d+Mg) I F}
Величины d~{ip(g)
верхнее правые производные числа функционала ip в точке g вдоль функции ¡/[•]. Величины d~ {</>(<?) | F} и d+{у>(<?) | F} назовем соответственно нижней и верхней производными (р в точке g по многозначному направлению F. Эти производные могут принимать несобственные значения —оо и +оо
liminf [<p{t + 6, y[U[-)t + ¿]) - <p(g)}6-\
limsup[^(i + 5, y[t,[-]t + 5]) - <p(g)]S~l; s\.o
{»[•] 6 Lip(ff) : y[r] e [FY п. в. r e [i,T]}; lim inf д tp(g \ y[-]),
w y[]eii(s,f^)
lim sup d+ip(g \ t/[-]). !/[■]} и d+{ip(g) I y[-]} представляют собою нижнее и
Утверждение 4 Пусть функционал <р : G t-4 R el-дифференцируем в точке д. Тогда сщшведлиоы равенства
d-MflJIF} = ЭдеЫ + шш^Ы,/),
d+Md) [ П = dtV>(g) + n^x(VV(g),f).
Кусочпо-ш-гладким назовем функционал, представмый в виде
ip(g) = rninmaxф{](д), д = {t, [•]*]} £ G, (27)
1 el jeJ
где фч : G (-4 R - непрерывные с1-диф(}юрснцирусмые функционалы (г € /, j е J), / и J - конечные множества. Положим
1о{д) = {г0 € / : maxфч,(д) = ч>{д)}, Jo{g,i) = {jo € J : ^„(з) = max^(5)}. ./е./
Утверждение 5 Пусть <p : G 4R - кусочно-ci-гладкий функционал (27). Тогда справедливы равенства
I = min min max ¡д(ф,,(д) + (Уфц(д), f)], feF «е/оЫ jeJo(»,•)
d+Mi/)l^} = тал min max [ЭД>,,(5) + (V^ (</),/)]. /ei" ieh(y) зчМал)
Рассмотрим функционал
= max[V-(ff, 0 + ii(01, 9 = {*, «[<*[•]<]) € G, (28)
где L - непустой компакт из К™, ц : L н4 [—оо,+оо) - полунепрерывная сверху функция, ф(д, I) : GxL 4 R - непрерывный функционал, ci-дифференцируемый при любом I 6 L равностепенно по I, причем отображения L Э I ь4 дьф(д, I) £ R и L Э 1>-4 Уф(д, 1) £ R" непрерывны. Положим
Утверждение 6 Пусть функционал tp : G t-4 К представим в виде (28). Тогда справедливы равенства
d'Mfl) I = - так [9^(5,0 + ^(5,0-/)],
d+M<?) I = max та^с [д<ф(д,1) + {Ъф(д,1), f)}.
В разделе 12 показано, что стабильность функционалов <р относительно ХДВ (11) выражается следующими дифференциальными неравенствами:
<1-{ч>(д)-(8,хЩ)\В(д)} + Н(д,а) < 0, (29)
а+М5)-(5,х[ф|Я(5)} + Я(д,8) > 0, (30)
д = {t,x{tt[]t]} eG, t<T, s er.
Здесь B{g) := {/ 6 Rn : ||/|| < L(g)}, L(g) - из условия (B.2). Отметим, что в силу утверждения 4 для ci-дифференцируемых функционалов данные неравенства эквивалентны уравнению (6).
Теорема 7 Пусть выполняются условия (В.1)-(В.З). Тогда для полунепрерывных снизу функционалов <р : G rt R условия (13) и (29) эквивалентны. Соответственно условия (14) и (30) эквивалентны для полунепрерывных сверху (функционалов.
Из теорем 2 и 7 и соответствии с определениями 3-5 следует, что пара функциональных дифференциальных неравенств (29), (30) определяет минимаксное решение уравнения (С) в случае распределенного последействия.
В разделе 13 показано, что и в остальных случаях минимаксное решение может быть определено при помощи аналогичных неравенств.
Пусть {Q, F'} е F'(H), {Р, F,} 6 Т,{Н) и при этом многозначные отображения G Э g F*(g, q) с К" и G Э g Ft(g, р) С К" непрерывны в метрике Хаусдорфа. Например, {Q, F*} и {Р, F,} можно определить согласно(20).
Теорема 8 При условиях (D.1)-(D.4) для полунепрерывных снизу функционалов ц> условие (22) эквивалентно дифференциальному неравенству
sup d"Ms) I F*{g, q)}< 0, g= {f, x[<,[-]i]} eG, t<T. qzQ
Соответственно для полунепрерывных сверху функционалов ip условие (23) эквивалентно дифференциальному неравенству
inf d +{ip(g) | F.(g,p)} >0, g= {t,*[«.[■]«]} 6 G, i < T. p€i
Пусть {<э,£4} e T(H), {P, Et) e 7,{H) и для любых (p,q) G P X Q отображения G Э g E*(g,q) С R" x I и G Э J H E,(g,p) С 1" x R непрерывны в метрике Хаусдорфа.
Теорема 9 Пусть выполняются условия (F.1)-(F.4). Тогда для полунепрерывных снизу функционалов tp : G R условие (16) эквивалентно дифференциальному неравенству
supd"{5i(&) | E'(g,q)} < 0.
qeQ
* Соответственно для полунепрерывных сверху функционалов ip : G у-Ь Ж
условие (17) эквивалентно дифференциальному неравенству
inf d+{?>(s0) | E,{g,p)} > 0. peP
Здесь g0 = {i, (x[t*[-]t], z[tt[-]t] = 0)}, g = {t, x[t»[-]t]} € G,t <T. Вспомогательный функционал ip(g) = Tp(t, x[t,[•]£], z[i,[-]i]) определяется no исходному <p(g) — ip(t, [•]£]) равенством lp(t, x[i,[-]i], ¿[i,[-]£]) = <p(t,x[i«[-]i]) — z\t\.
В силу утверждений 5, 6 полученные дифференциальные неравенства эффективно проверяются, когда функционал ip является кусочно-а-гладким или же представляет собой огибающую семейства ci-гладких функционалов.
В вырожденном случае отсутствия последействия данные неравенства аналогичны неравенствам, определяющим минимаксное решение обычных уравнений Г- Я с частными производными 1-го порядка5.
В разделе 14 рассмотрены инвариантные суб- и супсрградиенты функционалов р : (7 И И, обобщающие понятие и-лроизводных. Показано, что такие суб- и суперградиснты минимаксного решения уравнений вида (6) удовлетворяют неравенствам, определяющим его как вязкостное решение этих уравнений.
Глава IV состоит из разделов 15-17. В ней показано, что в общем случае уравнение (С) с гамильтонианом (5) однозначно определяет функционал цены дифференциальной игры с наследственной информацией (1)-(3), как свое минимаксное решение. При этом результаты по существованию и единственности минимаксных решений (теоремы 3-5) устанавливают существование цены и ссдловой точки рассматриваемой дифференциальной игры, а полученные для минимаксных решений функциональные дифференциальные неравенства (теоремы 7-9) доставляют инфииитезимальные условия оптимальности (критерии и- и ^-стабильности) негладкого функционала цены. Ключевым в обосновании данных утверждений является построение на базе минимаксных решений экстремальных стратегий (или е-стратегий) и доказательство их оптимальности. Рассматриваются различные, взаимно дополняющие друг друга конструкции экстремального прицеливания или сдвига.
В разделе 15 для случая управления системами с распределенным последействием развита конструкция экстремального прицеливания в направлении «-градиентов вспомогательных функционалов типа Ляпунова. Эту конструкцию можно рассматривать как подходящий функциональный аналог метода прицеливания в направлении квазиградиентов, известного27 для задач управления обыкновенными дифференциальными системами.
Полагаем выполненными условия(А.1)-(А.З), (А.4*) и (А.5). При этих условиях гамильтониан (5) удовлетворяет требованиям (В.1)-(В.4) и по теореме 3 задача (6), (7) имеет единственное минимаксное решение в смысле определения 5. Пусть О0 - некоторый компакт из С([£,, К") такой, что € О0. Для д - [•]£]} £ СУ обозначим
Xй(д) := {»[■] € Ыр(д) : \\у[т}\\ < Цт, у[и[-)т}) + сМ п.в. г 6 [I, Т)},
где £(■) - из условия (А.2). Зафиксировав М > 0, положим
Ы-] 6 Xм{1°, а^Н«0» | х[Ц.}?} € Б0}. (31)
Множество Х° компактно в С([г„ Т], К"). Полагая в условии (А.4*) О = Х°, определим число А > 1. Пусть е0 — е-2(г-<0)А) £ е (0,е°). Возьмем вспомогательный ш-гладкий функционал
"¿я) = Мг,х[и[.Щ) = (е~2<Т~£) \А4 + 2Л £ ИхМ112^г + ||хМ|12.
27Паркышева Г.Г., Субботин А.И Стратегии минимаксного прицеливания в направлении квазиградиента// Прикладная математика и механика, 1994. Т. 58. Вып. 4. С. 5-11.
Чтобы определить экстремальную е-стратсгию Щ(д) — U*(t, x[i,[•]<]) воспользуемся следующим преобразованием функционала tp:
<Ре{д) = <Pe(t, *[«.[.]<]) ~ min [ip(t, »[*,[•]*]) + «".MM)]. (32)
»I ]eA°
где wu[t.[\t] = {«j„[t] = x\r] - y\r],t, < т < t). Пусть j/"[•] 6 X° - минимизирующая в (32) функция. Она зависит от д = {<, x[i,[-]i]} и е. Обозначая <[t.[-]i] := {w°W = х[т) - y°[r},t, <r<t}, положим
исЛа) = р(д, О, = v«/e(i, <[t.№), (зз)
где р(д. s) - минимаксная предстратсгия из (8). Рассматривая преобразование Ч>Ъ) = <f(t, := max.[*»(*, »[«,[■]<]) - ve{t, w„[i.[-]<])], (34)
где w„[i,[-]i] = {w„[r] = у[т) — x{r),t, < т < t}, и обазначая :=
[гиЦт] = j/°[r] - ж[т], tt < г < t}, где «/£[•] 6 X° - максимизирующая в (34) функция, определяем экстремальную е-стратегию V'"(g) = V^e(t,x[i,[-]i]):
- q(9, si), si = VuE(t, <[*,[•]«]), (35)
где q(g, s) - максиминная предстратегия из (9).
Теорема 10 При условиях (А.1) -(А.З), (А.4*) и (А.5) дифференциальная игра с наследственной информацией (1) (3) имеет цену Г°(<?°) для любой начальной позиции
g° = {i0,x0[i,[-]i0]} G G. Функционал цены 1 : О 4 К совпадает с минимаксным решением <р соответствующей задачи (6), (7). Экстремальные е-стратегии (33) и (35) являются оптимальными.
В разделе 16 на материале дифференциальной игры с однородным гамильтонианом реализован метод экстремального прицеливания на стабильные мосты9. Пусть в дифференциальной игре (1) (3) выполняются условия (А.1)-(А.5) и при этом h(t,x[tt[•]£],«,«) = 0. Тогда гамильтониан (5) удовлетворяет требованиям (D.1)-(D.4) теоремы 4 и задача (6), (7) имеет единственное минимаксное решение </? в смысле определения 6. Обозначим
Г.Ю - {vHeX°:V>(t,»[t.M)<¥>(s°)}, (fo < , < Т) Y,(t) := {»[■] € : <p{t, y[U[■]<]) > <p(g°)h ~ ~ T)'
где X° - из (31). В терминологии теории дифференциальных игр множества Yu(t) и Yv(t) представляют собою и-стабильный и v-стабильный мосты. Экстремальные стратегии Ue(g) = Ue(t, ®[i»['M) и Ve(g) = Vе(t, [•]<]) определим следующим образом:
U°(g) = р(9,0, al = x[t)-yl\t), y°ul] e arg^mm(){max Ж-уМИЬ (36) УЪ) = q(9,sl), si = y°v[t]-x{t}, yl[-] e щш((){ max \\x[r]-y[r]||}, (37)
где p(g, s) e arg min{max{s, f(g, u, v))}, q{g, s) <E argmax{min{s, f(g,u, t>))}. u6l) veV u€v ti€l)
3 Л) концов НЛО Функциональные уравнения типа Гампльтопа-Якобп и дифференциальные игры с наследственно!! ииформицшЛ//Доклады РАН, 2000 Т.371 №4.С.457-461.
•I. Лукоянов Н Ю Об уравнешш типа Гамнльтона-Якобн в задачах управления с наследственно!! информацией// Прикладная математика и механика, 2000. Т.64. Вып 2. С. 252-263.
о Л\ коянов Н.Ю Об обобщениях уравнения Гамнльтона-Якобн для наследственных систем Изв. УрГУ Математика и механика, 2000 Вып 3 Л>18 С. 109-130.
6. Лукоянов Н.Ю Минимаксное решение функциональных уравнений типа Гамильтона-Якобн для наследственных систем// Дш/нреренц уравнения, 2001. Т 37. №2. С. 228-237.
7. Лукоянов Н.Ю О свойствах функционала цепы дифференциальной игры с наследственной информацией// Прикладная математика и механика, 2001. Т.65 Вып.З. С.375-384.
8 Лукоянов Н.Ю Об экстремальном прицеливании в задачах управления системами с последействие«// М.щ УрГУ- Математика и механика, 2003 Вып 5 ff<2G С. 115-123
9. Лукоянов Н.Ю Стратегии прицеливания в направлении инвариантных градиентов// Прикладная мателшншка и механика, 2004. T.G8. Вьш.4. С G29-643.
10 Л) коянов Н.Ю., Решетова Т.Н. Задачи конфликтного управления функциональными системам» высокой размерности// Прикладная математика и механика, 1998. Т.62. Вьш.4. С 0SG-097.
11. Luko\anov N.Yu Hamilton-Jacobi type equation for probhms of control of functional differential systems// Proc. of the ll-th IFAC Intern. Workshop: Control Applications of Optimization (St Peleibunj, 2000), pp. 591-596. (Pergamon, Dec 2000).
12. Luko\auov \ Yu. Necessary and sufficient conditions for the value of a differential game with hereditary information// Proc. oj the 10-th Intern Symposium on Dynamics Games and Applications (St.Peterburg, 2002), Vol.11, pp 487-491.
13. Ltiko\ anov X Yu Functional Hamilton-Jacobi type equation1! in ei-derivativcs for systems with disuibuted delays// Nonlinear Fund. Anal, and Appl2003 Vol.8. No.3. pp. 3G5-397.
14 Lukojanov N Yu Functional Hamilton-Jacobi type equations with ci-derivativcs in control pioblems with heieditary information// Nonlinear Funct Anal and Appl - 2003. Vol.8 No 4. pp. 535-556.
15 Lukoyaiiov N.Yu On dynamic programming m control problems of systems with distributed delays// Preprints IFAC Workshop on Time-Dtlay Systems (CDROM), INRIA, Rocquencouit, France, Sept. 2003.
Подписано в печать 22.12 2004 Формат 60x84 1/16. Объем 2 п.л. Тираж 120 экз Заказ Х«209 Размножено с готового оригинал-макета в тнпо! рафии УрО РАН 620219, г Екатеринбург, ул. С. Ковалевской, 18
P-2 1 9 б
РНБ Русский фонд
2005-4 48303
Введение.
I Дифференциальная игра с наследственной информацией. Уравнение для функционала цены.
1. Постановка задачи.
2. Коинвариантные производные функционалов.
3. Уравнение для функционала цены.
И Минимаксные решения функциональных уравнений типа Гамильтона-Якоби с коинвариантными производными
4. Стабильность классических решений.
5. Характеристические комплексы.
6. Минимаксное решение функциональных уравнений типа Гамильтона-Якоби для систем с распределенным запаздыванием.
6.1. Нижняя огибающая верхних решений.
6.2. Существование и единственность.
6.3. Примеры.
7. Уравнения с однородным гамильтонианом.
8. Неоднородные уравнения.
9. Корректность минимаксных решений.
10. К вопросу приближенного построения решений.
III Функциональные дифференциальные неравенства
11. Производные по многозначным направлениям.
11.1. Определение производных по многозначным направлениям.
11.2. Кусочно-сьгладкие функционалы.
11.3. Огибающие семейства ci-гладких функционалов.
12. Инфинитезимальные условия стабильности негладких функционалов.
13. Функциональные дифференциальные неравенства для минимаксных решений.
13.1. Случай однородного гамильтониана.
13.2. Общий случай.
13.3. Примеры.
14. Вязкостные решения функциональных уравнений типа Гамильтона-Якоби с сьпроизводными
IV Минимаксное решение уравнения типа Гамильтона-Якоби с сьпроизводными и функционал цены дифференциальной игры с наследственной информацией
15. Стратегии прицеливания в направлении сьградиентов вспомогательных функционалов.
16. Стратегии прицеливания на стабильные мосты
17. Стратегии экстремального сдвига на сопутствующие точки 176 Приложение: Дифференциальные системы с наследственной информацией.
Р1. Дифференциальные уравнения с последействием.
Р2. Дифференциальные включения с последействием.
Предыстория и актуальность темы. Представляемая диссертация посвящена проблеме развития для экстремальных задач в наследственных динамических системах конструкций и методов, связанных с уравнениями Гамильтона-Якоби. Объектом исследования данной работы являются задача управления наследственными динамическими системами в условиях неконтролируемых помех или конфликта и функциональное дифференциальное уравнение типа Гамильтона-Якоби с коинвариантны-ми производными. Исследования проводятся в рамках теоретико-игрового подхода, разрабатываемого в научной школе H.H. Красовского по оптимальному управлению.
Начиная с вариационных принципов классической механики, в современной теории динамических систем и оптимальных процессов сложились два основных, взаимно дополняющих друг друга подхода к решению экстремальных задач. Первый подход связан с непосредственным вычислением экстремального движения при фиксированном начальном состоянии. Фундамент этого подхода составляет принцип максимума JI.C. Понтрягина. В диссертации рассматривается второй подход, связанный с поиском функции цены, которая каждой точке пространства состояний системы ставит в соответствие оптимальный результат (или, в случае наличия неконтролируемых помех, - оптимальный гарантированный результат), достижимый из нее, как из начальной. Этот подход приводит к дифференциальным уравнениям типа Гамильтона-Якоби с частными производными первого порядка. В задачах оптимального управления -это известное уравнение Беллмана [15, 16], в дифференциальных играх -уравнение Айзекса [2]. Аналогичные уравнения возникают в геометрической, оптике - уравнение эйконала [94], в газовой динамике - предельное уравнение Бюргерса-Хопфа [162, 240, 252, 270] и т.д. Эти уравнения также можно интерпретировать в свете решения соответствующих экстремальных задач.
В рамках первого подхода решаются задачи оптимального программного управления (см., например, [3, 20, 23, 27, 28, 41, 72, 156, 255, 295]). В русле второго - на базе функции цены строятся позиционные стратегии оптимального управления по принципу обратной связи, назначающие текущее управляющее воздействие с учетом доступной информации о сложившемся к данному моменту состоянии системы, что особенно важно в приложениях и принципиально в задачах гарантированного управления в условиях неопределенности или конфликта (см., например, [21, 73, 78, 85, 97, 153-155, 157, 199, 201, 239, 243, 246, 261, 287]).
Современная математическая теория динамических систем и оптимальных процессов охватывает широкий круг актуальных задач, включает большое число разнообразных методов управления, наблюдения, оценивания и реконструкции, имеет прочные связи с другими разделами математики и многочисленные приложения. Ее становление относится к середине ХХ-го столетия и связано с именами отечественных и зарубежных математиков H.H. Красовского, JI.C. Понтрягина, Р. Айзекса (R. Isaacs), Р. Беллмана (R. Bellman), У. Флеминга (W.H. Fleming). Существенный вклад в ее развитие внесли Э.Г. Альбрехт, В.Д. Батухтин, В.Г. Болтянский, Р.Ф. Габасов, Р.В. Гамкрелидзе, П.Б. Гусятников, А.Я. Дубовиц-кий, С.Т. Завалищин, М.И. Зеликин, Ф.М. Кириллова, A.B. Кряжим-ский, A.B. Куржанский, A.A. Меликян, A.A. Милютин, Е.Ф. Мищенко, Ю.С. Осипов, H.H. Петров, J1.A. Петросян, Б.Н. Пшеничный, А.И. Субботин, В.М. Тихомиров, В.Е. Третьяков, А.Г. Ченцов, Ф.Л. Черноусько, A.A. Чикрий, В.А. Якубович, J.P. Aubin, M. Bardi, E.N. Barron, T. Basar, P. Bernhard, A.E. Bryson, F.H. Clarke, M.G. Crandall, R.J. Elliot, L.C. Evans, A. Friedman, Ho Yu-Chi, R.E. Kaiman, N.J. Kalton, G. Leitman, P.L. Lions, G.J. Olsder, E. Roxin, P. Varaiya, J. Warga и многие другие ученые ( см. книги и обзоры [2, 3, 16, 19-21, 23, 27, 28, 38, 41-46, 49, 56, 57, 72-78, 85, 87, 97, 103, 104,121, 124, 130, 131, 148, 149, 152-159, 168, 172, 183, 188-190, 197-201, 207, 212, 217-219, 226, 236, 245, 246, 254, 261, 265, 281, 285, 295] и библиографию к ним).
Тематика диссертации примыкает к той части этой теории, в которой изучаются качественные свойства функций оптимального результата и способы построения оптимальных позиционных стратегий управления в связи с конструкциями динамического программирования и уравнениями Гамильтона-Якоби.
Классическое уравнение Гамильтона-Якоби имеет источником аналитическую механику (см., например, [8]), где искомая функция, как правило, является гладкой (непрерывно дифференцируемой) и удовлетворяет этому уравнению во всех точках области определения. Известное в теории оптимальных процессов и дифференциальных игр уравнение Гамильтона-Якоби-Айзекса-Беллмана выводится для функции цены в предположении, что она также является гладкой. Однако, в действительности, эта функция напротив, как правило, таковой не является и названное уравнение не имеет подходящего классического решения. С другой стороны, во всех тех точках, где функция цены дифференцируема, она удовлетворяет данному уравнению и в этом смысле может рассматриваться как его обобщенное (негладкое) решение. Одна из основных трудностей при этом состоит в том, что только этого свойства, без дополнительных условий, характеризующих функцию цены в точках негладкости, не достаточно для ее однозначного определения. Поэтому требуется соответствующее уточнение понятия обобщенного решения.
Аналогичная ситуация имеет место в задачах математической физики, например, при описании поверхности кристаллов, растущих в насыщенном растворе [240], негладкого фронта распространения световой волны в неоднородной, композитной среде [137, 228] и т.д. Здесь содержательные негладкие решения удовлетворяют естественным физическим закономерностям, строгая формализация которых также приводит к задаче корректного определения обобщенного решения соответствующих уравнений типа Гамильтона-Якоби.
Все это стимулировало активные исследования в области построения теории обобщенных решений уравнений Гамильтона-Якоби и других типов нелинейных дифференциальных уравнений с частными производными первого и второго порядка. С математической точки зрения вопрос заключался в том, чтобы ввести понятие такого обобщенного решения этих уравнений, которое бы, во-первых, было корректно (то есть существовало, было единственным и непрерывно зависело от начальных данных) для широкого круга начальных и краевых задач; во-вторых, естественным образом согласовывалось с классическим понятием решения (в том смысле, что, с одной стороны, обобщенное решение должно удовлетворять уравнению всюду, где оно дифференцируемо, а с другой - классическое решение, если оно существует, должно удовлетворять всем требованиям, определяющим обобщенное решение); и наконец, в-третьих, которое бы отвечало содержательному смыслу этих уравнений, выявленному на конкретных примерах вышеупомянутых задач из теории оптимального управления, дифференциальных игр и математической физики.
В 1950-1970 годы в работах Н.С. Бахвалова, И.М. Гельфанда, С.К. Годунова, O.A. Ладыженской, O.A. Олейник, Б.Л. Рождественского, A.A. Самарского, С.Л. Соболева, А.Н. Тихонова, L.C. Evans, W.H. Fleming, Е. Hopf, P. Lax и многих других известных математиков (см. [13, 31, 32,
47, 48, 88, 101, 137, 162, 164, 178, 236, 240, 244, 252, 270, 273] и далее по ссылкам) интенсивно изучались слабые решения квазилинейных уравнений с частными производными. Эти исследования в основном опирались на интегральные методы и интегральные свойства обобщенных решений.
В то же время, уже в этот период закладываются основы целенаправленного привлечения к исследованию обобщенных решений инфините-зимальных конструкций выпуклого и негладкого анализа. В этой связи отметим результаты С.Н. Кружкова (см., например, [88, 89]), устанавливающие для уравнений Гамильтона-Якоби с выпуклым по импульсной переменной гамильтонианом корректность обобщенного решения задачи Коши-Дирихле в классе локально слабо вогнутых функций. Позднее было показано [193], что применительно к задачам оптимального управления такое решение уравнения Беллмана однозначно определяет функцию оптимального результата. В это же время F.H. Clarke предложил (см. [223]) использовать для исследования негладких решений уравнения Беллмана обобщенные производные по направлениям.
Дальнейшее развитие субдифференциального аппарата выпуклого анализа и инфинитезимальных конструкций негладкого и многозначного анализа [39, 56, 130, 158, 163, 207, 208, 225, 226, 286] позволило применять к исследованию негладких задач динамической оптимизации и обобщенных решений уравнений типа Гамильтона-Якоби новые подходы и методы, основанные на гладких аппроксимациях и обобщениях понятия дифференцируемое™ (см. [10, 37, 98-100,102,131,151,167-177, 220, 222, 230-235, 245, 247, 248, 264-266, 269, 271, 274, 295]).
Своеобразный подход к определению обобщенного решения уравнений Гамильтона-Якоби-Беллмана, развивается в работах В.П. Маслова и его сотрудников на базе идемпотентного анализа (см., например, [61, 123]).
Существенное продвижение в построении современной теории обобщенных решений уравнений Гамильтона-Якоби связано, с одной стороны, с понятием вязкостного решения (viscosity solution), которое в начале 1980-х годов ввели M.G. Crandall и P.L. Lions [230], а с другой - с понятием минимаксного решения, которое было предложено примерно в это же время А.И. Субботиным [167, 168].
Понятие вязкостного решения идейно восходит (см. [230, 273]) к методу "изчезающей вязкости" из математической физики, ранее последовательно применявшемуся для изучения уравнений Гамильтона-Якоби, например, в упомянутых выше работах С.Н. Кружкова. Этот метод первоначалыю использовался при доказательстве существования вязкостного решения. Однако само определение этого решения не содержит сингулярных предельных переходов в соответствующих параболических уравнениях и по своей сути основано (см. [234]) на замене уравнения парой неравенств относительно суб- и суперградиентов рассматриваемого решения. В точках дифференцируемости решения эти неравенства эквивалентны уравнению. В рамках теории вязкостных решений были сформулированы и доказаны теоремы единственности и существования для различных типов начальных и краевых задач и различных типов уравнений с частными производными первого и второго порядка (см. [211, 230-235] и обзор [236]). Была изучена связь понятия вязкостного решения с условиями оптимальности в задачах детерминированного и стохастического управления (обзор этих результатов можно найти в работах [212, 245]). В частности, в ряде работ (см., например, [215, 216, 241, 274]) для различных типов задач управления и дифференциальных игр было показано, что функция цены совпадает с вязкостным решением соответствующего уравнения Айзекса-Беллмана. С другой стороны, уравнения с частными производными первого порядка достаточно общего вида рассматривались как уравнение Айзекса-Беллмана для подобранной подходящим образом дифференциальной игры. Такие конструкции были описаны еще в ранних работах W.H. Fleming (см., например, [244]) и использовались позднее для доказательства существования вязкостных решений краевых задач и задач Коши (см., например, [232, 241]). В последнее время большое внимание уделяется вопросам разработки аналитических и численных методов построения вязкостных решений (см. в этой связи [126, 173, 213, 214, 242, 265, 281, 290, 291]).
Истоки минимаксного решения уравнений Гамильтона-Якоби лежат в теории позиционных дифференциальных игр, развитой в научной школе H.H. Красовского [68-79, 82-86, 260, 261] и базирующейся на минимаксных (максиминных) оценках и операциях. Фундаментальный вклад в труды этой школы по теории позиционного управления, наблюдения и восстановления динамики внесли A.B. Куржанский [36, 97, 265], Ю.С. Осипов [92, 140, 285], А.И. Субботин [85, 167, 172], A.B. Кряжимский [90, 92, 285], В.Е. Третьяков [86, 181, 182], А.Г. Ченцов [172, 195, 196]. Активная роль в этих исследованиях принадлежит Э.Г. Альбрехту, Б.И. Ананьеву, В.Д. Батухтину, Ю.И. Бердышеву, С.А. Брыкалову, B.J1. Гасилову, М.И. Гусеву, Х.Г. Гусейнову, С.Н. Завалищину, A.B. Киму, А.Ф. Клейменову, А.И. Короткому, А.Н. Красовскому, В.И. Максимову, О.И. Ни-конову, B.C. Пацко, В.Г. Пименову, А.Н. Сесекину, И.Ф. Сивергиной, H.H. Субботиной, A.M. Тарасьеву, В.Н. Ушакову, Т.Ф. Филипповой, Г.И. Шишкину, А.Ф. Шорикову и их ученикам (см. [4, 5, 14, 18, 22, 24, 34, 37, 43, 53, 57, 64-67, 93, 98-100, 121, 135, 144-146, 170, 171, 174-177, 185, 186, 204, 260-263, 284, 288, 293]).
В теории позиционных дифференциальных игр было введено понятие и- и ^-стабильных функций (см., например, [78, 85, 261]), которые соответственно мажорируют и минорируют функцию цены. При этом последняя оказывается единственной непрерывной функцией, одновременно являющейся и- и и-стабильной и удовлетворяющей естественному краевому условию, которое указывает показатель качества дифференциальной игры. В точках дифференцируемости она удовлетворяет уравнению Айзекса-Беллмана. Таким образом, свойства и- и ^-стабильности однозначно определяют корректное обобщенное решение соответствующей задачи Коши для этого уравнения, совпадающее с функцией цены дифференциальной игры. Это решение является, с одной стороны, минимальной «-стабильной функцией, а с другой - максимальной v-стабильной. Поэтому, в частности, такое решение уравнений типа Гамильтона-Якоби было позднее названо минимаксным, а и- и v-стабильные функции стали соответственно называть верхними и нижними решениями. В рамках конструкций унификации дифференциальных игр (см., например, [76, 77]), было показано, что свойства и- и ^-стабильности могут быть выражены только в терминах гамильтониана управляемой системы. Были получены инфинитезимальные критерии и- и ^-стабильности негладких функций, сначала [167, 170] - в форме неравенств для их производных по направлениям, а затем [37] - в терминах конусов Булигана для сечений (по времени) их множеств Лебега. Были также указаны [171] неравенства для сопряженных производных и- и г»-стабильных функций.
На этой основе в дальнейшем было показано (см., например, [168, 169]), что данный подход может быть применен не только к уравнениям Айзекса-Беллмана, возникающим в задачах управления и дифференциальных игр, но и к другим уравнениям с частными производными первого порядка. Для уравнения Гамильтона-Якоби общего вида были построены семейства характеристических обыкновенных дифференциальных включений (характеристические комплексы) и через свойства стабильности относительно этих включений введено понятие его минимаксного решения.
Были даны различные способы определения минимаксного решения, в том числе, в инфинитезимальной форме, при помощи производных по направлениям, конусов касательных направлений, суб- и супердифференциалов, сопряженных производных и других средств негладкого анализа.
Развитые конструкции и методы минимаксного решения уравнений Гамильтона-Якоби оказались естественным образом связанными с широким кругом разнообразных задач современной теории динамических систем и математической физики. В частности, определение минимаксного решения можно интерпретировать (см. [169, 292]) как естественное обобщение классического метода характеристик Коши. Отметим в этой связи, что метод характеристик является одним из основных способов конструктивного исследования и построения решений уравнений с частными производными. Обобщения этого метода применительно к различным задачам рассматривались в работах многих авторов (см., например, [103, 126, 127, 175, 208, 215, 222, 226, 281, 283]). Условия стабильности минимаксного решения по отношению к характеристическим дифференциальным включениям можно переписать (см. [169]) в терминах слабой инвариантности его надграфика и подграфика относительно этих включений. Слабо и сильно инвариантные множества и их приложения изучались, например, в работах [37, 100, 135, 207, 223, 226, 248, 264, 271].
В теории минимаксных решений уравнений с частными производными первого порядка доказаны достаточно общие теоремы существования, единственности и непрерывной зависимости решения от начальных данных (обзор результатов можно найти в [168, 169]). Обоснована содержательность понятия минимаксного решения. В частности, показано, что минимаксное решение определяет функцию цены в обобщенной позиционной дифференциальной игре для характеристических комплексов. Разработаны конструктивные и численные методы построения минимаксных решений, в том числе - итерационные и сеточные методы (см. [135, 173, 176, 177]). В приложении к задачам управления и дифференциальных игр отличительная особенность данных методов состоит в том, что они не только направлены на построение функции цены (как минимаксного решения соответствующего уравнения Айзекса-Беллмана), но и на эффективное построение соответствующих оптимальных стратегий управления. В этой связи отметим также работы [24, 33, 66, 67, 78, 84, 146, 184186, 260, 262, 263]. Результаты теории минимаксных решений активно развиваются и применяются в приложении к различным задачам во многих работах (см., например, [29, 30, 34, 51, 102, 145, 174, 175, 293]).
Отдельно отметим, что именно в рамках теории минимаксных решений был доказан принципиальный для современной теории обобщенных решений уравнений в частных производных первого порядка факт эквивалентности понятий вязкостного и минимаксного решений (см. [168]).
Таким образом в настоящее время можно говорить о единой теории обобщенных решений уравнений Гамильтона-Якоби, которая имеет прочные связи со многими областями математики и механики и многочисленные приложения в различных прикладных задачах. Инициированная актуальными проблемами теории управления и математической физики, она в свою очередь во многом способствовала существенному продвижению в развитии адекватного математического аппарата и создании единообразных методов и подходов для их корректного исследования и эффективного решения.
Возвращаясь к непосредственной тематике представляемой диссертации, заметим, что упомянутые выше результаты этой теории в части приложения к экстремальным задачам в динамических системах касаются, в основном, тех систем, движение которых описывается обыкновенными дифференциальными уравнениями. Принципиальным свойством таких систем является то, что их поведение в будущем однозначно определяется их текущим мгновенным состоянием и никак не зависит от их поведения в прошлом, то есть от того, каким образом сложилось данное текущее состояние.
Однако многие реальные процессы протекают согласно более сложным закономерностям, когда будущее зависит не только от настоящего, но и от прошлого. Математическое моделирование таких процессов приводит к понятию наследственных динамических систем, движение которых описывается при помощи дифференциальных уравнений с последействием, называемых также уравнениями с запаздыванием, дифференциально-разностными или функционально-дифференциальными уравнениями.
Наследственная природа характерна, например, для процессов деформации упругопластичных материалов, процессов развития биологических сообществ,- процессов распространения эпидемий или последствий экологических катастроф. В химико-технологических и теплоэнергетических процессах, космонавтике имеют место транспортные, технологические и информационные запаздывания, учет которых также приводит к уравнениям с последействием. Аппарат дифференциальных уравнений с noследействием привлекается для описания экономических, социально- и эколого-экономических процессов и т.д. Соответствующие примеры и библиографию можно найти, например, в работах [1, 7, 11, 26, 35, 59, 122, 192, 209, 259]. К наследственным динамическим системам приводят исследования процессов с неполной и недостоверной информацией, которую приходится восстанавливать по наблюдаемой истории движения (см., например, [72, 79, 97]). Отметим также, что информацию об истории движения часто оказывается целесообразно использовать в цепи обратной связи для улучшения качества управления динамической системой (пусть даже исходно обыкновенной) (см. в этой связи [70, 80, 85, 93, 96, 138— 142, 196, 260]). Чтобы подчеркнуть это обстоятельство в настоящей работе используется термин дифференциальные системы (задачи управления, дифференциальные игры) с наследственной информацией.
Первые примеры дифференциальных уравнений с последействием были уже у Бернулли, Эйлера, Лапласа, позднее у Вольтера, но целенаправленное исследование таких уравнений началось в 1950-х годах и связано с именами H.H. Красовского, А.Д. Мышкиса, R. Bellman, K L. Cook, J.K. Hale. Большой вклад в становление и развитие качественной теории наследственных динамических систем внесли Н.В. Азбелев, Р.Ф. Габа-сов, A.M. Зверкин, Г.А. Каменский, Ф.М. Кириллова, В.Б. Колмановский, A.B. Кряжимский, А.Б. Куржанский, A.A. Мартынюк, В.М. Марченко, Г.И. Марчук, Ю.А. Митропольский, С.Б. Норкин, В.Р. Носов, Ю.С. Осипов, Б.С. Разумихин, А.Л. Скубачевский, С.Н. Шиманов, Г.Л. Харати-швили, Л.Э. Эльсгольц, Н.Т. Banks, Т.А. Burton, С. Corduneanu, M.С. Del-four, R.D. Driver, A. Halanay, H.J. Kushner, V. Lakshmikantham, V. Volterra, T. Yoshizawa и многие другие авторы (см., например, книги и обзорные статьи [1, 6, 17, 26, 27, 42, 44, 50, 54, 59, 63, 69, 121, 125, 132-134, 160, 165, 190, 192, 194, 205, 206, 210, 221, 227, 229, 237, 238, 249, 251, 257, 259, 268, 297] и библиографию к ним).
Эти исследования показали, что уравнения с последействием обладают существенными особенностями и к ним неприменимы напрямую результаты, полученные для обыкновенных дифференциальных уравнений. С другой стороны, было показано, что при должном осмыслении поведение наследственных систем можно характеризовать на основе методов и конструкций, во многом аналогичных наработанным в теории обыкновенных дифференциальных систем.
Принципиальным шагом в построении качественной теории наследственных динамических систем стал функциональный подход H.H. Кра-совского, предложившего [68, 69] рассматривать эволюцию таких систем в пространстве историй движения. Тогда можно перейти к описанию этих систем при помощи обыкновенных дифференциальных уравнений, но уже в подходящем функциональном фазовом пространстве. Такой подход позволил перенести на наследственные системы основные классические результаты теории устойчивости по Ляпунову [120]. Был развит второй метод Ляпунова с использованием в качестве функций Ляпунова подходящих функционалов от истории движения [68, 69]. Были разработаны способы построения квадратичных функционалов Ляпунова (см., например, [128, 161], а также [59, 297]). Была построена спектральная теория линейных систем с последействием [202, 203] (см. также [132, 192]), а на ее основе - и соответствующая теория устойчивости и стабилизации по линейному приближению [138, 139]. Эти и другие результаты, посвященные различным аспектам теории устойчивости для различных типов функционально-дифференциальных уравнений, развивались и обобщались в работах многих авторов (соответствующие обзоры и бнблиогра^ фию можно найти, например, в [54, 63, 125, 134, 160, 192, 194, 221, 229, 249, 259, 268]).
Функциональный подход к задачам управления движением наследственных динамических систем во многом способствовал эффективному построению стратегий с памятью, учитывающих в цепи обратной связи историю движения (см. [70], а также [6, 237, 259, 267] и многие другие работы). Задачи конфликтного управления системами с последействием рассматривались в работах [82, 96, 136, 250]. В том числе, в работах Ю.С. Осипова и его сотрудников (см., например, [91, 140-144]) для таких задач были развиты основные конструкции и результаты теории позиционных дифференциальных игр. Рассматривались также (см., например, [256]) вопросы, связанные с развитием для задач управления наследственными системами подходов и методов так называемой теории Н^ (см. для случая обыкновенных дифференциальных систем, например, [217]).
В рамках теории программного управления для дифференциальных систем с последействием исследовались необходимые условия оптимальности в форме принципа максимума Л.С. Понтрягина. Первые результаты в этом направлении были получены Г.Л. Харатишвили (см., например, [190], а также [156], разд. 27). В дальнейшем, принцип максимума и его обобщения были сформулированы и доказаны для различных классов задач оптимального управления с запаздыванием для систем как с гладкой, так и с негладкой динамикой (см. работы [9, 23, 25, 27, 130, 191, 210, 227, 247] и приведенную в них библиографию), а также, для систем, описываемых функционально-дифференциальными включениями (см., например, [131, 224, 282]).
Таким образом, построение единой теории обобщенных (минимаксных, вязкостных) решений уравнений Гамильтона-Якоби и эффективность ее приложения к исследованию экстремальных задач в обыкновенных дифференциальных системах - с одной стороны, и развитие качественной теории дифференциальных систем с последействием и их активное применение в математическом моделировании реальных эволюционных процессов - с другой, обусловили актуальность и подготовили необходимый фундамент для развития теории Гамильтона-Якоби в наследственных динамических системах. Требовалось осмыслить, какие уравнения являются для наследственных систем естественным аналогом обычных уравнений Гамильтона-Якоби, в какой форме эти уравнения могут быть записаны, что понимать под их решением, какую пользу из них можно извлечь. Эти вопросы и определили направление исследований, представленных в диссертации. Логика развития теории обобщенных решений уравнений Гамильтона-Якоби подсказывала искать ответы на них в изучении качественных свойств величины цены и соответствующих конструкций динамического программирования в задачах управления с наследственной информацией.
Первые результаты по методу динамического программирования в системах с последействием были получены в работе [70] и затем развиты в работах [6, 53, 54, 58, 237, 267, 288] (см. также библиографию к этим работам) для задач оптимального управления линейно-квадратичного типа, составляющих один из тех немногих классов задач теории оптимальных процессов, в которых функция цены (а для рассматриваемого случая систем с последействием - соответствующий функционал от истории движения) обладает подходящими свойствами гладкости. Обобщения этих результатов для задач оптимального управления с негладким функционалом цены рассматривались в работах [289, 296]. В исследованиях дифференциальных игр систем с последействием [82, 85, 91, 96, 140-143] были установлены нелокальные свойства и- и ^-стабильности функционала цены.
В перечисленных работах прослеживается два подхода к формализации принципов динамического программирования для наследственных систем и выводу соответствующих функциональных аналогов уравнений Гамильтона-Якоби-Айзекса-Беллмана. Один из них непосредственно опирается на переход к описанию наследственных динамических систем при помощи обыкновенных дифференциальных уравнений в подходящем функциональном фазовом пространстве, в которое укладываются возможные истории движения системы. Этот подход приводит к функциональным уравнениям Гамильтона-Якоби с частными производными Фре-ше. Такие уравнения изучались в связи с задачами оптимального управления бесконечномерными дифференциальными системами во многих работах (см., в частности, работы [211, 231-233, 272] и библиографию к ним). Эти исследования были в основном посвящены развитию соответствующей техники вязкостных решений. Приложения полученных в рамках этого направления результатов к задачам оптимального управления системами с последействием рассматривались в работе Н.М. Soner [289], а также в работах [253, 269]. В связи с обсуждаемым здесь подходом отметим работу P.R. Wolenski [296], в которой для экстремальных задач в наследственных динамических системах проведены достаточно подробные исследования качественных свойств функционала цены, и в том числе, получены необходимые и достаточные условия оптимальности в форме уравнения для нижних производных Дини этого функционала.
Следует однако заметить, что подход, основанный на описании эволюции историй движения наследственной системы посредством обыкновенных дифференциальных уравнений в функциональных пространствах, связан, с одной стороны, с сужением множества допустимых начальных историй до достаточно гладких функций, а с другой, наоборот - с подходящим расширением функционального фазового пространства до, например, суммируемых функций, что влечет определенную потерю общности и ограничивает область корректного применения данного подхода. Это отмечалось, например, в работе [40], посвященной методу функционалов Ляпунова, в работах [12,180] по локальным достаточным условиям выживания движений наследственных систем в функциональном множестве. Это видно из результатов работ [289, 296].
В диссертации последовательно развивается другой подход, восходящий к работам [68-70]. Он также опирается на функциональную интерпретацию наследственных динамических систем, но не использует явного перехода к их описанию при помощи обыкновенных дифференциальных уравнений в функциональном пространстве, что позволяет избежать упомянутых выше осложнений, связанных с таким переходом, и охватить более широкий класс систем и более широкий круг задач, включая задачи управления в условиях неконтролируемых помех или конфликта, рассматриваемые в теории дифференциальных игр. Этот подход основан на изучении свойств функционала цены при сдвиге вдоль возможных траекторий движения наследственной динамической системы. При выводе соответствующих такому подходу уравнений динамического программирования в форме Гамильтона-Якоби классический аппарат функциональных производных оказывается неудобным. Поэтому приходится рассматривать специальные понятия дифференцируемости функционалов от истории движения и использовать адекватные этим понятиям производные, такие как инвариантные и коинвариантные производные, используемые в работах A.B. Кима (см., например, [52-54, 257]), или, например, близкие к ним СНо-производные, введенные в недавней работе J.P. Aubin и G. Haddad [209]. Таким образом, данный подход приводит к новому классу функциональных уравнений типа Гамильтона-Якоби. Согласованность этого подхода с конструкциями теории дифференциальных игр систем с последействием позволяет естественным образом развить для таких уравнений теорию минимаксных решений.
Цель работы. Целью работы является построение теории минимаксных решений функциональных уравнений типа Гамильтона-Якоби с коинва-риантными производными и ее приложение к задачам управления наследственными динамическими системами, включая задачи управления в условиях неконтролируемых помех или конфликта. Методы исследования. Представленные в диссертации исследования опираются на подходы и методы из качественной теории дифференциальных уравнений, теории позиционных дифференциальных игр и теории обобщенных (минимаксных, вязкостных) решений дифференциальных уравнений с частными производными первого порядка в сочетании с подходящей функциональной трактовкой процесса управления в наследственных динамических системах. Используются результаты из функционального анализа, аппарат дифференциальных включений с последействием, конструкции негладкого анализа и аппарат инвариантного дифференциального исчисления функционалов.
Научная новизна. В работе в связи с вопросами формализации и обоснования для задач управления наследственными динамическими системами метода динамического программирования рассмотрен новый класс функциональных дифференциальных уравнений типа Гамильтона-Якоби с коинвариантными производными и развита теория обобщенных (минимаксных) решений таких уравнений: дано определение минимаксного решения через нелокальные свойства стабильности относительно подходящего семейства характеристических дифференциальных включений с последействием; обоснована согласованность данного понятия обобщенного решения с содержательным смыслом рассматриваемых уравнений и с определением их решения в классическом смысле; сформулированы и доказаны теоремы существования, единственности и непрерывной зависимости минимаксного решения от начальных данных для задач Коши с условием на правом конце; введено понятие производных функционала по многозначным направлениям и дано эквивалентное определение минимаксного решения, основанное на замене уравнения парой функциональных дифференциальных неравенств для таких производных; показано, что данные неравенства являются инфинитезимальной формой выражения свойств стабильности минимаксного решения; получены формулы производных по многозначным направлениям для кусочно коинвариант-но гладких функционалов, а также, для огибающих семейств коинвари-антно гладких функционалов и приведены соответствующие уточнения вида указанных неравенств в этих типичных для обобщенного решения случаях; показано также, что инвариантные суб- и суперградиенты минимаксного решения удовлетворяют неравенствам, определяющим его как вязкостное решение рассматриваемых уравнений.
Приведена формализация задачи управления динамическими системами с последействием в условиях неконтролируемых помех как дифференциальной игры с наследственной информацией. Функционал цены этой игры указывает оптимальный гарантированный результат управления, достижимый в классе стратегий с памятью - детерминированных функций истории движения. Показано, что если этот функционал оказывается коинвариантно гладким, то он удовлетворяет уравнению типа Гамильтона-Якоби-Айзекса-Беллмана с коинвариантными производными, причем соответствующие стратегии экстремального прицеливания в направлении его коинвариантного градиента являются оптимальными. В общем случае показано, что функционал цены совпадает с минимаксным решением данного уравнения и развиты соответствующие методы построения по этому решению оптимальных стратегий управления: метод экстремалыюго прицеливания в направлении коинвариантных градиентов вспомогательных функционалов типа Ляпунова, подходящие модификации метода экстремального прицеливания на стабильные мосты и метода экстремального сдвига на сопутствующие точки.
Как следствие этих результатов, установлено существование цены и седловой точки в дифференциальной игре с наследственной информацией, получены новые условия оптимальности в задачах управления наследственными системами, в том числе - инфинитезимальные критерии и- и ^-стабильности негладких функционалов, определяемые дифференциальными неравенствами для их производных по многозначным направлениям и эффективно проверяемые в указанных выше типичных случаях.
По аналогии с положениями теории динамических систем, описываемых обыкновенными дифференциальными уравнениями, полученные результаты дают основание заключить, что рассмотренный класс функциональных дифференциальных уравнений с коинвариантными производными естественно трактовать как обобщение уравнения Гамильтона-Якоби для наследственных динамических систем.
Теоретическая и практическая ценность. Работа носит теоретический характер. Развитый в ней математический аппарат и полученные результаты открывают перспективы эффективного исследования экстремальных задач в наследственных динамических системах и дальнейшего развития теории минимаксных решений для новых типов функциональных дифференциальных уравнений. Эти результаты могут также быть положены в основу анализа конкретных задач управления эволюционными системами с последействием, они могут служить фундаментом для разработки и обоснования алгоритмов построения управлений, разрешающих эти задачи.
Апробация работы. Результаты диссертации обсуждались на семинарах отдела динамических систем Института математики и механики Уральского отделения РАН,'расширенных семинарах кафедры теоретической механики Уральского государственного университета; докладывались на заседаниях Ученого совета Института математики и механики УрО РАН, на научной сессии общего собрания Уральского отделения РАН (Екатеринбург, 2002); представлялись в докладах на всероссийских и международных конференциях по теории дифференциальных уравнений, динамической оптимизации и их приложениям к задачам механики, оптимального управления и дифференциальных игр, в том числе - на международной конференции, посвященной 90-летию со дня рождения JI.C. Понтрягина (Москва, 1998), IFAC International Conference"Nonsmooth and Discontinuous Problems of Control and Optimization" (Челябинск, 1998), 11-th IFAC International Workshop "Control Applications of Optimization" (Санкт-Петербург, 2000), 10-th International Symposium "Dynamic Games and Applications" (Санкт-Петербург, 2002), IFAC International Workshop "Time-Delay Systems" (INRIA, Rocquencourt, France, 2003), на Всероссийской конференции "Алгоритмический анализ неустойчивых задач" (Екатеринбург, 2004).
Публикации. Основной материал диссертации опубликован в работах [81, 110-113, 115-119, 276-280]. Работы автора [80, 105-109, 114, 275] не вошли в диссертацию, но имеют к ней непосредственное отношение. Структура, объем и краткое содержание работы. Диссертационная работа состоит из настоящего введения, четырех глав, объединяющих семнадцать разделов, приложения и списка литературы. Общий объем диссертации составляет 239 страниц, библиографический список включает 297 наименований, иллюстративный материал насчитывает 14 рисунков. Нумерация разделов сквозная. Нумерация формул двойная: в первой позиции указывается номер раздела, в котором приведена формула, во второй - порядковый номер формулы в этом разделе. Такая же нумерация принята для определений, утверждений, лемм, теорем, следствий, замечаний, примеров и рисунков. Нумерация условий тройная: в первой позиции указывается заглавная буква латинского алфавита, закрепленная за рассматриваемой группой условий, во второй - номер раздела, в котором приведена эта группа условий, в третьей - порядковый номер условия в группе. Все используемые обозначения объяснены в тексте работы там, где впервые встречаются.
В приложение вынесены используемые в работе результаты, касающиеся вопросов существования, единственности и непрерывной зависимости от начальных данных решений дифференциальных уравнений и дифференциальных включений с последействием. Эти, вообще говоря, известные факты получаются, например, путем естественного развития (в соответствии с [95, 179, 192]) конструкций и построений, используемых при обосновании аналогичных утверждений для обыкновенных дифференциальных систем (см., например, [19, 187]).
1. Азбелев, Н.В. Введение в теорию функционально-дифференциальных уравнений / Н.В. Азбелев, В.П. Максимов, Л.Ф. Рахматуллина.-М.: Наука, 1991. 280с.
2. Альбрехт, Э.Г. Построение приближенных решений некоторых квазилинейных дифференциальных игр / Э . Г . Альбрехт / / Тр. Института математики и механики УрО РАН, 2000. Т.6. J^ Г^ 1. 27-38.
3. Ананьев, Б.И. О двойственности задач оптимального наблюдения и управления для линейных систем с запаздыванием / Б.И. Ананьев / / Дглфференц. уравнения, гйП. ТЛО. т. 1960-1967.
4. Андреева, Е.А. Управление системами с последействием / Е.А. Ан- ^ дреева, В.Б. Колмановский, Л.Е. Шайхет.- М.: Наука, 1992. 336с.
5. Андреева, Е.А. Численный метод обучения искусственных нейронных сетей с учетом запаздывания / Е.А. Андреева, Ю.А, Пустар-накова / / Журнал выч. матем. и матем. физики, 2002. Т.42. J\^9. 1436-1444.
6. Арнольд, В.И. Математические методы классической механики / В.И. Арнольд.- М.: Наука, 1974.
7. Арутюнов, А.В. К теории принципа максимума в задачах с запазды- /j^* ванием / А.В. Арутюнов, М.Дж. Марданов / / Дифференц. уравнения, 1989. Т.25. №12. 2048-2058.
8. Бабский, В.Г. Математические модели в биологии, связанные с учетом последействия / В.Г. Бабский, А.Д. Мышкмс / / В кн. Мар-ри Дж.: Нелинейные дифференциальные уравнения в биологии.-М.: Мир, 1983. 383-394.
9. Баранов, В.Н. Достаточные условия локальной выживаемости для систем с последействием / В.Н. Баранов / / Дифференц. уравнения^ 2003. Т.39. №6. 858.
10. Бахвалов, Н.С. Осреднение процессов в периодических средах / Н.С. Бахвалов.- М.: Наука, 1984.
11. Батухтин, В.Д. Экстремальное прицеливание в нелинейной игре сближения / В.Д. Батухтин / / Доклады АН СССР, 1972. Т.207. №1. 11-14.
12. Беллман, P. Дифференциально-разностные уравнения / P. Беллман, К.Л. Кук.- М.: Мир, 1967. 548с. = Bellman, R. Differential-Difference Equations /R. Bellman, K.L. Cooke.-New York: Academic Press, 1963.
13. Бердышев, Ю.И. Качественный анализ областей достижимо- ''Щ сти / Ю.И. Бердышев / / Космические исследования, 1996. Т.34. №2. 141-144.
14. Благодатских, В.И. Дифференциальные включения и оптимальное управление / В.И. Благодатских, А.Ф. Филиппов / / Тр. МИАН им. В.А.Стеклова, 1985. Т.169. 194-252.
15. Болтянский, В.Г. Математические методы оптимального управления / В.Г. Болтянский.- М.: Наука, 1966. 308с. *
16. Брайсон, А. Прикладная теория оптимального управления / A. Брайсон , Ю-Ши Хо.- М.: Мир, 1972. 544с. = Bryson, А.Е. Applied optimal control / А.Е. Bryson, Yu-Chi Но.-1.ondon: Blaisdell Publishing Company, 1969.
17. Брыкалов, C.A. Непрерывная обратная связь в задачах конфликтного управления / А. Брыкалов / / Доклады РАН, 2001. Т.376. №4. 442-444.
18. Варга, Дж. Оптимальное управление дифференциальными и функциональными уравнениями / Дж, Варга.- М.: Наука, 1977. б24с. = Warga, J. Optimal control of differential and functional equations / J. Warga.- New York: Academic Press, 1972.
19. Вахрушев, В.А. О вычислительной реализации процедур управления с поводырем / В.А, Вахрушев, В.Н. Ушаков / / Прикладная математика и механика, 2002, Т.66. Вып. 2. 228-238,
20. Эежбищсий, А. Принцип максимума для процессов с нетривиальным запаздыванием управления / А, Вежбицкий / / Автоматика и телемеханика, 1970. №10. 13-20.
21. Вольтерра, В. Математическая теория борьбы за существование / B. Вольтерра.- М.: Наука, 1976. 286с. = Volterra, V. Theorie Mathematique de la Lutte poir la Vie / V. Volterra.-Paris: Gauthier-Villars, 1931.
22. Габасов, Р.Ф. Качественная теория оптимальных процессов / Р.Ф, Габасов, Ф,М. Кириллова.- М.: Наука, 1971. 508с.
23. Гамкрелидзе, Р.В, Основы оптимального управления / Р,В, Гамкре- лидзе,- Тбилиси: Изд-во Тбилисского университета, 1975, 256с.
24. Гарнышева, Г.Г. Стратегии минимаксного прицеливания в направлении квазиградиента / Г.Г. Гарнышева, А.И, Субботин / / Прикладная математика и механика, 1994, Т, 58. Вып. 4. 5-11.
25. Гарнышева, Г.Г. Субоптимальные универсальные стратегии в игровой задаче быстродействия / Г.Г. Гарнышева, А,И. Субботин / / Прикладная математика и механика, 1995, Т, 59. Вып. 5, С, 707-713,
26. Гельфанд, И.М. Некоторые задачи теории квазилинейных уравне- ний/И.М. Гельфанд//Успехи матем. наук, 1959. Т.14. №2. 87-158.
27. Годунов, К. Уравнения математической физики / К. Годунов.- М.: Наука, 1979. 392с.
28. Гурецкий, X. Анализ и синтез систем управления с запаздыванием I X. Гурецкий.- М.: Машиностроение, 1974. 328с. = Gorecki, Н. Analiza ъ synteza ukladow regulacji z opoznieniem / H. GorecH.-Waxszawa: Wydawnictwa Naukowo-Techniczne, 1970.
29. Гусев, М.И. К оптимизации управляемых систем при наличии огра- •^ ничений. I, II / М.И. Гусев, А.Б. Куржанский / / Дифференц. уравнения, 1971. Т.7. K 9^. 1591-1602; №10. 1789-1800.
30. Гусейнов, Х.Г. Производные многозначных отображений и их применение в игровых задачах управления / Х.Г. Гусейнов, А.И. Субботин, В.Н. Ушаков / / Проблемы управления и теории информации, 1985. Т.14. №3. 1-14.
31. Гусятников, П.Б. Теория дифференциальных игр / П.В. Гусятников,- М.: Изд-во МФТИ, 1982. 99с. , 39. Демьянов, В.Ф. Основы негладкого анализа и квазидифференциалъ-^' ное исчисление / В.Ф. Демьянов, A.M. Рубинов.- М.: Наука, 1990. 432с.
32. Долгий, Ю.Ф. Метод функционалов Ляпунова для систем с последействием / Ю.Ф. Долгий, А.В. Ким / / Дифференц. уравнения, 1991. Т.27. №8. 1313-1318. ^
33. Дубовицкий, А.Я. Необходимые условия слабого экстремума в общей задаче оптимального управления / А.Я. Дубовицкий, А.А. Милютин.- М.: Наука, 1971.
34. Жаутыков, О.А. Дифференциальные игры нескольких лиц / О.А. Жаутыков, В.И. Жуковский, Жаркынбаев.- Алма-Ата: Наука, 1988. 320с.
35. Завлищин, СТ. Импулсные процессы: модели и прилооюения / СТ. Завлищин, А.Н. Сесекин.- М.: Наука, 1991. 25бс.
36. Зверкин, A.M. Дифференциальные уравнения с отклоняющимся аргументом / A.M. Зверкин / / В кн.: Пятая летняя математическая школа- Киев: Ин-т математики АН УССР, 1968. С 307-399.
37. Зеликин, М.И. Оптимальное управление и вариационное исчисление I М.И. Зеликин.- М,: Изд-во Московского университета, 1985.
38. Зубов, В.И. Лекции по теории управления J В.И. Зубов.- М.: Наука, 1975.496с.
39. Ильин, A.M. Согласование асимптотических разлооюений решений краевых задач / A.M. Ильин.- М.: Наука, 1989. ЗЗбс.
40. Ильин, A.M. Линейные уравнения второго порядка параболического типа / A.M. Ильин, А.С Калашников, О.А. Олейник / / Успехи матем. наук, 1962. Т. 17. №3. 3-146.
41. Иоффе, А.Д. Теория экстремальных задач /А.Д, Иоффе, В.М. Тихомиров.- М.: Наука, 1974. 480с.
42. Каменский, Г.А. Линейные краевые задачи для дифференциально- разностных уравнений / Г.А. Каменский, А.Л. Скубачевский.-Щ и.: МАИ, 1992.
43. Камнева, Л.В. Достаточные условия стабильности для функции цены дифференциальной игры в терминах сингулярных точек / Л.В. Камнева / / Прикладная математика и механика, 2003. Т. 67. Вып. 3. 366-383.
44. Ким, А.В. Ко второму методу Ляпунова для систем с последействием / А.В. Ким / / Дифференц. уравнения, 1985. Т.21. №3. 385-391.
45. Ким, А.В. Об уравнении Беллмана для систем с последействием / А.В. Ким / / Изв. АН СССР: Техн. кибернетика, 1991, №2. 54-69.
46. Ким, А.В. i-Гладкий анализ и функционалъно-дифференциалъные уравнения / А.В. Ким.- Екатеринбург: Изд-во УрО РАН, 1996. 234с.
47. Ким, А.В. О применении г-гладкого анализа к разработке численных методов решения функционально-дифференциальных уравнений / А.В. Ким, В.Г. Пименов / / Тр. Института математики и механики УрО РАН, 1998. Т.5. 104-126.
48. Кларк, Ф. Оптимизация и негладкий анализ / Ф. Кларк.- М.: Наука, 1988. 280с. = Clarke, F.H. Optimization and nonthmooth analysis / F.H. Clarke.- New York ets. 1983.
49. Клейменов, А.Ф. Неантагонистические позиционные дифференциальные игры I А.Ф. Клейменов.- Екатеринбург: Наука, 1993. 185с.
50. Колмановский, В.Б. О синтезе билинейных систем с запаздыванием в управлении / В.Б. Колмановский, Н.И. Королева / / Прикладная математика и механика, 1989. Т.53. Вып.2. 238-243.
51. Колмановский, В.Б. Устойчивостъ и периодические реэюимы регулируемых систем с последействием / В.Б. Колмановский, В.Р. Носов,- М.: Наука, 1981. 448с.
52. Колмогоров, А.Н. Элементы теории функций и функционального анализа J А.Н. Колмогоров, СВ. Фомин.- М.: Наука, 1972. 496с.
53. Колокольцов, В.Н. Идемпотентный анализ и его применения в оптимальном управлении / В.Н. Колокольцов, В.П. Маслов.- М.: Наука, 1994.
54. Кононенко, А.Ф. Структура оптимальной стратегии в динамических управляемых системах / А.Ф. Кононенко / / Журнал вычисл. ма-тем. и матем. физики, 1980. Т.20. №5. 1105-1116.
55. Красовский, А.Н. Управление на минимакс интегрального функционала / А.Н. Красовский / / Доклады АН СССР, 1991. Т.320. Я^4. 785-788.
56. Красовский, Н.Н. О применении второго метода A.M. Ляпунова для уравнений с запаздываниями времени / Н . Н . Красовский / / Прикладная математика и механика, 1956. Т.20. Вып.З. 315->327.
57. Красовский, Н.Н. Некоторые задачи теории устойчивости двиоюе- ния / Н.Н. Красовский.- М.: Физматгиз, 1959. 211с.
58. Красовский, Н.Н. Об аналитическом конструировании оптимального регулятора в системе с запаздываниями времени /Н.Н. Красовский// Прикладная математика и механика, 1962. Т.26. Вып.1, 39-51.
59. Красовский Н.Н. Об одной задаче преследования / Н.Н. Красовский// Прикладная математика и механика, 1963. Т.27. Вып.2. 244-254.
60. Красовский, Н.Н. Теория управления двиэюением / Н.Н. Красовский.- М.: Наука, 1968. 476с.
61. Красовский, Н.Н. Игровые задачи о встрече двиоюений / Н.Н. Красовский.- М.: Наука, 1970. 420с.
62. Красовский, Н.Н. Экстремальное управление в нелинейной позиционной дифференциальной игре / Н . Н . Красовский / / Доклады АН СССР, 1972. Т. 203. ^^ 3. 520-523.
63. Красовский, Н.Н. Дифференциальная игра сближения-уклонения. I, П / Н.Н. Красовский / / Изв. АН СССР: Техн. кибернетика, 1973. № 2. 3-18; № 3. 22-42.
64. Красовский, Н.Н. К задаче унификации дифференциальных игр / Н.Н. Красовский / / Доклады АН СССР, 1976. Т. 226. Я^ 6. 1260-1263.
65. Красовский, Н.Н. Игровое управление в дифференциальных эволюционных системах / Н.Н. Красовский / / Доклады АН СССР, 1976. Т. 227. № 5. 1049-1052.
66. Красовский, Н.Н. Управление динамической системой / Н . Н . Красовский.- М.: Наука, 1985. 516с.
67. Красовский, Н.Н. К вопросу о наблюдаемости систем с запаздыванием / Н.Н. Красовский, А.Б. Куржанский / / Дифференц. уравнения, 1966. Т.2. т. 298-308.
68. Красовский, Н.Н. Задача конфликтного управления с наследственной информацией / Н.Н. Красовский, Н.Ю. Лукоянов / / Прикладная математика и механика, 1996. Т.60. Вып.6. 885-900.
69. Красовский, Н.Н. Уравнения типа Гамильтона-Якоби в наследственных системах: минимаксные решения / Н.Н. Красовский, Н.Ю. Лукоянов / / Тр. Института математики и механики УрО РАН, 2000. Т.е. т. с. iio-i3o.
70. Красовский, Н.Н. Линейные дифференциально-разностные игры / Н.Н. Красовский, Ю.С. Осипов / / Доклады АН СССР, 1971. Т.197. №4. 777-780.
71. Красовский Н.Н. О некоторых игровых ситуациях в теории управляемых систем / Н.Н. Красовский, Ю.М. Репин, В.Е. Третьяков / / Изв. АН СССР: Техн. кибернетика, 1965. № 4. 3-13.
72. Красовский, Н.Н. О программном синтезе гарантирующего управления / Н.Н. Красовский, Т.Н. Решетова / / Проблемы управления и теории информации, 1988. Т. 17. №6. 1-11.
73. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н, Красовский, А.И. Субботин.- М.: Наука, 1974. 456с.
74. Красовский, Н.Н. Стохастический программный синтез для позиционной дифференциальной игры/Н.Н. Красовский, В.Е, Третьяков// Доклады АН СССР, 1981. Т.259. №1. 24-27.
75. Кротов , В.Ф. Методы и задачи оптимального управления / В.Ф. Кротов , В .И. Г урман . - М.: Наука , 1973. 448с.
76. Кружков, Н. Обобщенные решения нелинейных уравнений первого порядка со многими независимыми переменными / Н. Кружков / / ^ Матем. сборник, 1966. Т.70. К'-З. 394-415.
77. Кружков, Н. Обобщенные решения уравнений Гамильтона-Якоби типа эйконала / Н. Кружков / / Матем. сборник, 1975. Т.98. №3. 450-493.
78. КряжимскиЙ, А.В. К теории позиционных дифференциальных игр сближения-уклонения / А . В . КряжимскиЙ / / Доклады АН СССР, 1978. Т.239. K^ 4. 779-782.
79. КряжимскиЙ, А .В . Дифференциально-разностная игра сближения с функциональным целевым множеством / А .В . КряжимскиЙ , <jif. Ю.С. Осипов / / Прикладная математика и механика, 1973. Т.37. Вьш.1.
80. КряжимскиЙ, А.В. О позиционном моделировании управления в динамических системах / А.В. КряжимскиЙ, Ю.С. Осипов / / Изв. АН СССР: Техн. кибернетика, 1983. JV 2^. 51-60.
81. Куржанский , А . Б . О существовании решений уравнений с последействием / А .Б . Куржанский / / Дифференц. уравнения, 1970. Т .6 . Я^10. 1800-1809.
82. Куржанский, А.Б. Дифференциальные игры сближения в системах с запаздыванием / А.Б, Куржанский / / Дифференц. уравнения, 1971. Т.7. №8.
83. Куржанский, А.Б. Управление и наблюдение в условиях неопределенности / А.Б. Куржанский.- М.: Наука, 1977. 392с.
84. Куржанский, А.Б. Эволюционные уравнения для пучков траекторий синтезированных систем управления / А.Б. Куржанский, О.И. Никонов / / Доклады РАН, 1993. Т.ЗЗЗ. №5.
85. Куржанский, А.Б. Метод динамического программирования в обратных задачах оценивания для распределенных систем / А.Б. Куржанский, И.Ф. Сивергина / / Доклады РАН, 1998. Т.369. №2. 161-166.
86. Куржанский, А.Б. Об описании множества выживающих траекторий дифференциального включения/А.Б. Куржанский, Т.Ф. Филиппова// Доклады АН СССР, 1986. Т.289. X^l. 38-41.
87. Ладыженская, О.А. Линейные и квазилинейные уравнения параболического типа I О.А. Ладыженская, В.А. Солонников, Н.Н. Ураль-цева.- М.: Наука, 1967.
88. Лахтин, А.С. Мйогозначные решения уравнений с частными производными первого порядка / А.С. Лахтин, А.И. Субботин / / Матем. сборник, 1998. Т. 189. №6. 33-58.
89. Ледяев, Ю.С. Экстремальные задачи в теории дифференциальных игр / Ю.С. Ледяев, Е.Ф. Мищенко / / Тр. МИАН им. В.А.Стеклова, 1988. Т.85. 147-170.
90. Лейтман, Дж. Введение в теорию оптимального управления / Дж. Лейтман.- М.: Наука, 1968. 190с. = 1.eitmann, G. An Introduction to Optimal Control / G. Leitmann.- New York: McGraw-Hill, 1966.
91. Лукоянов, Н.Ю. Об одной дифференциальной игре с интегральным критерием качества / Н.Ю. Лукоянов / / Дифференц. уравнения, 1994. Т.ЗО. №11. 1905-1913.
92. Лукоянов, Н.Ю. О задаче конфликтного управления при смешанных ограничениях на управляющие воздействия /Н.Ю. Лукоянов// Дифференц. уравнения, 1995. Т.31. №9. 1473-1482.
93. Лукоянов, Н.Ю. К задаче конфликтного управления при смешанных ограничениях / Н.Ю. Лукоянов / / Прикладная математика и механика, 1995. Т.59. Вьш.6. 995-964.
94. Лукоянов, Н.Ю. Одна дифференциальная игра с нетерминальной платой / Н.Ю. Лукоянов / / Изв. РАН: Теория и Системы управления, 1997. №1. 85-90.
95. Лукоянов, Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала /Н .Ю. Лукоянов / / Прикладная математика и механика, 1998. Т.62. Вып.2. 188-198.
96. Лукоянов, Н.Ю. Минимаксное решение уравнений Гамильтона- Якоби для наследственных систем / Н.Ю. Лукоянов / / Доклады РАН, 2000. Т.371. JV^ 2. 163-166.
97. Лукоянов, Н.Ю. Функциональные уравнения типа Гамильтона-Якоби и дифференциальные игры с наследственной информацией / Н.Ю. Дукоянов //Докл^ РАН, 2000. Т.371. >Г«4. G. 457-461.
98. Лукоянов, Н.Ю. Об уравнении типа Гамильтона-Якоби в задачах управления с наследственной информацией / Н.Ю. Лукоянов / / Прикладная математика и механика, 2000. Т.64. Вып.2. 252-263.
99. Лукоянов, Н.Ю. Об обобш,ениях уравнения Гамильтона-Якоби для наследственных систем / Н.Ю. Лукоянов / / Изв. УрГУ: Математика и механика, 2000. Вып.З. №18. 109-130.
100. Лукоянов, Н.Ю. О построении цены позиционной дифференциальной игры / Н.Ю. Лукоянов / / Дифференц. уравнения, 2001. Т.37. №1. 18-26.
101. Лукоянов, Н.Ю. Минимаксное решение функциональных уравнений типа Гамильтона-Якоби для наследственных систем / Н . Ю . Лукоянов / / Дифференц. уравнения, 2001. Т.37. №2. 228-237.
102. Лукоянов, Н.Ю. О свойствах функционала цены дифференциальной игры с наследственной информацией / Н . Ю . Лукоянов / / Прикладная математика и механика, 2001. Т.65. Вып.З. 375-384.
103. Лукоянов, Н.Ю. Об экстремальном прицеливании в задачах управления системами с последействием / Н.Ю. Лукоянов / / Изв. УрГУ: Математика и механика, 2003. Вып.5. i^ Г^ 26. 115-123.
104. Лукоянов, Н.Ю. Стратегии прицеливания в направлении инвариантных градиентов / Н.Ю. Лукоянов / / Прикладная математика и механика, 2004. Т.68. Вып.4. 629-643.
105. Лукоянов, Н.Ю. Задачи конфликтного управления функциональными системами высокой размерности / Н.Ю. Лукоянов, Т.Н. Ре-шетова// Прикладная математика и механика, 1998. Т.62. Вып.4. 586-597.
106. Ляпунов, A.M. Общая задача об устойчивости двиоюения / A.M. Ляпунов.- М.-Л.: ОНТИ, 1935.
107. Максимов, В.И. Задачи динамического восстановления входов бесконечномерных систем / В.И. Максимов.- Екатеринбург: Изд-во УрО РАН, 2000.305с.
108. Марчук, Г.И. Математические модели в иммунологии / Г.И. Мар- чук.- М.: Наука, 1980. 264с.
109. Маслов, В,П. Существование и единственность решений стационарных уравнений Гамильтона-Якоби и Беллмана, Новый подход / В.П, Маслов, Н. Самборский / / Доклады РАН, 1992. Т.324. №6. 1143-1148.
110. Матвеев, А.С. Абстрактная теория оптимального управления / А.С. Матвеев, В.А. Якубович.- Санкт-Петербург: Изд-во Санкт-Петербурского госуниверситета, 1994. 363с.
111. Матросов, В.М. Метод векторных функций Ляпунова в анализе сложных систем с распределенными параметрами (обзор) / В.М. Матросов / / Автоматика и телемеханика, 1973. №1. 5-22.
112. Меликян, А.А. Сингулярные характеристики уравнений в частных производных первого порядка / А.А. Меликян / / Доклады РАН, 1996. Т.351, №1. 24-28.
113. Меликян, А.А. Уравнения распространения слабого разрыва решения вариационной задачи / А.А. Меликян / / Тр. Института математики и механики УрО РАН, 2000. Т.6. №2. 446-459.
114. Мильштейн, Г.Н. Строго положительные функционалы Ляпунова для линейных систем с последействием / Г . Н , Мильштейн / / Диф-ференц. уравнения, 1987. Т.23, №12. 2051-2060.
115. Миш,енко, Е.Ф. Задачи преследования и уклонения от встречи в тео- 1^ рии дифференциальных игр / Е.Ф. Мищенко / / Изв. АН СССР: Техн. кибернетика, 1971. №5. 3-9.
116. Мордухович, Б.Ш. Методы аппроксимации в задачах оптимизации и управления / Б.Ш. Мордухович.- М.: Наука, 1988. ЗбОс.
117. Мышкис, А.Д. О некоторых проблемах теории дифференциальных уравнений с отклоняюш,имся аргументом / А.Д. Мышкис / / Успехи матем. наук, 1977. Т.32. №2. 174-202.
118. Мышкис, А.Д. Состояние и проблемы теории дифференциальных уравнений с отклоняюш,имся аргументом / А.Д. Мышкис, Л.Э. Эль-сгольц / / Успехи матем. наук, 1967. Т.22. J{s2. 21-57.
119. Незнахин, А.А. Сеточный метод приближенного построения ядра вы- "^ живаемости для дифференциального включения / А.А. Незнахин, В.Н. Ушаков / / Журн. выч. матем. и матем. физики, 2001. Т.41. №6. 895-908.
120. Никольский, М.С. Линейные дифференциальные игры преследования при наличии запаздывания / М.С. Никольский / / Доклады АН СССР, 1971. Т.197. №5. 1018-1021.
121. Олейник, О.А. Разрывные решения нелинейных дифференциальных уравнений / О.А. Олейник / / Успехи матем. наук, 1957. Т.12. №3. 3-73.
122. Осипов, Ю.С. Стабилизация управляемых систем с запаздыванием / Ю.С. Осипов / / Дифференц. уравнения, 1965. Т.1. №5. 463-473.
123. Осипов, Ю.С. О принципах сведения в критических случаях устойчивости движения систем с запаздыванием времени /Ю.С. Осипов// ^ Прикладная математика и механика, 1965. Т.29. Вып.5. 810-820.
124. Осипов, Ю.С. Дифференциальные игры систем с последействием / Ю.С. Осипов / / Доклды АН СССР, 1971. Т.196. K 4^. 779-782.
125. Осипов, Ю.С. К теории дифференциальных игр систем с последействием / Ю.С. Осипов / / Прикладная математика и механика, 1971. Т.35. Вып.5.
127. Осипов, Ю.С. К теории дифференциальных игр в системах с рас- г^^ пределенными параметрами / Ю.С. Осипов / / Доклады АН СССР, 1975. Т.223. №6. 1314-1317.
128. Осипов, Ю.С. К теории дифференциальных игр в системах с последействием / Ю.С. Осипов, В.Г. Пименов / / Прикладная математика и механика, 1978. Т.42. Вып.6. 963-977.
129. Пахотинских, В.Ю. Конструирование стабильных мостов в дифференциальных играх с фазовыми ограничениями / В.Ю. Пахотинских, А.А. Успенский, В.Н. Ушаков / / Прикладная математика и механика, 2003. Т.67. Вьш.5. 771-783.
130. Пацко, B.C. Численное решение дифференциальных игр на плоскости I B.C. Пацко, В.Л. Турова.- Препринт. Екатеринбург: Изд-во УрО РАН, 1995. 77с.
131. Петров, Н.Н. О существовании значения игры преследования / Н.Н. Петров / / Доклады АН СССР, 1970. Т.190. K 6^. 621-624.
132. Петров, Н.Н. Теория игр / Н.Н. Петров.- Ижевск: Изд-во Удмуртского госуниверситета, 1997. 196с. ;^ ^
133. Петросян, Л.А. Дифференциальные игры преследования / Л.А. Пет- росян.- Л.: Изд-во Ленинградского госуниверситета, 1977. 222с.
134. Пименов, В.Г. Функционально-дифференциальные уравнения: численные методы / В.Г. Пименов.- Екатеринбург: Изд-во Уральского госуниверситета, 1998. 80с.
135. Половинкин, Е.С. Об одном подходе к дифференцированию многозначных отображений и необходимые условия оптимальности решений дифференциальных включений / Е.С. Половинкин, Г.В. Смирнов / / Дифференц. уравнения, 1986. Т.22. Л*^ 6. 944-954.
136. Поляк, Б.Т. Введение в оптимизацию /Б.Т.Поляк.- М.:Наука,1983.
137. Понтрягин, Л.С. К теории дифференциальных игр / Л.С. Понтрягин / / Успехи матем. нук, 1996. Т.21. JV^ 4. 219-274.
138. Понтрягин, Л.С. О линейных дифференциальных играх, 1. 2 / Л.С. Понтрягин / / Доклады АН СССР, 1967. Т. 174. №6. 1278-1280; Д;175. №4. 764-766.
139. Понтрягин, Л.С. Математическая теория оптимальных процессов и дифференциальных игр / Л.С. Понтрягин / / Тр. МИАН им. В.А.Стеклова, 1985. Т.169. 119-157.
140. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко.- М.: Наука, 1961. 392с.
141. Пшеничный, Б.Н. Структура дифференциальных игр / Б.Н. Пшеничный / / Доклады АН СССР, 1969. Т.184. Я^2. 185-287.
142. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный.- М.: Наука, 1980. 319с.
143. Пшеничный, В.И. Необходимые условия экстремума / Б.Н. Пшеничный.- М.: Наука, 1982. 144с.
144. Разумихин, Б.С. Устойчивость эредитарных систем / Б.С. Разу- михин.- М.: Наука, 1988.
145. Репин, Ю.М. Квадратичные функционалы Ляпунова для систем с запаздыванием / Ю.М. Репин / / Прикладная математика и механика, 1965. Т.29. 564-566. i^ ^
146. Рождественский, Б.Л. Системы квазилинейных уравнений и их при- лооюения к газовой динамике / Б.Л. Рождественский, Н.Н. Яненко.-М.: Наука, 1978. 688с.
147. Рокафеллар, Р. Выпуклый анализ / Р. Рокафеллар.- М.: Мир, 1973. 469с. = Rockafellar, R. Convex Analysis / R. Rockafellar.- New Jersey, Princeton, Princeton University Press, 1970.
148. Соболев, Л. Некоторые применения функционального анализа в математической физике / Л. Соболев.- М.: Наука, 1988. 334с.
149. Солодов, А.В. Системы с переменным запаздыванием / А.В. Солодов, Е.А. Солодова.- М.: Наука, 1980. 384с.
150. Стихина, Т.К. К теории позиционного управления в системах с запаздыванием / Т.К. Стихина; УрГУ.- Свердловск, 1984.- 15с.- Деп. в ВИНИТИ 06.04.1984, JV 2^051.
151. Субботин, А.И. Обобщение основного уравнения теории дифференциальных игр / А.И. Субботин / / Доклады АН СССР, 1980. Т.254. JV^ 2. 293-297.
152. Субботин, А.И. Минимаксные неравенства и уравнения Гамилъто- на-Якоби / А.И. Субботин.- М.: Наука, 1991. 216с.
153. Субботин, А.И. Необходимые и достаточные условия для кусочно- гладкой цены дифференциальной игры / А.И. Субботин, Н.Н. Субботина / / Доклады АН СССР, 1978. Т.243. №4. 862-865.
154. Субботин, А.И. Сопряженные производные функции цены дифференциальной игры / А.И. Субботин, A.M. Тарасьев / / Доклады АН СССР, 1985. Т.283. Л•^ 3. 559-564.
155. Субботин, А.И. Оптимизация гарантии в задачах управления / А.И. Субботин, А.Г. Ченцов.- М.: Наука, 1981. 288с.
156. Субботин, А.И. Итерационная процедура построения минимаксных и вязкостных решений уравнений Гамильтона-Якоби /А.И. Субботин, А.Г. Ченцов / / Доклады РАН, 1996. Т.348. №3. 45-48.
157. Субботина, Н.Н. Сингулярные аппроксимации минимаксных и вязкостных решений уравнений Гамильтона-Якоби /Н.Н. Субботина / / i^y Тр. Института математики и механики УрО РАН, 2000. Т.6. №1. 190-208.
158. Субботина, Н.Н. Метод динамического программирования для класса локально-липшицевых функций / Н.Н. Субботина / / Доклады РАН, 2003. Т.389. №2. 1-4.
159. Тарасьев, A.M. Аппроксимационные схемы построения минимаксных решений уравнений Гамильтона-Якоби /A.M. Тарасьев / / Приклад-н(щ м(1тематика и механика, 199^. %5В. Вып.2. 22-'^6.
160. Тарасьев, A.M. Аппроксимационные схемы и конечно-разностные 1^ операторы для построения обобщенных решений уравнений Гамильтона-Якоби / A.M. Тарасьев, А.А. Успенский, В.Н. Ушаков / / Изв. РАН: Техн. кибернетика, 1994. №3. 173-185.
161. Тихонов, А.Н. О разрывных решениях квазилинейного уравнения первого порядка / А.Н. Тихонов, А.А. Самарский / / Доклады АН СССР, 1954. Т.99. №1. 27-30.
162. Толстоногое, А.А. Дифференциальные включения в банаховых пространствах I А.А. Толстоногов.- Новосибирск: Наука, 1986. 296с.
163. Тонков, Е.Л. Динамические задачи выживания / Е.Л. Тонкое / / ' Вестник Пермского гос. тех. ун-та. Функцион.-дифференц. урав-(спец.вып.), 1997. №4. 138-148.
164. Третьяков, В.Е. К теории стохастических дифференциальных игр / В.Е. Третьяков / / Доклады АН СССР, 1983. Т.269. JV^ З. 1049-1053.
165. Третьяков, В.Е. Оптимальное управление системами с неполной информацией/В.Е. Третьяков, И.В. Целищева, Г.И. Шишкин// Тр. Института математики и механики УрО РАН, 1992. Т.2, 176-187
166. Троицкий, В.А. Оптимальные прцессы колебаний механических систем I В.А. Троицкий.- Л.: Машиностроение, 1976.
167. Ухоботов, В.И. Синтез гарантированного управления на основе ап- проксимационной схемы / В.И. Ухоботов / / Тр. Института математики и механики УрО РАН, 2000. Т.б. JV^ 1. 239-246.
168. Ушаков, В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения /В .Н . Ушаков / / Изв. АН U. СССР: Технич. кибернетика, 1980. JV^ 4. 29-36.
169. Ушаков, В.Н. О приближенном построении решений в игровых задачах управления / В.Н. Ушаков, А.П. Хрипунов / / Прикладная математика и механика, 1997. Т.61. Вьш.З. 413-421.
170. Филиппов, А.Ф. Дифференциальные уравнения с разрывной правой частью / А.Ф. Филиппов.- М.: Наука, 1985. 225с.
171. Флеминг, У. Оптимальное управление детерминированными и стохастическими системами / У. Флеминг, Р. Ришел,- М.: Мир, 1978. 316с. = Щ Fleming, W. Deterministic and Stochastic Optimal Control / W. Fleming, R. Rishel.- New York: Springer-Verlag, 1975.
172. Фомин, В.Н. Адаптивное управление динамическими объектами / В.Н. Фомин, А.Л. Фрадков, В.А. Якубович.- М.: Наука, 1981. 447с.
173. Харатишвили, Г.Л. Оптимальные процессы с запаздыванием / Г.Л. Харатишвили.- Тбилиси: Мецниереба, 1966.
174. Харатишвили, Г.Л. Нелинейная задача оптимального управления с переменными запаздываниями, нефиксированным начальным моментом и кусочно непрерывной предысторией / Г.Л. Харатишвили, Т.А.Тадумадзе//Т;?. МИАН им. 5.Л.Стеклоеа,1998.Т.220.С.23б-255.
175. Хейл, Дж. Теория функционально-дифференциальных уравнений / Дж. Хейл.- М.: Мир, 1984. 421с. = Hale, J. Theory of Functional Differential Equations / J. Hale.- New-York: Springer-Verlag, 1977.
176. Хрусталев, М.М. Необходимые и достаточные условия оптимальности в форме уравнения Беллмана /М.М. Хрусталев / / Доклады АН СССР, 1978. Т.242. 1023-1026.
177. Хусаинов, Д.Я. Метод функций Ляпунова в исследовании устойчивости дифференциально-функциональных систем / Д.Я. Хусаинов, А.В. Шатырко.- Киев: Киевский госуниверситет, 1997. 236с.
178. Ченцов, А.Г. О структуре одной игровой задачи сближения / 4^ , А.Г. Ченцов / / Доклады АН СССР, 1975. Т.224. K 6^. 1272-1275.
179. Ченцов, А.Г. К игровой задаче наведения с информационной памятью / А.Г. Ченцов / / Доклады АН СССР, 1976. Т.227. JV^ 2.
180. Черноусько, Ф.Л. Некоторые задачи оптимального управления с малым параметром J Ф.Л. Черноусько.- М.: Наука, 1980.
181. Черноусько, Ф.Л. Оптимальное управление при случайных возмущениях I Ф.Л. Черноусько, В.Б. Колмановский.- М.: Наука, 1978, 352с. , 199. Черноусько, Ф.Л. Игровые задачи управления и поиска / Ф.Л. Черноусько, А.А. Меликян.- М.: Наука, 1978. 270с.
182. Черноусько, Ф.Л. Управление колебаниями / Ф.Л. Черноусько, Л.Д. Акуленко, Б.Н. Соколов.- М.: Наука, 1980.
183. Чикрий, А.А. Конфликтно управляемые процессы / А.А. Чикрий.- Киев: Наукова думка, 1992. 384с.
184. Эльсгольц, Л.Э. Введение в теорию дифференциальных уравнений с отклоняющимся аргументом / Л.Э. Эльсгольц, С Б . Норкин.-М.: Наука, 1971. 269с.
185. Янушевский, Р.Т. Управление объектами с запаздыванием / Р.Т. Янушевский,- М.: Наука, 1978. 416с.
186. Aubin, J.Р. Viability Theory / J.P. Aubin.- Boston: Birkhauser, 1991.
187. Aubin, J.P. Set-Valued Analysis / J.P. Aubin, H. Frankowska.- Boston: ^ ' Birkhauser, 1990.
188. Aubin, J.P. History path dependent optimal control and portfolio valuation and management / J.P. Aubin, G. Haddad / / Positivity, 2002. Vol.6, pp. 331-358.
189. Banks, H.T. Applications of abstract variational theory to hereditary systems: a survey / H.T. Banks, A. Manitius / / IEEE Trans. Automat. Control, 1974. Vol.AC-19. pp. 524-533.
190. Barbu, V. Hamilton-Jacobi Equations in Hilbert Spaces / V. Barbu, G. Da Prato.- Pitman, Boston, MA, 1983. I
191. Bardi, M. Optimal Control and Viscosity Solutions of Hamilton-Jacobi- Bellman Equations / M. Bardi, I.C, Dolcetta.- Boston: Birkhauser, 1996.
192. Bardi, M. On Hopf's formulas for solutions of Hamilton-Jacobi equations / M. Bardi, L.C. Evans / / Nonlinear Anal, Theory, Meth., Appl- 1984. Vol.8. No.ll . pp. 1373-1381.
193. Bardi, M. An approximation scheme for the minimum time function / M. Bardi, M. Falcone//5L4M J. Cont. Optim.- 1990. Vol.28, pp.950-965. "^
195. Basar, T. Dynamic Noncooperative Game Theory / T. Basar, G.J. 01s- der.- New York: Academic Press, 1982,
196. Bensoussan, A. Perturbation Methods in Optimal Control / A. Ben- soussan.- New York, Chichester: Wiley-Gautier, 1988. 574p.
197. Berkovitz, L.D. Optimal feedback control / L.D. Berkovitz / / SIAM J. Contr. Optim.- 1989. Vol.27. No.5. pp. 991-1006.
198. Burton, T.A. Stability and Periodic Solutions of Ordinary and Functional Differential Equations / T.A. Burton.- New York: Academic Press, 1985.
199. Cannarsa, P. Some characterization of optimal trajectories in control theory / P. Cannarsa, H. Frankowska / / SIAM J. Contr. Optim.- 1991. Vol.29, pp. 1322-1347.
200. Clarke, F.H. Generalized gradients and applications / F.H. Clarke / / Trans. Amer. Math. Society, 1975. Vol.205, pp. 246-262.
201. Clarke, F.H. Necessary conditions for functional-differential inclusions / F.H. Clarke, P.R. Wolenski / / Appl. Math. Optim.- 1996. Vol.34. No.l. pp. 51-78.
202. Clarke, F.H. Proximal analysis and feedback constructions / F.H. Clarke, Yu.S. Ledyaev, R.J. Stern / / Proc. Steklov Inst. Math.- 2000. Suppl. Issue 1, pp. S72-S89.
203. Nonsmooth Analysis and Control Theory / F.H. Clarke, Yu.S. Ledyaev, R.J. Stern, P.R. Wolenski.- New York: Springer-Verlag, 1998. 278p.
204. Colonius, F. Optimal Periodic Control / F. Colonius.- Lecture Notes in Mathematics, Vol.1313. Berlin: Springer-Verlag, 1988.
205. Conway, E.D. Hamilton's theory and generalized solutions of the Hamilton-Jacobi equations / E.D. Conway, E. Hopf / / Trans. Amer. Math. Society, 1964. Vol. 13. No.2. pp. 939-986.
206. Corduneanu, C. Integral Equations and Stability of Feedback Systems / C. Corduneanu.- New York: Academic Press, 1973. i
207. Crandall, M.G. Viscosity solutions of Hamilton-Jacobi equations / M.G. Crandall, P.-L. Lions / / Trans. Amer. Math. Society, 1983, Vol.277, No.l. pp. 1-42.
208. Crandall, M.G. Hamilton-Jacobi equations in infinite dimensions, Part I: uniqueness of viscosity solutions /M.G. Crandall, P.-L. Lions// J. Fund. Anal- 1985, Vol.62, pp. 379-396.
209. Crandall, M.G. Hamilton-Jacobi equations in infinite dimensions, Part П: existence of viscosity solutions /M.G. Crandall, P.-L. Lions// / . Fund. Anal- 1986, Vol.65, pp. 368-405.
210. Crandall, M.G. Hamilton-Jacobi equations in infinite dimensions, Part IV: Hamiltonians with unbounded linear terms /M.G. Crandall, P.-L. Lions// J. Fund. Anal- 1990, Vol.90, pp. 237-283.
211. Crandall, M.G. Some properties of viscosity solutions of Hamilton-Jacobi equations / M.G. Crandall, L.C. Evans, P.-L. Lions / / Trans. Amer. Мф. SQci^, 1984. VoL282. pp. 487-502.
212. Crandall, M.G. Uniqueness of viscosity solutions of Hamilton-Jacobi equations revisited / M.G. Crandall, H. Ishii, P.-L. Lions / / J. Math. Soc. Japan, 1987, Vol.39, No.4. pp. 581-596.
213. Crandall, M.G. A user's guide to viscosity solutions of second order partial differential equations / M.G. Crandall, H. Ishii, P.-L. Lions / / Bulletin (New Series) Amer. Math. Sodety, 1992. Vol.27, pp. 1-67.
214. Delfour, M.C. Stability and the infinite time quadratic cost problem for linear hereditary differential systems / M.C. Delfour, C. McCalla, S.K. Mitter / / SIAM J. Control, 1975. Vol.13. No.l pp. 48-88.
215. Driver, R.D. Ordinary and Delay Differential Equations / R.D. Driver.- New York: Springer-Verlag, 1977.
216. Elliot, R.J. The existence of value in differential games / R.J. Elliot, N.J. Kalton / / Memoirs Amer. Math. Society, 1972. Vol.126, pp. 1-67.
217. Evans, L.C. Partial Differential Equations / L.C. Evans.- Graduate Studies in Mathematics, Vol.19. Amer. Math. Society: Providence, Rhode Island, 1998. JJ
218. Evans, L.C. Differential games and representation formulas for solutions of Hamilton-Jacobi-Isaacs equations / L.C. Evans, P.E. Souganidis / / Indiana Univ. Math. J.- 1984. Vol.33, pp. 773-797.
219. Falcone, M. Discrete time high order schemes for viscosity solutions of Hamilton-Jacoby-Bellman equations / M. Falcone, R. Ferretti / / Numer. Math.- 1994. Vol.67, pp. 315-344.
220. Fleming, W.H. The convergence problem for differential games / W.H. Fleming / / J. Math. Anal and Appl- 1961. No.3. pp. 102-116.
221. Fleming, W.H. The Cauchy problem for a nonlinear first order differential equation / W.H. Fleming / / J. Differen. Equat- 1969. Vol.5. No.3. pp. 515-550.
222. Fleming, W.H. Controlled Markov Processes and Viscosity Solutions / W.H. Fleming, H.M. Soner.- New York: Springer-Verlag, 1993.
223. Friedman, A. Differential Games / A. Friedman.- New York: Wiley Interscience, 1971.
224. Ginsburg, B. The maximum principle in optimal control of systems governed by semiliniar equations / B. Ginsburg, A. loffe / / Nonsmooth Analysis and Geometric Methods in Deterministic Optimal Control, New York: Springer-Verlag, 1996. pp. 153-202.
225. Haddad, G. Monotone trajectories of differential inclusions and functional differential inclusions with memory / G. Haddad / / Israel J. Math.- 1981. Vol.39, pp. 83-100.
226. Halanay, A. Differential Equations: Stability, Oscillations, Time-Lags / A. Halanay.- New York: Academic Press, 1966.
227. Halanay, A. Differential games with delay / A. Halanay / / SIAM J. Control, 1968. Vol.6, pp. 579-593.
228. Hale, J.K. Introduction to Functional Differential Equations / J.K. Hale, S.M.V. Lunel.- New York: Springer-Verlag, 1993. 280p.
229. Hopf, E. Generalized solutions of nonlinear equations of first order / E. Hopf / / J. Math. Mech.- 1965. Vol.14, pp. 951-972. д^ •) Different Integr. Equations, 1992. Vol.5. No.5. pp. 1033-1040.
230. Isidori, A. Nonlinear Control Systems / A, Isidori New.- York: Springer- Verlag, 1995. (3rd edition)
231. Kalman, R.E. Contribution to the theory of optimal control / R.E. Kalman / / Bullet. Soc. Math. Mech.- 1960. Vol.5, pp.102-119.
232. Keulen, B. H^Q-Control for Distributed Parameter Systems: A State- Space Approach I B. Keulen.- Boston: Birkhauser, 1993.
233. Kim, A.V. Functional Differential Equations. Application of i-Smooth Calculus I A.V. Kim.- The Netherlands Dordrecht: Kluwer, 1999. 165p.
234. Kim, A.V. Numerical Methods for Delay Differential Equations / A.V. Kim, V.G. Pimenov,- Lecture Notes Series JVe44. Seoul National University. Seoul. Korea. 1999. 96p.
235. IColfflanovskii, V. Applied Theory of Functional-Differential Equations j V. Kolmanovskii, A. Myshkis.- Dordrecht: Kluwer Acad. Publish. Group, 1992. 234p.
236. Krasovskii, A.N. Control under Lack of Information / A.N. Krasovskii, N.N. Krasovskii.- Berlin etc.: Birkhauser, 1995. 322p.
237. Krasovskii, N.N, Game-Theoretical Control Problems / N.N. Krasovskii, A.I. Subbutin.- New York: Springer-Verlag, 1988. 518p.
238. Kumkov, S.I. Informational sets in a model problem of homing / S.I. Kumkov, V.S. Patsko / / J. Optimization Theory and Applications, 2001. V0LIO8. N0.3. pp. 499-526.
239. Kumkov, S.S. Constraction of singular surfaces in linear differential games / S.S. Kumkov, V.S. Patsko / / Annals of the Intern. Soc. of Dynamic Games: Adv. in Dynamic Games and Applications, 2001. Vol.6, pp. 185-202.
240. Kurzhanski, A.B. Set-valued calculus and dinamic programming in problems of feedback control / A.B. Kurzhanski / / Intern. Series of Numerical Mathematics, 1998. Vol.124, pp. 163-174.
241. Kurzhanski, A.B. Elipsoidal Calculus for Estimation and Control / A.B. Kurzhanski, I. Valyi,- Boston (ser. SOFA): Birkhauser, 1996.
242. Kurzhanski, A.B. On reachability under uncertainty / A.B. Kurzhanski, P. Varaiya / / SIAM J. Contr. Optim.- 2002. Vol.41. No.l. pp. 181-216.
243. Larssen, B. Dynamic programming in stochastic control of systems with delay/B. Larssen//5^осД. Stock Rep- 2002. Vol.74. No.3-4. pp. 651-673.
244. Lax, P. Hyperbolic systems of conservations laws. И / P. Lax / / Comm. Pure Appl. Math.- 1957. Vol.10, pp. 537-566.
245. Lions, P.L. Generalized Solutions of Hamilton-JасоЫ Equations / P.L. Lions.- Research Notes in Mathematics, Vol.69, Boston: Pitman, 1982. 318p.
246. Lukoyanov, N.Yu. Functional Hamilton-Jacobi type equations in ci- }j, derivatives for systems with distributed delays / N.Yu. Lukoyanov / / Nonlinear Fund. Anal, and AppL- 2003. Vol.8. No.3. pp. 365-397.
247. Lukoyanov, N.Yu. Functional Hamilton-Jacobi type equations with ci-derivatives in control problems with hereditary information / N.Yu. Lukoyanov / / Nonlinear Funct. Anal, and AppL- 2003. Vol.8. No.4. pp. 535-556.
248. Lukoyanov, N.Yu. On dynamic programming in control problems of systems with distributed delays / N.Yu- Lukoyanov / / Preprints IFAC Workshop on Time-Delay Systems (CDROM), INRIA, Rocquencourt, ., Prance, Sept. 2003.
249. Melikyan, A.A. Generalaized Characteristics of First Order PDEs: Applications in Optimal Control and Differential Games / k.k. Melikyan.- Boston: Birkhauser, 1998. 310p.
250. Minchenko, L.I. Necessary optimality conditions for differential difference inclusions / L.I. Minchenko / / Nonlinear Anal, Theory, Meth. and AppL- 1999. Vol.35, pp. 307-322.
251. Mirica, S. Finite-dimentional representations of the value functions of some optimal control problems / S. Mirica / / Control and Cybernetics, \ 2002. Vol.31. No.3. pp. 779-801. /
252. Patsko, V.S. Level sets of the value function in differential games with the homicidal chauffeur dynamics / V.S. Patsko, V.L. Turova / / Intern. Game Theory Rev.- 2001. Vol.3. No.l. pp. 67-112.
253. Osipov, Yu.S. Inverse Problems of Ordinary Differential Equations: Dynamical Solutions / Yu.S. Osipov, A.V. Kryazhimskii.- Amsterdam: Gordon and Breach, 1995. 625p. ^
254. Rockafellar, R.T. Variational Analysis / R.T. Rockafellar, R.J-B. Wets.- Berlin: Springer-Verlag, 1998. 735p.
255. Roxin, E. The axiomatic approach in differential games / E. Roxin / / J. Optim. Theor. Appl- 1969. VoL3. pp. 153-163.
256. Sesekin, A.N. On the singularity order of optimal controls in linear- quadratic optimization problems for systems with delays/A.N. Sesekin// Functional Defferential equations^ 1998. №1-2. pp. 243-251.
257. Soner, H.M. On the Hamilton-Jacobi-Bellman equations in banach spaces / H.M. Soner / / J. Optim. Theory and Appl- 1988. Vol.57. No.3. pp. 429-437.
258. Souganidis, P.E. Approximation schemes for viscosity solutions of Hamilton-Jacobi equations / P.E. Souganidis / / J. Differen. Equat.-1985. VoL59. pp.1-43.
259. Souganidis, P.E. Max-min representations and product formulas for viscosity solutions of Hamilton-Jacobi equations with applications to differential games / P.E. Souganidis / / Nonlinear Analysis. Theory, Meth., Appl- 1985. Vol.9. No.3. pp.217-257.
260. Subbotin, A.I. Generalized characteristics of Hamilton-Jacobi equations/ A.I. Subbotin, A.M. Taras'ev, V.N, Ushakov / / J. Comput. Systems Sci. Intern.- 1994. Vol.32. No.2. pp. 157-163.
261. Ushakov, V.N. Constructions of solutions in differential game of pursuit- evasion. Differential inclusions and optimal control / V.N. Ushakov / / 1.ecture Notes in Nonlinear Analysis, 1998. Vol.2, pp. 269-281.
262. Varaiya, P. On the existence of solutions to a differential game / P. Varaiya / / SIAM J. Contr. Optim.- 1967. Vol.5. No.l. pp. 153-162.
263. Vinter, R. Optimal Control / R. Vinter.- Boston: Birkhiiser, 2000. 507p.
264. Wolenski, P.R. Hamilton-Jacobi theory for hereditary control problems / P.R. Wolenski / / Nonlinear Anal- 1994. Vol.22. No.7. pp. 875-894.
265. Yoshizawa, T. Stability Theory by Liapunov's Second Method / T. Yoshizawa.- Tokyo: Math. Soc. Japan, 1966.