Построение ядер выживаемости в нелинейных задачах управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Незнахин, Александр Александрович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2001
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
Введение
Глава I. СЕТОЧНЫЙ МЕТОД ПРИБЛИЖЕННОГО ПОСТРОЕНИЯ ЯДРА ВЫЖИВАЕМОСТИ ДЛЯ ДИФФЕРЕНЦИАЛЬНОГО
ВКЛЮЧЕНИЯ
§1. Постановка задачи
§2. Дискретизация по времени
§3. Полностью дискретный алгоритм
Глава II. ПОСТРОЕНИЕ ЯДРА ВЫЖИВАЕМОСТИ ДЛЯ
ОБОБЩЕННОЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ
§1. Постановка задачи
§2. Дискретизация по времени
§3. Полностью дискретный алгоритм
Глава III. ПОСТРОЕНИЕ ЯДРА ВЫЖИВАЕМОСТИ С ОГРАНИЧЕННЫМ БЛУЖДАНИЕМ ДЛЯ ДИФФЕРЕНЦИАЛЬНОГО
ВКЛЮЧЕНИЯ
§1. Постановка задачи
§2. Дискретизация по времени
§3. Полностью дискретный алгоритм
Глава IV. ОДИН СПОСОБ ВИЗУАЛЬНОГО ПРЕДСТАВЛЕНИЯ ТРЕХМЕРНЫХ ОБЪЕКТОВ, ЗАДАННЫХ СВОИМИ СЕЧЕНИЯМИ
§1. Алгоритм сглаживания сечений
§2. Алгоритм соединения сечений
§3. Визуализация ядер выживаемости некоторых систем
Вопросы, рассмотренные в настоящей диссертации, связаны с изучением динамических систем, стесненных фазовыми ограничениями и функционирующих на конечном промежутке времени. Необходимость изучения таких систем вызвана многочисленными задачами из различных областей механики, экономики, экологии и биологии. Развитие математической теории управления динамическими системами в условиях неопределенности и конфликта [14, 15, 21, 24, 27] также обусловило значительный интерес к изучению управляемых систем и дифференциальных включений, стесненных фазовыми ограничениями.
Современный облик теории динамических систем, стесненных фазовыми ограничениями, в значительной степени определяется работами А.Б. Куржанского, А.Я. Дубовипкого, A.A. Милютина, Р.В. Гамкрелидзе, Ж.-П. Обэна и других авторов. Существенный вклад в развитие этой теории внесли С.М. Асеев, A.B. Арутюнов, В.И. Благодатских, Т.Ф. Филиппова, X. Франковска, П. Сент-Пьер, М. Куинкампуа и другие.
Диссертация, в основном, посвящена изучению нелинейных управляемых систем и связанных с ними дифференциальных включений, стесненных фазовыми ограничениями. Предполагается, что управляемая система имеет вид x = f(t,x,u), (0.1) и стеснена фазовыми ограничениями еФсахГ, иеф, (0.2) где 3 = (70,<9] - конечный отрезок времени, Жт - фазовое пространство системы (0.1), ф - компакт в пространстве управлений
ИГ.
Системе (0.1) сопоставляем дифференциальное включение xeF(t,x), (0.3) где F(t, х) = со{/(t, х, и): и е ф}.
Дифференциальные включения с фазовыми ограничениями -достаточно молодой раздел теории дифференциальных включений.
Решения x[t] управляемой системы (0.1) и дифференциального включения (0.3), удовлетворяющие ограничению (0.2), принято называть выживающими в Ф траекториями.
Вопросам выяснения условий существования выживающих траекторий и построения выживающих траекторий в последнее время уделяется значительное внимание. Здесь отметим работы [19, 33, 36, 41,42], в которых изложены теоретические основы выживаемости.
В работах [33, 36] получены условия существования выживающих траекторий. Вопросы существования выживающих траекторий для линейных управляемых систем были подробно изучены в исследованиях [36, 41, 42].
Задача построения выживающих траекторий дифференциальных включений возникает при исследовании вопросов управляемости в системах с неполной информацией и решении задач синтеза управлений в условиях неполной информации [20].
Одним из центральных понятий при решении задач построения выживающих траекторий является понятие множества достижимости. В работах [11, 23, 36, 38] были подробно изучены свойства множеств , выживающих траекторий дифференциальных включений и их сечений - множеств достижимости с ограничениями на фазовые координаты. Были приведены достаточные условия связности указанных множеств траекторий и множеств достижимости.
Важной задачей в теории дифференциальных включений является задача вывода эволюционных уравнений, описывающих динамику во времени множеств достижимости дифференциальных включений с фазовыми ограничениями. Рассмотрению этой задачи посвящена работа [33]. В этой работе для дифференциальных включений с фазовыми ограничениями приводится уравнение интегральной воронки, описывающей динамику сечений Х(т) пучков выживающих траекторий. '
С задачей построения выживающих траекторий для дифференциальных включений мы встречаемся и в теории позиционных дифференциальных игр, развитой на Урале H.H. Красовским, А.И. Субботиным и их сотрудниками [14 - 18, 28 - 35].
Исследования, посвященные свойству выживаемости динамических систем, начались в 40-е годы. Одной из первых работ в этом направлении является работа М. Нагумо [44] (1942 г.). В этой работе для векторного дифференциального уравнения x = f(x\ хеГ, ie[f0,oo) (0.4) изучалось, при каких условиях для любой начальной точки х0 из заданного замкнутого множества ф существует решение уравнения (0.4), x(tQ) = х0, удовлетворяющее фазовому ограничению f)e?), ie[i0,oo). (0.5)
Приведены необходимые и достаточные условия существования выживающих траекторий для любой начальной точки х(/0) = х0е2).
Эти условия сформулированы на языке инфинитезимальных конструкций.
В последние годы тематика выживающих траекторий рассматривалась в связи с развитием теории дифференциальных включений [41 - 43, 45 - 47].
Опишем один результат, являющийся, ка наш взгляд, ключевым в развитии теории дифференциальных включений, стесненных фазовыми ограничениями.
Полагаем, что 2]clm представляет собой фазовое ограничение для дифференциального включения (0.3).
Пусть дифференциальное включение (0.3) стационарно, т.е. имеет вид хе?(х), (0.6) а множество 2) е представляет собой фазовое ограничение для дифференциального включения (0.5). Полагаем
Тю(х) = {h е БГ : lim inf 8 Лй{хл Sh, 2)) = 0}, h е ЗЕТ.
5-»0+0
Множество называется контингентным конусом (или конусом
Булигана) к множеству ф в точке х е Rm [38], Приведем следующую теорему.
Теорема 0.1 [43]. Пусть 2)cclRm и F(x) -многозначное отображение, полунепрерывное сверху, F : -» convIRm. Тогда при любом t0 и любом начальном состоянии х0 е 2) существуют момент
T>tQ и выживающая на [tQ,r] траектория x(t) включения (0.6) с начальным условием x(tQ) — х0 в том и только в том случае, если
F(x)(\T^{x)*<Z>, Ухеф. (0.7)
Если множество F(2)) = {zeR*:z€F(x), xg2)} ограничено, то условие (0.7) является необходимым и достаточным для существования выживающей на полуоси [/0,оо) траектории включения (0.6), исходящей из произвольно выбранного начального вектора x(t0) = x0e$).
Отметим, что в теории позиционных дифференциальных игр [10 и др.], начиная с 80-х годов, также активно развивается направление исследования стабильных мостов, основанное на использовании инфинитезимальных конструкций и, в частности, конусов Булигана. Так очень полезным оказалось определение стабильных мостов в терминах конусов Булигана и гамильтонианов конфликтно-управляемой системы [25].
Приведем это определение.
Конфликтно-управляемая система описывается уравнением х = f(t,x,u,v), (0.8) te3 — [to,0] (t0<e< оо), xel'", и и v - векторы управления и помехи, стесненные соответственно ограничениями z/еф, vgÜ. (0.9)
Для этой системы рассматривается задача сближения-уклонения с целью Ш в фиксированный момент времени в.
Центральным элементом разрешающих конструкций этой задачи является стабильный мост 2U [15] в пространстве позиций (t, х) игры сближения-уклонения.
Ведем вспомогательные понятия и обозначения:
H{t, х, /) = шах min < /, /(t. х, uiv)>, меф vsÖ
F(t,x) = со{/еГ: f = f(t,x,u9v\ ие% veÜ},
Пt{t, х) = {/ б ST : </,/>< H(t, x,и, v)},
F,(t,x) = F(t,x)p|n;(i,x), / e S = {/ e Rm : ||/|| = 1}.
Величина H(t,x,l) называется гамильтонианом управляемой системы (0.8), (0.9).
Пусть 2Н - замкнутое множество в пространстве [io,0]xR™ позиций (t,x) системы (0.8), (0.9). Полагаем
DQS(t,w) = {d е!Г: : 3{tk} -> t + 0, w, e ЗВД, lim (w, - w)/(tk - f) = d}, tk-*t+о где 2Ü(0 = {x e Rm : (f, x) e 2B}, t e [i0,6>].
Тогда определение стабильного моста можно сформулировать в следующем виде.
Пусть в пространстве позиций (t, х) задано замкнутое множество W. Назовем 2U минимаксно и -стабильным мостом [15], если Щ9) с! и
D2B(t,x)f\Fl(t,x)4t0 (0.10) для любых (t,х) е 2U, t е [*0,0) и / е £.
Из этого определения легко вывести, что минимаксно w-стабильный мост W представляет собой множество пространстве позиций (/*,х„), для каждой из которых существует выживающая в 2В траектория x(t) дифференциального включения на промежутке времени [/*,#], каков бы ни был вектор / е S.
Обратное утверждение также справедливо. А именно, если некоторое замкнутое множество W в пространстве позиций (t, х) таково, что ЯВ(9)с:Ш и для исходной позиции (Д,х*)е 2U и любого leS существует выживающая в W траектория x(t) дифференциального включения на промежутке [и,в], то выполняется соотношение (О.Ю) для любых (t,x)em, te[tQ,0) и leS.
Важный раздел в теории оптимального управления составляют . экстремальные задачи для управляемых систем, описываемых дифференциальными включениями с фазовыми ограничениями (см., напр., [19, 41]). Для управляемых систем, описываемых дифференциальными включениями с фазовыми ограничениями, задачи оптимального управления рассматривались в работах [1, 2, 12]. Мы, однако, здесь не будем останавливаться на характеристике результатов, полученных в этих работах.
Настоящая диссертация посвящена исследованию трех задач выживаемости для управляемых систем, функционирующих на конечном промежутке времени:
1. Построение ядра выживаемости для дифференциального включения (0.3) при ограничениях (0.2).
2. Построение ядра выживаемости для обобщенной динамической системы (ОДС), динамика которой определяется непосредственно множествами достижимости.
3. Построение ядра выживаемости с ограниченным блужданием для ДВ (0.3) при ограничениях (0.2).
Во всех рассматриваемых задачах присутствуют нестационарные фазовые ограничения.
Основу решения этих задач составляют попятные сеточные алгоритмы приближенного построения ядер выживаемости.
Впервые вычисление ядра выживаемости было проведено в работе [41]. Предложенный в ней алгоритм тяжело осуществим, но имеет доказательство своей сходимости.
Работа [40] содержит один из последних результатов в этой области. В ней описан численный метод приближенного построения ядра выживаемости для стационарной управляемой системы при наличии стационарных фазовых ограничений на бесконечном промежутке времени. Метод схож с изложенным в диссертации: он использует попятные процедуры и предполагает введение дискретизации по времени и аппроксимацию фазового пространства дискретным множеством. Ядро выживаемости в нем определяется как цилиндр, сечение которого (по временной переменной) - дискретные множества, инвариантные относительно попятной процедуры построения следующего сечения ядра выживаемости по предыдущему.
1. Арутюнов A.B. Возмущения экстремальных задач с ограничениями и необходимые условия оптимальности / Итоги науки и техники. Сер. матем. анализ. М.: ВИНИТИ, 1989. 27, С. 147 - 235 (РЖМат, 1990, 2Б718).
2. Арутюнов A.B., Асеев С.М. Принцип максимума в задачах оптимального управления с фазовыми ограничениями. Невырожденность и устойчивость. // Докл. РАН. 1994. 334, №2. С. 134 137 (РЖМат, 1994, 12Б516)
3. Байдосов В.А. О подходе к определению динамических игр на языке обобщенных динамических систем. // Оптимальное управление системами с неопределенной информацией. Свердловск, 1980. С. 3 -11.
4. Барбашин Е.А. // Уч. зап. Моск. ун-та. 1949. № 135. С. 110 135.
5. Благодатских В.И. Задача управляемости для линейных систем // Тр. МИРАН СССР. 1977ю Т. 143. С. 57 67.
6. Благодатских В.К, Филиппов А.Ф. Дифференциальное включение и оптимальное управление // Тр. МИРАН СССР. 1985. Т. 169. С. 194252.
7. Благодатских В.И. О выпуклости сфер достижимости. // Дифференц. уравнения, 1972, 8, 12, 2149 2155.
8. Благодатских В.И. К теории достаточных условий оптимальности. //Докл. АН СССР, 1976, 231, 5,1041 1044.
9. Гусейнов Х.Г., Субботин А.И., Ушаков В.Н. Производные многозначных отображений и их применение в игровых задачах управления. // Проблемы упр. и теории информации. 1985. Т.14, №3. С. 1 14.
10. Гусейнов Х.Г., Ушаков В.Н. Об инфинитезимальных конструкциях в теории обобщенных динамических систем I. // Дифференц. уравнения. 1998. Т. 34, № 2. С. 157 165.
11. Гусейнов Х.Г., Ушаков В.Н. Об инфинитезимальныхконструкциях в теории обобщенных динамических систем II. //Дифференц. уравнения. 1998. Т. 34, № 4. С. 457 464.
12. Дубовщкий А.Я., Дубовицкий В.А. Принцип максимума в регулярных задачах оптимального управления, у которых концы фвзовой траектории лежат на границе фазового ограничения. // Автомат, и телемех. 1987. №12. С. 25 33 (РЖМат 1988, 4Б919).
13. Зубов В.И. Метод Ляпунова и его применение. Л., 1957.
14. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
15. Красовский H.H. Управление динамической системой // М.: Наука, 1985, 520с.
16. Красовский H.H. К теории управляемости и наблюдаемости линейных динамических систем. // Прикл. матем. и мех., 1964, 28, 1, 3-14.
17. Красовский H.H. Теория управления движением. М.: Наука, 1968.
18. Красовский H.H. Игровая задача о коррекции движения. // Прикл. матем. и мех., 1969, 33, 3, 386 396.
19. Куржанский A.B. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977, 392 стр.
20. Ледяев Ю.С., Мищенко Е.Ф. Об оптимальных стратегиях в дифференциальных играх фиксированной продолжительности // Докл. АН СССР. 1986. Т. 286. № 2. С. 284 287.
21. Никольский М.С. Об аппроксимации множества достижимости для дифференциального включения. // Вестн. Моск. ун-та, сер. 15 выч. мат. и киб., 1987, 4, С. 31-34.
22. Осипов Ю.С. Позиционное управление в параболических системах. // Прикл. матем. и мех., 1977, 41, 2, 195 201.
23. Половинкин Е.С. Стабильность терминального множества и оптимальность времени преследования в дифференциальных играх 1984, т. 20, №3, с. 433-446.
24. Понтрягин JI.C. Оптимальные процессы регулирования. // Успехи мат. наук, 1959, 14, 1, 3-20.
25. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.
26. Субботин А.И. Программные и позиционные поглощения в дифференциальных играх. // Прикл. матем. и мех., 1972, 36, 4, 740 -743.
27. Субботин А.И. Экстремальные стратегии в дифференциальных играх с полной памятью. //Докл. АН СССР, 1972, 206, 3, 552 555. ;
28. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
29. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. кибернетика 4, 1980. С. 32-45.
30. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985.
31. Филиппова Т.Ф. Задачи о выживаемости для дифференциальных включений.: Дис. . д-ра физ.-мат. наук: 01.01.02. Екатеринбург; 1992. 266 с. /Ин-т математики и механики УрО РАН.
32. Филиппова Т.Ф. Управление в условиях неопределенности системой с негладкой правой частью. // Дифференц. уравнения^ 1983, 19, 10, 1963 1699.
33. Филиппова Т.Ф. Об одном достаточном условии оптимальности в задаче управления ансамблем траекторий. // Оценивание динамики управляемых движений. Свердловск, 1988, 111 118.
34. Aubin J.-P. (1992) Viability Theory. Birkhauser.
35. Aubin J.-P., Clarke F. Monotone invariant solutions to differential inclusions // J. London Math. Soc. 1977, 16. P. 357-366.
36. Aubin J.-P. Contingent derivatives of set-valued maps and existence of solutions to nonlinear inclusions and differential inclusions/ // Math. Anal. Appl., Advances in Math., 1980, 7A, 159 229.
37. Barron E. & Jensen R. (1992) Optimal conrtol and semicontinuous viscosity solutions. Proc. American Math. Soc. 113, pp. 397 402.
38. P. Cardaliaguet, M. Quincampiox, P. Saint-Pierre. Numerical methods for optimal control and differential games. CEREMADE CNRS URA 749, University of Paris Dauphine.
39. Francowska H. & Quincampoix M. (1991) Viability kernels of differential inclusions with constraints: Algorithm and applications. Mathematics of Systems, Estimation and Control, vol. 1, N 3, pp. 371 t-388.
40. Frankowska H., Plascacz S., Rzezuchowski T. Theoremes de viabilité mesurables et l'équation d'Hamilton-Jacobi-Bellman. Comptes-Rendus de l'Akademie des Sciences, PARIS, Serie 1, 1992.
41. Haddad G. Monotone trajectories of differential inclusions and functional-differential inclusions with memory. // Israel J. of Math., 1981,31,83- 100.
42. Nagumo M. Uber die Lage der Integralkurven gewohnliker Diufferentialgleichungen. // Proc. Phys. Math. Soc. Japan, 1942, 24, 551 -559.
43. Quincampoix M. Differential inclusions and target problems // SIAM J. Control and Optim. 1992. V. 30.2. P. 324-335.
44. Quincampoix M. & Saint-Pierre P. An Algorithm for Viability Kernels in Holderian Case: Approximation by discrete dynamical systems. Mathematics of Systems. Estimation and Control.132
45. Quincampoix M. Frontières de domaines d'invariance et viabilité pour des inclusions differentialles avec contraintes. // C.R. Acad. Sci. Paris,1990, 311, Ser.I, 411 -416.
46. Rozyev I. & Subbotin A.I. (1988) Semicontinuous solutions of Hsamilton-Jacobi Equations. PMM U.S.S.R. Vol. 52, N. 2, pp. 141-146,
47. Roxin E. Il J. Different. Equat. 1965. Vol. 1. 115 150.
48. Saint-Pierre P. Discrete Approximation of the Viability Kernel. To appear in Applied Mathematics & Optimization, 1992.
49. Незнахин А.А. О построении ядра выживаемости для обобщенной динамической системы. // Деп. в ВИНИТИ 06.12.00 № 3082-В00. 22 с.
50. Незнахин А.А., Ушаков В.Н. Построение ядра выживаемости с ограниченным блужданием для дифференциального включения. // Деп. в ВИНИТИ 16.12.00 № 3083-В00 24 с.
51. Незнахин А.А. О построении ядра выживаемости для обобщенных динамических систем. // Тезисы докладов Международной конференции по дифференциальным уравнениям и динамическим системам. Суздаль. 21-26 августа 2000 г. С. 164.