Стохастический программный синтез в конфликтном управлении с оптимизацией позиционных и квазипозиционных функционалов тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Коврижных, Антон Юрьевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
2002 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Стохастический программный синтез в конфликтном управлении с оптимизацией позиционных и квазипозиционных функционалов»
 
 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Коврижных, Антон Юрьевич

Введение

Глава 1. ДИФФЕРЕНЦИАЛЬНАЯ ИГРА НА МИНИ

МАКС ПОЗИЦИОННОГО ФУНКЦИОНАЛА.

1. Постановка задачи.

2. Стохастическая программная конструкция.

3. Свойства стохастической программной конструкции.

4. Стабильность стохастического программного максимина.

5. Цена игры.

6. Вычисление программного экстремума.

Глава 2. ДИФФЕРЕНЦИАЛЬНАЯ ИГРА НА МИНИ

МАКС КВАЗИПОЗИЦИОННОГО ФУНКЦИОНАЛА

7. Постановка задачи.

8. Стохастическая программная конструкция для игры с показателем 7(4).

9. Стабильность стохастического программного максимина /0(4) (■).

10. Вычисление программного экстремума е(4)(-).

Глава 3. ОДНА ЗАДАЧА С ЭЛЛИПТИЧЕСКИМИ ОГРАНИЧЕНИЯМИ НА УПРАВЛЯЮЩИЕ ВОЗДЕЙСТВИЯ

ИГРОКОВ.

11. Постановка задачи.

12. Предельная схема вычисления цены игры.

13. Обоснование предельной схемы.

14. Пример.

 
Введение диссертация по математике, на тему "Стохастический программный синтез в конфликтном управлении с оптимизацией позиционных и квазипозиционных функционалов"

Предлагаемая работа посвящена задаче управления динамической системой, которая описывается дифференциальными уравне-нями. Задача рассматривается в случае неполной информации о помехе. Предполагается, что помимо разумно организуемого управления на систему действуют силы, которые заранее можно лишь грубо оценить. Качество процесса оценивается подходящим функционалом (показателем качества) на реализациях движения системы. Возникает задача конфликтного управления, т.е. задача об управлении по принципу обратной связи, которое гарантиирует оптимально значение заданного показателя качества. Названная задача включается в круг антагонистических дифференциальных игр.

В настоящее время теория дифференциальных игр представляет собой самостоятельную дисциплину, имеющую прочные связи со многими разделами механики и математики. Существенный вклад в развитие теории дифференциальных игр внесли работы Р. Ай-зекса [1], Э.Г. Альбрехта [2], В.Д. Батухтина [4], Т. Башара [62], Р. Беллмана [5], В.Г. Болтянского [43], А. Брайсона [70], Р.Ф. Га-басова [7], Р.В. Гамкрелидзе [43], В.И. Жуковского [8], М.И. Зе-ликина [9], Н. Калтона [65], Ф.М. Кирилловой [7], А.Ф. Клейменова [11], А.Н. Красовского [12]- [17], H.H. Красовского [15, 16], [18]-[22], М.Г. Крендала [64], A.B. Кряжимского [23, 35], А.Б. Куржанско-го [24, 25], Дж. Лейтмана [63], Дж. Лина [72], П.Л. Лионса [64, 71], М.Д. Локшина [27], Н.Ю. Лукоянова [19, 28], A.A. Меликяна [30, 58], Е.Ф. Мищенко [31, 43], М.С. Никольского [33], Ж.П. Обена [61], Г. Ольсдера [62], Ю.С. Осипова [34, 35], B.C. Пацко [36], H.H. Петрова [37], Л.А. Петросяна [38], В.Г. Пименова [39], Г.К. Пожариц-кого [40], Е.С. Половинкина [41], Л.С. Понтрягина [42, 43], Б.Н. Пшеничного [44], Н.Ю. Сатимова [46], А.И. Субботина [21], [47]- [50], H.H. Субботиной [48], A.M. Тарасьева [49, 51, 52], В.Е. Третьякова [15, 22, 53], В.И. Ухоботова [54], В.Н. Ушакова [52, 55], У. Флеминга [66, 67], А. Фридмана [68], Хо Ю-ши [69, 70], А.Г. Ченцова [50, 56], Ф.Л. Черноусько [57, 58], A.A. Чикрия [8, 59], Р. Эллиотта [65] и многих других ученых.

Диссертация базируется на концепции дифференциальных игр, развиваемой в Екатеринбурге [12]—[28], [34], [47]—[56]. В основе этой концепции лежат понятия стабильных функций и множеств, метод экстремального прицеливания на стабильные множества (мосты) или на сопутствующие точки, определяемые по функции цены игры, методы построения величины цены игры на базе вспомогательных программных конструкций. В регулярных случаях эти вспомогательные программные конструкции являются детерминированными и тесно связаны с конструкциями из теории оптимального программного управления. В нерегулярных случаях для вычисления цены игры (оптимального гарантированного результата) в рамках принятой концепции был предложен метод стохастического программного синтеза [15, 18] и идейно связанный с ним метод выпуклых сверху оболочек [16, 19, 20]. В тоже время для многих задач минимаксного управления, в том числе, для задач с нетерминальным показателем качества процесса управления, когда следует учитывать информацию об истории этого процесса, остается ряд невыясненных вопросов. Прежде всего, это вопросы, связанные с построением и обоснованием процедур стохастического программного синтеза, а также вопросы, касающиеся прояснения взаимосвязи таких процедур с другими известными процедурами вычисления цены игры. Исследование названных проблем является целью представляемой работы.

Рассматривается следующая задача конфликтного управления. Динамическая система, подверженная воздействиям управления и неконтролируемой помехи описывается обыкновенными линейными дифференциальными уравнениями. Ограничения на мгновенные воздействия управления и помехи носят геометрический характер. Промежуток времени процесса управления зафиксирован. Показатель качества выбран как функционал от реализации движения, типа некоторой нормы, оценивающей совокупность фазовых состояний системы, реализовавшихся в наперед заданные моменты времени. Такой показатель может быть задан изначально, либо такой функционал вводится в качестве аппроксимирующего для исходного показателя, который оценивает континуум значений фазовых состояний системы. Ставится задача об управлении, которое доставляет показателю качества оптимальный гарантированный результат. Подобная задача возникает, например, когда требуется в условиях неопределенно действующей помехи с гарантией провести движение объекта в наперед заданные моменты времени как можно ближе к началу координат, или же вблизи заданной траектории. Исследуются два случая. В первом случае показатель качества обладает позиционной структурой, поэтому информационным образом, который определяет управление по принципу обратной связи, является текущее состояние объекта. Во втором случае показатель качества непозиционный. Здесь информационным образом в текущий момент времени является история движения системы от начала движения до текущего момента.

Диссертация содержит введение, три главы, приложение и список литературы. Нумерация параграфов сквозная. В первой главе в §1 дается постановка задачи в соответствии с [16, 18]. Показатель качества оценивает либо суммарное, либо максимальное, либо среднее отклонение от начала координат фазовой точки системы в выбранные моменты времени. Данный показатель - позиционный функционал от реализации движения системы. Затем в §2 на основе метода программного стохастического синтеза предлагается процедура для вычисления цены игры. По сравнению с каноническим случаем (см. например [18, с. 286]) особенность данной задачи составляет многомерная по времени структура показателя качества. Это в свою очередь усложняет возникающие здесь стохастические максиминные конструкции. Стохастическое движение вспомогательной модели формирует многомерную случайную величину, оценивающую случайные состояния модели в выбранные моменты времени. Строение такой величины отвечает строению показателя качества. Предлагаемая далее трактовка этой величины как элемента подходящего функционального пространства позволяет перейти к двойственному описанию максимина - стохастическому программному экстремуму. Таким образом, как и в терминальном случае, вычисление одной величины - программного максимина, можно заменить вычислением другой нужной нам величины - программного экстремума. Обсуждаемый подход оказывается удобным для обоснования важных свойств стохастической конструкции (§§ 3,4). Ключевым здесь является обоснование свойства и-стабильности величины программного максимина. Далее в §5 формулируется и доказывается теорема о предельном равенстве программного стохастического мак

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Коврижных, Антон Юрьевич, Екатеринбург

1. Айзеке Р. Дифференциальные игры. М.:Мир. 1967. 479 с.

2. Альбрехт Э.Г. О сближении квазилинейных объектов в регулярном случае // Дифференц.уравнения, 1971. Т.7, N 7. С. 1171 -1172.

3. Аркин В.И., Левин В.Л. Выпуклость значений векторных интегралов, теоремы измеримого выбора и вариационные задачи / / Успехи математических наук, 1972. Т.27, N 3. С. 21 77.

4. Батухтин В.Д. Об одной игровой задаче наведения с неполной информацией // Прикл. математика и механика, 1980. Т.44, вып.4. С. 595 601.

5. Веллман Р. Динамическое программирование. М.:ИЛ. 1960. 400 с.

6. Варга Док. Оптимальное управление дифференциальными и функциональными уравнениями. М.:Наука, 1977. 624 с.

7. Габасое Р.Ф., Кириллова Ф.М. О некоторых применениях функционального анализа к теории оптимальных процессов / / Изв.АН СССР. Техн.кибернетика, 1966. N 4.

8. Жуковский В.И., Чикрий A.A. Линейно-квадратичные дифференциальные игры. Киев: Наукова Думка, 1994. 320 с.

9. Зеликин М.И. Об одной дифференциальной игре с неполной информацией // Докл. АН СССР. 1972. Т.202, N 5.

10. Канторович Л.В., Акилов Г.П. Функциональный анализ. М.гНаука. 1984. 752 с.

11. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург:Наука Урал, отделение, 1993. 185 с.

12. Красовский А.Н. О позиционном минимаксном управлении // Прикл. математика и механика, 1980. Т.44, вып.4. С. 602 610.

13. Красовский А.Н. Построение смешанных стратегий на основе стохастических программ / / Прикл. математика и механика,1987. Т.51, вып.2. С. 186 192.

14. Красовский А.Н. Управление в смешанных стратегиях на мини-макс интегрального функционала // Прикл. математика и механика, 1992. Т.56, вып.2. С. 192 204.

15. Красовский А.Н., Красовский Н.Н., Третьяков В.Е. Стохастический программный синтез для детерминированной позиционной дифференциальной игры // Прикл. математика и механика, 1981. Т.45, вып.4. С. 579 586.

16. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Birkhauser, Boston, 1994. 319 p.

17. Krasovskii A.N., Choi Y.S. Stochastic Control with the Leaders-Stabilizers. IMM Ural Branch of RAS. Ekaterinburg, Russia, 2001. 51 p.

18. Красовский H.H. Управление динамической системой. М.:Наука. 1985. 518 с.

19. Красовский Н.Н., Лукоянов Н.Ю. Задача конфликтного управления с наследственной информацией // Прикл. математика и механика, 1996. Т.60, вып.6. С. 885 900.

20. Krasovskii N.N., Reshetova T.N. On the program Synthesis of a guarenteed control // Problem of Control and Information Theory.1988. Vol.17, N 6. R 333-343.

21. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. M.-.Наука, 1974. 456 с.

22. Красовский H.H., Третьяков В.Е. Стохастический синтез для позиционной дифференциальной игры // Докл. АН СССР. 1981. Т.259, N 1. С. 24 27.

23. Кряжимский A.B. К теории позиционных дифференциальных игр сближения-уклонения // Докл. АН СССР. 1978. Т.239, N 4. С. 779 782.

24. Куржанский А.Б. Управление и наблюдение в условиях неопре-деленнности. М.:Наука, 1977. 390 с.

25. Куржанский А.Б., Никонов О.И. К задаче синтеза стратегий управления. Эволюционные уравнения и многозначное интегрирование // Докл. АН СССР. 1990. Т.311, N 4. С. 788 793.

26. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.:Наука, 1974. 696 с.

27. Локшин М.Д. О дифференциальных играх с интегральными ограничениями на управляющие воздействия // Дифференц. уравнения, 1992. Т.28, N 11. С. 1952 1961.

28. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Приклад, математика и механика. 1998. Т.62, вып.2. С. 188 198.

29. Лукоянов Н.Ю. О построении цены позиционной дифференциальной игры // Дифференц. уравнения, 2001. Т.37, N 1. С. 18 -26.

30. Меликян A.A. Оптимальное взаимодействие двух преследователей в игровой задаче // Изв. АН СССР. Техн. кибернетика, 1981. N 4. С 10 18.

31. Мищенко Е. Ф. Задачи преследования и уклонения от встречи в теории дифференциальных игр // Изв. АН СССР. Техн. кибернетика, 1971. N 5. С. 3 9.

32. Пшеничный В.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т.184, N 2. С. 285 287.

33. Рокафеллар Р. Выпуклый анализ. М.:Мир, 1973. 472 с.

34. Сатимов Н.Ю. О задачах преследования и убегания в дифференциальных играх // Мат. заметки, 1981. Т.29, N 3.

35. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.гНаука, 1991. 216 с.

36. Субботин А.И., Субботина H.H. Свойства потенциала дифференциальной игры // Прикл. математика и механика. 1982. Т.46, N 2. С. 204 211.

37. Субботин А.И., Тарасъев A.M. Сопряженные производные функции цены дифференциальной игры // Докл. АН СССР. 1985. Т.283, N 3. С. 559 564.

38. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.гНаука, 1981. 288 с.

39. Тарасъев A.M. Об одной нерегулярной дифференциальной игре // Прикл. математика и механика, 1985. Т.49, вып.4. С. 682 -684.

40. Тарасъев A.M., Ушаков В.Н. О построении стабильных мостов в минимаксной игре сближения-уклонения. Свердловск, 1983. 61 с. Деп. в ВИНИТИ 19.04.83 N 2454-83.

41. Третьяков В.Е. К теории стохастических дифференциальных игр // Докл. АН СССР. 1983. Т.269, N 3. С. 1049 1053.

42. У хоботов В. И. Синтез гарантированного управления на основе аппроксимационной схемы / / Труды института математики и механики УрО РАН. 2000. Т.6, N 1. С. 239 246.

43. Ушаков В.Н. Экстремальные стратегии в дифференциальных играх с интегральными ограничениями // Прикл. математика и механика. 1972. Т.36, вып.1.

44. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т.99, N 3. С. 394 420.

45. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.:Наука, 1988. 319 с.

46. Черноусько Ф.Л. Меликян А.А. Игровые задачи управления и поиска. М.:Наука, 1978. 270 с.

47. Чикрий А.А. Конфликтно управляемые процессы. Киев: Науко-ва Думка, 1992. 384 с.

48. Ширяев А.Н. Вероятность. М.:Наука, 1980. 576 с.

49. АиЫп J.P., Cellina A. Differential inclusion. N.Y.;B.:Springer-Verl., 1984. 324 p.

50. Basar Т., Olsder J. Dynamic non cooperative game theory. N.Y.:Acad. Press, 1982. 430 p.

51. Blaquiere A., Leitman G. Quantitative and Qualitative Games. N.Y.rAcad. Press, 1969. 80 p.

52. Crandall M.G., Lions P.L. Viscosity solutions of Hamilton-Jacoby equations // Trans. Amer. Math. Sos., 1983. Vol.277, no.l. P. 1 42.

53. Elliott R.J., Kalton N.J. The existence of value in differantial games of pursuit and evasion //J. Different. Equat. 1972. Vol.12, no.3. P. 504 523.

54. Fleming W.H. The convergence problem for differential games. // J.Math. Anal, and Appl. 1961. Vol.3. P. 102 116.

55. Fleming W.H. The convergence problem for differential games.II // Ann. Math. Stud., 1964. No.52. P. 195 210.

56. Friedman A. Differential games. N.Y.:Wiley Intersci., 1971.

57. Ho Y.C. A note on linear-quadratic pursuit-evasion differential games // J. Optimiz. Theory and Appl., 1970. Vol.1, no.6. P .449 -451.

58. Ho Y.C., Bryson А.Е., Baron S. Differential games and optimal pursuit-evasion strategies // IEEE Trans. Automat. Control, 1965. Vol.10, no.4. P. 385 389.

59. Lions P.L. Optimal control and viscosity solutions / / Lect. Notes Math., 1985. Vol.1119. P. 94 112.

60. Varaiya P., Lin J. Existence of saddle points in differantial games // Ibid. 1969. Vol.7., no.l. P. 141 157.

61. Коврижных А.Ю. Об одной игровой задаче с геометрическими ограничениями эллиптического типа // Молодеж. конф. "Проблемы теорет. и прикл. математики": Тез. докл. конф. N 25 26, сост. в 1994 - 1995 годах. Екатеринбург: УрО РАН, 1995. С. 47.

62. Kovrizhnykh A. Y. Limit scheme of the game value calculation^ Предельная схема вычисления цены игры //3 Междунар. семин. "Негладк. и разрыв, задачи упр. Оптимиз. и их прил.", Санкт-Пертербург, 1995]: Тез. докл. СПб., 1995. 4.1. С. 57- 58.

63. Коврижных А.Ю. Об одной задаче конфликтного управления с позиционным показателем качества // Молодеж. конф. "Проблемы теорет. и прикл. математики": Тез. докл. конф. N 27, сост. в 1996 году. Екатеринбург: УрО РАН, 1996. С. 35 36.

64. Коврижных А.Ю. К задаче конфликтного управления с позиционным показателем качества. / / Украинская конференция " Моделирование и исследование устойчивости систем": Тез. докл. Киев, 1996. С. 64.

65. Kovrizhnykh А. Yu. On the game value calculation with a nonterminal quality index // The Fourth International Workshop "Multiple Criteria and Game Problems under Uncertainty". Orekhovo Zuevo, 1996.:Book of Abstracts, Moskow, 1996. C. 144.

66. Коврижных А.Ю. Об одной дифференциальной игре на мини-макс позиционного функционала // Молодеж. конф. "Проблемы теорет. и прикл. математики": Тез. докл. конф. N 28. Екатеринбург: УрО РАН, 1997. С. 55.

67. Коврижных А.Ю. Предельная схема вычисления цены игры // Изв. РАН. Сер. Теория и системы упр. 1997. N 1. С. 95 99.

68. Kovrizhnykh A.Yu. On the Construction of the Value of the Game with Some Quality Indices / / Nonsmooth and Discontinuous Problems of Control and Optimiz., Chelyabinsk, June, 17-20, 1998: Proc. Intern. Workshop / IFAC. Chelyabinsk, 1998. P. 117 118.

69. Коврижных А.Ю. О построении цены игры для некоторых показателей качества // Проблемы теорет. и прикл. математики: Тез. докл. 29-ой Регион, молодеж. конф., 26-30 янв. 1998 г. Екатеринбург: УрО РАН, 1998. С. 44.

70. Коврижных А.Ю. Об одной дифференциальной игре на мини-макс квазипозиционного функционала. // Проблемы теорет. и прикл. математики: Тез. докл. 30-ой Регион, молодеж. конф. Екатеринбург: УрО РАН, 1999. С. 58 59.

71. Коврижных А.Ю. О вычислении цены дифференциальной игры на минимакс позиционного функционала // Изв. УрГУ. 1999. N 14. С. 47 64.

72. Kovrizhnykh A.Yu. On the Problem of Conflict with a Quasipositional Functional // Proceedings of the Steclov Institute of Mathematics, Suppl. 2, 2000, p. S79 S93.

73. Коврижных А.Ю. Об одной квазипозиционной дифференциальной игре // Современные методы в теории краевых задач. " Пон-трягинские чтения -ХГ':Тез. докл. ВВМШ. Воронеж: 2000, с. 84.

74. Коврижных А.Ю. О построении цены дифференциальной игры с позиционным функционалом качества // Дифференц. уравнения, 2001. Т.37. N 5. С. 638 647.