Исследование и вычисление гарантированного результата в задачах позиционного управления тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Тарасьев, Александр Михайлович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Свердловск МЕСТО ЗАЩИТЫ
1984 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Исследование и вычисление гарантированного результата в задачах позиционного управления»
 
 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Тарасьев, Александр Михайлович

Введение.

§ I. Предварительные сведения из теории позиционных дифференциальных игр

§ 2. Сопряженные производные.

§ 3, Функция-унификатор.

§4. Оператор стабильного поглощения. . • •

§ 5« Построение стабильных мостов . 74

§ 6. Пример.

§ 7, 0 двух формализациях позиционных стратегий.

 
Введение диссертация по математике, на тему "Исследование и вычисление гарантированного результата в задачах позиционного управления"

В диссертации рассматриваются задачи управления, в которых требуется построить позиционную стратегию (управление по принципу обратной связи), гарантирующую определенное качество управляемого процесса при любой неизвестной заранее помехе. Задачи та -кого типа исследуются в рамках теории дифференциальных игр. Создание этой теории было обусловлено запросами практики. Быстрому ее развитию способствовали достижения математической теории оп -тимального управления. Современный облик теории дифференциальных игр в значительной мере определяется основополагающими работами советских математиков Н.Н,Красовского и Л.С,Понтрягина. Среди широкого круга зарубежных исследований следует выделить работы Р, Айзеке а и У.Флеминга, которые были среди первых в этой облас -ти.

В последнее время в теории дифференциальных игр значите ль -ное внимание уделяется исследованиям, направленным на развитие вычислительных методов. Конечной целью этих исследований должна быть разработка вычислительных программ для решения на ЭВМ раз -личных задач, относящихся к теории дифференциальных игр. В частности, важной проблемой является задача построения стабильных мостов, т.е. таких множеств в пространстве позиций, из которых разрешима задача гарантированного управления.

Существующие в настоящее время алгоритмы для решения этой проблемы базируются на так называемой попятной конструкции (конструкции альтернированного интеграла). Эта конструкция изучалась во мшгих работах (см., например, [20,36,40,58,603), где она использовалась, в основном, для теоретических построений. Доведение этой конструкции до практически реализуемых алгоритмов потребовало дополнительных исследований. Существующие в настоящее время программы позволяют строить стабильные мосты для управляемых систем второго и третьего порядка (см., например, 17,8,28,31,35,48, 503). Ограничения m размерность системы вызваны большим объемом вычислений и памяти, необходимых при реализации попятной конструкции.

Важную роль в решении задач управления играют также исследования, подготавливающие базу для новых вычислительных методов. Как известно, функция цены и границы стабильных мостов лишь в редких случаях обладают гладкостью. Однако, как правило, они являются кусочно-гладкими. Поэтому представляет интерес изучение свойств кусочно-гладких границ стабильных мостов и функций цены. Такое исследование может подсказать новые направления для разработки экономичных вычислительных методов, использующих современный ап -парат теории приближения функций, в частности, сплайнов.

В настоящей диссертации представлены как исследования общих свойств функции цены, которые могут оказаться полезными при соз -дании базы для новых вычислительных алгоритмов, так и исследова -ния, дающие непосредственный выход на разработку численных мето -дов.

Материал диссертации разбит на семь параграфов. Леммы и теоремы в параграфах нумеруются двумя цифрами, первая из которых указывает номер параграфа, вторая - номер утверждения. Аналогич -ная нумерация принята и для формул.

Первый параграф носит вводный характер. Здесь изложены необходимые сведения из теории дифференциальных игр.

Во втором параграфе введены понятия верхних и нижних сопря -женных производных локальш-липшицевых функций. Они определяются как результат известной в выпуклом анализе операции сопряжения, выполняемой над нижними или верхними производными исходной фикции. Изучены некоторые свойства сопряженных производных. Для описания динамики управляемой системы используется понятие функции-унификатора. Доказана теореш, утверждающая, что функция-унификатор является мажорантой, (минорантой) для нижней (верхней) сопря -же иной производной лока ль но-липшицев ой функции цены дифференциальной игры. Эта теореш содержит необходимые и достаточные условия, которым должна удовлетворять функция цены, и продолжает исследо -вания по унификации дифференциальных игр [17,183 •

В § 3 рассматриваются некоторые приложения теорем, получен -ных в § 2, и выясняется роль функции-унификатора. Установлено, что необходимые и достаточные условия из § 2 являются обобщением известюго уравнения Айзекса-Беллмана. Показано, что с помощью теорем из § 2 можно получить новое простое доказательство следующего известюго факта теории дифференциальных игр. Если функции-унификаторы двух дифференциальных игр с одинаковыми функциями платы связаны опредеданным неравенством (равенством), то соответ ствующие функции цены будут связаны тем же соотношением. Указан вид необходимых и достаточных условий, которым должна удовлетво -рять функция цены, в случае, когда невыполнено условие седловой точки в маленькой игре. Демонстрируется возможность применения полученных теорем для исследования структуры сингулярных поверх -ностей, в точках которых функция цены недифференцируема. На основе результатов из § 2 выводится условие регулярности функции про-граммюго (детерминированного) максимина. Это условие получается в форме, которая была предложена Н.Н.Красовским на семинаре по теории управления в Институте математики и механики УНЦ АН СССР. Доказана эквивалентность необходимых и достаточных условий из § 2 и условий, фигурирующих в определении вязкого решения уравнения Айзекса-Беллмана (Гамильтона-Якоби), из работ С56,57] .

В четвертом и пятом параграфах рассматривается вопрос о построении множества позиционного поглощения в задаче сближения с компактной целью в фиксированный момент времени.

В § 4 предлагается форма оператора стабильного поглощения, которая является достаточно общей и в то же время удобной для разработки вычислительных алгоритмов. Для этого вводится много -значное отображение, определенное на пространстве позиций и удовлетворяющее ряду условий. Основным условием является соотношение, связывающее это отображение и функцию-унификатор управляемой системы, Оператор стабильного поглощения определяется в терминах упомянутого многозшчного отображения. Приводятся примеры, демонстрирующие полезные качества введенной конструкции.

В § 5 вводятся понятия аппроксимирующего оператора стабиль -ного поглощения и системы множеств, аппроксимирующей множество позиционного поглощения. Эти понятия нацелены на приближенное вычисление максимальных стабильных мостов. Дается определение пре -дела аппроксимирующей системы множеств при шаге попятной процедуры, стремящемся к нулю, и доказывается, что таким пределом явля -ется множество позиционного поглощения. Результаты §§ 4 и 5 с&ли использованы при разработке алгоритмов построения стабильных мостов для систем второго порядка. Эти алгоритмы реализованы в виде программ, составленных на языке Фортран. Изложение одного из них содержится в [483 . В конце пятого параграфа приведены расчеты, выполненные программой, которая основана на предложенной конструкции.

Материал §§ 4 и 5 примыкает к исследованиям [17,21,50,511 .

В § 6 рассмотрен пример нерегулярной дифференциальной игры, для которого с помощью процедуры, обоснованной в четвертом и пя -том параграфах, получено аналитическое описание функции цены. Задача построения функции цены даже для систем с простой динамикой является достаточно сложной. Это обстоятельство объясняется тем, что, как правило, в пространстве позиций имеются так называемые сингулярные множества, на которых функция цены недифференцируема. Структура же сингулярных поверхностей обычно бывает весьма елок -ной. Хотя в исследованном примере уравнения движения и функционал платы довольно просты, тем не менее, он в полной мере демоштри -рует упомянутые трудгости вычисления функции цены. Доказано, что необходимые и достаточные условия, полученные в [44,45] ^условия, изложенные в § 2 настоящей работы, могут служить эффективным инструментом для проверки того, что сконструированная функция позиции есть цена игры,

В последнем, седьмом параграфе рассматривается вопрос о сравнении оптимальных гарантированных результатов задачи управления для двух формализаций позиционных стратегий, В первой формализа -ции позиционные стратегии отождествляются с произвольными функциями, а соответствующие им движения определяются предельным пере -ходом от пошаговых движений (ломаных Эйлера), Известно, что оптимальный результат, который могут гарантировать такие стратегии, совпадает с оптимальным результатом в противоположной задаче, которая рассматривается в классе контрстратегий (теорема об альтернативе в минимаксной дифференциальной игре С203 ), Во второй формализации позиционные стратегии отождествляются с функциями Каратеодори. Движения, порожденные такого рода стратегиями, определяются как решения (в смысле Каратеодори) соответствующих диф -ференциальных уравнений. Показано, что результат, который можно обеспечить в рамках второй формализации, нв лучше, чем результат, достижимый в рамках первой формализации. Доказательство этого факта требует специальных построений вследствие того, что позиционные стратегии, рассматриваемые в рамках второй формализации, и контрстратегии из первой формализации, вообще говоря, несовместны.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Тарасьев, Александр Михайлович, Свердловск

1. Айзеке Р. Дифференциальные игры. - М.: Мир, 1967. - 479 с.

2. Алексейчик М.И. Дальнейшая формализация основных элементов антагонистической дифференциальной игры. В кн.: Мат.анализ и его прилож., т. 7. Ростов-на-Дону: Ростов, ун-т. 1975,с. I9I-I99.

3. Альбрехт Э.Г. О встрече квазилинейных объектов в регулярном случае. Прикл. математика и механика, 1971, т. 35, вып. 4, с. 569-574.

4. Альбрехт Э.Г., Логинов М.И. О непрерывной зависимости жней -ной игры сближения от параметра. Прикл. математика и меха -ника, 1976, т. 40, вып. 2, с. 208-212.

5. Батухтин В.Д. О дифференцируемости цены дифференциальной игры сближения. Дифференц. уравнения, 1972, т. 8, $ 12, с. 21402148.

6. Батухтин В.Д., Ченцов А.Г. Об одной программной конструкции в позиционной дифференциальной игре. Изв. АН СССР, Серия матем., 1975, т. 39, Л 4, с. 926-936.

7. Боткин Н.Д. Оценка погрешности численных построений в диффе -ренциальной игре с фиксированным моментом окончания. Пробл. управления и теории информ., 1982, т. II, JS 4, с, 283-295.

8. Боткин Н.Д., Пацко B.C. Позиционное управление в линейной дифференциальной игре. Изв. АН СССР, Техн.кибернетика, 1983, й 4, с. 75-78.

9. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. - 624 с.

10. Григоренко Н.Л. О нелинейной задаче преследования несколькими объектами. Вестник Москов. Унив. Сер. Вычисл. Матем.Кибернет. 1981, В I, с. 60-69.

11. Григоренко Н.Л. Игра простого преследования-убегания группыпреследователей и одного убегающего. Вестник Москов. У нив. Сер. Вычисл. Матем. Кибернет., 1983, I I, с. 41-47.

12. Демьянов В.Ф. Минимакс: дифференцируемоеть по направлениям. -Л.: Изд-во ЛГУ, 1974. 112 с.

13. Демьянов В.Ф., Васильев JT.B. Недифференцируемая оптимизация.-М.: Наука, 1981. 384 с.

14. Красовский А.Н. Дифференциальная игра для позиционного фу нес -ционала. Докл. АН СССР, 1980, т. 253, 6, с. 1303-1307.

15. Красовский А.Н., Красовский Н.Н., Третьяков В.Е. Стохастический программный синтез для детерминированной позиционной дифференциальной игры. Прикл. математика и механика, 1981,т. 45, вып. 4, с. 579-586.

16. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. - 420 с.

17. Красовский Н.Н. К задаче унификации дифференциальных игр, -Докл. АН СССР, 1976, т. 226, Я 6, с. 1260-1263.

18. Красовский Н.Н. Унификация дифференциальных игр. В кн.: Игровые задачи управления. Свердловск: УНЦ АН СССР, 1977, с. 3244.

19. Красовский Н.Н. Дифференциальные игры, Аппроксимационные и формальные модели. Матем. сборник, 1978, т. 107(149), 15 4 (12), с, 541-571.

20. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. - 456 с.

21. Красовский Н.Н., Субботин А.И. Аппроксимация в дифференциальной игре. Прикл. математика и механика, 1973, т. 37, вып.2, с. 197-204.

22. Красовский Н.Н., Субботин А.И., Ушаков В.Н. Минимаксная дифференциальная игра. Докл. АН СССР, 1972, т. 206, 13 2,с, 277-280.

23. Красовский Н.Н., Третьяков В.Е. Стохастический программный синтез для позиционной дифференциальной игры. Докл. АН СССР, 1981, т. 259, J& I, с. 24-27.

24. Красовский Н.Н., Третьяков В.Е. Одна задача оптимального управления на минимум гарантированного результата. Изв. АН СССР, Техн.кибернетика, 1983, В 2, с. 6-23.

25. Кряжимский А.В, Альтернатива в линейной игре сближения-уклонения с неполной информацией. Докл. АН СССР, 1976, т. 230, JS 4, с. 773-776.

26. Кряжимский А.В. К теории позиционных дифференциальных игр сближения-уклонения. Докл. АН СССР, 1978, т. 239, ti 4, с. 779-782.

27. Куржанекий А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.

28. Никольский М.С. Некоторые вычислительные аспекты 1-го прямого метода Понтрягина в дифференциальных играх. Вестник Москов. У нив. Сер. Вычисл.Матем.Кибернет., 1980, № 4, с. 2732.

29. Никольский М,С. Об альтернированном интеграле Л.С.Понтряги -на. Матем. сборник, 1981, т. 116(158), В 1(9), с. 136-144.

30. Никольский М.С. Об одном прямом методе решения линейных дифференциальных игр преследования-убегания. Матем.заметки, 1983, т. 33, JS 6, с. 885-891.

31. Остапенко В.В. Приближенное решение задач с ближе ния-у к лоне -ния в дифференциальных играх, Докл. АН СССР, 1982, т. 263, & I, с. 30-34.

32. Остапенко В.В. Методы решения одного класса задач сближения-уклонения. Автоматика и телемеханика, 1984, й 6, с. 42-46.. < I • » t

33. Пацко B.C., Тарасова С.И. Дифференциальная игра сближения сфиксированным моментом окончания, Свердловск, 1983, - П2с.- Рукопись представлена Ин-том математики и механики УЩ АН СССР. Деп. в ВИНИТИ 26 сент. 1983, JS 5320-83.

34. Петров Н.Н. Существование значения игры преследования. -Дифференц. уравнения, 1971, т. 7, 15, с. 827-839.

35. Пономарев А.П. Оценка погрешности численного метода построе -ния альтернированного интеграла Понтрягина. Вестник Мое ков. У нив. Сер. Вычисл. Матем. Кибернет., 1978, й 4, с. 37-43.

36. Понтрягин Л.С. 0 линейных дифференциальных играх. I. Докл. АН СССР, 1967, т. 174, В 6, с. 1278-1280.

37. Понтрягин Л.С. 0 линейных дифференциальных играх. 2. Докл. АН СССР, 1967, т. 175, й 4, с. 764-766.

38. Понтрягин JT.C. Линейные дифференциальные игры преследования.- Матем. сборник, 1980, т. 112, J5 3, с. 307-330.

39. Пшеничный Б.Н. Выпуклый анализ и экстрешльные задачи. М.: Наука, 1980. - 319 с.

40. Пшеничный Б.Н, Структура дифференциальных игр. Докл. АН СССР, 1969, т. 184, й 2, с. 285-287.

41. Пшеничный Б.Н,, Сагайдак М.И. О дифференциальных играх с фиксированным временем. Кибернетика, 1970, JS 2, с. 54-63.

42. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. - 469 с.

43. Субботин А.И. Обобщение основного уравнения теории дифферен -циальных игр. Докл. АН СССР, 1980, т. 254, Г& 2, с. 293-297.

44. Субботин А.И., Субботина Н.Н. Необходимые и достаточные условия для кус очно-гладкой цены дифференциальной игры. Докл. АН СССР, 1978, т. 243, JS 4, с. 862-865.

45. Субботин А.И., Субботина Н.Н. Свойства потенциала дифференциальной игры. Прикл. математика и механика, 1982, т. 46, вып. 2, с. 204-211.

46. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. - 288 с.

47. Тарасьев A.M. О построении функции цены в одной нерегулярной дифференциальной игре с фиксированным моментом окончания. -Свердловск, 1983. 42 с. - Рукопись представлена Урал.ун-том Деп. в ВИНИТИ 5 мая 1983, № 2455-83.

48. Тарасьев A.M., Ушаков В.Н. Построение системы множеств, аппроксимирующей максимальный минимаксно U -стабильный мост. В сб.: Алгоритмы и программы решения линейных дифференциальных игр. Свердловск: УНЦ АН СССР, 1984, с.159-190.

49. Тарасьев A.M., Ушаков В.Н. О построении стабильных мостов в минимаксной игре сближения-уклонения. Свердловск, 1983. -60 с. - Рукопись представлена Урал.ун-том. Деп. в ВИНИТИ5 мая 1983, № 2454-83.

50. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения. Изв.АН СССР, Техн.ки -бернетика, 1980, № 4, с.29-36.

51. Ушаков В.Н. К теории минимаксных дифференциальных игр. I. -Свердловск, 1980. 187 с. Рукопись представлена Ин-том математики и механики УНЦ АН СССР. Деп. в ВИНИТИ I сент. 1980, Ш 4425-80.

52. Федоренко Р.П. О задаче Коши в теории преследования. Журнал вычисл. матем. и матем. физики, 1969, т.9, № 5, с.1036-1045.

53. Ченцов А.Г. Об игровых задачах сближения-уклонения. Прикл. математика и механика, 1974, т.38, вып.2, с.211-223.

54. Ченцов А.Г. К игровой задаче наведения. Докл.АН СССР, 1976, т.226, Ш I, с.73-76.

55. Черноусько Ф.Л., Меликян А.А. Игровые задачи управления и поиска. М.: Наука, 1978. - 270 с.

56. Barron Е.П., Evans L.C., Jensen R. Viscosity solutions of Isaacs' equations and differential games with Lipschitz controls.- J. Different. Equat., 1984, vol.53, no.2, p.213-233.

57. Crandall M.G., Lions P.L. Viscosity solutions of Hamilton-Jacobi equations.- Trans. Amer. Math. Soc., 1983, vol.277, no.1, p.1-42.

58. Fleming W.H. The convergence problem for differential games. J. Math. Analysis & Appl., 1961, vol.3, no.1, p.102-116.

59. Fleming W.H. The convergence problem for differential games, II.- Ann. Math. Studies, 1964, no.52, p.195-210.

60. Friedman A. Differential games.- New York: Wiley Intersci., 1971.- 350 p.