Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх

Мухтаров, Магзум

Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Мухтаров, Магзум АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Караганда МЕСТО ЗАЩИТЫ

1984 ГОД ЗАЩИТЫ

01.01.02 КОД ВАК РФ

Диссертация по математике на тему «Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх»

Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Мухтаров, Магзум

Введение.

Глава I. Игровые задачи со свободным правым! концом

1,1. Постановка задачи

1-2. Решение линейной задачи. II

1-3. Метод решения задача I.I.I в случае квазилинейного объекта.-.

1.4. Метод, решения задачи, I.I.2 в случае квазилинейного объекта.

1.5. Итерационная процедура вычисления оптимального управления в квазилинейном случае.

1.6. Иллюстрирующий пример.

Глава П. Согласованное управление динамическими системами при условии минимума энергии

2.1. Постановка задачи.

2.2. Метод решения линейной задачи.

2.3. Метод: последовательных приближений решения задачи 2.I.I

2.4. Метод решения квазилинейной задачи.

2.5. Итерационная процедура решения задачи (2.1.I) -(2.1.5) в случае квазилинейного объекта.

2.6. Иллюстрирующий пример.

Глава Ш. Согласованное управление динамическими системами при условии минимума квадратичных функционалов на верхнем уровне

3.1. Постановка задачи.

3.2. Метод решения линейной задачи.

3.3. Метод решения квазилинейной задачи.

3.4. Иллюстрирующий пример.

Введение диссертация по математике, на тему "Итерационные методы построения оптимальных программных управлений в некоторых квазилинейных иерархических играх"

Теория дифференциальных игр - один из новых интенсивна развивающихся разделов математической теории, оптимальных управляемых процессов. Ее появление и, развитие в конце пятидесятых - на« чале шестидесятых годов вызвано различными задачами современной техники. Основополагающие результаты в теории дифференциальных игр принадлежат Л.С.Понтрягину и R.H.Красовскому. Библиография работ, развивающих это направление, содержат около двух тысяч наименований. Отметим монография в статьи fl, 326, 33 , 50 , 51, 54, 62, 64] , в которых приведены наиболее важные результаты,дана оценка и характеристика основных направлений развития современной теории дифференциальных игр.

В данной диссертационной работе изучаются некоторые иерархические дифференциальные игры. В теории иерархических игр исследуются задачи управления, в которых игроки обладают* различными правами. Мы будем рассматривать двухуровневые иерархические задачи согласованного управления динамическими процессами игроками верхнего и нижнего уровней.

Предполагается, что оба игрока знают динамику управляемого процесса, его начальное состояние и, не получают1 информацию о текущих состояниях процесса вплоть до окончания игры. Это обстоятельство вынуждает игроков использовать управляющие воздействия, зависящие только от- времени и отвечающие заданной начальной позиции.

Игрок нижнего уровня имеет право первым выбрать свое управляющее воздействие, минимизируя заданный функционал, оценивающий качество процесса управления, а предполагая, что игрок верхнего уровня может использовать в процессе управления произвольные допустимые управляющие воздействия. Свое оптимальное управляющее воздействие игрок нижнего уровня сообщает игроку верхнего уровня. Последний, используя эту информацию, находит оптимальное управляющее воздействие, минимизируя свой функционал качества и в свою очередь сообщает его игроку нижнего уровня. Таким образом, результат рассматриваемой иерархической игры полностью определяется игроком верхнего уровня, который доминирует в течение всей игры, навязывая решение, отражающее главным образом его, интересы. Игрок нижнего уровня вынужден, приспосабливаться к стратегии игрока верхнего уровня иерархии.

Актуальность темы. Иерархические дифференциальные игры составляют одно из новых и интенсивно развивающихся в настоящее время направлений теории дифференциальных игр. Основы теории иерархических систем были заложены в работах Ю.Б.Гермейера [2l] и й.Н.Моисеева [43 ] в середине шестидесятых годов. Обзор наиболее важных результатов и направлений исследования этой теории содержится в первой главе книги [43в, с. 15-63] , написанной большим количеством авторов.

В последние годы к иерархическим задачам управления привлечено внимание многих исследователей: устанавливаются необходимые условия оптимальности управления игроков, изучаются вопросы существования оптимальных решений и разрабатываются алгоритмы их построения при различных предположениях относительно структуры иерархических систем: и характера информированности их различных уровней. Анализу таких вопросов посвящены работы [l2, 22, 23, 31, 42, 43, 47, 59-61, 63] .

Цель работы состоит в изучении некоторых двухуровневых задач иерархического координированного управления процессами, описываемыми квазилинейными дифференциальными уравнениями. При определенных предположениях обосновываются итерационное методы построения оптимальных программных управлений игроков верхнего и нижнего уровней для задач управления со свободным правым концом и с закрепленными концами при условии минимума квадратичных функционалов, оценивающих качество управления* Указываются эффективно проверяемые достаточные условия существования оптимальных решений.

Общая методика исследования. Работа опирается на принцип максимума Л.С.Понтрягина в теории оптимальных управляемых систем , методы классического вариационного исчисления, численные методы в теории оптимального управления, а также на основные факты теории обыкновенных дифференциальных уравнений, интегральных и интегро-дифференциальных уравнений.

Научная новизна и практическая ценность. Разработанный в диссертации метод последовательных приближений для формирования оптимальных программных управлений в иерархических системах является новым и может быть положен в основу практически реализуемых ал горитмов управления в прикладных задачах. Решение задачи получено в завершенном виде: в линейном случае построение оптимальных управлений сведено к решению некоторой системы линейных алгебраических уравнений, в квазилинейном случае оптимальное решение есть равномерный предел последовательности решений систем линейных алгебраических уравнений с переменной неоднородностью, зависящей от нелинейных членов в уравнениях движения и шага итерации. Поэтому алгоритмы иерархического программного управления, разработанные в данной работе, допускают аналитическую и численную реализацию на ЭВМ и могут найти применение в задачах экономики и многокритериальных задачах механики.

Краткое содержание работы. Диссертация состоит из введения, трех глав и списка литературы.

Заключение диссертации по теме "Дифференциальные уравнения"

Основные результаты работы:

I» Выведены необходимые, а при определенных предположениях и достаточные, условия оптимальности программных управлений игроков.

2. В линейном случае для игр типа (I) и (II) получены эффективна проверяемые достаточные условия существования и единственности оптимальных программных решений.

ЗАКЛЮЧЕНИЕ

Для двухуровневых иерархических игр, динамика которых на заданном конечном промежутке времени описывается квазилинейными дифференциальными уравнениями, разработаны методы построения оптимальных по Штакельбергу программных управлений. В зависимости от платы и граничных условий рассматриваются игры следующего типа:

I). Иерархическая игра со свободным, правым концом. Задано начальное состояние управляемого процесса, конечное состояние произвольно. Игроки формируют' оптимальные управляющие воздействия, последовательно минимизируя квадратичные функционалы, интегральная часть коагорых зависит от их управляющих воздействий и не зависит от фазовых координат.

П)* Иерархическая игра с закрепленным; концом. Задано начальное и конечное состояние управляемого процесса. Игроки формируют оптимальные управляющие воздействия, последовательно минимизируя интегральные квадратичные относительно их управляющих воздействий функционалы, которые не зависят от фазовых координат.

Ш). Иерархическая игра с закрепленными концами типа (П), но при условии, что интегральный функционал, оценивающий качество управления игрока верхнего уровня, квадратичен относительно фазовых координат и управляющих воздействий игроков.

Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Мухтаров, Магзум, Караганда

1. Айзеке Р. Дифференциальные игры. - М.: Мир, 1967, 479 с.

2. Альбрехт Э.Г., Шелементьев. Г.С. Лекции по теории стабилизации. Свердловск, изд-во Уральск.гос.универс. 1972, 273 с.

3. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976, 424 с.

4. Атанс М., §алб П. Оптимальное управление. М.: Машиностроение, 1968, 764 с.

5. Балакришнан А.В. Прикладной функциональный анализ. М.: Наука, 1980, 383 с.

6. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969, 408 с.

7. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. М.: Мир, 1972, 544 с.

8. Быков Я.В. О некоторых методах построения решений интегральных и интегро-дифференциальных уравнений. Фрунзе, изд-во АН КиргССР, 1971, НО с.

9. Вайсборд Э.М., Жуковский В.И. Введение в дифференциальные игры нескольких лиц и их приложения. М., Сов.радио, 1980,с.304.

10. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977, с.624.

11. Виграненко Т.И. Об одном классе линейных интегро-дифференциальных уравнений. Зап.Ленинград.горн.ин-та, 1956, 33, выл.З, с.161-176.

12. Вольтерра В. Теория функционалов, интегральных ш интегро-дифференциальных уравнений. М.: Наука, 1982, с.302.

13. Воробьев Н.Н. Современное состояние игр. Успехи матем.наук, 1970, вып.2, с.81-140.

14. Габасов Р., Кириллова $.М. Построение последовательных приближений для некоторых задач оптимального управления. Автомат и телемехан. 1966, №2, с.5-17.

15. Гагаев Б.М. Теоремы существования решений интегро-дифференциальных уравнений. ДАН СССР, 1952, 85, №3, с.469-472.

16. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966, с.576.

17. Гельфанд И.М., Фомин С.В. Вариационное исчисление. М.: §из-матгиз., 196I, с.228.

18. Гермейер Ю.М. а) об играх двух лиц с фиксированной последовательностью ходов. ДАН СССР, 1971, 198, №5, с.1001-1004. б) игры о непротивоположными интересами. М.: Наука, 1976, с.328.

19. Горелик В.А. Принцип гарантированного результата в неантаго-нических играх двух лиц с обменом информацией. В сб. Исследование операций. М.: изд-во ВЦ АН СОТ, 1971, вып.2, с.102-118.

20. Гороховик В.В., Кириллова Ф.М„ 0 линейных дифференциальных играх нескольких лиц. В кн.: Управляемые системы. Новосибирск, 1971, вып.10, с.3-9.

21. Дубовицкий А.Я., Милютин А.А. Необходимые условия слабого экстремума в общей задаче оптимального управления. М.: Наука, 1971, 113 с.

22. Женхэн 0. а) 0 существовании и единственности решений интеграл ьно-дифференциальных уравнений. ДАН СССР, 1952, 86, №2, с.229-230.

23. Зубов В.И. Лекции по; теории управления. М.: Наука, 1975, с. 495.

24. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974, 480 с.

25. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971, 399 с.

26. Карлин С. Математические методы в теории игр, программировании и экономике, М.: ИЛ, 1964, 838 с.

27. Колмогоров А.Н., Фомин С.В. Элементы теории и функционального анализа. М.: Наука, 1981, 542 с.

28. Кононенко А.Ф. а) Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов. IBM и МФ, 1973, №3, №2, с.311-317.

29. Теоретико-игровой анализ двухуровневой иерархической системыуправления IBM и МФ, 1974, 14, №5, c.II6I-II70.

30. Красовский E.R., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974, 455 с.

31. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973, 446 с.

32. Крейн С.Г. Линейные дифференциальные уравнения в банаховом пространстве. М.: Наука, 1967, 464 с.

33. Куржанский А.Б. О построении методом моментов оптимального управления, минимизирующего среднеквадратичную ошибку. Автомат. и телемехан., 1964, 25, №6, с.624-630.

34. Летов A.M. Математическая теория процессов управления. М.: Еаука, 1981, 255 с.

35. Лефшец С. Геометрическая теория дифференциальных уравнений. М.: Ш, 1961, 387 с.

36. Ли Э.Б., Маркус Л. Основы теории оптимального управления.М.: Наука, 1972, 574 с.

37. Люстерник Л,А., Соболев В.И. Элементы функционального анализа. М.: Наука, 1965, 520 с.41» Ляпунов A.M. Общая задача об устойчивости движения. М.: Госте хиздат, 1950, 472 с.

38. Меньшиков И.С. Иерархическая дифференциальная игра. Прикл. матем. и механ. 1979, т.42, вып.1, с.23-*27.

39. Мухтаров М. а) Об одной квазилинейной иерархической игре со свободным; правым концом. Деп. ВИНИТИ от 16 февраля 1984. №936-84, 23 с.б) Согласованное управление квазилинейной системой. Деп. ВИНИТИ от 16 февраля 1984. №935-84. 22 с.

40. Нейман Дж., Моргенштерн 0. Теория игр и экономическое поведение. М.; Наука, 1970, 707 с.

41. Неш Дж. Бескоалиционные игры. В кн. Матричные игры. М.: Физматгиз. 1961, с.205-221.

42. Пацюков 3.П. Дифференциальные игры при различной информированности игроков. М.: Сов.радио, 1976, с.200.

43. Петров Ю.П. Вариационные методы теории оптимального управления. М.-Л.: Энергия, 1977, с.208.

44. Петровский И.Г. Лекции по теории интегральных уравнений. М.: Наука, 1965, 127 с.50* Петросян Л.А. Дифференциальные, игры преследования. Л.г Изд-во Ленинградск.ун-та, 1977, 222 с.

45. Понтрягин Л.С. а) К теории дифференциальных игр. Успехи мат. наук, 1966, 21, №4, 219-274 с.б) Линейная дифференциальная игра убегания. В кн. Труды мат, ин-та им.Стеклова. М.: 1971, 112, с.30*63.

46. Понтрягин Л.С., Болтянский В,Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1976, 392 с.

47. Прасад У.К., Сарма И.Дж. Многокритериальные задачи оптимального управления: игровое кооперативное решение по; №эшу-Хар-сани. Автомат, и телемехан. 1975, Кб, с.95-106.

48. Пшеничный Б.Н. а) Структура дифференциальных игр. ДАН СССР, 1969, 184, №2, с.285-287.б) Необходимые условия экстремума. М.: Наука, 1982, с.142.

49. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1978, 551 с.

50. Сатимов Н. К задаче преследования в нелинейных дифференциальных играх. Кибернетика, Киев, 1973, №3, с.88-93.

51. Сейдж З.П., Уай Ч.С.Ш. Оптимальное управление системами. М., Радио и связь, 1982, с.392.

52. Степанов В.В. Курс дифференциальных уравнений. М.: Гостехиздат, 1950, 467 с.

53. StactcMezg И. тке Тк&огу of the Магле* Economy.

54. Oxfoiot oubUSun/y, (QxfonJ, ёпдЖзогЫ, /$fJL.

55. Siotrr A.W-;Ho Y-C. A/onzeZo~H^m JOctfeA&ntuxJL

56. Games J. of (SfJ- r/t.awf Jf>pt. /#6$. 1/3 /*3 .

57. SoTitxCun JU-j(mol Qraz fr/l ■ Mafc/iorbat Mptcfc-6fat. jy-a&ZeJe&ty ffactfeffl суп п&пъгъо-Нит?

58. GcumeJ.f.&J optJk.ctAbaf Jflrf/W м .

59. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981, с.288.

60. Тынянский Н.Т., Васильев Н.С. К иерархическим дифференциальным играм. В сб. Дифференциальные, бескоалиционные, кооперативные и статистические игры. Калинин, изд~во КГУ, 1979,с.3-25.

61. Флеминг У., Ришел Р. Оптимальное управление детерминированными. и стохастическими системами. М.: Мир, 1978, 316 с.

62. Цлаф Л. Я. Вариационное исчисление и интегральные уравнения. М.: Наука, 1970, 191 с.

63. Черноусько Ф.Л., Колмановский В.Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978, 352 с.

64. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. М.: Мир, 1974, 488 с.