Информация и равновесие в многошаговых играх

Слобожанин, Николай Михайлович

Информация и равновесие в многошаговых играх тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Слобожанин, Николай Михайлович АВТОР

доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

2012 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Диссертация по математике на тему «Информация и равновесие в многошаговых играх»

Автореферат диссертации на тему "Информация и равновесие в многошаговых играх"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Слобожанин Николай Михайлович

ИНФОРМАЦИЯ И РАВНОВЕСИЕ В МНОГОШАГОВЫХ ИГРАХ

01.01.09 — дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук

005013520

1 5 МАР Ш

Санкт-Петербург — 2012

005013520

Работа выполнена в Санкт-Петербургском государственном университете на факультете прикладной математики - процессов управления.

Научный консультант: доктор физико-математических наук,

профессор Л.А. Петросян (СПбГУ)

Официальные оппоненты: доктор физико-математических наук,

профессор Захаров Виктор Васильевич (СПбГУ)

доктор физико-математических наук, профессор Луценко Михаил Михайлович (ПГУПС, Санкт-Петербург) доктор физико-математических наук, профессор Мазалов Владимир Викторович (ИПМИ Карельского НЦ РАН, Петрозаводск)

Ведущая организация: Вычислительный центр

им. A.A. Дородницына РАН

Защита состоится "25"апреля 2012 г. в 16 часов на заседании диссертационного совета Д-212.232.59 по защите диссертации на соискание учёной степени доктора физико-математических наук при Санкт-Петербургском государственном университете по адресу: 199004, г. Санкт-Петербург, Средний пр. В.О., 41.

С диссертацией можно ознакомиться в библиотеке им. М Петербургского государственного университета, по адресу: Петербург, Университетская наб., 7/9.

. Горького Санкт-199034, г. Санкт-

Автореферат разослан "_"_2012 г.

Учёный секретарь

диссертационного совета Д-212.232.59 доктор физико-математических наук,

профессор • В.Д. Ногин

ОБЩАЯ ХАРАКТЕРИСТИКА' РАБОТЫ'

Актуальность темы. Теория многошаговых игр занимается изучением управления изменяющихся систем в условиях конфликта цли, неполноты информации. По этой причине на протяжении последних восьми десятилетий наблюдается большой интерес к созданию математических моделей, теории и методов решения многошаговых игр. • : .

Основой построения математической модели конфликтного процесса является строгое адекватное действительности определение его информационной структуры. Первоначально в работах Джона фон Неймана, Г. Куна и др. для конечных многошаговых игр с зависимой динамикой (позиционных игр) информационная структура процесса моделировалась посредством разбиения пространства игры на информационные множества игроков. Это безусловно строгий подход, но обладает одним существенным недостатком - чрезмерной общностью подхода, что затрудняет построение методов нахождения оптимальных стратегий игроков. Основополагающей работой по информационному анализу позиционных игр является работа Г. Куна "Позиционные игры и проблема информации", в которой автор для конечных игр доказал теорему о необходимых и достаточных условиях равенства выигрыша игроков в смешанных стратегиях и соответствующих им стратегиях поведения. Это условие было названо Куном полной памятью для игроков. В дальнейшем эта теорема была обобщена Л.А. Петросяном для бесконечношаговых позиционных игр с конечным множеством альтернатив и нобелевским лауреатом Р. Дж. Ауманом для бесконечношаговых позиционных игр с множеством альтернатив произвольной мощности. Однако, отметим, что требование полной памяти довольно сильное требование (игрок в каждый момент времени должен помнить всё, что совершил и знал ранее). При более слабых ограничениях на.память игрока в игре теоремы об эквивалентности некоторого подкласса смешанных стратегий всему классу смешанных стратегий были доказаны Н. Н. Воробьёвым.

JI. Э. Дубинсом эта игра была решена для постоянной задержки информации у корабля равной двум - и полной информации у бомбардировщика при конечных альтернативных множествах. Автором настоящей диссертации в 1981 г. доказана теорема о необходимых и достаточных условиях оптимальности стратегий поведения корабля для случая произвольной конечной задержки информации у корабля. Одной из первых фундаментальных работ в области многошаговых игр с разделёнными динамиками является работа X. Э. Скарфа, Л. С. Шепли "Игры с неполной информацией". В ней авторы рассмотрели бес-конечношаговые антагонистические игры с постоянными положительными задержками информации у игроков, с конечными альтернативными множествами. При предположении непрерывности функции выигрыша были получены функциональные уравнения, связывающие значения подыгр соседних уровней. На основании этих уравнений был получен метод решения упомянутого выше класса многошаговых игр.

В 1969 году вышла работа Д. Блэкуэлла, в которой автор исследовал вопрос существования значения в играх с конечными альтернативными множествами, с нулевыми задержками информации, с функциями выигрыша, имеющим вид характеристических функций. В 1972 году были опубликованы работы М. Ор-кина об играх, рассмотренных X. Э. Скарфом и Л. С. Шепли, в которых изучен вопрос о приближении значения игры значениями других игр, функции выигрыша которых сходятся сверху к функции выигрыша первоначальной игры.

Говоря об играх с неполной информацией, необходимо сказать о довольно развитой области теории игр с неполной информацией - дифференциальных играх с неполной информацией, которые могут быть сведены к играм с полной информацией, что в свою очередь позволяет использовать известный аппарат дифференциальных игр. В значительной степени этот класс игр был исследован Н. Н. Красовским и его учениками. Этому же вопросу посвящены работы Ф. Л. Черноусько и A.A. Меликяна. Представляют интерес работы М. С. Никольского, в которых приводятся достаточные условия для завершения преследования за конечное время при неполном знании преследователем фазового положения или динамики убегающего. Проблема вывода функциональных интегральных уравнений в дифференциальных играх преследования с постоянной задержкой информации у преследователя, несводимых к играм с полной информацией, нашла отражение в работах Л. А. Петросяна. Значение информации о функции цели противника в играх двух лиц, основы информационной теории иерархических систем, исследованы в работах Н. Н. Моисеева,

Ю. Б. Гермейера, А. Ф. Кононенко и его учеников. Анализ равновесия в различных классах стратегий в дифференциальных играх с полной информацией приведён в работах А. Ф. Кононенко, О. А. Малафеева, С. В. Чистякова. Прикладные аспекты теории многошаговых игр исследованы в работах А. А. Васина, В. В. Мазалова и других зарубежных и отечественных учёных.

В настоящей диссертации впервые информационная структура многошаговых игр с разделёнными динамиками моделируется посредством информационных вектор-функций игроков. Производится анализ таких функций. Последнее позволяет, в частности, для антагонистических игр с переменными задержками информации у игроков, произвольной продолжительности (как конечной, так и бесконечной), с динамиками, определяемыми произвольными функциями достижимости, получить функциональные интегральные уравнения, связывающие значения подыгр соседних уровней. На базе этих уравнений в диссертации строится метод решения многошаговых антагонистических игр с неполной информацией." Таким образом, на основании вышеизложенного можно утверждать, что в диссертации исследуется актуальные проблемы конфликтных процессов.

Цель работы заключается в построении математической модели развёрнутой формы многошаговых игр с разделёнными динамиками с множеством игроков произвольной мощности, основой которой является определение информационной структуры игры, а также методов и алгоритмов решения различных подклассов рассматриваемого класса игр.

Методы исследования. Доказательство основных результатов диссертации опираются на классические методы теории игр, функционального анализа и теории вероятностей.

Научная новизна. Впервые для описания информационности игрока в многошаговых играх с разделёнными динамиками вводится информационная вектор-функция. Впервые приведена аксиоматика развёрнутой формы многошаговых игр с разделёнными динамиками, основой которой является, введённое и исследованное в диссертации, условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций.

ными динамиками это не всегда так. Впервые получена и доказана теорема о необходимых и достаточных условиях, когда упомянутое отображение непрерывно для игр с разделёнными динамиками. Это условие связывает геометрические и информационные характеристики многошаговой игры.

На базе упомянутой выше теоремы для многошаговых игр с разделёнными динамиками с не более чем счётным множеством игроков, с полной информацией, произвольной продолжительности, с произвольными непрерывными функциями выигрыша доказана теорема о необходимых и достаточных условиях существования равновесия по Нэшу в чистых стратегиях, которая развивает и обобщает теоремы Цермело-Неймана и Гейла-Стюарта. Для того же класса игр для полунепрерывных сверху функций выигрыша доказаны теоремы существования е -равновесия в игре в чистых стратегиях и построены алгоритмы нахождения е - равновесных чистых стратегий. Доказана также теорема существования седловой точки в играх преследования с полной информацией в произвольном пространстве, когда выигрыш преследователя определяется поглощением преследуемого множеством достижимости преследователя.

Для многошаговых игр с разделёнными динамиками, с множеством игроков произвольной мощности впервые вводится понятие измеримой стратегии поведения, по ситуации в измеримых стратегиях поведения строится мера на множестве траекторий игры, исследуются свойства этой меры.

Впервые для многошаговых антагонистических игр с переменными задержками информации у игроков, которые могут принимать отрицательные значения, вводится определение подыгры. Впервые для того же класса игр на основании полученных в диссертации свойств меры на множестве траекторий игры вводятся и обосновываются функциональные интегральные уравнения, связывающие значения подыгр соседних уровней. Эти уравнения развивают и обобщают уравнения X. Э. Скарфа, Л. С. Шепли, Л. А. Петросяиа.

На базе функциональных интегральных уравнений впервые определяется и обосновывается метод решения многошаговых антагонистических игр с разделёнными динамиками, с переменными задержками информации у игроков.

планирования с заранее неопределёнными параметрами. Введённые в диссертации информационные вектор-функции и условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций могут быть использованы для дальнейшего исследования информационных конфликтных процессов, в частности, для информационной классификации таких процессов, начало которой приведено в диссертации.

Положения, выносимые на защиту.

1. Математический анализ информационной структуры многошаговых игр с разделёнными динамиками и на базе этого аксиоматика развёрнутой формы многошаговых игр с разделёнными динамиками, основой которой является условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций.

2. Необходимые и достаточные условия непрерывности отображения, сопоставляющего ситуации в чистых стратегиях единственную порождённую ею стратегию для многошаговых игр с разделёнными динамиками. Получение с помощью этого условия необходимых и достаточных условий существования равновесия по Нэшу, е - равновесия в многошаговых играх с полной информацией и седловой точки в играх преследования с полной информацией.

3. Построение меры на множестве траекторий многошаговой игры с разделёнными динамиками с множеством игроков произвольной мощности по измеримым стратегиям поведения. Исследование свойств этой меры.

4. Построение о обоснование функциональных интегральных уравнений, связывающих значения подыгр соседних уровней для многошаговых антагонистических игр с переменной задержкой информации.

5. На базе функциональных интегральных уравнений построение метода решения многошаговых антагонистических игр с разделёнными динамиками, с переменными задержками информации у игроков.

Апробация работы. Основные положения и результаты работы докладывались и обсуждались на международном конгрессе по компьютерным системам и прикладной математике (Санкт-Петербург, 1993 г.); международной конференции по интегральным и алгебраическим вычислительным методам в науке и технике "Интеграл - 94"(Санкт-Петербург. 1994 г.); международных

научных конференциях "Многокритериальные и игровые задачи"(Орехово-Зуево, 1994, 1996 гг.); международном симпозиуме по водородной энергетике и технологии HYPOTHESIS-III, секция "Экономика и моделирование высокотехнологичных социально-экономических процессов" (Санкт-Петербург, 1999 г.); международной конференции Control Applications of Optimization (11th IFAC) (Санкт-Петербург, 2000 г.); межвузовской конференции молодых учёных (Москва, МФТИ, 1989 г.); всероссийской конференции "Понтрягинские чтения - IV"( Воронеж 1993 г. ); III Московской международной конференции по исследованию операций (ORM2001) ( Москва, 2001 г.), а также на городских научных семинарах по теории игр под руководством профессора Н. Н. Воробьева (ИСЭП. Ленинград, 1982-1984 гг.), городских научных семинарах по теории вероятности под руководством академика И. А. Ибрагимова ( ЛОМИ, Ленинград, 1984-1985 гг.); городских научных семинарах по теории игр под руководством Л. А. Петросяна (факультет ПМ-ПУ СПбГУ. Санкт-Петербург, 1990-е-2000-е гг.); научном семинаре по теории игр института математики и механики УрО РАН под руководством чл. корр. РАН А. Г. Ченцова ( Екатеринбург, 2003 г.), на научном семинаре по теории игр ВЦ РАН под руководством профессора А. Ф. Кононенко ( Москва, 2003 г.); на научном семинаре по теории игр МГУ кафедры исследования операций под руководством профессора А. А. Васина ( Москва, 2003 г.), а также на научных семинарах кафедры моделирования социально-экономических систем факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета под руководством профессора О. А. Малафеева ( Санкт-Петербург, 1992-2011 гг. )

Публикации. Результаты диссертации опубликованы в 43 научных работах, в том числе - в одной монографии объёмом 308 страниц.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения и списка литературы. Общий объём диссертации - 270 страниц. Список литературы включает 124 наименования.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснованы актуальность, научная новизна и практическая ценность результатов диссертации; сформулированы цель, методы исследования, основные результаты и положения диссертации, выносимые на защиту; дан краткий обзор известных по теме диссертации результатов и приведено краткое изложение результатов диссертации.

В первой главе приведен математический анализ информационной струк-

туры многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности.

Обсудим терминологию. Рассмотрим произведение множеств

z=Uzp>

0еВ

где В—также некоторое множество. Элементы множества Z будем называть упорядоченными наборами, равно векторами, равно точками и обозначать: z = (...,z/},...) = (z0,/3eB).

Пусть А — непустое множество произвольной мощности. В дальнейшем, при интерпретации А часто будем отождествлять с множеством игроков, а его элемент, скажем, а —с игроком а (игроком с именем а). Сопоставим каждому элементу а из А один и только один элемент из множества (Nljloj-ljf+oo}), где N множество натуральных чисел, и обозначим его Та. При интерпретации число Та можно рассматривать как количество ходов, которые должен совершить игрок а. Если Та = +оо, то мы считаем, что игрок а совершит в процессе бесконечное (счетное) число ходов. Число Та в философском аспекте можно рассматривать также и как личное время игры игрока а. В общем случае личное время игры у разных игроков может быть различно. Предполагается также, что есть общее (внешнее) физическое время, реализуемое в виде дискретных моментов. В каждый из этих моментов, по крайней мере, один из игроков совершает ход. Другими словами, предполагается "вложение" личного времени каждого игрока в общее физическое время. Последнее утверждение можно интерпретировать и так: общее физическое время процесса принятия решений "складывается" ("синтезируется") из личных времен каждого участника процесса.

Обозначим через Та множество всех целых чисел из отрезка [0,Та], через 2т" — множество всех подмножеств множества Та.

Определение 1. Всякое отбражение

L : ^ ^ П 2 'Г Э

цел

будем называть информационной функцией игрока а.

Тогда la(k) есть вектор, который в общем случае может быть произвольной (в том числе бесконечной) размерности. В соответствии с принятыми обозначениями можно записать: la{k) = (..., la(k)tз, • • ■), где ¡3 принимает все значения

из Л и la(k)ß есть подмножество (которое может быть и пустым) множества Тр. Допускаем также и такое обозначение:

Ш = {1а{к)0,РеА).

О подмножестве 1а{к)р будем говорить как о ß-ä компоненте вектора 1а(к). Содержательно 1а{к)р есть подмножество номеров ходов игрока ß, которые необходимо и достаточно знать игроку а для совершения (к + 1)-го хода. Обратим внимание на то, что среди компонент вектора 1а(к) = (..., 1а(к)р,...) присутствует и компонента 1а{к)а- Изначально на подмножество номеров ходов 1а{к)а игрока а, которые ему необходимо и достаточно знать для совершения (к 4- 1)-го хода, мы не накладываем никаких ограничений.

Далее будем рассматривать упорядоченные наборы информационных функций I = (..., 1а,...) = (1а, а S Л), т. е. точки из множества L = Паел гДе Ьа — множество всех информационных функций игрока а. Нас будет интересовать их информационная разрешимость.

Рассмотрим произведение Т = Поел Содержательно всякий вектор а = (..., аа,...) (или в другом обозначении (аа; а 6 Л)) из Т будем интерпретировать как информационный вектор количественного состояния процесса с игроками из множества А. При этом будем считать, что к некоторому моменту времени t игрок а сделал аа ходов. Будем говорить, что вектор а = (..., аа,...) из Т больше либо равен вектору & = (..., Ьа, ■ ■■) из Г, и писать: а > Ь, если аа > Ьа для любого а из А. Будем говорить, что вектор а = (..., аа,...) из Т не больше вектора 6 = (... ,Ьа,...) из Т, если существует элемент ß из А, такой, что bß > ар. Это соотношение будем обозначать так: а ^ Ь или Ь ^ а. Таким образом множество Т становится частично упорядоченным множеством. Часто векторы из Т будем помечать верхним индексом и писать: ак = (... ...).

Определение 2. Счетную последовательность векторов а0,... ,ак,... из Т будем называть остовной, если

1)а° = (..., О,...);_

2) для любого А; из N либо ак+1 > ак, либо ак = afc+1 = ак+2;

3) + 1 > ак+1 для любого а из А и любого к из N;

4) lim = Та.

к—»+оо

Из условия 2) определения 2. следует: если ак = ak+l = afc+2, то ak+l = ак+2 = ак+3 =____Это соответствует случаю, когда в процессе принятия решений у каждого игрока число ходов конечно. Содержательно остовная по-

следователыгость соответствует реально развивающемуся процессу принятия решений с множеством игроков А. Она характеризует динамику принятия решений.

Определение 3. Будем говорить, что упорядоченный набор информационных функций (1а,а € А) информационно разрешим на векторе а из Т, если существует элемент (3 е А, такой, что тр{1р(ар)у) < а7 для любого 7 из А.

В общем случае допускается, что множество ¿,з(а/?)7 может быть счетным. Заметим также, что ¿/у(а^)7 может равняться 0. Определим Бир(0) = тах(0) = 0.

Содержательно информационная разрешимость означает: в процессе игроками сделано столько ходов, что игроку (3 достаточно информации, чтобы совершить свой ход с номером (ар + 1).

Пусть I = (1а, а е А) — какой-либо упорядоченной набор информационных функций. Рассмотрим подмножество В множества А. Часто в дальнейшем будем говорить об информационной разрешимости упорядоченного набора информационных функций I' = (1а,а 6 В) на векторе а нз Т" = П7ев^7> понимая под значением 1а{аа) сужение вектора 1а(аа) (как вектора из множества на компоненты с индексами 7 из подмножества В.

Определение 4. Будем говорить, что упорядоченный набор информационных функций I = (1а, а € А) — почти информационно разрешимый, если для любого подмножества В множества А упорядоченный набор информационных функций I' = (¿с, а е В) информационно разрешим на всяком векторе а из Т' = ПаеВТа.

Пусть I = (1а,а € А) — произвольный набор информационных функций. Далее, пока не будет оговорено особо, все рассуждения будут производиться относительно данного упорядоченного набора.

Определение 5. Будем говорить, что вектор а из Т 1-порождаетп вектор Ь из Т, если

1) а < Ь;

2) аа + 1 > Ьа для любого а из А\

3) аа <Ьа=> тах(/а(аа)7) < а7 Для любого 7 из А.

Определение 6. Будем говорить, что вектор а из Т максимально I-порождаетп вектор Ъ из Т, если

1) а < 6;

2) аа + 1 > Ьа для любого а из А;

3) аа < Ьа<& тах(/„(аа)7) < аТ для любого 7 из А.

Определение?. Счетную последовательность векторов а = а0, а1,..., ак,... из Г назовем /-последовательностью, если

1) в0 = (••■, 0,.. •); _

2) для любого к кз N выполняется условие: либо вектор ак /-порождает вектор ак+1, либо ак = ам и не существует в Т вектора, ¿-порожденного вектором ак.

Определение 8. Назовем счетную последовательность векторов а = а0, а1,..., ак,..., из Т максимальной I-последовательностью, если

1) а0 = (•••,0,...); _

2) для любого к из N выполняется условие: либо вектор ак максимально ¿-порождает вектор либо в Т нет векторов, ¿-порожденных вектором ак, и ак = ак+1.

Равенство ак = ак+1 в контексте с приведенными определениями равносильно равенствам ак = ак+1 = ак+2 = ... = акАгт =____Действительно, если

бы вектор ам был ¿-порожден вектором ак+1, то из-за равенства ак = ак+1 он был бы порожден вектором ак. Но ак не ¿-порождает ни одного вектора из Т. В случае, когда множество игроков А конечно и все числа Та конечны, разумно было бы определить ¿-последовательность как конечную. Однако при таком подходе появляется громоздкость в обозначениях. Поэтому случай конечных процессов вписан в общее определение при предположении, что при реальных рассмотрениях "хвост" ар+1 = ар+2 = ... не будет учитываться (здесь р — наименьшее число, при котором появляются равенства ар = ар+1 = ор+2 = ...).

Теорема 1. Если существует остовная I- последовательность, то максимальная I-последовательность является остовной.

В диссертации показано, что в общем случае остовных последовательностей, соответствующих упорядоченному набору информационных функций, может существовать бесконечно много. Максимальная же остовная I- последовательность — единственна.

Нас интересуют необходимые и достаточные условия существования остовной ¿-последовательности. Далее мы и займемся этими исследованиями.

Теорема 2. Если существует остовная I- последовательность, то упо-

рядоченный набор информационных функций 1 = {1а,а € А) почти информационно разрешим.

Теорема 3. Пусть множество А - конечно. Тогда, для того чтобы существовала остовная I-последовательность необходимо и достаточно, чтобы упорядоченный набор информационных функций I = {la, а е А) был почти информационно разрешим.

Однако, в общем случае, когда |А| = +оо , теорема 3 не работает.

Пример 1. Пусть множество имен игроков А совпадает с множеством натуральных чисел N. Пусть продолжительность процесса Tt для любого игрока г равна +оо. Определим информационную функцию k игрока г. Пусть i;(0)i-i = {1} при i > 2, h{l)j = {1} для любого j из N и U(k)j = {0} в остальных случаях, где fc G 77, г € N, j е N. Покажем, что упорядоченный набор определенных таким образом функций (/¡,г G N) удовлетворяет условию почти информационной разрешимости. Для этого рассмотрим произвольное подмножество В множества А и зафиксируем некоторый произвольный вектор а = (аГ, г G В) из множества Пгев ЛГГ, где Nr = N для любого г из В. Нам надо показать информационную разрешимость упорядоченного набора информационных функций I' = {1г,г 6 В) на векторе а = (аг,г € В). Рассмотрим полную группу возможностей для компонент вектора а = (ar,r G В):

1) среди компонент вектора а есть компоненты, большие либо равные 2;

2) среди компонент вектора а есть компоненты, равные 0;

3) каждая компонента вектора а равна 1.

Рассмотрим случай 1. Пусть а7 > 1. Тогда по определению информационных функций 1Т(аг) = ({0Г}, г 6 В), где 0Г = 0. Очевидно, что max{0r} < аг для любого г из В. Полученные неравенства и означают требуемую почти информационную разрешимость.

Рассмотрим случай 2. Найдем компоненту вектора а равную нулю с наименьшим номером. Пусть это будет а7. Тогда если в множестве В есть элемент, равный г - 1, то компонента a7_i больше либо равна 1. В этом случае получаем max(£f(ar)?-i) = 1 < «г-1 и тах{17{а7)г) = 0 < ar для элементов г из В, не равных f - 1. Полученные неравенства в векторной записи эквивалентны неравенству (таx(l7(a7)r), г е В) < (ar, г £ В), что означает требуемую почти информационную разрешимость. Если в множестве В нет элемента г - 1, то max(/7(ar)r) = 0Г = 0 < аг для любого г из В. Последние неравенства, как и в

случае 1, означают требуемую почти информационную разрешимость.

Рассмотрим случай 3. Здесь упорядоченный набор информационных функций (1г,г £ В) информационно разрешим на векторе (аг,г <= В), поскольку каждая функция /г ограничена единицей.

Таким образом, мы показали почти информационную разрешимость упорядоченного набора информационных функций I = {/,-, г е Лг}. Но тем не менее, максимальная ¿-последовательность не является остовной. Чтобы это показать проанализируем каждый вектор а* максимальной /-последовательности. Получаем:

а1 = (1,0,...,0,...), а2 = (1,1,0,...,0,...),

а* = (1Д-1Д-2,...,2,1,0,...,0,...), ке N.

Таким образом, а\ = 1 для любого к из N, в то время как для остовной последовательности требуется, чтобы Нт^+00а£ = +оо. Значит, наша максимальная /-последовательность не является остовной.

Итак мы показали, что условие почти информационной разрешимости не является достаточным для существования остовной /-последовательности для случая, когда множество игроков не менее чем счетно. Попытаемся определить необходимые и достаточные условия существования остовной /-последовательности в общем случае.

Рассмотрим множества € А. Зафиксируем некоторый элемент а из А и целое число к из множества Та. Определим алгоритм построения множеств упорядоченных пар вида (р,/?), где ¡3 е Л, р б Т0 для фиксированной упорядоченной пары (к, а).

Макрошаг 0. Строим множество Ь0{к,а) - а)}.

Макрошаг 1. Строим множество Ь^к^а). Если к = 0, то полагаем ¿х(А,а) = 0. Если к > 1, то Ьг(к,а) — {к - \,а}[){(р,Р)/р е А, р е Цк - 1)д}

Макрошаг г. На г-м (г € ¿V, г > 2) макрошаге строим множество Ьг(к,а) = у ^(¿,7).

Определение 9. Алгоритм, определенный выше, будем называть алгоритмом 1-предыстории к-го хода игрока а.

Обсудим это определение. Нетрудно заметить, что алгоритм ¿-предыстории состоит из счетного множества макрошагов. Из определения 9 следует, что если множество Ьг(к, а) состоит лишь из элементов вида (О./З), то выполняются равенства 0 = ЬГ+г (к: а) = ... = Ьг+п(к. а) = ... .

Определение 10. Длиной алгоритма 1-предыстории к-го хода игрока а назовем

зир{г £Ы/ЬГ{к,а) ф 0}.

Отметим, что если первая компонента в паре (к, а) равна нулю, то по определению длина алгоритма равна нулю. Если алгоритм ¿-предыстории к-го хода игрока а такой, что Ьг(к, а) ф 0 для любого г из Ы, то его длина по определению равна +оо. Для каких упорядоченных наборов информационных функций I = (3 е А) такое случается, будет выяснено далее.

Определение 11. Множество Ьг{к,а) (г € Ы) из определения 9 будем называть г-м слоем алгоритма 1-предыстории к-го хода игрока а.

Попробуем интерпретировать непустые слои ЬГ(к, а), которых в общем случае может быть счетное множество. О слое Ь\(к,а) можно говорить, как о множестве номеров ходов всех игроков, которые (ходы) необходимо и достаточно знать игроку а для совершения к-го хода в некоторый момент времени Тг, если он к этому моменту уже сделал (к - 1)-й ход. Тогда о всех непустых слоях Ьг(к. а) алгоритма /с-го хода игрока а содержательно можно сказать так: для того, чтобы когда-либо состоялся к-й ход игрока а, необходимо и достаточно, чтобы состоялся каждый ход р игрока (5 для всякой пары (р, (3), принадлежащей какому-нибудь слою Ьг(к,а).

Ниже дадим основное определение гл. 1 — определение информационной разрешимости упорядоченного набора информационных функций в общем случае:

Определение 12. Будем называть упорядоченный набор информационных функций I = (1а, а € А) информационно разрешимым, если алгоритм /-предыстории к-го хода игрока а имеет конечную длину для любого а из множества А при любом к из Та.

Определение 12 можно пояснить так: если упорядоченный набор информационных функций I = (1а, а е А) информационно разрешим, то каждый ход

каждого игрока произойдет за конечное время. Далее сформулируем основную теорему гл. 1.

Теорема 4. Пусть I = (1а, а € А) — упорядоченный набор информационных функций, где А — непустое множество произвольной мощности. Для того чтобы существовала остовная I-последовательность векторов из Т необходимо и достаточно, чтобы набор I был информационно разрешимым.

Из предыдущих рассуждений следует что, когда множество игроков А конечное, то условия почти информационной разрешимости и информационной разрешимости упорядоченного набора информационных вектор-функций I = (1а, а е А) эквивалентны, поскольку оба они в данном случае равносильны условию существования остовной /-последовательности.

Далее в гл. 1 приводится анализ упорядоченных по игрокам наборов информационных вектор-функций с целью получения частичной информационной классификации многошаговых игр с разделенными динамиками. В частности получены и доказаны теоремы о необходимых и достаточных условиях для упорядоченным по игрокам наборов информационных вектор-функций, определяющих одновременные игры, поочередные игры, игры с полной информацией. Приведено в отличие от Г. Куна не стратегическое, а информационной определение игр с полной памятью.

В начале гл. 2 приводится аксиоматика развернутой формы многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности, основой которой является условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций.

Определение 13. Развернутой формой многошаговой игры с разделенными динамиками относительно множества А будем называть упорядоченный набор объектов

Г = {{Ха, ха0, £>а, Та, 1а, ФЛ), а € А),

удовлетворяющий следующим аксиомам:

1) Ха — множество, ха0 е Ха\

2) Иа:Ха^ 2Х"\0;

3) Та е^и{+оо};

4) : Та -> П/зел2^- причем тах(1а(к)а) = к и упорядоченный набор (¿а, а € А) является информационно разрешимым;

5) ^а : П/?6А Хр" где II — множество вещественных чисел.

Дадим названия объектам, определяющим набор Г, и интерпретируем развернутую форму, определяемую набором Г.

Для простоты понимания интерпретации введем следующие определения.

Определение 14. Очередью относительно множества А будем называть всякое отображение О : N -> 2Л, такое, что, если О (i) = 0, то и 0(г + 1) = 0.

Определение 15. Очередью, соответствующей остовной последовательности а = (аГ)о°, будем называть отображение О : N -» 2А, такое, что 0(г) = (а <= АК = ¿C1 + 1}, где а\ а*'1 - соответственно г-й и (г - 1)-й векторы остовной последовательности.

Для очереди, соответствующей остовной последовательности а, иногда будем использовать функциональное обозначение и писать: 0(а).

Множество А будем называть множеством игроков или множеством имен игроков. При этом договоримся, что среди имен нет одинаковых. Отметцм, что мы ничем не ограничиваем мощность множества А. Множество Ха будем называть пространством игры или множеством позиций [точек, элементов) игрока а. Из определения следует, что оно не пусто и в общем случае может быть произвольной мощности. Элемент ха0 пространства Ха является начальной позицией игрока а. Отображение Da определяет динамику передвижения игрока а в пространстве Ха и называется его функцией достижимости. Множество Da(x) есть множество позиций, куда может попасть игрок а, находясь в позиции х. Число Та — количество ходов игрока а в процессе принятия решений, которое в общем случае не пропорционально времени. При этом количества ходов для разных игроков могут быть разными и могут принимать бесконечные значения. Отметим, что символ Та обозначает множество.целых чисел в отрезке [0,Та\. Отображение 1а, как и в гл. 1, назовем информационной функцией игрока а. Это — вектор-функция (точнее, вектор-отображение), компонентами которой являются подмножества целых чисел. Отображение Фа назовем функцией выигрыша игрока а.

Интерпретация упорядоченного набора объектов Г будет следующей. Будем считать, что имеется счетная строго возрастающая последовательность моментов времени

Т = t0 < ti < ••• < tk < tk+1 < ... .

В момент to каждый игрок а из множества А находится в своей начальной позиции ха0. В некоторые моменты времени из последовательности Т игроки

совершают ходы (принимают решения). Ходом игрока а, находящегося в позиции у е Ха, будем называть выбор точки из множества Da(y) и перемещение в нее. При этом не исключается случай, когда у е Da(y). Другими словами, если в данном случае игрок а выберет у (останется на месте), все равно будем считать, что он совершил ход.

Правила совершения ходов игроками определяются следующим образом: в момент £i игрок а совершает ход тогда и только тогда, когда

((supie(0)„),/?€ Л) <(...,О,...).

Нетрудно заметить, что в силу определения информационных функций, в этом неравенстве sup можно заменить на max и само неравенство можно заменить равенством.

Пусть на промежутке времени [t0,tk] игрок /? совершил ходы х0о,хрьх02, т-е- количество его ходов равно числу akfi. Иными словами, информационный вектор количественного'состояния (сдвига) процесса к моменту времени tk+1 есть ak = (akg,P е Л). В момент tk+l игрок а совершает ход тогда и только тогда, когда он сделал не все ходы в процессе (а* < Та) и когда выполняется векторное неравенство

(ma х{Цак)р),/ЗеА)<ак.

Расшифруем последнее неравенство. Множество 1а(ак)р есть множество номеров тех ходов игрока /?, которые (ходы) необходимо и достаточно знать игроку а, чтобы совершить свой (1+а£)-й ход. (Так предписано правилами игры, природы). И если

. тах(Цак)р) < а%

то такое знание реализуется. Если игрок а сделал не все ходы и последнее векторное неравенство не выполняется, то в момент tk+i он ход не делает (пропускает). Он ждет, пока остальные игроки сделают достаточные количества ходов, чтобы неравенство выполнялось. Такое обязательно случится, поскольку упорядоченный набор информационных функций I = (la,ct е Л) удовлетворяет условию информационной разрешимости. Действительно, если рассмотреть к ifc+1

векторы а и а , о которых шла речь ранее, и предположить, что вектор ак является вектором максимальной ¿-последовательности, то и вектор ак+1 будет вектором максимальной /-последовательности (он образуется по правилам максимальной ¿-последовательности). Поскольку вектор а0 характеризует количества ходов, совершенных игроками на отрезке времени [¿0, ¿0], то он равен

(... ,0,...) — нулевой вектор. Но и максимальная /-последовательность начинается вектором (...,0,...). Следовательно, каждый вектор ак — вектор максимальной ¿-последовательности. Поскольку в данном случае для векторов максимальной /-последовательности выполняется равенство lim^^ ак = Та для любого а из А, то каждый игрок сделает все ходы.

Информированность игроков в процессе принятия решений следующая. С самого начала игроку а, а € А, известна последовательность моментов времени Т, упорядоченный набор Г (кроме информационных функций (3 £ Л\{а} и функций выигрыша Ф^, (3 6 Л\{а}) и правила, по которым игроки совершают ходы. Может появиться вопрос: как игрок определит количество ходов, совершенных каждым игроком на отрезке времени [ío,íjt], т.е. вектор ак = (а,р,Р € Л)? Ограничимся пока простым ответом: эта информация каждому игроку сообщается неким нейтральным (а может быть заинтересованным?) игроком. Если в момент í¿+1 игрок а совершает ход, то кроме информации, о которой мы только что сказали, он знает ходы игрока /3, номера которых принадлежат множеству 1а(ак)р для любого ¡3 из А. Обратим внимание на то, что la(da)íí есть лишь подмножество номеров ходов, совершенных игроком ¡3 на отрезке времени [io.it]. Множество номеров всех ходов игрока /3 есть {0,1,2,... В частности, подмножество la{da)a не обязано совпадать с множеством номеров всех ходов, сделанных самим игроком а. Таким образом, наша модель допускает, что игрок может терять информацию и о себе. Но в силу определения max(/„(a*)a) = ака. Последнее означает, что игрок помнит свой последний ход, т.е. знает позицию хааi, в которой находится сам.

Таким образом, если в момент t¡¡+i игрок а совершает ход, то он помимо прочей информации, о которой было сказано, знает вектор

г'а< = ((*/?г|г е Цака),3),(3 б А),

где x¡}r есть реализация г-го хода игрока /3.

Мы уже упомянули о том, что в процессе принятия решений каждый игрок сделает все ходы. В итоге реализуется траектория игры:

s = (sa,a € А),

где

sa = (яа1, • • • , Хак, £a(fc+l)>. . . ) = (Xa¡)la, е Da(xak).

В "конце игры" игрок а получает выигрыш, равный Фа(я). Естественно предположить, что в процессе принятия решений игрок а своими решениями (ходами)

стремится максимизировать значение функции Фа(я).

Сделаем некоторые замечания к приведенной интерпретации. Мы сказали, что свой очередной ход игрок а, находясь в точке хаак, если совершает, то не раньше момента ¿^+1- К последнему надо относиться, как к идеализации. Более точно можно считать, что игроком а решение о (1 + а„)-м ходе принимается, и сам ход совершается на отрезке времени £(с-н]-

Скажем несколько слов об очередности (очереди), в соответствии с которой игроки осуществляют ходы. Предположим, что каждому игроку известна последовательность моментов времени Т, весь упорядоченный набор Г и информационный вектор а0 = (..., 0,...) количественного состояния процесса в момент ¿о, поэтому каждый из игроков определит, кто делает ход в момент

Следовательно, каждому игроку еще до начала процесса может быть известен вектор а1 = £ Л). Но тогда каждый игрок еще до начала процесса может знать, кто делает ход в момент ¿2 и вектор а2. Повторив наши рассуждения, если нужно, счетное число раз (скажем, по индукции) можно говорить, что каждый игрок еще до начала процесса может знать, кто из игроков делает ход в момент для любого к из ЛГ, если пренебречь временем, затрачиваемым на вычисление очередности. Реальнее же предположить, что все вычисления о возможности совершения хода в момент игрок делает на отрезке времени

(¿ь^+О-

Сделаем замечание о последовательности Г = £1 < £2 <•••<£*: < £<¡+1 <

_____ Мы сказали, что каждому игроку эта последовательность известна. Это —

упрощенная, идеализированная модель. Можно опять предположить, что всякий очередной момент принятия решений tk+1 сообщается игрокам неким "нейтральным" игроком. Правда, при этом внешнее по отношению к процессу время 1,2,3,..., к, к + 1,... является равномерным и известным. В последнем случае внешнее время к считает ходы процесса (не ходы игрока!), где под ходом процесса в момент Ьк следует понимать совокупность всех ходов игроков, совершающих ход в момент £ь Если пуститься в философские рассуждения и рассмотреть принятие решений отдельным игроком в аспекте категорий свободы и необходимости, то можно считать подпоследовательность моментов времени, в которые этот игрок принимает решения, необходимостью, предопределенностью (если угодно, судьбой). Из предыдущих рассуждений следует, что эта подпоследовательность, вообще говоря, "кому-то" известна (или точнее, вычислима). Свобода же игрока а заключается в том, что, находясь в момент £* в точке у, он свободен на отрезке времени (£*, <*+1] выбирать любую точку

г из множества достижимости Da(y) и перемещаться в нее, если правилами процесса предусмотрен его ход.

Ранее мы отметили, что последовательность векторов о = (ar)g°, характеризующих количественное состояние процесса в приведенной интерпретации, совпадает с максимальной /-последовательностью. Другими словами, можно констатировать, что очередность (очередь) совершения ходов игроками в приведенной интерпретации определяется максимальной /-последовательностью. Зафиксируем теперь произвольную остовную /-последовательность а = (аг)о° и изменим приведенную ранее интерпретацию. При этом в новой интерпретации мы оставляем все неизменным за исключением очередности совершения ходов. Будем считать, что в момент tk+x игрок а совершает ход, если а £ 0(к + 1), где О—очередь, соответствующая последовательности а. Напомним (см. определение 15), что 0{к + 1) = {а\а е A, ak+1 - = 1}. Поскольку а = (сГ)^ — остовная последовательность, то и в данной интерпретации каждый игрок сделает все предписанные ему в процессе принятия решений ходы. При этом ни один игрок не будет ущемлен в получении информации, и в итоге реализуется та же траектория процесса, что и в случае максимальной /-последовательности, если игроки будут придерживаться тех же стратегий. Придерживаться тех же стратегий игроки смогут, поскольку состояние информации для каждого из них при очередном принятии решения — то же самое, что и в случае максимальной /-последовательности. А значит, при использовании одинаковых стратегий, при разных допустимых очередях совершения ходов, игроки получат одни и те же выигрыши. Последнее более строго показано в главе 3.

Нетрудно заметить, что функции Ф„,а е А, из определения 2.1.1 определены с "избытком". В общем случае не каждая точка из множества П/?ел будет являться траекторией. Пусть, например, множество Da(xa0) не равно множеству Ха: не каждая точка множества Ха достижима для игрока а из точки ха0. Пусть г е Xa\Da(xa0). Тогда в множестве присутствуют элементы вида (z,...), в то время как ни одна траектория не пройдет через точку z. Для исследования всякой конкретной задачи с помощью предлагаемой модели функцию Фа с множества действительных траекторий до множества П/?ел ХТ/> всегда можно доопределить (например, нулем).

Ранее мы отметили, что посредством своих ходов (управлений) игрок a стремится максимизировать функцию Фа(з),з = (se;a 6 А). Понятно, что случай минимизации функции Фа(в) равносилен максимизации функции

—Фа(з). Если Фа = Ф = ф.( для любых элементов а, /3 из множества А, то мы находимся в условиях задачи бесконфликтного управления с множеством участников А. В этом случае игроки участвуют в оптимизации одной и той же функции Ф^), где в = а £ А) при довольно сложной информационной структуре процесса.

В гл.1 мы определили динамику поступления информации игрокам для одновременных, поочередных процессов, для процессов с конечной информацией, с полной информацией, с полной памятью. Естественно, перечисленные типы динамики поступления информации не представляют собой полную классификацию, а являются лишь началом исследований в области моделирования поступления информации участникам процесса принятия решений.

Определение 16. Будем говорить, что развернутая форма игры

Г = ((Ха, ха„ Та, 1а, Фв), а б А)

соответствует в информационном смысле процессу типа е, если упорядоченный набор информационных функций I = (1а,а £ А) соответствует процессу типа е.

Переменная е из последнего определения может принимать следующие значения: одновременный, поочередный, с конечной информацией, с полной информацией, и т. д.

Далее в главе 2 определяются траектории игры и чистые стратегии игроков. На этих структурах рассматриваются тихоновские топологии и показывается, когда эти топологии можно задать метриками, аналогичными метрике Бэра. Доказываются теоремы о необходимых и достаточных условиях, когда в тихоновских топологиях топологические пространства траекторий и стратегий игры являются компактами. Для позиционных игр отображение, сопоставляющее ситуации в чистых стратегиях единственную порожденную ею траекторию, непрерывно. Для многошаговых игр с разделенными динамиками это не всегда так. В гл. 2 доказывается теорема о необходимых и достаточных условиях когда упомянутое выше отображение непрерывно для многошаговых игр с разделенными динамиками. Это условие связывает геометрические и информационные характеристики многошаговой игры. На базе упомянутой теоремы доказывается теорема о необходимых и достаточных условиях, когда в многошаговых играх с разделенными динамиками, с полной информацией, с не более чем счетным множеством игроков существует ситуация равновесия

по Нэшу для произвольных непрерывных функций выигрыша игроков. Эта теорема развивает и обобщает известные теоремы Цермело-Неймана, Гейла-Стюарта. Для того же класса игр с полунепрерывными сверху функциями выигрыша игроков доказаны теоремы существования е-равновесия в игре в чистых стратегиях и построены алгоритмы нахождения е-равновесных чистых стратегий. Исследовано равновесие в бесконечношаговых антагонистических играх с разделенными динамиками, с полной информацией, с полунепрерывной функцией выигрыша. В частности для игр из данного класса доказана теорема о существовании значения игры и оптимальной стратегии у одного из игроков. На основе последней теоремы доказана теорема существования седловой точки в играх преследования с полной информацией в произвольном пространстве, когда выигрыш преследователя определяется поглощением преследуемого множеством достижимости преследователя. Для многошаговых антагонистических игр с полной информацией, с полунепрерывной функцией выигрыша получен и обоснован алгоритм построения е-равновесных чистых стратегий.

В главе 3 для многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности вводится понятие измеримой стратегии поведения игрока, по ситуации в измеримых стратегиях поведения строится мера на множестве траекторий игры, исследуются свойства этой меры. В частности для игр двух лиц определяется, когда интеграл по траекториям игры можно заменить повторным интегралом. При этом основным инструментом для построения меры является теорема И. Тулча о построении меры на произведении измеримых пространств по измеримым функциям перехода.

В главе 4 для многошаговых антагонистических игр с разделенными динамиками, произвольной продолжительности с переменными задержками информации у игроков, которые могут принимать отрицательные значения, вводится определение подыгры, стандартной подыгры. Для того же класса игр на основании полученных в главе 3 свойств меры на множестве траекторий игры определяются и обосновываются функциональные интегральные уравнения, связывающие значения подыгр соседних уровней. Эти уравнения развивают и обобщают известные уравнения Х.Э. Скарфа, Л.С. Шепли и уравнения Л.А. Петросяна. Поскольку уравнения Х.Э. Скарфа, Л.С. Шепли определены для многошаговых антагонистических игр с конечными наперед заданными альтернативными множествами, с постоянными задержками информации у игроков при предположении непрерывности функции выигрыша. Уравнения, по-

лученные в данной диссертации, определены и обоснованы без ограничения на функцию выигрыша. Уравнения JI.A. Петросяна получены для конечношаго-вых дифференциальных игр преследования с постоянной задержкой информации у преследователя с полной информацией у преследуемого.

Далее в главе 4 конкретизируется вид основных функциональных интегральных уравнений для случая, когда информационные функции Ii, ¿2 конечны, альтернативные множества игроков конечны, функция выигрыша ограничена. Показано, что в этом случае в уравнениях операцию sup можно заменить на операцию шах, операцию inf можно заменить на операцию min без какого-либо предположения о непрерывности функции выигрыша, что было сделано у Х.Э. Скарфа и J1.C. Шепли. Как уже было отмечено выше, достаточно, чтобы функция выигрыша была ограничена. Далее в этой же главе доказывается теорема о существовании е-равновесия и оптимальной стратегии у максимизирующего игрока в классе смешанных стратегий в многошаговых антагонистических играх бесконечной продолжительности, с конечными альтернативными множествами, с переменными задержками информации у игроков, когда функция выигрыша ограничена снизу и полунепрерывна сверху в тихоновской топологии на множестве траекторий игры. При этом показано, что значение игры есть предел значений некоторых конечных подыгр, смешанная оптимальная стратегия максимизирующего игрока есть слабый предел расширений оптимальных стратегий некоторых конечных подыгр. Под смешанной стратегией в данном случае понимается любая вероятностная мера на множестве чистых стратегий. Далее делается замечание о том, что справедлива двойственная теорема, когда функция выигрыша полунепрерывна снизу и ограничена сверху.

В начале пятой главы на базе функциональных интегральных уравнений определяется и обосновывается метод решения многошаговых антагонистических игр с разделенными динамиками, произвольной продолжительности, с переменными задержками информации у игроков, которые могут принимать отрицательные значения. При этом сначала ищется оптимальная стратегия первого (максимизирующего) игрока. Для отыскания оптимальной стратегии второго (минимизирующего) игрока достаточно построить рассуждения двойственным образом. Далее в главе 5 рассматривается приложение построенного метода к играм с полной памятью. Приводится полная классификация функциональных интегральных уравнений для данного случая. Количество таких уравнений оказывается равным четырем.

В Заключении сформулированы основные результаты, полученные в дис-

сертации.

1. Для описания информированности игрока в многошаговых играх с разделенными динамиками, с множеством игроков произвольной мощности, с различными (в том числе бесконечными) продолжительностями игры для разных игроков введена информационная вектор-функция игрока. Произведен математический анализ упорядоченного по игрокам набора информационных вектор-функций с целью получения условия, когда каждый игрок получает причитающуюся ему информацию вовремя и полностью. Это условие названо информационной разрешимостью упорядоченного по игрокам набора информационных вектор-функций. Первоначально информационная разрешимость определена для игр с конечным множеством игроков.

2. Оказалось, что информационная разрешимость для игр с конечным множеством игроков в общем случае не работает для игр с не менее чем счетным множеством игроков. Для многошаговых игр с множеством игроков произвольной мощности получено другое условие информационной разрешимости. Доказано, что для игр с конечным множеством игроков эти два условия эквивалентны.

3. Дана частичная информационная классификация многошаговых игр с разделенными динамиками. В частности получены и доказаны теоремы о необходимых и достаточных условиях для упорядоченных по игрокам наборов информационных вектор-функций, определяющих одновременные игры, поочередные игры, игры с полной информацией. Приведено в отличие от Г. Куна не стратегическое, а информационной определение игр с полной памятью.

4. Приведена аксиоматика развернутой формы многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности, основой которой является условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций.

5. Определены тихоновские топологии на множестве траекторий, чистых стратегий игры. Показано когда эти топологии можно задать метриками, аналогичными метрикам Бэра.

6. Для многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности доказана теорема о необходимых и достаточных условиях непрерывности отображения, сопоставляющего ситуации в чистых стратегиях единственную, порожденную ею траекторию. Тем самым установлена связь геометрических и информационных параметров игры.

7. Доказана теорема о необходимых и достаточных условиях существования равновесия по Нэшу в чистых стратегиях для бесконечношаговых игр с разделенными динамиками, с полной информацией, с не более чем счетным множеством игроков, для произвольных непрерывных функций выигрыша игроков.

8. Для многошаговых игр с разделенными динамиками, с полной информацией, с не более чем счетным множеством игроков, с полунепрерывными сверху функциями выигрыш доказаны теоремы существования е-равновесия в игре в чистых стратегиях и построены алгоритмы нахождения е-равновесных чистых стратегий.

9. Доказана теорема существования седловой точки в играх преследования с полной информацией в произвольном пространстве, когда выигрыш преследователя определяется поглощением преследуемого множеством достижимости преследователя.

10. Для многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности введено понятие измеримой стратеги поведения игрока. По ситуации в измеримых стратегиях поведения построена мера на множестве траекторий игры, исследованы свойства этой меры.

11. Для многошаговых антагонистических игр, произвольной продолжительности, с разделенными динамиками, с переменными задержками информации у игроков получены и обоснованы функциональные интегральные уравнения, связывающие значения подыгр соседних уровней.

12. На базе функциональных интегральных уравнений получен и обоснован метод решения многошаговых антагонистических игр с разделенными динамиками, произвольной продолжительности, с переменными задержками информации у игроков.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Слобожанин Н. М. О мере на множестве партий в многошаговых играх // Вопросы механики и процессов управления. - Л.: ЛГУ. 1984. -Вып. 7. - С.87-93.

2. Слобожанин Н. М. Многошаговые игры с неполной информацией // Математические методы оптимизации и управления в сложных системах.

- Калинин: КГУ, 1984. - С.90-103.

3. Слобожанин Н. М. Существование ситуация равновесия при конечном времени игры // Дифференциальные игры с неполной информацией/ Л.А. Петросян, Г.В. Томский. - Иркутск: ИГУ, 1984. - Глава 3, параграф 3-С. 142-150.

4. Слобожанин Н. М. Одно необходимое и достаточное условие оптимальности стратегии убегающего // Дифференциальные игры с неполной информацией/ Л.А. Петросян, Г.В. Томский. - Иркутск: ИГУ, 1984.

- Глава 3, параграф 4 - С. 150-162.

5. Слобожанин Н. М. О мере на множестве траекторий в динамических играх // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(II), 23.04.84-27.04.84. - Л.: ЛГУ, 1984. - С.101—104.

6. Слобожанин Н. М. Многошаговые игры с задержкой информации // Записки науч. семинаров ЛОМИ. Проблемы теории вероятностных распределений. - Наука, 1985. - С. 142-150.

7. Слобожанин Н. М. Об одной задаче геометрической вероятности // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(Ш), 2.04.85-5.04.85. - Л.: ЛГУ. 1985. -С.80-84.

8. Слобожанин Н. М. Один метод решения игр с задержкой информации // Дифференциальные, многошаговые, бескоалиционные и иерархические игры. - Калинин: КГУ, 1985. - С. 140-154.

9. Слобожанин Н. М. Заметка к играм поиска // Дифференциальные, многошаговые, бескоалиционные и иерархические игры. - Калинин: КГУ, 1986. - С.160-168.

10. Слобожанин Н. М. Об одном свойстве многошаговых игр поиска // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(IV), 12.05.86-16.05.86. - Л.: ЛГУ, 1986. - С.71-75.

11. Слобожанин Н. М. Решение одного класса многошаговых игр с полной информацией // Вестн. ЛГУ. Серия мат., мех., астрон. - Л., 1987. -Вып. 15. - 10 с. - Деп. в ВИНИТИ 27.10.1986, №7205-87 Деп.

12. Слобожанин Н. М. О рекурсивных стратегиях в играх с монотонной памятью // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований "(V), 20.04.87-24.04.87. -Л.: ЛГУ, 1987. - С.90-94.

13. Слобожанин Н. М. О рекурсивных стратегиях в многошаговых играх с полной памятью // Дифференциальные, многошаговые, бескоалиционные и иерархические игры. - Калинин: КГУ, 1987. - С. 128-140.

14. Слобожанин Н. М. Формализация принципа оптимальности Беллма-на // Межвузовская конференция молодых ученых МФТИ. Москва, 1989. -С. 100-104.

15. Слобожанин Н. М. Теоретико-игровая модель диагностики экологических систем // Всесибирская конференция по математическим проблемам экологии, 23.06.92-25.06.92. - Новосибирск, Институт математики СО РАН, Тез. докладов, 1992. - С.70-71.

16. Слобожанин Н. М. О математической модели прогноза и управления экологическим процессом // Конференция "Теоретические и прикладные проблемы экологии 23.10.92-27.10.92. - Бухарский ГУ, 1992. - С.50-51.

17. Слобожанин Н. М. Об оптимизации дохода от работы сложной системы при наличии сбоев // Межвузовский сб. научных трудов "Управление экономическими системами в условиях формирования рыночных отношений. Вопросы теории и практики". - Иваново: ИГУ, 1992. - С.38-43.

18. Слобожанин Н. М. Об оптимальном управлении в динамических антагонистических процессах с переменной задержкой информации // Все-

российская конференция "Понтрягинские чтения-IV 3.05.93-8.05.93. - Воронеж, Тез. докладов, 1993. - С.80.

19. Слобожанин Н. М. О топологии на множестве траекторий в дискретных динамических управляемых процессах // Международный конгресс по компьютерным системам и прикладной математике, 19.07.93-23.07.93. - Санкт-Петербург, Тез. докладов. - С. 100.

20. Слобожанин Н. М. Динамические игры с дискретным временем с неполной информацией // Сб. научных трудов "Модели, алгоритмы, программы". - Тверь: ТГУ, 1993. - С. 80-87.

21. Слобожанин Н. М. Дискретные динамические управляемые процессы п лиц // Международная конференция по интервальным и алгебраическим вычислительным методам в науке и технике "Интервал - 94 7.03.9410.03.94. - Санкт-Петербург, Тез. докладов. - С. 100-102.

22. Слобожанин Н. М. О свойствах меры на множестве траекторий в динамических процессах с запаздыванием информации // III Международная конференция "Многокритериальные задачи при неопределенности 5.09.949.09.94. - Орехово-Зуево, Тез. докладов. - С.70.

23. Слобожанин Н. М. The properties of control in pursuit games // Сб. научных трудов "Game Theory and Applications-/ edited by L.A. Petrosjan and V.V. Mazalov. - New York, USA, Nova Science Publishers, 1996. - C.187-192.

24. Слобожанин H. M. Управление в конфликтных дискретных процессах с запаздыванием информации // Вопросы механики и процессов управления. - СПб: СПБГУ, 1996. - Вып. 17. - С. 189-195.

25. Слобожанин Н. М. The control in pursuit games // Международная научная конференция "Многокритериальные и игровые задачи", 8.09.9614.09.96. - Орехово-Зуево, Тез. докладов. - С. 110.

26. Слобожанин Н. М. Управление в многошаговых играх. - СПб.: СПбГУ, 1996.

27. Слобожанин Н. М. Управление в динамических играх с зависимыми

движениями // Труды XXIX научной конференции "Процессы управления и устойчивость", ф-т ПМ-ПУ. - СПб.: СПбГУ, 1999. - С.591-606.

28. Слобожанин Н. М. Информационная состоятельность в динамических играх // Труды международного симпозиума по водородной энергетике и технологии HYPOTHESIS-III. Секция "Экономика и моделирование высокотехнологичных социально-экономических процессов" / под общ. ред. О.А.Малафеева и А.И.Муравьева. - СПб: СПбГУЭФ, 1999. - С. 92-98.

29. Слобожанин Н. М. Управление в играх в развернутой форме // Труды XXXI научной конференции "Процессы управления и устойчивость", ф-т ПМ-ПУ СПбГУ. - СПб: СПбГУ, НИИ Химии, 2000. - С.472-481.

30. Слобожанин Н. М. On two definitions of informational consistency in games with separated dynamics // Abstracts of ll"1 IFAC International workshop Control Applications of Optimization. - 2000. - C.238-239.

31. Слобожанин H. M. On information consistency in games with separated dynamics // A proceeding volume from the l\th IFAC Workshop/ edited by V. Zakharov. Volume 2. СПб: PERGAMON, 2000. - C.647-653.

32. Слобожанин H. M. On information structure in games with separated dynamics // Тезисы докладов III Московской международной конференции по исследованию операций (ORM2001). - Москва: ВЦ РАН, 2001. -С. 108-109.

33. Слобожанин Н. М. О непрерывности отображения, связывающего стратегии и траектории в играх // Труды XXXIII научной конференции «Процессы управления и устойчивость», ф-т ПМ-ПУ СПбГУ. - Санкт-Петербург: СПбГУ, НИИ Химии, 2002. - С.530-534.

34. Слобожанин Н. М. Информация и управление в динамических играх. - СПб: СПбГУ, 2002.

35. Слобожанин Н. М. О функциональных уравнениях одной игры с переменной задержкой информации // Вестник С.-Петербургского университета. Серия 10, Прикладная математика, информатика, процессы управления. - СПб: СПбГУ, 2006. - Вып. 2. - С.75-90.

36. Слобожанин Н. М. Информационная разрешимость в многошаговых играх с конечным множеством игроков // Математическая теория игр и ее приложения. - Петрозаводск: редакционно-издательский отдел КарНЦ РАН, 2011. - Т. 3, вып. 2. - С. 81-101.

37. Слобожанин Н. М. Информационная разрешимость в многошаговых играх с множеством игроков произвольной мощности // Математическая теория игр и ее приложения. - Петрозаводск: редакционно-издательский отдел КарНЦ РАН, 2011. - Т. 3, вып. 4. - С.81-109.

38. Слобожанин Н. М. Теоремы существования для бесконечных позиционных игр // Некоторые вопросы вычислительной и прикладной математики. - Якутск: ЯГУ, 1977. - С.37-42

39. Слобожанин Н. М. О существовании ситуации равновесия в бесконечных позиционных играх п лиц // Вопросы механики и процессов управления. - Л.: ЛГУ, 1978. - Вып. 2. - С.213-219

40. Слобожанин Н. М. Обоснование одной гипотезы Л. А. Петросяна // Вестник Ленинградского Университета. - Л.: ЛГУ, 1981. - №13. - С.120-123.

41. Слобожанин Н. М. О функциональных уравнениях одного класса многошаговых игр // Вестн. ЛГУ. Серия мат., мех., астрон. - Л., 1981. -Вып. 19. - 14 с. - Деп. в ВИНИТИ 15.09.1981, №4455-81 Деп.

42. Слобожанин Н. М. О существовании ситуации равновесия в бесконечных позиционных играх с неполной информацией // Многошаговые, дифференциальные, бескоалиционные и кооперативные игры и их приложения. - Калинин: КГУ, 1982. - С.89-95.

43. Слобожанин Н. М. Измеримые стратегии поведения в многошаговых играх // Вестн. ЛГУ. Серия мат., мех., астрон. - Л., 1982. - Вып. 13. -19 с. - Деп. в ВИНИТИ 24.03.1982, №1298-82 Деп.

Подписано к печати 16.12.11. Формат 60x84 'к. Бумага офсетная. Гарнитура Тайме. Печать цифровая. Печ. л. 1,00. Тираж 100 экз. Заказ 5331.

Отпечатано в Отделе оперативной полиграфии химического факультета СПбГУ 198504, Санкт-Петербург, Старый Петергоф, Университетский пр., 26 Тел.: (812)428-4043, 428-6919

Содержание диссертации автор исследовательской работы: доктора физико-математических наук, Слобожанин, Николай Михайлович

Введение.

Глава 1. Информационная разрешимость.

§ 1.1. Процессы с задержкой информации.

§ 1.2. Процессы с неполной информацией.

§ 1.3. Информационная разрешимость в общем случае.

§ 1.4. Динамика принятия решений.

Глава 2. Развернутая форма игры с разделенными динамиками

§2.1. Определение развернутой формы.—

§2.2. Траектории и чистые стратегии.

§2.3. Равновесие по Нэшу в классе чистых стратегий в играх с полной информацией.

§ 2.4. Алгоритмы решения игр с полной информацией.

Глава 3. Определение многошаговой антагонистической игры с задержкой информации.

§3.1. Развернутая форма игры.—

§3.2. Мера на множестве траекторий, индуцируемая стратегиями поведения.

§3.3. Нормальная форма игры, подыгра, множества Зсг(х,п). с{х,п).

Глава 4. Основное функциональное уравнение.

§4.1. Вывод основного функционального уравнения.

§ 4.2. Функциональное уравнение для игр с конечными альтернативными множествами.

§4.3. Теорема существования ситуации ^-равновесия и оптимальной стратегии у одного из игроков для дискретного случая

Глава 5. Метод решения многошаговых антагонистических

§5.1. Рекурсивная стратегия в общем случае.—

§5.2. Рекурсивная стратегия в играх с монотонной памятью.

§5.3. Функциональные уравнения для игры с монотонной памятью

Введение диссертация по математике, на тему "Информация и равновесие в многошаговых играх"

Актуальность темы. Теория многошаговых игр занимается изучением управления изменяющихся систем в условиях конфликта или неполноты информации. По этой причине на протяжении последних восьми десятилетий наблюдается большой интерес к созданию математических моделей, теории и методов решения многошаговых игр.

Основой построения математической модели конфликтного процесса является строгое адекватное действительности определение его информационной структуры. Первоначально в работах Джона фон Неймана, Г. Куна и др. для конечных многошаговых игр с зависимой динамикой (позиционных игр) информационная структура процесса моделировалась посредством разбиения пространства игры на информационные множества игроков. Это безусловно строгий подход, но обладает одним существенным недостатком - чрезмерной общностью подхода, что затрудняет построение методов нахождения оптимальных стратегий игроков. Основополагающей работой ио информационному анализу позиционных игр является работа Г. Куна [35], в которой автор для конечных игр доказал теорему о необходимых и достаточных условиях равенства выигрыша игроков в смешанных стратегиях и соответствующих им стратегиях поведения. Это условие было названо Куном полной памятью для игроков. В дальнейшем эта теорема была обобщена Л. А. Петросяном [54] для бесконечношаговых позиционных игр с конечным множеством альтернатив и нобелевским лауреатом Р. Дж. Ауманом [1] для бесконечношаговых позиционных игр с множеством альтернатив произвольной мощности. Однако, отметим, что требование полной памяти довольно сильное требование (игрок в каждый момент времени должен помнить всё. что совершил и знал ранее). При более слабых ограничениях на память игрока в игре теоремы об эквивалентности некоторого подкласса смешанных стратегий всему классу смешанных стратегий были доказаны H.H. Воробьёвым [10, 12].

Настоящая диссертация посвящена многошаговым играм с разделёнными динамиками игроков. Одной из первых задач данного класса игр является интересная проблема о корабле, маневрирующим так, чтобы минимизировать вероятность его поражения бомбардировщиком, летящим над ним, сформулированная Р. Айзексом из РЭНД-Корпорейшн и представлен пая им на конференции Американского общества по исследованию операций 16 мая 1953 г. [120]. Он же предсказал значение этой игры. В 1957 году независимо С. Карлином [20] и Л. Э. Дубинсом [16] эта игра была решена для постоянной задержки информации у корабля равной двум и полной информации у бомбардировщика при конечных альтернативных множествах. Автором настоящей диссертации в 1981 г. в [67] доказана теорема о необходимых и достаточных условиях оптимальности стратегий поведения корабля для случая произвольной конечной задержки информации у корабля. Одной из первых фундаментальных работ в области многошаговых игр с разделёнными динамиками является работа X. Э. Скарфа и Л. С. Шепли [63]. В ней авторы рассмотрели бесконечношаго-вые антагонистические игры с постоянными положительными задержками информации у игроков, с конечными альтернативными множествами. При предположении непрерывности функции выигрыша были получены функциональные уравнения, связывающие значения подыгр соседних уровней. На основании этих уравнений был получен метод решения упомянутого выше класса многошаговых игр.

В 1969 году вышла работа Д. Блэкуэлла [119], в которой автор исследован вопрос существования значения в играх с конечными альтернативными множествами, с нулевыми задержками информации, с функциями выигрыша, имеющим вид характеристических функций. В 1972 году были опубликованы работы М. Оркина [121, 122] об играх, рассмотренных X. Э. Скарфом и Л. С. Шепли, в которых изучен вопрос о приближении значения игры значениями других игр, функциями выигрыша которых сходятся сверху к функции выигрыша первоначальной игры.

Говоря об играх с неполной информацией, необходимо сказать о довольно развитой области теории игр с неполной информацией - дифференциальных играх с неполной информацией, которые могут быть сведены к играм с полной информацией, что в свою очередь позволяет использовать известный аппарат дифференциальных игр. В значительной степени этот класс игр был исследован H.H. Красовским и его учениками [29-34, 50, 51, 111-113]. Этому же вопросу посвящены работы Ф.Л. Черноусько [114] и A.A. Меликяна [115]. Представляют интерес работы М. С. Никольского [47, 48], в которых приводятся достаточные условия для завершения преследования за конечное время при неполном знании преследователем фазового положения или динамики убегающего. Проблема вывода функциональных интегральных уравнений в дифференциальных играх с постоянной задержкой информации у преследователя, несводимых к играм с полной информацией, нашла отражение в работах Л. А. Петросяна [56, 58, 62]. Значение информации о функции цели противника в играх двух лиц. основы информационной теории иерархических систем, исследованы в работах H.H. Моисеева [14, 46], Ю.Б. Гермейера [13], А. Ф. Кононенко и его учеников [7. 23, 24]. Анализ равновесия в различных классах стратегий в дифференциальных играх с полной информацией приведён в работах А.Ф. Кононенко [25], O.A. Малафеева [45], C.B. Чистякова [117]. Прикладные аспекты теории многошаговых игр исследованы в работах A.A. Васина [4, 5], В. В. Мазалова [43, 44] и других зарубежных и отечественных учёных.

В настоящей диссертации впервые информационная структура многошаговых игр с разделёнными динамиками моделируется посредством информационных вектор-функций игроков. Производится анализ таких функций. Последнее позволяет, в частности, для антагонистических игр с переменной задержкой информации произвольной продолжительности (как конечной, так и бесконечной), с динамиками, определяемыми произвольными функциями достижимости, получить функциональные интегральные уравнения, связывающие значения подыгр соседних уровней. На базе этих уравнений в диссертации строится метод решения многошаговых антагонистических игр с неполной информацией [106, 107]. Таким образом, на основании вышеизложенного можно у тверждать, что в диссертации исследуется актуальные проблемы конфликтных процессов.

Цель работы заключается в построении математической модели развёрнутой формы многошаговых игр с разделенными динамиками с множеством игроков произвольной мощности, основой которой является определение информационной структуры игры, а также методов и алгоритмов решения различных подклассов рассматриваемого класса игр.

На множествах траектории игры и чистых стратегий игроков вводятся топологии А.Н. Тихонова. Показано, когда данные топологии можно задать метриками, аналогичными метрике Бэра. В многошаговых играх с зависимыми динамиками отображение, сопоставляющее ситуации в чистых стратегиях единственную порождённую ею траекторию, непрерывно. В играх с разделёнными динамиками это не всегда так. Впервые получена и доказана теорема о необходимых и достаточных условиях, когда упомянутое отображение непрерывно для игр с разделёнными динамиками. Это условие связывает геометрические и информационные характеристики многошаговой игры.

На базе упомянутой выше теоремы для многошаговых игр с разделёнными динамиками с не более чем счётным множеством игроков, с полной информацией, произвольной продолжительности, с произвольными непрерывными функциями выигрыша доказана, теорема о необходимых и достаточных условиях существования равновесия по Нэшу в чистых стратегиях, которая развивает и обобщает теоремы Цермело-Неймана и Гсйла-Стюарта. Для того же класса игр для полунепрерывных сверху функций выигрыша доказаны теоремы существования е -равновесия в игре в чистых стратегиях и построены алгоритмы нахождения е -. равновесных чистых стратегий. Доказана также теорема существования седловой точки в играх преследования с нолной информацией в произвольном пространстве, когда выигрыш преследователя определяется поглощением преследуемого множеством достижимости преследователя.

Практическая ценность. Полученный в диссертации метод решения многошаговых антагонистических игр с переменной задержкой информации может быть положен в основу исследования игровых задач с неполной информацией. которые служат моделями развёртывающихся во времени процессов. В частности, его модно использовать при исследовании задач управления системами при частично известных возмущающих воздействиях, при решении задач планирования с заранее неопределёнными параметрами. Введённые в диссертации информационные вектор-функции и условие информационной разрешимости упорядоченного по игрокам набора информационных вектор-функций могут быть использованы для дальнейшего исследования информационных конфликтных процессов, в частности, для информационной классификации таких процессов, начало которой приведено в диссертации.

Положения, выносимые на защиту.

2. Необходимые и достаточные условия непрерывности отображения, сопоставляющего ситуации в чистых стратегиях единственную порождённую ею стратегию для многошаговых игр с разделёнными динамиками. Получение с помощью этого условия необходимых и достаточных условий существования равновесия но Нэшу, б равновесия в многошаговых играх с полной информацией и Седловой точки в играх преследования с полной информацией.

Апробация работы. Основные положения и результаты работы докладывались и обсуждались на международном конгрессе по компьютерным систсмам и прикладной математике (Санкт-Петербург, 1993 г.); международной конференции по интегральным и алгебраическим вычислительным методам в науке и технике "Интеграл - 94"(Санкт-Петербург, 1994 г.): международных научных конференциях "Многокритериальные и игровые задачи "(Орехово-Зуево, 1994, 1996 гг.); международном симпозиуме но водородной энергетике и технологии HYPOTHESIS-ПІ, секция "Экономикам моделирование высокотехнологичных социально-экономических процессов" (Санкт-Петербург. 1999 г.); международной конференции Control Applications of Optimization (11th IFAC) (Санкт-Петербург, 2000 г.); межвузовской конференции молодых учёных ( Москва, МФТИ, 1989 г.); всероссийской конференции "Понтрягинские чтения - IV"( Воронеж 1993 г. ); III Московской международной конференции по исследованию операций (ORM2001) ( Москва, 2001 г.), а также на городских научных семинарах по теории игр под руководством профессора. H.H. Воробьева (ИСЭП, Ленинград, 1982-1984 гг.), городских научных семинарах по теории вероятности под руководством академика И. А. Ибрагимова ( ЛОМИ, Ленинград, 1984-1985 гг.); городских научных семинарах по теории игр под руководством Л. А. Петросяна ( факультет ПМ-ПУ СПбГУ, Санкт-Петербург, 1990-е-2000-е гг.); научном семинаре по теории игр института математики и механики УрО РАН под руководством чл. корр. РАН А. Г. Ченцова ( Екатеринбург. 2003 г.), на научном семинаре по теории игр ВЦ РАН под руководством профессора А. Ф. Кононенко ( Москва, 2003 г.): на научном семинаре по теории игр МГУ кафедры исследования операций под руководством профессора. А. А. Васина. ( Москва, 2003 г.), а также на научных семинарах кафедры моделирования социально-экономических систем факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета под руководством профессора O.A. Малафеева ( Санкт-Петербург, 1992-2011 гг. )

Заключение диссертации по теме "Дискретная математика и математическая кибернетика"

Основные результаты, которые получены в итоге проведенных исследований и выносятся на защиту, следующие:

1. Для описания информированности игрока в многошаговых играх с разделенными динамиками, с множеством игроков произвольной мощности, с различными (в том числе бесконечными) иродолжительностями игры разных игроков введена информационная вектор-функция игрока. Произведен математический анализ упорядоченного по игрокам набора информационных вектор-функций с целью получения условия, когда каждый игрок получает причитающуюся ему информацию вовремя и полностью. Это условие названо информационной разрешимостью упорядоченного по игрокам набора информационных вектор-функций. Первоначально информационная разрешимость определена для игр с конечным множеством игроков.

3. Дана частичная информационная классификация многошаговых игр с разделенными динамиками. В частности получены и доказаны теоремы о необходимых и достаточных условиях для упорядоченных игрокам наборов информационных вектор-функций, определяющих одновременные игры, поочередные игры, игры с полной информацией. Приведено в отличие от Г. Куна не стратегическое, а информационной определение игр с полной памятью.

7. Доказана теорема о необходимых и достаточных условиях существования равновесия по Нэшу в чистых стратегиях для многошаговых игр с разделенными динамиками, с полной информацией, с не более чем счетным множеством игроков, для произвольных непрерывных функций выигрыша игроков.

8. Для многошаховых игр с разделенными динамиками, с полной информацией, с не более чем счетным множеством игроков, с полунепрерывными сверху функциями выигрыш доказаны теоремы существования е-равновесия в игре в чистых стратегиях и построены алгоритмы нахождения ^-равновесия в чистых стратегиях.

10. Для многошаговых игр с разделенными динамиками, с множеством игроков произвольной мощности введено понятие измеримой стратеги поведения игрока. По ситуации в измеримых стратегиях поведения построена, мера на множестве траекторий игры, исследованы свойства этой меры.

ЗАКЛЮЧЕНИЕ

Список источников диссертации и автореферата по математике, доктора физико-математических наук, Слобожанин, Николай Михайлович, Санкт-Петербург

1. Ауман Р. Дж. Смешанные стратегии и стратегии поведения в бесконечных позиционных играх. / пер. И. Н. Врублевской // Позиционные игры / Под ред. Н. Н. Воробьева и И. Н. Врублевской - М.: Наука, 1967. -С.251-277.

2. Беллман Р. Динамическое программирование. М.: Иностранная литература, 1960. - 400 с.

3. Бородин А. Н., Ибрагимов И. А. Предельные теоремы для функционалов от случайных блужданий // Труды МИАН СССР. СПб.: Наука, 1994.

4. Васин А. А., Гурвич В. А. Коалиционные ситуации равновесия в метаиг-рах /7 Вестн. МГУ. Вычислительная математика и кибернетика. 1980. - Вып. 3. - С.38-44.

5. Васин A.A., Гусев А. Г., Шарикова A.A. Теоретико-игровой анализ од-ноэтапных и двухэтапных аукционов однородного товара // Математическая теория игр и се приложения. 2009. - Т. 1, вып. 4.

6. Ватель И. А., Ерешко Ф. И. Математика конфликта и сотрудничества. -М.: Знание, 1973.

7. Ведерников Р. А., Кононенко А. Ф. О принятии решений в двухуровневой иерархической системе управления при неполной информации о нижнем уровне // Изв. АН СССР. Техн. кибернетика. 1976. - Вып. 2. - С. 13-22.

8. Вентцель А. Д. Курс теории случайных процессов. М.: Наука, 1975. -320 с.

9. Воробьев Н. Н. Редуцированные стратегии для игр в обобщенной форме //Докл. АН СССР. 1957. - Т. 115, №5. - С.855-857.

10. Воробьев Н. Н. Редуцированные стратегии в позиционных играх // Позиционные игры / Под ред. H.H. Воробьева и И.Н. Врублевской М.: Наука, 1967. - С.94-113.

11. Воробьев H.H. Современное состояние теории игр // Успехи мат. наук. 1970. - Т. 25, т. - С.81-140.

12. Воробьев H.H. Теория игр. М.: Наука, 1984. - 496 с.

13. Гермейер Ю. Б. Введение в теорию исследования операций. М.: Наука, 1971.

14. Гермейер Ю.Б., Моисеев H.H. О некоторых задачах теории иерархических систем управления // Проблемы прикладной математики и механики. М.: Наука, 1971. - С. 30-43.

15. Гликсберг И. Л. Дальнейшее обобщение теоремы Какутани о неподвижной точке с приближением к ситуациям равновесия в смысле Нэша // Бесконечные антагонистические игры / Под ред. H.H. Воробьева М.: Физматгиз, 1963. - С.297 303.

16. Дубине Л. Э. Дискретная игра на уклонение от преследования / / Применение теории игр в военном деле. М.: Советское радио, 1961. С. 275 302.

17. Захаров В. В., Петросян Л. А. Теоретико игровой подход к проблеме охраны окружающей среды // Вестн. ЛГУ. Серия мат., мех., астрон. -Л., 1981. Вып. 1.

18. Захаров В. В. О регуляризации и динамической устойчивости решений иерархических дифференциальных игр // Вестн. ЛГУ. Серия 1. Л., 1988. Вып. 1.

19. Иванов М.А., Луценко М. М. Минимаксные доверительные интервалы для параметра гипергеометрического распределения // Автомат, и теле-мех. 2000. - Вып. 7. - С.68-76.

20. Карлин С. Бесконечная игра с запаздыванием // Применение теории игр в военном деле. М.: Советское радио, 1961. - С. 303-321.

21. Колмогоров А. H. Основные понятия теории вероятностей. М.: Наука, 1974. - 120 с.

22. Колмогоров А.Н., Фомин C.B. Элементы теории функций и функционального анализа. М.: Наука, 1976. - 544 с.

23. Кононенко А. Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов /./ ЖВМ и МФ.- 1973. Т. 13, вып. 2. - С.311-317.

24. Кононенко А.Ф. Теоретико-игровой анализ двухуровневой иерархической системы управления //' ЖВМ и МФ. 1974. Т. 14, вып. 5. -С.1161-1170.

25. Кононенко А. Ф. О равновесных позиционных стратегиях в неантагонистических дифференциальных играх // Докл. АН СССР. 1976. - Т. 231, вып. 2. - С.285-288.

26. Кононенко А. Ф., Халезов А. Д., Чумаков В. В. Принятие решений в условиях неопределенности. М.: ВЦ АН СССР, 1991.

27. Красовский А. А. Статистическая теория переходных процессов в системах управления. М.: Наука, 1968. 240 с.

28. Красовский А. А. Игровые задачи о встрече движений. М.: Наука, 1970.- 420 с.

29. Красовский H. Н. Об управлении при неполной информации // Прикладная математика и механика 1976. - Т. 40, вып. 2. - С.197-205.

30. Красовский H. Н. Дифференциальные игры. Аппроксимационные и формальные модели // Мат. сб. 1978. - Т. 107, вып. 4. С.541-571.

31. Красовский H.H., Осипов Ю. С. К теории дифференциальных игр с неполной информацией // Докл. АН СССР. 1974. - Т. 215, вып. 4.- С.780-783.

32. Красовский H.H., Субботин А. И. Позиционные дифференциальные иг ры. М.: Наука, 1974. - 456 с.

33. Кряжимский А. Б. Альтернатива в линейной игре сближения-уклонения с неполной информацией // Докл. АН СССР. 1976. - Т. 230, вып. 4. -С. 773-776.

34. Кряжимский А. Б., Филиппов С. Д. Об одной игровой задаче сближения двух точек на плоскости в условиях неполной информации // Задачи управления с неполной информацией. Свердловск, 1976. - С.62-77.

35. Кун Г. У. Позиционные игры и проблема информации / Пер. О. Н. Бондаревой // Позиционные игры / Под ред. H.H. Воробьева и И. Н. Вруб-левской. М.: Наука, 1967. - С.13-40.

36. Кукушкин Н.С., Морозов В. В. Теория неантагонистических игр. М.: МГУ, 1984. - 104 с.

37. Куржанекий А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.

38. Куржанекий А. Б. Об информационных множествах управляемой системы // Докл. АН СССР. 1978. - Т. 240, вып. 1. - С.14-17.

39. Лагунов В. Н.Оценка платы в одной дифференциальной игре при наличии эффекта запаздывания // Управляемые системы. Новосибирск, 1970. Вып. 6. - С.23-25.

40. Лоэв М. Теория вероятностей. М.: Изд-во иностр. лит-ры, 1962. - 720 с.

41. Луценко М.М. Теоретико-игровой метод оценки параметра биномиального закона // Теория вероятностей и ее применения. 1990. - Т. 35, вып.3. С.471-481.

42. Луценко М. М. Теоретико-игровой подход к оценке точности тестирования // Математическая теория игр и ее приложения. 2009. - Т. 1, вып.4. С.63-77.

43. Мазалов В. В. Математическая теория игр и приложения. Санкт-Петербург, Москва, Краснодар: Лань, 2010. - 446 с.

44. Мазалов В. В., Сакагучи М. Равновесие в бескоалиционной игре п лиц с выбором момента времени // Математическая теория игр и ее приложения. 2009. - Т. 1, вып. 1.

45. Малафеев О. А. О существовании равновесия в дифференциальных бескоалиционных играх двух лиц с независимыми движениями // Вестн. ЛГУ, серия математика, 1980. - Вып. 4. - С. 12-16.

46. Моисеев Н. Н. Элементы теории оптимальных систем. М.: Наука, 1975.

47. Никольский М.С. Преследование не полностью известного объекта /7 Вестн. Моск. ун-та, серия 1. 1971. - Вып. 1. - С. 3-8.

48. Никольский М. С. Об одной задаче преследования с неполной информацией // Изв. АН СССР. Техн. кибери. 1971. - Вып. 5, 6. - С. 10-13.

49. Никольский М.С. Линейные дифференциальные игры преследования при наличии запаздываний ,// Диф. кравнеиия. 1972. - Т. 8, вып. 2.- С. 260-267.

50. Осипов Ю.С. К теории дифференциальных систем с последействием // Прикладная математика и механика 1971. - Т. 35, вып. 2. - С. 300-311.

51. Осипов Ю. С., Пименов В.Г. К теории дифференциальных игр в системах с последействием // Прикладная математика и механика 1978. - Т. 42, вып. 6. - С. 969-977.

52. Пацюков В. П. Дифференциальные игры при различной информированности игроков. М.: Советское радио, 1976. - 200 с.

53. Петросян Л. А. Некоторые теоремы из теории бесконечных позиционных игр // Программа четвертого Всесоюзного математического съезда. 1961.- 60 с.

54. Петросян Л. А. Еще одно обобщение теоремы Куна // Позиционные игры / Под ред. Н. Н. Воробьева и И. Н. Врублевской. М.: Наука, 1967. -С. 230-245.

55. Петросян Л. А. Сигнальные стратегии и стратегии поведения в одном классе бесконечных позиционных игр // Позиционные игры / Под ред. Н. Н. Воробьева и И. Н. Врублевской. М.: Наука, 1967. - С. 221-229.

56. Петросян Л. А. Дифференциальные игры с неполной информацией // Докл. АН СССР. 1970. - Т. 195, вып. 3. - С. 558-561.

57. Петросян Л. А. Игры преследования с неполной информацией // Успехи теории игр. Труды II Всесоюзной конференции по теории игр. Вильнюс, 1971. - С. 227-233.

58. Петросян Л. А. Игры преследования с задержкой информации у игрока // Изв. АН Арм. ССР Мат. 1973. - Т. 8. - С. 93-101.

59. Петросян Л. А. Дифференциальные игры преследования. Л.: ЛГУ, 1977.- 224 с.

60. Петросян Л. А., Захаров В. В. Введение в математическую экологию. -Л., 1986.

61. Петросян Л. А., Томский Г. В. Динамические игры с полной информацией и их приложения к играм с неполной информацией // Диф. уравнения.- 1982. Т. 18, вып. 4. - С.593-595.

62. Петросян Л. А., Томский Г. В. Дифференциальные игры с неполной информацией. Иркутск: ИГУ, 1984. - 187 с.

63. Скарф X. Э., Шеили Л. С. Игры с неполной информацией /./ Применение теории игр в военном деле. М.: Советское радио, 1961. - С. 256-274.

64. Слободинская Т. В., Петросян Л. А. Функциональное уравнение для дифференциальной игры с неполной информацией // Вопросы механики и процессов управления. Л.: ЛГУ, 1981. - Вып. 4. - С. 183-197.

65. Слобожанин Н. М. Теоремы существования для бесконечных позиционных игр // Некот. вопросы вычисл. и прикл. мат. Якутск, 1977. - С. 3742.

66. Слобожанин Н. М. О существовании ситуации равновесия в бесконечных позиционных играх п лиц // Вопросы механики и процессов управления.- Л.: ЛГУ, 1978. Вып. 2. - С. 213-219.

67. Слобожанин Н.М. Обоснование одной гипотезы Л. А. Петроеяна // Вестн. Ленингр. ун-та. 1981. - Вып. 13. - С. 120-123.

68. Слобожанин Н. М. О функциональных уравнениях одного класса многошаговых игр // Вестн. ЛГУ. Серия мат., мех., астрой. Л., 1981. -Вып. 19. - 14 с. - Деп. в ВИНИТИ 15.09.1981, №4455-81 Деп.

69. Слобожанин Н. М. О существовании ситуации равновесия в бесконечных позиционных играх с неполной информацией // Многошаговые дифференциальные бескоалиционные и кооперативные игры и их приложения.- Калинин: КГУ, 1982. С. 89-195.

70. Слобожанин Н. М. Измеримые стратегии поведения в многошаговых играх / /' Вестн. ЛГУ. Серия мат., мех., астрон. Л., 1982. - Вып. 13. - 19 с.- Ден. в ВИНИТИ 24.03.1982, №1298-82 Деп.

71. Слобожанин Н. М. О мере на множестве партий в многошаговых играх / / Вопросы механики и процессов управления. Л.: ЛГУ, 1984. - Вып. 7. -С. 87-93.

72. Слобожанин Н. М. Многошаговые игры с неполной информацией // Мат. методы оптимизации и управления в сложных системах. Калинин, 1984.- С. 90-103.

73. Слобожанин Н.М. Существование ситуации равновесия при конечном времени игры // Дифференциальные игры с неполной информацией/ Л.А. Петросян, Г.В. Томский. Иркутск: ИГУ, 1984. - Глава 3, параграф 3 - С. 142-150.

74. Слобожанин Н.М. Одно необходимое и достаточное условие оптимальности стратегии убегающего // Дифференциальные игры с неполной информацией/ Л.А. Петросян, Г.В. Томский. Иркутск: ИГУ, 1984. - Глава 3, параграф 4 - С. 150-162.

75. Слобожанин Н. М. О мере на множестве траекторий в динамических играх // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(II), 23.04.84-27.04.84. Л.: ЛГУ, 1984. - С.101-104.

76. Слобожанин Н. М. Многошаговые игры с задержкой информации // Записки науч. семинаров ЛОМИ. Сер. Проблемы теории вероятностных распределений. 1985. Т. 142, вып. 9. - С. 86-93.

77. Слобожанин Н.М. Об одной задаче геометрической вероятности // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(III), 2.04.85-5.04.85. Л.: ЛГУ, 1985. - С.80-84.

78. Слобожанин Н. М. Один метод решения игр с задержкой информации // Многошаговые дифференциальные бескоалиционные и кооперативные игры и их приложения. Калинин, 1985. - С. 87-105.

79. Слобожанин Н. М. Заметка к играм поиска !/ Дифференциальные, многошаговые, бескоалиционные и иерархические игры. Калинин: КГУ, 1986. - С. 160-168.

80. Слобожанин Н. М. Об одном свойстве многошаговых игр поиска // Межвузовская конференция молодых ученых "Развитие фундаментальных и прикладных исследований"(IV), 12.05.86-16.05.86. Л.: ЛГУ, 1986. -С.71-75.

81. Слобожанин Н. М. Решение одного класса многошаговых игр с полной информацией // Вести. ЛГУ. Серия мат., мех., астрон. Л., 1987. -Вып. 15. - 10 с. - Деп. в ВИНИТИ 27.10.1986, №7205-87 Деп.

82. Слобожанин Н. М. О рекурсивных стратегиях в играх с монотонной памятью // Межвузовская конференция молодых ученых "Развитие фундаментальных и приклад- ных исследований"(У), 20.04.87-24.04.87. Л.: ЛГУ, 1987. - С.90-94.

83. Слобожанин Н. М. О рекурсивных стратегиях в многошаговых играх с полной памятью // Дифференциальные, многошаговые, бескоалиционные и иерархические игры. Калинин: КГУ, 1987. - С. 128-140.

84. Слобожанин Н. М. Формализация принципа оптимальности Беллмана // Межвузовская конференция молодых ученых МФТИ. Москва, 1989. -С.100-104.

85. Слобожанин Н. М. Теоретико-игровая модель диагностики экологических систем // Всесибирская конференция по математическим проблемам экологии, 23.06.92-25.06.92. Новосибирск, Институт математики СО РАН, Тез. докладов, 1992. - С.70-71.

86. Слобожанин Н. М. О математической модели прогноза и управления экологическим процессом // Конференция "Теоретические и прикладные проблемы экологии 23.10.92-27.10.92. Бухарский ГУ, 1992. - С.50-51.

87. Слобожанин Н. М. Об оптимальном управлении в динамических антагонистических процессах с переменной задержкой информации // Всероссийская конференция "Понтрягинские чтения-IV 3.05.93-8.05.93. Воронеж, Тез. докладов, 1993. - С.80.

88. Слобожанин Н. М. О топологии на множестве траекторий в дискретных динамических управляемых процессах // Международный конгресс по компьютерным системам и прикладной математике, 19.07.93-23.07.93. -Санкт-Петербург, Тез. докладов. С. 100.

89. Слобожанин Н. М. Динамические игры с дискретным временем с неполной информацией // Сб. научных трудов "Модели, алгоритмы, программы". Тверь: ТГУ, 1993. - С. 80-87.

90. Слобожанин Н.М. Дискретные динамические управляемые процессы п лиц // Международная конференция по интервальным и алгебраическим вычислительным методам в науке и технике "Интервал 94 7.03.9410.03.94. - Санкт-Петербург, Тез. докладов. - С. 100-102.

91. Слобожанин Н.М. О свойствах меры на множестве траекторий в динамических процессах с запаздыванием информации // III Международная конференция "Многокритериальные задачи при неопределенности 5.09.949.09.94. Орехово-Зуево, Тез. докладов. - С.70.

92. Слобожанин Н. М. The properties of control in pursuit games // Сб. научных трудов "Game Theory and Applications-/ edited by L.A. Petrosjan and V.V. Mazalov. New York, USA, Nova Science Publishers, 1996. - C. 187-192.

93. Слобожанин Н.М. Управление в конфликтных дискретных процессах с запаздыванием информации // Вопросы механики и процессов управления. СПб: СПБГУ, 1996. - Вып. 17. - С.189-195.

94. Слобожанин Н. М. The control in pursuit games // Международная научная конференция "Много-критериальные и игровые задачи", 8.09.9614.09.96. Орехово-Зуево, Тез. докладов. - С. 110.

95. Слобожанин Н.М. Управление в многошаговых играх. СПб.: СПбГУ, 1996. - 96 с.

96. Слобожанин Н. М. Управление в динамических играх с зависимыми движениями // Процессы управления и устойчивость. Труды XXX науч. конф. СПб., 1999. - С. 591-604.

97. Слобожанин Н. М. Управление в играх в развернутой форме // Труды XXXI научной конференции "Процессы управления и устойчивость", ф-т ПМ-ПУ СПбГУ. СПб: СПбГУ, НИИ Химии, 2000. - С.472-481.

98. Слобожанин Н. М. On two definitions of informational consistency in games with separated dynamics ,// Abstracts of llt/l I FA С International workshop Control Applications of Optimization. 2000. - C.238-239.

99. Слобожанин H. M. On information consistency in games with separated dynamics // A proceeding volume from the ll"' IFAC Workshop/ edited by V. Zakharov. Volume 2. СПб: PERGAMON, 2000. C.647-653.

100. Слобожанин H. M. On information structure in games with separated dynamics // Тезисы докладов III Московской международной конференции по исследованию операций (ORM2001). Москва: ВЦ РАН, 2001. -С. 108-109.

101. Слобожанин Н.М. О непрерывности отображения, связывающего стратегии и траектории в играх // Труды XXXIII научной конференции «Процессы управления и устойчивость», ф-т ПМ-ПУ СПбГУ. Санкт-Петербург: СПбГУ, НИИ Химии, 2002. - С.530-534.

102. Слобожанин Н. М. Информация и управление в динамических играх. -СПб.: СПбГУ, 2002. 308 с.

103. Слобожанин Н. М. О функциональных уравнениях одной игры с неременной задержкой информации // Вестник С.-Петербургского университета.

104. Серия 10, Прикладная математика, информатика, процессы управления.- СПб: СПбГУ, 2006. Вып. 2. - С.75-90.

105. Слобожанин Н. М. Информационная разрешимость в многошаговых играх с конечным множеством игроков // Математическая теория игр и ее приложения. Петрозаводск: редакционно-издательский отдел КарНЦ РАН, 2011. - Т. 3, вып. 2. - С. 81-101.

106. Слобожанин Н. М. Информационная разрешимость в многошаговых играх с множеством игроков произвольной мощности // Математическая теория игр и ее приложения. Петрозаводск: редакционно-издательский отдел КарНЦ РАН, 2011. - Т. 3, вып. 4. - С.81 109.

107. Субботин А. И., Чснцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука, 1991. - 342 с.

108. Филиппов С.Д.Игровая задача наведения при запаздывании информации // Оптимальное управление системами с неопределенной информацией. Свердловск, 1980. - С. 113-119.

109. Халмош П. Теория меры. М.: Иностранная литература, 1953. 291 с.

110. Чснцов А. Г. О структуре одной игровой задачи сближения // Докл. АН СССР. 1975. - Т. 224, вып. 6. - С. 1272-1275.

111. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Матем. сб. 1976. - Т. 40, вып. 6. - С. 1113-1116.

112. Ченцов А. Г. Об одном примере нерегулярной дифференциальной игры // Прикладная математика и механика. 1976. Т. 99, вып. 3. - С. 394-420.

113. Черноусько Ф. JI. Управляемый поиск подвижного объекта // Прикладная математика и механика. 1980. - Т. 44, вып. 1. - С.3-12.

114. Черноусько Ф. Л., Меликян A.A. Игровые задачи управления и поиска.- М.: Наука, 1978. 268 с.

115. Чикрий A.A., Чикрий Г. Ц. Об информированности в дискретных игровых задачах // Кибернетика. 1979. - Вып. 5. - С.126-128.

116. Чистяков С. В. Об одном подходе к решению игр преследования /в соавт. с Л. А. Петросяном // Вестн. ЛГУ. Серия мат., мех., астрой. Л., 1977.- Вып. 1.

117. Яновская Е. Б. О существовании значения антагонистических игр с полунепрерывными функциями выигрыша /7 Изв. АН СССР. Техн. кибернетика. 1973. - Вып. 6. - С. 56-60.

118. Blackwell D. Infinite Г,$-games with imperfect information // Zastosow. mat.- 1969. №10 - P.99-101.

119. Isaaks R. The problem of aiming and evasion // Naval Research Logistics Quarterly. 1955. - Vol. 2 - P.47-67.

120. Orkin M. Infinite games with imperfect information // Trans. Amcr. Math. Soc, 171, Sept. 1972. - P.501-507.

121. Orkin M. An approximation theorem for infinite games // Proc. Amer. Math. Soc, 36. 1972. - №1 - P.212-216.

122. Stewart F. M. and Gale D. Infinite games with perfect information /7 An. of Mat. Studies 28. Princeton, 1953. - P. 245-266.

123. Tulcea I. Mesures dans les espases produits /7 Atti Accad. Naz. Lincei Rend, 7 1949, 1950.