Равновесие по Нэшу в игре группового преследования

Тарашнина, Светлана Ивановна

Равновесие по Нэшу в игре группового преследования тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Тарашнина, Светлана Ивановна АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Санкт-Петербург МЕСТО ЗАЩИТЫ

1997 ГОД ЗАЩИТЫ

01.01.09 КОД ВАК РФ

Автореферат по математике на тему «Равновесие по Нэшу в игре группового преследования»

Автореферат диссертации на тему "Равновесие по Нэшу в игре группового преследования"

, САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ ' ' ' УНИВЕРСИТЕТ

2 >11ЛДР №

На правах рукописи

ТАРАШНИНА Светлана Ивановна

РАВНОВЕСИЕ ПО НЭШУ В ИГРЕ ГРУППОВОГО ПРЕСЛЕДОВАНИЯ

Специальность: 01.01.09. " Математическая кибернетика"

АВТОРЕ ф Е Р А Т диссертации на соис.калше ученой степени кандидата физико-математических наук

Санкт-Петербург 1997

Работа выполнена в Санкт-Петербургском Государственном Университете на факультете прикладной математики — процессов управления.

Научный руководитель: доктор физико-математических наук,

профессор Петросян Л. А.

Офицальные оппоненты: доктор физико-математических наук,

профессор Чистяков С. В.

кандидат физико-математических наук, Савищенко Н. И.

Ведущая организация: Институт проблем механики РАН, Москва.

Защита состоится 1997 г в часов на заседа-

нии диссертационного совета К-063.57.16 по защитам диссертаций на соискание ученой степени кандидата физико-математических наук в Санкт-Петербургском государственном университете по адресу: 198904, Санкт-Петербург, 10-я линия В.О., д.ЗЗ, ауд.88.

С диссертацией можно ознакомиться в научной библиотеке им. М.Горького Санкт-Петербургского Государственного Университета.

Автореферат разослан ]

Ученый секретарь диссертационного совета, д.ф.м.н., профессор

Горьковой В.Ф.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория дифференциальных игр преследования решает задачи управления непрерывно движущимися объектами в условиях конфликта, когда целью одной стороны является поимка объекта другой стороны за кратчайшее время, а целью противоположной стороны, участвующей в конфликте, является максимизация времени встречи с объектами противника. Когда в процессе преследования участвует один преследователь и один преследуемый игрок мы имеем дело с классической антагонистической дифференциальной игрой преследования. Если же в преследовании участвуют более двух игроков, то более естественной является постановка задачи преследования как неантагонистической дифференциальной игры, хотя некоторые авторы даже и и этом случае прибегали к модели антагонистической игры, разбивая игроков па две группы (каждая из которых считалась отдельным игроком) с противоположными интересами.

Антагонистические дифференциальные игры преследования впервые подробно описаны в монографии Р. Айзекса, переведенной на русский язык в 1967 году.

В отечественной литературе фундаментальные результаты в области теории антагонистических дифференциальных игр преследования получены в работах Л. С. Понтрягина, II. II. Красовского, Э. Г. Альбрехта, И. Л. Григоренко, А. Н. Красовского, В. Н. Лагунова, О. А. Малафеева, А. А. Меликяна, Е. Ф. Мищенко, М. С. Никольского, Ю. С. Осипова, Л. А. Петросяна, Б. Н. Пшеничного, Б. Б. Рихсиева, H. Ю. Сатимова, А. И. Субботина, Г. В. Томского, Ф. Л. Черноусько, А. А. Чикрил, С. В. Чистякова.

В то же время более реалистическим, неантагонистическим играм преследования, как п мировой, так и в отечественной литературе но теории дифференциальных игр достаточного внимания не уделялось. Здесь следует отметить работу Петросяна Л. А. и Ширяева В. Д. 'Простое преследование одним преследователем двух преследуемых" [1978], в которой была впервые поставлена задача преследования как неантагонистическая дифференциальная игра преследования одного преследователя и двух убегающих.

В случае, когда в процессе преследования участвуют один преследователь и много убегающих, каждый из которых стремится максимизировать свое время выживания (время до момента встречи)

предположение о возможности объединения большого числа убегающих. в одну коалицию на длительном промежутке времени, и тем самым, построение антагонистической игры, моделирующей конфликтный процесс преследования, предсташшется искусственным. Поэтому задача исследования процесса преследования как неантагонистической игры и описание о ней множества равновесных по Нашу ситуаций, относится к числу актуальных проблем современной теории игр преследования.

Важнейшим результатом в теории неантагонистических некооперативных дифференциальных игр является доказательство существования равновесия по Нэшу для общего случая игры п лиц. Оно было получено, с использованием различных подходов, Малафеевым О. А. и Чистяковым С. В.

Цель исследования. Цель работы заключается в исследовании неаитагонистической дифференциальной игры простого преследования между одним преследователем и п убегающими, действующими как самостоятельные игроки; нахождение в такой задаче множеств равновесных но Нашу ситуаций в предположении, что стратегия преследователя заключается в выборе одного из п! порядков преследования и соответствии со стратегией параллельного сближения, оптимальность которой была доказана Л .Л.Петросяном для игры преследования с "линией жизни" в 1965 году, а класс стратегий убегающих включает в себя произвольные перемещения, возможные при использовании уравнений простого движения.

Научная новизна работы. В диссертации исиользоваи новый подход к исследованию задач группового преследования, в котором убегающие игроки не рассматриваются как единал коалиция, действующая против преследующего игрока, а предполагается, что каждый из убегающих игроков стремится максимизировать собственный выигрыш— время до момента встречи с преследователем. Для построения множеств равновесных по Нэшу ситуаций получил развитие введенный впервые Л. А. Петросяном подход, основанный на возможности преследующего игрока с помощью угрозы изменения порядка преследования навязывать убегающим определенные, может быть, в некоторых случаях неблагоприятные, для них способы поведения. Равновесные по Нашу ситуации найдены в явном аналитическом виде.

Методика исследования. В работе используются понятия и утверждения теории дифференциальных игр, теории игр, теории оптимального управлеггия.

Практическая ценность. Полученные результаты представляют теоретический и практический интерес. Так, например, результаты рассматриваемой работы могут быть применены для исследования конфликтных задач управления, включающих одного сильного участника и большого числа игроков, имеющих более слабые возможности влиять на развитие процесса. Найденное в работе богатое семейство равновесий по Кэшу позволяет прогнозировать различные сценарии развития конфликтно управляемой системы, с упомянутым распределением сил участников процесса.

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались

в на Международном конгрессе "International Congress on Computer Systems and Applied Mathematics" CSAM'93 (St.-Petersburg, 1993);

• на Международных конференциях: The 3-d, 4-th Intern. Workshops "Multiple criteria problems under uncertainty" (Orekhovo-Zuevo, 1994, 1996);

« на Международном научном конгрессе "Народы содружества независимых государств накануне третьего тысячелетия: реалии и перспективы" (С.-Петербург, 1996); « на Международной конференции N. N. Vorob'ev memorial conference "Game theory and economics'" (St.-Petersburg, 1996);

♦ паСанкт-Петербургскомгородскомсеминарепо теории игр, 1997, рук. проф. Петросян;

Публикации. По результатам диссертации опубликовано 6 печатных работ. Перечень публикаций приведен в конце автореферата.

Структура и объем работы. .Диссертация состоит из введения, двух глав, разбитых на 11 параграфов, заключения и списка литературы, включающего 37 - наименований. Работа изложена на 104 страницах, содержит 12 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность выбранного направления

исследования, дан краткий обзор литературы по теме диссертации и приведена аннотация результатов диссертации.

Глава 1 посвящена исследованию задачи группового преследования одним преследователем двух убегающих, действующих как самостоятельные игроки.

В неантагонистических играх со многими участниками может существовать несколько ситуаций равновесия, которые в отличие от антагонистических игр, вообще говоря, не эквивалентны и не взаимозаменяемы.

Рассмотрим бескоалиционную игру преследования трех лиц: Р — преследователь, Е1, Е-2 — убегающие. Игра происходит в плоскости, движения игроков простые, игроки Е\, Е2 дискриминированы, т. е. Р в каждый момент времени знает направления движения Е1 и Е2 в этот момент. Пусть а — линейная скорость Р, /?,• — линейная скорость Е{, причем а > тахД;, г = 1,2. Р\ Е\ — их местопо-

ложения в момент времени Ь, Движение игроков начинается

в момент времени I = 0 из начальных положений Р°, ЕУбегающий Е{ считается пойманным, если местоположения игроков Р и Ei в некоторый момент времени совладают.

Выигрыш Ei определим, как время встречи Ег с Р, г = 1,2 . Выигрыш Р определяется, как взятая с обратным знаком величина выигрыша пойманного последним. Игрок Р стремится минимизировать времл преследования, а убегающие Е\ и £2 стремятся по возможности оттянуть момент поимки их преследователем Р. Обозначим через Кр — функцию выигрыша игрока Р, а через /С,- — функцию выигрыша убегающего Е{, г - 1,2.

Будем считать, что преследователь Р на протяжении всей игры использует стратегию параллельного сближения (П-стратегию).

В начале игры Р предписывает убегающим определенные стратегии, интересные ему. С учетом предписанных стратегий Р определяет оптимальный порядок очередности встреч, перебирая всевозможные порядки и выбирая тот, который дает минимальное время преследования. Убегающим^, Еч сообщается выбранный порядок. Для того, чтобы они придерживались предписанных стратегий игрок Р подключает стратегию наказания, которая заключается в изменении порядка преследования в случае, если какой-нибудь из убегающих отклонится от предписанной стратегии, и отклонившийся игрок преследуется первым.

Оказывается, в игре Г(1,2; Р°, Е\, Е®) существует бесконечное

множество ситуаций равновесия по Нэшу. Интересен тот факт, что преследователь Р, используя стратегию наказания, т. е. угрожая изменением порядка преследования, может заставить убегающих действовать крайне неблагоприятно для самих себя, например, двигаться в точку встречи преследователя с предыдущим убегающим или стоять яа месте вплоть до момента поимки предыдущего убегающего.

Обозначим первого по порядку преследуемого через Ej, второго через Ё'з-j (г =1,2).

Определение 1. Стратегия наказания игрока Р называется эффективной в момент времени t, t 6 [О, Т;), если время жизни игрока £з_,-, начиная с момента I, при движении согласно предписанной стратегии будет больше, чем если он отклонится от нее, т. е.

Ti,3-i > TL;> «'=1,2.

-Данное условие будем называть условием эффективности стратегии наказания в »момент времени t, t 6Е [0, 31). Здесь Т)- -— время встречи Р с FJi.

Условие эффективности стратегии наказания в момент t — 0 в этом случае имеет вид

(а - 203+ (« - ft) [l^fi"-,'! - й-i] >0, ¿=1,2. (1)

Выбор порядка очередности встреч игроком Р осуществляется из условия, какой из порядков .дает меньшее время преследования, т. е.

Kf(u*У )vi'') = max {л'р(п12,гУ\!Г), Кр(и2ь*т\ t>2)} ,

где Tit3-i — время, за которое Р догонит обоих игроков, сначала Ei, затем г = 1,2. Получено условие, исходя из которого Р

осуществляет выбор порядка очередности встреч

¿=1,2.

Случай, когда игрок не достигает точки А1 до момента 7}, возможен при условии

/3з-': е, > \EtiNil ¿=1,2 (3)

о - А

Теорема 3.1. В игре Г(1, 2; Р°, Е°) в случае, когда выполнены условия (1)-(3), существует ситуация равновесия по Нэшу, которая строится следующим образом:

1) оптимальная стратегия Ei (у1) предписывает ему движение вдоль прямой линии, соединяющей точки начальных местоположений Р и Е{, в направлении от Р.

_2_%

2) оптимальная стратегия Е^-% (у ) предписывает ему движение по прямой Ез_{Агг, к точке А" до момента Т», где N' = РТ' — точка встречи игроков Р и Ег, и движение в обратном направлении после момента

3) игрок Р (стратегия и*) выбирает стратегию «¿,3-«', г ~ 1 или 2 в зависимости от того, какой из порядков дает меньшее время преследования пуп условии, что Е{ и придерживаются стратегий

V1 и у*3 ' соответственно, и Р меняет порядок преследования, если „

Ез-{ отклонится от стратегии V

Доказано, что если условие эффективности имеет место в момент времени £ = 0, то оно имеет место и в произвольный текущий момент времени < £ [0,Т;).

Определение 2. Областью осуществимости стратегии наказания игрока Р при фиксированных местоположениях игроков Р и Е{ будем называть множество местоположений убегающего Е^-г, при которых данная стратегия наказания является эффективной.

Для ситуации (м*, г? ,г>3 ') построена область осуществимости стратегии наказания игрока Р при фиксированных начальных местоположениях игроков Е{ и Р: Р° = (0,0), = (в, 0), а > 0 и

скоростях а = 1, = /З3_г = и показано, что, если игрок попал в эту область в начальный момент времени, то он не сможет ее покинуть до момента поимки игрока Е;. Другими словами, найдено множество всех местоположении Е^х,]/), при которых ситуация (и*, V1, и ) является равновесной по Нэшу.

Найдено целое семейство ситуаций равновесия по Нэшу, предусматривающих произвольное прямолинейное движение второго убегающего. Данное семейство ситуаций включает в себя как наиболее благоприятную для убегающего /£;}_,• ситуации, так и крайне неблагоприятную для него ситуацию и бесконечное множество ситуаций промежуточного характера. Каждая ситуация этого множества строится следующим образом: игрок Ei использует уже описанную стратегию V1, игрок Ез_; использует стратегию г>3_\ которая предписывает ему движение но лучу Е^^М в произвольном направлении ЧУ, 7 6 [0,27г) до момента Т{, а затем движение вдоль прямой И'М в направлении от Р, & игрок Р применяет выше описанную стратегию и*, учитывая, что £?,• и придерживаются стратегий г? и £,3_г соответственно. В этом случае также получены условия, при которых ситуация (и*, V1, V3"') является равновесной по Нишу.

В работе исследован вопрос: может ли игрок Ез-{ менять направление своего движения в промежутке времени [0,Т;) таким образом, чтобы имело место равновесие по Нэшу. Обозначим через б; — множество направлений движения игрока для которых вы-

полняется неравенство

й(а- - ) + у^2-2Ц?«>5(71 + > &-,•(« - (4)

Зафиксируем некоторое направление 71 £ 0\, в котором начинает двигаться игрок Ез-{ в момент времени Ь = 0. Множество С?1 не пусто, так как всегда существует направление 71 = 7Г 4- для которого неравенство (4) выполняется для любых начальных местоположений Р°, Е®, и скоростей игрокоп. Таким образом, мы имеем равновесную по Нэшу ситуацию вида (м*,г?, у3 ').

Введем прямоугольную систему координат следующим образом: за начало координат примем точку ось Ох направим по Р°Е$, ось Оу — вверх.

Предположим теперь, что убегающий может сделать к — 1

поворот. В работе определено множество направлений движения Ск, в которых может повернуть убегающий в момент времени в зависимости от того, как он двигался первоначально, чтобы пересечение областей осуществимости стратегий наказания было непусто, и местоположение игрока £'з_¿ в момент поворота, т. е. в момент времени I — Тк~\, принадлежало этому пересечению, т. е.

ф %У1Е7^{х,у) е Другими словами, если игрок

Ез-i выбирает направление своего движенияв момент времени Tk-i из множества Gk, "го это ведет к сохранению описанного равновесия по Нашу.

Теорема 7.1. В игре Г( 1,2; Р°, Е®, существует ситуация равновесия по Еэшу, которая строится следующим образом:

1) оптимальная стратегия E¡ (i)2) предписывает ему движение вдоль прямой линии, соединяющей точки начальных местоположений Р и Ei в направлении от Р.

-г

2) оптимальная стратегия (у ) предписывает ему двигаться по ломаной MqM\ ... Мь до момента Ti, при каждом j — 1-ом повороте выбирая направление своего движения из множества Gjr где

7/ £ (arceos Zj-\ + <рТ>~1, — arceos \ -f 2ít + y^"1), \Z¡~x| ^ 1 7; £ [0, 2-тг), 1 > 1.

а затем по прямой NlXík в направлении от Р. Здесь Мо ~= Mj = ElMt — причем в промежуток времени Aj = [xj_i,Tj)

он движется по лучу Mj-\Mj, j = 1, ... ,k в направлении q~fj и в момент Tj меняет направление своего движения. Здесь jj — угол, соответствующий направлению qy .

3) игрок Р (стратегия и*) выбирает стратегию и,- з_,-, г = 1 или 2 в зависимости от того, какой из порядков дает меныисс время преследования при условии, что Ei и E-¿-i придерживаются стратегий

~3-г

vl и v соответственно, и Р меняет порядок преследования, если

~3-i

Ез_,- отклонится от стратегии v

Еще одно семейство равновесий по Нешу получено в предположении, что игроки Ei и Е-2 могут изменять свои линейные скорости /?¿(í), i = 1, 2 в произвольный момент t так, что 0 ^ $(¿) ^ Д, i = 1,2.

Теорема 6.1 U игре Г(1,2; Р°, Е'{, Е$) в случае, когда начальные положения таковы, что выполнены условия (5), (6), существует ситуация равновесия по Нэшу, которая строится следующим образом:

1) оптимальная стратегия E¡ (v*) предписывает ему движение вдоль прямой линии, соединяющей точки начальных местоположений Р и Ei, в направлении от Р.

2) оптимальная стратегия предписывает ему стоять

на месте до момента времени гиТ{, где. ю £ [О, 1], а затем двигаться по прямой /¿з_,-ЛГ'; от точки Ыг, т. е. /?з_,-(<) = О 6 [О, гоТг], /?з-.(0 = /%-,■

игрок Р (стратегия и*) выбирает стратегию Иг,з_;, г = 1 ил« 2 э зависимости от того, какой из порядков дает меньшее время преследования при условии, что Е{ и £з_,- придерживаются стратегий Т? и соответслпвенно, т. е.

. Г - /?3-,-) + [\№Е1_г\ + /?3-,-7;(1 - IV)} (а - А) ) »= 1,2.

Р меняет, порядок преследования, если Е^ отклонится от стратегии г?3~'.

Условия (5), ((!) имеют вид

й(а - &-,•) + + /?3-«Т;(1 - и)](а - (к) <

ея-г(а -0{) 4- [¡Аг3~!Ег° | + /?,-Т3_<(1 - «,)](« - (5)

(а+(« -/?;) |+ Й-,] >0, (б)

г'= 1,2, ме[0,1].

В главе 2 рассмотриваете.я неантагонистическая дифференциальная игра простого преследования одним преследователем п убегающих.

Пусть имеется один преследователь Р и п преследуемых Еу, Е2, • ■ • , Еп. Пусть также а — линейная скорость Р, — линейная скорость Е{, причем а > шахД-, г = 1, ... , п.

Выигрыш игрока определим, как время встречи Р с E^, г = 1,2,... ,п. Выигрыш Р определяется как взятая с обратным знаком величина выигрыша пойманного последним. Данную дифференциальную игру условимся обозначать Г(1, п; Р°, Е°,... , Е

Преследователь Р в момент £ = 0 выбирает один из п\ способов поведения: преследует по П-стратегии последовательно каждого из убегающих игроков. Стратегия «1,2,. .¿,...,п — стратегия игрока Р,

заключается в последовательном применении П-с.тратегии к игрокам Ei, i?2, ... ,Е{, ... ,Еп соответственно.

Обозначим через Е\ — j-oro по порядку преследования игрока. Предположим, что в некоторый момент времени i преследователь

уже поймал нескольких убегающих Е\, j < j', и он начинает пре-

. / ■ /

следовать убегающего Е\ . Тогда Е{ — игрок, за которым ведется преследование в данный момент.

В работе получены обобщения на случай п убегающих теоремы 2.1, теоремы 2.2, теоремы 3.1, теоремы (5.1 гл. 1. Интересно, что в игре r(l,vi;/>0, ... , Е®) существует беконечное множество обобщений каждой из теорем главы 1. Приведем пример наиболее неблагоприятного для убегающих игроков обобщения теоремы 6.1.

Теорема 4.1. Б игре Г(1, щ Р°, Е°,... , Е°) в случае, когда для каждого убегающего Е\, I = 2,... ,п выполнены 1—1 условий (7), существует ситуация равновесия по Нэшу, которая строится следующим образом:

1) Ei выбирает стратегию v*, которая предписывает ему

« движение согласно поведению [vj ]* по прямой, соединяющей .исстополож.ения игроков Р и Е\ в момент в направле-

нии on Р, если г = j1, j' S {1, ... , п};

• стоять согласно поведению [vj]* на Aiecme до момента встречи игроков Р и , т. е. до момента времени Tj-i, если i = j, j > f, j G |2,...,«}, Здесь A-(i) = 0, Vi € [0,7}] и &■(*) = Д, Vi > Тг;

2) Игрок P в соответствии со стратегией и*

выбирает стратегию иi,2,...,n или, .. или un,n-i,...,1 в зависимости от того, какой из порядков дает меньшее время, при условии, что каждый из убегающих Ei придерживается стратегии v*, г — 1,... ,п, и Р меняет порядок преследования, если какой-нибудь из оставшихся преследуемых Ei, i ф f выбирает направление своего движения так, что вектор его скорости не совпадает с направлением, предписанным стратегией v*. Если олгклонится игрок Ei, i — j', то P we меняет порядка преследования. Причем условие (7) имеет вид

а - Рг

+Ps-lTs-X COS <р-* - + (!/о_1 -/3s_lTs^ sin^-2 - 2/0)2 +

+ P,T, cos p'-i - X-«)2 - ¡3STS sin - yj? > > + cosy'-2 - X°)2 + - ft-1.sin -

(7)

для всех s < I, .5 £ {1,. .. — 1}, / G {2, ...,n}.

Кроме описанного обобщения существуют более слабые обобщения ситуации (u*,v*,v3~').

Убегающим игрокам Е\, I = 1,...,« предписывается стоять на месте некоторый отрезок времени A¡k = tj — í¿, где tj > tf., tj,tk G [0,7]_i]. Причем до момента t = игрок E¡ должен двигаться с максимальной скоростью по прямой от предполагаемой точки встречи преследователя с предыдущим убегающим. Промежуток времени = tj —ti;, где tj > tk, tj,lk £ [0,Tj_i] он стоит, а затем опять движется с максимальной скоростью по прямой от предполагаемой точки встречи преследователя с предыдущим убегающим.

Игрок Р, согласно предписанному убегающим поведению, выбирает такой порядок очередности встреч, который дает минимальное время преследования и преследует последовательно по П-стратегии убегающих в соответствии с выбранным порядком. Р меняет порядок преследования, если какой-нибудь игрок выбирает направление своего движения, отличное от вышеописанного.

Ясно, что чем слабее требования преследователя, тем меньше условий на начальные положения и скорости игроков накладывается для того, чтобы рассматриваемая ситуация была равновесной по Нашу. Например, если время простоя игрока Е,, i — 2,... , га, Ajh = T¡, т. е. tk = 0, tj = 'i'i, то для равновесия по Нашу данной ситуации необходимо выполнение для каждого Ei одного неравенства (7), равно как и, ecflníj, tk G (0, Ti). Чем больше времени стоит убегающий E¿, i = 2,... , п, тем больше ограничений на множество начальных положений и скорости игроков.

Предположив, что убегающие могут вступать в коалиции, получаем, что в данной игре коллективная договоренность будет бессмысленной, так как по крайней мере один из отклонившихся игроков будет нести потери.

Замечание 1.1. В игре Г( 1, п; Р°, ... , Е%) при отклонении от ситуации («*, uj,... , и*) группы убегающих игрок Р преследует из этой группы игрока с наименьшим номером к, и ситуация (и*,vi,... ,v*) является почти сильно равновесной, поскольку сре-

ди отклонившихся игроков всегда существует игрок с наименьшим порядковым номером, которого Р будет преследовать первым, и, по крайней мере, »тот убегающий при отклонении получит меньший выигрыш.

В заключении подытоживаются полученные результаты.

В работе показано, что любая обобщенная ситуация является почти сильно равновесной.

ВЫВОДЫ

Подытоживая результаты диссертационной работы, мы приходим к следующему основному выводу.

В дифференциальной не.антагонистической игре п + 1 лица простого преследования между одним преследователем и несколькими убегающими игроками преследователь Р может, угрожая изменением порядка преследования, навязать убегающим игрокам практически любой способ поведения. Сюда включается способы поведения, благоприятные для убегающих, крайне неблагоприятные для них, благоприятные для одних и неблагопрятные для других и обширное семейство поведений, носящих промежуточный характер.

Удалось доказать, что подобные наборы стратегий (ситуаций) при определенных ограничениях на начальные местоположения игроков являются равновесными по Нашу, т. е. устойчивыми к отклонению от них каждого отдельного игрока. Более того, отмеченные равновесия оказываются даже устойчивыми относительно отклонений от них коалиций убегающих игроков, т. е., пользуясь терминологией теории игр, оказываются почти сильно равновесными.

Публикации по теме диссертации

1. Taraslmirja S. The "lifeline" pursuit game with a pursuer team P = P(1),P(2) and two evaders E(\),E{'2). International Congress on Computer Systems and Applied Mathematics CSAM'93. St.-Petersburg, 1993.

2. Tarashnina S. On a three person "lifeline" pursuit game. The 3d International Workshop "Multiple criteria problems under uncertainty". Abstracts. Orekhovo-Zuevo, 1994, p.92.

3. ТарашнинаС. И., Кудряшова H. А. Об осуществимости стра-

тегий наказания в игре простого преследования трех лиц // Сложные управляемые системы: Сб. научн. тр., Москва, 1996, стр. 152156.

4. Тарашнина С. И. Устойчивость тоталитарных режимов // Тезисы докладов Международного научного конгресса "Народы содружества независимых государств накануне третьего тысячелетия: реалии и перспективы", С.-Петербург, 1996, том 3, стр. 157-58.

5. Taraslinina S. The Set of Nash equilibrium in simple pursuit game with one pursuer and many evaders// The 4-th International Workshop "Multiple criteria and game problems under uncertainty". Abstracts. Moscow, 1996, p. 117.

6. Tarashnina S. I. The Nash equilibria in the pursuit game with one pursuer and two evaders. N. N. Vorob'ev memorial conference "Game theory and economics". Abstracts. St.Petersburg, 1996, p. 70.