Теоретико-игровая модель охраны воздушного бассейна от загрязнения тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Савищенко, Наталья Ивановна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Теоретико-игровая модель охраны воздушного бассейна от загрязнения»
 
Автореферат диссертации на тему "Теоретико-игровая модель охраны воздушного бассейна от загрязнения"

Г Б ол

. г да

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Савищенко Наталья Ивановна

ТЕОРЕТИКО-ИГРОВАЯ МОДЕЛЬ ОХРАНЫ ВОЗДУШНОГО БАССЕЙНА ОТ ЗАГРЯЗНЕНИЯ

01.01.09-Автоматическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Санкт-Петербург 1995

Работа выполнена на кафедре

Математической Статистики Теории Надежности Массового Обслуживания факультета Прикладной математики-Процессов управления Санкт-Петербургского Государственного Университета

Научный руководитель: -доктор физико-математических наук

профессор Л.А.ПЕТРОСЯЬ

Официальные оппоненты: -доктор физико-математических наук,

профессор В.В.ЗАХАРОЕ -кандидат физико-математических наук доцент В.А.УЛАНОГ

Ведущая организация- Уральский Государственный Университет.

Защита диссертации состоится в " " час. на заседании Диссертационного Совета К-063.57.16 по защитам диссертаций на соискание ученой степени кандидата физико-математических наук

в Санкт-Петербургском Государственном Университете по адресу 199034, Санкт-Петербург, 10-я линия д.ЗЗ ауд.88, факультет Прикладной Математики-Процессов Управления

С диссертацией можно ознакомиться в научной библиотеке им.Горького Санкт-Петербургского государственного университета по адресу: 199034 Санкт-Петербург, Университетская наб. 7/9. Автореф ерат р азослан

"Л6 " ¿рье^Ц&г. 1995г. Ученый секретарь Диссертационного Совета доктор физико-математических наук, профессор Горьковой В.Ф.

Актуальность темы И( следования. Проблема сохранения -экологического равновесия в условиях глобального загрязнения окружающей среды вследствие всеобъемлющей деятельности промышленных предприятий в последние годы становится предметом дискуссий специалистов всех профилей.

В математике, в частности в теории игр, процесс загрязнения окружающей среды может быть рассмотрен как моделируемый управляемый процесс. На возможность применения теоретико-игровых методов к вопросам охраны природы указывал Н.Н.Воробьев. Поскольку теория игр является теорией математических моделей принятия решений в условиях конфликта.

В условиях угрозы глобального загрязнения налицо все признаки конфликтной ситуации, рассмотрением способов поведения в которой занимается теория игр. На сегодняшний день в экологии положение следующее. Среди регионов, на территории которых расположены источники вредных выбросов, существуют такие, которые в силу различных причин не делают инвестиций в природоохранные мероприятия, и в таком случае все бремя раесходов. в том числе последствий нарушений в окружающей среде, ложится на регионы, заботящиеся об общем экологическом фоне.

Конструкция теоретико- игровой модели ставит перед собой цель выяснить условия, при которых возможно объединение усилий по природоохране, достижение соглашений, фиксирующих подобные сивмо1 тные действия, то есть кооперацию, а так',ке условия сохранения соглашений о кооперации в течение длительного периода. Для решения этих вопросов с математической точки зрения в сконструированной теоретико- игровой модели применяется аппарат теории дифференциальных игр. Фундаментальные результаты

й

и 3'ioii облает математики получены п работах Л.( ЛТонтрягин; II .Н.Красовского. Б.Н.Пшеничного. Л. А.Петро( яна.

Вопросы теории неантагонистических дифференциальных иг исследованы в ¡заботах Н.Н.Данилова. В.В.Захарова, В.И.Жуког ского, А.Ф.Клейменова, А.Ф.Кононенко. О.А.Малафеева, Л.А.Пет роеяна, С.В.Чистякова.

Вопросам применения теории дифференциальных игр к вопрс сам охраны окружающей ереды посвящены работы В.В.Захаров; Л.А.Петросяна. М.Пойола. В.Кайтала, Дж.Закура.

Основной целью диссертационной работы является пострш нпе и исследование теоретике)- иг ровых моделей загрязнения окр> жающей среды выбросами промышленных предприятий и обоснс вание возможности теоретико-игрового подхода к принятию решс ний в области охраны природы. Одновременно ставилась цель: пс лучить условия существования оптимальных решений и решени устойчивых во времени в кооперативных дифференциальных игра>

Научная новизна. В диссертации ш пользуется новый подхо; заключающийся в конструировании суперигры для решения вс проса динамической устойчивости, актуального в различные мс .менты развития суперигры, когда на каждом этапе заново реша ется вопрос о кооперации, либо возможной некооперации. В ра боте "A Multistage .supergamc of downstream pollution'" ( Petio.sja L.A..G.Zaccoui.) конструкция суперигры была впервые введена дл задачи с двумя игроками. Получены условия равновесия по Н-зш в сконструированной суперигре Л: + 1 лица.

Применена введенная впервые Л.А.Петросяном регуляриз. ЦИЯ ДЛЯ получении динамически -Ус ТОЙЧИВЫХ решений. ЧТО ПОЗВОЛ:

ет конструировать ¿-динамически устойчивую траекторию и применять арбитражную схему, которые оказываются динамически устойчивыми уже по построению.

Общая методика исследований. В работе используютя понятия и утверждения общей теории игр, теории дифференциальных уравнений, теории оптимального управлейия, линейного программирования.

Практическая ценность. Полученные в диссертации результаты могут быть ис пользованы при разработке текущих и перспективных территориальных планов охраны окружающей среды и рационального использования природных ресурсов, а также для дальнейшего теоретического исследования дифференциальных лиц.

Апробация работы. Основные результаты диссертации были представлены на Международном Конгрессе по Компьютерным Системам и Прикладной Математике СЭАМ'ЭЗ (Санкт-Петербург, 1993), на Международной конференции "Многокритериальные задачи при неопределенности" (Орехово-Зуево, 1994), на семинарах кафедры Математической Статистики Надежности Массового Обслуживания Санкт-Петербургского Университета.

Публикации. Основные результаты, изложенные, в диссертации, опубликованы в работах [1-4].

Структура и объем работы. Диссертация состоит из введения, двух глав (11 параграфов), списка использованной литературы. Объем работы составляет 133 страницы машинописного текста. В тексте приведено два рисунка. Библиография содержит 45 наименований и помещена на страницах 127-133.

СОДЕРЖАНИЕ РАБОТЫ.

Во введении дается обоснование возможности применения тс оретико- игровых методов к решению проблем охраны окружающе; среды, приводится обзор литературы по этому вопросу, излагаются результаты работы по параграфам.

Первая глава посвящена исследованию предлагаемых прин ципов оптимальности на динамическую устойчивость (состоятель ность во времени). Предлагается регуляризация динамически не устойчивой траектории развития игры и арбитражной схемы Нэш. в игре N + 1 лица.

В представлена постановка задачи минимизации затрат н; очистительные мероприятия.При N — 2 эта задача была впер вые сформулирована в работе Kaitala V., М. Pohjola, " Sustaiiiabl International Agreements on Green House Warnung: A Game tlieor Study", однако наш подход поиска решения существенно отличаете, от предлагаемого в указанной работе.

Рассмотрим дифференциальную игру N + 1 лица

r(Q0,(T-f0)) (1

с предписанной продолжительностью Т — to из начального сс стояния Qо- N игроков — регионы, не страдающие от глобальни го загрязнения. Игрок N + 1 несет убытки вследствие глобальни го загрязнения. — уровень глобального загрязнения в момен времени ¿о- Изменение уровня Q(1) концентрации С02 в атмосфер определяет убытки регионов, порождаемые, отклонением от допу стимого уровня загрязнения. Введя функцию стоимости убытки

региона г, опишем имеющуюся ассиметричную ситуацию

I Д(д)=(), для всех (} (¿ = 1,^) (

БлчПФ) >.°> для всех (}.

В некооперативной задаче каждый из игроков минимизирует свои затраты:

Г

Л = I С,(е,)<1(, 1 = 1^, ' (3)

Т

./у+1 = J [Сл,+1(е^+1) + £>^+,((?)ЗЛ. (4)

где С,(е,) — расходы по поддержанию выброса С£?2 в атмосферу на уровне е,- — убывающая выпуклая функция, удовлетворяющая СДе}") = 0 для некоторого положительного уровня выброса е)" ; -ОдчКФ) — расходы игрока ЛГ + 1 на возмещение убытков от физического ущерба — возрастающая выпуклая функция.

Уравнения движения, описывающие динамику загрязнения известны:

ю ЛЧ1 _

«"= 1,^ + 1 (5)

1=1

где (¿(Ь) — уровень глобального загрязнения; г,- — управляющие параметры — количество экологически вредных газов, выбрасыва-

емых игроком г (г = 1, N + 1); «,-, /1 — параметры окружающей среды.

В кооперативной задаче, игроки минимизируют затраты, действуя совместно:

ЛЧ1 /•Гл,+ |

Л1. (С)

В §2 представлена постановка задачи максимизации прибыли от выпускаемой продукции. Случай, когда N = 2 эта задача Пыла впервые сформулирована в работе G.Zaccour " Side Payments in a Dynamic Game of Environmental Policy Coordination ".

Рассмотрим дифференциальную игру множества N + 1 лиц с предписанной продолжительностью Т — ta

r(S0,Ko,T-to) (7)

из начального состояния (5°,Jí'°). S°— уровень выбросов S(t) в момент времени tQ:

S° = S(t0), (8)

зависящий от применяемой технологии очистки К0:

K0 = (KlK¡,...yK°N+l), (9)

где Kf — технология очистки, применяемая i-тым игроком.

В некооперативной задаче каждый из игроков стремится максимизировать свою функцию прибыли:

т

W¡{SЛ"°; <?,, /,) = j U¡(qi)dt, i = UV (10)

lo

' WN + i{Sa,K\qN+lJN+i)= (11¡

т

= J[UN+l(qÑ+\) ~ F/v+i(/jv+i) - DN+\(S)]dt

где U,{</,) — чистая польза от выпускаемой продукции количеств; iji ( она равна прибыли, получаемой после реализации выпущенное

G

продукции минус затраты на. выпуск продукции ): F¡[Ji) функция вложения инвестиций в технологию очистки, зависящая от инвестиционных окладов I,(/); Д(S) -- ущерб от глобального загрязнения уровня S.

Изменение этого уровня может быть описано дифференциальным уравнением:

Л'+1

S(í) = - ¿S (12)

где ó — темп абсорбции, то есть темп растворения газов.

В в функцию выигрыша, определяемую в задачах минимизации затрат и максимизации прибыли вводится функция, характеризующая соответственно "обесценивание затрат" и "обесценивание прибыли".

Свойства функции обесценивания.

1. Функция Li(t) определена на всем временном интервале [0,оо) .

2. Li{i) > О

3. Lj(t) — строго убывающая функция, так как с течением времени ценность затрат и прибыли уменьшается.

4. Если заранее определить начальный момент времени t0, то лишь в этот момент ценность затрат и прибыли совпадает с реальными затратами и прибылью, то есть при /и = О L¡(0) = 1 .

5. lini L¡(t) = 0

I—X.

Определение. Функция L¡{t — t{]}. обладающая определенными выше свойствами называется дискаунт-фактором.

В частном случае' дискаунт - фактор может быть представ экспоненциальной функцией:

41 - <о) = (

В §4 предлагается кооперативный и некооперативный под: к решению рассмотренных задач минимизации затрат и максим» ции прибыли с учетом ассиметричной ситуации, когда существу регионы, не страдающие, от глобального загрязнения:

Д-(С?) = 0, для всех (} (*=ГЛГ)

Ду-нСС) > 0, для всех С}.

При некооперативном подходе решением является равнове> по Нэшу.

В §5 выясняется, что с учетом дисконтирования траекто] развития игры, вдоль которой достигается максимум функцион; вида

ЛЧ1 °?ЛЧ-1

Ж = £ IV; = / £ - *о) [иЫ - ВД) ~ Д(5)] с1т (

,=, I ;=1

динамически неустойчива, что очевидно даже в простейшем слу<-когда в качестве дискаунт-фактора принимается экспоненциаль; функция.

Предлагается регуляризация задачи, для чего вводится по тие локально кооперативной траектории.

Фиксируем разбиение временного интервала [*о,оС') точкам

6 : (-)и = ¿о < в| < . . . < в»- < < .. . (

где (-),„ , - (-)1 = Л > 0.

На каждом интервал«- [(~)ь I I) определяется новый набор стратегий :

((^40,^40). (^+,(0,^+1(0)), (1С)

применение которого означает достижение максимума функционала вида:

АГ+1 + 1

„/в, = £ = / £- Рг(1,) - Д(5)]^г (17) *'=' е,

где траектория Х(Хоь: /), реализующаяся в результате применения этих стратегий начинается в точке Х(Хс:)1; 9^), характеризующей начальное состояние X©,.

= Х(вк) = (5в1(в*)> Л-04(0О) - (18)

©0 = ад4.,;04-1)- (19)

Определение.Набор стратегий

((Л), №)), ^ , - •, ($+,(*), (20)

назовем 6 -кооперативным решением, определенным на интервале /ц,оо, являющемся объединением интервалов [Э^, 8^+1)1 гДе индекс [6] означает, что на каждом интервале [в*., О1-+1) определяются свои наборы стратегий:

и Л- кооперативное решение 'склеивается " из определенных таким образом на каждом интервале [(-)/,в/ч ¡) наборов стратегий.

Траекторию, реализующуюся В результате применении на( рн стратегий

■. ((чЫ Ш, {Ш Ш,- - ■, (i/v+iio. %, (0))

назовем Ь- кооперативной траекторией

= ВДв,.;*), te{Qk,ek+i), к = 0,1,2,... (:

Теорема. Сконструированная 6- кооперативная траекто}: является Л- динамически устойчивой.

13 «G в качестве "справедливого" распределения выигрыша кооперации, принимаемого как разница затрат игрока N +1 на п] родоохранные мероприятия при некооперации и при кооперация учетом предварительной выплаты каждому г-тому игроку (г = 1, i

N

9{Qo) = (Q0) - V£+1(Q0) - £ > « (

i=I

предлагается арбитражная схема Наша, которая предписывает , лить предполагаемый от кооперации выигрыш поровну. Одн; многократное, применение, арбитражной схемы Нэша делает испо. зуемый принцип несосостоятельньш во времени, то есть динами ски неустойчивым, в случае если применение арбитражной схе Нэша предписано на период [io,oo)-

Предлагается регуляризация арбитражной схемы Нэша. I на каждом интервале разбиения [Gfc, Э*+] ) определяется значен предназначенное к дележу:

= (

«И1 /

в* вц-1

/

Ьк+1{т - 04)

Сн+1(с%+,(е*)) г))

Сл+|(^+1(в4)) + Длг+» {(Т((3ь; г))

(1т -

<1т-

N в'+1

¡=1

е4

здесь е®(0*) — оптимальная стратегия игрока г в некооперативной игре, определенная в момент времени в^. из состояния (¿к = Я°(Як',т) — текущая точка некооперативной траектории исходящей в момент времени 0* из точки 0*), характери-

зующей начальное состояние. ¿¡>1.; <^(0ь) — оптимальная стратегия игрока г в кооперативной игре из состояния т) — точка

оптимальной траектории Ц если игроки используют <5- ко-

оперативные стратегии.

Теорема. Предложенная регуляризация арбитражной схемы является <5- динамически устойчивой.

Вторая глава посвящена конструированию суперигры для решения на каждом этапе развития суперигры вопроса о кооперации либо некооперации.

В §1 моделируется многоступенчатая суперигра N + 1 лица

(20)

где (5°, Л"°) — параметры исходного состояния: начального уровня загрязнения 5° и начального набора технологий очистки Л'о:

Предполагаемая суммарная прибыль, определяемая из исхо, ного состояния (5й, А'0) в случае кооперации множества N + 1 игр ков оказывается равной:

N+1

= шах - (2

*§( 1111

лж

.= 1

т

■ и',(5°, А'0; си,I.) = I{£%,-) - Г,(7,) - Д(5)

> о. /¡(0 > 0, * е [«о

где /1*°; /,-) — прибыль игрока I в случае применения им к

оперативной стратегии (<£•, /,•), предписывающей ему выпуск % кол чества продукции и инвестиций объема /i в природоохранные мер приятия.

Игрок //+1, страдающий от негативных последствий загря нения атмосферы, заинтересован в кооперации настолько, что гот* предварительно выплатить каждому ¿-тому игроку, малозаинтер сованному в кооперации величину 7*, дабы вовлечь тех в коопер цию.

Игроки, соглашающиеся принять предложение игрока N + а, следовательно, участвовать в кооперации на интервале ' могут рассчитать свою прибыль в момент времени : '

и/(М =-^-^-х (2

-Л + 1

1=1

где 7' — предлагаемые игроком N + 1 предварительные выплаты (поскольку игрок N -{- 1 более всех заинтересован в кооперации);

— точка кооперативной траектории Л (Л"/, ^; /). реализовавшейся на предыдущей (к — 1)-ой ступени кооперации множества игроков; — /¿—1) — предполагаемая суммарная прибыль + 1 игроков, участвующих в кооперации на интервале [¿*_1,Т].

В случае реализации партии (Г*Г), в которой первые к ступеней игра кооперагивна и некооперативна после, для игроков из множества П;* суммарная прибыль имеет вид: к

У}

X г^+^ад,.,;«,_,), Т-«,..,) .,;</_,), Г- и)

(30)

+

;=1

/=1

(ачх,,, г;г

(31)

+

где П])едварительные платежи, предлагаемые игроку / на /-той

х

< тупени ( 1 < / < к); 5/ множество игроков, соглал ишииХ( я на той ступени участвовать в кооперации продолжительностью Т— </_ — — всегда определенная прибыль игрока г некооперативной игре Г — <(;).

В §2 рассматривается последняя ступень, суперигры, на к< торой определяются множества стратегий игроков и описывает; поведение игрока, заинтересованного в кооперации, в случае отк за некоторых игроков кооперироваться. Поиск множества игроко соглашающихся на кооперацию позволяет выяснить условия сущ с твовапия равновесия по Нашу на последней ступени суперигры.

Теорема. Любая пара стратегий

(7(5«),5(7(5«))), (3:

где. 7(5«) = (71,72,..., 7,у"); (3,

ФШи)) = (Фм^Ь1), • - •, (3-

является равновесием по Нашу, если

П М'(5и) ф 0, (3:

7' = _1шп 71 , (3

где 5„ --- устойчивое множество игроков, то есть множество , в к тором все игроки согласились кооперироваться п определенный м мент характеризз'ющий начало ?/.-той с тупени.

В ЬЗ для определения динамической устойчивости процедур распределения платежей вводятся функции, характеризующие1 т кое распределение.

Определение. Функции, coolвстсшующие правилу, согласно KoiopoMY на интервале [/,,_|,Т] распределяются выигрыши, называются процедурой распределения платежей:

г

I Ыт)<1т = -)'. i =ТЛ,\ . [Щ

(и- I

г ,s-„

[ ?.v+,(T)rfr = Р-Ч» + |(А'(Лf). Г - /„_,) - ¿V: . (39)

rs«+l

/ = P-s'- + 1 (.Y(A-jM.a: /„-i), г - 0- '€[/„-,. 7'] (4(1)

i

Получено условие динамической устойчивости "процедуры pat пределения платежей".

Теорема. Процедура распределения платежей С,(/)• ' € [/„_ t- Т] динамически устойчива, если

6(0 < /„_,). Г - *„_,]. (41)

f €[/„_,, Г].т = СТ.

В указывается, что в качестве схемы, предлагающей "справедливый дел«1«" выигрыша от кооперации может быть применена арбитральная схема Нэша.

В ¡"¡о представлено решение суперигры.

Общие выводы по работе.

В диссертационной работе построены и исследуются теорет ко- игровые модели окружающей среды.

• В рассматриваемых моделях найдены условия, обеспечив«.] щие равновесие по Нэшу в некооперативных играх Л' + 1 лица.

Регуляризация позволяет сконструировать <V динамическ устойчивую траекторию развития игры. Регуляризация арбитра: ной схемы делает применяемую арбитражную схему также динам чески устойчивой.

Сконструирована модель суперигры, позволяющая на кажд< ступени суперигры решать вопрос о динамической устойчивое при выборе игроками кооперативного либо некооперативного noi дения.

Основные результаты диссертации опубликованы в следу

щих работах:

1. Савищенко Н.И. Регуляризация арбитражной схемы в пробле экологического загрязнения//Сб. научн. тр. Псков: Псковск пед.ин-т, 1994

2. Савищенко Н.И. Проблемы окружающей среды и координац природоохранной политики. В кн: "Введение в математически экологию' // Санкт-Петербург. СПбГУ, 1995

3. Savi.slieuko N. The ршЫеш of paymeiits in tlieoretical-^aiue пю oí" ecological wanniiig// Iuteru Congrcss он Computer Svsteins a Applie<l Matlieiuattics CSAM'93: Abstraéis. Si .-Petersbei^. 1993

4. Savi.slieuko N. The refiumeiit, of t.lie Xash Bar^amiiiu, procedmc in liouse дашо// Múltiple entena problems nnder nn< erlaiilty: Abstrae Tlie 3-<l Illteni. Workslmp. Oiekhovo-Zuevo. l?nssia 1994