Векторный риск тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Бардин, Александр Евгеньевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1993 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Векторный риск»
 
Автореферат диссертации на тему "Векторный риск"

РГб од

САН.КТгЛЕТЕРБУРГСКИй ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

- 7 М 1333

На правах рукописи. БАРДИН Александр Евгеньевич

УДК 519,816.2

ВЕКТОРНЫЙ РИСК

(01.01.09 — математическая кибернетика)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

САНКТ-ПЕТЕРБУРГ 1993

Работа выполнена в Орехово-Зуевском педагогическом институте Министерства образования Российской Федерации

Научный руководитель: — доктор физико-математических наук,

профессор В. И. Жуковский.

Официальные оппоненты: — доктор физико-математических наук,

профессор В. В. Захаров — кандидат физико-математических наук В. С. Молоствов.

Ведущая организация: — Институт Кибернетики АН Украины.

Защита состоится « » 1993 г. в часов

на заседании специализированного совета К 063.57.16 по присуждению ученой степени кандидата физико-математических наук н Санкт-Петербургском государственном университете по адресу: 198904, г. Санкт-Петербург, Старый Петергоф, Библиотечная пл. д. 2.

С диссертацией можно ознакомиться в библиотеке Санкт-Пс тербургского государственного университета (199034, г. Санкт-Пе тербург, Университетская наб., д. 7/9).

Автореферат разослан « » _ 1993 г.

Ученый секретарь специализированного совета кандидат физико-математических наук,

доцент В. Ф. ГОРЬКОВОЙ

ОБЩАЯ ХАРАКТЕРЫ Р И СТИКА РАБОТЫ

Актуальность теиы. Современная технология и новые задачи экономики потребовали исследования математических моделей, в которых одновременно учитываются три фактора:

- качество функционирования управляемой системы оценивается набором критериев;

- наличие помех, возмущений и другого вида неопределенностей, о которых известны лишь границы изменений;

- управляемая система меняется с течением времени.

Эти задачи рассматриваются в рамках современной математической теории управления, конкретно в том ее направлении, которое к настоящему времени получило название -"многокритериальные динамические задачи при неопределенности". Данный раздел математической кибернетики находится на стыке теории многокритериальных задач и дифференциальных позиционных игр.

Изучение многокритериальных "статических" задач при неопределенности началось буквально в последние годы и проводится в России, США, Италии, Японии и Болгарии. Основа таких исследований - принцип максимина и его модификации на случай векторного критерия.

Однако принцип максимина рассчитан на реализацию "катастрофы" - самой "плохой" для ЛПР (лица, принимающего решение) неопределенности. Такая ориентация является крайне осторожной (пессимистической) и обычно возникает в конфликтных ситуациях, где противоборствующая сторона стремится

'предпринять наихудшее для противника действие. В случае неопределенностей типа возмущений, помех и ошибок измерений обычно маловероятно ожидать реализацию "катастрофы". Поэтому при выборе решения ЛПР может действовать смелее - использовать другие подхода к прин. л решений. Один из таких принципов -минимаксное сожаление по Сэвиджу и взят в основу настоящей работы.

Цель работы. Формализация векторного риска - аналога минимаксного сожаления Сэвиджа в случае векторного критерия. Исследование свойств такого решения. Разработка основ теории векторного риска для многокритериальных динамических позиционных задач при неопределенности и рекомендации к практическому построению.

Методика исследования. В основе исследования лежат результаты теории позиционных дифференциальных игр и многокритериальных задач. Используются понятия и факты, теории оптимального управления, исследования операций, дифференциальных уравнений, функционального анализа и теории множеств.

Научная новизна. Прежде чем исследовать вопросы векторного риска в многокритериальных позиционных динамических системах при неопределенности, следовало рассмотреть ряд новых задач исследования операций, многокритериальных динамических систем и дифференциальных игр, которые, с одной стороны, являются актуальными и представляют самостоятельный интерес для указанных областей, с другой - играют вспомогательную роль в построении основ 'принципа минимаксного сожаления в векторных динамических системах. В "статическом" случае для многокрите-

альных задач при неопределенности в главе I диссертации введены два понятия решения - r-гарантирующего й г-минимаксного и исследованы их свойства. Установлено существование г-минимаксного решения при обычных ограничениях в теории многокритериальных задач (компактность множества решений и непрерывность критериев) и г-гарантирующего решения (в смешанных стратегиях).

Для динамических задач предложена (в главе II) модификация понятия движения, отличающаяся от общепринятого тем, что при построении пошаговых движений допускаются разрывы первого рода в точках разбиения. Необходимость данной модификации вызвана спецификой многокритериальной позиционной динамической задачи. Для последней (в главе III) введено понятие решения - максимальной по Слейтеру стратегии и выявлены ее свойства (существование, внешняя, внутренняя и динамическая устойчивость), способы построения, необходимые условия.

На основе указанных результатов (в главе IV) предложено понятие г-гарантирующей стратегии для многокритериальной динамической позиционной задачи при неопределенности, выявлены свойства и установлено существование для класса задач с "разделенной" динамикой. Основные результаты работы являются новыми.

Практическая ценность. Результаты диссертации могут использоваться при принятии решений в многокритериальных задачах при неопределенности, при построении алгоритмов управления конкретными динамическими системами. Такой алгоритм применен к задаче управления ресурсами при стремлении к монополии на рынке и максимизации прибыли с учетом себестоимости.

Апробация работы. Результаты, составляющие содержание

с

диссертации,- доложены на школе-семинаре "Проблемы многокритериальное™" (Киев, 1992 г.), на III Международном семинаре по глобальной оптимизации (Иркутск, 1992 г), на межвузовской конференции "Новые информационные технологии -теория и практика" (Орехово-Зуево, 1992 г.). Диссертацонная работа обсуждалась на с- чинарах Института Кибернетики АН Украины, факультета ПМ и ПУ Санкт-Петербургского университета, кафедры теоретической механики РосЗИТЛН.

Публикации. Основные результаты диссертации отражены в публикациях И-б], некоторые из них выполнены в соавторстве. Научные результаты, представленные, в диссертации, получены автором самостоятельно.

Структура и объем работы. Диссертация состоит из введения, четырех глав, разделенных на 12 параграфов и приложения. Обьем работы 134 страницы машинописного текста. Библиография содержит 64 наименования.

СОДЕРЖАНИЕ РАБОТЫ

Во введении излагаются основные результаты работы.

В начале главы I приводится формализация принципа минимаксного сожаления Сэвиджа для скалярной оптимизационной задачи при неопределенности, выявляются позитивные и негативные стороны такого подхода.

Затем вводится понятие r-гарантирующего решения в случае многих критериев. Для этого рассматривается многокритериальная задача при неопределенности

<Х, Y, Г(х. у)>, 11) где решения х t X € comp неопределенность у £ Y f comp n-,m и'компоненты Г±(х, у), i i nj-{|, ¿,___,ы> векторного критерия

г/

I

i(x, y)=(i'1 (х,у),..., l'NU,yj) предполагаются непрерывными на произведении компактов X » Y.

В задаче (I) ЛПР стремится выбрать решение х е X таким образом, чтобы одновременно достичь возможно больших значений всех компонент вектора i(x,y). При этом ЛПР учитывает возможность реализации любой неопределенности у a Y.

Каждой неопределенности у € Y ставим в соответствие вектор максимальных значений компонент, который определяет точку "утопии":

f(y)=(max f. (х, у).....max fM(x, у))

хос хех

и разность

Ф(х, y)=f(y)-f(x, у)=

=(шах 1 (z, y)-f (х, у),..., шах 1 (z, y)-fH(x, у)), zex 1 zex N ы

которая названа векторным риском.

Определение I. Решение х* t" X назовем г-гарантирупцим

для задачи (I), если существует неопределенность у* <е У такая, что

Ф(х*. у) / ф(х*, у*) / ф(х, у*), Vx € X, у ^ Y. Здесь ф(1 >> ф(2) « ф<1 >> ф<2) (lew); ф(1 ф(2) <» Тф(1 Чф'2'.

Утверждение I. Множество г-гарантирующих решений задачи (I) является замкнутым и ограниченным подмножеством (может и пустым) множества X.

Построение г-гэрантирующего решения х* для (I) сводится, к нахождению седловой точки в игре <Х, Y, £ а ф (х, у)>, где а^ О и 2 а±> 0. Установлено существование г-гарантирующего решения в смешанных стратегиях.

• Основываясь на теории векторных гарантий в многокритериальных задачах при неопределенности, формализуется понятие

г-минимакса.

Рассматривается многозначное отображение X -» Y: Ys(x) = iys(x) е Y I ф(х, ys(x)) i ф(х. у), v у е Y). Определение 2. Решение х^ назовем г - минимаксный по Слейтеру для (I), если существует неопределенность у(х^) е Ys(x^) такая, что

Ф(х^, у(х£)) / ф(х, у(х)), vx е X. у(х) € Ys(x). Вектор ф(х^,у(х^)) есть г-мишшакс по Слейтеру для задачи (I). Установлено существование г-минимаксных по Слейтеру решений, а также свойства внутренней и внешней устойчивости.

_ В главе II рассматривается двустороннее.конфликтное управление динамической системой 2, состояние которой описывается фазовым вектором х € изменяющимся (во времени t) в соответствии с системой обыкновенных дифференциальных уравнений

x=f(t, х, u, v). (2)

Здесь время t меняется в постоянных пределах от до О .>tQ, вектор f (t,x,u,v)=(i1 (t.x.u.v),... ,fn(t.,x,u,v)) отражает динамические свойства системы 2; управляющие воздействия uePecomp рр и v е Q е comp к4 подчинены первому и второму игрокам соответственно. Векторная функция f(t,x,u,v) непрерывна по совок

упности аргументов, локально липшицева по х и |f| < ^ 7(I+|x|), 7=const>0.

Стратегии U первого игрока отождествляются с допустимыми функциями u(t,x), стратегии V второго - с функциями v(t,x). В связи с выявленными в контрпримере из §4 негативными свойствами движений вводится понятие квазидвижения.

Пошаговый квазидвижениеы системы 2, порожденным из

/

начальной позиции (tQl xQ) е [О, D) » кп

а) стратегией У-г х), У л 53 ,

б) разбиением Л : ^ т„<...< х = 19,

А и и ТПд

в) числом а е [О, П будем называть_всякую функцию

х(-, V, Д, а)=х(г, т0, х0, х0, и(.), V, Д, а), т0«г г < и, которая при ^ I < (3=0,1,..., Шд-1) удовлетворяет квази-

пошаговому уравнению

г

Х(г, V, Д, а)=х^+| Г(т, х(Т, V, Д, а), и(т), х^))с!г,

при условии

тд-1

£ I Х3-Х0(Т3, V, д, а) I < а.

Здесь х0(т;), V, Д, а) - значение (при Ъ^) продолженного вправо до решения 1(1, V, А, а) на промежутке

< V (,1=0'1.....

то есть

1

х0(1:;),У,Д,а)=х;(_1+| Кт. х(т, V, Д, а), и(а), х^_1))с1т,

причем V, Д, а)=х0, х0(1;0, V, Д, а)=х0.

V,

Определение 3. Квазидвижениеи х[•1 = х[1, 10> х , V],

^ тЗ системы 2, порожденным стратегией V е !В из позиции (1;0, х0), называется любая непрерывная на отрезке и ,ч91 функция хШ, для которой существует сходящаяся (при г, т =» со) к ней (в метрике пространства М^С ) последовательность по-

• 10 -шаговых квазидвижений (продолженных влево до tQ, если а^г|.Ч0) х( ■, V. Д(г> а(й))=x(t, Х0. ¿¿г,' и(г) (•), V, Д(г), а1""), t < -б, когда

diara Д(г)= тахЕт^'-т.] -> О j j+i i

и

l^r)-t0| + |iir,-x0l/ 0

при г оо, а(т)* о при (т -» t»).

Здесь Д(г): t^ t'r) <...< = Ч», 0 s» а(тЧ 1.

Утверждение ,2. Пучок квазидвижений i ttQ, xQ, V] является непустым, ограниченным (по норме) замкнутым подмножеством пространства CMt^A] <= Mntt0,"iH.

Далее в главе II устанавливаются, аналогично 1), свойства пучков квазидвижений, альтернатива в случае квазидвижений, существование седловой точки антагонистической игры со скалярной функцией выигрыша, следствия из альтернативы, которые используются в главе III.

В третьей главе вводится понятие решения для многокритериальной динамической позиционной задачи

< 2,. 33, F(xM]) >, (3)

где управляемая система 2 описана уравнением (2). Множество стратегий JB=CV -f v(t, х) | v(t, x) с Q e comp к4}. Качество функционирования системы S определяется значениями N-векторно-го целевого функционала if(xt-öl); предполагаем, что компоненты Fi(x), i е и={1.....Ю вектора г(х) непрерывны.

Определение 4. Стратегию V3 е ® назовем максимальной по Слейтеру в многокритериальной задаче (3) .с начальной

1) Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука. 1974.

позицией (t0, х } t CO, (j) - iPn, если н? существует V г » такого, что имела бы место система строгих неравенств

F1(xtd, t0, х0, VI) ;■ F±u[ 0, t0, х0, Vе] ), i t , для любых квазидвижений-x[•, tQ, xQ, V], x[■, tn, x0, Vs] системы 2.

Установлено существование и свойства внешней, внутренней и динамической устойчивости множества ®3 максимальных по Слей-теру стратегий.

Далее ^ выявляется структура решений многокритериальной задачи (3) при фиксированной начальной позиции (t , xQj. Пусть Xs={xeX[i3, tQ, x0,VrQ]| x=x[U, tQ, x0,Vs], Vs t ®s>- множество всех правых (при t =9) концов квазидвижений xi-, tQ, хп, Vs]>, которые порождаются из начальной позиции (t , xQ) в_сл.учае, когда "переберем" все максимальные по Слейтеру стратегии Vй г;

Введем также "статическую" многокритериальную задачу

<Х[0. t0. х0. V -г Q], (F^x)}^. (4)

с

Обозначим символом Иг множество всех максимальных по Слейтеру (слабоэффективных) решений х3 "статической" многокритериальной задачи (4).

Утверждение 3. При любой начальной позиции (tQ, х ) е [О, чЭ) х кп множества Хэи X5 совпадают.

В заключении главы III получены необходимые условия существования максимальных по Слейтеру стратегий в задаче (3).

В главе IV для многокритериальной задаче при неопреде- . ленности

<2, Ш, »}, г(xC'öl )> (5)

формализуется понятие г-гарантируицей по Слейтеру стратегии и выявлены ее свойства.

В соответствии с подходом главы I, каждой неопределенности U t U поставим в соответствие "точку утопии" nr[U] = (F. tUl,... ,F [U1),

1 N

где

F.tU] = шах F, (x[i9, хп,Ш,

i . x[-] i oo

и разность (векторный функционал риска)

Ф(х[1Э, tQl х0, V, U])=f[U]-f(xH>, tQ, х0, V, U]). Определение 5. Стратегию Vre 3) назовем г-гарантируюцей по Слейтеру для задачи (5) с начальной позицией (tQ, xQ), если . существует неопределенность Ure U такая, что ®(x[«,t0,x0.Ur]) j Ф(х[-Э, t0,x0, Ur, Vr]) i Ф(хРй, t0,x0. Vr]) при всех квазидвижениях x[-t tQ, х , Ur], х[-, tQ, х , V1", иг] и х[., t0, Х0, У-].

Получены свойства наследственности и динамической устойчивости ситуации (Ur, Vr). Существование г-гарантирующих стратегий Vr доказано в §12 для многокритериальной динамической задачи

<2, ш.ш, F(x[-e],yt'e])>, (б)

где управляемая система 2 описывается "разделенным" векторным дифференциальным уравнением (хскп, уекк) x=f(t, х, V), x[t0l=x0, y=cp(t, у, и), уCt0]=y0, функции f(') и ф(•) непрерывны, локально Липшицевы по "своим" фазовым переменным и

|f| ^ 7(1,<1 + М), 1ф1 < 712)(1 + 1у1). 7<J)=«™st > О (J=l,2). Фиксирована начальная позиция (tQ, xQ, yQ) € [0, t) » Fn ■ pk. S и U - множества соответственно "одноточечных" стратегий и

неопределенностей; при этом предполагаем непрерывность р (х,у). Установлена также структура г-гарантируклцих стратегий в задаче (б).

Сравнение максиминного подхода и рассматриваемой в диссертации модификации принципа минимаксного сожаления провес дено на модельном примере.

В приложении получены необходимые условия существования оптимальной по Слейтеру стратегии в линейно-квадратичной динамической позиционной многокритериальной задаче. С помощью этих условий установлена структура решений. .Именно, показано, что "глобальная" оптимальность по Слейтеру для векторного критерия влечет и "локальную" оптимальность по Слейтеру в каждой позиции и, х)<;[0, -3] - кп для специальным образом построенной "статической" многокритериальной задачи.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

I? Принцип минимаксного сожаления обобщен на случай векторного критерия.

2? Предложена модификация движений в позиционных динамических задачах.

3? Формализовано оптимальное решение ( слабо эффективная стратегия) в позиционной многокритериальной динамической задаче и выявлены его свойства.

4? Разработан способ построения необходимых условий в многокритериальных позиционных динамических задачах.

5? Введено понятие г-гарантируклцей стратегии - нового решения многокритериальной динамической позиционной задачи при неопределенности, установлено существование и выявлены свойства.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Бардин А.Е., Салуквадзе М.Е. Векторный риск в'многокрите-. риальных задачах. Тбилиси: Институт систем управления АН

Грузии. 1992, 28 с.

2. Бардин А.Е., Салуквадзе М.Е. Минимаксный риск // Сообщения АН Грузии. 1992. т.З, с. 12-14.

3. Бардин А.Е. Необходимые условия оптимальности по Парето // Тезисы докладов межвузовской конференции. Орехово-Зуево: ОЗПИ. 1992, с. 21.

4. Бардин А.Е. Принцип минимаксного сожаления для многокритериальной задачи // Тезисы докладов IX Сибирской школы-семинара "Методы оптимизации и их приложения". Иркутск. 1992 с. 18-19.

22ТМ0- 6-/У-.3