Векторный риск тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Бардин, Александр Евгеньевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1993
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
РГб од
САН.КТгЛЕТЕРБУРГСКИй ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
- 7 М 1333
На правах рукописи. БАРДИН Александр Евгеньевич
УДК 519,816.2
ВЕКТОРНЫЙ РИСК
(01.01.09 — математическая кибернетика)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
САНКТ-ПЕТЕРБУРГ 1993
Работа выполнена в Орехово-Зуевском педагогическом институте Министерства образования Российской Федерации
Научный руководитель: — доктор физико-математических наук,
профессор В. И. Жуковский.
Официальные оппоненты: — доктор физико-математических наук,
профессор В. В. Захаров — кандидат физико-математических наук В. С. Молоствов.
Ведущая организация: — Институт Кибернетики АН Украины.
Защита состоится « » 1993 г. в часов
на заседании специализированного совета К 063.57.16 по присуждению ученой степени кандидата физико-математических наук н Санкт-Петербургском государственном университете по адресу: 198904, г. Санкт-Петербург, Старый Петергоф, Библиотечная пл. д. 2.
С диссертацией можно ознакомиться в библиотеке Санкт-Пс тербургского государственного университета (199034, г. Санкт-Пе тербург, Университетская наб., д. 7/9).
Автореферат разослан « » _ 1993 г.
Ученый секретарь специализированного совета кандидат физико-математических наук,
доцент В. Ф. ГОРЬКОВОЙ
ОБЩАЯ ХАРАКТЕРЫ Р И СТИКА РАБОТЫ
Актуальность теиы. Современная технология и новые задачи экономики потребовали исследования математических моделей, в которых одновременно учитываются три фактора:
- качество функционирования управляемой системы оценивается набором критериев;
- наличие помех, возмущений и другого вида неопределенностей, о которых известны лишь границы изменений;
- управляемая система меняется с течением времени.
Эти задачи рассматриваются в рамках современной математической теории управления, конкретно в том ее направлении, которое к настоящему времени получило название -"многокритериальные динамические задачи при неопределенности". Данный раздел математической кибернетики находится на стыке теории многокритериальных задач и дифференциальных позиционных игр.
Изучение многокритериальных "статических" задач при неопределенности началось буквально в последние годы и проводится в России, США, Италии, Японии и Болгарии. Основа таких исследований - принцип максимина и его модификации на случай векторного критерия.
Однако принцип максимина рассчитан на реализацию "катастрофы" - самой "плохой" для ЛПР (лица, принимающего решение) неопределенности. Такая ориентация является крайне осторожной (пессимистической) и обычно возникает в конфликтных ситуациях, где противоборствующая сторона стремится
'предпринять наихудшее для противника действие. В случае неопределенностей типа возмущений, помех и ошибок измерений обычно маловероятно ожидать реализацию "катастрофы". Поэтому при выборе решения ЛПР может действовать смелее - использовать другие подхода к прин. л решений. Один из таких принципов -минимаксное сожаление по Сэвиджу и взят в основу настоящей работы.
Цель работы. Формализация векторного риска - аналога минимаксного сожаления Сэвиджа в случае векторного критерия. Исследование свойств такого решения. Разработка основ теории векторного риска для многокритериальных динамических позиционных задач при неопределенности и рекомендации к практическому построению.
Методика исследования. В основе исследования лежат результаты теории позиционных дифференциальных игр и многокритериальных задач. Используются понятия и факты, теории оптимального управления, исследования операций, дифференциальных уравнений, функционального анализа и теории множеств.
Научная новизна. Прежде чем исследовать вопросы векторного риска в многокритериальных позиционных динамических системах при неопределенности, следовало рассмотреть ряд новых задач исследования операций, многокритериальных динамических систем и дифференциальных игр, которые, с одной стороны, являются актуальными и представляют самостоятельный интерес для указанных областей, с другой - играют вспомогательную роль в построении основ 'принципа минимаксного сожаления в векторных динамических системах. В "статическом" случае для многокрите-
альных задач при неопределенности в главе I диссертации введены два понятия решения - r-гарантирующего й г-минимаксного и исследованы их свойства. Установлено существование г-минимаксного решения при обычных ограничениях в теории многокритериальных задач (компактность множества решений и непрерывность критериев) и г-гарантирующего решения (в смешанных стратегиях).
Для динамических задач предложена (в главе II) модификация понятия движения, отличающаяся от общепринятого тем, что при построении пошаговых движений допускаются разрывы первого рода в точках разбиения. Необходимость данной модификации вызвана спецификой многокритериальной позиционной динамической задачи. Для последней (в главе III) введено понятие решения - максимальной по Слейтеру стратегии и выявлены ее свойства (существование, внешняя, внутренняя и динамическая устойчивость), способы построения, необходимые условия.
На основе указанных результатов (в главе IV) предложено понятие г-гарантирующей стратегии для многокритериальной динамической позиционной задачи при неопределенности, выявлены свойства и установлено существование для класса задач с "разделенной" динамикой. Основные результаты работы являются новыми.
Практическая ценность. Результаты диссертации могут использоваться при принятии решений в многокритериальных задачах при неопределенности, при построении алгоритмов управления конкретными динамическими системами. Такой алгоритм применен к задаче управления ресурсами при стремлении к монополии на рынке и максимизации прибыли с учетом себестоимости.
Апробация работы. Результаты, составляющие содержание
с
диссертации,- доложены на школе-семинаре "Проблемы многокритериальное™" (Киев, 1992 г.), на III Международном семинаре по глобальной оптимизации (Иркутск, 1992 г), на межвузовской конференции "Новые информационные технологии -теория и практика" (Орехово-Зуево, 1992 г.). Диссертацонная работа обсуждалась на с- чинарах Института Кибернетики АН Украины, факультета ПМ и ПУ Санкт-Петербургского университета, кафедры теоретической механики РосЗИТЛН.
Публикации. Основные результаты диссертации отражены в публикациях И-б], некоторые из них выполнены в соавторстве. Научные результаты, представленные, в диссертации, получены автором самостоятельно.
Структура и объем работы. Диссертация состоит из введения, четырех глав, разделенных на 12 параграфов и приложения. Обьем работы 134 страницы машинописного текста. Библиография содержит 64 наименования.
СОДЕРЖАНИЕ РАБОТЫ
Во введении излагаются основные результаты работы.
В начале главы I приводится формализация принципа минимаксного сожаления Сэвиджа для скалярной оптимизационной задачи при неопределенности, выявляются позитивные и негативные стороны такого подхода.
Затем вводится понятие r-гарантирующего решения в случае многих критериев. Для этого рассматривается многокритериальная задача при неопределенности
<Х, Y, Г(х. у)>, 11) где решения х t X € comp неопределенность у £ Y f comp n-,m и'компоненты Г±(х, у), i i nj-{|, ¿,___,ы> векторного критерия
г/
I
i(x, y)=(i'1 (х,у),..., l'NU,yj) предполагаются непрерывными на произведении компактов X » Y.
В задаче (I) ЛПР стремится выбрать решение х е X таким образом, чтобы одновременно достичь возможно больших значений всех компонент вектора i(x,y). При этом ЛПР учитывает возможность реализации любой неопределенности у a Y.
Каждой неопределенности у € Y ставим в соответствие вектор максимальных значений компонент, который определяет точку "утопии":
f(y)=(max f. (х, у).....max fM(x, у))
хос хех
и разность
Ф(х, y)=f(y)-f(x, у)=
=(шах 1 (z, y)-f (х, у),..., шах 1 (z, y)-fH(x, у)), zex 1 zex N ы
которая названа векторным риском.
Определение I. Решение х* t" X назовем г-гарантирупцим
для задачи (I), если существует неопределенность у* <е У такая, что
Ф(х*. у) / ф(х*, у*) / ф(х, у*), Vx € X, у ^ Y. Здесь ф(1 >> ф(2) « ф<1 >> ф<2) (lew); ф(1 ф(2) <» Тф(1 Чф'2'.
Утверждение I. Множество г-гарантирующих решений задачи (I) является замкнутым и ограниченным подмножеством (может и пустым) множества X.
Построение г-гэрантирующего решения х* для (I) сводится, к нахождению седловой точки в игре <Х, Y, £ а ф (х, у)>, где а^ О и 2 а±> 0. Установлено существование г-гарантирующего решения в смешанных стратегиях.
• Основываясь на теории векторных гарантий в многокритериальных задачах при неопределенности, формализуется понятие
г-минимакса.
Рассматривается многозначное отображение X -» Y: Ys(x) = iys(x) е Y I ф(х, ys(x)) i ф(х. у), v у е Y). Определение 2. Решение х^ назовем г - минимаксный по Слейтеру для (I), если существует неопределенность у(х^) е Ys(x^) такая, что
Ф(х^, у(х£)) / ф(х, у(х)), vx е X. у(х) € Ys(x). Вектор ф(х^,у(х^)) есть г-мишшакс по Слейтеру для задачи (I). Установлено существование г-минимаксных по Слейтеру решений, а также свойства внутренней и внешней устойчивости.
_ В главе II рассматривается двустороннее.конфликтное управление динамической системой 2, состояние которой описывается фазовым вектором х € изменяющимся (во времени t) в соответствии с системой обыкновенных дифференциальных уравнений
x=f(t, х, u, v). (2)
Здесь время t меняется в постоянных пределах от до О .>tQ, вектор f (t,x,u,v)=(i1 (t.x.u.v),... ,fn(t.,x,u,v)) отражает динамические свойства системы 2; управляющие воздействия uePecomp рр и v е Q е comp к4 подчинены первому и второму игрокам соответственно. Векторная функция f(t,x,u,v) непрерывна по совок
упности аргументов, локально липшицева по х и |f| < ^ 7(I+|x|), 7=const>0.
Стратегии U первого игрока отождествляются с допустимыми функциями u(t,x), стратегии V второго - с функциями v(t,x). В связи с выявленными в контрпримере из §4 негативными свойствами движений вводится понятие квазидвижения.
Пошаговый квазидвижениеы системы 2, порожденным из
/
начальной позиции (tQl xQ) е [О, D) » кп
а) стратегией У-г х), У л 53 ,
б) разбиением Л : ^ т„<...< х = 19,
А и и ТПд
в) числом а е [О, П будем называть_всякую функцию
х(-, V, Д, а)=х(г, т0, х0, х0, и(.), V, Д, а), т0«г г < и, которая при ^ I < (3=0,1,..., Шд-1) удовлетворяет квази-
пошаговому уравнению
г
Х(г, V, Д, а)=х^+| Г(т, х(Т, V, Д, а), и(т), х^))с!г,
при условии
тд-1
£ I Х3-Х0(Т3, V, д, а) I < а.
Здесь х0(т;), V, Д, а) - значение (при Ъ^) продолженного вправо до решения 1(1, V, А, а) на промежутке
< V (,1=0'1.....
то есть
1
х0(1:;),У,Д,а)=х;(_1+| Кт. х(т, V, Д, а), и(а), х^_1))с1т,
причем V, Д, а)=х0, х0(1;0, V, Д, а)=х0.
V,
Определение 3. Квазидвижениеи х[•1 = х[1, 10> х , V],
^ тЗ системы 2, порожденным стратегией V е !В из позиции (1;0, х0), называется любая непрерывная на отрезке и ,ч91 функция хШ, для которой существует сходящаяся (при г, т =» со) к ней (в метрике пространства М^С ) последовательность по-
• 10 -шаговых квазидвижений (продолженных влево до tQ, если а^г|.Ч0) х( ■, V. Д(г> а(й))=x(t, Х0. ¿¿г,' и(г) (•), V, Д(г), а1""), t < -б, когда
diara Д(г)= тахЕт^'-т.] -> О j j+i i
и
l^r)-t0| + |iir,-x0l/ 0
при г оо, а(т)* о при (т -» t»).
Здесь Д(г): t^ t'r) <...< = Ч», 0 s» а(тЧ 1.
Утверждение ,2. Пучок квазидвижений i ttQ, xQ, V] является непустым, ограниченным (по норме) замкнутым подмножеством пространства CMt^A] <= Mntt0,"iH.
Далее в главе II устанавливаются, аналогично 1), свойства пучков квазидвижений, альтернатива в случае квазидвижений, существование седловой точки антагонистической игры со скалярной функцией выигрыша, следствия из альтернативы, которые используются в главе III.
В третьей главе вводится понятие решения для многокритериальной динамической позиционной задачи
< 2,. 33, F(xM]) >, (3)
где управляемая система 2 описана уравнением (2). Множество стратегий JB=CV -f v(t, х) | v(t, x) с Q e comp к4}. Качество функционирования системы S определяется значениями N-векторно-го целевого функционала if(xt-öl); предполагаем, что компоненты Fi(x), i е и={1.....Ю вектора г(х) непрерывны.
Определение 4. Стратегию V3 е ® назовем максимальной по Слейтеру в многокритериальной задаче (3) .с начальной
1) Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука. 1974.
позицией (t0, х } t CO, (j) - iPn, если н? существует V г » такого, что имела бы место система строгих неравенств
F1(xtd, t0, х0, VI) ;■ F±u[ 0, t0, х0, Vе] ), i t , для любых квазидвижений-x[•, tQ, xQ, V], x[■, tn, x0, Vs] системы 2.
Установлено существование и свойства внешней, внутренней и динамической устойчивости множества ®3 максимальных по Слей-теру стратегий.
Далее ^ выявляется структура решений многокритериальной задачи (3) при фиксированной начальной позиции (t , xQj. Пусть Xs={xeX[i3, tQ, x0,VrQ]| x=x[U, tQ, x0,Vs], Vs t ®s>- множество всех правых (при t =9) концов квазидвижений xi-, tQ, хп, Vs]>, которые порождаются из начальной позиции (t , xQ) в_сл.учае, когда "переберем" все максимальные по Слейтеру стратегии Vй г;
Введем также "статическую" многокритериальную задачу
<Х[0. t0. х0. V -г Q], (F^x)}^. (4)
с
Обозначим символом Иг множество всех максимальных по Слейтеру (слабоэффективных) решений х3 "статической" многокритериальной задачи (4).
Утверждение 3. При любой начальной позиции (tQ, х ) е [О, чЭ) х кп множества Хэи X5 совпадают.
В заключении главы III получены необходимые условия существования максимальных по Слейтеру стратегий в задаче (3).
В главе IV для многокритериальной задаче при неопреде- . ленности
<2, Ш, »}, г(xC'öl )> (5)
формализуется понятие г-гарантируицей по Слейтеру стратегии и выявлены ее свойства.
В соответствии с подходом главы I, каждой неопределенности U t U поставим в соответствие "точку утопии" nr[U] = (F. tUl,... ,F [U1),
1 N
где
F.tU] = шах F, (x[i9, хп,Ш,
i . x[-] i oo
и разность (векторный функционал риска)
Ф(х[1Э, tQl х0, V, U])=f[U]-f(xH>, tQ, х0, V, U]). Определение 5. Стратегию Vre 3) назовем г-гарантируюцей по Слейтеру для задачи (5) с начальной позицией (tQ, xQ), если . существует неопределенность Ure U такая, что ®(x[«,t0,x0.Ur]) j Ф(х[-Э, t0,x0, Ur, Vr]) i Ф(хРй, t0,x0. Vr]) при всех квазидвижениях x[-t tQ, х , Ur], х[-, tQ, х , V1", иг] и х[., t0, Х0, У-].
Получены свойства наследственности и динамической устойчивости ситуации (Ur, Vr). Существование г-гарантирующих стратегий Vr доказано в §12 для многокритериальной динамической задачи
<2, ш.ш, F(x[-e],yt'e])>, (б)
где управляемая система 2 описывается "разделенным" векторным дифференциальным уравнением (хскп, уекк) x=f(t, х, V), x[t0l=x0, y=cp(t, у, и), уCt0]=y0, функции f(') и ф(•) непрерывны, локально Липшицевы по "своим" фазовым переменным и
|f| ^ 7(1,<1 + М), 1ф1 < 712)(1 + 1у1). 7<J)=«™st > О (J=l,2). Фиксирована начальная позиция (tQ, xQ, yQ) € [0, t) » Fn ■ pk. S и U - множества соответственно "одноточечных" стратегий и
неопределенностей; при этом предполагаем непрерывность р (х,у). Установлена также структура г-гарантируклцих стратегий в задаче (б).
Сравнение максиминного подхода и рассматриваемой в диссертации модификации принципа минимаксного сожаления провес дено на модельном примере.
В приложении получены необходимые условия существования оптимальной по Слейтеру стратегии в линейно-квадратичной динамической позиционной многокритериальной задаче. С помощью этих условий установлена структура решений. .Именно, показано, что "глобальная" оптимальность по Слейтеру для векторного критерия влечет и "локальную" оптимальность по Слейтеру в каждой позиции и, х)<;[0, -3] - кп для специальным образом построенной "статической" многокритериальной задачи.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
I? Принцип минимаксного сожаления обобщен на случай векторного критерия.
2? Предложена модификация движений в позиционных динамических задачах.
3? Формализовано оптимальное решение ( слабо эффективная стратегия) в позиционной многокритериальной динамической задаче и выявлены его свойства.
4? Разработан способ построения необходимых условий в многокритериальных позиционных динамических задачах.
5? Введено понятие г-гарантируклцей стратегии - нового решения многокритериальной динамической позиционной задачи при неопределенности, установлено существование и выявлены свойства.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Бардин А.Е., Салуквадзе М.Е. Векторный риск в'многокрите-. риальных задачах. Тбилиси: Институт систем управления АН
Грузии. 1992, 28 с.
2. Бардин А.Е., Салуквадзе М.Е. Минимаксный риск // Сообщения АН Грузии. 1992. т.З, с. 12-14.
3. Бардин А.Е. Необходимые условия оптимальности по Парето // Тезисы докладов межвузовской конференции. Орехово-Зуево: ОЗПИ. 1992, с. 21.
4. Бардин А.Е. Принцип минимаксного сожаления для многокритериальной задачи // Тезисы докладов IX Сибирской школы-семинара "Методы оптимизации и их приложения". Иркутск. 1992 с. 18-19.
22ТМ0- 6-/У-.3