Теория оптимальных правил "многократной остановки" тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Николаев, Михаил Леонидович АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2000 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «Теория оптимальных правил "многократной остановки"»
 
Автореферат диссертации на тему "Теория оптимальных правил "многократной остановки""

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М. В. ЛОМОНОСОВА

На правах рукописи УДК 519.21

Р Г Б ОД

НИКОЛАЕВ Михаил Леонидович

- 7 ФЕЗ 2000

ТЕОРИЯ ОПТИМАЛЬНЫХ ПРАВИЛ "МНОГОКРАТНОЙ ОСТАНОВКИ"

01.01.05— теория вероятностей и математическая статистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук

Москва 2000

//

Диссертация выполнена в Математическом институте им. В. А. Стеклова РАН и Марийском филиале Московского открытого социального университета.

Официальные оппоненты: доктор физико-математических наук,

профессор Веретенников А. Ю.,

Ведущая организация: Центральный экономико-математический

институт, г. Москва

Защита состоится 18 февраля 2000 года в 11 часов на заседании диссертационного совета Д 053.05.38 при Московском государственном университете по присуждению ученой степени доктора физико-математических наук по адресу: 119899, Москва, Воробьевы Горы, МГУ, Факультет вычислительной математики и кибернетики, ауд.

С диссертацией можно ознакомиться в библиотеке Факультета вычислительной математики и кибернетики МГУ.

доктор физико-математических наук Гущин А. А.,

доктор физико-математических наук, профессор Мельников А. В.

685.

Автореферат разослан января 2000 г.

Ученый секретарь совета профессор

Трифонов Н. П.

/5 /У/. 6\05

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В конце 40-х — начале 50-х годов в статистическом анализе возникло новое направление — последовательный анализ Вальда. Идея этого подхода оказалась очень плодотворной и на ее основе сформировалась новая ветвь статистики, развитая в работах А. Вальда, Дж. Волфовица, К. Дж. Арроу, Д. Блекуэлла и М. А. Гиршика. Под влиянием этого направления возникла также и задача оптимальной остановки случайных процессов, сформулированная Дж. Снеллом следующим образом.

Пусть на некотором вероятностном пространстве Р) за-

даны неубывающая последовательность ^-подалгебр С С ... С С Т и последовательность ^„-измеримых случайных величин Хп = Хп(ш), п = 0,1, 2,.... Обозначим С = {г} совокупность случайных величин со значениями из множества {0,1, 2,..., +оо} и таких, что Р(г < оо) = 1 и {ш : г (о/) = u} € Такие случайные величины называются моментами остановки, задающими правила остановки процесса Хп. Если интерпретировать Хп как "выигрыш", который получается при остановке в момент времени п, а ЕХГ — как средний выигрыш по правилу остановки г, то основные задачи теории оптимальных правил остановки состоят в нахождении цены v — supEXr и е-оптимальных правил т6 (е ^ 0), т.е. таких момен-

тес

тов, для которых ЕХГс + £ ^ v. В случае е = 0 момент т" = т0 называют оптимальным. Исходя из теории мартингалов Дж. Снелл (при достаточно широких предположениях) показал, что цена v есть Ei/o, где {Un,T„) — минимальный регулярный супермартингал, мажорирующий {Хп}, а момент т£ = inf{ra ^ 0 : Un ^ Х„ +е} является е-оптимальным (е > 0).

В работах И. Чао и Г. Роббинса, Г. Хаггстрома, Д. Сигмунда, JI. Шеппа и др. получено обобщение результатов Снелла, найдены решения некоторых задач последовательного анализа. Так ими, в частности, установлено, что если Сп С С есть класс моментов

остановки такой, что Р(т ) n) = 1 и /„ =esssup Е(А"1-|^ГП), то

гес„

"n-цена" v„ = sup ЕХГ равна Е/„, а е-оптимальный момент остановки те = inf{n ^ 0 : /„ ^ -f гг}, при Э'том последовательность {Л} совпадает (при некоторых предположениях) с минимальным регулярным супермартингалом {£/„}, мажорирующим последовательность {X,,}. Можно сказать, общая теория оптимальных правил остановки случайных процессов с дискретным временем достигла почти окончательного вида (см. книгу Г. Роббинса', Д. Сигмунда, И. Чао1 и библиографию там же).

В рассмотренную схему входит и тот случай, когда величины Хп представлены в виде Хп = • • • ,£«), где {£„} — некото-

рая последовательность, причем наибольший интерес представляет случай, когда последовательность {£„} является марковской. Общая теория марковского случая (с дискретным и непрерывным временем) построена, в основном, в работах Е. Дынкина, А. Ширяева и Б. Григелиониса. Именно эта модель детально исследована в известной монографии А. Ширяева2. А'. Факеев разработал теорию оптимальных правил остановки для процессов с непрерывным временем.

Естественным расширением общей теории оптимальных правил остановки является случай к (к 2) остановок случайного процесса. При к — 2 задача в основном решена Г. Хаггстромом3. Решение задачи в общем (к ^ 2) случае является актуальной проблемой. В качестве мотивации можно привести следующие задачи:

— обобщение задачи о наилучшем выборе на случай выбора к (к ^ 2) лучших объектов;

— многоразовая коррекция траектории движения материальной точки;

1 Роббинс Г., Сигмунд Д.. Чао И. Теория оптимальных правил остановки. М.: Наука, 1977.

2Ширяев А.Н, Статистический последовательный анализ. М.: Наука, 1969, 197G.

3Haggstrom G. Optimal sequential procedures when than one stop is required. -Aim. Math. Statist., 19G7, v.38, N G, p. 1618-1626.

— нахождение оптимальной стратегии я = (<т, т) в задаче "купли-продажи", когда покупка акции стоимостью осуществляется в случайный момент <г, продажа в момент г по цене 5Г и "доход" от операции составляет Х„т = 5Г —

— разработка процедур скорейшего обнаружения множественной разладки5.

Наконец, отметим, что проблематике статистического последовательного анализа в последние десятилетия посвящены многие конференции. г.

Замечание!..В дальнейшем под "многократной остановкой" условимся понимать к (к ^ 2) остановок случайного процесса.

Цели исследования. Диссертационная работа посвящена построению теории оптимальных правил многократной остановки случайных процессов с дискретным временем. Основными целями являются:

— нахождение условий существования и структуры оптимальных и ¿-оптимальных (е > 0) правил многократной остановки;

— исследование способов построения функции выигрыша (цены игры);

— отыскание необходимых и достаточных условий оптимальности правила многократной остановки;

—; рассмотрение ряда задач последовательного анализа, допускающих конструктивное решение.

Методика исследований базируется на основных результатах теории случайных процессов и общей теории оптимальных правил остановки случайных процессов с дискретным временем.

Научная новизна. В отличие от общей теории оптимальных правил остановки, когда требуется делать одну остановку наблюдаемого случайного процесса, в данной схеме исследуется случай

4 Ширяев А.Н. Основы стохастической финансовой математики. Т. 1, 2. М.: Фазис, 1998.

5Колмогоров А.Н., Прохоров Ю.В., Ширяев А.Н. Вероятностно-статистические методы обнаружения спонтанно возникающих эффектов. Труды МИАН СССР, М.: Наука, 1988.

к (к 2) остановок случайного процесса с дискретным временем. Наиболее существенные результаты диссертации:

— найдены условия существования и структура оптимальных и е-оптимальных (е > 0) правил многократной остановки случайных процессов;

— установлены необходимые и достаточные условия оптимальности правила многократной остановки;

— получены достаточные условия конечности с вероятностью единица кандидата на оптимальное правило многократной остановки;

— даны практически удобные способы построения выигрыша (цены игры);

— в рамках общей схемы выделен и подробно изучен случай многократной остановки марковских' последовательностей. Показано, что можно несколько упростить общую теорию и дать сравнительно простое описание оптимальных правил многократной остановки;

— рассмотрены два обобщения классической задачи наилучшего выбора: выбор с максимальной вероятностью к (к ^ 2) лучших объектов из числа заданных N и задача выбора к (к ^ 2) объектов с минимальным суммарным рангом. Найдены оптимальные стратегии выбора и предельный выигрыш. Задачи показательны тем, что имеют явные решения, т.е. доведены до "числа".

Теоретическая и практическая ценность. Работа носит, в основном, теоретический характер. Ее результаты и методы могут быть использованы в научных исследованиях и учебных целях. Кроме того, разработанные процедуры могут найти применение в финансово-актуарном деле, моделях управления производством и в других областях.

Апробация работы. Результаты диссертации докладывались на семинарах, отечественных и международных конференциях как в нашей стране, так и за рубежом. В частности, на:

— семинаре Института математики АН СССР им. В.А.Стеклова

(рук. - проф. Новиков A.A., 1987), семинаре Института математики РАН (рук. - акад. РАН Прохоров Ю.В., 1999);

— Третьей (1981), Четвертой (1985) и Пятой (1989) Международных Вильнюсских конференциях по теории вероятностей и математической статистике;

— I Всемирном конгрессе Общества математической статистики и теории вероятностей им. Бернулли, Ташкент, 1986;

— 12-th European Meeting of Statisticians, Varna, Bulgaria, 1979;

— Первой (Абрау-Дюрсо, 1994), Второй (Йошкар-Ола, 1995), Третьей (Туапсе, 1996), Четвертой (Уфа, 1997), Пятой (Йошкар-Ола, 1998) и Шестой (Самара, 1999) Всероссийских Школах-коллоквиумах по стохастическим методам;

— XIX (1985), XX (1986) Всесоюзных школах по теории вероятностей и математической статистике, Бакуариани;

— 20-th Conference on Stochastic Processes and their Applications, Nahariya, Israel, 1991;

—- XII Internationaler Kongreßüber Anwendungen der Mathematik in den Ingenieurwissenschaften, Weimar, 1990;

— Всесоюзной научно-технической конференции с международным участием стран членов СЭВ "Применение статистических методов в производстве и управлении", Пермь, 1990.

Публикации. Основные результаты диссертации опубликованы в работах [1-16].

Объем и структура работы. Диссертация состоит из введения и двух глав, содержит 127 страниц текста, в списке литературы 50 названий.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована актуальность темы исследований, приведены цели работы и обзор литературы, дано краткое описание результатов диссертации.

Глава I посвящена построению теории оптимальных правил многократной остановки случайных процессов с дискретным временем.

В §1.1 приводятся необходимые для дальнейшего стандартные сведения из общей теории оптимальных правил остановки случайных процессов с дискретным временем.

В §1.2 содержится постановка задачи оптимальной многократной остановки случайных процессов с дискретным временем.

Основная схема, принятая в диссертации, следующая.

Пусть ух,у2, - ■ ■ (возможно конечная) последовательность случайных величин с известным совместным распределением. Эти случайные величины мы наблюдаем последовательно и должны решить, когда остановиться. Если мы останавливаемся в момент времени тт^ после наблюдений (у^,.. .,уШ1), то начинаем наблюдать другую последовательность 2/т1,,„1+1, у„1ит1+2, ■ ■ • (зависящую ОТ (уг,..., 2/т 1)) и решаем задачу оптимальной остановки новой последовательности. Если сделано г остановок в моменты т1,т2,...,т{ (1 ^ г ^ к — 1), то наблюдаем последовательность случайных величин у,„,,...,,„;,„,¡+1,!/™,.....«.¡да+г,---, распределение которой зависит

от (уи. ■ ■ ,у„11,утл,т1 + 1,...,утит1, • • •, 2/т, ,...,т, )• Наше решение остановиться в моменты m¡ (г = 1,2,... к) зависит лишь от наблюдений, которые уже сделаны, но не зависит от будущего, которое еще не известно. После к (к ^ 2) остановок получаем выигрыш

......тк — Зтп 1(?/1) • • • I Упг 1 ,тпл + 11 • ■ ■ 1 Ут ......ть ) )

где £Г,„,....,„1к — известная функция. Задача состоит в нахождении процедуры, которая максимизирует ожидаемый выигрыш.

Дадим более формальную постановку задачи. Всюду далее будем считать заданными:

1) вероятностное пространство

2) при каждом г — 1,2,...,к и наборе целых чисел 0 = т0 < Ш! < ... < т,-_! неубывающую последовательность ст-подалгебр {Р,,,,.....„.,■_,,ш;,т,- > т,_1} сг-алгебры Т такую, что

ГП],....ГН,-1 ^ ........ ^ -^1711,+ 1 I

3) для фиксированных целых mi,... , mfc_i, 1 ^ mi < ... < mt_i, случайный процесс

{^т 1 ,...,Г7)(,- ] ,711* ) ^rai , тщ i ^fc ^ .

В случае неформальной постановки, сделанной выше,

mi,...,mi — ^(i/ll • • • ) Ут \ j 2/т ,,011 + 1 j • • • i 2/т , ,;il2 ' ' " * > Уl .....'"i) *

Введем необходимые определения. Набор случайных величин (г!,..., г,-), принимающих значения 1,2,...,+оо, назовем правилом г-кратной остановки (1 ^ i ^ к), если он удовлетворяет следующим условиям:

а) 1 ^ Ti < т2... < г, < оо (Р-п.н.),

bj) {и> ■ П — Tnu...,Tj = rrij} £ J7mi,...tmj при всех TTij > m,_i > ... > mi ^ 1; j = 1,2,. ..,i.

Для удобства правило ¿-кратной остановки будем называть просто правилом многократной остановки (п.м.о.). Для каждого п.м.о. т = (т!,..., тк) естественным образом определим ZT = ZT, , положив

Ti(w) = mi,... ,тк(ш) = mk, mk > ... > mi > 1; если верно хотя бы одно неравенство вида r,(a>) ^ т1+1(и>) или тк (ш) = -foo.

Пусть Sm означает класс п.м.о. т = (ri,...^.) таких, что

тх ^ m (Р-п.н.). Положим vm = sup ЕZT, где супремум берется

resm

по всем т таким, что Е/?г существует. Функцию vm будем называть m-ценой, v = vx просто ценой, а п.м.о. г* € Sm, для которого математическое ожидание ЕZT. существует и ЕZT. = v, назовем оптимальным правилом многократной остановки в S,„. Будем говорить, что правило те € 5ТО является е-оптимальным (е > 0), если v,n — £ ^ и ЕZTt существует.

д

Zr{u>) =

mi т

-ОО,

Теперь мы в состоянии очертить круг основных задач:

А: отыскать условия существования и структуру т* и те;

В: найти необходимые и достаточные условия оптимальности п.м.о.;

С: получить достаточные условия конечности с вероятностью 1 кандидата на оптимальное п.м.о.;

D: вычислить ш-цену vm.

§1.3 носит вспомогательный характер. Здесь рассматриваются последовательности случайных величин, которые играют ключевую роль в нашем построении.

Введем предварительно ряд обозначений:

х+ = шах(ж,0), х~ = — шт(ж,0),

(A), = (Ai, Л2,.. ■ ,Л,), (A)i = Alf E(ni)l.i = E(f|^(ra)(),

А(т)Л = (SUP Е(т).+, (. . . (SUP Е^),,.^) ...)),

mi+1 тк-1

i(m)i£ = E(m)i( sup Е(т);+1 (... ( sup E(ra)fc_^) ...)).

Пусть T(m),- — класс правил г-кратной остановки (т), = (ть ... ,т,) (г = 1,2,...Д')ст1 = ть ... ,r,-_i = mi_1, г,- ^ т,- (Р-п.н.), где Tj,,,), = Т„п означает класс всех таких моментов остановки т1г что Ti ^ ш^Р-п.н.). Положим Х(гп)к = Z(m)k и определим последовательно от i — к по убывающим значениям г:

V(m)i. = esssup E(m).X(r)j, (1)

(r),'6T(m).

= E(*T.),-_i V"(m)i_lj,„{_l+1, i — к, к - 1,..., 1, (2)

где X0 = 0.

Наглядный смысл очевиден — это максимальный средний выигрыш, который может быть получен, если первые (г — 1) остановок сделаны в моменты т^-.-.т,-.!, а г-я остановка после момента т, при условии уже проделанных т,- наблюдений. Случайная последовательность {X(m)f} — специально построенная последовательность, которую мы останавливаем в г-й раз (г = 1,2,..., к). Например, {Xmi} — исходная последовательность, используемая для остановки в первый раз, {Х(„,)2} — для остановки во второй раз (т2 ^ тj 1) и т.д.

Оказывается, Vjm), и Х(т),. связаны рекуррентным уравнением

774 ) wl j +1} (Р-п.н.), (3)

позволяющим, в частности, в случае конечного числа наблюдений конструктивно находить оптимальное правило многократной остановки и цену игры vm.

§1.4 посвящен отысканию условий существования и структуры оптимального и с-оптимальных (е > 0) п.м.о., достаточных условий конечности кандидата на оптимальное п.м.о. (задачи А, С).

Теорема 1.4.1 дает условия существования и структуру оптимального в S1 п.м.о.

Теорема 1.4.1. Пусть выполнено условие

А+: E(sup А(т)1 (sup < +оо.

т 1 (m)k

Положим для г = 1,2,..., fe

т* = inf{m, > m,-.! : V(m)i = X(ra)i}

на множестве Fj_х = {ш : ra* = т1,...,т*_1 = m,^}, где считаем, что т*(и>) = -f-oo на {и> : т'_1[ш) = +оо} и F0 = П. Тогда если случайный вектор т* = (tj,...,ta?) конечен с вероятностью единица, то т* € Si является оптимальным п.м.о. и Vi = ЕtZr. (Р-п.н.).

Замечание2. Условие А+ обеспечивает существование всех рассматриваемых математических ожиданий.

При построении e-оптимальных (е > 0) правил многократной остановки будет использоваться следующая теорема.

Теорема 1.4.2. Пусть выполнено условие А+. Определим для всякого е > 0 случайный вектор т£ = (г1е,..., тке), положив для ¿=■1,2,...,*:

т1£ = inf jm, > m¡_1 : X{m)¡ > V{m). - ^ j

на множестве Fi_i = {ы : rl£ = mi,... ,T(¿_1)£ = m¿_i}, где считаем, что tíc = -fco на {ш : t"(,_i)£ = +00} 'и F0 = Q. Тогда те является правилом многократной остановки и ЕiZTe ^ Vi — е (Р-п.н.).

Следующее утверждение является обобщением теоремы 1.4.1; доказывается совершенно аналогично.

Теорема 1.4.3. Предположим, что случайные величины Z(m)h удовлетворяют условию А+ и т ^ 1} — последователь-

ность случайных векторов — (TjTO,..., т£та), определенных следующим образом:

т*т = inf{m¡ > m,_i : X(m)j = У(т),}

на множестве Fi_1 = {w : = mi,...,^^ = m,_ 1},

где положим r,*m = -foo на {u> : = -foo}, F0 = П u

m0 — m — 1. Если случайный вектор т{т) конечен с вероятностью единица, то он является оптимальным п.м.о. в Sm и Fro - ЕmZr¡m) (Р-п.н.).

Приводимая ниже теорема раскрывает роль Vm как аналога экс-цессивной мажоранты для Z^m)k и как характеристики m-цены vm.

Теорема 1.4.4. Пусть выполнено условие А+. Тогда:

а) V,„ =esssup ЕmZT (Р-п.н.);

res,,,

б) EV„, = v,n ;

в) для любого оптимального п.м.о. т 6 Sm V,n = EmZf (Р-п.н.).

Определим случайный вектор тт(е) = (rlw(e),... ,rim(£)), положив

г,ш(е) = inf |m¿ > m,_! : X(m)i. ^ V(ra)i - ||

на множестве {а; : т1т(е) = mlt... ,r(i_i),„(е) = ггг,_х}, где будем считать, что T(J+1)m(£) = оо на {u> : т,-т(е) = 00} и F0 — П, ш0 = т — 1. Как и в случае теоремы 1.4.2, тт(е) есть п.м.о. в 5,„ и E„,Zr,n(e) ^ Vm - е (Р-п.н.).

Теперь мы способны рассмотреть вопрос о существовании и структуре £-оптимального п.м.о. (е > 0).

Теорема 1.4.5. Если выполнено условие , то правило многократной остановки rm(e) является £-оптимальным п.м.о. в S,„.

Заметим, что вектор т* = (т^,... ,т£) (как и r("m() не может быть конечным с вероятностью единица, если оптимального многократного правила в Si(Sm) не существует. Более того, можно построить примеры, в которых оптимальное правило существует, а г* не является конечным. Достаточные условия конечности с вероятностью единица кандидата на оптимальное п.м.о. г* устанавливаются в теореме 1.4.6.

Теорема 1.4.6. Пусть выполнено условие Тогда случайный вектор г' является конечным с вероятностью единица, если Р-п.н.:

ak) lim Z(m\ = -00 для всех тк-\ > > ... > mx ^ 1;

nifc—»CO '

а*—1) lim supm. Zim). = -00 для всех mA._2 > rnk_3 > ... >

Ulk-1—юо

mi ^ 1;

а,) lim A(m).(supmii Z[m)k) = —00 для всех > m,_2 > ... >

m! ^ 1, г — k - 2,... ,1.

Рассмотрим теперь конечный случай. Пусть задано семейство случайных величин

{Z{m)h, 1 ^ тпх ^ Ni, mi < m2 < iV2(™i),...,

<mk 4 ^(т1,,..,т(.1)},

где iVi, Ni(-) (i = 2,...,k) являются целыми положительными числами. В частности, в эту схему входит и модель вида

{Z(m)k, 1 <С m1 < m2 < ... < mk ^ N},

которая возникает при рассмотрении многих игровых задач последовательного анализа. Очевидно, теория оптимальных правил многократной остановки, построенная выше, справедлива и в этом случае. Тогда последовательность У(га). можно определить (см. (3)) из рекуррентных уравнений "индукцией назад":

У{т);_11ТЩ+1} (Р-П.Н.) (4)

при 1 ^ тпх ^ 7\Г1?... ,т,_2 < т,_1 ^ ЛГ1_1(т1,..., т{_2), т,_! < гп{ ^ ..., т,_1), где как и прежде полагаем Х(,„)к =

Оптимальное п.м.о. г" также находится по теореме 1.4.1, а теорема 1.4.4(6) и рекуррентное соотношение (4) позволяют в принципе найти цену игры .

Доказываемая в §1.5 теорема дает необходимые и достаточные условия оптимальности п.м.о. в случае, когда случайные величины Z^m)k удовлетворяет более сильному условию, чем условие А+ (задача В).

Теорема 1.5.1. Пусть выполнено условие А+ : Е(8ирЛт1(5ир.г+ )) < +оо.

"И (т)*

Для того чтобы п.м.о. т = (гх,... ,тк) было оптимальным, необходимо и достаточно выполнения условий (Р-п.н.):

на множестве {ш : Тх — тпх,...,?{ = mi,Ti > т;};

на множестве {и> : тх — гпх,..., г,-_1 = т,_1, г, > т,}, I — 1,2,... ,к.

В общей схеме случайные величины Х(т)1 и т-цену V,,,

невозможно найти непосредственно, исходя только из определений и рекуррентных уравнений (§1.3) и теоремы 1.4.4(6) (§1.4). В связи с этим важно исследовать вопрос о возможности такого построения У(т),, Х{т){ и т-цены V,,,, которое давало бы практически удобный способ их нахождения (задача Ю).

Рассмотрим конечный случай. Пусть задано семейство случайных величин

{Z[m]k, 1 ^ Ш! < т2 < ... < тк ^ N} .

Как мы уже сказали, теория оптимальных правил многократной остановки, построенная выше, справедлива и в этом случае. Определим естественным образом основные объекты схемы. Положим (для 1 ^ ш ^ N - к + 1):

= {т € Sm : P(m ^ п < т2 < ... < тк <L N) = 1} , = sup Е ZT,

res%

T£={r16Tmi:P(T1$N-k + l) = l},

T(l)< = {(T)' e T0"h ■■P(Ti^N-k + i\ T1=m1,...,

ri_1 = m,_i) = l}, i = 2, ...,&,

У(т){ = esssup E(m).X^lt (г)<ет(т).

— i — к, к - 1, . . . , 1,

где Х£ь = Z(rh , Xrna = 0.

В силу (4) последовательность {У^.} можно определить из рекуррентных уравнений "индукцией назад":

y-.V _ yN

v»)t = rnax{xfm)(I E)ra)i^)f_iiW(+1}

при т,_! < т,- ^ JV — к + i — 1, i = к, к — 1,..., 1. Ясно, что С С ... С Sm, поэтому

Аналогично,

Vra (Р-П.н.).

Следовательно, существуют пределы

lim г£и V£= lim при этом v*n <: г>„, и Уп; v,„.

Вспомним теперь, что по теореме 1.4.4(6) m-цена v^ — поэто-

му можно вычислить из рекуррентных уравнений. Естественно задаться вопросом: при каких условиях на Z(m)k v*m совпадает с

После этих предварительных рассмотрений, подсказывающих, каким может быть один из способов построения ш-цены игры vmt перейдем к точным формулировкам (§1.6).

Теорема 1.6.1. Предположим, что Z(m)k удовлетворяют условиям А+ и

А' : E(supmi ,4(m)l(sup(mK Z^n)J) < +оо. Тогда для г = 1,2,..., к

= Ä, = J™.

Следствие 1.6.1. Если выполнены условия А+ и А~, то т-цена

vm = lim EV^.

Л ->со

Далее мы рассмотрим другие способы конструктивного построения случайных величин V(Tn)i, Ar(m). и га-цены vm. Пусть для —со < о ^ 0 ^ b < -i-oo

z(m), (а) = max {Z{m)i, a} , Z(mh (b) = min {Z(m)k, b}

и

{b, Z(m)k > b, Z(m)!,, a ^ Z(m)i ^ b,

°> Z(m)k < a-

Определим очевидным образом (см. (1) и (2)) случайные величины ^(m).Ot (где снова х(т)Л-) = z(mhl))> соответствующие

последовательностям {^(1П)к(а)}, [Z(m)k(b)} и {Z^m)lt(a, b)}. Понятно, что они также удовлетворяют рекуррентным уравнениям (3).

Теорема 1.6.2. Пусть выполнено условие А+. Тогда Р-п.н. для ¿=1,2,..., А

lim V{m).(a) = V{n)i, lim X(mh(a) - X(m)i.

a-f — oo > ' ' Q-^ — oo i

Следствие 1.6.2. Пусть справедливо условие А+. Тогда: /P-n.w.J;

= lim lim ЕК?(а) = lim EVra(a).

<j-+-OO ЛГ-юо 0-+-00

Теорема 1.6.3. Если выполнено условие А~, то Р-га.и. lim Vjm).(6) = V(,„)., lim X(m)i(b) = X(m)i.

Следствие 1.6.3.

Пусть выполнено условие A~. Тогда (как и для Х^„).)

Vim)i = lim lim V{Zh(b) = lim lim (Р-п.н.);

О—ЮоЛ—ЮО 1 ' JV—> oo Ь—t-oo v "

Если выполнены оба условия А+ и А~, то

vm = lim lim EV^(ft) = lim lim EKiv(b).

b—юо iV—voo m V ' A'-*oc 4-+oo m V '

Пусть случайные величины Z(m)k удовлетворяет условию Л+. Положим тогда для iV ^ 2

—JV

r^.V

= maX{^(m)k,E(m)fcFjn)k ii,nt + 1} , Ш^х < mk < N. Обозначим предел Vim)k = lim , и

N—юс ^ 'h

Определим далее

V

(m)k_2,,V-l yJV-1

V (m)fc-i

SUp Х(т)к_2 r), шах , Е(т)к_, } ,

т*_з < тк-1 < N — 1, и т.д. Наконец, "jv-jt+i = EjV-jt+x( sup Xr),

r>N-k+l

V

■N-k + 1

max{xmi,ErniF^i+1+1} , 1 ^ ma < Лг - к + 1.

Теорема 1.6.4. Пусть выполнены условия А+ и А~. Тогда с верояностью единица = ^(т), и = Х(т)г

Следствие 1.6.4. При выполнении условий А+ и А~

lim EV*.

ЛГ-юо m

Мы суммируем предшествующие результаты в следующей теореме.

Теорема 1.6.5. Пусть выполнено условие А+. Тогда

lim lim lim ЕV£(a,b),

о—» - ос Ь—юо N—юо

lim lim lim EV£'(a,ft),

_ 3-+-OC ЛГ-ЮО l-»cc

lim lim lim EV^fa, t),

ci —^ — oc b—юо Л"-юо

lim lim lim EF,„(a, 6).

. a—» —со Л'—too fr—юо

Для большого класса задач оптимальной многократной остановки можно ограничиться рассмотрением случая, когда случайные величины 2(т))г представимы в виде — д{хт1,... ,хт/1), где {¡с,,} — марковская последовательность.

Целью параграфа 1.7 является описание оптимальных и е~оптимальных правил многократной остановки в марковском случае.

Дадим более точную формулировку марковского случая. Предположим, на произвольном вероятностном пространстве (П, Т, Р) заданы:

1) марковская цепь {жт, Тт, т ^ 1} в фазовом пространстве {X,13), где — неубывающая последовательность <т-подалгебр сг-алгебры Т\

2) при каждом г ~ 1,2,... ,к а наборе целых чисел 0 = т0 < т 1 < ... < т,_! неубывающая последовательность <т-подалгебр {^г(то).,т1- > т,..!} сг-алгебры Т такая, что

(т);_1 С ^(т); С т," >

3) для фиксированных целых тп1,..., тпк_1, 0 = га0 < гпх < ... < случайный процесс {2{т)к,^{т)к,тк > тк_1}, где ■Я(т)к ~ ^(«т,, • • • 1к), а д{х,у, ... ,г) является действительной Вк-измеримой функцией, определенной на Хк.

Определим ш-цену игры

ит = вир Е2Т - вир Ед(хГ,----,хГк)

и скажем, что п.м.о. т е 5т, если г € 5„, и существуют такие В, € Б, что

тг = тГ{гп! ^ т : хт1 € Вх} , г, = тГ {т, > : ж,,,,. € Д } ,

где B¡ ~ B¡(тl,.. .,гГь,..., гГ)._,), г — 2,..., к. Наглядный смысл 5т понятен — это класс п.м.о. без "памяти", т.е. запоминаются лишь состояния цепи в моменты ,..., тк.

Утверждение, что тп-цена ига достигается на 5,,,, является интуитивно очевидным, так как в марковском случае наше решение об

остановках, по-видимому, должно основываться на состояниях системы в данный момент и в предыдущие моменты остановки, и не должно зависеть от прошлых промежуточных состояний. В теореме 1.7.1 мы дадим строгое обоснование этого принципа.

Теорема 1.7.1. Предположим, что условие А+ выполнено. Тогда

ут = вир Ед(хТ1,...,хГк).

г£5га

В главе II рассматривается применение общих результатов теории оптимальных правил многократной остановки к трем задачам последовательного анализа. Задачи показательны тем, что допускают явные решения, т.е. доведены до "числа".

Предмет §2.1 составляет задача нахождения оптимального п.м.о. в схеме Бернулли.

Пусть задана последовательность независимых испытаний имеющих распределение Бернулли с Р(£, = 1) = р = 1 - = 0) = 1 — д, 0 < р < 1. Определим длину успешной серии испытаний (число единиц, идущих подряд, считая назад от г-го наблюдения):

1

Щ = = Уп+1 = ... = у,- = 1).

» ->

Определим наш суммарный выигрыш после к (к ^ 2) остановок (серий успешных испытаний)

г{т)к = л?» + + ■ • •+- стк = ¿с.1+1>

¡=1

1 ^ г«! < т2 < ... < тк,

где с — цена за испытание, причем с < 1, так как при с ^ 1 Z^m)k ^ 0 и стратегия тривиальна — не делать испытаний, д™*_1+1 = с(ш, - т,_ 1) — "чистый" выигрыш только после г-ой серии (как всегда тп0 = 0).

Положим

vN - sup EZr.

resf

Цель параграфа — описать оптимальное правило многократной остановки г* = (гг*,... ,т£) 6 Sf, вычислить цену игры vN и найти lim vx.

N-+00

Установлено, что оптимальное правило многократной остановки т* = (rj,..., г£) имеет вид:

т" — min{m, > m,_i : (mf) ü"J;_j+1) G Г,}

на множестве F,_x = {а» : т{ = m1(... ,т*_1 = m^i}, г = 1,2,..., к, где т0 = О, F0 = П, (тi,Rn]_l+1) — состояние игры на момент rrii в г-ой серии успешных испытаний, а Г, — специальные опорные множества.

Структура опорных множеств Г2 (при к — 2) раскрывается в теореме 2.1.1.

Теорема 2.1.1.

1) Состояние {t,R) £ Г2 тогда и только тогда, когда

„ р — с v<i 1 р — с с,

R > --+ и*-*-1, где иГ1 = ---, и? = 0.

Ч Я

2) Если с ^ 2 — 1/р, то (t, 72) 6 Д тогда и только тогда, когда

N—t — 1 V—t

_ р — с и, а — и, V . 1 n п

R 2 --+ —---1— + И"1-1, где u° = = 0.

Ч Ч

Здесь и'з" — цена игры с m испытаниями и одной остановкой.

В следующей теореме найдена формула, позволяющая вычислять предельный оптимальный выигрыш lim vN (к 2).

Лг~*оо

Теорема 2.1.2. Пусть R - min{Ä' > 0 :pn'+1 ^ с}. Тогда lim ^АД-МЦЙ.

JV-»oo IP

В качестве примера приведем численные значения при р — \

N ~ г>(Л') „(ЛИ

ожидаемого выигрыша v и длин успешных серии R{ ' и щ для iV-шаговой игры, когда необходимо остановиться в первый и во второй раз, соответственно, если остается сделать т испытаний, а также значения для v* = lim vN.

N—юо

с = 0.25 с = 0.125

R[N) = 1, m £ 2 (jV, f 1, 2^m<4, 1 ~ 1 2, m > 4

R{2W) = 1, m £ 1 (jv) _ j 1, m = 1, Л2 ~ \ 2, m > 1

N vN N г;Л' ■

2 0.5000 2 0.7500

3 0.6875 3 1.0313

4 0.8125 4 1.2350

5 0.8906 5 1.3909

6 0.9375 6 1.5158

7 0.9648 7 1.6388

8 0.9805 8 1.7309

9 0.9893 9 1.8436

10 0.9942 10 1.9343

N со 1 iV —^ oo 2.5

Последующие два параграфа главы II посвящены двум различным обобщениям классической задачи наилучшего выбора.

Классическая задача наилучшего выбора ставится следующим образом. Имеется N объектов, которые определенным образом упорядочены по качеству. Объекты поступают к нам в случайном порядке. После поступления очередного объекта, когда нам известны лишь сравнительные качества уже поступивших объектов, нужно

либо остановиться на нем, либо продолжить наблюдения (тогда вернуться к отвергнутому объекту невозможно). Задача состоит в том, чтобы с максимальной вероятностью выбрать лучший объект.

Задача в классической постановке рассматривалась в работах М. Гарднера, Е. Дынкина, Е. Дынкина и А. Юшкевича, И. Чао, С. Моригути, Г. Роббинса и С. Самуэлса, А. Ширяева и др. Как известно, оптимальная стратегия выбора имеет вид; существует такой номер ку, что первые к"у - 1 объектов надо пропустить, а затем остановить свой выбор на первом объекте, который лучше всех предшествующих; при этом Ы/е < к^ < И/е + (2 - 1/е) и вероятность удачного выбора при N —оо равна 1/е 0,368.

Всевозможные обобщения, но на случай выбора только одного объекта, исследовались в работах Е. Дынкина и А. Юшкевича, И. Джилберта и Ф. Мостеллера, С. Гусейн-Заде. Э. Пресмана и И. Соиина, Б. Березовского и А. Гнедина.

В §2.2 изучена задача выбора с максимальной вероятностью сразу к (к ^ 2) лучших объектов.

Пусть имеется N объектов, которые определенным образом упорядочены по качеству, т.е. можно сказать, какой из них самый лучший, какой второй по качеству и т.д. Занумеруем объекты в том порядке, как мы знакомимся с ними. Объекты поступают к нам в случайном порядке, т.е. все /V! перестановок равновероятны. В момент я нам известны сравнительные качества объектов аь а2,..., а,, но мы ничего не знаем о качестве остальных N — я объектов. После ознакомления с а, мы можем его либо принять (и тогда выбор одного объекта сделан), либо отвергнуть и продолжить наблюдения (тогда вернуться к отвергнутому объекту невозможно). Требуется найти оптимальную стратегию, обеспечивающую наибольшую вероятность выбора к объектов, лучших по качеству.

Поставленная выше задача математически может быть описана следующим образом. Пусть (ах, а2,..., а^) — любая из ЛМ перестановок чисел (1,2,...,АГ) (число 1 соответствует лучшему объекту, N — худшему). Так как порядок выбора объектов случаен, то ве-

рояхность любой комбинации (аи а2,..., a.v) равна Для каждого г — 1,2,..., N определим y¡ = т] если а, является m-м по качеству среди объектов (аь ..., а,). Нетрудно показать, что yi,.-.,yt\ независимы и

р (j = l,2,...,¿), г

Р(а, = т\ у1=1и..., у,_х - у, =

^m-l^JV-m

P (а, -m\yi- j)

a

N

где (как всегда) 0! = 1, С™ — 0 при п < т и то < 0.

Пусть (г1}..., ik) — произвольная перестановка чисел 1,2,..., к. Стратегию выбора г* = (т^,..., т£), 1 ^ т{ < < ... < ^ N, для которой

Р ( U {ат; = ¿1. • ■ • > = «»})

(.■„-,и)

- sup р( IJ {аГ1 =»!,..., аг„ = »*}) = Р;,, (5)

(и,...,..) 7

назовем оптимальной.

Задача наилучшего выбора состоит в нахождении оптимальной стратегии т* = (г^,..., г£).

Обозначим — ^mlV.V.'mk условную вероятность события

{amj = г\,..., a„lJr = гА.} относительно <т-алгебры ^(,,,)„ = (где Тт>, порождена наблюдениями (ух,... ,ymh)) и положим

Zl™)> - Y1 Щт)ь > (¿1, ...,«•*)

где

í=i

и

Bi = {w : ym, - jhymi+1 > 1,- ..,y„„+l_i > I ~ 1,2,... - 1;

2/m, = 1, Ут2 = 1 или 2, ..., ymii = 1 или 2 ... или к.

Тогда из (5) следует, что

P*v = EZT. = sup EZr = т/f. res.

Таким образом, задача наилучшего выбора к объектов редуцируется к задаче многократной остановки случайной последовательности Zim)k.

Показано, что решением задачи является следующая оптимальная стратегия: существует такой набор (ttJ,. .. 1 ^ ttJ < ... < 7ГI ^ N, что первые — 1 объектов надо пропустить, а затем остановиться на первом объекте, который лучше всех предшествующих, во второй раз — на первом объекте, который лучше всех предшествующих или хуже ровно одного (в том случае, если просмотрено т, -1 объектов); третий выбор следует делать на первом объекте, который лучше всех предшествующих или хуже ровно одного (если просмотрено — 1 объектов) или хуже ровно двух (если просмотрено 713 — 1 объектов) и т.д.

Разберем подробнее задачу о наилучшем выборе двух объектов.

Обозначим и Z^'^ условные вероятности событий {em —

1, а„ = 2} и {ат —2, а„ = 1} относительно Ттп — Тп (тп < п) и положим Zmn = + ZgfK Тогда из (6)

п ,, п(п — 1)

т'п ~ N(N - 1) *Ут = > > 1.У.. = 2),

¡о 14 п(п — 1)

= N(N - 1)"Ут = Ут+1 > 1' • • • ' У"-1 > 1. У» = 1).

а оптимальная стратегия выбора двух лучших объектов т* = (тг*, г,) имеет следующую структуру:

т{ = min{m ^ к'у : ym = 1}, То — min[min{7z > m : уп — 1},

min{n > m : п Гм,уп = 2}] на {т^ = mj,

где ку и l"N (1 < к~у < l*N ^ Лг) — найденные "пороговые" значения Приведем теперь выражение для оптимального предельного вы игрыша. Положим а* = lim ß* — lim и Р* — lim Pt. =

JV-чоо N N-¥oo Л ЛГ-+0О

lim vf. Тогда

N-ico

P* = sfep - 2 Inц + 2ve - 5) % 0,225,

где 229 есть корень уравнения у/ёц - In ц = ~ - у/ё, а а* — ц

ß* — е'1?2.

В задаче о наилучшем выборе (§2.2) пусть г,- обозначает абсо лютный ранг выбранного объекта, т.е. ж, = 1+число объектов и: (ах, а2,..., а.у) < а,-. Требуется (§2.3) найти оптимальную стратегик выбора, которая будет минимизировать математическое ожидание абсолютных рангов Е(гт, ... + xTk), k ^ 2.

Математически задачу можно описать следующим образом Пусть (®х, ж2,..., Ху) — случайная перестановка чисел (1,2,..., N) т.е. все N1 перестановок равновероятны. Для каждого i — 1,2,..., Л определим относительный ранг г-го объекта у, = т, если среди объ ектов а,,а2,... ,а,_! существует ровно т - 1 объект с качествам* меньшими качества объекта а, . Как мы уже отметили, у1> уг, ■ ■ ■, у2\ независимы и

Р(гл = Я = 1Л 0'= 1,2,...,«),

Р(ж,- = k\ y1-l1,..., 1 = li-uVi = j) = P(®f = k I Vi = л

fii-ls-ii-} ^k-l^N-k

где (как обычно) 0! = 1, С,"' = 0 при га < m и m < 0.

Тогда

| Vi = i) = f; fcP(a< = Л I У.- = j) = (7)

Положим

Цель настоящего параграфа — найти оптимальную процедуру выбора к объектов г* = ... 6 Sf и предельный выигрыш v* — lim v?.

Л'-юс

Пусть Я(1И){ есть (г-алгебра, порожденная наблюдениями (j/i>y2i-- -! Утщ)- Чтобы привести нашу задачу к стандартному виду задач оптимальной многократной остановки, необходимо положить

дг 1

тп)k = E(m)fc {xml + ••■ + X,„k) = 2^gmiT»b + ~-->

~ m(. + i

где £rn!iint - E(m)k«mi.. Тогда из (7)

. . iV + 1

E(m);«mi = у,„.) — -—Угщ

rrij + 1

и = inf EZr (где г = (r)t. = (ть ..., г*)).

Итак, наша задача свелась к задаче нахождения оптимального п.м.о. т" для последовательности {Z[,n)k}-

Оказывается, оптимальное п.м.о. т*, задающее оптимальную стратегию выбора к объектов, имеет вид:

т- = min{m, > rn,_1 : ym. ^

на множестве = {о; : т{ = ... — m,_i}, где F0 = Q, — специально построенные последовательности целых чисел.

Таким образом, оптимальная стратегия выбора описывается ш языке последовательностей что придает ей весьма простое

вид.

Кроме того, установлено, что при к — 2

В заключение приведем численные значения при N — 5,1С ожидаемого выигрыша г»^ и последовательностей чисел <5(1) =

N ¿(2) <

5 (0,1,1,5) (1,1,2,5) 131/30

10 (0,0,1,2,2,3,4,5,10) (0,0,1,1,2,2,3,5,10) « 6,318

Поясним на примерах. Пусть (2,5,1,3,4) — пример перестановки чисел (1,2,3,4,5), где 1 соответствует лучшему объекту, 5 — худшему. Их относительные ранги: уг = 1, у2 = 2, = 1, = 3, у5 — 4. Тогда оптимальная процедура выбора, задаваемая правилом двукратной остановки т* = (т{, г,*), где

г* - min{m ^ 1 : ym ^

Tj = min{n > m : у,, ^ при Tj = m,

даст t* — 3 (и £3 = 1), rj = 5 (и хъ — 4), т.е. выигрыш будет равен ж3 +£4 = 1-1-4 — 5 (чуть хуже, чем 1+2 = 3). Еще один вариант: (4,2,5,1,3). Тогда т{ — 2 (и х2 = 2), т2 = 4 (и ж3 = 1) и выигрыш есть х2 + = 2 + 1 = 3, т.е. в этом случае оптимальная процедура выбора "вылавливает" оба лучших по качеству объекта.

СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Николаев М.Л. Об одном обобщении задачи наилучшего выбора.

- Теория вероятн. и ее примен., 1977, т. 22, вып. 1, с. 191-194.

2. Николаев М.Л. Построение цены одной последовательной игры. -

Вероятностные методы и кибернетика. Казань, 1978, вып. 14, с. 56-67.

3. Николаев М.Л. Обобщенные последовательные процедуры. -

Литов. матем. сб., 1979, т. 19, N3, с. 35-44.

4. Nikolaev M. Generalized sequential procedures in Markov case. - In:

12-th European Meeting of Statisticians. Abstracts. Varna, 1979, p. 176.

5. Николаев М.Л. О критерии оптимальности обобщенной после-

довательной процедуры. - Литов. матем. сб., 1981, т. 21, N3, с. 75-82.

6. Николаев М.Л. О способах отыскания цены обобщенной после-

довательной игры. - В сб.: XIX школа-коллоквиум по теории вероятностей и математической статистике. Тезисы докладов. Бакуриани, 1985, с. 86-87.

7. Николаев М.Л. Об одном способе отыскания цены обобщенной по-

следовательной игры. - В сб.: IV Международная вильнюская конференция по теории вероятностен и математической статистике. Тезисы докладов. Вильнюс, 1985, т. II, с. 121-122.

8. Николаев М.Л. Задача наилучшего выбора к объектов. - В сб.:

Первый Всемирный Конгресс общества математической статистики и теории вероятностей. Тезисы докладов. Ташкент, 1986, т. 1, с. 323.

9. Nikolaev M. Generalized sequential procedures for Markov sequences

- In: The 20-th Conference on Stochastic Processes and the.ii applications. Abstracts. Nahariya, Israel, 1991, p. 73.

10. Николаев М.Л. Оптимальные правила многократной останови

в схеме Бернулли. - В сб.: Всероссийская школа-коллоквиум по стохастическим методам. Тезисы докладов. М.: ТВП, 1994 с. 86-88.

11. Николаев М.Л. Об одном способе отыскания цены в зада-

че многократной остановки,- В сб.: II Всеросийская школа-коллоквиум по стохастическим методам. Тезисы докладов. М.: ТВП, 1995, с. 108-110. .

12. Николаев М.Л. Об одной игровой задаче последовательного ана-

лиза. - Обозрение прикладной и промышленной математики,

1997, т. 4, вып. 3, с. 385-386.

13. Николаев М.Л. Об оптимальной многократной остановке по-

следовательности независимых наблюдений. - Обозрение прикладной и промышленной математики, 1998, т. 5, вып. 2, с. 260.

14. Николаев М.Л. Оптимальные правила многократной остановки.

- Обозрение прикладной и промышленной математики, 1998, т. 5, вып. 2, с. 309-348.

15. Николаев М.Л. Об оптимальной многократной остановке мар-

ковских последовательностей. - Теория вероятн. и ее примен.,

1998, т. 43, вып. 2, с. 374-382.

16. Николаев М.Л. О некоторых задачах оптимальной многократ-

ной остановки, допускающих конструктивное решение. - Обозрение прикладной и промышленной математики, 1999, т.6, вып. 1, с. 183-184.

 
Содержание диссертации автор исследовательской работы: доктора физико-математических наук, Николаев, Михаил Леонидович

Введение

Глава I. Оптимальные правила многократной останов

§1.1. Задача оптимальной остановки

§1.2. Постановка задачи многократной остановки

§1.3. Вспомогательные результаты.

§1.4. Оптимальные и ^-оптимальные правила многократной остановки

§1.5. Необходимые и достаточные условия оптимальности правила многократной остановки.

§1.6. О способах построения цены игры.

§1.7. Марковский случай.

Глава II. Некоторые применения к задачам последовательного анализа

§2.1. Оптимальное правило в схеме Бернулли.

§2.2. Об одном обобщении задачи наилучшего выбора

§2.3. Задача выбора к объектов с минимальным суммарным рангом.

 
Введение диссертация по математике, на тему "Теория оптимальных правил "многократной остановки""

В конце 40-х — начале 50-х годов в статистическом анализе возникло новое направление — последовательный анализ Вальда. Идея этого подхода оказалась очень плодотворной и на ее основе сформировалась новая ветвь статистики (А.Вальд [1], А.Вальд, Дж.Волфовиц [2] и К.Дж.Арроу, Д.Блекуэлл, М.А.Гиршик [3]). Под влиянием этого направления возникла также и задача оптимальной остановки случайных процессов, сформулированная Дж. Снеллом [4] следующим образом. Пусть на некотором вероятностном пространстве заданы неубывающая последовательность сг-подалгебр С С . С Тп С Т и последовательность ^"„-измеримых случайных величин Хп = Xn(uj),n = 0,1,2,Обозначим С = {г} совокупность случайных величин со значениями из множества {0,1,2., +оо} и таких, что Р(т < оо) = 1 и {ш : т(ш) — п} G Тп. Такие случайные величины называются моментами остановки, задающими правила остановки процесса Хп. Если интерпретировать Хп как "выигрыш", который получается при остановке в момент времени n, а ЕХТ — как средний выигрыш по правилу остановки т, то основные задачи теории оптимальных правил остановки состоят в нахождении цены v = sup ~ЕХТ и тес е-оптималъных правил те{е ^ 0), т.е. таких моментов, для которых ЕХТе + е ^ v. В случае £ = 0 момент т* = tq называют оптимальным. Исходя из теории мартингалов Дж.Снелл (при достаточно широких предположениях) показал, что цена v есть Ei7o> где (Un,Fn) минимальный регулярный супермартингал, мажорирующий {Хп}, а момент те = inf{n ^ 0 : Un ^ Хп + г} является е-оптимальным (е > 0).

В работах И.Чао и Г.Роббинса [5] - [7], Г.Хаггстрома [8], Д.Сиг-мунда [9], Л.Шеппа [10] и др. получено обобщение результатов Снел-ла, найдены решения некоторых задач последовательного анализа. Так ими, в частности, установлено, что если Сп С С есть класс моментов остановки такой, что P(r ) n) = 1 и /„ =esssup Е(Хт\Тп), то тесп n-цена" vn = sup ЕХТ равна Е/п, а ¿г-оптимальный момент остатесп новки те = inf{n ^ 0 : /п ^ Хп + е}, при этом последовательность {/п} совпадает (при некоторых предположениях) с минимальным регулярным супермартингалом {Un}, мажорирующим последовательность Можно сказать, общая теория оптимальных правил остановки случайных процессов с дискретным временем достигла почти окончательного вида (см. книгу Г.Роббинса, Д.Сигмунда, И.Чао [11] и библиографию там же).

В рассмотренную схему входит и тот случай, когда величины Хп представлены в виде Хп = дп(£о, ., £п), где {£п} — некоторая последовательность, причем наибольший интерес представляет случай, когда последовательность {£п} является марковской. Общая теория марковского случая (с дискретным и непрерывным временем) построена, в основном, в работах Е.Дынкина [12], А.Ширяева и Б.Григелиониса [13], Б.Григелиониса [14]. Именно эта модель детально исследована в книге А.Ширяева [15]. А.Факеев [16] разработал теорию оптимальных правил остановки для процессов с непрерывным временем.

Естественным расширением общей теории оптимальных правил остановки является случай к (к ^ 2) остановок случайного процесса. При к = 2 задача в основном решена Г. Хаггстромом [18]. Решение задачи в общем (к ^ 2) случае является актуальной проблемой. В качестве мотивации можно привести следующие задачи: обобщение задачи о наилучшем выборе на случай выбора к (к ^ 2) лучших объектов; многоразовая коррекция траектории движения материальной точки; нахождение оптимальной стратегии тг = (сг, г) в задаче "купли-продажи" , когда покупка акции стоимостью осуществляется в случайный момент сг, продажа в момент г по цене Бт и "доход" от операции составляет Х^ — Бт — Ба [17], [43], [44]; разработка процедур скорейшего обнаружения множественной разладки [42].

Замечание 1. В дальнейшем под "многократной остановкой" условимся понимать к (к ^ 2) остановок случайного процесса.

Диссертационная работа посвящена построению теории оптимальных правил многократной остановки случайных процессов с дискретным временем. В отличие от общей теории оптимальных правил остановки, когда требуется делать одну остановку наблюдаемого случайного процесса, в данной схеме исследуется случай к (к ^ 2) остановок случайного процесса с дискретным временем.

Остановимся несколько подробнее на содержании диссертации.

 
Список источников диссертации и автореферата по математике, доктора физико-математических наук, Николаев, Михаил Леонидович, Москва

1. Валъд А. Последовательный анализ. М.: Физматгиз, 1.60.

2. Wald A., Wolfowitz J. Optimum character of the sequential probabilityratio test.- Ann. Math. Statist., 1948, v. 19, N 3, p.326-339.

3. Arrow K.I., Blackwell D., Girshick M.A. Bayes and minimaxsolutions of sequential decision problems.- Econometrica, 1949, v. 17, p. 213-214.

4. Snell I.L. Applications of martingale system theorems.- Trans. Amer.Math. Soc., 1953, v. 73, p. 293-312.

5. Chow Y.S., Robbins H. A martingal system theorem and applications.- In: Proc. Fourth Berkeley Symp. Math. Statist Prob. / Univ. Calif. Press, USA, 1961, v. 1, p. 93-104.

6. Chow Y.S., Robbins H. On values associated with a stochastic.sequence.- In: Proc. Fifth Berkeley Symp. Math. Statist. Prob. / Univ. Calif Press, USA, v. 1, 1967, p. 427-440.

7. Chow Y.S., Robbins H. On optimal stopping rules.- Z.Wakrssheinlichkeitstheorie, 1963, N 2, p. 33-49.

8. Haggstrom G. Optimal stopping and experimental design.- Ann. Math.Statist., 1966, v. 37, N 1, p. 7-29.

9. Siegmund D.O. Some problems in the theory of optimal stoppingrules.- Ann. Math. Statist., 1967, v. 36, N 6, p. 1627-1640.

10. Shepp L.A. Explicit solutions to some problems of optimal stopping.- Ann. Math. Statist., 1969, v. 40, N 3, p. 993-1010.

11. Роббинс Г., Сигмунд Д., Чао И. Теория оптимальных правил остановки. М.: Наука, 1977.

12. Дынкин Е.Б. Оптимальный выбор момента остановки марковскогопроцесса.- ДАН, 1963, т. 150, вып. 2, с. 238-240.

13. Григелионис Б.И., Ширяев А.Н. О задаче Стефана и оптимальныхправил остановки марковских процессов. Теория вероятн. и ее примен., 1966, т. 11, вып. 4, с. 612-631.

14. Григелионис Б.И. Об оптимальной остановке марковских процессов.-Литов. матем. сб., 1967, т. 7, вып. 2, с. 265-279.

15. Ширяев А.Н. Статистический последовательный анализ. М.: Наука, 1969, 1976.

16. Факеев А.Г. Об оптимальной остановке случайных процессов с непрерывным временем. Теория вероятн. и ее применен., 1970, т. 15, вып. 2, с. 336-344.

17. Ширяев А.Н., Кабанов Ю.М., Крамков Д.О., Мельников А.В. Ктеории расчетов опционов европейского и американского типов.

18. II.- Теория вероятн. и ее применен., 1994, т. 39, вып. 1, с. 23129.

19. Haggstrom G. Optimal sequential procedures when more than one stopis required. Ann. Math. Statist., 1967, v. 38, N 6, p. 1618-1626.

20. Николаев M.JI. Обобщенные последовательные процедуры. Литов. матем. сб., 1979, т. 19, N 3, с. 35-44.

21. Николаев M.JI. О критерии оптимальности обобщенной последовательной процедуры. Литов. матем. сб., 1981, т. 21, N 3, с. 75-82.

22. Николаев M.JI. О способах отыскания цены обобщенной последовательной игры. В сб.: XIX школа-коллоквиум по теории вероятностей и математической статистике. Тезисы докладов. Баку-риани, 1985, с. 86-87.

23. Николаев M.JI. Об одном способе отыскания цены обобщенной последовательной игры. В сб.: IV Международная вильнюская конференция по теории вероятностей и математической статистике. Тезисы докладов. Вильнюс, 1985, т. II, с. 121-122.

24. Николаев M.JI. Построение цены одной последовательной игры.- Вероятностные методы и кибернетика. Казань, 1978. вып. 14, с. 56-67.

25. Николаев M.JI. Об одном способе отыскания цены в задаче многократной остановки. В сб.: Всеросийская школа-коллоквиум по стохастическим методам. Тезисы докладов. М.: ТВП, 1995, с. 108-110.

26. Starr N. How to win a war if you must: optimal stopping based onruns. Ann. Math. Statist., 1972, v. 43, p. 1884-1893.

27. Nikolaev M. Generalized sequential procedures in Markov case. In:12.th European Meeting of Statisticians. Abstracts. Varna, 1979, p. 176.

28. Gardner M. Mathematical games Sci. Amer., 1960, v. 202, N 1,p.150-156; 1960, v. 202, N3, p. 173-182.

29. Дынкин Е.Б. Достаточные статистики для задачи об оптимальнойостановке. Теория вероятн. и ее примен., 1968, т. 13, вып. 1, с. 150-151.

30. Дынкин Е.Б., Юшкевич А.А. Теоремы и задачи о процессах Маркова. М.: Наука, 1967.

31. Chow Y.S., Moriguti S., Robbins H., Samuels S.M. Optimal selectionbased on relative rank (the "secretary problem"). Israel J.Math., 1964, v. 2, N 2, p. 81-90.

32. Gilbert J.P., Mosteller F. Recognizing the maximum of a sequence.J.Amer.Statist.Assoc., 1960, v. 61, N 313, p. 35-73.

33. Гусейн-Заде С.М. Задача выбора и оптимальное правило остановки последовательности независимых испытаний.- Теория веро-ятн. и ее примен., 1966, т. 11, вып. 3, с. 534-537.

34. Пресман Э.Л., Сонин И.М. Игровые задачи оптимальной остановки. Существование и единственность точек равновесия. В кн.: Вероятностные проблемы управления в экономике. М.: Наука, 1977.

35. Пресман Э.Л., Сонин И.М. Задача наилучшего выбора при случайном числе объектов. Теория вероятн. и ее примен., 1972, т. 17, вып. 4, с. 695-706.

36. Березовский Б.А., Гнедин A.B. Задача наилучшего выбора. М.:Наука, 1984, 196 с.

37. Николаев M.JI. Об одном обобщении задачи наилучшего выбора.- Теория вероятн. и ее примен., 1977, т. 22, N 1, с. 191-194.

38. Николаев M.JI. Задача наилучшего выбора к объектов. В сб.:Первый Всемирный Конгресс общества математической статистики и теории вероятностей. Тезисы докладов. Ташкент, 1986, т. 1, с. 323.

39. Tamaki М. A secretary problem with double choices.- J.Oper.Res.Soc.Jap., 1979, v. 22, p. 257-265.

40. Vanderbey R. The optimal choice of a subset of population.-Math.Oper.Res., 1980, v. 5, N 4, p. 481-486.

41. Glasser K. The ¿-choice secretary problem.- Cent. Nav. Anal. Profess.Pap., 1979, N 253.

42. Glasser K., Holzsager R., Barron A. The d choice secretaryproblem. Commun. Statis. - Sequential analysis, 1983, v. 2, p. 177-199.

43. Колмогоров A.H., Прохоров Ю.В.,Ширяев А.Н. Вероятностностатистические методы обнаружения спонтанно возникающих эффектов. Труды МИАН СССР, М.: Наука, 1988.

44. Ширяев А.Н. Основы стохастической финансовой математики. Т.1, 2. М.: Фазис, 1998.

45. Мельников А.В. Финансовые рынки. М.: ТВП, 1997.

46. Nikolaev М. Generalized sequential procedures for Markov sequences.- In: The 20-th Conference on Stochastic Processes and their applications. Abstracts. Nahariya, Israel, 1991, p. 73.

47. Николаев M.JI. Об одной игровой задаче последовательного анализа. Обозрение прикладной и промышленной математики, 1997, т. 4, вып. 3, с. 385-386.

48. Николаев М.Л. Об оптимальной многократной остановке последовательности независимых наблюдений. Обозрение прикладной и промышленной математики, 1998, т. 5, вып. 2, с. 260.

49. Николаев М.Л. Оптимальные правила многократной остановки.Обозрение прикладной и промышленной математики, 1998, т. 5, вып. 2, с. 309-348.

50. Николаев М.Л. Об оптимальной многократной остановке марковских последовательностей. Теория вероятн. и ее примен., 1998, т. 43, вып. 2, с. 374-382.

51. Николаев М.Л. О некоторых задачах оптимальной многократной остановки, допускающих конструктивное решение. Обозрение прикладной и промышленной математики, 1999, т.6, вып. 1, с. 183-184.