Сходимости цен в задачах оптимальной остановки случайных процессов по неполным данным в схеме Калмана-Бьюси тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Бакиа, Инаам АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Автореферат по математике на тему «Сходимости цен в задачах оптимальной остановки случайных процессов по неполным данным в схеме Калмана-Бьюси»
 
Автореферат диссертации на тему "Сходимости цен в задачах оптимальной остановки случайных процессов по неполным данным в схеме Калмана-Бьюси"

!. -Л

московский государственный университет имени М .В.ЛШОНСССВА

Механико-математический факультет

На правах рукописи

бакиа инаам

УДК 519.21

сходимость цен в задачах оптимальной остановки

случайных процессов по неполным данным в схеме калмана-быеи

01.01.06 - теория Езроятностай п математическая статистика

АВТОРЕФЕРАТ диссертации на соискание ученоЯ степени кандидата фазнко-ч/лтематичэскЕх наук

15 ОС КЗ А - 1£9 2

Работа выполнена на кафедре теории вероятностей и математической статистики механихо-иатематнческого факультета Тбилисского государственного университета имени Ив.Джавахюпвили.

Научный руководитель - кандидат физико-математических наук,

ст.н.с., доцент В.М.Д0ЧВИН1

Официальные оппоненты:

доктор физико-математических наук, профессор А.Н.ШИРЯЕВ, кандидат физико-математических наук, с.н.с. Э.Л.ПРЕСМАН

Ведущая организация: Институт проблей передачи информации

АН России

Защита диссертации состоится ^ Ш(У_1992 г.

в 16 час. 05 мин. на заседании специализированного совета Д.053.05.№ при Московском государственном университете имени М.В.Ломоносова по адресу: 119899,ГСП,Москва, Ленинские Горы, ИГУ, механико-математический факультет, аудитория 16-24.

С диссертацией мохно ознакомиться в библиотеке механико-математического факультета МГУ (Главное здание, 14 этаж).

Автореферат разослан 2 У У 1992 г.

Ученый секретарь специализированного совета Д.053.Сб.04 при МГУ доктор физико-математических наук

Т.П.Лукашенко

er;,.;Г ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Теория оптимальной остановки случайных процессов является важнейшей составной частью теории оптимального стохастического управления.

Известно, что общей теории управления и приложения нужно выбрать в определенном смысле оптимальные моменты принятия решений.

Общие вопросы теории оптимальной остановки (теория оптимальных правил остановки) для однородных необрывапцпхея марковских случайных процессов и последовательностей наиболее полно изложены в монографии /I/. Там же приведены приложения к таким задачам математической статистики, как задача о выборе наилучшего объекта и другие. Хорошо известно, что основными задачами теории являются выяснение структур цены, оптимального момента остановки и нахождение способов их отыскания. В теории оптимальной остановки по неполным данным наряду с этими вопросами изучаются тахже вопросы редукции к задаче по полним данным и сходимости соответствующих цен, когда коэффициент "помехи" в наблюдаемом процессе стремится к нулю.

В настоящей работе изучаются вопросы редукции и оходимости цен для частичво-наблюдаемых случайных процессов и последовательностей в общей схеме Калмана-Бьюси для линейной функции выигрыша. Кроме этого скорость сходимости дискретной схемы к непрерывной исследуется для задачи различения двух простых гипотез о среднем значении винеровского процесса. Получены результаты для различных схем частично-наблвдаемых случайных процесоов и последовательностей как собственно в теории оптимальной остановки, так и теории оптимального управления. Следует отметить, что явние

решения задач оптимальной остановки случайных процессов по неполным данным существенно сложнее, чем в соответствующих задачах по полный данным. Поэтому проведение редукции и доказательство сходимости соответствующих цен являются весьма актуальными вопросами как для теории, так для приложений.

Цель работы.

1. Провести редукции задач оптимальной остановки по неполным данным частично-наблвдаемых случайных процессов для схемы Калмана-Бьюси к соответствующим задачам по полным данныы.

2. Доказать сходимость соответствующих цен и дать оценку-скорости сходимости в терминах малого коэффициента "помехи" наблюдаемого процесса.

3. Доказать сходимость цен при аппроксимации непрерывной схемы дискретными схемами, как в общем случае, так и для задачи различения двух простых гипотез.

Научная новизна. Основные результаты диссертации являются новыми и состоят в следующем:

1. Решена задача редукции, когда в коэффициентах сноса час-тично-наблвдаемого процесса схемы Калмана-Еьюси входит наблюдаемый процесс. Рассматривается случай линейной функции выигрыша.

2. Доказана сходимость цен, когда малые коэффициенты "помехи" Е, и £г в наблюдаемом процессе стремятся к нулю. Показано, что скорость сходимости имеет порядок л/е, ♦ ьг ' • Даются также некоторые обобщения этих результатов, в частности улучшен порядок сходимости.

3. Аналогичные результаты получены для частично-наблюдаемих случайных последовательностей схемы Калмана-Бьюси. Кроме этого доказана сходимость цен при аппроксимации непрерывной схемы дис-

кретнымн схемами. Рассмотрен пример этой сходимости для задачи различения двух простых гипотез о средней значении винеровского процесса.

Методика исследования. В диссертации используются аппарат стохастических дифференциальных уравнений Ито, результаты лпнеЗ-ной нестационарной фильтрации часткчно-набдвдаешх случайных процессов К-Б и общей теории оптимальной остановки марковских процессов.

Применение. Диссертация носат теоретический характер. Полученные результаты могут быть использованы в задачах обнаружения, а теории передачи информации, в задачах различения гипотез, з теории управления по неполным данным. Статистическая динамика, оптотлзация управления летательных аппаратов, статистическая радиотехника, передача цифровых сообщений в системах с обратной связью, теория помехоустойчивости.

СОДЕРЖАЩЕ ДИССЕРТАЦИИ

Во введения обосновала актуальность темы и кратко изложены основные результаты диссертации.

I. Теория оптимальной остановки случайных процзссов является вданейдай составной частью теории оптимального стохастического управления. Известно, что в обаей теории управления и прило-лэнкях нузяо Еыбрать в опрздоленном смысле оптимальные моменты прекращения наблюдений а принятия ревеняЗ. Общие вопроси теории оппааяьноЯ останоют (теортттт оптпкзльнше правил остановки) для однородных нэобривавзвхся маряовекгсх случайных процессов и после-доЕДтзльноотеЯ.

Хорсг.о пзгзстпо, ч?о сопоглкп тс орта спг".;гль;г:"

остановки являются выяснение структур цены, оптимального момента остановки и нахождение способов их отыскания. В теории оппагаль-ной остановки по неполным данным наряду с этима вопросам изучаются также вопросы редукции к задаче по полным данным п сходшо-стп соотБетствупаих цен, когда коэффициент "помехи* в наблюдаемом процессе стремится к нулю.

В настоящей работе изучается вопросы редукции и сходимости цен для частЕчно-наблюдазмых случайных процессов и последовательностей в общей схеме Калкана-Еьюси в случае лтшеЕлоС функция кгрыша. Вопрос сходимости цен изучается такге в частном случсо при аппроксимации непрерывной схемы Калглаяа-Бъкси дискрзтиымз схемами. Кроме этого скорость сходемосте дискретной схез.а к непрерывной есследуегся для задачи различения двух простых гипотез о среднем значении винеровского процэсса.

2. Перейдем к подробному изложению основных результатов диссертационной работы.

Работа состоит из двух глав. В первой главе изучаются вопросы редукции и сходимости цен для непрерывной схемы Калкапа-Бьюси частично-наблюдаемых случайных процессов.

В параграфе один для частного случая рассматривается постановка задач редукции и сходимости цен. Цусть ( ,Т , Р) _ полное вероятностное пространство и С^) ; t ¡-о , неубывахщес семейство б" -подалгебр б" -алгебры Т ' \ £ ^ с ^ е "У при всех -5 «1; . Предположим, что на этом вероятностном пространстве задан двумерный гауссовский частичпо-наблюдаемый случайный процесс (£>/■$ ' % . определяемый следующей системой стохастических дифференциальных уравнений

сЦ = [<*,(*) + а,ш сН + + Ц,(Н о(\д£ш,(1)

£,сЫ(*ПЕгс1ца), (2)

1де коэффициента с^-М, ¿=0л, Ьjlt))¿гlJzJ А,ЛО , 0, 1, г, изкзрнше неслучайные функции, 14 >0 / ¿¿>о - константы, ^ и м/, - два независиках винеровекпх процесса. Предполагается, что

' (р-и-н.) в системе (I), (2) 0 считается

ненаблюдаемой, а г - наблюдаемой компонентами, причем

А• Это частная схема т.н. общей схемы Катшана-БьЕСи частично-наблвдаемнх случайных процессов (в коэффициенте сноса отсутствует наблюдаемый процесс).

Рассмотрим линейную функции выигрыша

.ди .х) = + /?<*> X, (з),

где и ^¡Ь) - измеримые неслучайные функции и введем

цены

^ир , (4)

те Уй ■

мдгт, Ог) . • (5)

о ^^

где Хй. и И(Ч обозначает классы мсыентов остановки от-

носительно семейств 6" -алгебр ( и (Т* ' ') соответственно, , , б"И1;''1 - 5*1:} .

Цены и з'"1* соответствуют случаям полного и неполного наблюдений над прсцэсссм в . Первая основяач задача - зяда-та редуте дли - зазгючаогсл в том, чтобы записать цену (5) с поио-

щыо класса tri9 , где под знаком математического ожидания в функции выигрыша будет стоять некоторый случайный процесс, согласованный с этим семейством. Как показывает пример в § I не всегда sll'il—> S° , при £,о , 1г—+о • Поэтому вторая основная задача состоит в доказательстве этой сходимости. В § 2 решена задача редукции. Обозначим

М ( 0t / ) , (6)

<"£= M(0t- (7)

В теореме I.I показано, что

(8)

Те yfi'

В теореме 1.2 доказывается, что

sup МЗ (т . в^1) , О)

te Iii6

где случайный процесс 0l''lL (6t , Tfe) / t^O , определяется соотношением

Г- Ф [ ¡4;' O.IS) j' Ф;' t'1' dwls) t (I0)

t L 0 s 0 JlfTir

Ф - е- X p[ j cis] ' (II)

о

a v/lt) новый винеровский процесс, с помощью которого процесс б записывается в виде dBt =[as(t)+ dt+д/b*(t)*b'(t)' dw(t)■

В доказательстве сходимости цен существенную роль играет оценка условной дисперсии t*1'1' с помощью £,, i3 .

В теореме 1.3 § 3 показывается, чтр

С'* 4 + (12)

где константы А, и В определены условиями

(17) функции Ь4») и Ь,Ш непрерывны и монотонно не убывают,

причем для всех * > о

+ 6г < ~ ^ (У) функция . непрерывна, монотонно не возрастает и су-

ществуют кокстантн А4 и А1 , о < А, $ А( < <*> . такие, что для всех > о

« Ад > «Г Ад • определяются с помощью коэффициентов процесса (I), (2).

В теореме 1.4 дается оценка скорости сходимости цены б*1'*1

О л

к цене 5 , при ^ о , г, —* о . которая определяется соотношением

5°_ ^ р н/^Г . (13)

где

Н = е4(гв £ 77"')А (14)

а константа $ определяется условием 0 « £(г) ^ ? < °° •

В параграфе четыре изучается общая схема, когда в уравнении (I) для в в коэффициенте сноса линейно входит наблюдаемый процесс V"'1 ^ что существенно осложняет доказательство сходимости цен.

В теореме 1.5 решается задача редукции, а в теореме 1.6 дается оценка скорости сходимости цен

I ^ Г-Н лДТПГ (15)

где константа H мах ( и,, н2 , Hj.hJ , н , а

HJ= eCl >Jz в A,' iГ1' , lb = eCifzYKrTrr , eClJ~r~e> ¿■1ГГ' , w^-- ¿V28a1 /г1' ,

где константа с,-1": - a определяются условиями

(f) Am <±>J(t) •- éLl , о < с, < «> j

J _^«tf ^

(П) Ci m ф'(П - el > о < с, <. m

Til г

(Ш) функция a2(t) непрерывна, монотонно не возрастает и существуют константы a и ci , 0< a<.a , такие, что для всех a < a2(t) 4 â .

В последнем § 5 главы I даются некоторые обобщения полученных результатов. Во-порвых, задачи редукции и сходимости цен изучаются для обобщенной схемы Калиала-Еьюси. Во-вторых, показывается, что скорость сходимости цен имеет порядок £ где е. коэффициент "помехи" в наблюдаемом процессе.

Пусть заданы независимые ыожду собой непрерывные справа га-

^ _у

уссовского мартингалы х = ( х4 > Tt ) и у '= ( > \ ) •

__Q

а также ненаблюдаемый процесс о = ( бt > Tt ) и наблвдаемый процесс s' = ( \\ , ) определяемые следующей системой

dot, a (t) ôt clt + bit) dyt , (16)

- Ait) 6t dt + t dxt , (17)

где £>o - константа, ai 1-) ' ь(t) в Ait) - неслучайные измеримые функции о < t с т<«*> Величины <J( t ,-х.) , s" , sf ,

К ' 4t определяются согласно формулам ( з ),( î* ), (5) р(б),(;) и (II) соответственно.

Пусть f (t) - непрерывная возрастающая функция, мажорирующая функцию I bit) A\(t)l . тогда в теореме 1.7 показывать

ется, что для st имеет место следующая оценка

К * ь с? fif} ' * ■ (Г8)

Пусть далее % стандартная нормальная случайная величина. В теореме 1.8 показывается, что для те wL

МЛ^т-йг) (19)

Обозначим t

и, = i dy.

i г е xpU г (\а,(з)[ ¿s) f(T) \

и пусть о < С < bit) <<» •

Основной результат 5 5 содержится в теореме 1.9, согласно которой имеет место следующая оценка О < s°-S5 <

t

+ sap M sup (g'(t of )| ■ (20)

S ut t

O^u sj 1

M s

t $т 1

где и - некоторая непрерывная возрастающая функция, а класс функций h определяется с помощью

i <уо - t ! t0 L , ¿ad 4éa. с .

»

+

f 12

Согласно этой теореме улучшается порядок сходимости цен, где сходимость имеет порядок ^ГT' •

3. В параграфе один главы П решается задача редукции для частично-наблодаемой случайной последовательности ( в > li"t') = = ( вп, • и = -■•■ задаваемой на вероятностное пространства

( si /y ,р) следузэдщя рекурреитнкш уравпегпшмя

= + а1(и> ЬА(и) ц<»ш) + b^i и) ^ Hti) - (21)

V^rr A>W A,(»)0„ + i, i/«J , (22)

где = 0 (р-и-н) , £1>о,£_г>о - конотанты, п4(") . yvi)--незавкыаще случайные величины, распределенные по нормальному закону со срсдаша о и дисперсией 1. Цусть задана функция выигрыша вида

и, х) = ?Ы) + £ (и) -К (23)

и введен цены

s°= sup MSfiT/6r) (24)

Те «Y

s^ Sup£ fl3(r,0r) (25)

те "г

J Л^1'

где vrt и Hit обозначает классы ыоы^нтов остакопш со значениями в \ 0И , 2, ... } ошосительно сезлоЕств е -алгебр

и ( соотвотствзшо, y°= t^vi] j

т;^ 6-U-4 <

Обоакачюд такне

- и (еп I г/"') (23)

= м[(0и-Ч)г|С(""]. (27)

В теорема 2.1 цена sE,,ti записывается с помощью а в теореме 2.2 доказывается следующее соотношение

S£"fi = Sup , (28)

те иГ

где случайная последовательность определяется формулой

„„ = W» + ^ + Р. ?„u

В теореме 2.3 параграфа 2 дается следующая оценка для

О ^ £ UU <) • (29)

где константа А, определяется условием

О < ^ А*(и) с Д4 <оо j

причем ^ о ■

В теореме 2.4 порядок сходимости цен определяется следующим совт-ношением .

О ^ 4. г ■ (30)

В третьем параграфе рассматривается простая дискретная схема с шагом л > о ( а0{ч)=тО > а4(л)=г 1, ^(»1)= i, bjinb-o* Д ,

= ± ) . В теореме 2.5 устанавливается следующая оценка

S°- 2U JEHL. (31)

л/Т^

В четвертом параграфе изучаются вопросы сходимости оптимальных моментов остановки и оптимальных границ принятия решений для дискретной схемы к соответствующим величинам непрерывной схемы в задаче различения двух простых гипотез о среднем значении винеров-ского процесса.

Пусть наблюдается случайный процесс $ =. ( > ± , определяемый соотношением

% вt \ & ^ . & >о ; п+о , (32)

где - стандартный винеровский процесс, б - неизвестный параметр, принимающий одно из двух значений 9 = 0 (гипотеза н,) или 0 = 1 (гипотеза ).

Обозначим Мг, ¿ = 1, -усреднение по мере £ > индуцированной процессом ^ при 0 = 0 ,е=1 . Требуется найти такой момент остановки е , что И^ т ^ М; т , I « о, I для любого те кг/* • Известно, что решение определяется двумя постоянными границами В и А , связанных о ошибками первого и второго родов. В случае 0, а, г&,... в та величины обозначим через , -Рл 8Л ■ д •

Определим функцию фСа^а^) соотношением

ф( а,, . а ' ах.

В теореме 2.6 показывается, что пет место следупцие оценки

И.-т! ^ А ,¿=0,1, . (33)

К, А.- Л А\ <4Т з

Кз. - Д&1 </Г Ф(#">)-

(34)

(35)

ОСНОВНОЕ СОДЕР1АНИЕ ДИССЕРТАЩИ ОТРАЖЕНО В СЛЕДУЩИХ РАБОТАХ АВТОРА:

1. Бакиа И.А. О редукции одной задачи оптимальной остановки по неполным данным к задаче по полным данным. Пятая между-нар. конф. Вильнюс (1989), тезисы, 38-39.

2. Bakia X. On the payoff convergence rate estimation in the problem of optimal stopping of random processes in the Kal-man-Bucy scheme, Bui. of the Acad, of Sciences of Georgia, t. 140, N 3 (1990), 493-496.

3. Bakia I.A. On the payoff convergence rate estiamtion in the problem of optimal stopping of.random sequences in the scheme of Kalman-Bucy. Bui. of the Acad, of Sciences of Georgia, t.141, И 1, 1990, 37-39.

4. Бакиа И. Сравнение оптимальных границ дискретной непрерывной схемы в задаче различения гипотез о среднем значении ви-неровского процесса. (В печати).