Сходимости цен в задачах оптимальной остановки случайных процессов по неполным данным в схеме Калмана-Бьюси тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Бакиа, Инаам
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1992
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
!. -Л
московский государственный университет имени М .В.ЛШОНСССВА
Механико-математический факультет
На правах рукописи
бакиа инаам
УДК 519.21
сходимость цен в задачах оптимальной остановки
случайных процессов по неполным данным в схеме калмана-быеи
01.01.06 - теория Езроятностай п математическая статистика
АВТОРЕФЕРАТ диссертации на соискание ученоЯ степени кандидата фазнко-ч/лтематичэскЕх наук
15 ОС КЗ А - 1£9 2
Работа выполнена на кафедре теории вероятностей и математической статистики механихо-иатематнческого факультета Тбилисского государственного университета имени Ив.Джавахюпвили.
Научный руководитель - кандидат физико-математических наук,
ст.н.с., доцент В.М.Д0ЧВИН1
Официальные оппоненты:
доктор физико-математических наук, профессор А.Н.ШИРЯЕВ, кандидат физико-математических наук, с.н.с. Э.Л.ПРЕСМАН
Ведущая организация: Институт проблей передачи информации
АН России
Защита диссертации состоится ^ Ш(У_1992 г.
в 16 час. 05 мин. на заседании специализированного совета Д.053.05.№ при Московском государственном университете имени М.В.Ломоносова по адресу: 119899,ГСП,Москва, Ленинские Горы, ИГУ, механико-математический факультет, аудитория 16-24.
С диссертацией мохно ознакомиться в библиотеке механико-математического факультета МГУ (Главное здание, 14 этаж).
Автореферат разослан 2 У У 1992 г.
Ученый секретарь специализированного совета Д.053.Сб.04 при МГУ доктор физико-математических наук
Т.П.Лукашенко
er;,.;Г ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Теория оптимальной остановки случайных процессов является важнейшей составной частью теории оптимального стохастического управления.
Известно, что общей теории управления и приложения нужно выбрать в определенном смысле оптимальные моменты принятия решений.
Общие вопросы теории оптимальной остановки (теория оптимальных правил остановки) для однородных необрывапцпхея марковских случайных процессов и последовательностей наиболее полно изложены в монографии /I/. Там же приведены приложения к таким задачам математической статистики, как задача о выборе наилучшего объекта и другие. Хорошо известно, что основными задачами теории являются выяснение структур цены, оптимального момента остановки и нахождение способов их отыскания. В теории оптимальной остановки по неполным данным наряду с этими вопросами изучаются тахже вопросы редукции к задаче по полним данным и сходимости соответствующих цен, когда коэффициент "помехи" в наблюдаемом процессе стремится к нулю.
В настоящей работе изучаются вопросы редукции и оходимости цен для частичво-наблюдаемых случайных процессов и последовательностей в общей схеме Калмана-Бьюси для линейной функции выигрыша. Кроме этого скорость сходимости дискретной схемы к непрерывной исследуется для задачи различения двух простых гипотез о среднем значении винеровского процесса. Получены результаты для различных схем частично-наблвдаемых случайных процесоов и последовательностей как собственно в теории оптимальной остановки, так и теории оптимального управления. Следует отметить, что явние
решения задач оптимальной остановки случайных процессов по неполным данным существенно сложнее, чем в соответствующих задачах по полный данным. Поэтому проведение редукции и доказательство сходимости соответствующих цен являются весьма актуальными вопросами как для теории, так для приложений.
Цель работы.
1. Провести редукции задач оптимальной остановки по неполным данным частично-наблвдаемых случайных процессов для схемы Калмана-Бьюси к соответствующим задачам по полным данныы.
2. Доказать сходимость соответствующих цен и дать оценку-скорости сходимости в терминах малого коэффициента "помехи" наблюдаемого процесса.
3. Доказать сходимость цен при аппроксимации непрерывной схемы дискретными схемами, как в общем случае, так и для задачи различения двух простых гипотез.
Научная новизна. Основные результаты диссертации являются новыми и состоят в следующем:
1. Решена задача редукции, когда в коэффициентах сноса час-тично-наблвдаемого процесса схемы Калмана-Еьюси входит наблюдаемый процесс. Рассматривается случай линейной функции выигрыша.
2. Доказана сходимость цен, когда малые коэффициенты "помехи" Е, и £г в наблюдаемом процессе стремятся к нулю. Показано, что скорость сходимости имеет порядок л/е, ♦ ьг ' • Даются также некоторые обобщения этих результатов, в частности улучшен порядок сходимости.
3. Аналогичные результаты получены для частично-наблюдаемих случайных последовательностей схемы Калмана-Бьюси. Кроме этого доказана сходимость цен при аппроксимации непрерывной схемы дис-
кретнымн схемами. Рассмотрен пример этой сходимости для задачи различения двух простых гипотез о средней значении винеровского процесса.
Методика исследования. В диссертации используются аппарат стохастических дифференциальных уравнений Ито, результаты лпнеЗ-ной нестационарной фильтрации часткчно-набдвдаешх случайных процессов К-Б и общей теории оптимальной остановки марковских процессов.
Применение. Диссертация носат теоретический характер. Полученные результаты могут быть использованы в задачах обнаружения, а теории передачи информации, в задачах различения гипотез, з теории управления по неполным данным. Статистическая динамика, оптотлзация управления летательных аппаратов, статистическая радиотехника, передача цифровых сообщений в системах с обратной связью, теория помехоустойчивости.
СОДЕРЖАЩЕ ДИССЕРТАЦИИ
Во введения обосновала актуальность темы и кратко изложены основные результаты диссертации.
I. Теория оптимальной остановки случайных процзссов является вданейдай составной частью теории оптимального стохастического управления. Известно, что в обаей теории управления и прило-лэнкях нузяо Еыбрать в опрздоленном смысле оптимальные моменты прекращения наблюдений а принятия ревеняЗ. Общие вопроси теории оппааяьноЯ останоют (теортттт оптпкзльнше правил остановки) для однородных нэобривавзвхся маряовекгсх случайных процессов и после-доЕДтзльноотеЯ.
Хорсг.о пзгзстпо, ч?о сопоглкп тс орта спг".;гль;г:"
остановки являются выяснение структур цены, оптимального момента остановки и нахождение способов их отыскания. В теории оппагаль-ной остановки по неполным данным наряду с этима вопросам изучаются также вопросы редукции к задаче по полным данным п сходшо-стп соотБетствупаих цен, когда коэффициент "помехи* в наблюдаемом процессе стремится к нулю.
В настоящей работе изучается вопросы редукции и сходимости цен для частЕчно-наблюдазмых случайных процессов и последовательностей в общей схеме Калкана-Еьюси в случае лтшеЕлоС функция кгрыша. Вопрос сходимости цен изучается такге в частном случсо при аппроксимации непрерывной схемы Калглаяа-Бъкси дискрзтиымз схемами. Кроме этого скорость сходемосте дискретной схез.а к непрерывной есследуегся для задачи различения двух простых гипотез о среднем значении винеровского процэсса.
2. Перейдем к подробному изложению основных результатов диссертационной работы.
Работа состоит из двух глав. В первой главе изучаются вопросы редукции и сходимости цен для непрерывной схемы Калкапа-Бьюси частично-наблюдаемых случайных процессов.
В параграфе один для частного случая рассматривается постановка задач редукции и сходимости цен. Цусть ( ,Т , Р) _ полное вероятностное пространство и С^) ; t ¡-о , неубывахщес семейство б" -подалгебр б" -алгебры Т ' \ £ ^ с ^ е "У при всех -5 «1; . Предположим, что на этом вероятностном пространстве задан двумерный гауссовский частичпо-наблюдаемый случайный процесс (£>/■$ ' % . определяемый следующей системой стохастических дифференциальных уравнений
сЦ = [<*,(*) + а,ш сН + + Ц,(Н о(\д£ш,(1)
£,сЫ(*ПЕгс1ца), (2)
1де коэффициента с^-М, ¿=0л, Ьjlt))¿гlJzJ А,ЛО , 0, 1, г, изкзрнше неслучайные функции, 14 >0 / ¿¿>о - константы, ^ и м/, - два независиках винеровекпх процесса. Предполагается, что
' (р-и-н.) в системе (I), (2) 0 считается
ненаблюдаемой, а г - наблюдаемой компонентами, причем
А• Это частная схема т.н. общей схемы Катшана-БьЕСи частично-наблвдаемнх случайных процессов (в коэффициенте сноса отсутствует наблюдаемый процесс).
Рассмотрим линейную функции выигрыша
.ди .х) = + /?<*> X, (з),
где и ^¡Ь) - измеримые неслучайные функции и введем
цены
^ир , (4)
те Уй ■
мдгт, Ог) . • (5)
о ^^
где Хй. и И(Ч обозначает классы мсыентов остановки от-
носительно семейств 6" -алгебр ( и (Т* ' ') соответственно, , , б"И1;''1 - 5*1:} .
Цены и з'"1* соответствуют случаям полного и неполного наблюдений над прсцэсссм в . Первая основяач задача - зяда-та редуте дли - зазгючаогсл в том, чтобы записать цену (5) с поио-
щыо класса tri9 , где под знаком математического ожидания в функции выигрыша будет стоять некоторый случайный процесс, согласованный с этим семейством. Как показывает пример в § I не всегда sll'il—> S° , при £,о , 1г—+о • Поэтому вторая основная задача состоит в доказательстве этой сходимости. В § 2 решена задача редукции. Обозначим
М ( 0t / ) , (6)
<"£= M(0t- (7)
В теореме I.I показано, что
(8)
Те yfi'
В теореме 1.2 доказывается, что
sup МЗ (т . в^1) , О)
te Iii6
где случайный процесс 0l''lL (6t , Tfe) / t^O , определяется соотношением
Г- Ф [ ¡4;' O.IS) j' Ф;' t'1' dwls) t (I0)
t L 0 s 0 JlfTir
Ф - е- X p[ j cis] ' (II)
о
a v/lt) новый винеровский процесс, с помощью которого процесс б записывается в виде dBt =[as(t)+ dt+д/b*(t)*b'(t)' dw(t)■
В доказательстве сходимости цен существенную роль играет оценка условной дисперсии t*1'1' с помощью £,, i3 .
В теореме 1.3 § 3 показывается, чтр
С'* 4 + (12)
где константы А, и В определены условиями
(17) функции Ь4») и Ь,Ш непрерывны и монотонно не убывают,
причем для всех * > о
+ 6г < ~ ^ (У) функция . непрерывна, монотонно не возрастает и су-
ществуют кокстантн А4 и А1 , о < А, $ А( < <*> . такие, что для всех > о
« Ад > «Г Ад • определяются с помощью коэффициентов процесса (I), (2).
В теореме 1.4 дается оценка скорости сходимости цены б*1'*1
О л
к цене 5 , при ^ о , г, —* о . которая определяется соотношением
5°_ ^ р н/^Г . (13)
где
Н = е4(гв £ 77"')А (14)
а константа $ определяется условием 0 « £(г) ^ ? < °° •
В параграфе четыре изучается общая схема, когда в уравнении (I) для в в коэффициенте сноса линейно входит наблюдаемый процесс V"'1 ^ что существенно осложняет доказательство сходимости цен.
В теореме 1.5 решается задача редукции, а в теореме 1.6 дается оценка скорости сходимости цен
I ^ Г-Н лДТПГ (15)
где константа H мах ( и,, н2 , Hj.hJ , н , а
HJ= eCl >Jz в A,' iГ1' , lb = eCifzYKrTrr , eClJ~r~e> ¿■1ГГ' , w^-- ¿V28a1 /г1' ,
где константа с,-1": - a определяются условиями
(f) Am <±>J(t) •- éLl , о < с, < «> j
J _^«tf ^
(П) Ci m ф'(П - el > о < с, <. m
Til г
(Ш) функция a2(t) непрерывна, монотонно не возрастает и существуют константы a и ci , 0< a<.a , такие, что для всех a < a2(t) 4 â .
В последнем § 5 главы I даются некоторые обобщения полученных результатов. Во-порвых, задачи редукции и сходимости цен изучаются для обобщенной схемы Калиала-Еьюси. Во-вторых, показывается, что скорость сходимости цен имеет порядок £ где е. коэффициент "помехи" в наблюдаемом процессе.
Пусть заданы независимые ыожду собой непрерывные справа га-
^ _у
уссовского мартингалы х = ( х4 > Tt ) и у '= ( > \ ) •
__Q
а также ненаблюдаемый процесс о = ( бt > Tt ) и наблвдаемый процесс s' = ( \\ , ) определяемые следующей системой
dot, a (t) ôt clt + bit) dyt , (16)
- Ait) 6t dt + t dxt , (17)
где £>o - константа, ai 1-) ' ь(t) в Ait) - неслучайные измеримые функции о < t с т<«*> Величины <J( t ,-х.) , s" , sf ,
К ' 4t определяются согласно формулам ( з ),( î* ), (5) р(б),(;) и (II) соответственно.
Пусть f (t) - непрерывная возрастающая функция, мажорирующая функцию I bit) A\(t)l . тогда в теореме 1.7 показывать
ется, что для st имеет место следующая оценка
К * ь с? fif} ' * ■ (Г8)
Пусть далее % стандартная нормальная случайная величина. В теореме 1.8 показывается, что для те wL
МЛ^т-йг) (19)
Обозначим t
и, = i dy.
i г е xpU г (\а,(з)[ ¿s) f(T) \
и пусть о < С < bit) <<» •
Основной результат 5 5 содержится в теореме 1.9, согласно которой имеет место следующая оценка О < s°-S5 <
t
+ sap M sup (g'(t of )| ■ (20)
S ut t
O^u sj 1
M s
t $т 1
где и - некоторая непрерывная возрастающая функция, а класс функций h определяется с помощью
i <уо - t ! t0 L , ¿ad 4éa. с .
»
+
f 12
Согласно этой теореме улучшается порядок сходимости цен, где сходимость имеет порядок ^ГT' •
3. В параграфе один главы П решается задача редукции для частично-наблодаемой случайной последовательности ( в > li"t') = = ( вп, • и = -■•■ задаваемой на вероятностное пространства
( si /y ,р) следузэдщя рекурреитнкш уравпегпшмя
= + а1(и> ЬА(и) ц<»ш) + b^i и) ^ Hti) - (21)
V^rr A>W A,(»)0„ + i, i/«J , (22)
где = 0 (р-и-н) , £1>о,£_г>о - конотанты, п4(") . yvi)--незавкыаще случайные величины, распределенные по нормальному закону со срсдаша о и дисперсией 1. Цусть задана функция выигрыша вида
и, х) = ?Ы) + £ (и) -К (23)
и введен цены
s°= sup MSfiT/6r) (24)
Те «Y
s^ Sup£ fl3(r,0r) (25)
те "г
J Л^1'
где vrt и Hit обозначает классы ыоы^нтов остакопш со значениями в \ 0И , 2, ... } ошосительно сезлоЕств е -алгебр
и ( соотвотствзшо, y°= t^vi] j
т;^ 6-U-4 <
Обоакачюд такне
- и (еп I г/"') (23)
= м[(0и-Ч)г|С(""]. (27)
В теорема 2.1 цена sE,,ti записывается с помощью а в теореме 2.2 доказывается следующее соотношение
S£"fi = Sup , (28)
те иГ
где случайная последовательность определяется формулой
„„ = W» + ^ + Р. ?„u
В теореме 2.3 параграфа 2 дается следующая оценка для
О ^ £ UU <) • (29)
где константа А, определяется условием
О < ^ А*(и) с Д4 <оо j
причем ^ о ■
В теореме 2.4 порядок сходимости цен определяется следующим совт-ношением .
О ^ 4. г ■ (30)
В третьем параграфе рассматривается простая дискретная схема с шагом л > о ( а0{ч)=тО > а4(л)=г 1, ^(»1)= i, bjinb-o* Д ,
= ± ) . В теореме 2.5 устанавливается следующая оценка
S°- 2U JEHL. (31)
л/Т^
В четвертом параграфе изучаются вопросы сходимости оптимальных моментов остановки и оптимальных границ принятия решений для дискретной схемы к соответствующим величинам непрерывной схемы в задаче различения двух простых гипотез о среднем значении винеров-ского процесса.
Пусть наблюдается случайный процесс $ =. ( > ± , определяемый соотношением
% вt \ & ^ . & >о ; п+о , (32)
где - стандартный винеровский процесс, б - неизвестный параметр, принимающий одно из двух значений 9 = 0 (гипотеза н,) или 0 = 1 (гипотеза ).
Обозначим Мг, ¿ = 1, -усреднение по мере £ > индуцированной процессом ^ при 0 = 0 ,е=1 . Требуется найти такой момент остановки е , что И^ т ^ М; т , I « о, I для любого те кг/* • Известно, что решение определяется двумя постоянными границами В и А , связанных о ошибками первого и второго родов. В случае 0, а, г&,... в та величины обозначим через , -Рл 8Л ■ д •
Определим функцию фСа^а^) соотношением
ф( а,, . а ' ах.
В теореме 2.6 показывается, что пет место следупцие оценки
И.-т! ^ А ,¿=0,1, . (33)
К, А.- Л А\ <4Т з
Кз. - Д&1 </Г Ф(#">)-
(34)
(35)
ОСНОВНОЕ СОДЕР1АНИЕ ДИССЕРТАЩИ ОТРАЖЕНО В СЛЕДУЩИХ РАБОТАХ АВТОРА:
1. Бакиа И.А. О редукции одной задачи оптимальной остановки по неполным данным к задаче по полным данным. Пятая между-нар. конф. Вильнюс (1989), тезисы, 38-39.
2. Bakia X. On the payoff convergence rate estimation in the problem of optimal stopping of random processes in the Kal-man-Bucy scheme, Bui. of the Acad, of Sciences of Georgia, t. 140, N 3 (1990), 493-496.
3. Bakia I.A. On the payoff convergence rate estiamtion in the problem of optimal stopping of.random sequences in the scheme of Kalman-Bucy. Bui. of the Acad, of Sciences of Georgia, t.141, И 1, 1990, 37-39.
4. Бакиа И. Сравнение оптимальных границ дискретной непрерывной схемы в задаче различения гипотез о среднем значении ви-неровского процесса. (В печати).