Задача о разладке для самовозбуждающихся процессов тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Алиев, Амир Фикрет оглы
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2013
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В. ЛОМОНОСОВА
МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ
На правах рукописи УДК 519.21
J2ш4>~
Алиев Амир Фикрет оглы
Задача о разладке для самовозбуждающихся процессов
01.01.05 - Теория вероятностей и математическая статистика ц
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Москва - 2013
005060824
Работа выполнена на кафедре теории вероятностей Механико-математического факультета Московского государственного университета имени М.В. Ломоносова.
Научный руководитель: академик РАН, доктор
физико-математических наук, профессор Ширяев Альберт Николаевич
Официальные оппоненты: доктор физико-математических наук,
профессор Мазалов Владимир Викторович, директор ИПМИ КарНЦ РАН
кандидат физико-математических наук, доцент Бурнаев Евгений Владимирович, зав. сектором №5 ИППИ РАН
Ведущая организация: Центральный экономико-математический
институт РАН
Защита состоится 21 июня 2013 г. в 16 часов 45 минут на заседании диссертационного совета Д 501.001.85 при Московском государственном университете имени М.В. Ломоносова, расположенном по адресу: 119991, Москва, ГСП-1, Ленинские горы, д.1, МГУ, Механико-математический факультет, аудитория 16-24.
С диссертацией можно ознакомиться в Фундаментальной библиотеке МГУ имени М.В. Ломоносова.
Автореферат разослан 20 мая 2013 г.
Учёный секретарь диссертационного совета Д 501.001.85 при МГУ доктор физико-математических наук, профессор
Общая характеристика работы
Актуальность работы. Задача о разладке может быть кратко описана как оценивание ненаблюдаемого момента изменения характеристик наблюдаемого процесса. Большой интерес к задачам о разладке вызван в первую очередь важностью разработки эффективных методов её обнаружения в ряде практических задач. Исторически, первым таким приложением ещё в начале XX века был контроль качества на производстве, скажем, задача об обнаружении момента изменения характеристик выпускаемого товара вследствие внезапной поломки. В течение прошлого столетия список приложений значительно расширился: следует отметить задачи скорейшего обнаружения вспышек эпидемий1,2 и «атак» в компьютерных сетях 3'4, выявления изменения климатических условий 5,6 и характера сейсмической активности распознавание однородных блоков наблюдений в записи ЭКГ 8'9 и молекуле ДНК 10, опознавание возникно-
1 D. Воск, С. Sonesson (2003). A review and discussion of prospective statistical surveillance in public health. J. Royal Stat. Soc.: Series A 166:1 5—21.
2 M. Hoiile, M. Paul, L. Held (2007) Statistical approaches to the surveillance of infectious diseases for veterinary public health. Univ. of Munich: Dept. of Stat., Technical Report 14.
3 H. Kim, B. L. Rozovskii, A. G. Taktakovsky (2004). A nonparametric multichart CUSUM test for rapid detection of DOS attacks in computer networks. IJCIS 2:3 149-158.
4 A. G. Taktakovsky, B. L. Rozovksii, R. B. Blazek, H. Kim (2005). Detection of intrusions in information systems by sequential change-point methods. Stat. Meth. 3 252-293.
s S. R. Rodionov, J. E. Overland (2005). Application of a sequential regime shift detection method to the Bering Sea ecosystem. ICES J. Marine Science. 62 328-332.
6 S. R. RODIONOV (2004). A sequential algorithm for testing climate regime shifts. Geophys. Res. Lett.
31:9.
7 I. V. Nikiforov, I. N. tlkhonov (1986). Application of change detection theory to seismic signal processing. Detection of abrupt changes in signals and dynamical systems, Ed. by M. Basseville, A. Benveniste. Berlin Heidelberg: Springer. 355-373.
8 J. S. Barlow, O. D. Creutzfeldt, D. Michael et al (1981). Automatic adaptive segmentation of clinical EEGs. Electroencephalography and Clinical Neurophysiology 51:5 512-525.
9 В. E. Brodsky, B. S. Dakkhovsky (2000). Non-parametric statistical diagnosis. Netherlands: Kluwer.
10 J. V. Braun, R. K. Braun, H. G. Miller (2000). Multiple changepoint fitting via quasffikelihood, with application to DNA sequence segmentation. Biometrika 87:2 301-314.
вения тренда в финансовых данных 11,12 и изменения смертности при проведении операций 13. Столь широкое распространение практических задач требует столь же богатого арсенала теоретических методов их решения.
Для выработки методов решения в каждом случае необходимо подобрать модель разладки. Среди ключевых параметров такой модели будут описание ненаблюдаемого момента разладки, целевая функция, учитывающая в той или иной форме погрешность оценивания, динамика наблюдаемого процесса и характер смены режима этого процесса. Кроме того, могут также играть роль такие второстепенные факторы, как присутствие цены за наблюдения, наличие установившегося стационарного режима перед разладкой, неоднозначность распределения наблюдаемого процесса после разладки и т.п.
В диссертации изучаются методы, относящиеся к так называемому байесовскому подходу к задачам о разладке. В моделях этого типа подразумевается, что момент разладки есть случайная величина с заранее известной функцией распределения. Такая постановка впервые встречается в статье Гиршика и Рубина 14 в контексте выявления брака на производстве. Глубокое теоретическое изучение естественных формулировок и подходов к решению такого рода задач впервые было дано Ширяевым15. Байесовский подход подразумевает достаточно точную спецификацию модели (и потому применим не во всех приложениях), но при этом позволяет строить оптимальные стратегии. Классическими здесь следует считать задачи об оптимальной стратегии обнаружения смены сноса
11 J. Chen, А. К. Gupta (1997). Testing and locating variance changepoints with application to stock
prices. J. Am. Stat Assoc. 92:438 739-747.
12 o. kohler, h. r. Lerche (1э97). An empirical study concerning the detection of trend changes in
some financial time series. FDM Preprint 36
13 S. H. Steiner, R. J. COOK, V. T. Farewell (1999). Monitoring paired binary surgical outcomes
using cumulative sum charts. Stat. Med. 18:1 69-86.
14 M. A. glrshick, H. Rubin (1952). A Bayes Approach to a Quality Control Model. Ann. Math. Statist.
23 114-125.
15 A. H. Ширяев (1969). Статистический последовательный анализ. Оптимальные правила остановки. М: Наука.
винеровского процесса 16'17 и интенсивности пуассоновского процесса 18>19. На основе байесовских моделей с разладкой можно строить и иные оптимизацион-
2П
ные задачи .
Значительный прогресс теории о разладке возбудил интерес к усложнению стандартных подходов. На практике существует множество случаев, в которых момент разладки связан с наблюдаемым процессом. К примеру, в рядах финансовых данных возникновение тренда может быть обусловлено как текущей ценой, или динамикой цены актива за недавнее время, так и (наблюдаемым) новостным фоном. Наглядным примером модели с зависимостью может служить работа Локки 21, в которой разладка происходит до некоторого другого наблюдаемого момента и, следовательно, зависит от наблюдений. Эти соображения говорят о необходимости построения общих моделей, описывающих такую зависимость, и характеризации оптимальных процедур в них. Другое направление для расширения классических методов состоит в моделях с плавным изменением характеристик процесса, вместо внезапной разладки. Такие задачи стоят на стыке с теорией нелинейной фильтрации 22, и, хотя понятие момента разладки перестаёт иметь смысл, могут быть рассмотрены с точки зрения единственности момента подачи тревоги. Здесь интересны конкретные постановки, ухватывающие эти сложности (в том числе зависимость изменений характеристик процесса с наблюдениями), но в то же время позволяющие получать явные оптимальные стратегии.
16 А. Н. Ширяев (1965). Некоторые точные формулы в задаче о «разладке». ТВП 10:2 380-385.
17 Е. A. Feinberg, А. N. Shiryaev (2006). Quickest detection of drift change for Brownian motion in generalized Bayesian and minimax settings. Stat. Dec. 24 445-470.
18 G. Peskir, A. Shiryaev (2000). Solving the Poisson disorder problem. Tech. Rep. 419 Dep. of Theor. Stat. Univ. of Aarhus.
19 E. В. Бурнаев (2008). О задаче обнаружения разладки для пуассоновского процесса в обобщенной
байесовской постановке. ТВП 53:3 534-550.
20 В. В. Мазалов, Е. Е. Ивашко (2009) Байесовская модель в задаче наилучшего выбора с «разладкой». Вестник СПбГУ 10:4 142-151.
21 A. LOKKA (2007). Detection of disorder before an observable event. Stochastics 79 219-231.
22 F. Gustaffson (2000). Adaptive filtering and change detection. New York: Wiley.
Цель диссертационной работы состоит, таким образом, в обобщении типичных моделей на случай зависимости между моментом разладки и наблюдениями, а также разбору модели с непрерывной по времени разладкой с соответствующей зависимостью.
Научная новизна. Все полученные результаты являются новыми. На защиту выносятся следующие основные результаты и положения:
1. Построена общая байесовская модель для задачи о разладке с зависимостью от наблюдений, для неё найдены рекуррентные соотношения для достаточных статистик. Для демонстрации полученных результатов, на частных примерах задачи о разладке самовозбуждающегося процесса демонстрируется методика решения с помощью сведения задачи к задаче оптимальной остановки марковского процесса и затем, в некоторых примерах, к задаче Стефана с подвижной границей.
2. Поставлена и решена конкретная задача о непрерывной разладке с зависимостью от наблюдений. Для некоторых начальных условий получено аналитическое выражение для решения, для других изучено асимптотическое поведение и предложен алгоритм моделирования решения.
3. Доказаны утверждения для задач оптимальной остановки в многомерных пространствах, дающие новые инструменты для поиска решений этих задач через решения соответствующих задач Стефана. Эти результаты применяются для характеризации решений задач из предыдущих пунктов.
Теоретическая и практическая значимость. Диссертация носит теоретический характер. Результаты и методы работы могут быть использованы для построения широкого класса моделей разладки с зависимостью между наблюдениями и моментом разладки и поиска оптимальных методов обнаружения разладки в них. Явные формулы, полученные для задачи о непрерывной разладке, могут быть использованы в качестве первого приближения в задачах
подобного типа. Доказанные результаты для многомерных задач оптимальной остановки могут быть использованы для получения новых граничных условий в широком классе задач Стефана с подвижной границей.
Апробация работы. Основные результаты диссертации докладывались на следующих семинарах и конференциях:
• Большой кафедральный семинар кафедры теории вероятностей, рук. Ширяев А.Н., МГУ им. М.В.Ломоносова, 2006, 2012 гг.
• Семинар «Стохастический анализ и теория мартингалов», рук. Ширяев А.Н., МГУ им. М.В.Ломоносова, неоднократно в 2009-2012 гг.
• Семинар «Вероятностные проблемы управления и стохастические модели в экономике, финансах и страховании», рук. Аркин В.И. и Пресман Э.Л., ЦЭМИ РАН, 2012 г.
• 15ая Европейская конференция молодых учёных <?15th European Young Statisticians Meeting», Castro Urdíales, Spain, 2007 г.
Публикации. Результаты диссертации опубликованы в 3 печатных работах автора в рецензируемых журналах [1-3] и материалах конференции [4]. Работ, написанных в соавторстве, нет.
Личный вклад автора. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Все представленные в диссертации результаты получены лично автором.
Структура и объём диссертации. Диссертация состоит из введения, 3 глав и библиографии, включающей 96 наименований. Общий объём диссертации 78 страниц, включая 5 рисунков.
Краткое содержание диссертации
Во введении даётся обзор литературы по задачам о разладке, обосновывается актуальность диссертационной работы. Кроме того, формулируется цель и показывается научная новизна исследования, указывается практическая значимость полученных результатов, представляются выносимые на защиту научные положения. Наконец, описывается структура диссертации и взаимосвязь её глав.
В первой главе исследуется постановка задачи об однократной разладке с зависимостью от наблюдений для случая произвольных начального и конечного распределений. Сначала описывается общая задача разладки случайного процесса с зависимостью от наблюдений в дискретном времени. Изложение следует работе Ширяева 23, где такое описание даётся для момента разладки независимого от реализации процесса. Полученные результаты достаточно просты и служат отправной точкой для построения модели в непрерывном времени, являющейся основной в диссертации. В непрерывном времени случай независимого от процесса момента разладки подробно изучался в работе Кавтарадзе с соавторами 24, и изложение можно рассматривать как расширение соответствующих результатов этой работы.
Рассмотрим вероятностное пространство (ü, {rf^o^*, Р) на котором задан процесс (Xt)t>a, Т* = <т(Хи, и ^ f) и меры Р°°, Р°, абсолютно непре-
роо рО.
рывные относительно меры Р (можно считать изначально, что Р = —^—)• Расширим это пространство с помощью дополнительного вероятностного пространства (П\ J"', Р') до (П, Р) (как прямое произведение вероятностных пространств, то есть здесь Q — ii х Ü' и аналогично для сигма-алгебр и мер). В дальнейшем изложении мы будем иногда отождествлять Тх и =
23 А. Н. Ширяев (2008). О стохастических моделях и оптимальных методах в задачах скорейшего
обнаружения. ТВП 53:3 417-436.
24 Т. kavtaradze, N. Lazrieva, М. Mania, P. Muliere (2007). A Bayesian-martmgale approach to
the general disorder problem. Stoch. Proc. AppL 117 1093-1120.
{А х А 6 -Т7*}- На полученном вероятностном пространстве рассмотрим произвольный марковский момент 0. Мы будем работать в дальнейшем с регулярной версией условной функции распределения Р (в < £| (и>).
Утверждение 1.2.1. Процесс
согласован с (7Г^)(>[|.
Связь момента в, процесса X и случайной функции С? несколько проясняет следующее несложное обобщение классического результата о компенсаторе марковского момента (см. монографию Жакода и Ширяева25).
Утверждение 1.2.2. Пусть процесс (С?(4,и))(>0 предсказуем. Тогда компенсатор субмартингала (О^г^о равен
ш
Г в{(1и,ь))
У С([и,оо],ш)" о
Наша цель - построить модель, в которой распределение процесса меняется в момент времени в с Р°° на Р°. Введём (стандартные) обозначения
«-Я- «
М\ = Сод[Ь%, г = 0, оо, (2)
где вторая пара равенств задаст локальные мартингалы М1 по мере Р через стохастический логарифм. Иными словами, процессы Мг определяются как
г
М\
о
Кроме того, зададим
< Яг
г г
мI = ! !{*< х}(1М™ + J х}йм°
25 Ж. Ж а код, А. Н. Ширяев (1994). Предельные теоремы для случайных процессов. М: Физматлит
и введем меру на пространстве ф.,?), отвечающую интересующей нас модели разладки
¿Р" = £(М9)хс1Р. Интерес представляют сужения этой меры на Т*.
Теорема 1.2.1. В этих обозначениях справедливо представление і
^ = І £(Ми)іС ({X., з < і}, сій) + £(М»)г (1-<? ({*„ в < «}, 0) • о
Для многих классических критериев риска важную роль играет статистика
п = рв (6 (3)
которая выражается через ранее введённые величины.
Теорема 1.2.2. Для процесса апостериорной вероятности разладки справедливо представление
=__
~ /04 £{М«)<в({Хя, з ^ и}, ¿и) + £(М~), (1 - С({Х„ в < «}, і))' Из этого представления, в свою очередь, выводится стохастическое дифференциальное уравнение на процесс (тг^^о-
Теорема 1.2.3. Процесс апостериорной вероятности разладки может быть представлен через стохастическое дифференциальное уравнение
, . Л,,, _ 7Г(_(ДМі)2
ащ = — Щ-)
(1-П-)
+
. (4)
где Мап - непрерывная мартиигалъная компонента М.
В случае, когда траектории (? п.н. непрерывны, мы можем преобразовать уравнение (4) с помощью компенсатора процесса одного скачка (в^ь^о, который
в соответствии с Утверждением 1.2.2 представим в видеК^і Лб) для некоторой монотонно неубывающей предсказуемой случайной функции К:
йщ = 7Г{-(1 - Щ-)
Далее приводятся примеры, иллюстрирующие приведённый подход к задаче о разладке, и представляющие самостоятельный интерес. Эти примеры получены небольшой модификацией классических результатов о разладке ви-неровского и пуассоновского процессов и имеют стандартную целевую функцию
V = Ы(Р(т < в) + с Е(т - в)+) = Ы Е ^(1 - яу) + с I ,
где инфимум берется по всем моментам остановки по Винеровская разладка переменной интенсивности.
Рассмотрим задачу о разладке винеровского процесса, в которой наблюдаемый процесс устроен как
йУг = ц1{в ^ + а<Ши
где Ш - стандартный винеровский процесс, а момент разладки в зависит от процесса и задаётся через условную функцию распределения как
= 7Г + (1 - тг) | 1 - ехр | - I
Таким образом, разладка может происходить с разной интенсивностью при разных значениях процесса. Полученные результаты позволяют свести эту задачу к задаче оптимальной остановки двумерного марковского процесса (здесь И^ -обновляющий процесс, также являющийся винеровским)
ÍdYt = /Л7Г(<Й + а<Шь
¿щ = А(У0(1 - + £тг,(1 - щ)т
Ввиду сложности соответствующей задачи Стефана, в диссертации описывается методика численного моделирования решения.
9
Винеровская разладка на дискретном множестве.
Снова рассмотрим задачу о разладке винеровского процесса Y (см. предыдущий пример). Пусть на том же вероятностном пространстве задан (наблюдаемый) пуассоновский процесс N интенсивности Л, независимый с W. Пусть момент разладки в имеет геометрическое (с параметром р) распределение на множестве его скачков:
G(t, ш) = 1-Р(в> t\Ns, s ^ t) = 1 - (1 - pf^K (5)
Этот пример отвечает случаю, когда разладка может происходить только в определённые наблюдаемые моменты времени и, таким образом, зависит от наблюдений. Используя общие результаты диссертации и некоторые частные для данного примера соображения, удаётся показать, что процесс апостериорной вероятности есть однородный марковский процесс с инфинитезимальным оператором
(L /)(тг) = ^г2(1 - тг)2/"М + А(/(тг + р(1 - ж)) - f(n)).
Также удаётся дать форму оптимального множества (с помощью результатов третьей главы диссертации) и свести в итоге задачу о разладке к задаче Стефана с подвижной границей.
Теорема 1.4.2. Оптимальная стратегия в этой задаче о разладке представляется в виде т* = inf{i : 7rf > Л}, где оптимальный уровень А определяется из решения задачи Стефана на А и неизвестную функцию V
V(tt) - 1 - яг, 7Г > А, (6)
\-V + ar = 0, 7г< А, (7)
У [А) — — 1 (гладкое склеивание), (8)
V(0) = V(p). (9)
Пуассоновская разладка на дискретном множестве.
Рассмотрим задачу о разладке пуассоновского процесса, в которой наблюдаемый процесс устроен как
«¿У( = 1{0 > + 1{° <
где ЛГА°,ЛГЛ1 - независимые пуассоновские процессы интенсивности Л0 и Ах соответственно, а момент разладки 0 задаётся через ещё один независимый пуас-соиовский процесс N аналогично предыдущему примеру, т.е. как (5). Опять же с помощью общих результатов диссертации доказывается, что (7Г{){>0 есть однородный марковский процесс с инфинитезимальным оператором
(I /)(тг) = -(Ах - А0)тг(1 - 7г)Г(1г) + А (/(тг + р(1 - тг)) - Дтг)) +
(Лхтг, + Л0(1 - *.)) (/ _ ж)) ~ Я*)) • (Ю)
Для Лх > Ло также даётся характеризация решения с помощью результатов третьей главы диссертации и доказывается
Теорема 1.5.2. При Л1 > Ло оптимальная стратегия в описанной задаче о разладке представляется в виде т" = тф : щ ^ Л], где оптимальный уровень А определяется из решения задачи Стефана на А и неизвестную функцию V
У(5Г) = 1 - ТГ, 7Г > А, (11)
1_У + С7Г = 0, тг < А, (12)
у(0 )=У(р). (13)
Результаты первой главы опубликованы в работе [2].
Во второй главе изучается задача о разладке винеровского процесса, в которой происходит непрерывное изменение сноса процесса, а именно, случай винеровской пары процессов разладки и наблюдений. Рассматривается процесс
4
и = I е„<1з + агУУи 4 > 0. о
По аналогии с задачами об однократной разладке, функция штрафа берется в виде
/ т \
(14)
V = Ы | Р(вт <ц)+сЕ¡1{0а ^ //><¿5
В такой постановке может быть произвольным марковским процессом.
Разбирается, однако, частный случай, при котором 9Ь = в0 + а^Ви где начальное значение - нормальная случайная величина 60 ~ Я{т,р), а пара Б{) образует двумерный винеровский процесс с коэффициентом корреляции между компонентами р. Теория линейной фильтрации в непрерывном времени позволяет вывести отсюда динамику (марковского) процесса апостериорной вероятности щ = Р (в > ц\ Т^) и переформулировать с его помощью задачу (14). Решающую роль в решении соответствующей задачи оптимальной остановки играет начальное условие р: при р = <Г1сг2(1 - р) удаётся получить явный вид функции штрафа и оптимального момента остановки. Показывается, что оптимальный штраф имеет вид V , где функция У(х) - решение задачи
оптимальной остановки
Г
(1-ф(^)) + с i
(15)
для процесса Zt = 71(, где Ф - функция стандартного нормального распределения, 7 = ^ а I - стандартный винеровский процесс. Эта задача, в свою очередь, может быть сведена к задаче Стефана
£У"(х) = -сФ(х), х < А
(16)
У(х) = 1 - Щх), х^А
Г(А) = (1-Ф(х))'\яшЛ = -ФЦА)
и решена в явном виде.
Теорема 2.2.1. Решением задачи оптимальной остановки (15) является
функция
{1 - Ф(а;), х ^ А л
1 - Ф{А) + Ц /ХА Ф(и)с1и^, х < А
где А есть решение трансцендентного уравнения ^ /^Ф(и)А, = Ф'(Л). Оптимальный момент остановки при этом может быть выражен как та =
Ы(Ь : Zl ^ Л).
Таким образом, получена полная характеризация оптимального момента остановки и соответствующей ему функции штрафа.
В случае р -ф <у\Оъ{У - р) задача становится двумерной, так как процесс (тг()(>о есть неоднородный марковский процесс, и, следовательно, соответствующая функция штрафа V(«, 7г) зависит ещё и от времени. Представлен асимптотический результат, связывающий однородный и неоднородный случай.
Теорема 2.3.1. У(1,-к) К(тг), Ь со равномерно по всем-к на подот-резках интервала (0,1).
Результаты второй главы опубликованы в работе [1].
В третьей главе разбираются некоторые общие теоремы для задач оптимальной остановки в многомерных пространствах, применяющиеся в первых двух главах.
Первым разбирается принцип гладкого склеивания, позволяющий требовать выполнение дополнительных граничных условий в задаче Стефана. В многомерных пространствах при определённых требованиях гладкости границы соответствующие результаты были получены Григелионисом и Ширяевым26. Следует также отметить работу Аркина и Сластникова27, где из вариационных соображений доказан принцип гладкого склеивания в многомерном пространстве для определённого класса моментов остановки.
29 Б. И. Григелионис, А. Н. Ширяев (1966). О задаче Стефана и оптимальных правилах остановки
марковских процессов. ТВП 11:4 612-631.
27 В. И. Аркин, А. Д. сластников (2008). Вариационный подход к задачам оптимальной остановки
диффузионных процессов. ТВП 53:3 516-533.
Пусть в К" задан диффузионный процесс с вектором сноса а(х) и
диффузионной матрицей В(х). По заданной функции : йп —> К определим У(х) = вир,. Ех С(ХТ). Пусть в точке Ь функции V и С равны (оптимальная точка). Представим две теоремы, дающие условия выполнения принципа гладкого склеивания функций V и С в точке 6. Для соответствующих формулировок напомним, что функцией шкалы процесса X называется решение й : К" —> К дифференциального уравнения
(а(аг), з'(х)) + ~1гВ(х)В*(х)з"(х) = 0.
Такое решение не является единственным, но нам будет достаточно существования набора из п решений, удовлетворяющего условиям теоремы. Этот вектор решений мы в дальнейшем будем обозначать Б.
Кроме того, введем в К" топологию >У как систему множеств IV с условием: для любого х <Е IV и последовательности контуров 7„, стягивающихся к х, выполнено соотношение
,1ДЕ,||ХГ гЩХ«
т»-* Ех ||Хт(7п) — х|| 4 >
(здесь и далее 11 ■ | (обозначает стандартную норму в Мп). Справедливость аксиом топологии легко проверяется по определению. Топология И> содержит все множества открытые в обычной топологии пространства М". При п = 1 и довольно слабых условиях, наложенных на процесс, эта топология совпадает с обычной топологией прямой, однако в многомерном случае она несколько богаче.
■ Теорема 3.1.1. Пусть в точке Ь функции С? и 5 дифференцируемы, причём якобиан функции Б отличен от нуля. Тогда функция V — С является в топологии >У бесконечно малой относительно ||х — 6|| при х —> Ь.
Иные условия для выполнения принципа гладкого склеивания даёт следующая теорема, в которой процесс (Х^^о может уже быть произвольным марковским процессом.
Теорема 3.1.2. Пусть распределение приращений процессаХ пе зависит от начальной точки и точка Ь регулярна для множества остановки П относительно процесса X. Пусть, кроме того, функция О дифференцируема по всем направлениям и модули её производных по всем направлениям ограничены в некоторой окрестности границы. Тогда в точке Ь дифференцируема по всем направлениям и функция V, причём её производные совпадают с производными по соответствующим направлениям функции й.
Оставшаяся часть третьей главы посвящена характеризации множеств остановки и продолжения наблюдений в общей задаче оптимальной остановки вида
Обозначим за СТ множество продолжения наблюдений в задаче оптимальной остановки (18), где инфимум берется по моментам остановки не превышающим Т. Доказывается, что при определённых ограничениях на процесс предел этого семейства при ТI 0 есть С0+ = < 0} с точностью до граничных точек,
семейство С^ непрерывно растёт и в пределе при Т оо обращается в множество продолжения наблюдений в исходной задаче (18). Хотя соответствующие утверждения и являются вспомогательными для доказательства результатов первой и второй главы, они вынесены отдельно в общей форме, позволяющей охватить множество конкретных применений.
Результаты третьей главы опубликованы в работах [3, 4].
Автор хотел бы выразить глубокую благодарность своему научному руководителю, академику РАН, профессору Альберту Николаевичу Ширяеву за постановку задач и многолетнее внимание.
г
(18)
о
Работы автора по теме диссертации
1. Алиев А. Ф. Задача о непрерывной разладке винеровского процесса // Доклады академии наук. 2013. Т. 450:2. С. 135-139.
2. Алиев А. Ф. К задаче об обнаружении разладки самовозбуждающегося процесса // Теория вероятностей и её применения. 2012. Т. 57:3. С. 588-597.
3. Алиев А. Ф. О принципе гладкого склеивания вК" // Успехи математических наук. 2007. Т. 62:4. С. 147-148.
4. Aliev A. On the principle of smooth fit in optimal stopping problems // Proceedings of the 15th European Young Statisticians Meeting (EYSM). 2007. P. 1-5.
Подписано в печать:
20.05.2013
Заказ № 8522 Тираж - 140 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М.В. ЛОМОНОСОВА
МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ
На правах рукописи УДК 519.21
04201357906
Алиев Амир Фикрет оглы
Задача о разладке для самовозбуждающихся процессов
01.01.05 - Теория вероятностей и математическая статистика
ДИССЕРТАЦИЯ
на соискание ученой степени кандидата физико-математических наук
Научный руководитель академик РАН, д. ф.-м. н., проф. Ширяев Альберт Николаевич
Москва - 2013
Содержание
Введение ................................... 3
Глава 1. Задача о разладке для самовозбуждающегося процесса ......................................12
1.1. Дискретный случай.........................12
1.2. Непрерывный случай................................................18
1.3. Виперовская разладка с интенсивностью, зависящей от значения процесса.............................25
1.4. Виперовская разладка иа дискретном наблюдаемом множестве 29
1.5. Пуассоновская разладка па дискретном наблюдаемом множестве 34
Глава 2. Задача о непрерывной разладке винеровского процесса ......................................38
2.1. Постановка задачи..........................38
2.2. Однородный случай.........................40
2.3. Неоднородный случай........................47
Глава 3. Некоторые общие теоремы для многомерных задач о разладке..................................56
3.1. О принципе гладкого склеивания в Мп ..............57
3.2. Об оптимальном множестве остановки в Мп...........61
Литература..................................68
Введение
Актуальность работы. Задача о разладке может быть кратко описана как оценивание ненаблюдаемого момента изменения характеристик наблюдаемого процесса. Большой интерес к задачам о разладке вызван в первую очередь важностью разработки эффективных методов её обнаружения в ряде практических задач. Исторически, первым таким приложением ещё в начале XX века был контроль качества па производстве, скажем, задача об обнаружении момента изменения характеристик выпускаемого товара вследствие внезапной поломки. В течение прошлого столетия список приложений значительно расширился: следует отметить задачи скорейшего обнаружения вспышек эпидемий [40. 51] и «атак» в компьютерных сетях [55. 92]. выявления изменения климатических условий [83, 84] и характера сейсмической активности [69], распознавание однородных блоков наблюдений в записи ЭКГ [35, 42] и молекуле ДНК [41], опознавание возникновения тренда в финансовых данных [43, 56] и изменения смертности при проведении операций [91]. Столь широкое распространение практических задач требует столь же богатого арсенала теоретических методов их решения.
Для выработки методов решения в каждом случае необходимо подобрать модель разладки. Среди ключевых параметров такой модели будут описание ненаблюдаемого момента разладки, целевая функция, учитывающая в той или иной форме погрешность оценивания, динамика наблюдаемого процесса и характер смены режима этого процесса. Кроме того, могут также играть роль такие второстепенные факторы, как присутствие цепы за наблюдения, наличие установившегося стационарного режима перед разладкой, неоднозначность распределения наблюдаемого процесса после разладки и т.п.
Первые теоретические исследования задач такого рода возникли в рабо-
тах Шыоарта [85. 86] в связи с задачей обнаружения брака на производстве, а именно выхода системы из нормального рабочего состояния. Для решения данной задачи Шыоарт предложил метод «контрольных карт», при котором тревога подавалась при выходе наблюдаемых характеристик процесса из коридора образованного вокруг эмпирического среднего. Пейдж в своих работах [70. 71] предложил альтернативную процедуру, впоследствии получившую название СиБиМ, т.к. роль контрольной статистики играли кумму-лятивныс суммы вида {(Хп)п^о - наблюдения над процессом)
5П+1 = тах{8п + Хп, 0).
Ещё одна методика, предложенная Робертсом [81], основывалась на статистике экспоненциального сглаживания
5П+1 = (1 - г)5п + гХп.
Следует также отметить результаты [22. 23, 25]. Раннее численное сравнение различных методов можно найти в [80. 82], более современное в [6-3. 90].
Первым точным решением задачи о разладке следует считать, по-видимому, работу Гиршика и Рубина [49], которые нашли оптимальную стратегию подачи тревоги в общей за,даче смены плотности распределения последовательности случайных величин, где момент разладки имеет геометрическое распределение. Важно отметить, что в своей работе Гиршик и Рубин также рассмотрели случай, когда наблюдения имеют стоимость, и можно отказаться от них в какие-то моменты времени (см. [44], где подобная задача рассматривается в непрерывном случае). Подобная постановка задачи о разладке, в которой момент разладки полагался случайным и имеющим известное распределение, получила название байесовской, и была подробно изучена Ширяевым [26-31]. В этих работах были найдены оптимальные правила остановки в задачах о разладке вииеровского процесса, как однократной, так и воз-
пикающей на фойе стационарного режима (отметим обзорную статью [10]). Ключевую роль в этой задаче играет апостериорная вероятность наступления разладки тг^ = Р [в ^ Ц где в - момент разладки, а - наблюде-
ния. Для неё удаётся получить стохастическое дифференциальное уравнение (для наглядности параметры модели положены равными единице)
йщ = (1 - + 7Г*(1 - щ)(Шг.
Существует множество обобщений и расширений полученных Ширяевым результатов. Так, Гапеев и Ширяев [48] получили решения задачи о разладке винеровского процесса в случае сноса, зависящего от текущего значения процесса. Гальчук и Розовский [8] дали решение задачи о разладке пуассо-повского процесса (изменение интенсивности в случайный момент времени) при определённых условиях па параметры, сходное по духу с вииеровским случаем. Их результат был расширен Дэвисом [45] и Псшкиром и Ширяевым [73]. Во всех этих задачах минимизируется целевая функция, состоящая из взвешенной суммы штрафа за ложную тревогу и времени запаздывания (постановка Каратзаса [53], в которой минимизируется среднее расстояние между разладкой и тревогой, сводится к этому случаю, как было показано в [87]). В то же время, возможны и другие функции штрафа. Так, Пур [78] изучает экспоненциальный штраф за запаздывание для задачи о разладке винеровского процесса, а Байрактар и Даяник [37] - для процесса Пуассона. Ещё больший класс функций штрафа для задачи о разладке пуассоновского процесса изучен в [38]. В то время как большинство этих работ оперирует с независимыми наблюдениями (в дискретном случае) или процессами с независимыми приращениями (в непрерывном), в последние годы появились также расширения на общую ситуацию смены распределения последовательности (подробное рассмотрение сложностей этого общего случая можно найти в обзорной работе Лая [59]). Здесь следует отметить работы Ширяева [33] (в
дискретном времени) и Кавтарадзе с соавторами [54] (в непрерывном), допускающие также произвольные распределения момента разладки. Важные результаты, показывающие асимптотические характеристики различных процедур в такой общей модели были получены Тартаковским и Виравали [93].
Другая постановка задачи о разладке изучает случай, когда нет известного априорного распределения момента разладки. При таком подходе, называемом минимаксным, минимизируется худший среди всех фиксированных моментов разладки случай, т.е. ищется минимум по всем моментам остановки с ограниченной снизу ошибкой первого рода выражения
вир евв вирш Ев ((т - 0) + | Те) ■
о
Л орден [62] впервые предложил такого рода постановку и доказал ассимп-тотическую оптимальность СиЭиМ-метода Пейджа. Как было показано впоследствии Мустакидесом [6С] в дискретном времени и Ширяевым [32] в непрерывном времени, этот метод на самом деле является строго оптимальным для последовательности независимых случайных величии и винеровского процесса. Важно отметить работы Ритова [79] и Байбеля [39], где эти результаты (в дискретном и непрерывном времени соответственно) доказаны методами, проясняющими связь с байесовской постановкой. Мей [65] даёт пример нарушения оптимальности метода СиЭиМ для последовательностей зависимых величин. Модификации СиБиМ-алгоритма па случай зависимых наблюдений исследовались Никифоровым [19-21]. Для разладки процессов Ито, оптимальность модификации СиЭиМ-мстода, основанной на расстоянии Куль-бака-Лейблера, показана в [67]. Несколько отличающаяся минимаксная постановка принадлежит Поллаку, который в своих работал [75. 76] доказал асимптотическую оптимальность модифицированной статистики Ширяева-Роберт-
са для минимизации выражения
sup Ев((т-0)|т>0,т)
в^о
среди всех моментов остановки с ограниченной снизу ошибкой первого рода.
, Вопрос об оптимальном методе в этой задаче до сих пор открыт. Различие постановок Лордена и Поллака исследуется в [68]. Непараметрическую модификацию CUSUM-метода, основанную на знаковой статистике, можно найти в [64].
Между этими постановками находится так называемая обобщённо-байесовская постановка задачи, в которой функция риска усредняется по всевозможным (фиксированным) моментам разладки (что в каком-то смысле отвечает равномерному распределению момента разладки на числовой полуоси). Такая задача исследовалась в работах Ширяева [28, 29] для винеровско-го процесса как предельная для экспоненциального распределения момента разладки при убывающем к нулю параметре. Файпберг и Ширяев [471 дают непосредственное решение задачи о разладке виперовского процесса в обобщённо-байесовской постановке. Соответствующая задача для пуассоповского процесса рассматривается в работах Буриасва [5. G], для общих процессов Леви - в работе Устинова [24]. Связь обобщённо-байесовской и минимаксной постановок проясняет обзорная статья [77]. Важную роль в формулировке оптимальных моментов в этих работах играет так называемая статистика Ширяева-Робертса.
Все эти постановки рассматривают ситуацию последовательного наблюдения над процессом, во многом опирающуюся на классическую теорию последовательного анализа Вальда [89. 94-96] (см. [46] для результатов в непрерывном случае). В то же время, возможна «апостериорная постановка», при которой наблюдателю уже дана полная информация о наблюдениях за какой-то большой промежуток времени, и требуется по пей оцепить момент разлад-
ки. Для винеровского процесса соответствующая задача изучалась Вострико-вой [7]. Подробно эта проблематика освещается в монографии [36]. Непараметрические техники для такого рода задач исследовались Дарховским |11], Дарховским и Бродским [12, 13, 42].
В диссертации изучаются методы, относящиеся к байесовскому подходу к задачам о разладке, когда подразумевается, что момент разладки есть случайная величина с заранее известной функцией распределения. Байесовский подход требует достаточно точной спецификации модели (и потому применим не во всех приложениях), но при этом позволяет строить оптимальные стратегии. На основе байесовских моделей с разладкой можно строить и иные оптимизационные задачи (см. например [18]).
Значительный прогресс теории о разладке возбудил интерес к усложнению стандартных подходов. На практике существует множество случаев, в которых момент разладки связан с наблюдаемым процессом. К примеру, в рядах финансовых данных возникновение тренда может быть обусловлено как текущей ценой, или динамикой цены актива за недавнее время, так и (наблюдаемым) новостным фоном. Наглядным примером модели с зависимостью может служить работа Локки [60], в которой разладка происходит до некоторого другого наблюдаемого момента и, следовательно, зависит от наблюдений. В работе Пешкира [72] хотя и не происходит разладки, но при оценке момента выхода наблюдаемого процесса на скрытый случайный уровень с известным распределением используется функция риска, типичная для задач о разладке. Эти примеры говорят о необходимости построения общих моделей, описывающих такую зависимость, и характеризации оптимальных процедур в них. В [68] даётся подход к формулировке такой модели, по не предложен общий метод решения соответствующих задач.
Другое направление для расширения классических методов состоит в моделях с плавным изменением характеристик процесса, вместо внезапной раз-
ладки. Такие задачи стоят на стыке с теорией нелинейной фильтрации [50], и, хотя понятие момента разладки перестаёт иметь смысл, могут быть рассмотрены с точки зрения единственности момента подачи тревоги. Здесь интересны конкретные постановки, ухватывающие эти сложности (в том числе зависимость изменений характеристик процесса с наблюдениями), но в то же время позволяющие получать явные оптимальные стратегии.
Цель диссертационной работы состоит, таким образом, в обобщении типичных моделей на случай зависимости между моментом разладки и наблюдениями, а также разбору модели с непрерывной по времени разладкой с соответствующей зависимостью.
Научная новизна. Все полученные результаты являются новыми. На защиту выносятся следующие основные результаты и положения:
1. Построена общая байесовская модель для задачи о разладке с зависимостью от наблюдений, для неё найдены рекуррентные соотношения для достаточных статистик. Для демонстрации полученных результатов, на, частных примерах задачи о разладке самовозбуждающегося процесса демонстрируется методика решения с помощью сведения задачи к задаче оптимальной остановки марковского процесса и затем, в некоторых примерах, к задаче Стефана с подвижной границей.
2. Поставлена и решена конкретная задача о непрерывной разладке с зависимостью от наблюдений. Для некоторых начальных условий получено аналитическое выражение для решения, для других изучено асимптотическое поведение и предложен алгоритм моделирования решения.
3. Доказаны утверждения для задач оптимальной остановки в многомерных пространствах, дающие новые инструменты для поиска решений этих задач через решения соответствующих задач Стефана. Эти резуль-
таты применяются для характеризации решений задач из предыдущих пунктов.
Теоретическая и практическая значимость. Диссертация носит теоретический характер. Результаты и методы работы могут быть использованы для построения широкого класса моделей разладки с зависимостью между наблюдениями и моментом разладки и поиска оптимальных методов обнаружения разладки в них. Явные формулы, полученные для задачи о непрерывной разладке, могут быть использованы в качестве первого приближения в задачах подобного типа. Доказанные результаты для многомерных задач оптимальной остановки могут быть использованы для получения новых граничных условий в широком классе задач Стефана с подвижной границей.
Апробация работы. Основные результаты диссертации докладывались на следующих семинарах и конференциях:
• Большой кафедральный семинар кафедры теории вероятностей, рук. Ширяев А.Н., МГУ им. М.В.Ломоносова, 2006, 2012 гг.
• Семинар «Стохастический анализ и теория мартингалов», рук. Ширяев А.Н., МГУ им. М.В.Ломоносова, неоднократно в 2009-2012 гг.
• Семинар «Вероятностные проблемы управления и стохастические модели в экономике, финансах и страховании», рук. Аркии В.И. и Пресмап Э.Л., ЦЭМИ РАН, 2012 г.
• 15ая Европейская конференция молодых учёных « 15th European Young Statisticians Meeting», Castro Urdiales, Spain, 2007 r.
Публикации. Результаты диссертации опубликованы в 3 печатных работах автора в рецензируемых журналах [1-3] и материалах конференции [34]. Работ, написанных в соавторстве, нет.
Личный вклад автора. Содержание диссертации и основные положения, выносимые па защиту, отражают персональный вклад автора в опубликованные работы. Все представленные в диссертации результаты получены лично автором.
Структура и объём диссертации. Диссертация состоит из введения, 3 глав и библиографии, включающей 96 наименований. Общий объём диссертации 78 страниц, включая 5 рисунков.
Глава 1
Задача о разладке для самовозбуждающегося
процесса
Рассмотрим задачу о разладке, в которой наблюдаемый процесс претерпевает изменение своих свойств (по распределению) либо в детерминированный момент времени, либо в случайный момент, не зависящий от наблюдений. Построение соответствующей вероятностной модели даётся в [33, 88]. Такая модель охватывает широкий класс приложений, ограниченный однако требованием независимости наступления момента разладки от наблюдений до этого момента. Однако, как указано нами выше, из рассмотрения приложений возникает необходимость строить и исследовать модели, в которых смена режима будет «провоцироваться» не только скрытыми факторами, по и непосредственно наблюдениями.
В первой части главы мы дадим общее описание таких моделей как в дискретном, так и в непрерывном случае, а также достаточных статистик для принятия решений о подаче тревоги для широкого класса задач о разладке. Затем мы рассмотрим конкретные примеры с самовозбуждением и, перейдя для них к задаче оптимальной остановки марковского процесса, с помощью численны