Последовательные методы проверки статистических гипотез и обнаружения разладки тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Житлухин, Михаил Валентинович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2013
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
• *' Ф^еёкйекай- академий йаук", ".' • Математический институт им. В. А. Стеклова
На правах рукописи к 519.21
005532952
Житлухин Михаил Валентинович
ПОСЛЕДОВАТЕЛЬНЫЕ МЕТОДЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ И ОБНАРУЖЕНИЯ РАЗЛАДКИ
01.01.05 — теория вероятностей и математическая статистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
1 2 СЕН 2013
Москва, 2013 г.
005532952
Работа выполнена в отделе теории вероятностей и математической ста тистикп Федерального государственного бюджетного учреждения наукл Математического института им. В. А. Стеклова РАН.
Научный руководитель:
О фициальные оппоненты:
Ведущая организация:
д.ф.-м.н.. профессор, академик РАН главный научный сотрудник МИАН Ширяев Альберт Николаевич
д.ф.-м.н., профессор, директор ИПМИ КарНЦ РАН Мазалов Владимир Викторович
к.ф.-м.н., доцент,
заведующий сектором ИППН РАН Бурнаев Евгений Владимирович
Федеральное государственное бюджет ное учреждение науки Центральный эко номико-математический институт РАН.
Защита диссертации состоится 10 октября 2013 г. в 14:00 па заседании диссертационного совета Д 002.022.01 при МИАН по адресу: 11999 Москва, ул. Губкина, д. 8.
С диссертацией можно ознакомиться в библиотеке МИАН по адрес, Москва, ул. Губкина, д. 8, 8-й этаж.
Автореферат разослан
Ученый секретарь диссертационного
совета Д 002.022.01 при МИАН,
доктор физико-математических наук, __
профессор В. А. Ватутп
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Диссертация посвящена вопросам носледова-сльной проверки статистических гипотез и обнаружению "разладок" слу-айных процессов. Также в диссертации получены вспомогательные ре-ультаты по теории оптимальной остановки марковских процессов, кото-ые представляют интерес и сами по себе.
Характерной особенностью последовательных методов математической гатистики является возможность выбирать момент прекращения иаблю-енпя (объем выборки) в зависимости от наблюдаемых данных. Такая вен-ожность во многих случаях обеспечивает выигрыш в средней продолжи--;лыюст)1 наблюдения по сравнению с методами с фиксированным объе-ом выборки при одинаковой вероятности ошибочных решений.
Основополагающей работой статистического последовательного анали-1 можно считать книгу А. Вальда1, где, главным образом, изучаются зада-п последовательной проверки гипотез по дискретным наблюдениям. Фун-' мент теории обнаружения разладок был заложен в работах У. Шыоирта, . ПэНджа, С. Робертса. А. Н. Ширяева и др. (см. работы2'3,4-5).
Первая глава диссертации посвящена теории оптимальной остановки .арковских процессов, результаты которой играют ключевую рол):, в по-ледователыюм анализе: обычно оптимальный момент прекращения на-люденпя может быть найден путем решения вспомогательной задачи об птнмальной остановке. Цель главы доказать общие результаты о еуще-гвованпи оптимальных моментов остановки, и их характернации в виде омснтов первого выхода, случайного процесса на, границу.
Стандартные условия существования оптимальных моментов нзложе-ы. например, в известных монографиях6-7. Однако, этих, условий оказы-
ВчльО А. Последовательный щтлиз (пер. с англ.). — Москва: Физыатгиз. 1900 - Stewart w. The tppHcaUon of statistics as an aid in maintaining quality of a manufact un-d product.
turned of the Arne.rir.an Statistical Association. — 1925. — Vol. 20, no. 152...... I'p. âKKHS
3 Page К S. Continuous inspection schemes // Biomctiika. — 1951. — Vol. 41........ Pp. 100-114
' Roberts S. IV. Control charts based on geometric moving average // T<xh.t>omrf.ri,-*....... 105') Vol I
l'p. 2:50 250 ..........'
Ширяев А. H. Обнаружение спонтанно возникающих эффектов ' / Доклады АН СССР — 1ОД1 Т. 138. S' 4. С. 79!} 801 ' ....."
* Шщигсн А. И. ОгатистнческиП последовательный анализ. — 2 юя. - Москно: Наука, 1976
7 rester G\, Shrryam A. Optimal stoppins and iree-boundary probU-ms......- Birkhäiisrr Basel. 200>'i
вАется недостаточно для решения задач, возникающих, в диссертации, ! поэтому первая часть главы посвящена изучению более слабых условий.
Доказав существование оптимального момента остановки в конкретно} задаче, возникает вопрос его явного нахождения. Один из наиболее иеполь
зуемых методов......- сведение задачи об оптимальной остановке к задаче с<
свободной границей для ннфинитезималыюго оператора останавливаемой процесса. Этот метод, как правило, позволяет получить явное апалитиче ское решение, для "однородных задач", но задачи последовательного а на лиза, изучаемые в работе, таковыми не являются, и их явное решение и представляется возможным. Тем не менее, если доказать, что оптнмаль ним моментом остановки является момент первого выхода, процесса и некоторую границу, то. используя задачу со свободной границей, возмо; • но получить интегральное уравнение, описывающее данную границу. Эт позволяет свести исходную стохастическую задачу об оптимальной оста иовке к более простой детерминистической задаче решения интегральног уравнения. Результаты подобного типа хорошо известны в литературе (на пример, данная техника, обширно применяется в книге;7). Однако, не был известно общих результатов, которые были бы применимы к достаточт широкому классу задач. В диссертации доказывается одна, такая обща} теорема. В последующей части работы ее применение является ключевые шагом в решении рассматриваемых задач последовательного анализа. Вез условно, данная теорема может быть полезна и в исследованиях вне рамо! диссертации.
Глава '2 посвящена- задачам последовательной проверки гипотез. В ни: предполагается, что наблюдателю доступна стохастическая система, пред:
ставленная вероятностным пространством Ш. ¿Р, Р"), где ц-.........неизвестны!
параметр вероятностного закона, описывающего систему. Наблюдения про изводятся последовательно, и "информация", извлекаемая из наблюдений, представлена потоком а-алгебр (фильтрацией) Е = где, С &
Наблюдатель имеет возможность выбрать момент т прекращения наблю дения, в который выносится заключение об истинном значении д. По опре делению, т должен быть моментом остановки фильтрации Р.
Хорошие решающие правила должны обладать как малым временем
«блюдсния, так.и.нкзкоП частотой ошибочных решений. Та к как iki юйства являются взаимоисключающими (мем дольше производится на-пюденпе, тем больше шанс вынести верное решение), то приходится ис-н'гь "компромисс'1 в зависимости от требований конкретного критерия он-имальностн.
Фундаментальным результатом, полученным А. Вальдом, является по-b.ilo(>am<\ ibiibiù критерий отношен ия правдоподобия, предназначенный ля проверки двух простых гипотез Н{, : // = //(1 и 7/j : ц — цх. Крите-ий заключается в наблюдении за процессом отношения правдоподобия и •тановке наблюдения в момент его первого выхода из некоторого витерит значений; решение о справедливости //0 или Н\ принимается в зави-шости от того, через какой конец интервала вышел процесс. Для случая юлюдения последовательности независимых одинаково распределенных тугайных величии А. Вальд и Дж. Волфовиц доказали8 оптимальность анного критерия, показав, что он обладает наименьшим средним време-ем наблюдения как при справедливости Щ, так и при справедливости Н\, ху.ш всех последовательных критериев с такими же вероятностями отмочных решении. Впоследствии данный результат был обобщен на более шрокие классы стохастических систем.
В диссертации будут рассматриваться задачи проверки гипотез, когда ц вляетея неизвестным коэффициентом сноса броуновского движения. Та-ая модель интересна как сама по себе, так и может быть рассмотрена: как редельный случай дискретных наблюдений, когда выборка увеличнвает-1 "непрерывным" образом. Оптимальность критерия Вальда для броупов-•ого движения с неизвестным сносом была доказана А. Н. Ширяевым0 в лшеукязаиной постановке Вальда и Волфовпца, а также в бай«.ч-овекой остановке, когда ц является ненаблюдаемой бернуллневской случайной
"ЛИЧИНОЙ.
На практике, однако, критерия Вальда бывает недостаточно, так как епзвеетнып параметр может принимать более чем два значения. Две бо-
8 Wolfowitz ./. Optimum character of the sequential probability ratio test .'/ The Annate of
athcrna tirai Statistic.*. — 1048. — Vol. 19; no. 3. — Pp. 326-339
4 Ширяев A. H. О двух задачах иослсдошн'слыюш ашишзл ,'/ KvfcintemuKa — 1907 — Т •> —
. 79-80
лее сложных модели, рассматриваемых в ди'сеёртащш. были предложен! Г. Черновым10, а также Дж. Кифером и Л. Вейсом11. В задаче Чернова р -ненаблюдаемая нормальная случайная величина с известными средним s дисперсией, и. требуется проверить гипотезы о положительности или отри цательиости /i. Оптимальным считается решающее правило, мшшмизиру ющее сумму среднего времени наблюдения и штрафа за неверное решение пропорционального абсолютному значению р. Г. Чернов и Дж. Брейквел. установили10'12,13, что следует останавливать наблюдение, когда наблюди емый процесс выйдет на одну из двух симметричных границ, и принимал-гипотезу о положительности р, если выход произошел через верхнюю грг 1пшу. и гипотезу об отрицательности, если через нижнюю. Чернов и Брей квелл не нашли границу в каком-либо явном виде, но исследовали аенмг тотику в предположении ее гладкости (приведенном без доказательства В настоящей диссертации мы получим интегральное уравнение, характс ризующее данную границу, и докажем, что она непрерывна. Уравнен и решается численно.
В задаче Кнфера-Вейса ß — числовой параметр, н ставится задача hj'îc верки двух простых гипотез о значении сноса броуновского движение, гд требуется минимизировать максимальное (при всевозможных значения, параметра) среднее время наблюдения при ограничении на вероятноеп ошибочного решения. Дж. Кифер и Л. Вейс рассматривали эту задачу дл. дискретных наблюдений; для непрерывных наблюдений она изучалась, на пример, в работах14,15"11'. Причиной рассмотрения такой постановки слу жит тот факт, что критерий Вальда обладает достаточно большим сред
10 Chtrneff 11. Sequential test« for the mean of a Normal distribution // Fourth Berkeley Symposium. 1061. - Vol. 1. - Pp. 70-91
u Kiefer ./., Wei»« L. Some properties of generalized sequential probability ratio test« The Annals Mathematical Statistics. — J057. - Vol. 28, no. 1, — Pp. ."-71
12 Bn.afoot.il J., Chrtvoff H. Sequential tests for the mean of a Normal distribution II (large !:} // 77 Annal* of Mathematical Statistics. — 100-1. — Vol. 35. Pp. 162.....173
13 Chernoff H. Sequential tests for the mean of a Normal distribution III (small t) ' • The Annals Mathcmaliad Statistic*. — 1965. — Vol. 36. — Pp. 28-54
11 Ande.i-.wn T. IV. A modification of the sequential probability ratio test, to reduce -he sample size The Annals of Mathematical Statistics. — I960. — Vol. 31, no. 1. — Pp. 163-197
,F> Lai T. L. Optima! stopping and sequential tests which minimize the maximum expected sample size The Annals of Statistics. 1973. Vol. 1, no. 4. — Pp. 059 673
HovuKon A. A.. Jlî*i.'ii.nni В. П. Асимптотическое рептенпе задами Кифера Bçfica .li:i процесео с независимыми приращениями // Теория вероятностей у ее применения. — 10&7. — Т. 32. .Vs -I. -С. 679 690
им временем наблюдения, если истинное значение параметра не совпадает > значениями в проверяемых гипотезах. Так, Р. Бекхофер показал1', что i может даже уступать критерию с фиксированным объемом выборки, акнм образом, возникает желание найти решающее правило, минимизи-/ющее максимально возможное среднее время наблюдения.
В задаче Кпфера-Вейса для броуновского движения оптимальным мо~ ентом прекращения наблюдения является момент первого выхода наблю-■хемого процесса на некоторые границы. Результаты, имеющиеся в литера-'ре, посвящены, главным образом, асимптотическому исследованию гра-щ остановки или аппроксимации задачи схемой с дискретным временем, астоящая диссертация дополняет имеющиеся результаты: приводится ха-жтеризация границы с помощью интегрального уравнения, которое ре-аетея ч и с л е н но.
Третья глава, (-одержит результаты о методах обнаружения "разлалок". ;.од разладкой понимается неизвестный момент изменения вероятностного шона стохастической системы (например, случайного процесс,а или по-едовательноети). Общая задача заключается в выборе момента останов-п наблюдаемой фильтрации, который был бы наиболее? близок к моменту азладки в определенном смысле.
В диссертации рассматривается байесовская постановка, где нредпола-хется, что момент разладки является ненаблюдаемой случайной неличной. Базовый результат в "непрерывном времени" — решение байесовской дачи о разладке для броуновского движения — был получен А. FL Ширя-ым18. В этой задаче предполагается, что наблюдается броуновское дви-■ение, снос которого изначально равен нулю, но меняется на некоторое звеетное значение ц в ненаблюдаемый момент в. Случайная величина в редполагается экспоненциально распределенной с известным параметром и не зависимой от броуновского движения. Требуется найти момент оста-овки (момент "подачи сигнала' о наступлении разладки), который бы мн-нмизировал линейную комбинацию вероятности ложной тревоги и сред-
'' Btekhojer Л. А Ше. ом »Jus Ibniting relative efficiency of »hc Wald sequrntial probability ratio tesl .
»>nuü of the Amcrican SiaUrtical Association. — i960. — Vol. 55, no. 292........ Pp. 660-663"
,B Ширяем А. Я. Об оптимальных методах в задачах скорейшего обнаружения // Теория нераягтю-ruii и СО применения. 196;$. — Т. 8. Л"» 1. — С'. 26-51
него времени запаздывания' решения. Оказывается, что объявлять сигнал-тревоги о разладке следует в момент, когда процесс апостериорной вероят ности того, что разладка уже произошла, превысит определенный у ровен i-В работе18 приведена явная формула, выражающая процесс апостериорно! вероятности через наблюдаемый процесс, и найден оптимальный уровень зависимости от предпочтений между вероятностью ложной тревоги и врс м и ¡ем зам аз ды вания.
Впоследствии байесовская задача о разладке рассматривалась для рас личных процессов: для броуновского движения, пуассоповского процесс; диффузионных процессов и др. Рассматривались также различные Kpi терпи качества, моментов подачи сигнала о наступлении разладки: ниш мнзапия вероятности ложной тревоги и среднего времени запаздывали* минимизация средней величины промаха во времени, минимизация эксгк иеициальных функционалов от времени запаздывания и др. Большой обзо известных результатов содержится в книге10 и работе20.
Первый результат по теории обнаружения разладок, полученный в дис сертации, — формулировка общей модели стохастических систем с разла/ кой, в которой информация о системе представлена потоком а-алгебр. Ка частные случаи, данная постановка, включает модели случайных процессо и последовательностей с разладкой. В качестве критерия качества мо.мем та. обнаружения разладки выступает общая задача минимизации средпег значения штрафа за ошибку в обнаружении.
Достоинство модели состоит в том. что она обобщает многие результа ты, имеющиеся в литературе, и для нее удается получить универсальны метод решения широкого класса задач.
Главным результатом для общей модели является теорема о еведепи задач обнаружения разладки к задачам об оптимальной остановке дл обобщенной статистики Ширяева-Робертса 'ф. Эта статистика тсс-но ев* зана с процессом апостериорной вероятности, но имеет несколько боле-простую структуру. Выводится стохастическое дифференциальное уравне ние, которому удовлетворяет Ф, и устанавливается, что в случае разладк!
10 Poor Я. V., Hadjikadix О. Quickest Detection. — Cambridge University Press. 2001.1
Shiryaev .4. N. Quickest detfiction problems: fifty years later // Seqticnlial Analyst*. — 2010. — Vol. 2i no. 4. — Гр. 443-363
нффузиснпого процесса Л" пара. (г!>,Х) является марковским процессом: ; то дает возможность применять методы общей теории об оптимгчльной становке марковских процессов.
Полученные общие результаты применяются к задачам о разладке бро-новского движения, когда момент разладки имеет равномерное распре-еление на отрезке. Следует отметить, что в литературе, как правило, ассматрпвается экспоненциальное распределение, которое является есте-твенной моделью разладки на временно]'! полупрямой, так как эксионен-иальное распределение обладает наибольшей энтропией на полупрямой. В вязи с этим интересно рассмотреть случай разладки па конечном отрезке ремени, где уже естественной моделью является равномерное распределе-ие. При этом задачи о разладке на полупрямой с экспоненциальным распределением сводятся, как правило, к однородным задачам об оптимальной становке марковских процессов, и их решение может быть найдено явно налитнчески. В отличие от них. задачи о разладке на отрезке удается свети лишь к неоднородным задачам оптимальной остановки, и их решения казываются значительно труднее (источником неоднородное! и является •ремя, оставшееся до конца отрезка).
Сначала будет рассмотрена задача, где требуется минимизировать сред-ий штраф за. разницу между моментом наступления разладки и моментом одачи сигнала тревоги. Оказывается, что оптимальным моментом оста-овки для широкого класса, функций штрафа является момент первого ыхода статистики Шнряева-Робертса па некоторую границу, характеризу-мую интегральным уравнением. Доказываемая теорема содержит аналоги езультатов для разладки на полупрямой (см. монографии0'7,19).
Далее будут решены задачи об оптимальной остановке броуновского .вижения и геометрического броуновского движения с разладкой. Предпо-агая, что эти процессы имеют положительный снос до момента разладки отрицательный после, задача заключается в выборе момента останови, максимизирующего среднее значение остановленного процесса. Задачи •акого типа изучались для экспоненциального распределения момента ра,з-
ладки в работах21-22'23,' где им придавалась экономическая интерпретации вопроса выбора оптимального момента продажи актива, с изменяющим» трендом цены. Разладка на конечном отрезке, рассматриваемая в диссер тадии, является другой естественной моделью, так отмечено в работе22.
Цель работы. Целью работы является нахождение оптимальных ре шающих правил в конкретных моделях последовательной., анализа, связан ных с проверкой статистических гипотез и обнаружением разладок. Такж цслыо работы является получение общих результатов о существовании ре шенин задач оптимальной остановки марковских процессов и характер« зацнп границ множеств остановки с помощью интегральных уравнений.
Научная новизна. Результаты диссертации являются новыми и со стоят в следующем.
1. Ослаблены достаточные условия в теореме о существовании решен и* задачи об оптимальной остановке марковского процесса и. доказана обща-теорема о характеризации границы множества остановки в виде единствен ного решения интегрального уравнения.
2. В задачах Чернова и Кнфера Вепса проверки гипотез о значении ко эффнцнента сноса броуновского движения получены интегральные урав нения, характеризующие оптимальные границы остановки, и найдены он тнмальные решающие правила.
3. Сформулирована общая байесовская задача обнаружения разладю стохастической системы по наблюдению за потоком ст-алгсбр. Показано как такая задача может быть сведена к задаче об оптимальной останов ке статистики Ширяева Робертса для широкого класса функций штраф; Используя это, доказано, что оптимальным моментом остановки в зада че обнаружения разладки броуновского движения, когда момент разладк равномерно распределен на конечном отрезке, является момент первог выхода статистики Ширяева-Робертса на. некоторую границ}', для которо.
21 Bc.ihtl Л/., Lrrrhi: Н. П. A new look at optimal stopping problems related to mathematical finance . Statistic'»- Srnica. - 1997. - Vol. 7. — Pp. 93-J08
" Sh.iryar.v A.. Novikov А. Л. Oil a stochastic version ol" the trading rule "Buy and Hold- / 5;V<t-;./.vs .
Decisions. ...... 2009. Vol. 2fi. no. -I. - Pp. 289.....302
w ЕШгот E., Liv.dbn.rg С. Optimal closing of a momentum trade. — To appear in Journal of Appbe Probability
олучено интегральное уравнение. Также найдены уравнения для опти-пхльных границ остановки в задачах об оптимальной остановке броунов-кого движения и геометрического броуновского движения с разладкой.
Методы исследования. В диссертации применены методы стохасти-еского анализа: теория марковских процессов, теория мартингалов и сто-астическое дифференциальное исчисление.
Теоретическая и практическая значимость. Работа носит теоре-ический характер. Ее результаты могут быть полезны в вопросах последо-ателыюго анализа, стохастических систем, связанных с проверкой гипотез обнаружением разладок. Теоремы первой главы могут быть использова-ы при решении широкого класса задач об оптимальной остановке для fарковских прсцессов.
Апробация диссертации. Результаты работы доклады вал ись авто-ом на следующих научных конференциях и семинарах: . Конференция "The Seventh Bachelier Colloquium on Mathematical Finance and Stochastic Calculus", Метабьеф, Франция, 13-20 января 2013 г. Тема доклада: Disorder detection problems with applications to finance. . Конференция "Stochastic Optimization and Optimal Stopping', Москва, 2-1-28 сентября 2012 г. Тема доклада: A general Bavesian disorder problem for Brownian motion on a finite interval.
. Конференция "The Joint Meeting of International Young Business and Industrial Statisticians", Лиссабон, Португалия, 23-26 июля 2012 г. Тема доклада: General Bavesian quickest detection problems: sufficient statistics and optimal stopping times. . Конференция ИППИ (Москва) WIAS (Берлин) по стохастическому и предсказательному моделированию, Москва, 31 мая - 1 июня 2012 г. Тема доклада: New results in Bayesian quickest detection problems and their applications.
. Конференция МИЛН — 1IOMII, посвященная теме "Вероятность и функциональный анализ", Москва. 16-17 февраля 2012 г. Тема доклада: О задаче Г. Чернова последовательного различения гипотез о сносе броунов-с ко го д в i i жен и я.
0. Семинар Филдеовского' института, Торонто. Канада, март 2013 г. 7. Большой семинар кафедры теории вероятностей механико-математи ноского факультета. МГУ. несколько докладов в 2009-2012 гг. В. Научный семинар "Случайные процессы и стохастический анализ' по;
рук. А.Н. Ширяева, МГУ, несколько докладов в 2008-2013 гг. 9. Семинар .Лаборатории предсказательного моделирования. МФТИ, ап рель 2012 г.
Публикации. Список работ автора, содержащих результаты днсеерта ции, приведен в конце автореферата. По теме диссертации опублпковапь 5 работ [2]-[6]: работа [1] содержит вспомогательный результат.
Структура и объем работы. Диссертация состоит из введения, тре. глав и приложения. Общий объем работы составляет 98 страниц. Снисо! литературы включает 66 наименований.
Благодарность. Работа, выполнена под руководством академика РА1 профессора Альберта Николаевича Ширяева, которому автор выражаст искреннюю благодарность.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Глава 1 посвящена, теории оптимальной остановки марковских про цессов. Пусть на фильтрованном, измеримом пространстве (И, {■■^'1)1 >о] задан строго марковский процесс Х = (Х(. Рх), £ ^ 0, со значениями в из меримом множестве 5с1, заданы измеримые функции О. Ь: х М —> Ж и временной горизонт [Та,Т], где —оо < Т0 < Т ^ +оо. Семейство вероят постных мер Рх, х € 8. как обычно, таково, что Р.г (Хо = х) = 1.
Для произвольного £ ^ 0 введем множество 9Л*. всех марковских мо ментов фильтрации удовлетворяющих условию т(и>) < I для все.
у € У. В случае I = ос, считаем состоящим из всех, марковских мо ментов, конечных. Р.т-п.н. для каждого х €
Рассматривается задача об опгпимллттой остановке
Ы' Е,г
<?(< + т, А'г) + / Щ + 5-, Х,ч)<1з Л)
(1
до t € [То. J""|, х € SV к Еа. обдоиачает математическое/»жидание по мере Рт. »адача заключается и нахождении функции V(t,x)\\ моментов остановки * — r*(i,x), на которых достигаются инфимумы для V(t,w). Функция Указывается функцией цены, а моменты т* — оптимальными люмспитми установки.
В главе рассматриваются вопросы существования оптимальных моментов остановки и получения удобного представления для них.
Центральный результат теории оптимальной остановки для марковских фоцеесов состоит в том, что при некоторых дополнительных предноложе-шях оптимальным моментом остановки является момент тр первого попадания процесса, А" в множество остановки D:
D = {(/.. .г) : V(i, х) = G(t. .г)}, rD(t) = inf{5 > 0 : (s + I. А",) € D}.
Известно'''7, что это так. когда функции G и L ограничены сверху и
2.,. sup \G(s+t, Xs) +/0Я Цн+t. Xn)du\ < ос для любых х € .9, t € рп, Т]. о«c.ss;r-<
Однако этих условий оказывается недостаточно для рассматриваемых в >аботе задач. В связи с этим вводится следующее более слабое
Условие (А). Существует множество D° С D такое, что выполнены неравенства
snp Ej.
!/..!•)€[/,„ 71 xS
Т -i Tj>u (f )
G(fH-r.A*T)-G(/,a:)+ f L{t + .<?. Xs)ds
•A)
< +OC
i-:, «up
G(i + s.Xe)+ f L(t + u. Xn)du J 0
V/r, £ [70.7-). < oo Vi 6 S, t £ [Г(), T).
де Т£»а(е) = т!-!*' ^ 0 : (¿ 4- в, Хя) € £>°}. В первом неравенстве супремум >еретея но тройкам (I, х, г). где х) € [/о- Т) х 5 и т — момент остановки, •довлстворяющий неравенству г < тро(1).
Первым основным результатом главы является следующая теорема.
Теорема. Mo.ue.nm тр является решением задачи (1), сели функции ' и С непрерывны, и выполнено условие (А).
Рассмотрим диффузионный процесс Л", удовлетворяющий уравнению
dXt = /¿(Л't)dt + a{Xt)dBu Х0 = х (Р.,-п.н.).
и являющийся положительным или симметричным. Под положительным понимается такой процесс, что S = [0. ос) и Рз-(Л', > 0: / > 0) = 1 д. п любого х > 0; а под симметричным — такой, что S* = R, ц(—х) = —//(¿г) с{х) == сг(-х) для любого х е К, И G(t.x) = G(t,-.r), Lij.x) = L{l. -:r] для любых I € [Tq. T), x G M.
Вторым основным результатом главы является теорема о том. что npi дополнительных предположениях множество D односвязно, и его грани ца может быть охарактеризована как решение некоторого ннтегрнльногс. уравнения.
Определим дифференциальный оператор Л? = -щ + -+- -^
Вводятся следующие восемь условий:
(i) /¿. а принадлежат классу С1-2; а > 0 при всех х ^ 0; (н) G непрерывна, на множестве ['7о, Г) x S, G € С1,2 па IТо, Т) х (0, ос) L удовлетворяет условию Липшица на [Ïq, 'Г) х 5;
(iii) для каждого t € [То, Т) функция х {L -f J?G)(t,x) либо положи тельна при х > 0, либо строго возрастает при х > 0 и равна, иулк: для некоторого .т0(0 > 0; при этом функция
h(t) = inf{:r > 0 : (L + ¿fG)(t.x) > 0}
непрерывна и ограниченна на [Т0, Т) (где полагаем inf 0 = 0);
(iv) V непрерывна на множестве [Т(>, T] x S. а оптимальным моменток остановки является момент T.o(f) — inf {s > 0 : (t + s, X„) € D}\
(v) множество продолжения наблюдения С = {(/..т) € [Т>- T) х 5' V(t.,x) < G (t, .г)} имеет вид С = {(¿,х) € [Т0. T) x S : Jj-j < а*(/)} где а*: [7о, Т) —> (0, 4-ос] — невозрастающая строго положительная функция на [Т0, Т). конечная хотя бы в одной точке и удовлетворяю щая следующим условиям для каждого I 6 ¡Tq. T):
fT!
Д Е,-[|L(f -h s, A*.,)j I{\XS\ < a*(t + s)}ds] < oc, (2:
çT-i
/ Es\\X'G{t + s. X„)\I{\XS\> a {t + s)}ds\ < ос, . (3)
J о
f E,{(a(X..)G's{1 (• л. Л',))"' 1{|ЛУ| > a(t ~ .s )},/*] J о
< ос; (4)
(vi) V(t,.r) = fi (/, .x) + f-2 (t.x) на множестве [7 о, 7') x (0, .ос) с некоторой функцией /i класса С1,2 и некоторой функцией /2, являющейся выпуклой или вогнутой по х при х ^ а*(0 и при 0 < л; a*(i): fvii) для каждых (i.i) € [То, Г) х ¿> существует предел
v(t.x) = lim ErV*(« + s. Л'„);
s — T/ 4 • - . ■ viii) для каждого t e [To. T) выполнено условие гладкого склсивштя
V;_(t.a*(t)) = G>.(t.a(t)).
Теорема. Если выполнены уааовия (i)-(vüi), то функция а*{1) является непрерывным решением уравнения
rT-t
G(t. a(t)) - v(J, a(t)) = f EnU) '/,(< + s, Л%)1{|Л'в| < a(i + s)}
./о L
-.'ZCAt + », Л\)1{|Л\| > a(t + s)}] ds. t G [Tit. T). и, удовлетворяет условию
«*(/.) ^ h(l) при t e [To, T). Цля функции цены справедлива формула
(о)
(С)
V(t,x) - п((.х) +
/ Е
Ja
L(t 4- 5. X,)I{|A-,i < аГ{1 + s)}
■JS?G(î + s, A\.)I{ |A',j > a'(t + s)}
ds.
В случае Т < оо решение (5) единственно в классе непрерывных функций а (1). удовлетворяющих условиям (2)-(4). (6).
Список условий 0)~(\'Ш) кажется достаточно длинным, однако норные грн условия легко проверяются из постановки конкретной задачи. Уело-
впя (К;)-(\.'ш) требуют более сложных рассуждении; для их проверки в рассматриваемых в диссертации задах об оптимальной остановке применяются соображения, использующие структуру соответствующих задач.
Интегральное уравнение (5) может быть решено численно с помощью метода "обратной индукции". Он основан на том, что для каждого фиксированного / € ['Го-Т) интеграл в уравнении (5) может быть приближенно вычислен, зная значения а*(г>) лишь при в ^ а поэтому можно последовательно находить значения функции а"{1) в точках некоторого разбиения [2'о, 21], начиная с правого конца.
В главе 2 рассматриваются задачи Чернова и Кифера-Всйса проверки гипотез о значении коэффициента сноса броуновского движения. Предполагается, что на некотором вероятностном пространстве (П, Р) задан наблюдаемый случайный процесс X = (Х/)фо вида
= (7)
где В — (В,.)(£о ~ стандартное броуновское движение на (П, ¿Р.Р), а ц — неизвестный параметр.
В задаче Чернова предполагается, что /г — ненаблюдаемая случайная величина., не зависящая, от В и имеющая нормальное распределение с известными средним //о и дисперсией а%. Задача, состоит в проверке гипоте; Н+: /I > 0 и II-: ¡г < 0 по последовательному наблюдению за X.
По определению, каждая процедура проверки гипотез задается решаю щам праби.иом (т. (]), состоящим из конечного (Р-н.п.) момен та остановки г фильтрации о, ^ — <г(Хк-,з ^ и ¿^-измеримой функции Н, при
нимающей значения ±1. Момент т задает время прекращения наблюдения а значение функции 4 соответствует принимаемой гипотезе.
Согласно определению в работе10, решающее правило (т'.с!*) называет ея оптггмаъъным, если оно минимизируют функцию штрафа, состоя щук из штрафов за продолжительность наблюдения и за неверное решение:
Е[ет* + /Н/;.|1К ф йёпОх)}] = 1111; Е[ст + к\,Щ<1. ф 5ёп{/,)}1 где с. А: > 0 — константы, а. иифимум берется по всем решающим правилам
т. (Г). Здесь штраф за продолжительность наблюдения пропорционален ,ре.мепи наблюдения, а штраф за неверное решение пропорционален абсолютной величине /л. Без ограничения общности можно считать с = к = 1 см. работу [б]), что и предполагается далее.
Основные результаты работ10-12,13 Чернова и Брейквелла состояли в нахождении асимптотики оптимального решающего правила при ап 0 и о —► ос, но точное решающее правило ими найдено не было. В настоящей диссертации доказывается, что в оптимальном решающем правиле (т*\(Г) ■юмент г* является моментом первого выхода некоторого случайного процесса (получающего простым преобразованием из А") на. определенную траншу, характеризуемую интегральным уравнением, а значение функции (Г тределяется по значению А'т-.
Решение основано на сведении к задаче об оптимальной остановке для >роуиовскоп:> движения с помощью замены времени в исходном процессе. Фиксировав параметры (/¿о-<То), вводится процесс IV — (И-'^о^ъ
<оторый является стандартным винеровским процессом (1Тд определяется -ак потраекторный предел при / —> 1).
Оказывается, что задача Чернова может быть решена, путем решения вдачи об оптимальной остановки для процесса 11-' (см. теорему ниже:):
де ннфимум берется по классу 9??"' моментов остановки т ^ 1 фильтрации
IV,. = <г0(1 - О*
— НЧ)/(Го-
2
+ (Ц)/(То
* ¡1.0,1т0
Н{их) = 4= Ф/^Д) - ^ф(-|.т|/уД), 1> 0, а: € М.
V / Ъ
Теорема. 1) Пусть момент остановки является опггшлиыьпыи в задаче (8). Тогда оптимальное решающее правило (г*, à*) g задаче проверки гипотез Н+ и //_ имеет, вид
Т* = •>/-<'"' d' = + Ро./о-о).
2) Момент t*v = т,\>(//о, сто) и.чеетп вид
= mf{0 < « < 1 : IIV, 4- //0М>| > <(/)}■
где a* (t): [0,1] —> BU ....... невозрастающая непрерывная, функция на [0,1].
являющая единственным решение.м интегрального уравнения-
(1 - i)H{ 1 — i, a(t))
= f1_l_[ф Л*(«)-*(*Л _ф d4
в классе непрерывных функций a(t), обладающих свойствами
ал
О < a(t) sC -j(l - t) при t < 1, o(1) = 0.
Далее в главе рассматривается задача Кифера-Вейса для броуновского движения. Также предполагается, что наблюдению подлежит процесс (7), но теперь р — неизвестный числовой параметр.
Задача заключается в проверке гипотез Н+ : р = р0 и : р. = —/у0, где ро > 0 — фиксированная константа. Задается допустимая вероятность ошибки а & (0.1/2), и вводится класс Ап всех решающих правил с вероятностью ошибки, не превышающей а: (r,d) G Да, если Р'" '(d — —1) <С а и Р~''°(d =1) < а, где Р" обозначает вероятностную меру, порождаемую процессом А' со значением параметра р = и. Здесь решающе«; правило ( г, d) состоит из момента остановки т фильтрации — а(ХЛ; s < t), и
.^--измеримой функции d, принимающей значения ±1.
OnmuM.ajibH.hLM. решающим правилом в данной задаче считается правило (r*,d') G Да, которое» минимизирует максимальное среднее время
аблюдешш среди всех решающих правил из класса Д«:
supE"r* — inf supEV, '(9)
«sr (r.rf)6Att „ей
де E" обозначает математическое ожидание по мере Р".
Результат!:.!, имеющиеся в литературе, посвящены приближенным реше-шям (асимптотическим и численным). В диссертации оптимальное реша-)щее правило находится явно, выражая т* в виде момента первого выхода фоцесса X на границ}', задаваемую интегральным уравнением.
Теорема. Оптимальным решающим правил/ли (г*, d") в задаче (9) яв-
гяегпся
т* = inf{i > 0 : > a*(t + /0)}. (Г = sgnXT..
.de a*(t) > 0 — неьозрастающая непрерывная. функция на К, являющая ем 'динственпъш решением, интегрального уравнения,
ехр(-//0a(t) - /îqÎ/2) = f [Ф<{a(s + t) - ait)) - <I>,(-«(s + t) ~ a(1))]ds
./ о
h классе непрерывных функций a(t) на R, удовлетворяющих неравенству
О < a{t) < fi0c t б R.
Зс.тчина /о = /fi(n) находится из условия P,io(d*(lo) = —1) = о .
Таким образом, чтобы найти оптимальное решающее правило (т".(1м), ■начала нужно вычислить функцию a*(t), которая не зависит от a, a заем для заданного значения ci подобрать ¿о так, что момент г" = г*{ta) •довлетворяет условию = —1) = а для d*{t0) = sgnAVu,,i-
Глава 3 содержит результаты по методам обнаружения разладки ето-састическнх систем. Определение стохастической системы с разладкой да-лгея следующим образом.
Пусть на фильтрованном вероятностном пространстве (Q. Р)
¡адана случайная величина в со значениями в [0, ос] и известной (функцией >аспределения G{t), причем существуют регулярные условные вероятности
Р'( •) = Р( ■ [ в .-■ /), и любые две меры Р'1 и Р<г локально эквиваленты, т.е. Р*1 ~ для любого .« ^ 0. где Р' обозначает сужение Р( на Символом Ц обозначим производную Радопа-Никодима ёР^/дРи а символом 1Ш — множестве всех марковских моментов фильтрации ¥ =
Совокупность (Г2, Р, Р. в, С) называется байесовской стохастической системой с разладкой, если для любых I, 5 ^ 0 выполнено равенство
ц = ц=щ < 8) + цЩ- 1С* ^ 5).
Смысл этого равенства в том, что в представляет момент изменения поведения системы (момент "разладки"): до момента в наблюдаемая система подчиняется мере а. после него — Р°. Величина в предполагается ненаблюдаемой, а наблюдателю доступна информация из потока сг-алгебр ¥.
Под задачей обнаружения разладки понимается задача, нахождения момента остановки т* фильтрации ЗР, который был бы наиболее близок к в 1 некотором смысле. Для определения понятия близости в диссертации ис пользуются два следующих критерия.
Пусть Н{1): К —» К — некоторая ¿/-образная функция, т. е. убывающая при I ^ 0, возрастающая при 1 ^г 0 и со значением /./(О) = 0. Экстремалг, пая байесовская, задача обнаружения разладки заключается в нахожденш т* Е ЯЛ минимизирующего средний штраф ЕН(т — в):
ЕН(т* - 0) = М ЕН(т - в).
Рассматривается также условно-экстремальная байесовская постановка, г которой для заданных функций штрафа Н\ и Нп требуется найти момсгп т* 6 т минимизирующий средний штраф относительно Н1 нрн условии что средний штраф относительно #2 не превышает заданного уровня а:
Е//] (г* - 0) = ц^ ЕЯ] (т - в), гА 6 {II,),
гб£И„(Я2)
где Ш?„(Я2) = {те ЭЛ: Е Н2(т - в) < а}.
Показывается, что условно-экстремальная задача сводится к экстре мальной (см. главу 3), поэтому основные результаты доказываются дл*
кстремалыюй постановки.
Первый главный результат заключается в сведении задачи обнаруже-шя разладки к задаче об оптимальной остановке для обобщенной стати-тики Ширяева- Робертса, когда функция штрафа линейна или экснонсн-шальна при t ^ 0. т.е. #(/) = ct или H{t) = |(ew - 1) при t ^ 0; в первом •лучае далее для удобства полагаем Ъ = 0. По определению, обобщенной "гатнетикой Ширяева-Робертса с параметром 6^0 называется процесс iAh) = (%f4b>)t^(h задаваемый формулой
v*M = [' >dG(s).
J 0
Теорема. Если, функция, H{t) линейна или экспоненциальна при t > 0 : параметрами Ъ > 0, с > 0, то справедливо равенство
inf EH(т - в) = inf те: ал теш?
де функцил Jf(t) задается формулой
H\t) = f //(/ - s)dG(s).
Оба инфимума в (10) достигаются на одном моменте остановки.
Вводя обозначение L( = L^/Lf0 для производной Радоня-Ннкодима ме->ы Р(/ по мере показывается, что iplb> удовлетворяет стохастическому дифференциальному уравнению
(Ь)
duf = hv'f'd) + dG{i) + ^<-dLu г -\с/'1 = С(0).
t<t
Если X — диффузионный процесс с разладкой вида
dXt = n(Xt)I(t > 9)dt. + dB,.
где // ~Л 0 -- известная функция, то из явного представление для L имеем ¿ф\ь) = bipl''!dt + dG(t) + 4<lb)n(X,)dXh 46) = 6'(0).
Н(т)
L
• ил I
ПО)
В частности, относительно меры Р'х двумерный процесс (Xbt¿7''}) является марковским. Более того, если /л(-) = const (разладка броуновского движения), то сама статистика Ширяева-Робертса является марковским процессом, что позволяет сводить задачи обнаружения разладки к задачам об оптимальной остановке марковских процессов.
Используя этот результат, решается задача обнаружения разладки броуновского движения, когда 9 имеем равномерное распределение на иолу-отрезке (О, Г], т.е. G{t) = G(ü) + pi при t < Г, где С(0) — вероятность присутствия разладки с самого начала, а р = (1 — G(0))/T — плотность 0.
В следующей теореме символом обозначается математическое ожидание по мере относительно которой удовлетворяет вышеуказанному стохастическому дифференциальному уравнению с процессом Л' являющимся стандартным броуновским движением и iI>q} — х.
Теорема. Если функция H(t) линейна или экспоненциальна при t ^ О с параметрами Ъ ^ 0. с > 0 и удовлетворяет условию Липшица на [—Т. 0), то решением экстремальной задачи обнаружения- ра.зладки броуновского движения дм в ~ í/((0, Т]) является
т* = inf{£ > О : Ф1Ь) > a(t)} Л Т,
■где а* : [0, Т] —> R+. — невозрастаю-щая непрерывная функция, являющаяся сдинстпвенньш, решением уравнения
fj ' [(«tf0 - pint - < a(s)}] ds -i). t € [0. T).
в классе непрерывных функций a(t), удовлетворяющих условиям a(t) iï pH(t - T)/с при t. е [О.Г), а{Т) = рН{()~)/с.
Последняя часть главы 3 посвящена задачам об оптимальной остановке броуновского движения с разладкой и геометрического броуновского движения с разладкой. А именно, для наблюдаемого процесса X = (Xt)t^o,
dXt - bul (t < 0) + //21(/ > 0)}dt + adBu
ассматриваются задачи об оптимальней' остановке
V{,) = sup ЕХТ, Vü) = sup Eexp(AV— а2т/2).
т€Шт теОТг
де Шт обозначает класс моментов остановки г < Т. согласованных с эильтрацией F = о, ^ = s *)• Индекс (I) соответствует (.-ш-
.ейпому) броуновскому движению, а (.9) — геометрическому. Момент раз-адки в предполагается равномерно распределенным на полуотрезке (Ü. Т\.
С помощью замены меры данные задачи сводятся к задачам оппшаль-ой остаповки статистики Ширяева- Робертеа. и находятся их решения.
Для формулировки соответствующей теоремы введем следующие обо начения. Положим р — (pt — p-i)¡iy и зададим процесс А* = (A'/)t>o.
= (A't — р i i) jo, который является броуновским движением с единичным оэффициеитом диффузии и коэффициентом сноса, меняющимся в момент со значения 0 на значение (—//). Символом ф = будем обозначать
стандартную) статистику Ширяева-Робертса, построенную по X:
■ф, - exp(-/í.Yí - рЧ/2) (-r + P j() exp(/í-V.4 + (11)
начальным условием x = G(0) и p = (1 — G(Q))/T.
Определим вероятностные меры P^ = PJ: и P'f]. относительно королях процесс ф задается формулой (11) с начальным условием щ = х ¿t 0 и фоцессом Л" являющимся, соответственно стандартным броуновским дви-кением и броуновским движением со сносом а. Сопутствующие математи-¡еские ожидания будем обозначать символами E¿?' и
Теорема. Оптимальными моментами остановки для Vi!l и V'J)Í являются
Т'п = inf{¿ О : 17 ^ a¡!}(/)}, т(*} = inf{¿ ^ 0 : Ф{ > «;„(/)}.
:де a'a){t) и ) — невозрастакпцие непрерывные функции на [0,7''], яв-ъяющиеся единственными решениями уравнении (t € [0, Т))
[' ' E^¡(í) [(//!(1 - ОД) - \р2\фя))1{ф* < оа,и + *)}],/* = 0.
^ Е^тИ'Ы* - ОД) - < + s)}]ds = О
e классе непрерывных функций, удовлетворяющих условиям
aft) ^ — (1 - G(i)) при / € [О,Г), а(Т) = О.
СПИСОК РАБОТ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
[1] Zhitlukhm M. V. A maximal inequality for skew Brownian motion // Statin tics & Decisions. - 2009. — Vol. 27, no. 3. — Pp. 261-280
[2] Житлухин M. В., Муравлёв А. А. Об уравнениях для оптимальны, границ в задаче Чернова различения двух гипотез // Успехи .чатема гпических наук. - 2011. - Т. 66, X« 5. — С. 183-184
[3] Житлухин М. В., Муравлёв А. А. О задаче Чернова проверки гнпотег-о значении сноса броуновского движения // Теория вероятностей и е< применены. — 2012. — Т. 57, № 4. — С. 778-788
|4] Житлухгт М. В.. Ширяев А. Н. Байесовские задачи о разладке ш фильтрованных вероятностных пространствах // Теория- вероятиостсг и ее применения. - 2012. — Т. 57, № 3. — С. 453-470
[5] Житлухин М. В.. Ширяев А. Н. Задачи об оптимальной остановке до* броуновского движения с разладкой на отрезке // Теория вероятностей и. ее применения. — 2013. — Т. 58, Xй 1
[6] Житлухин М. В.. Муравлёв А. А., Ширяев А. Н. Оптимальное решающее правило в задаче Кифера-Вейса для броуновского движения // Успехи математических наук. — 2013. — Т. 68. Л'* 2. — С. 201-202
Подписано в печать 13.0С.2013 Тираж 100 экз.
Отпечатало в Математическом институте им. В. Л. Сгеклова РАН Москва, 119991. ул. Губкина, 8
Российская академия наук Математический институт им. В. А. Стеклова
04201361518
На правах рукописи УДК 519.21
Житлухин Михаил Валентинович
ПОСЛЕДОВАТЕЛЬНЫЕ МЕТОДЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ И ОБНАРУЖЕНИЯ РАЗЛАДКИ
01.01.05 — теория вероятностей и математическая статистика
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель — академик РАН, профессор А.Н. Ширяев
Москва, 2013 г.
Оглавление
Введение 3
Глава 1. Оптимальная остановка марковских процессов 14
§1.1. Основные определения из теории марковских процессов..............14
§ 1.2. Постановка задачи об оптимальной остановке марковского
процесса. Существование решения............................................................17
§ 1.3. Задачи с функционалами Майера и Лагранжа..................................23
§ 1.4. Интегральные уравнения для границ множеств остановки..........26
Глава 2. Задачи последовательной проверки гипотез 38
§2.1. Стохастические системы с неизвестными параметрами..................38
§ 2.2. Задача Чернова..................................................................................................39
§ 2.3. Задача Кифера-Вейса....................................................................................50
Глава 3. Задачи скорейшего обнаружения разладки 62
§3.1. Стохастические системы с разладкой......................................................62
§ 3.2. Сведение к задачам об оптимальной остановке для статистики Ширяева-Робертса....................................................................................66
§ 3.3. Обнаружение разладки броуновского движения на отрезке________71
§ 3.4. Оптимальная остановка броуновского движения и геометрического броуновского движения с разладкой на отрезке................80
Приложение. Вспомогательные результаты стохастического
анализа 87
§ П.1. Формула Ито с локальным временем на кривых..............................87
§ П.2. Совместное распределение геометрического броуновского движения и его интеграла....................................................................................89
§ П.З. Неравенства для броуновского движения..............................................90
Список обозначений 92
Список литературы 93
Введение
1. Диссертация посвящена исследованиям в двух взаимосвязанных разделах статистического последовательного анализа — последовательной проверке гипотез и скорейшему обнаружению "разладки".
Активное изучение последовательных методов математической статистики началось в 1940-50-х гг. В отличие от классических методов, где объем выборки заранее фиксирован, характерной особенностью последовательных методов является возможность выбирать момент прекращения наблюдений (объем выборки) в зависимости от наблюдаемых данных. Такая возможность во многих случаях обеспечивает выигрыш в среднем числе наблюдений по сравнению с методами с фиксированным объемом выборки при одинаковой вероятности ошибочных решений.
Первая группа задач, рассматриваемых в диссертации, относится к вопросам проверки гипотез о вероятностных характеристиках случайных процессов по результатам последовательного наблюдения за ними. Вторую группу задач составляют вопросы последовательного обнаружения моментов изменения вероятностных характеристик случайных процессов (моментов "разладки"). Совместное исследование двух данных групп задач обусловлено, прежде всего, схожестью методов их решений, основанных на сведении к задачам об оптимальной остановке для марковских процессов. В связи с этим существенную часть работы (первую главу) составляют вспомогательные результаты из теории оптимальной остановки, представляющие ценность и сами по себе.
В работе преимущественно применяется байесовский подход, предполагающий, что ненаблюдаемые параметры являются случайными величинами с известными функциями распределения. Существует также вариационный подход, который не предполагает наличия дополнительной априорной информации. Отметим, что эти два подхода тесно связаны, и в них применяются сходные вероятностно-статистические методы.
2. Математически рассматриваемые задачи формулируются следующим образом. В байесовской задаче о последовательной проверке гипотез предполагается, что на некотором вероятностном пространстве (П, Р) задана ненаблюдаемая случайная величина \х с известной функцией распределения и наблюдаемый случайный процесс X = (Х^^о (или случайная последовательность X = (Хп)п^о), для которого известны условные распределения Р" = Ьаду(Х \ ц = и). Таким образом, ¡1 влияет на структуру X, и, наблюдая за X, можно делать предположения об истинном значении /л.
Рассматриваемая задача заключается в проверке гипотез Щ: /л € М^, г = 1,..., М, по последовательному наблюдению за X, где М* сМ - некоторые фиксированные непересекающиеся множества. Каждая последовательная процедура проверки гипотез задается с помощью решающего правила (т, с/), состоящего из момента остановки г фильтрации ¥х = ¿Р* = а(Х3; в ^ ¿), и с^^-измеримой функции принимающей значения 1,..., АГ (или любые другие N различных значений). Момент т соответствует моменту прекращения наблюдения, а значение функции (1 соответствует принимаемой гипотезе в момент т. При этом "хорошие" решающие правила должны обладать как малым временем наблюдения, так и низкой частотой ошибочных решений.
Основополагающим результатом теории последовательной проверки гипотез является хорошо известный последовательный критерий отношения вероятностей, предложенный А. Вальдом [46] для задачи проверки двух простых гипотез Н\: ¡1 = и Н^'. ц = Ц2- Вводя процесс логарифмического отношения правдоподобия Z = где1
«др-1 ё<*(р»
критерий заключается в том, что следует останавливать наблюдения и принимать гипотезу #2, когда значение Zt становится меньше некоторого уровня А, и гипотезу Н\, когда значение становится больше некоторого уров-
1 Предполагается, что вероятностные меры РМ1 и РМ2 локально эквивалентны, т.е. для каждого
£ ^ О сужения мер Р''1 | и РА'2 | эквивалентны; тогда процесс 2 корректно определен.
ня В (А < В). Уровни А и В выбираются исходя из требований к среднему времени наблюдения Ет и к вероятностям ошибочных решений ("принять гипотезу Hi при справедливости Н^ и наоборот). Отметим, что обращение именно к логарифму отношения правдоподобия объясняется, прежде всего, его удобными свойствами аддитивности.
В работе [43] для случая наблюдения последовательности независимых одинаково распределенных случайных величин А. Вальд и Дж. Волфовиц доказали оптимальность данного критерия в вариационной постановке, показав, что он обладает наименьшим средним временем наблюдения как при справедливости Н\, так и при справедливости #2, среди всех последовательных критериев с такими же вероятностями ошибочных решений. Доказательство основывается на рассмотрении вспомогательной байесовской задачи проверки гипотез.
А. Н. Ширяев в работе [62] доказал оптимальность критерия Вальда в задаче проверки двух простых гипотез о значении коэффициента сноса броуновского движения как в байесовской, так и в вариационной постановке. Общий результат был получен А. Ирле и Н. Шмитцом в работе [21], доказавшими оптимальность критерия Вальда в случае "непрерывного времени", когда процесс Z имеет стационарные независимые приращения.
Рассмотрим подробнее байесовскую задачу проверки двух простых гипотез для броуновского движения. Пусть на вероятностном пространстве (Q, J^", Р) задан наблюдаемый процесс X = (Xt)t^o, имеющий структуру
Xt = fit + Bt,
где В = (Bt)t>0 — стандартное броуновское движение на (Q, ¿Р, Р), а ц — случайная величина на (Q, Р), не зависящая от В и принимающая два значения /¿i и Ц2 с известными вероятностями р и 1 — р. Слагаемое fit можно интерпретировать как полезный сигнал, а слагаемое Bt — как шум. Считается, что ¿х непосредственно не наблюдаема, а наблюдателю доступна лишь информация, задаваемая фильтрацией F*.
Известный байесовский критерий (см., например, [62, 63]) заключается в нахождении оптимального решающего правила (т*,с£*), минимизирующего в классе всех решающих правил (т, d) среднюю величину риска
7£(т, (Г): состоящую из штрафа за продолжительность наблюдения и штрафа за ошибочное решение:
Щт, с£) = сЕт + пР(д. = 1, ц = /х2) + г2Р(^ = 2, у, =
где с > 0 — "стоимость" единицы времени наблюдения, а г1,г2 > 0 — штрафы за неверные решения.
Без ограничения общности можно считать, что /¿1 > 0, [12 = (иначе достаточно перейти к процессу = — + д2)£/2) и ё, принимает значения ±1. Тогда оптимальное решающее правило имеет вид (см. [62, 63])
г* = ы{г ^ 0 : Я* г (Л, Б)}, сГ = 86п(ят.),
где А < 0 < 5 — константы, определяемые как решения некоторой системы алгебраических уравнений и зависящие от с, ¿¿1,7*1, г2; процесс логарифмического отношения правдоподобия имеет вид Z% =
Задача решается путем сведения к задаче об оптимальной остановке. Вводится процесс апостериорных вероятностей тт = (тг^г^о, гДе
щ = = }1\ |
При этом щ = е^/((1 — р)/р + е2*), и процесс тг удовлетворяет стохастическому дифференциальному уравнению
¿Щ = 2^17Г4(1 - щ)(1Ви 7Г0 = р,
где В = — некоторое броуновское движение, согласованное с филь-
трацией В частности, 7Г является марковским процессом.
Далее устанавливается, что для любого решающего правила справедливо неравенство
7£(т, 6) ^ Е ¡ст + тт{г1(1 — 7гТ), г27гт}],
причем равенство достигается, если (1 = +1 при 7^(1 — ттт) ^ г27гт и д, = —1 при гх(1 — 7гг) > г27гт. Тогда для нахождения оптимального решающего правила нужно найти т*, минимизирующий математическое ожидание в
предыдущей формуле, и задать сГ так, чтобы достигалось равенство.
Применяя общую теорию об оптимальной остановке марковских процессов, доказывается, что т* является моментом первого выхода 7г из некоторого интервала (Л', В') С (0,1) или, что то же самое, моментом первого выхода Z из интервала (А, В), где А = \og{A'/{1 — А')) — \og{p/(l — р)), В = \og(B'/(l — В')) — \og{p/{l — р)). Система уравнений, решениями которой являются А и В, находится из рассмотрения задачи со свободной границей для инфинитезимального оператора процесса Z.
Рассмотренная задача представляет собой простейшую модель броуновского движения с неизвестным коэффициентом сноса. Часто, однако, возникает необходимость обращения к более сложным случаям, нежели чем когда ¡1 принимает лишь два значения. В работе будут изучены две такие задачи, где не было известно точного решения (были известны лишь асимптотически оптимальные решения).
Первая задача была сформулирована и исследована в работах Г. Чернова и Дж. Брейквелла [8-11]. Предполагается, что наблюдается броуновское движение с неизвестным сносом /х, являющимся нормальной случайной величиной с известными средним до и дисперсией Од> и требуется проверить гипотезы Н+: ¡1 > 0 и Н_: ¡1 ^ 0. В качестве показателя оптимальности решающего правила (г, ¿) берется средняя величина риска, состоящая из штрафа за продолжительность наблюдения и штрафа за ошибочное решение пропорционального \[х\. Таким образом, рассматривается задача о нахождении решающего правила (т*,с1*), минимизирующего величину
где с, к > 0 — фиксированные константы, (1 принимает значения ±1, соответствующие принятию Н+ и Н-, и полагается sgn0 = — 1.
Г. Чернов и Дж. Брейквелл установили, что оптимальное решающее правило (г*, с?*) таково, что т* является моментом первого выхода наблюдаемого процесса X на некоторую криволинейную границу, а сГ является функцией от Хт*. Ими была найдена асимптотика границы (в предположении ее достаточной гладкости) при £ —>• оо и £ —> 0, что в некотором смысле соответствует сто —>■ 0, сто —> оо. Однако явный ее вид найден не был.
В § 2.2 будет доказано, что граница непрерывна, и будет получено интегральное уравнение, однозначно ее характеризующее. Граница будет найдена путем его численного решения.
Вторая задача последовательного различения гипотез, рассматриваемая в диссертации, — задача проверки двух гипотез о значении сноса броуновского движение, где требуется минимизировать максимальное среднее время наблюдения при ограничении на вероятность ошибочного решения. Вопрос подобного типа был поставлен Дж. Кифером и Л. Вейсом [25] в случае дискретного времени, а затем исследовался и другими авторами как в дискретном, так и в непрерывном времени. Причиной рассмотрения такой постановки служит тот факт, что критерий Вальда обладает достаточно большим средним временем наблюдения, если истинное значение параметра не совпадает со значениями в проверяемых гипотезах. Например, в работе [3] было показано, что он может даже уступать критерию с заранее фиксированным объемом выборки. Таким образом, возникает естественное желание найти решающее правило, минимизирующее максимально возможное среднее время наблюдения.
Для броуновского движения данная задача заключается в построении решающего правила (т*, сГ), основанного на наблюдении за процессом Х^, = которое обладает вероятностями ошибочных решений Р(с1 — 1 | д = ¡12) и Р{(1 = 2 | ¡1 = /¿1), не превосходящими заданной величины а, и при этом минимизирующего тахи Е(т | ¡л = и). Данная задача, как и критерий Вальда, дана не в байесовской постановке (здесь — числовой параметр), однако ее решение все равно основывается на сведении к вспомогательной задаче об оптимальной остановке. Будет показано, что оптимальный момент остановки наблюдения т* является моментом выхода наблюдаемого процесса X на некоторую криволинейную границу, а б,* определяется по значению Хт*; для границы будет получено интегральное уравнение, которое будет решено численно. Данный результат дополняет многочисленные имеющиеся в литературе результаты, посвященные изучению асимптотических свойств оптимальных решающих правил (см., например, работы [2, 26, 55], относящиеся к задаче для броуновского движения).
3. Опишем теперь суть задач обнаружения "разладки". Пусть на некотором вероятностном пространстве задан наблюдаемый случайный процесс X = {Хг)т, имеющий структуру
х
где N = (Л^)^о и5 = — некоторые случайные процессы на
(О, Р), а в ^ 0 — неизвестная величина. Процесс 5 интерпретируется как сигнал, а в — как момент его появления (момент "разладки2"). Предполагается, что в непосредственно не наблюдаема, а наблюдатель может судить о значении в лишь по изменениям в структуре процесса X. Задача состоит в обнаружении разладки по результатам последовательного наблюдения за X как можно скорее после того, как она произошла.
Каждая последовательная процедура подачи сигнала о наступлении разладки отождествляется с моментом остановки т фильтрации ¥х = — о{Х3\8 ^ ¿). При этом "хорошие" моменты подачи сигнала должны быть как можно более близкими к моменту разладки 9.
Активное исследование задач обнаружения разладки началось в 195060-х гг. в работах А. Н. Ширяева, С. Робертса, Э. Пэйджа и др. (см. [32, 33, 39, 58-60]); отметим также метод контрольных карт, предложенный У. Шьюартом в 1920-х гг. [40].
Байесовская постановка задачи обнаружения разладки была предложена в работе А. Н. Ширяева [60] для процесса броуновского движения и формулируется следующим образом. Пусть на вероятностном пространстве (О, Р) задан случайный процесс X = (Х^^о со структурой
Хг = - в)+ + Ви
где В = (В^^о — стандартное броуновское движение на ^,Р), 6 — экспоненциально распределенная случайная величина с известным пара-
2Термин "разладка" происходит из применений данной теории в вопросах контроля качества продукции, где момент в интерпретируется как сбой (разладка) оборудования. Процесс N соответствует доле брака в готовой продукции при нормальном режиме работы, а процесс 5 — дополнительной доле брака после сбоя.
метром Л, и ¡1 ^ 0 — известная константа. В обозначениях выше, Л^ = Ви
= (* - Оу.
Критерий качества обнаружения разладки заключается в нахождении оптимального момента остановки т* фильтрации ¥х, минимизирующего среднюю величину риска 7£(т), состоящего из штрафа за ложную тревогу и штрафа за запаздывание:
Щт) = гР(т < в) + сЕ(т - $)+,
где г > 0 — штраф за ложную тревогу, а с > 0 — штраф за единицу времени запаздывания. Без ограничения общности считают г — 1, что и будет предполагаться далее.
Задача нахождения г* решается путем сведения ее к задаче об оптимальной остановке для процесса апостериорных вероятностей 7Г = (71^)^0, 7Г4 = Р(0 ^ £ | А именно, момент т* может быть найден как миними-
зирующий математическое ожидание (см., например, [60, 63])
Е
1 — 7ГТ + с / 7Г3(1з
Jo
Доказывается, что процесс 7г удовлетворяет стохастическому дифференциальному уравнению
<1щ = Л(1 - щ)(Ы + - 7Гь)(1Вь
с броуновским движением В = (В)^о, согласованным с фильтрацией ¥х. В частности, 7Г является марковским процессом, и, используя общие результаты марковской теории об оптимальной остановке, устанавливается, что оптимальный момент т* имеет вид
т* = ы{г ^ 0 : щ ^ А},
где А е (0,1) — константа, зависящая от Л и с, которая однозначно характеризуется как решение некоторого алгебраического уравнения.
В третьей главе диссертации будут рассмотрены более сложные модели стохастических систем с разладкой. Сначала в §3.1 будет сформулирована
общая постановка байесовской задачи о разладке на фильтрованном вероятностном пространстве, частным случаем которой являются задачи о разладке случайных процессов и случайных