О задачах управления процессом наблюдения по неполным данным тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Джамбурия, Леван Гивиевич
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Тбилиси
МЕСТО ЗАЩИТЫ
|
||||
1984
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
ВВЕДЕНИЕ.
ГЛАВА I, ЗАДАЧА О РАЗЛАДКЕ ВИНЕРОВСКОГО ПРОЦЕССА ПРИ
НАЛИЧИИ ПЛАТЫ ЗА НАБЛЮДЕНИЯ . •
§ I. Вспомогательные результаты
§ 2. Постановка задачи и формулировка основной теоремы
§ 3* Задача Стефана.
§ Уравнение Беллмана.
§ 5. Доказательство основной теоремы
ГЛАВА П. ЗАДАЧА ПОИСКА
§ I. Постановка задачи
§ 2. Задача Стефана
§ 3. Задача Стефана (продолкение)
§ 4, Уравнение Беллмана
§ "5. Исследование производных и формула Ито
§ б. Основная теорема
ГЛАВА Ш. ЗАДАЧА О РАЗЛАДКЕ ПРИ НАЛИЧИИ ПЛАТЫ ЗА НАБЛЮДЕНИЯ. ДИСКРЕТНОЕ ВРЕМЯ
§ I. Постановка задачи и основная теорема
§ 2. Некоторые вспомогательные предложения и рекуррентные соотношения. III
§ 3. Доказательство основной теоремы
I. В настоящей диссертации рассматриваются две задачи статистического последовательного анализа - задача о разладке и задача последовательного различения двух гипотез. Эти задачи рассматривались многими авторами в различных постановках (см. [I] -М и указанную в них литературу). Как обычно, они сводились к задаче оптимальной остановки некоторого марковского процесса. Из общей теории оптимальной остановки марковских процессов, развитой в [I] , следует существование оптимального момента остановки в задачах о разладке и последовательном различении двух гипотез. В случае непрерывного времени находится также явное выражение для функции риска.
Предложенная в диссертации байесовская постановка этих задач отличается от обычных постановок тем, что наблюдению подлежит некоторый управляемый процесс. В связи с этим, кроме нахождения оптимального момента остановки, возникает проблема построения и оптимальной (или £ -оптимальной) стратегии. Рассмотрение управляемого наблюдаемого процесса в задаче о разладке обусловлено введением платы за наблюдение (в указанных выше работах рассматривался случай бесплатных наблюдений). В аналогичной постановке задача о разладке рассматривалась в [73 (в случае непрерывного времени). Основной результат этой работы заключается в определении структуры оптимальной стратегии при условии, что она существует. Отметим, однако, что рассуждения носят эвристический характер.
Задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или по другому, задача поиска, впервые была рассмотрена в [5] . В работе С8Ц были продолжены исследования, начатые в И . В [8] исследуются функции',* определяющие границы в оптимальном правиле, по достижении которых следует прекращать наблюдение. Однако, в этих работах не было дано доказательство существования оптимального или £- оптимального правила. В работах [9] , [10] рассматривалась задача последовательного различения \ь гипотез в случае управляемого наблюдаемого процесса для некоторого узкого класса стратегий. Аналогичным задачам посвящены также работы [II] , [12] .
2т В настоящей диссертации задача о разладке в случае управляемого наблюдаемого процесса рассматривается как для не-х прерывного, так и для дискретного времени, В случае непрерыв^ ного времени предлагается следующая постановка задачи.
На вероятностном пространстве ( Вт) заданы стандартный винеровский процесс \А/= (\А4,Зч) и независимая от него 9о -измеримая случайная величина 0 такая, что
9-о)=зс, &(е^1е>ок~н ьо, \>о,
Наблюдению подлежит процесс где и ^ег - отличные от нуля константы, процесс о(.=. принимает два значения - 0 и I и таков, что уравнение (I) имеет единственное сильное решение. Про^ цесс называется стратегией и множество всех стратегий обозначается через Я/С . обозначает множество всех конечных марковских моментов относительно потока б~ -алгебр
Пара называется решающим правилом. Функция риска имеет следующий вид:
ЗЧ-тгЫ^ [ (^(<с<0) +сМ*»лахОс-0,о)+ Г
С>0, ч/ где Нг(т<9) - вероятность ложной тревоги, М^-ЖсОС^-б,о) - среднее время запаздывания в обнаружении момента разладки и Изг^0^^ - среднее время, за которое проводились наблюдения при использовании стратегии (сх^
Основной отличительной чертой этой постановки является то, что из-за наличия платы за наблюденш |) кроме нахождения оптимального момента остановки, надо найти и оптимальную стратегию, т.е. определить, в какие промежутки времени следует проводить наблюдения.
В случае дискретного времени предполагается, что на вероятностном пространстве 3) 1^-) заданы действительные случайные величины • такие, что
0=о)=эг, В(0=»О=(4-зг)(4-рГр, О^Н О^И, х<,. х0=к)=х, 10= к). £ 0=к)= Р°( V х^ • - Ли«хкн) Хк, • ■., , ки, где Р и Р - вероятностные меры на
Рассматривается последовательность случайных величин такая, что для кашдого У\л\ О гаи 4 и ^
- измерима, где -ДМ, М4, = ■ г- и 1 -)
С обозначает ^ в степени ¿к )• Последовательность £ = , -) называется стратегией. Множество всех стратегий обозначается через Л . Через обозначается множество всех конечных марковских моментов относительно потока <э-алгебр Пара Д=(сьт;) называется решающим правилом* Функция риска имеет вид: г рдг(е>т)+сМ^хМ1о)+
А тьМ? г
Задача заключается в построении оптимальных или £ -оптимальных решающих правил, а в случае непрерывного времени и в нахождении явного выражения для функции риска •
3. Задача последовательного различения двух гипотез рассматривается в диссертации в следующей постановке.
На вероятностном пространстве (-П-> 3") (3^ Р) заданы винеровский процесс и Эъ - измеримая случайная величина 0 такая, что
Р(0=о)=зг., Ш"*. Р(9=2)=^. ад-яки- (г)
Надо различить гипотезы Н : 0 - О и Н • 0+0 по наблюдениям за процессом * Г* Г = \0Ы(ем)+ М1(9 + ^ , (3) где процесс Ы.=. (оц,, принимает два значения .0 и
I и таков, что уравнение (3) имеет единственное сильное решение. Процесс оС называется стратегией. Мнoseство веек стратегий обозначается IX • Через Xt обозначается мнокество всех конечных марковских моментов относительно потока б -алгебр Пусть I - <£* - измеримая случайная величина, принимающая значения 0 и I и пусть
Различая гипотезы Н и Н » надо минимизировать величину м ст+ vm
00
Тройка , удовлетворяющая условию (2), однозначно определяет пару чисел (х^ч) , где Х= , Ч- — о Ж0 0 ЦГо и обратно. При решении этой задачи, удобно приписывать мере Р индекс и рассматривать выражение (4), как функцию от • Задача заключается в нахождении явного выражения для функции риска где - решающее правило, и построении оптимального решающего правила.
Этой задаче можно дать следующую интерпретацию. Некоторая цель может появиться на одном из двух направлений (0Н или 0-2,) . Есть возможность наблюдать в кавиый момент времени "Ь одно из этих двух направлений (выбрать сК^-0 или I). Зада ча заключается в оптимальном выборе стратегии оС-(в какой момент времени,какое направление следует наблюдать), в оптимальном выборе момента прекращения наблюдений (выбор ТбХС*) и в оптимальном выборе заключительного решения -есть цель на каком-нибудь из двух направлений ( не различая, на каком именно) или она отсутствует (выбор случайной величины ¿Ь )•
При решении задачи последовательного различения двух гипотез и задачи о разладке в случае непрерывного времени применяется следующий традиционный метод ( см. [I] , [13] ). Решается некоторая задача Стефана, а потом доказывается, что полученное решение совпадает с функцией риска. Затем, с использованием этого факта, строятся оптимальные и Е,- оптимальные решающие правила. Задача о разладке в случае дискретного времени решается с использованием общих результатов теории оптимальной остановки и планирования эксперимента, полученных в [14] .
4. Настоящая диссертация состоит из трех глав. В первой главе рассматривается задача о разладке винеровского процесса при наличии платы за наблюдения. В первом параграфе этой главы приведены некоторые вспомогательные результаты. В частности^ лемме I доказывается один частный случай формулы Ито, не являющийся следствием обобщенной формулы Ито из [15] . Заметим, что доказываемую в лемме I формулу можно также получить из формулы Ито для выпуклых функций [16] .
В § 2 приводится постановка задачи. Там же показывается, что функцию риска рфг) можно представить в следующем ввде
-А) <5) г Д
9€к)=Ч Ч ^ Я^Ччи-ЬК'*)' окй-сеД* 0 • где 113^*) • Процесс удовлетворяет уравнению ГА 0- +^ ^ , (б) где
Таким образом; поставленная задача приводится к задаче оптимальной остановки управляемого процесса (6) с функцией риска (5). ч \
В § 3 рассматриваются две задачи Стефана, при с,< —а
1 \ ' 1 &<зг (А+с) и при Функции -1(5Т) и Ч>03Г) , являющиеся реше^
Хе (д+с) ^ и киями этих йадач, являются дважды непрерывно дифференцируемыми функциями в кавдой точке интервала £0»О за исключением одной точки,в которой вторая производная этих функций не существует. Этим фактом и вырожденностью диффузии процесса (б) и вызвано применение леммы I из § I при использовании формулы И то для функций и .
В § 4 доказано, что функции и ^Сл) удовлетворяют уравнению
1тл к во всех точках интервала [0,1] , в которых существуют вторые производные этих функций. Это уравнение, на самом деле, есть уравнение Беллмана для задачи оптимальной остановки управляемого процесса (6) с функцией риска (5).
В последнем параграфе (§ 5) доказывается основная теорема главы I (теорема I), Из этой теоремы следует, что функция риска ^ею совпадает с функцией ^(5Г) , в случае г \ и с функцией Ч>СЮ ,в случае - . При этом су
J 1 &Г(Х+сГ щественно используется тот факт, что функции -^СГ) и удовлетворяют уравнению (7). В случае са-¿к^-— доказывается существование оптимального решающего правила Д*-(оС;Т ) и устанавливается» что при
0, ЬО)
И т*- 0 при ос е [-А- ,
В случае с, » СТеВ) доказывается, что для любого ¿>о существует натуральное число п , зависящее только от Ь и иг , такое, что решающее правило д&- (о^
О, эг*'*ь где ([и/Ц - целая часть 1гЬ ), А- — а к. 1 у с а В есть единственное решение уравнения и^-АЫ Л[НМ-Н(А)] . 1 й^-и)1 С ^ относительно 9Т в интервале (А,1) » является £ ь-оптималь* ным (константыС;С^Л и функция Н определены при формулировке теоремы I).
Если 9ге[В)/1] , то О является оптимальным моментом остановки.
В главе П рассматривается задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или, по другому, задача поиска. В первом параграфе приводится постановка задачи. Там не показывается,что для любой стратегии ск и момента остановки £Т: существует оптимальное заключительное решение С^^ • С использованием этого факта, функция риска преобразуется к следующему виду получена система стохастических дифференциальных уравнений: х:=Х| с«
Таким образом, поставленная задача сводится к задаче оптимальной остановки двумерного управляемого процесса (Х^У*); определяемого системой (9), с функцией риска (8). Заметим, что движение точки (Х-^Уь ) носит вырожденный характер - оно может происходить только по вертикали или горизонтали.
Метод решения этой задачи аналогичен методу, который применялся в главе I. Второй и третий параграфы главы П посвящены решению задачи Стефана.
В § Ч доказывается, что функция ^(х,^) , являющаяся решением задачи Стефана, удовлетворяет уравнению г .х
Уъ
1% ку^&ч^т^^ в тех точках (х,^) £ [о,+а>)х[р,+оо) , в которых существуют вторые производные функции • Входящая в это уравнение функция определяется следующим образом
-0 (Ю)
-гЛ- )
В § 5 устанавливается, что функция -^(Х)^-) имеет непрерывные производные второго порядка всех ввдов в каждой точке за исключением тех точек, которые принадлежат кривым, определенным системой (2.18) и дифференциальным уравнением (3.10). Доказывается, что производные функции -^(Л^) ограничены во всей области + . С использованием этих фактов выводится формула Ито, аналогичная формуле, полученной в лемме I главы I. При выводе этой формулы используется тот факт, что если в некоторой области ( с границей, удовлетворяющей некоторым условиям гладкости) задана некоторая дважды непрерывно дифференцируемая функция, то
- 13 её можно продолжить на всю плоскость таким образом, что полученная функция токе будет дважды непрерывно дифференцируемой ( см., например, [17] ,с.595).
В § б, пользуясь формулой Ито и равенством (10), доказывается, что функция риска совпадает с функцией ^(х^) доказывается также, что если (множества % и определяются в § 4 ), то для любого £.>о существует натуральное число Уь , зависящее только от ь и точки (х,^) , такое, что решающее правило Д1^- сС) , где сГ- т является 8, -оптимальным. Если (Х,^е[о,+оо)х[о/+оо)\( Д ' То решающее правило Д-Сс^оЛ, где Т-0 и с1-Т / является оптимальным.
В третьей главе рассматривается задача о разладке при наличии платы за наблюдения в случае дискретного времени. Метод решения, применяемый в этой главе, отличен от метода, применяемого в главах I и П и заключается в приведении поставленной задачи к виду, удобному для использования результатов из [14] • В этом же параграфе приводится постановка задачи и формулируется основная теорема,
В § 2 вводится понятие контрольной случайной величины, которая является, в некотором смысле, эквивалентной понятию решающего правила и приводится несколько вспомогательных предложен ний из [14] • В этом псе параграфе, с помощью формулы Байеса, выводятся рекуррентные соотношения для апостериорных вероятностей наличия момента разладки, аналогичные соотношениям, используемым в [I] . В конце параграфа доказываются две леммы вспомогательного характера.
Третий параграф посвящен доказательству основной теоремы (теорема I). В начале этого параграфа в теореме 5 устанавливается взаимно-однозначное соответствие между множеством всех контрольных случайных величин и множеством всех решающих правил. С помощью этой же теоремы доказывается, что вопрос существования оптимального решающего правила можно свести к вопросу существования контрольной случайной величины "Ь такой, что где процесс 2. определяется при доказательстве теоремы I. С использованием результатов из [14] доказывается существование оптимальной контрольной случайной величины, откуда следует существование оптимального решающего правила Устанавливается, что где ^ - некоторая постоянная из интервала СОД] , множества Го и Г^ определяются в
§ 1г
В каждой главе диссертации используется своя нумерация формул, теорем и лемм. Ссылка на данную формулу внутри главы делается без указаний, а на формулу другой главы - с указанием этой главы.
По материалам диссертации автором опубликованы работы [18]-[20] .
Работа выполнена под руководством А.Н.Ширяева, которому автор выражает искреннюю благодарность за постановку задачи и постоянное внимание к работе.
1. Ширяев А.Н. Статистический последовательный анализ.- М.: Наука, 1976.
2. Ширяев А#Н. Задача скорейшего обнаружения нарушения стационарного режима,- ДАН СССР, 138, 5(1961), 1039-1042.
3. Bather J.А., On a Quickest Detection Problem, Ann.Math.Statist.38, 3 (1967), 711-724.
4. Гальчук Л,И., Розовский Б.Л. Задача о "разладке" пуассонов-ского процесса»- Теор. вероятн. и её примен., ХУ1, 4(1971).
5. Ширяев А«Н. К теории решающих функций и управлению процессом наблюдения по неполным данным,- Tran. Third PragueConference on Information Theory, Statistical Decision Functions, Random Processes, Prague, 1964, 657-681.
6. Михалевич B.C., Байэсовський виб1р Mia двумя цпотезами про середне значения нормального процесу.- В1сник Ки1всько-го Ун1верситету, I, 1(1958), I0I-I04.
7. Balmer D.V/., On a Quickest Detection Problem With Costly1.formation, Journal of Applied Probability, 12(1975),87-97.
8. Липцер Р.Ш., Ширяев А.Н. Об одной байесовской задаче последовательного поиска в диффузионной аппроксимации.- Теор. вероятн. и её примен., X, 1(1965).
9. Зигангиров K.ffi. Задача поиска в системе с конечным числом позиций.- Радиотехника и электроника, 8, 1(1963),16.23.
10. Зигангиров К.1. Одна задача.оптимального сканирования." Теор. вероятн. и.её примен., 2(1966).
11. Крылов H.B. Управляемые процессы диффузионного типа.- М.:Наука, 1977.
12. Wgttig А.Т. Generalized Ito's Formula and Additive Junctionals of Brovraian Motions, Z.WarhscheinlichkeitstheorieVerw. Gebiete, 1977, 41, 153-159.
13. Фихтенгольц Г.M. Курс дифференциального и интегрального исчисления, т.1, М.: Наука, 1969.
14. Джамбурия Л,Г. Об одном обобщении яадачи о разладке.« № общ. АН ГССР, 110, 1(1983).
15. Джамбурия Л.Г. Задача о разладке для винеровского процесса при наличии платы за наблюдения.- Успехи мат.наук, 39, 1(235), 1984.
16. Джамбурия Л.Г. Задача об обнаружении цели.- Тезисы докладов ХУШ школы-коллоквиума по теории вероятностей и математической статистике. Тбилиси: Тбилисский государственныйуниверситет, 1984.
17. Meyer P.A., Un cours sur les integrales stochastiques, tecture Notes in Mathematics, 511(1974/1975), 245-400.
18. Смирнов В.И. Курс высшей математики, т.Ш, ч.1, М.: Наука,1974.
19. Гихман И.И., Скороход А.В. Теория случайных процессов, т.1, М.: Наука, 1971.
20. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов.-М.: Наука, 1974.
21. Понтрягин Л.С. Обыкновенные дифференциальные уравнения.-М.: Наука, 1965.