О задачах управления процессом наблюдения по неполным данным тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Джамбурия, Леван Гивиевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Тбилиси МЕСТО ЗАЩИТЫ
1984 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «О задачах управления процессом наблюдения по неполным данным»
 
 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Джамбурия, Леван Гивиевич

ВВЕДЕНИЕ.

ГЛАВА I, ЗАДАЧА О РАЗЛАДКЕ ВИНЕРОВСКОГО ПРОЦЕССА ПРИ

НАЛИЧИИ ПЛАТЫ ЗА НАБЛЮДЕНИЯ . •

§ I. Вспомогательные результаты

§ 2. Постановка задачи и формулировка основной теоремы

§ 3* Задача Стефана.

§ Уравнение Беллмана.

§ 5. Доказательство основной теоремы

ГЛАВА П. ЗАДАЧА ПОИСКА

§ I. Постановка задачи

§ 2. Задача Стефана

§ 3. Задача Стефана (продолкение)

§ 4, Уравнение Беллмана

§ "5. Исследование производных и формула Ито

§ б. Основная теорема

ГЛАВА Ш. ЗАДАЧА О РАЗЛАДКЕ ПРИ НАЛИЧИИ ПЛАТЫ ЗА НАБЛЮДЕНИЯ. ДИСКРЕТНОЕ ВРЕМЯ

§ I. Постановка задачи и основная теорема

§ 2. Некоторые вспомогательные предложения и рекуррентные соотношения. III

§ 3. Доказательство основной теоремы

 
Введение диссертация по математике, на тему "О задачах управления процессом наблюдения по неполным данным"

I. В настоящей диссертации рассматриваются две задачи статистического последовательного анализа - задача о разладке и задача последовательного различения двух гипотез. Эти задачи рассматривались многими авторами в различных постановках (см. [I] -М и указанную в них литературу). Как обычно, они сводились к задаче оптимальной остановки некоторого марковского процесса. Из общей теории оптимальной остановки марковских процессов, развитой в [I] , следует существование оптимального момента остановки в задачах о разладке и последовательном различении двух гипотез. В случае непрерывного времени находится также явное выражение для функции риска.

Предложенная в диссертации байесовская постановка этих задач отличается от обычных постановок тем, что наблюдению подлежит некоторый управляемый процесс. В связи с этим, кроме нахождения оптимального момента остановки, возникает проблема построения и оптимальной (или £ -оптимальной) стратегии. Рассмотрение управляемого наблюдаемого процесса в задаче о разладке обусловлено введением платы за наблюдение (в указанных выше работах рассматривался случай бесплатных наблюдений). В аналогичной постановке задача о разладке рассматривалась в [73 (в случае непрерывного времени). Основной результат этой работы заключается в определении структуры оптимальной стратегии при условии, что она существует. Отметим, однако, что рассуждения носят эвристический характер.

Задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или по другому, задача поиска, впервые была рассмотрена в [5] . В работе С8Ц были продолжены исследования, начатые в И . В [8] исследуются функции',* определяющие границы в оптимальном правиле, по достижении которых следует прекращать наблюдение. Однако, в этих работах не было дано доказательство существования оптимального или £- оптимального правила. В работах [9] , [10] рассматривалась задача последовательного различения \ь гипотез в случае управляемого наблюдаемого процесса для некоторого узкого класса стратегий. Аналогичным задачам посвящены также работы [II] , [12] .

2т В настоящей диссертации задача о разладке в случае управляемого наблюдаемого процесса рассматривается как для не-х прерывного, так и для дискретного времени, В случае непрерыв^ ного времени предлагается следующая постановка задачи.

На вероятностном пространстве ( Вт) заданы стандартный винеровский процесс \А/= (\А4,Зч) и независимая от него 9о -измеримая случайная величина 0 такая, что

9-о)=зс, &(е^1е>ок~н ьо, \>о,

Наблюдению подлежит процесс где и ^ег - отличные от нуля константы, процесс о(.=. принимает два значения - 0 и I и таков, что уравнение (I) имеет единственное сильное решение. Про^ цесс называется стратегией и множество всех стратегий обозначается через Я/С . обозначает множество всех конечных марковских моментов относительно потока б~ -алгебр

Пара называется решающим правилом. Функция риска имеет следующий вид:

ЗЧ-тгЫ^ [ (^(<с<0) +сМ*»лахОс-0,о)+ Г

С>0, ч/ где Нг(т<9) - вероятность ложной тревоги, М^-ЖсОС^-б,о) - среднее время запаздывания в обнаружении момента разладки и Изг^0^^ - среднее время, за которое проводились наблюдения при использовании стратегии (сх^

Основной отличительной чертой этой постановки является то, что из-за наличия платы за наблюденш |) кроме нахождения оптимального момента остановки, надо найти и оптимальную стратегию, т.е. определить, в какие промежутки времени следует проводить наблюдения.

В случае дискретного времени предполагается, что на вероятностном пространстве 3) 1^-) заданы действительные случайные величины • такие, что

0=о)=эг, В(0=»О=(4-зг)(4-рГр, О^Н О^И, х<,. х0=к)=х, 10= к). £ 0=к)= Р°( V х^ • - Ли«хкн) Хк, • ■., , ки, где Р и Р - вероятностные меры на

Рассматривается последовательность случайных величин такая, что для кашдого У\л\ О гаи 4 и ^

- измерима, где -ДМ, М4, = ■ г- и 1 -)

С обозначает ^ в степени ¿к )• Последовательность £ = , -) называется стратегией. Множество всех стратегий обозначается через Л . Через обозначается множество всех конечных марковских моментов относительно потока <э-алгебр Пара Д=(сьт;) называется решающим правилом* Функция риска имеет вид: г рдг(е>т)+сМ^хМ1о)+

А тьМ? г

Задача заключается в построении оптимальных или £ -оптимальных решающих правил, а в случае непрерывного времени и в нахождении явного выражения для функции риска •

3. Задача последовательного различения двух гипотез рассматривается в диссертации в следующей постановке.

На вероятностном пространстве (-П-> 3") (3^ Р) заданы винеровский процесс и Эъ - измеримая случайная величина 0 такая, что

Р(0=о)=зг., Ш"*. Р(9=2)=^. ад-яки- (г)

Надо различить гипотезы Н : 0 - О и Н • 0+0 по наблюдениям за процессом * Г* Г = \0Ы(ем)+ М1(9 + ^ , (3) где процесс Ы.=. (оц,, принимает два значения .0 и

I и таков, что уравнение (3) имеет единственное сильное решение. Процесс оС называется стратегией. Мнoseство веек стратегий обозначается IX • Через Xt обозначается мнокество всех конечных марковских моментов относительно потока б -алгебр Пусть I - <£* - измеримая случайная величина, принимающая значения 0 и I и пусть

Различая гипотезы Н и Н » надо минимизировать величину м ст+ vm

00

Тройка , удовлетворяющая условию (2), однозначно определяет пару чисел (х^ч) , где Х= , Ч- — о Ж0 0 ЦГо и обратно. При решении этой задачи, удобно приписывать мере Р индекс и рассматривать выражение (4), как функцию от • Задача заключается в нахождении явного выражения для функции риска где - решающее правило, и построении оптимального решающего правила.

Этой задаче можно дать следующую интерпретацию. Некоторая цель может появиться на одном из двух направлений (0Н или 0-2,) . Есть возможность наблюдать в кавиый момент времени "Ь одно из этих двух направлений (выбрать сК^-0 или I). Зада ча заключается в оптимальном выборе стратегии оС-(в какой момент времени,какое направление следует наблюдать), в оптимальном выборе момента прекращения наблюдений (выбор ТбХС*) и в оптимальном выборе заключительного решения -есть цель на каком-нибудь из двух направлений ( не различая, на каком именно) или она отсутствует (выбор случайной величины ¿Ь )•

При решении задачи последовательного различения двух гипотез и задачи о разладке в случае непрерывного времени применяется следующий традиционный метод ( см. [I] , [13] ). Решается некоторая задача Стефана, а потом доказывается, что полученное решение совпадает с функцией риска. Затем, с использованием этого факта, строятся оптимальные и Е,- оптимальные решающие правила. Задача о разладке в случае дискретного времени решается с использованием общих результатов теории оптимальной остановки и планирования эксперимента, полученных в [14] .

4. Настоящая диссертация состоит из трех глав. В первой главе рассматривается задача о разладке винеровского процесса при наличии платы за наблюдения. В первом параграфе этой главы приведены некоторые вспомогательные результаты. В частности^ лемме I доказывается один частный случай формулы Ито, не являющийся следствием обобщенной формулы Ито из [15] . Заметим, что доказываемую в лемме I формулу можно также получить из формулы Ито для выпуклых функций [16] .

В § 2 приводится постановка задачи. Там же показывается, что функцию риска рфг) можно представить в следующем ввде

-А) <5) г Д

9€к)=Ч Ч ^ Я^Ччи-ЬК'*)' окй-сеД* 0 • где 113^*) • Процесс удовлетворяет уравнению ГА 0- +^ ^ , (б) где

Таким образом; поставленная задача приводится к задаче оптимальной остановки управляемого процесса (6) с функцией риска (5). ч \

В § 3 рассматриваются две задачи Стефана, при с,< —а

1 \ ' 1 &<зг (А+с) и при Функции -1(5Т) и Ч>03Г) , являющиеся реше^

Хе (д+с) ^ и киями этих йадач, являются дважды непрерывно дифференцируемыми функциями в кавдой точке интервала £0»О за исключением одной точки,в которой вторая производная этих функций не существует. Этим фактом и вырожденностью диффузии процесса (б) и вызвано применение леммы I из § I при использовании формулы И то для функций и .

В § 4 доказано, что функции и ^Сл) удовлетворяют уравнению

1тл к во всех точках интервала [0,1] , в которых существуют вторые производные этих функций. Это уравнение, на самом деле, есть уравнение Беллмана для задачи оптимальной остановки управляемого процесса (6) с функцией риска (5).

В последнем параграфе (§ 5) доказывается основная теорема главы I (теорема I), Из этой теоремы следует, что функция риска ^ею совпадает с функцией ^(5Г) , в случае г \ и с функцией Ч>СЮ ,в случае - . При этом су

J 1 &Г(Х+сГ щественно используется тот факт, что функции -^СГ) и удовлетворяют уравнению (7). В случае са-¿к^-— доказывается существование оптимального решающего правила Д*-(оС;Т ) и устанавливается» что при

0, ЬО)

И т*- 0 при ос е [-А- ,

В случае с, » СТеВ) доказывается, что для любого ¿>о существует натуральное число п , зависящее только от Ь и иг , такое, что решающее правило д&- (о^

О, эг*'*ь где ([и/Ц - целая часть 1гЬ ), А- — а к. 1 у с а В есть единственное решение уравнения и^-АЫ Л[НМ-Н(А)] . 1 й^-и)1 С ^ относительно 9Т в интервале (А,1) » является £ ь-оптималь* ным (константыС;С^Л и функция Н определены при формулировке теоремы I).

Если 9ге[В)/1] , то О является оптимальным моментом остановки.

В главе П рассматривается задача последовательного различения двух гипотез в случае управляемого наблюдаемого процесса, или, по другому, задача поиска. В первом параграфе приводится постановка задачи. Там не показывается,что для любой стратегии ск и момента остановки £Т: существует оптимальное заключительное решение С^^ • С использованием этого факта, функция риска преобразуется к следующему виду получена система стохастических дифференциальных уравнений: х:=Х| с«

Таким образом, поставленная задача сводится к задаче оптимальной остановки двумерного управляемого процесса (Х^У*); определяемого системой (9), с функцией риска (8). Заметим, что движение точки (Х-^Уь ) носит вырожденный характер - оно может происходить только по вертикали или горизонтали.

Метод решения этой задачи аналогичен методу, который применялся в главе I. Второй и третий параграфы главы П посвящены решению задачи Стефана.

В § Ч доказывается, что функция ^(х,^) , являющаяся решением задачи Стефана, удовлетворяет уравнению г .х

Уъ

1% ку^&ч^т^^ в тех точках (х,^) £ [о,+а>)х[р,+оо) , в которых существуют вторые производные функции • Входящая в это уравнение функция определяется следующим образом

-0 (Ю)

-гЛ- )

В § 5 устанавливается, что функция -^(Х)^-) имеет непрерывные производные второго порядка всех ввдов в каждой точке за исключением тех точек, которые принадлежат кривым, определенным системой (2.18) и дифференциальным уравнением (3.10). Доказывается, что производные функции -^(Л^) ограничены во всей области + . С использованием этих фактов выводится формула Ито, аналогичная формуле, полученной в лемме I главы I. При выводе этой формулы используется тот факт, что если в некоторой области ( с границей, удовлетворяющей некоторым условиям гладкости) задана некоторая дважды непрерывно дифференцируемая функция, то

- 13 её можно продолжить на всю плоскость таким образом, что полученная функция токе будет дважды непрерывно дифференцируемой ( см., например, [17] ,с.595).

В § б, пользуясь формулой Ито и равенством (10), доказывается, что функция риска совпадает с функцией ^(х^) доказывается также, что если (множества % и определяются в § 4 ), то для любого £.>о существует натуральное число Уь , зависящее только от ь и точки (х,^) , такое, что решающее правило Д1^- сС) , где сГ- т является 8, -оптимальным. Если (Х,^е[о,+оо)х[о/+оо)\( Д ' То решающее правило Д-Сс^оЛ, где Т-0 и с1-Т / является оптимальным.

В третьей главе рассматривается задача о разладке при наличии платы за наблюдения в случае дискретного времени. Метод решения, применяемый в этой главе, отличен от метода, применяемого в главах I и П и заключается в приведении поставленной задачи к виду, удобному для использования результатов из [14] • В этом же параграфе приводится постановка задачи и формулируется основная теорема,

В § 2 вводится понятие контрольной случайной величины, которая является, в некотором смысле, эквивалентной понятию решающего правила и приводится несколько вспомогательных предложен ний из [14] • В этом псе параграфе, с помощью формулы Байеса, выводятся рекуррентные соотношения для апостериорных вероятностей наличия момента разладки, аналогичные соотношениям, используемым в [I] . В конце параграфа доказываются две леммы вспомогательного характера.

Третий параграф посвящен доказательству основной теоремы (теорема I). В начале этого параграфа в теореме 5 устанавливается взаимно-однозначное соответствие между множеством всех контрольных случайных величин и множеством всех решающих правил. С помощью этой же теоремы доказывается, что вопрос существования оптимального решающего правила можно свести к вопросу существования контрольной случайной величины "Ь такой, что где процесс 2. определяется при доказательстве теоремы I. С использованием результатов из [14] доказывается существование оптимальной контрольной случайной величины, откуда следует существование оптимального решающего правила Устанавливается, что где ^ - некоторая постоянная из интервала СОД] , множества Го и Г^ определяются в

§ 1г

В каждой главе диссертации используется своя нумерация формул, теорем и лемм. Ссылка на данную формулу внутри главы делается без указаний, а на формулу другой главы - с указанием этой главы.

По материалам диссертации автором опубликованы работы [18]-[20] .

Работа выполнена под руководством А.Н.Ширяева, которому автор выражает искреннюю благодарность за постановку задачи и постоянное внимание к работе.

 
Список источников диссертации и автореферата по математике, кандидата физико-математических наук, Джамбурия, Леван Гивиевич, Тбилиси

1. Ширяев А.Н. Статистический последовательный анализ.- М.: Наука, 1976.

2. Ширяев А#Н. Задача скорейшего обнаружения нарушения стационарного режима,- ДАН СССР, 138, 5(1961), 1039-1042.

3. Bather J.А., On a Quickest Detection Problem, Ann.Math.Statist.38, 3 (1967), 711-724.

4. Гальчук Л,И., Розовский Б.Л. Задача о "разладке" пуассонов-ского процесса»- Теор. вероятн. и её примен., ХУ1, 4(1971).

5. Ширяев А«Н. К теории решающих функций и управлению процессом наблюдения по неполным данным,- Tran. Third PragueConference on Information Theory, Statistical Decision Functions, Random Processes, Prague, 1964, 657-681.

6. Михалевич B.C., Байэсовський виб1р Mia двумя цпотезами про середне значения нормального процесу.- В1сник Ки1всько-го Ун1верситету, I, 1(1958), I0I-I04.

7. Balmer D.V/., On a Quickest Detection Problem With Costly1.formation, Journal of Applied Probability, 12(1975),87-97.

8. Липцер Р.Ш., Ширяев А.Н. Об одной байесовской задаче последовательного поиска в диффузионной аппроксимации.- Теор. вероятн. и её примен., X, 1(1965).

9. Зигангиров K.ffi. Задача поиска в системе с конечным числом позиций.- Радиотехника и электроника, 8, 1(1963),16.23.

10. Зигангиров К.1. Одна задача.оптимального сканирования." Теор. вероятн. и.её примен., 2(1966).

11. Крылов H.B. Управляемые процессы диффузионного типа.- М.:Наука, 1977.

12. Wgttig А.Т. Generalized Ito's Formula and Additive Junctionals of Brovraian Motions, Z.WarhscheinlichkeitstheorieVerw. Gebiete, 1977, 41, 153-159.

13. Фихтенгольц Г.M. Курс дифференциального и интегрального исчисления, т.1, М.: Наука, 1969.

14. Джамбурия Л,Г. Об одном обобщении яадачи о разладке.« № общ. АН ГССР, 110, 1(1983).

15. Джамбурия Л.Г. Задача о разладке для винеровского процесса при наличии платы за наблюдения.- Успехи мат.наук, 39, 1(235), 1984.

16. Джамбурия Л.Г. Задача об обнаружении цели.- Тезисы докладов ХУШ школы-коллоквиума по теории вероятностей и математической статистике. Тбилиси: Тбилисский государственныйуниверситет, 1984.

17. Meyer P.A., Un cours sur les integrales stochastiques, tecture Notes in Mathematics, 511(1974/1975), 245-400.

18. Смирнов В.И. Курс высшей математики, т.Ш, ч.1, М.: Наука,1974.

19. Гихман И.И., Скороход А.В. Теория случайных процессов, т.1, М.: Наука, 1971.

20. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов.-М.: Наука, 1974.

21. Понтрягин Л.С. Обыкновенные дифференциальные уравнения.-М.: Наука, 1965.