Гарантированное оценивание статистически неопределенных систем и задачи коррекции движения тема автореферата и диссертации по механике, 01.02.01 ВАК РФ

Ананьев, Борис Иванович АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Свердловск МЕСТО ЗАЩИТЫ
1990 ГОД ЗАЩИТЫ
   
01.02.01 КОД ВАК РФ
Автореферат по механике на тему «Гарантированное оценивание статистически неопределенных систем и задачи коррекции движения»
 
Автореферат диссертации на тему "Гарантированное оценивание статистически неопределенных систем и задачи коррекции движения"

АКАДЕМИЯ НАУК СССР УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ

На правах рукописи АНАНЬЕВ Борис Иванович

ГАРАНТИРОВАННОЕ ОЦЕНИВАНИЕ СТАТИСТИЧЕСКИ НЕОПРЕДЕЛЕННЫХ СИСТЕМ И ЗАДАЧИ КОРРЕКЦИИ ДВИЖЕНИЯ

Специальность 01.02.01 -, теоретическая механика

Автореферат .

диссертации на соискание ученой степени доктора физико-математических наук

Свердловск 1990

Работа выполнена в отделе оптимального управления Института математики и механики Уральского отделения АН СССР

Официальные оппоненты: академик АН УССР, доктор физико-математических Наук, профессор Ю.Ы.ЕРМОЛЬЕВ;

доктор физико-математических наук, профессор И.Я.КАЦ;

доктор физико-математических наук, профессор В.Б.КОЛМАНОВСКИЙ

Ведущая организация - Институт проблем управлет-

(автоматики и телемеханики) АН СССР (г.Москва)

Зшцита состоится "_"_1990 г. в_час.

на заседании специализированного совета Д 002.07.01 по защите диссертаций на соискание ученой степени доктора наук при Институте математики и механики Уральского отделения АН СССР по адресу: 620066, г.Свердловск, ул.С.Ковалевской, 16.

С диссертацией можно ознакомиться в библиотеке Института математики и механики Уральского отделения АН СССР.

Автореферат разослан "__ 1990 г.

Учений секретарь

специализированного совета к.ф.-м.н.. с.н.с.

М.И.Г^гсей

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Работа посвящена исследовании задач оценивания и управления для динамических статистически неопределенных систем, подверженных случайным возмущениям, одновременно неопределенным как в первых, так и во вторых моментах или распределениях. Разработка способов решения данных задач приобретает особое значение при изучении таких проблем управления по неполньм данным, когда неизвестные параметры следует оценивать по ходу процесса в реальном масштабе времени.

Систематическая постановка задач оценивания впервые дана в работах А.Н.Колмогорова, Н.Винера и К.Шеннона. Дальнейшее развитие она получила в исследованиях Р.Е.Калмана и Р.Бьюси. -Указанный круг вопросов обнаружил тесные связи с теорией синтеза управляемых систем и теорией дифференциальных игр, основы которых были развиты в трудах Н.Н.Красовского и Л.С.Понтрягина. Исследования в рассматриваемой области прикладной математики и механики стимулируются обилием приложений и запросами практики. Статистически неопределенные ситуации при управлении и оценивании естественно возникают, например, в задачах инерциальной навигации, при обработке изображений по данным случайных измерений, при передаче сообщений по каналам связи и во многих других задачах техники и экономики.

В работах школы Н.Н.Красовского систематически развивались теория и методы решения задач управления и наблхщения в условиях конфликта и неопределенности. Соответствующие подходы были глубоко разработаны А.Б.Куржанским применительно к задачам оценивания и управления по неполньм данным, С.С,Осиповны для проблем теории дифференциальных игр в распределенных системах и совместно с А.В.Кряжимским - для задач восстановления неизвестных входов динамической системы, а также А.И.Субботиньм - для теории дифференциальных игр в обыкновенных нелинейных системах. В работах указанных авторов неопределенные возмущения трактуется обычно как детерминированные. Информация о них ограничена, как правило, заданием априорных множеств, которым принадлежат эти возмущения. Наряду с упомянутым широко используется вероятностный подход к задачам управления и оценивания в работах

И.И.Гихмана, А.В.Скорохода, Ю.М.Ермольева, В.Б.Колмановского, Н.В.Крылова, Р.Ш.Липцера, В.С.Пугачева, Б.Т.Поляка, В.Н.Фомина, Я.З.Цыпкина, Ф.Л.Черноусько, А.Н.Ширяева, В.А.Якубовича, Р.Беллмана, А.Бенсуссана, М.X.А.Дениса, Т.Кайлата, Г.Дж.Кушне-ра, В.М.Уонема, У.Флемминга, Р.Ркшела.

Исследование статистически неопределенных задач оценивания и управления методами теории игр начато в пятидесятых-на-чале шестидесяти годов в работах Дк.Л.Джексона, Л.Х.Зеттер -берга, Н.Дж.Нильсона, П.Дк.Хьюбера, Д.Е.Джохансена, а также в исследованиях советских авторов М.Л.Лидова, В.М.Александрова, Д.С.Иргера и в ряде работ других математиков и механиков. Вце раньше минимаксный подход к задачам статистики и последовательного анализа активно разрабатывался А.Вальдом, В начале семидесятых годов были опубликованы работы И.Я.Каца и A.B. Куржанского о двойственности задач управления и наблюдения, где, в частности, рассматривалась и статистически неопределенная ситуация при оценивании неизвестного параметра. Впоследствии ими были разработаны методы рекуррентной фильтрации, для статистически неопределенных многошаговых систем. Упомянутые методы получили развитие в дальнейших работах И.Я.Каца. По исследуемой проблемр следует также отметить реботы И.Н.Белогла-зова, И.А.Богуславского, Б.Н.Бублика, Г.А.Голубева, А.И.Кибзу-на, В.В.Малышева, Н.Ф.Кириченко, В.П.Кузнецова, А.Г.Наконечного, В.Г.Репина, Б.Н.Пшеничного, В.Г.Покотило, Г.П.Тартаковскоп П.Е.Эльясберга, М.Минца, С.А.'йассама, М.Морриса, К.Дк.Мартина, Д.П.Луза, Х.В.Пура. Подход П.Дк.Хьюбера получил интенсивное развитие в исследованиях Я.З.Цыпкина и Б.Т.Поляка.

Сказанное выше позволяет заключить, что проблема оценивал и управления для статистически неопределенных систем привлекла внимание многих исследователей. Вместе с тем, повышение точное ти и быстродействия алгоритмов оценивания и управления в широ ко распространенной на практике статистически неопределенной ситуации заставляет искать новые или совершенствовать уже изве стнгч подходы к рассматриваемой проблеме. Причем проделанная работа в указанном направлении еще далека от своего окончатель ного завершения. Таким образом, тематика исследования представ ляется актуальной как с теоретической,так и прикладной точек зрен.:я.

Цель работы. Целью работы является разработка, обоснование и дальнейшее развитие точных и приближенных методов оценивания для статистически неопределенных систем, направленное на повышение точности оценивания по среднеквадратичному критерию от рассогласования при одновременном расширении класса возможных неопределенностей в объекте наблюдения и канале измерения, а также разработка эффективных методов определения стратегий корректирования движения управляемых систем, функционирующих в условиях статистической неопределенности. Упомянутые вопросы рассматриваются в диссертации для объектоз маблидения и управления, которые описываются либо линейными диффеРекДиальнши уравнениями Кто, либо разностными уравнениями, как линейными, так и нелинейными.

Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории управления и наблюдения в условиях неопределенности, систематически развиваемой А.Б. Куржанским и его учениками. Активно используются понятия и результаты классической теории игр, математической статистики, статистической теории фильтрации Р.Калмана и Р.Еыоси, выпуклого и многозначного анализа, теории меры, функционального ана -лиза, детерминированной и статистической теории управления, теории случайных процессов.

На.учкая новизна.Полученные я диссертации результаты являются нов»®. Среди них отметим следующие.

. I. Для линейных статистически неопределенных систем с непрерывным временем поставлены и решены минимаксные задачи фильтрации, интерполяции и прогнозирования в классе линейных по сигналу оценок. В случае совместных интегральных квадратичных ограничений на первые моменты возмущений и при проиэзоль -«ых компактных ограничениях на неизвестные вторые моменты по -лучены определяющие соотношения в форме стохастических дкффе -ренциальных уравнений для операторов в пространстве матриц, ' 'подходящей размерности.

2. Установлено, что предложенная схема оценивания охватывает как случаи детерминированного минимаксного оценивания, тал и статистического оценивания при известных моментах возмущений. 'Предложен способ аппроксимации точного решения задачи' оценивания с .раздельными интегральными или геометрическими огракнчен«-

ями на первые моменты возмущений с помощью решений задачи при совместных интегральных ограничениях.

3. Изучены асимптотические свойства минимаксных оптимальных оценок текущего состояния линейной статистически неопределенной системы при совместных квадратичных ограничениях на первые моменты возмущений. Найдены условия сходимости оптимальных минимаксных оценок и ошибки минимаксного оценивания к их установившиеся значениям при стремлении интервала наблюдения к бе-снсчечнос?и.

4. Для линейных многошаговых статистически неопределенных систем поставлена и решена задача фильтрации с помощью линей -них по сигналу оценок. В случае совместных суммарных квадратичных ограничений на первые моменты возмущений, а также при неопределенных вторы?; моментах и неизвестной точно динамике системы получены рекуррентные определяющие уравнения для операторов в пространстве матриц, подходящей размерности. Предложены процедуры аппроксимации точного решения задачи оцениввнияс геометрическими ограничениями на первые моменты возмущений с помощью решений задачи при суммарных квадратичных ограничениях.

5. Предложена постановка задачи минимаксного оценивания текущего состояния нелинейной многошаговой статистически неопределенной системы, включающая частные случаи - линейно-гаус-совские и детерминированные системы с неопределенными параметрами. Выделен класс допустимых нелинейных по сигналу оценок. При определенных предположениях о случайных возмущениях в системе доказаттеорема существования седловой точки целевого функционала в виде среднего от квадрата нормы рассогласования

и получены необходимые условия оптимальности для оценки фазового вектора. Установлены условия невырожденности, при которых указанные необходимые условия оптимальности становятся достато-чнши и точное оптимальное решение можно аппроксимировать последовательностью решений конечномерных задач; указан способ такой аппроксимации;

6. Поставлены и решены задачи коррекции движения для линейных статистически неопределенных систем, в которых неопределенными являются только первые^ моменты возмущений, подчиненные геометрическим включениям. Получено необходимое условие

оптимальности в виде принципа минимума. Установлено, что задача коррекции, состоящая в синтезе марковского момента перехода к управлению по доступной информации, может бить сведена к минимаксной проблеме выбора оптимального момента остановки случайного процесса (последоватачьности) с неопределенным средним.

7. Рассмотрено приложение ряда разработанных в диссертации методов к задаче выставки гироплатформы на подвижном основании в двухступенчатой транспортной системе корабль-самолет. Проведено численное моделирование некоторых минимаксных алгоритмов оценивания и коррекции движения.

Теоретическая и практическая ценность. Для линейных статистически неопределенных динамических систем, описываемых дифференциальной уравнениями '/¡то или разностными уравнениями, с неполной информацией разработан единый подход к решению минимаксных задач оценивания по минимуму среднеквадратичного критерия от рассогласования, подход, который в случае полной статистики возмущений приводит к известньм результатам теории стохастической фильтрации, а в случае отсутствия статистики - ' к известны« результатам теории гарантированного детермлниро -ванного оценивания. Выделены случаи, когда получаемые алгоритмы оценивания имеют рекуррентную структуру, что позволяет использовать их на практике для получения оценок в темно реального времен/.. Для нелинейных многоиаговых статистически неопределенных систем предложена новая постановка задачи оценивания в духе А.Вальда, причем указана процедура конечномерной аппроксимации точного решения. Установлена принципиальная возмож -ность улучшения качества минимаксного оценивания за счет вибо-ра класса допусткмьт оценок. Предлагаемы"« подход, применимый к частным случаям - линейно-гауссовск;™ и детерминированнш системам с неопределенными параметрами, позволяет учитывать разработанные приближенные методы определения условного среднего при нехождении оптимальных минимаксных оценок.

Отмечена интерпретация минимаксных методов оценивания как процедур регуляризации некорректных задач и на примерах показано, что применение указанных методов дает существенное улучшение сходимости оценок на бесконечности и позволяет создать ус-

тойчивый (робастный) алгоритм фильтрации.

Исследованы минимаксные задачи коррекции движения статистически неопределенных линейных систем с неполной информацией, для которых неопределенными являются только первые моменты возмущений. Особенностью изученных задач является разделенность процессов управления и наблюдения по времени, причем предполагается, что наблюдение предшествует управлению. С помощью аппарата выпуклого анализа получены определяющие соотношения,позволяющие ^¿фектквно находить решение задачи. Установлено, что синтез марковского момента перехода к управлению сводится л ми-' нимаксной проблеме выбора оптимального момента остановки случайного процесса с неопределенным средним, что позволяет использовать известные результаты И.И.Гихыана и А.В.Скорохода, Н.В.Крылова, А.Н.Ширяева для окончательного решения задачи синтеза.

Практическое значение результатов работы подтверждается успешным их применением для решения задачи выставки гироплат-формы на подвижном основании в двухступенчатой транспортной системе корабль-самолет. Кроме того, ряд результатов работы использовался в отчотах по прикладным темам, которые разрабатывались в Институте математики и механики УрО АН СССР.

Апробация работы. Результаты, составляющие содержание работы, обсуждались на всесоюзных и международных конференциях, школах, совещаниях, семинарах. Они докладывались на 5 Всесоюзном совещании по статистическим методам в системах управления (Алма-Ата, 1981), на Всесоюзных конференциях по управлению в механических системах (Москва, 1932; Казань, 1985), на б съезде по теоретической и прикладной механике (Ташкент, 1936), на 12 Всесоюзной математической школе по теории управления и исследованию операций (Ижевск, 1939), на международной конференции "Стохастическая оптимизация" (Киев, 1984), на международной конференции по динамике машин (Франкфурт-на-Одере, ГДР, 1985), на 2 симпозиуме К5АК по стохастическому управлению (Вильнюс, 1936), на семинаре академика АН УССР Ю.М.Ермольева в Институте кибернетики АН УССР, на семинаре кафедры кибернетики Московского института электронного машиностроения, на семинаре члена-корреспондента АН СССР Я.З.Цыпкмна в Институте проблем управления АН СССР, неоднократно излагались на семинаре, руководимом

членом-корреспондентом АН СССР А.Б.Куржанским в Институте математики и механики УрО АН СССР.

Публикации. По теме диссертации опубликовано 20 работ. Основные результаты диссертации содержатся в 15 работах, список которых приводится в конце автореферата.

Структура и объем работы. Диссертация состоит из введения, четырех глав, разбит!« на параграфы, которые, в свою очередь, разделяются на пункты, заключения, приложения и списка литературы. Объем диссертации составляет 268 страниц маши -нописного текста. Библиография состоит из 106 наименований. В основной текст включено 9 рисунков и £ таблицы.

СОДЕРЖАНИЕ РАБОТ f

Введение содержит мотивацию выбора темы исследования, обоснование ее актуальности, описание некоторых подходов к решению задач управления и оценивания в условиях неопределенности. Кроме того, объясняется понятие статистически неопределенной системы с непрерывным и дискретным временем, указываются предпосылки для изучения такого рода систем, а также дается краткий обзор основных результатов диссертации.

Первая глава состоит из 5 параграфов и посвящена изучению задач оц^.мвания для линейных динамических систем, описываемых стохастическими дифференциальньми ypaBHCHMflvn Uto, при наличии неопределенных первых и вторых моментов случайных возмущений в самой системе и канале наблюдения. Постановки задач данной главы отличаются от рассмотренных ранее радом усложняющих факторов: наличием неопределенностей как в первых, Так и во вторых моментах случайных возмущений; отсутствием ограничений на выбор весовой функции линейной операции наблюдения,* векторным характером оцениваемого параметра; подробные рассмотрением случаев совместных и раздельных интегральных квадратичных ограничений на первые моменты йоэмущениЙ при произвольных компактных ограничениях на вторые моменты. Основные результаты этой главы состоят в выводе и обосновании эволюционных уравнений, решения которых в конечный момент времени используются для построения оптимальной минимаксной оценки состояния сис-

темы. Параметры указанных уравнений определяются заранее путем решения надлежащих ¿экстремальных задач для систем уравнений типа Риккати. Наряду с этим выделены случаи, когда оптимальные минимаксные оценки в каждый момент времени могут быть найдены из решения некоторого эволюционного дифференциального уравнения, т.е. имеют "рекуррентный" характер.

В § 1.1 дан обзор известных результатов по гарантированному оценивании состояний статистически неопределенных систем с помощью линейных по сигналу оценок. Такого рода процедурам посвящено наибольшее количество работ в данной области. ^ сматрисаются задачи оценивания как для непрерывных, так и для многошаговых систем. Приведены примеры, показывающие неустойчивость классических методов оценивания по отношению к малому изменении параметров системы. Обзор не охватывает всей сферы применения игрового подхода к задачам оценивания. Отобраны лишь некоторые работы советских и зарубежных авторов, из числа уже упоминавшихся вше, которые наиболее близки по методам и характеру полученных результатов к тому, что изучалось автором настоящей диссертации.

В § 1.2 дается постановка задачи фильтрации для системы*

оЬх =■ (Аос +-Втг)сЦ + <Г4 оЦ ,

х<*,) = бузе. +К.х, , (1<2Л)

= ( Сое +

= о , Ь е С ,Т} .

Здесь 6 Я ; Д, В , С .0" известные непре-

рывные матричные функции времени, К, - известная матрица. Случайные процессы £ , с ортогональными приращениями

и нулевыми средними значениями предполагаются стандартными и не обязательно гауссовскими. Случайный вектор Х>0 с нулевым средним и единичной матрицей ковариаций и процессы У^Ь,

взаимно нокоррелированы моду собой. Заранее неизвестные ве!

торные и матричные функции и начальные параметры в уравнения — _

Формулы и утверждения далее нумеруются в соответствии с текстом диссертации.

(I.2.1) стеснены априорными ограничениями

( x.,tf(->,n;on = z&Z ,

m (1.2.3)

( (T»,g;(-), со) = д € 2),

где шюжество 2- выпукло, замкнуто и ограничено, а множество 5) удовлетворяет некоторш техническим требованиям, обеспе -чкваквдим, й частности, невырожденность шума в канале измерения. Набор параметров Z характеризует неопределенность в первых моментах случайных возмущений, а параметры Л - во вторых моментта.

Для данного момента времени рассматривается масс всех линейных оценок вида

t __ Jit) = ] + fCi) , (1.2.5)

и требуется в указанном классе решить лпдэчу

зыр Е iiiVxd) - $чЪ(!?- — ишг « £.41) . М ftt) • (1.2.6)

Здесь и далее Е - знак математического ожидания, Is! - некоторая d* (г -матрица. Задача (1.2.6) сводятся к минимаксной проблеме управления для системы

d&d,v)/dt *=-&ct,t)A ,

t 6 £t,,t] , Gd.b-N. {I>2>7)

В случае отсутствия «формации о параметре Хв к условии на правом конце добавляется условие на левом :

G(t(t.)K. яо. a.2.i7)

Далее выделяются случаи, когда можно продвинуться в решении указанной проблемы управления для системы (Т.2.7). Предполагается, что первое из включений (1.2.3) имеет вид

г е Я « I г ! х/Г.х, + ] си'^и- +

''о

+ и'Г^г^)с1« £ 1 } ,

_ (1.2.18) где » 1=0,1,1, - симметрические положительно определенные матрицы, знак ' означает транспонирование. Данные ограничения могут быть заданы непосредственно до процесса оцени -вания, либо строиться наблюдателем как аппроксимации "

ограничений на неопределенные первые моменты случайных ^ щений. Для дальнейшего определим множества

Ф » сону { у = сР„,^СО.Я(О) : д сЗ) } , (1.2.11)

V = СОНУ { * : V - а' , \\И\ -1 1 , (1.2.22)

где Р„ = ^„С/, С^-б"^', II-II - евкдлидова

норма, С-ОЩ/ - операция овыпукления. Замыкание в формуле (1.2.11) берется в подходящих функциональных пространствах. Наложенные ранее условия на множество 3) обеспечивают слабую* компактность множества (1.2.11).

Один из основных результатов {1.2 формулируется следующим образом.

Теорема 1.2.3. Реиением задачи (1.2.6) при ограничениях (1.2.18), (1.2.3) является оценка

= > (1-2.33)

определяемая через оператор в пространстве матриц V" , слу-ющий решением эволюционного уравнения

с1 V « 7/-СД + (¿у'(*) -

- ичС'&Ц)^)>Х , = о , (1.2.35)

где

% = (Яви+н^г'оссв&'р,

(1.2.36)

Параметры соотношений (Г.2.33)-(1.2.36), содержащиеся

в множествах (1.2.11), (1.2.22) соответственна, определяются из решения экстремальной задачи

— тал = е2(1) . (1.2.37)

Здесь ^ (и) - оператор, подчиняющийся дифференциальному уравнению типа Риккати, в которое также входят неопределенные параметры У , ^ ; - единичная матрица размерности с(, .

В приведен^« выше соотношениях используются понятия тензорного произведения матриц, трактуемого как оператор

с« ВЛУА' УМ,

и скалярного произведения матриц, определяемого по формуле

(Л,В)

где Ъь - операция взятия следа матрицы. _

При отсутствии информации о параметре , когда первое слагаемое в формуле (1.2.18) отсутствует, справедливо утверждение.

Теорема 1.2.7. Пусть однородная система (1.2.1) вполне наблюдаема на любом отрезке 1Ьб,Ь] и КвКо>'0 .Тогда решение задачи (1.2.6) имеет вид

$\1) = Т/^ЫУ, (1.2.67)

где - оператор, удовлетворяющий при X. & 1;д

для V <Г>£) уравнению (1.2.35), в котором оператор (Р заменен на б и параметры > ^ - экстремальные элементы в задаче

У,*

Оператор а c-t) при Z •5't.0 + 0 для удовлетворяет

уравнению Риккати с начальным условием, заданным для "t = t0+S\

Отступление от начального момента Ь0 на величину 8 для начальных условий эволюционных определяющих соотношений объясняется соотношением

lim 5 (i) = 00 ,

выполняющимся при отсутствии информации о параметре ОС Л . Для операторов + , при ¿Г;»0 даны формулы

для их нахождения.

В § 1.3 рассматриваются вопросы редукции размерности определяющих соотношений при ограничениях типа (1.2.18? 'я-мика оптимальных оценок. Более подробно изучается решь. дачи (1.2.6) для некоторых частных случаев ограничений (I.ü.3) на неопределенные параметры. Приведены примеры. Основной результат об уменьшении размерности формулируется в виде утверждения.

Теорема 1.3.2. Пусть оценивается скалярная величина

Nxd) td = l

) и/или параметры Z - О . Тогда имеем

TU) -P(t)»IA , Ш) - Vil)*h .

Решением задачи (1.2.6) служит оценка

f(i) «tfVci), (1.3.2)

определяемая через вектор V , служащий решением эволюционного уравнения

cLV= AVctt + К (etyct) - 1У1г) ,

Vcb = о, (I*3-a

где

К =РС '(H+R)-1.

(1.3.6)

Параметр У в данных соотношениях определяется из решения экстремальной задачи

bttfPd)N' -FHCWC - £ad) . (1.3.7)

У 14

Здесь г(Ь) - матричное решение уравнения Риккаги, зависящее от неопределенного параметра У .

Точно так же редуцируются и соотношения в теореме 1.2.7 при отсутствии информации о параметре С10

Для вывода эволюционных уравнений, описывающих динамику оптимальных оценок, в работе принимается предположение 1.3.1, сводящееся к требованию существования такого элемента

у*=(РГ,(зЧ л*->> &<р, а.з.20)

который является наибольшим в смысле естественного частичного порядка в пространстве матриц. Здесь предполагается, что

х/(А-В)х >,о Ух.

В том случае, когда указанный наибольший элемент (1.3,20) существует, отпадает необходимость решать экстремальную задачу (1.3.7),и оптимальная оценка будет определяться из соотношений (1.3.2)-(1.3.6) при У^У*. В работе указаны конкретные пример! ограничений по 4 . Для которых предположение 1.3.1 выполняется.

Отметим, что в скалярном случае Соб — ^ ^ и при отсутствии неопределенностей во вторых моментах возмущений близкие ре -зультаты получены А.Г.Наконечным, а при условии X.- О для систем с постоянными коэффициентами минимаксные фильтры типа (1.3.5) получены американскими математиками Д.П.Луэом и Х.В. Пуром. Таким образом, теорема 1.3.2 обобщает ранее известные результаты. Более того, предположим, что ограничения (1.2.3) и (1.2.18) подчиняются требованию

(1.3.18)

п.в. * € и0,Тз .

Тогда уравнения (1.3.2)-(1.3.6) позволяют единообразно описать решение статистически неопределенных задач фильтрации с охватом крайних случаев: чисто детерминированного минимаксного оценивания и статистического оценивания при известных моментах возмущений. В первом случае выведенные уравнения совпадают с уравнениями для центров эллипсоидов, совместимых с измеренном

сигналом, полученными ранее А.Б.Куржанским, а во втором они переходят в известные уравнения фильтрации Калмана-Бьюси.

Далее рассматривается решение задачи фильтрации при раздельных ограничениях

Т

X. ¿1,1 ; исЦ 6 I ,

т Ч (1.3.34)

] ы'у^ыи ± 1

на первые моменты и при произвольных ограничениях (1.2.3) на вторые моменты. Установлено, что точное решение задачи может быть аппроксимировано по критерию последовательностью 4

задач при совместных ограничениях, мажорирующих (1.3.3ч,, бором двух скалярных параметров.

Отмечено, что в случае геометрических ограничений

осееХв,. шЪеУ, гл1) ,

где ограничивающие множества суть выпуклые компакты, для скалярного оцениваемого параметра можно также критериально аппроксимировать точное решение с помощью решений задач при совместных квадратичных ограничениях, используя метод А.Б.Куржанского, изложенный в его монографии "Управление и наблюдение в условиях неопределенности"(1977 г.).

§ 1.4 посвящен построению интерполирующих и прогнозирующих минимаксных фильтров. Для данного момента Ь рассматривается класс всех линейных оценок вида

(1.4.1)

и требуется в указанном классе решить задачу '

(1.4.2)

В случае Ь & получаем задачу интерполяции или сглажива-

ния, а при £ > - задачу прогнозирования. Если , то

задача сводится к ранее изученной.

Решение поставленной проблемы (1.4.2) можно описать следующим образом. При.ограничениях (1.2.3), '1.2.18) оптимальная минимаксная оценка имеет вид

Г'сО) » 1(1.4.23)

где оператор ' для заданных элементов У,«/' опреде-

ляется из решения системы обратных (по £ ) или прямых (по ) эволюционных уравнений. Полную систему этих уравнений здесь не приводим ввиду ее громоздкости. Параметры V • лежащие в множествах (1.2.11), (1.2.12), в соотношении (1.4.23) должны быть решением экстремальной задачи

- тал. * (1>4>ав)

г

где для оператора , зависящего от У, ^ , в работе

приведены прямые (по О1 ) и обратные (по £ ) дифференциальные уравнения. Минимаксная ошибка задачи (1.4.2) обладает тем свойством, что

^Л^Л) (1.4.29)

при - ^ « Это неравенство соответствует интуитивному представлению о том, что увеличение промежутка наблюдения ведет к улучшения качества оценивания для данного момента Ь .

Далее в § 1.4 разбирается случай отсутствия информации о параметре X, » а также обсуздаются вопросы уменьшения размерности определяющих соотношений и динамика интерполирующих (прогнозирующих) оптимальных оценок по тому же плану, что в предыдущем параграфе. Вновь отмечено, что при условии типа (1.3.18) в полученных эволюционных соотношениях можно переходить к пределу по параметрам И получить как решение дотармини-ровянной минимаксной задачи интерполяции или Прогнозирования, так и известные статистические интерполирующие и прогнозирующие фильтры.

17

В $ 1.5 рассматриваются асимптотические свойства оптимальных минимаксных оценок текущего состояния при ограничениях (1.2.3), (1.2.18) на неопределенные моменты возмущений. Асимптотические свойства решений для иных постановок задачи статистически неопределенного оценивания изучались И.Я.Кацем, Б.Н. Пшеничным и В.Г.Покотило.

Приведем некоторые неравенства, полученные в данном параграфе, описывахяше свойства решений операторного уравнения Риккати. Пусть - его решение с начальным услови- .

ем ,) - решение обратного уравнения

Риккати, которому удовлетворяет оператор (Р

при !Р0 > 0 . Тогда имеем

ла,1ь) * »ли,о к'ао

МХ) -»Г^М*)

(1.5.15)

равномерно по неопределенным параметрам У, ^ . ЗдесЬ ^ ,

I =1,2,- дифференцируемые функции, обладающие свойством:

^ 51 1 » > 0 } М- и Ж - операторы управляемости и наблюдаемости соответственно, определяемые по формулам

ЛЫ&) * ? сХс^^нОаЬ +

хН,*) , (1.6.1) Лил.) * 1сХ1*&с'*и)'1й9к +

+ И, *+)'*'( С Х(*Л> ) , (1.5.14)

в которых - фундаментальная матрица однородного

уравнения (1.2.1)« Н^ВГ^В' • Предположим, что выполняются следуяцае условия. • „ па

Условие А. Элементы матриц Д , С , Н1 к Ц являются

равномерно существенно ограниченными функциями времени на всей прямой.

Условие Б. Существуют числа Л , $ >0 такие, что

П € ^ ' (1.5.21)

Условия типа (1.5.21) служат аналогом требований равномерной полной наблюдаемости и управляемости в обычной задаче статистической фильтрации. Приведенные визе неравенства (1.5. 9) и (1.5.19) при выполнении условий А, Б позволяют доказать утверждение.

Теорема 1.5.2- Существует предел

йпх <рал,ь.) -3^), (1,5.26)

где £Р(£) - единственное ограниченное решение операторного урарчения Риккати на всей прямой, непрерывно зависящее от параметров ^ | фо) , Я(') , в подходящих метриках.

Далее показывается! что сходимость (1.5.26) имеет экспоненциальный характер, т.е. '

нМДл) -^сМ ^ ¿0(/КРен).

где ^ > 0 , (л)(•) - линейная возрастающая функция. Кроме того, установившийся фильтр вида (1.2.35), (1.2.36), где оператор Т заменяется на {Р , оказывается экспоненциально устойчивым, причем эта устойчивость»как и неравенство (1.5.29)»равномерны по неопределенным параметрам ^ , , ЙО). В работе оп-

ределен вид оптимального установившегося закона наблюдения и найден предел минимаксной ошибки оценивания при стремлении интервала наблюдения к бесконечности. Установлено, что При достаточно большом интервале наблюдения вместо оптимальной минимаксной оценки (1.2.33) можно с тем же успехом использовать установившуюся оценку, поскольку значения минимаксных ошибок йудут отличаться на величину, стремящуюся к нули при увеличения дяи-

ны интервала.

В случае стационарных систем достаточные условия сходимости минимаксных оценок к установившемуся значению существенно ослабляются. С этой целью вводятся понятия детектируе;лости и стабилизируемости для стационарных статистически неопреде -ленных систем. Показано, что выполнение детектируемости и стабилизируемости как раз и доставляет совокупность достаточных условий для обеспечения упомянутой сходимости. В конце параграфа для однородных систем с неопределенностью лишь в начальном состоянии и в уравнении наблюдения приводятся простые условия, обеспечивающие сходимость минимаксной ошибки оценивания к нулю при возрастании интервала наблюдения.

Вторая глава диссертация содержит 5 параграфов, в рых исследуются задачи оценивания состояния многошаговых с-. тистически неопределенных систем. Такого рода системы возникают при конечноразностной аппроксимации непрерывных задач оце -нивания предыдущей главы. Естественным образом такие системы появляются также в тех случаях, когда измеряемые данные поступают не непрерывно, а дискретно, что обычно для технических приложений. Кроме того, многошаговые задачи оценивания имеют самостоятельное значение. В отличие от предыдущей главы рассматриваются как линейные, так и нелинейные многошаговые системы.. Для линейных систем задача решается в классе оценок, линейно зависящих от измеряемого сигнала. Здесь предполагается, что-помимо первых и вторых неопределенных моментов возмущений в сис -теме может быть неопределена и ее переходная, матрица. Задачи . оценивания с неопределенной динамикой изучались американскими математиками М.Минцем и К.Дк.Мартином. Ими предполагалось, что система стационарна и перйые моменты возмущений равны нулю. Обобщение результатов и особенно получение рекуррентных определяющих соотношений составило нетривиальную задачу. Как и в первой главе подробно изучаются суммарные квадратичные ограничения на первые моменты возмущений и возможность критериальной аппроксимации точного решения задачи с геометрическими ограничениями на первые моменты и произвольно ограниченными вторыми моментами с помощью решений задачи при суммарных квадратичных неравенст -вах на первые моменты.

Отметим, что задача фильтрации для линейных статистически неопределенных систем изучалась И.Я.Кацем и А.Б.Куржанским. Постановка задачи, предложенная указанными авторами, обобщается в данной ряботе на нелинейный случай. Укажс также, что построе -нию линейных гарантирующих алгоритмов фильтрации для дискретных систем с конечным числом неопределенных параметров посвящена одна из работ И.Н.Белоглазова.

В настоящей работе предложена новая постановка задачи минимаксного оценивания для нелинейной многошаговой статистически неопределенной системы. Евделен класс допустимых нелинейных оценок (или нерандомизирущих решающих правил в терминологии А.Валь-да). Класс этих оценок оказывается достаточно широким и некомпактным. Поэтому использование общей теории статистических выводов (А.Вальд, Н.Н.Ченцов, А.А.Боровков) здесь не проходит. Примене -ние теоремы о минимаксе, установленный Фань Цзы, позволяет все же доказать существование седловой точки и цены игровой задачи на -блвдения для рассматриваемого случая. Используемый в работе переход от максимума по параметру к максимуму по вероятностным рас -пределениям (смешанным стратегиям) - достаточно стандартный прием в теории оптимизации, теории игр и т.д. Он выглядит в рассматриваемом случае вполне естественно.

В § 2.1 рассматривается вопрос о конечно-разностном представлении стохастических дифференциальных уравнений состояния в слу -чае дискретно поступающих данньяс измерения. Покаэеко, что в ряде случаев стохастические дифференциальные уравнения мотао заменить многошаговыми, не теряя информации на этапе дискретизации. Последнее обстоятельство оказывается ваяньм для решения ряда технических задач. Отметим, что конечно-разностная аппроксимация стохастических уравнений изучалась Ю.М.Ермольевым, Г.Н.Мильштейном и рядом других авторов.

В § 2.2 изучается задача оценивания текущего состояния линейной многошаговой статистически неопределенной системы с помощью линейных по сигналу оценок. Рассматривается система

2t

(2.2.1)

ЯП г-^кП

■ь , • Элементы последовательностей ^ ,

^ представляют собой взаимно некоррелированные случайные векторные величины с нулевыми средними и единичными матрицами ковариаций. Матрицы В^, предполагаются зоданньми, а все остальные параметры системы - неопределенными и лежащими в компактных множествах. Упорядоченный набор неопределенных параметров для данного дискретного момента Ь обозначается символом

, а совокупность всех параметров вплоть до момен-"" череэ . В классе линейных оценок

t __

требуется решить следующую задачу, аналогичную рассмотренным в предыдущей главе,

ИгЛОС. Е ¡¡УУх. - У", (и) II2 м1п = . (2.2.6)

воЬ ^ *

В общем случае решение задачи (2.2.6) сведено к нахождению седловой точки определенного функционала от оценки и вероятностной меры, характеризующей распределение неопределенных параметров. Показано, что можно ограничиться множеством вероятностных мер с конечным носителем, и указано ограничение на число точек в носителе. Полученное оптимальное решение типа (2.2.5) имеет нерекуррентную структуру. Поэтому важное значение приобретает вопрос о рекуррентном представлении оптимального решения или, если это невозможно, о его аппроксимации с помощью рекуррентных фильтров. Пусть векторы , "ЦТ а^Ь&У) в системе (2.2.1) ' стеснены суммарным квадратичным ограничением I

I ( 1Г./Г1 V- + ъг{ Г^ЪГ. ) + 1Г0Т0 V» 4 1 , 1» 1

(2.2.27)

где , Г- заданные симметрические положительно определенные матрицы. Данные ограничения могут аппроксимировать сверху (по включению) реальные ограничения на первые моменты возмущений. Основное результат параграф' сформулирован в следующем утверждении.

Теорема 2.2.3. Решение задачи (2.2.6) при выполнении неравенства (2.2.27) и произвольных компактных ограничениях на другие параметры доставляет сценка

£<«*> = (2.2.43)

где оператор может быть найден путем решения систему

о ( ¿сС — С ОI , ^ =о.

(2.2.44) '

ЛИ /V

Здесь А- , С, - матрицы подходящей размерности; СК; - опера-

Ь I 1-

торный коэффициент усиления, вычисляемый через определенные рекуррентные соотношения; ДГ - матрица вида

М'ыТМ!...! О^э . (2-2-35)

В последней формуле числа ¿1 суть весовые коэффициенты экстремальной меры

Л' = 1 ¿Л , X ¿1 , ¿1 >

«■ = 1 (2.2.34)

характеризующей наихудшее распределение неопределенных парамет -ров; число V = ¿НгЬ + Л ; - единичная мера, сосредоточенная в одной точке. Веса меры (2.2.34) определяются путем решения экстремальной задачи

( /7 таж = ь\ , (2.2.45)

леА

где ^ ^ - решение соответствующего дискретного уравнения Рик-кати, А - множество вероятностных мер вида (2.2.34).

Далее в 5 2.2 по тому же плану, что и в случае непрерывных систем, рассмотрены вопросы редукции размерности определяющих соотношений и динамика оптимальных оценок. Предлоаены способы аппроксимации точного ршсния задачи при геометрических ограничениях на первые моменты возмущений с помощью рекуррентных ре -шений задачи при суммарных квадратичных ограничениях.

Б 5 2.3 последуится задача '2.2.6) в более широком по орав- ' внению с линейным классе допустимых операций для нели-

нейной системы

Я-о" • (2.3.1)

Элементы последовательностей , ^ здесь представляют собой независимые случайные векторные величины с распределениями, которые могут зависеть от параметра ©^ , удовлетворяющего априорному включению

€ > t » (2.3.2)

где - компактное метрическое пространство. Данное пространство может, ь частности, быть совокупностью неопределенных ве -роятностных распределений.

Опишем класс нелинейных допустимых операций. Для каждого фиксированного £ будем опускать нижние индексы в обозначении набора неопределенных параметров 60£ и писать 0 . Для каждого : Ь принимаются следующие

Предположение 2.3.1. I) Существует <з" - конечная мера V на компактном множестве © неопределенных параметров, которая мажорирует вероятностное распределение Р0(сС^) вектора наблюдений. Для плотности Радока-Нккодима справедливо неравенство

с1Р6ир/си рса,б> ^ рси> iv-n.fi.),

(2.3.9)

где функция р С* > интегрируема по мере V .

2) Выполнены неравенства

талс. £ цх.Ца<с<*> , е ъ

II Е 1^,0311 * ( Р - п.в.),

- (2.3.11) где |Д) - интегрируемая с квадратом по мере Р функция. Здесь

¿Рсу) . (2.3.10)

3) Функция плотности рс^б) и условное математическое ожидание вектора непрерывны по в для Р -почти всех

а- •

Задача (2.2.6) решается в классе

Г - (2.3.12)

состоящем из векторных интегрируемых с квадратом по мере Р функций • Для описания основного результата введем

обозначения

К( =* ЕЛ К с ^с), ),

где ЕЛ - усреднение по вероятностной мере, заданной на компакте © . Имеет место

Теорема 2.3.1. При выполнении предположений 2.3.1 решение задачи (2.2.6) эквивалентно нвховденип седловой точки для функционала КСЛА) на множестве Г хД , где Д - сово -купность вероятностных мер. Седловая точка { А* ] су-

ществует, причем оптимальное решение удовлетворяет необходимому условии

Гц) - (Рл- - П.Н.) , (2.3.23)

где ^д(') - байесовская оценка виде

ш =

(NExiE txjy,-]

0 , =0 , (2.3.18)

4.

а вероятностная мера Рл определяется равенством

dPAtty) =* ЕЛр(у.,-)с6Уф . (?" тг?)

В общем случае условие (2.3.23) лишь необходимо, но окстремальная мера А невыроадена в том смысле, что меры У " -Рл" эквивалентны, то упомянутое условие также и достаточно для оптимальности. В частности-, условие невырожденности всегда выполняется, ссли >0 ( Р - п.в.). При условии невы-

рожденности оптимальная оценка определяется единственньм обра -эом ( VYlOcL р ). Остальная часть § 2.3 посвящена вопросам конечномерной аппроксимации задачи и некотором частным случаям. А именно, доказано, что при условиях невырожденности можно аппроксимировать точное оптимальное решение с помощью решений задачи с мерами, сосредоточенными в конечном множестве точек. Указан способ аппроксимации с помощью возрастающей последовательности £ -сетей компакта @ . Разобраны два частных случая общего реше -ния: для линейно-гауссовсяих систем и для детерминированных систем с неопределенными параметрами. В первом случае оптимальная оценка нелинеГ 'а, но имеет линейный по измерениям рост на бесконечности и совпадает при отсутствии неопределенных параметров с известной оценкой условного среднего. Во втором случае получен -ное решение совпадает с известньзйи результатами теории гарантированного оценивания. Отметим, что упомянутая теория в различных аспектах развивалась в работах Э.Г.Альбрехта, М.И.Гусева, A.C. Кощеева, О.И.Никонова, И.Ф.Сивергиной. А.М.Устюжанина, Т.Ф.Филипповой, А.Ю.Хапалова.

В § 2.4 предлагается другая схема нелинейного оценивания. Показано, что в случае лкнейно-гауссовских систем она приводит к решениям, совпадающим с введенными И.Я.Кацем и А.Б.Куржанским.

Определим функционал

Gft(^-)) = ^о-р Е с iiiJ\fxi-tt(y)nz ¡ у,вП {2ЛЛ)

где 0 - функционал задачи (2.2.6), и поставим задачу

У Л $к)) min . (2.4.2)

■ fO)

В качестве класса допустимых оценок выбирается множество (2.3. 12). При этом предположения 2.3.1 несколько усиливаются дополнительными условиями. Оптимальное решение имеет вид

ы

f.(tf) = I ¿iElNxJy.,^} , (2.4.15)

t. = 1

где d. - размерность оцениваемого параметра, а числа ,

в сумме равные единице, определяются из резтения приведенной в работе экстремальной задачи.

В § 2.5 приводятся некоторые примеры сравнения введенных линейных и нелинейных оценок. В частности, приведен пример некорректности фильтра Калмана по отноше-.нию к малому изменению параметра системы. Отмечено, что минимаксные оценки дают регуляризацию решения и приводят к устойчивому решению. Однако оценки вида (2.4.15), решающие задачу (2.4.2), как показывают примеры, могут дать расходимость процесса оценивания для неустойчивых систем C2.2.I), где £ — О

Третья глава, состоящая из 3 параграфов, посвящена минимаксным задачам коррекции движения линеаризованных моделей управляемого возмущенного движения с выпукльм терминальным функционалом качества при неполной информации о состоянии объекта. Предпола -гается, что по ходу процесса поступает некоторая дополнительная измерительная информация, позволяющая уменьшить степень неопределенности фазового вектора. Особенностью рассматриваемых задач является разделенность процессов наблюдения и управления, причем промежуток наблюдения предшествует отрезку управления и эти промежутки не пересекаются. Оптимальное управление отыскивается в классе функционалов, зависящих от наблюдаемого сигнала и времени измеримым образом. ¡«!омент окончания наблюдения может не быть за-

27

дан заранее. В таком случае возникает задача о совокупной оптимизации процессов управления и наблюдения. Решение названных задач достигается в работе сочетанием методов теории фильтрации Калмана-Бьюси, выпуклого анализа и теории управления по неполным данным.

Излагаемые постановки задач и ход рассуждений примыкают к исследованиям Н.Н.Красовского, А.Б.Куржанского, Г.С.Шелементьева Задачи подобного типа рассматривались также в статистической постановке в работах Д.Е.Охоцимского, В.А.Рясина, Н.Н.Ченцова, Ф.Л.Черноусько, ¡,1.Л.Лядова,

В § ЗЛ рассматривается программная коррекция движения непрерывной линейной системы

¿х =(Ах +Ви. + \г)с1£ +сЦ , Ь е со,Т],

И ГУ* (3.1.1)

где X € К , Ц. б ¡\ « ^ - винеровский процесс с нулевьм средним и известной матрицей ковариаций приращений; Ц, -управление, а V - детерминированное неизвестное возмущение, стесненные ограничениями

и(Ъ 617 , и(4) е V, (зл.з)

где I/, V - выпуклые компакты. Начальное состояние системы -гауссовский вектор с неизвестным первым моментом, удовлетворяющим ограничению типа (3.1.3). По ходу процесса наблюдается процесс у £ Ят . служащий решением стохастического уравнения

сСу, = ( Сх + ИГ + сЦ , ^(0 )=0. (3.1.5)

Здесь ЪУ - неизвестная детерминированная функция, подчиненная ограничению вида (3.1.3), - винеровский процесс, независимый от ^ и ОССО) , с известной матрицей Я(4)>0 ковариаций приращений.

Опишем постановку задачи. Тройка неопределенных параметров на с.резке обозначается далее через

2*0) в (Х(0), и-4(-)) . (3.1.7)

Клас1 допустимых управлений состоит из функционалов

У*и » У'!^) • подчиненных включению (3.1.3) и удовлетворяющих определении* условиям измеримости. Определим для данного -3 функционал

Злид.,0) в £ [ таос Е [ У(//хсТ))|

* 2*0) 2ГгС->

^СО 1 . (3.1.8)

Здесь внутренний максимум берется по параметрам условного га-уссовского распределения величины ХСТ) при фиксированном сигнале. Наличие внешнего максимума связано с тем обстоятельством, что сигнал представляет собой величину с неопределенных

средним и для вычисления математического ожидания нужно задать параметры % • Если момент 5 окончания наблюдения за -

ранее не фиксирован, то мы приходим к следующей задаче

. О

34(lUv>) -ч* min , 'Ь . (3.1.9)

s,

В формулах (3.1.8), (3.1.9)' функция У предполагается выпуклой и неотрицательной, ff - заданная матрица.

Для решения задачи (3.1.9) внутреннее условное математическое ожидание представляется в виде

Е с (//х(Т»! ^с-),zro)i = ,

Л (3.1.13)

где УС^,1) - определенная выпуклая функция, ХС^, - Р^ие -Кие статистических уравнений прогнозирования при фиксированных параметрах Z^i') и заданном управлении U. (•,•) на отрезке • Далее решается вспомогательная минимаксная задача

wievx, i x.(Jti)) vrtin ~ Z(S}0CoW) . Zt0) tUy)

fi (3.1.16)

Здесь CC0(i) - решение фильтра Калмана-Бьюси для заданного сигнала у^О) , но при условии Z (•) = 0 -Для выпуклой функции Z(i,') в работе приведена формула, полученная методами выпуклого анализа, а для оптимального управления получено необходимое условие минимума

' » ыеи

■¿6[5,ТЗ, (3.1.23)

где

•) - определенная вектор-строка, Ь - экстремальный вектор, - ЭС.Д4) • С помощью теоремы об измеримом выборе показано, что эдомеит У.^С-) измеримым образом зависит от (р . Устанавливается формула

Е г(*,0С,С*)) , (3.1.23)

где для вектора &(1>) получены дифференциальные уравнения, зависящие от параметров , а для функции - явное аналитическое выражение. Окончательно момент перехода к управлению определяется путем решения задачи

тмс ^(*,&(»)) - тиг = г" (зл.зо)"

2вм «

а искомое оптимальное управление имоет вид

= • (3.1.31)

В § 3.2 решается задача синтеза марковского момента перехода к управлению. Здесь совокупность детерминированных моментов остановки -5 расширяется до совокупности М, (Т) всех марковских моментов "ССу-С')) относительно возрастающего потока под- С -алгебр {Й^СС^Ь к Ъ0 \ , заданного на пространстве С „ Ю,ТЗ Щ -векторных непрерывных функций, выходящих из пуля. Под марковским момейтом далее понимается измеримое отображение

т с: С0,Т] -г [о,Т] ,

обладающее свойством

Рассматривается задача

О Ш — ММ = £,„ , (3.2.2)

г &Ж(г),и.€иг:

где - функционал (3.1.8) гтри -5 = VС^О)), Отметим, что за счет расширения класса моментов остановки имеем е., ^ >

причем здесь всегда реализуется знак строгого неравенства за исключением вырожденных случаев. Задача (3.2.2) сводится к минимаксной проблеме об оптимальной остановке диффузионного процесса Х0(£) с неизвестным средним. Дчя ее решения используются известные результаты Н.В.Крылова, А.Н.Ширяева, И.И. Гихмана и А.В.Скорохода. Выписано уравнение Беллмана и рассмотрены его свойства. Оптимальный момент остановки, доставляющий минимум в (3.2.2), получен как момент первого выхода некоторого определенного процесса из заданной открытой области.

В 5 3.3 рассматриваются основные соотношения, описывающие решение дискретных аналогов исследованных выше задач. Основной моделью, приводящей к изучению многошаговых вариантов, считается дискретное поступление данных измерения. Используя материал §2.1, непрерывное уравнение состояния заменяем многошаговым и затем исследуем последнее вместе с дискретным уравнением изме -рения. Оспвное внимание уделено задаче синтеза марковского момента перехода к управлению. Ее решение сводится к минимаксной проблеме определения оптимального момента остановки случайной последовательности с неопределенным средним. Приведены определяющие соотношения для поиска момента остановки и оптимального управления. Результаты иллюстрируются на модельном примере, который является дискретньм аналогом примера, рассмотренного в предыдущем параграфе.

Четвертая глава содержит 2 параграфа и носит прикладной характер. Здесь рассматривается применение ряда разработанных в диссертации методов к одной проблеме из инерциальной навигации и приведены результаты численных расчетов. Задачи инерци -альной навигации изучались А.Ю.Ишлинским, И.А.Богуславским, П.В.Бронбергом, Д.М.Климовым и другими авторами. В работах названных авторов широко применяются методы фильтрации Калмана-Бьюси, их обобщения и модификации. Вместе с тем в монографии

И.А.Богуславского "Прикладные задачи фильтрации и управления" (1983 г.) отмечается, что статистика возмущений, действующих в инерциальных системах навигации, часто бывает неполной. Поэтому многие вопросы вполне естественно изучать в минимаксной постановке. В диссертации исследуется задача математического согласования (выставки) систем координат двухступенчатой транспортной системы, состоящей из корабля и стартующего с него самолета. Данная задача,рассматривалась в цитированной выше книге И.А.Богуславского чисто статистическими методами, и численного моделирования минимаксных алгоритмов в ней не проходи- ' лось.

В настоящей работе задача выставки излагается в несколько модифицированной постановке, связанной с наличием неопределенных факторов. Г § 4.1 приводится общая нелинейная модель, ее линеаризация, а также многошаговая система, соответствующая дискретному поступлению измерений в простейшей модели процесса выставки. Описываются гипотезы о неопределенных факторах, воз*-' кикающих в системе.

В § 4.2 для численного моделирования выбираются некоторые усредненные числовые данные, приводимые в работах Д.М.Климова, А.Липтона, Н.А.Парусникова, В.Н.Морозова, В.И.Борзова. Счет проводился по программе, реализующей линейный минимаксный ре -куррентный фильтр, оценивающий величины углов рассогласования систем координат и их дрейфы.•Вычисления для одного варианта случайных данных и детерминирсванных возмущений производятся в темпе реального времени. В работе приведены графики, выведен -нье на графопостроитель, и таблицы результатов вычислений. При решении программной задачи коррекции для многошаговой 6 -мерной системы, соответствующей дискретной модели измерений, предполагалось, что корабль неподвижен относительно поверхности Земли. В этом случае общая система распадается на 3 независимых двухмерных подсистемы, причем для одной из них (описывающей отклонение от местной вертикали) наблюдений не производится. В силу последнего обстоятельства для стой подсистемы целесообразно искать программное управление, начиная с первого шага. Для двух других подсистем момент перехода к управлению определяется решением задачи коррекции.

ЗАКЛЮЧЕНИЕ

Таким образом, в диссертации разработаны новые и получили дальнейшее развитие известные методы минимаксного оценивания состояний линейных с непрерывным временем и как линейных, так и нелинейных многошаговых статистически неопределенных систем. Предложены минимаксные схемы коррекции движения линейных статистически неопределенных систем. На примере одной проблемы из инерциальной навигации продемонстрирована практическая ценность развитых методов.

В работе получены следующие основные результаты.

- Поставлены и решены минимаксные задачи оценивания состояния линейной статистически неопределенной системы с непрерыв -ным временем в классе линейных по сигналу оценок.

- Получены эволюционные определяющие соотношения для за -дач фильтрации, интерполяции и прогнозирования в случае совместных интегральных квадратичных ограничений на первые моменты возмущений в системе и при произвольных компактных ограничениях на вторые моменты. Указанные соотношения имеют вид стохас -тических дифференциальных уравнений для операторов в пространстве матриц, подходящей размерности,

- Показано, что предложенная схема оценивания охватывает как случаи детерминированного минимаксного оценивания, так и статистического оценивания при известных моментах возмущений.

- Предложена процедура аппроксимации точного решения задачи фильтрации с раздельньми интегральными ограничениями на первые моменты возмущений с помощью эволюционных решений задачи при совместных интегральных ограничениях.

- Изучены асимптотические свойства оптимальных решений минимаксной задачи фильтрации при совместных квадратичных ограничениях на первые моменты возмущений и при произвольных компактных ограничениях на вторые моменты. Найдены условия, при кото -рых оптимальные оценки и ошибки минимаксного-оценивания сходятся к их установившимся значениям при стремлении интервала наблюдения к бесконечности. Указан вид установившихся значений для оценки и ошибки оценивания.

- Поставлена и решена минимаксная задача фильтрации для линейной многошаговой статистически неопределенной системы в классе линейных по сигналу оценок.

- Получены рекуррентные определяющие соотношения для зада-си фильтрации в случае суммарных квадратичных ограничений на первые моменты возмущений при неопределенных вторых моментах и неизвестной точно динамике системы. Отмеченные соотношения имеют вид многошаговых уравнений для операторов в пространстве* матриц, подходящей размерности.

- Приведены способы аппроксимации точного решения задачи оценивания с геометрическими ограничениями на первые моменты возмущений при помощи решений задачи для совместных квадратичных ограничений.

- Выделен класс допустимых нелинейных по сигналу оценок, в котором поставлена и решена задача минимаксного оценивания текущего состояния нелинейной многошаговой системы произвольного вида. При некоторых естественных предположениях о случайных возмущениях в системе доказана теорема существования седловой точки целевого функционала в виде среднего от квадрата нормы ошибки оценивания и получены необходимые условия оптимальности для оценки фазового вектора.

- Установлены условия невырожденности, при которых точное оптимальное решение можно аппроксимировать последовательностью решений конечномерных задач. Указан способ такой аппроксимации с помощью возрастающей последовательности £. -сетей в компакт -ном множестве неопределенных параметров.

- Рассмотрены решения задачи оценивания в двух частных случаях: для линейно-гауссовск ж и для детерминированных систем о неопределенными параметрами.

- Поставлены и решены программные минимаксные задачи кор -рекции движения для линейных систем с непрерывным и дискретным временем, в которых неопределенными являются только первые мо -менты возмущений, подчиненные геометрическим включениям. Получе но необходимое условие оптимальности управления в виде принципа минимума.

- Исследованы обобщения предыдущих задач, состоящие в поис ке марковского момента перехода к управлению, синтезируемого по доступной информации. Установлено, что такие задачи могут быть сведены к минимаксной проблеме выбора оптимального момента оста новки случайного процесса (последовательности) с неопределенным среди м значением.

- Рассмотрено приложение ряда разработанных в диссертации методов к задаче выставки гироплатформы на подвижном основании в двухступенчатой транспортной системе корабль-самолет,

- Проведено численное моделирование некоторых минимаксных алгоритмов оценивания и коррекции движения.

Пользуясь случаем, автор благодарит Александра Борисовича Куржанского за поддержку работы и постоянное внимание.

ПУБЛИКАЦИИ ОСНОВНЫХ РЕЗУЛЬТАТОВ

1. Ананьев Б.И. Минимаксная квадратичная задача коррекции движения // Прикл.матем. и мех. 1977, Т.41, вып.З. С.436-446.

2. Ананьев Б.И., Куржанский А.Б. Управление и оценивание в статистически неопределенных системах // Тез.докл. 5 Всесоюзн. совещания по статистическим методам в процессах управления. Алма-Ата, 1981. C.I7-I8.

3. Ананьев Б,И. Об оценивании состояния статистически неопределенных систем управления движением П Тез.докл. 4 Всесоюзн. конф. по оптимальн.управления в механ.системах. Москва, 1982. С.4.

4. Ананьев Б.И. Минимаксные среднеквадратичные оценки в статистически неопределенных системах // Дифференц.уравнения. 1984.

Т.20, Jf 8. C.I29I-I297.

5. Ананьев Б.И. О задачах гарантированного оценивания в системах со статистически"неопределенными возмущениями // Теэ.дикЛ. мевдународн. конф. "Стохастическая оптимизация". Киев, 1984. Часть I, С.14-16.

6. Ананьев Б.И. О коррекции движения при стохастически неопределенных возмущениях П Эволюционные системы в задачах оценивания / УНЦ АН СССР. СвердлоЬск, 1985. С.3-14;

7. Ананьев Б»Й. О задаче гарантированного оценивания нелинейных Динамических систем со статистически неопределенными возмущениями )/ Труды 15 Мёждун* конф. по Динамике машин. Франкфурт-на-Одере, ГДР. Часть 3 / Мзд. Б.ХаЙмаН rt X.Фридрих. Карл-Маркс-Штадт,

1986. C.I-II.

8. Ананьев Б.И. Асимптотические свойства минимаксных оценок состояния статистически неопределенных систем /V Гарантированное оценивание й задачи управления /УНЦ АН СССР. Свердловск, 1986.

С.3-18.

9. Ананьев Б.И., Ширяев 8.И. Определение наихудших сигналов в задачах гарантированного оценивания h Автоматика и телемеханика.

1987. * 3. С.49-58.

10. Ананьев Б,И, Минимаксные оценки состояния линейных многошаговых статистически неопределенных систем. М., 1987. Деп.

в ВИНИТИ 6.02.87, № 902-В87, 40 с.

11. Ананьев Б.И. Интерполяция и прогнозирование состояния

в динамических системах со статистически неопределенными возмущениями /7 Оценивание динамики управляемых движений / УрО АН СССР. Свердловск, 1988. С.18-28.

12. Ананьев Б.И., Вайсакалов И.Б. Об одной минимаксной задаче оптимального управления для статистически неопределенных систем // Динамические задачи оценивания в условиях неопределенности / УрО АН СССР. Свердловск, 1989. С.3-10.

13. Ананьев Б.И. Минимаксные регуляторы для статистически неопределенных управляемых систем // Изв. АН СССР, Техн.кибернетика. 1989, Г 4. C.I05-II5.

14. Arum'ev B.I., Kurzhanskii А.В, The nonlinear filtering problem for a multistage eyatem with statistical uncertainty // Second IPAO вушр. on etochast. control, Vilnius, USSR, 1986t Repr. M,, 1936, Pt.1. P.205-210.

15« Anan'ev B.I, On minima* state estimates for multistage statistically uncertain systems // Probl. Control & Inform. Theory. 19B9. Vol.18, N 1. P.27-41.

Иэ совместных публикаций [2, 9, 14] в данную работу включены лишь некоторые результаты,• полученные лично диссертантом. Отметим, что в совместной работг [12] постановка задачи и ме -тод ее решения принадлежат автору диссертации. Доказательства проведены совместно с И.Б.Байсакаловым с равным творческим вкладом. В работе [9] диссертанту принадлежат §§ 2-4. Параграфы I, 5 и 6 написаны В.И.Ширяевым.

I

НС-26183. Подписано к печати 20.02.90 г. Формат 60x84 1/16. Объем 1,5 печ.л. Тираж 100 экз. Заказ 23. Бесплатно.

Ротапринт Института математики и механики УрО АН СССР 62С219, Свердловск, ул.С.Ковалевской, 16.