Рекуррентное оценивание в нелинейных детерминированных системах тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Соловьева, Ольга Эдуардовна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
1994 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Рекуррентное оценивание в нелинейных детерминированных системах»
 
Автореферат диссертации на тему "Рекуррентное оценивание в нелинейных детерминированных системах"

МИНИСТЕРСТВО ПО ДЕЛАМ НАУКИ, ВЫСШЕЙ ШКОЛЫ И ТЕХНИЧЕСКОЙ ПОЛИТИКИ УРАЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

на правах рукописи

СОЛОВЬЕВА Ольга Эдуардовна

РЕКУРРЕНТНОЕ ОЦЕНИВАНИЕ В НЕЛИНЕЙНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМАХ

Специальность 01.01.02. - дифференциальные уравнения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Екатеринбург - 1994

Работа выполнена в Уральском ордена Трудового Красного Знамени государственном университете им. A.M. Горького на кафедре вычислительной математики.

Научный руководитель - доктор физико-математических наук, профессор Мипьштейн Г.Н.

Официальные оппоненты - доктор физико-математиичесхих наук, профессор Кряжимсхий А.В. - кандидат физико-математических наук, доцент Вдовин А.Ю.

Ведущая организация - МГУ

Защита состоится " ""^^р^&а994 г. в /^^часов на заседании специализированного совета К 063.78.03 в Уральском ордена Трудового Красного Знамени государственном университете им. А.М. Горького (620083, г. Екатеринбург, пр. Ленина, 51, комн. 248).

С диссертацией можно ознакомиться в библиотеке Уральского государственного университета.

Автореферат разослан 1994 г.

Ученый секретарь

специализированного совета /*> ^

к.ф.-м. н., доцент — , Пименов В.Г.

Актуальность темы. Потребность оценивания фазовых координат, параметров, а также входных воздействий системы по результатам наблюдения возникает во многих прикладных задачах, связанных с управлением динамическими процессами, моделированием и исследованием динамических объектов .

Имеется большое количество работ как отечественных, так и зарубежных авторов, посвященных вопросам теории оценивания и ее приложениям . Впервые задача наблюдения была рассмотрена в работах Н.Н.Красовского и Р.Калмаяа. Наиболее конструктивные результаты по оцениванию получены для линейных систем. Рекуррентный подход в оптимальной фильтрации разработан Р.Калманом и Р.Бьюси. В работах Н.Н.Красовского и А.Б.Куржансхого применен игровой подход к задачам наблюдения и фильтрации при различных ограничениях на помехи. Многочисленные результаты по гарантированному оцениванию в минимаксной постановке, допускающей рекуррентное решение, принадлежат А.Б.Куржанскому. Широкий круг задач оценивания, связанных с задачами позиционного управления, представлен в работах Ю.С. Оси-пова и А.В.Кряжимсхого.

Перечислить здесь сколько-нибудь полно даже значительные работы в области оценивания не представляется возможным. Многие достижения по оцениванию в линейных системах отражены, например, в. книгах Я.Н.Ройтенберга и В.Н.Фомина, там же имеется обширная библиография. Вопросы оценивания и идентификации параметров в нелинейных детерминированных системах рассматривались в монографиях и статьях Р.Беллмана, Р.Бьюси, Л.Льюнга, Н.Н.Красовского, А.Б.Куржан-ского, А.В.Кряжимского, Ю.С. Осшгова, Я.З.Цыпкина. Материал, наиболее близкий к данной диссертации по постановкам задач и методам решения, содержится в работах М.И. ГУсева и А.Б.Куржансхого, Дж.Касти и Р.Калабы, А.А.Суханова, Н.Н.Ка§1туас1а.

В настоящей диссертации рассматриваются задачи оценивания фазовых координат, идентификации параметров, а также восстановления входного воздействия в нелинейных детерминированных системах. Предлагаемые методы оценивания и идентификации предназначены для тех реалистических ситуаций, когда отсутствуют достаточно подробные априорные сведения о параметрах и начальных данных, а также информация о шумах в объекте и канале наблюдения. В этих случаях наиболее естественным является метод невязки, в котором отыскание оценок связывается с задачей минимизации некоторого функционала, зависящего

от невязок в системе и наблюдениях. Возникающая оптимальная задача решается рекуррентно по времени наблюдения, что в итоге приводит к уравнениям нелинейного фильтра, формирующего оценки состояния, параметров и входа системы.

Оказалось', что разработанный в диссертации рекуррентный подход позволяет получать различные представления нелинейного фильтра. Они отличаются друг от друга наборами характеристик, описываемых различными вспомогательными системами.

В связи с (определенной трудоемкостью в реализации оптимального нелинейного фильтра, в работе предприняты различные попытки его упрощения. На основе уравнений оптимального фильтра построены более простые модифицированный и локально-оптимальный фильтры.

Специальное внимание в работе уделено задаче оценивания с частично известными начальными данными, которая достаточно часто встречается в приложениях. Например, к ней сводится задача идентификации параметров в системе с известным начальным состоянием. Полученный оптимальный фильтр для неизвестной части компонент начального вектора (или параметров) имеет меньшую размерность, что упрощает решение задачи оценивания.

Цель работы. Построение и исследование рекуррентных оптимальных фильтров для оценивания состояний, параметров и входных воздействий в нелинейных детерминированных системах в непрерывном и дискретном случаях при наличии неизвестных помех в объекте и наблюдениях.

Общие методы исследования опираются на концепции и результаты теории оптимального управления и оценивания. Научная новиона работы закпючаетсявследующем:

1. Для системы обыкновенных дифференциальных уравнений

— выведены рекуррентные уравнения оптимального нелинейного фильтра для оценивания состояния, параметров, а также входного воздействия системы при наличии неизвестных помех как в объекте, так и в наблюдениях;

— предложены различные способы вывода уравнений нелинейного фильтра, приводящие к различным его представлениям;

— получен фильтр меньшей размерности в задаче с частично известными начальными-данными, благодаря которому упрощается отыскание оценок в том числе и в линейном случае;

— в предположении малости помех'в наблюдении построен более про-

стой модифицированный фильтр, использующий укороченную вспомогательную систему;

— выведены уравнения рекуррентного локально-оптимального фильтра, близкого в реализации к линейному.

2. Для дискретной системы

— разработана рехуррентно - итерационная процедура формирования оценок фазовых координат и параметров по неточным наблюдениям.

Все основные результаты диссертационной работы являются новыми.

Теоретическая н практическая ценность работы состоит прежде всего в получении конструктивных алгоритмов рекуррентного оценивания в нелинейных системах. Разработанные фильтры, в отлпчпе от традиционно используемых линеаризованных, позволяют проводить оценивание в случае, когда априорная информация об оцениваемых величинах не слишком близка к истине или даже совсем отсутствует. Существование различных представлений фильтра интересно и в теоретическом, п в практическом отношении, поскольку открывает возможности для выбора в каждой конкретной ситуации достаточно удобного и устойчивого в вычислительном отношении алгоритма оценивания. Выведенные уравнения оптимального фильтра являются основой дм различных направлений его дальнейшего изучения и использования, в частности, позволяют строить более простые фильтры.

Апробация работы. Результаты работы докладывались на научных семинарах в Уральском госуниверситете, в Московском госуниверситете, в институте математики и механики УрО РАН, на конференции в Москве, 1990 г., на Всесоюзной конференции по механике в Екатеринбурге, 1992 г., а также на двух конференциях в Киеве, 1992 и 1993 гг.

Публикации. По теме диссертации опубликовано 8 работ. В [1),[6] Г.Н. Мпльштейну принадлежат постановки задач и часть методов построения рекуррентных фильтров. ,,

Структура и объем диссертации. Работа состоит из введения, четырех глав, заключения, списка обозначений и списка литературы. Объем диссертации составляет 121 страниц машинописного текста, включая 4 рисунка, 4 таблицы и 68 библиографических ссылок.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении кратко положено состояние вопроса л основные результаты работы.

В первой главе решаются задачи оценивания фазовых переменных и параметров системы обыкновенных дифференциальных уравнений по неточным наблюдениям. ГЬава содержит 8 разделов.

В разд.1 приводится постановха задачи. Рассматривается система уравнений

Х' = Кз,Х) (1)

с наблюдениями

у(а)=ф,Х(а)),го<з<и (2)

Штрих означает производную по э, X — п-мерный фазовый вектор, у — т-мерный вектор - столбец. Приближенное равенство в (2) указывает ва наличие .Неизвестной помехи в канале наблюдения.

В случае, когда подробная априорная информация о помехе отсутствует, естественно потребовать, чтобы оценка для истинного решения минимизировала невязку в наблюдении. Вводится функционал качества

3(г,Х{.)) = - х)тР(Х(Ц) -х) + (3)

в котором благодаря включению считающихся известными вектора х и матриц Р > 0 и > 0 учтены априорные сведения о начальных данных, а также о структуре и интенсивности помех в наблюдении.

Оценка х,/и ^ < з < ^ состояния Х(в) по наблюдениям ва промежутке ищется в качестве оптимальной траектории в задаче минимизации функционала (3) вдоль решений системы (1).

Поскольку решение системы (1) однозначно определяется на-

чальными данными = х, на функционал (3) можно смотреть, как на функцию J(t;x) = J(t,X(■;x)), также зависящую от х, и искать оценку начального состояния в качестве решения задачи минимизации этой функции.

В разд.2 выводятся уравнения рекуррентного нелинейного фильтра для оценки х(ф начального состояния на основе необходимых условий минимума функции J{t¡x).

Пусть

/о(з,х) = - ф,г))тд(«)(гг(») - ф,х)).

Введем (п х хг)-матрицы производных решения по начальным

б

данным х

„ . . (ЭХА дХх, . Г 1 . т— и матрицу производных по х функции J(s;x)

а также матрицы

Г А У/, эх,) Г » У*, 0/о)

В используемых обозначениях « — номер строки, к — номер столбца для заключенного в фигурные скобки элемента матрицы.

ТЕОРЕМА 1. Пусть хиц — оптимальная оценка начального состояния Х{1о) в смысле минимизации функции J{t\x). Пусть для любого < 6 [<о>'о+7Ч » окрестности х(оц существует обратная матрица Тогда х 1вц удовлетворяет задаче Коши

¿х

= (4)

*ь/ь = г>

где Х(5;1),Хг(»;а;), при фиксированном х находятся из вспомо-

гательной системы уравнений

Х' = Па,Х\ ХОо) = х (5) .7=1,7*

= X*ВД + [е . = *

Уравнения (4) для хиц (собственно фильтр) содержат характеристики, которые определяются из вспомогательной системы уравнений. В линейном случае характеристики фильтра (матрица усиления, удовлетворяющая системе уравнений Рпкатти), как известно, зависят только

от времени и могут быть вычислены до проведения наблюдений. В нелинейном случае фильтр существенно сложнее, его характеристики являются функциями и времени и самой оценки г,оу( . и, стало быть, зависят от. наблюдений. При реализации фильтра дм вычисления правой части уравнения (4) требуется многократный пересчет с начального момента времени Ц решения оадачп Коши (5) на удлиняющихся промежутках времени.

Благодаря фильтру (4) вместе с х1вц находится и оптимальная оценка х„ц, <о < я << в качестве-решения А'(в; системы (1).

В разд.З решается задача оценивания с частично известными начальными данными. Пусть в системе (1) известны первые к компонент начального вектора X (¿о)

А'^о) = ¿1, о) = (6)

Для получения оценки остальных (п - к) компонент по наблюдениям !/(«), < « < рассмотрим задачу минимизации функционала

1 и

= £ ММ - +1 /о

<2 ,-=1 Л,

вдоль решений системы (1) с дополнительными условиями (б) на Х(<о).

В терминальном члене функционала участвуют известные априорные значения 1 = 1,п - к, для оцениваемых компонент Лг(<о). В отличие от функционала (3) здесь терминальный член содержит только неизвестные компоненты вектора Х(^); (я - к) х (п — &)-матрица Р равна а/п_ь от > 0 (все выхладки можно проводпть и для произвольной матрицы Р > 0).

В теореме 2 даются уравнения рекуррентного фильтра, формирующего оценку для неизвестной части начального вектора. Рал мерность этого фильтра меньше, чем в общем случае, и зависит от п — к.

Наиболее простой вид он приобретает, когда оценивается только одна компонента Х(<о). В этом случае для оценки выписывается скалярное уравнение, а вспомогательная система имеет размерность порядка п, а не п2.

В разд.4 рассматривается задача идентификации /-мерного параметра Л в системе

Х' = !(з,Х,А) (7)

с наблюдениями

у (в) = 9(в,Х(5),Л), «о < в < I.

Она сводится к задаче оценивания состояния в расширенной системе с фазовым вектором (Х,Л)Т, если к уравнениям (7) добавить уравнения

Л' = 0.

Если начальное состояние Х(<о) системы (7) известно, то задача идентификации параметра Л становится задачей оценивания состояния расширенной системы с частично известными начальными данными.

При <р(з,Х(з),Л) = С(з)Х(з) выписываются уравнения фильтра для оценки А параметра Л:

§ = ^ Л)ХдТ(*;Л )Ст(*)д(Ш0 - С(*)Х(*;А)), (8) А(*э)=5.

В (8) Х(з; Л) — решение системы (7) с начальными данными = 2 при Л = Л; А"д(5;Л), = ¡77, — (п х 1)-матрицы производных

решения Х($;Л) по параметру, а также (/ х /)-матрица 7дл(з;Л) удовлетворяют системам, аналогичным соответствующим системам из (5).

В разд.5 на основе уравнений оптимального фильтра в предположении малости помех в наблюдении построен более простой модифицированный фильтр

где удовлетворяет задаче Коши

V = Х2(з-,х)ихг{з,Х{цх))Хх{з-,х), ¿(<0) » Р.

В модифицированном фильтре используется укороченная вспомогательная система, в которой вместо матрицы </ц(з;:е) участвует близкая к ней положительно определенная матрица и не требуются матрицы вторых производных решения АГ(я;х).

В типичных ситуациях предлагаемая модификация не приводит к значительным отклонениям от оптимальной оценки. В линейном случае модифицированный фильтр совпадает с оптимальным.

В раод.б получен второй вариант фильтра для оценки состояния в (1)-(2), опирающийся на необходимые условия непосредственно в задаче

минимизации функционала (3) вдоль решений системы (1). Необходимые условия здесь выписываются в виде нелинейной краевой задачи на промежутке наблюдения

X' = f(s,X) (9)

p{t0)=P{X(tQ)-x),p(t) = Q, (10)

и оптимальная оценка хац является ее решением.

С изменением t на промежутке [*о»*о+21 ff1* отыскания х,ц потребуется решение возникающего при этом семейства краевых задач (9)-(10). Благодаря рекуррентному методу решения этого семейства задач выводятся уравнения для оценки начального состояния хХйц (являющейся левым концом оптимальной траектории).

Пусть p(s;x) - решение задачи Коши для системы (9) с на-

чальными данными

X(t0) = x, p(t0) = P{x-x).

Справедлива

ТЕОРЕМА 3. Пусть при t е (*о, существует матрица pj1 (t; х). Тогда xitft удовлетворяет задаче Коши

Ч/ь = г-

где Х(з-,х),рх(а]х) при фиксированном х находятся в качестве части решения задачи Коши---—_—__

X' = f(s,X),X(t0)=x (12)

Г> = -fI(s,X)p+f0x(a>X), p(t0) = Р(х - х) X'x = Ms,X)Xt) X,(t0) = I

X) - {g jgjL»}] - /Дз, Х)Рг

Вместе с îtaft благодаря фильтру (11) находится и вся оптимальная траектория х,/( = X(s; х<о/<).

На основе второго варианта уравнений для xta/t удалось получить фильтр непосредственно для оценки it = xtjt состояния X(t) в текущий момент наблюдения.

ТЕОРЕМА 4. Пусть выполнены условия теоремы 3 и it — правый конец оптимальной траектории. Тогда xt удовлетворяет задаче Коши

^ = f(t,it)-K(t,iti/t)füx(t,xt), (13)

где K(s-, х) находится в качестве решения задачи Коши

К' = ~К

{¿д|^л}] К + и{я,Х)К+Киг{з,Х1 (14)

ад^р-1.

В линейном случае этот фильтр ( при Р = 0 ) совпадает с известным детерминированным вариантом халмановсхого фильтра.

В разд.7 обсуждается случай, когда априорной информации о начальных данных системы (1) не имеется, т.е. в функционале качества (3) Р = 0. В этой ситуации рекуррентный фильтр уже не может быть применен с начального момента наблюдения Ц, поскольку не определены начальные данные для уравнений фильтра и его характеристик. Если же при некотором <1 > <0 найдена оценка х^^, то с момента <1 поведение оценки £(0д описывается фильтром (4) ( или (11) ) с начальными данными £,0/1(1- Обратим внимание на то, что для вычисления характеристик фильтра потребуется интегрировать вспомогательные системы уравнений, начиная по-прежнему с момента Ц, а не с момента ¿5.

- В разд.8 приведены уравнения фильтров для линейных задач. Здесь подробно рассмотрены случаи Р = 0 (именно для этого случая получены уравнения калмановского фильтра для детерминированных систем) и Р Ф 0. При частично известных начальных данных выведены (не встреченные в литературе) уравнения фильтров меньшей размерности и для оценки начального состояния и для оценки в текущий момент наблюдения.

Глава 2 посвящена задачам оценивания в дискретном случае.

Рассматривается система разностных уравнений

Х(з+1) = Пз,Х(з)) (15)

с наблюдениями

у(8)±<р(8,Х(з)), 3=0,1,...,«. (16)

Здесь так же, как и в главе 1, отыскание оценки в = 0,2, состояния Х(й) системы (15) по наблюдениям (16) при фиксированном I связано с минимизацией функционала качества

3 — ^(Х(0) - х)тР(Х(0) - х) + (17)

\ ПШ - Ф, - Ф,Х(*)))}.

В нелинейной задаче (в отличие от линейной) не удается ,вообще говоря, получить рекуррентные уравнения для оценки в духе уравнений непрерывного фильтра. В непрерывном случае время в системе и наблюдениях меняется непрерывным образом, поэтому возможно рассматривать приращение оценки £¡„/¡+^1 - ( или ¿<+д< -¿г ) при как угодно малых изменениях промежутка наблюдения и в результате придти к дифференциальному уравнению для х1ац. В дискретном же случае при продвижении на один шах и состояние и наблюдение могут измениться настолько сильно , что знание оценки £о/<-1 на предыдущем шаге мало что сможет дать для формирования оценки х0ц. Поэтому поиск рекуррентных уравнений для дискретных задач в общем случае вряд ли оправдан.

Однако при достаточно естественном предположении о близости соседних оценок удалось найти рекуррентно - итерационный способ формирования оценок.

В разд. 2 оценка х0ц при каждом I ищется с помощью итерационной процедуры______

Процедура 1. Пусть для любого < = 0,Т в окрестности существует обратная матрица . Пусть х^' — г-е приближение для х0ц. Тогда (г+ 1)-е приближение находится из соотношения

• ^'^¿Й-^Л^Й)^^)- (18)

В качестве начального приближения берется оценка на предыдущем (<-1)-м шаге

Соотношения для формирования оценки во многом схожи с уравнениями непрерывного фильтра, в них также используются характеристики, определяющиеся из вспомогательной системы разностных уравнений.

В линейном случае итерационная процедура при при каждом t сходится всегда и оа один шаг, благодаря чему x0/¡ выражается через x0/t_¡ п получаются новостные рекуррентные уравнения детерминированного варианта калмановского фильтра.

В раод.З главы 2 вывод рекуррентных соотношений опирается на необходимые условия в задаче минимизации функционала (3). Необходимые условия выписываются в виде краевой задачи

X{s + l)=j(s,X{s)), s = (19)

p(s) = fj(s,x(s))p(s+1) - ;0x(s,x(s)), s

/J(0,X(0)M1) -Ы0,Х(0)) = Р(Х(0) -х), р(г)= о. (20)

Особенность сопряженной системы в дискретном случае заключается в том, что "время" в ней течет в обратном направлении. Поэтому наиболее естественно начальные данные для (15) задавать слева, а для сопряженной системы справа.

Пусть

КО) = лт(о,*(о))Р(1) - ыо,х(о)).

Обозначим X{s;x),p(s\x) — решение краевой задачи для системы (19) с краевыми условиями

X(0) = xlP(t)=Q.

В этом случае итерационная процедура для отыскания x0jt приобретает вид

4/Î0=42 - 4/1) - Р)~1 (ко-,ф - rati - *)), (21) 0/í ~x0fi-l-

Здесь p(t; x) — часть решения краевой задачи для системы (19), pz(t; х) — матрица производных по начальным данным сопряженного вектора, она является частью решения краевой задачи для системы в вариациях.

Таким образом, характеристики в рекуррентных соотношениях (21) определяются в качестве решения вспомогательных краевых задач ( а не задач Коши, как в разд.6 главы1 ). Нетрудно заметить, что поскольку уравнения для X не зависят от р, решение вспомогательной краевой задачи для (19) (также, как п для системы в вариациях) разбивается на решение двух последовательных задач Коши: для X слева направо, а затем для р справа налево.

В разд.З рассматривается задача с частично известными начальными данными, для которой также получены рекурентные процедуры оценивания.

Разд.4 посвящен линейным фильтрам, которые легко выводятся на основе предложенных нелинейных процедур.

В разд.5 обсуждается задача оценивания состояния непрерывной системы по дискретным наблюдениям.

В третьей главе рассматривается более общая постановка задачи оценивания (для непрерывных систем) : помехи присутствуют и в наблюдениях а в самом объекте. Наряду с задачей оценивания состояния решается задача восстановления неизвестной функции входного воздействия.

Раздел 1 содержит постановку задачи. Оценивание состояния X(s) и входного воздействия v(s) в системе

, (22)

по наблюдениям

y(s) = <р(а, X(s), v(s)), t0 < s <t, сводится к задаче минимизации по v и vi функционала

J(t,X(-)) = \(X(t0) - r)T/Wo) - *) + (23)

J/WO - <p(s,X(s)))TQ(s)(y(s) - ф,X(S))) +

(u(a) - €(s))TS(s)(*(s) - v(s)) + w{s)TR(s)w(s)}ds_

вдоль решений системы с управлением (v,w)

X' = f(s,X,v) + D{s)w. (24)

Выбор D{s),P,Q(s),S(s),R(s),x,v(s) связал с априорными сведениями относительно начального состояния системы {х,Р > 0), входного воздействия (v(s),S(s) > 0), а также с учетом структуры и интенсивности помех (Q(s) > 0 и R(s) >0).

В разд.2 дается рекуррентный метод решения задачи оптимального управления более общего вида (включающей рассмотренные выше задачи оценивания)

J(i,*(.)) = i(X(t0)-x)TF(X(i0)-x) + £/o(s,X(S),«(S))ds -, min (25)

X' = f(s,X,v), (26)

где минимум в (25) берется по определенному классу управлений.

Предполагается, что функции f(s,x,u) и /q(s,x,u) и ограничения на управление « таковы, что управление, найденное из условия максимума функции Понтрягина:

H(s,i,p,u) =pTf(3,x,v)-J0(3,x,v) -»max представимо в виде достаточно гладкой функции

s

и = и(з,х,р). (27)

Суперпозиция функции Понтрягина H(»,z,p,u) с (27) дает функцию Гамильтона задачи (25)-(26), которую обозначим Н(а,х,р). Необходимые условия оптимальности в задаче (25)-(26) выразятся в виде краевой задачи

X' = f(s,X,ii(s,X,p)) = HP(s,X,p) (28)

р' = -/Л*, X, и (s, X, р))р 4- /о г(з, X, в (s, Х,р)) = -Ях(а, Х,р)

p(t0) = P(X(t0)-x), p(t) = 0. - (29)

В связи с задачами оценивания оптимальную траекторию в (25)-(26) будем по-прежвему называть оценкой и обозначать хшц .

С изменением t на некотором промежутке [<<ь*о Д2" отыскания х,ц (даже при фиксированном я) потребуется решение новых краевых задач для каждого i. Этого можно взбежать с помощью рекуррентного решения возникающего семейства краевых задач, что приводит х построению фильтра, например, для оценки х(о/( состояния в начальный момент времена или для оценки Х( состояния в текущий момент времени.

В теореме 5 дается рекуррентный по времени t способ отыскания оценки xta/t, являющейся певым концом оптимальной -траектории в задаче (25)-(26) и вместе с тем левым концом Х(з) в краевой задаче (28)-(29).

Пусть X{s;x), p(s)x) - решение задачи Коши для системы (28) с начальными данными

ХЦй)=х, p(t0) = P(x-x).

ТЕОРЕМА 5. Пусть при существует матрица р;:1 (4; х).

Тогда оценка х^ц удовлетворяет задаче Коши

^ = (30)

*|„/<о =

где Х(в;х), р1(э;х) при фиксированном х находятся в качестве части решения оадачи Коши

Х'= Нг{8,Х,р), Х(«о) = 1 (31)

рГ =-Нг(з,Х,р), р(*о) = Р(х-3)

Х'х = Нрх(з,Х,Р)Хг + НРГ($,Х,р)рх, Хг(Ь) = I (32)

р'г = -Нгг{з,Х,р)Хх - Н:Т{$,Х,р)рх, рхцо) = Р.

Вместе с хгф благодаря фильтру (30) находится оптимальная траектория хгц оадачи (25)-(26) в качестве части решения Х(з;х1оц) системы (28), а оптимальное управление й,ц найдется с помощью соотношения (27):

«./« = = и(з,хф,рф). (33)

Обратимся теперь к уравнению фильтра для х( = Хф. ТЕОРЕМА 6. Пусть выполнены условия теоремы 5 и х{ — правый конец оптимальной траектории в задаче (25)-(26). Тогда х» удовлетворяет задаче Коши

^ = -—(34)_

К —

где К(з; х) находится в качестве решения задачи Коши

К' = +КНхг{з,Х{з-,х),р(8-,х))К+ Нрх{$,Х{з-,х),р{з-,х))К+ (35)

КНч(*,Х&х),р{г,х)) + И„(8,Х{г,х),р(';*)),

Задача (23)-(24) для оценивания состояния и входного воздействия в системе (22) входит в класс задач (25)-(26), поэтому для ее решения можно воспользоваться результатами, описанными выше.

Пусть из условия максимума определяются достаточно гладкие функции v = ь(з,х,р) 11» = -из^^ур). Выписав соответствующие системы

для X, р, можно затем воспользоваться либо уравнением фильтра для ila¡t, либо уравнением для it. Получив, например, xt, найдем xsj¡, ps¡t \ í0 < s < t, в качестве решения задача Кошп для системы вида (28) с начальными данными на правом конце промежутка X(í) = ít, p(f) = 0. Это решение дает как оптимальную оценку xs¡t состояния X(s) системы (22), так п оптимальную оценку входного воздействия v(s)

%/t = u(s>Zs/kPs/i), h<s<t, (36)

по наблюдениям на промежутке [£<),')•

В разд. 2.3 приводятся результаты применительно к линейным задачам. Получено решение задачи о рекуррентном восстановлении входного воздействия в линейной системе с помощью метода невяоки в несколько более общей постановке, чем в известной автору литературе.

В раод.З на основе уравнений нелинейного фильтра конструируется локально - оптимальный фильтр. Здесь оценка строится оптимально на малых промежутках времени [t,t + Д<] при меняющемся с ростом t функционале качества. В результате получается локально - оптимальный фильтр вида

^ = /(<,it,u(<,i<, о))-Jlf/o.(í,¿tl «(*,*«,())), (37)

álo=r

® = ШЯИ((,Г,,0)М+ ~ (38) .

MHzp{t,xh0) + H„(t,xt,0), M(t0) = Р-К

Локально - оптимальный фильтр имеет структуру, сходную с фильтрами в линейных задачах. При его реализации, как и в линейном случае, не требуется многократных пересчетов решения вспомогательной системы. В отличие от линейного случая здесь матрица усиления М зависит от ¿t, т.е. в конечном счете от наблюдений, поэтому не может быть вычислена заранее.

Оказывается, возможны различные представления оптимального нелинейного фильтра. В разд.2 решение краевой задачи (28)-(29)( полученной из необходимых условий) ищется в качестве решения вспомогательной задачи Коши, удовлетворяющей исходным краевым условиям (29). В этом случае основным объектом, определяющим структуру фильтра, является задача Кошп с начальными данными заданными слева, а дифференциальные уравнения выписываются для оценки xt¡>jt начального состояния.

В разд.4 предлагаются другие способы получения фильтра, приводящие к новым его представлениям.

Для простоты огранпчемся задачей оценивания состояний системы

Х' = /(в,Х)

по наблюдениям

у(з)=С(з)Х(з),

Теоремы 7-9 дают различные представления фильтра, построение которых опирается на различные основные объекты.

Например, решение исходной краевой задачи может быть связано с решением вспомогательной краевой задачи

Р(г) = о,

в которой краевые условия согласуются с исходными краевыми условиями.

Ее решение обозначим Х(в;<, х),

"Бэорема 8. Пусть при I е |*о» <о + Л существует матрица (Р -о! х))~1- Тогда оптимальная оценка х1ац начального состояния Х{Ьй) удовлетворяет задаче Коши

= о; ч/,) (39)

Матрицы ЛГг(«;«,а:),рг(в;*,£) являются решением краевой задачи для системы (32) с краевыми условиями_______

Векторы являются решением краевой задачи

XI = НР:(з, Х,р)Х, + Ярр^, Х,р)р, (40)

А = -Я1Х(«,Х,р)Х, - Нхр{э,Х,р)р1 Х,{г0;г,х) = О, !>,(«;*,*) = Ст0Ж<)(г/(*)- С(<щп<,х)).

В принципе, в качестве основного объекта для построения фильтра можно рассмотреть любую краевую задачу для системы (28), согласующуюся с исходными краевыми условиями (29). Такая задача может содержать к (0 < к < 2п), параметров, относительно которых всегда

можно на основании (29) составить к тождеств по Ь. В итоге получится соответствующее представление фильтра.

Хотя точные решения уравнений различных представлений фильтра дают одни п те же оценки, численные решения могут различаться. В связи с этим возникает важная задача выбора в каждой конкретной ситуации достаточно удобного и устойчивого в вычислительном отношении представления фильтра. Так, например, в случае устойчивой исходной системы (22), задача Коши для сопряженной системы неустойчива, и фильтр, опирающийся на задачу Коши будет плохо обусловленным. В то же время фильтр, использующий вспомогательную краевую задачу, "может оказаться более приемлемым.

В четвертой главе представлены результаты численных экспериментов. В разд.1 приводится теоретический материал по уточнению оценок при известных номинальных значениях. Для искомых отклонений истинных значений от номинальных выписывается линеаризованная задача, которая может быть решена средствами линейной фильтрации.

В разд.2 в качестве примера идентификации параметров в дискретной системе рассмотрены результаты идентификации параметров модели ритмоинотропных явлений в сердечной мышце. Во многих приложениях модели номинальные значения параметров известны и требуется оценить степень отклонений от них в результате тех пли иных воздействий на мышцу. В этих случаях метод линеаризации вполне оправдан и дает удовлетворительные результаты. При определенных условиях, многократно применяя процедуру оценивания отклонений и постепенно уточняя при этом номинальные значения, удается получить оценки, как угодно близкие к истинным значениям.

Если же отклонения от номинальных значений нельзя считать малыми или же требуется найти сам номинальный набор параметров, приходится обращаться к нелинейному фильтру, поскольку линеаризованный не позволяет решить задачу в такой ситуации. *

В разд.З описана серия экспериментов, иллюстрирующих возможности оценивания состояния нелинейной системы с помощью линеаризованного и нелинейного фильтров при различной информированности о начальных данных в системе.

В разд.4 приведены результаты оценивания параметра нелинейной системы при различных априорных сведениях о параметре . Особое внимание обращено на влияние характера помехи в наблюдениях на ка-

чество оценивания.

В разд.5 проведен сравнительный анализ результатов численного интегрирования различных представлений нелинейного оптимального фильтра.

В заключении сформулированы основные результаты диссертационной работы.

Список работ по теме диссертации

1. Мильштейн.Г.Н., Соловьева О.Э. Уточнение параметров линейных систем// Деп. в ВИНИТИ 30.06.88, N5582-1388, с.32

• 2. Соловьева О.Э. Идентификация параметров модели ритмоино-тропных явлений в сердечной мышце методами калмановского оценивания// Деп. в ВИНИТИ 30.08.89, N5654-089, с.46

3. Мильштейн.Г.Н., Соловьева О.Э. Анализ состояния электромеханического сопряжения на основе идентификации параметров модели регуляции сократительной деятельности сердечной мышцы // В сб. "Центральные и периферические механизмы регуляции физиологических функций". Тезисы докладов конференции, 2-ой Моск. мед.ин-т, 1990, с.86-87

4. Мильштейн.Г.Н., Соловьева О.Э. Построение фильтра в нелинейных детерминированных системах. Тезисы докладов УП-ой Всесоюзной конференции "Управление в механических системах". Свердловск, 1990, с.76-77

5. Соловьева О.Э. Рекуррентные алгоритмы оценивания в нелинейных дискретных детерминированных системах// Деп. в ВИНИТИ 04.03.91г№58-В91, с.22----

6. Мипыытейн.Г.Н., Соловьева О.Э. Рекуррентное оценивание и идентификация параметров в нелинейных детерминированных системах. — ПММ, 1991, т.55, вып.1, с.39-47

7. Мильштейн.Г.Н., Соловьева О.Э. Нелинейная фильтрация детерминированных систем на основе метода минимизации невязки. Тезисы докладов конференции "Моделирование и исследование устойчивости процессов". Киев, 1992, часть 2, с.7

8. Соловьева О.Э. Различные представлениях нелинейного фильтра И их численная реализация. Тезисы докладов конференции "Моделирование и исследование устойчивости систем". Киев, 1993, часть 2, с.43