Минимаксная рекуррентная интерполяция динамических объектов тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Штаненко, Татьяна Ивановна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2000
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
СЛЯКТ-ИЕТЕРВУРГСКИЙ ГОСУДЛРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
РГ6 оя
2 5 ДЕК 2000
Щтаненко Татьяна Ивановна
МИНИМАКСНАЯ РЕКУРРЕНТНАЯ ИНТЕРПОЛЯЦИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ
(01.01.09 — математическая кибернетика)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Санкт-Петербург 2000
Работа выполнена на кафедре теоретической кибернетики математико-механи ческого факультета Санкт-Петербургского государственного университета.
Научные дохтор физико-математических наук,
руководители: Фомин Владимир Николаевич
доктор физико-математических наук, Барабанов Андрей Евгеньевич
Официальные доктор физико-математических наук, профессор
оппоненты:
Тертычкый Владимир Юрьевич, кандидат физико-математических наук, Бондарко Владимир Александрович.
Ведущая организация — Санкт-Петербургский государственный электротехнический университет (ЛЭТИ), (г. Санкт-Петербург)
ционного Совета К 063.57.49 по защите диссертации на соискание ученой степени кандидата наук в Санкт-Петербургском государственном университете по адресу. 198504, Санкт-Петербург, Старый Петергоф, Библиотечная площадь, д. 2, математике-механический факультет.
С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт-Петербургского университета, Университетская наб., д. 7/9.
Автореферат разослан „ X 9ППП г.
Ученый секретарь
диссертационного совета,
кандидат физико-математических наук
доцент А. й. Шепелявый
Защита состоится
на заседании диссерта-
В
Общая характеристика работы
Актуальность темы. В стандартной линейно-квадратичной теории оптимальной фильтрации ставятся три задами: сглаживание или интерполяция; собственно фильтрация; прогноз или экстраполяция. Они различаются объемом измерений, которые доступны в момент времени t, когда требуется оценить состояние системы
Решение задач собственно фильтрации и прогноза дается известным фильтром Калмана-Бьюси, описанным в большом количестве монографий (Р.Е.Калман, Р.С.Бьюси., В.Н.Фомин, М.Аоки, К.Т.Леондес и др.). В данной работе изучается, в основном, другая постановка задачи: имеется фиксированное запаздывание оцениваемого вектора по отношению к последнему доступному измерению, и требуется минимизировать квадратичный функционал качества относительно ошибки оценивания. Функционал может быть либо дисперсией ошибки оценивания либо минимаксным по множеству возмущений относительно этой ошибки, что приводит к линейно-квадратичным постановкам и к Н00-оптимизации. Требуется найти оценку интерполяции, оптимальную по отношению к критерию качества, а также рекуррентную формулу для пересчета таких оценок.
В монографиях по линейно -квадратичной теории управления и фильтрации А.Язвинского, Дж.Медича, Я.Н.Ройтенберга, М.А.Огаркова и др. оптимальная оценка интерполяции представляется как решение стохастического линейного дифференциального уравнения, в которое входит текущее и новое измерение. Это уравнение имеет простую вычислительную структуру, однако оно неустойчиво и непригодно для практических расчетов.
В монографии Р.Ш.Липцера и А.Н.Ширяева даны исчерпывающие решения для общего нестационарного условно-гауссовского процесса наблюдения. В диссертационной работе уточнены свойства фильтров для стационарных систем и найдены рекуррентные формулы для расчета зависимости точности от запаздывания.
Современная теория ^/^ -оптимального управления и фильтрации построена, в основном, на спектральном методе аппроксимаций аналитическими функциями, изложенном в монографии Б.Френсиса, и на методе уравнений Риккати, введенном Дж.Дойлом и К.Гловером. Оба этих метода не дают эффективных решений для бесконечномерных объектов. В главе 4 впервые получено уравнение %°°-оптимального
интерполирующего фильтра на основе метода линейного функционального уравнения, предложенного А.Е.Барабановым. Приведены примеры расчетов оптимальных фильтров для объектов первого и второго порядков.
Цель настоящей работы заключается в синтезе рекуррентных фильтров, связывающих оценки оптимальной интерполяции, а также в исследовании и уменьшении их вычислительной сложности.
Методы исследования. В работе применяются методы линейно-квадратичной теории, основанные на двойственности задач управления и фильтрации; минимаксные методы синтеза %°°-оптимальных систем; метод окаймления и другие приемы сокращения вычислений при решении уравнений большой размерности.
Научная новизна. Новым является преобразование двойственности нестационарной задачи интерполяции линейного объекта и задачи управления с условиями на начальное состояние. В синтезированном оптимальном сглаживающем фильтре выделена стационарная часть и исследована зависимость точности от запаздывания. Впервые решена задача синтеза %°°-оптимального фильтра в задаче сглаживания.
Практическая ценность. Оптимальные фильтры, представленные в данной работе, могут быть применены в разнообразных задачах оценивания данных измерения по эашумленным измерениям.
Публикации. Основные результаты диссертации были опубликованы в работах [1-6], а также докладывались на Пятой Крымской Международной Математической школе "Метод функций Ляпунова и его приложения" (5-13 сентября 2000 г.) и на семинарах кафедры теоретической кибернетики математико-механического факультета Санкт-Петербургского государственного университета—Работа-над диссертацией проводилась при частичной финансовой поддержке Российского фонда фундаментальных исследований (гранты N 98—01— 00581, 98-01-01009).
Структура и объем работы. Диссертация состоит из введения и четырех глав, изложенных на 108 страницах машинописного текста, включающего 1 рисунок и список литературы, состоящий из 40 наименований.
Содержание работы
В первой главе обсуждается проблема фильтрации в предположении, что математическая модель частично наблюдаемого процесса задается формирующим фильтром
xi+i = Atxt + Etu)t+U yt = Ctxt + Ftwt, ts<t< tf,
xt G R", yt £ Rm, возбуждаемым стандартным белым шумом w, Ai, Et, Ct,Ft — детерминированные матрицы соответствующих размеров. Ставится задача построения линейного фильтра
f+fc
xt/t+k = Y, hwyt', ts<t+k <tf, t'=t,
оптимального по отношению к следующему критерию: J¡k\h) = M\xt - xtMk\2 inf, ts<t< t¡.
При к = 0 эта задача решается стандартным фильтром Калмана-Бьюси, при к < 0 это задача прогноза, решение которой сводится к случаю fe = 0. В данной работе изучается задача интерполяции, в которой число к > 0 — это количество "будущих" измерений j/<+s, 1 < s < к, входящих в уравнение фильтра для оценки Xt.
т, 1 . . ~ W/IЬтРАИиЦ
Б разделах 1.1 и 1.2 доказано, что данная задача управления- находится в двойственности со следующей матричной линейно-квадратичной задачей оптимизации. Объект управления описывается уравнением
xt>+1 = Ät>Xt' + Bt'üt, t' = 0,1,..., t - ts,
с начальным данным хо = I + где u-1 = col (u_i,u_2,...,
7 = (7_i,7_2, ... ,7-*) И матрицы коэффициентов системы управления связаны с матрицами коэффициентов объекта фильтрации равенствами Ац = В? — Aj_t,_iCt_t, при 0 < í' < í — i.,; 71. = AtiAt% ■ ■ ■ Atf-iClt, при -к < f < -1. Требуется минимизировать матрицу
t-i,
+ ßt'iv)T{avut. + ßt'iv) + (и~1)гГи-1
t'=о
по всевозможным наборам управлений («_*, U-i+i,. • ■
Здесь введены обозначения оц' — + = ,
при 0 <t' < t-ts■, симметричная матрица Г = (Ге',<")<~,4"=-1 имест компоненты
("'=¿+1
где Ф(4 - И,Г) = • ■ +
Доказано методами линейно-квадратичной теории оптимального управления (теорема 1.1), что матрица й достигает минимального значения на некотором наборе управлений и что на опти-
мальном процессе {¡¿. = —К^х? при > 0, где К? — коэффициент усиления Калмана.
В разделе 1.1 доказано, что поставленные задачи оптимального управления и оптимальной фильтрации находятся в двойственности. А именно, преобразование й(_<<= — Л^, 0<Л'<Л+кь связывает оптимальные последовательности матриц в этих задачах. Идея доказательства состоит в представлении погрешности фильтрации в виде линейной функции возмущения и затем в нахождении линейной рекуррентной зависимости между соседними коэффициентами этого разложения (лемма 1.1). По двойственности получается решение задач интерполяции, фильтрации и прогноза в следующей форме.
Теорема 1.2. Предположим, что выполнены условия
(Сг-Ег<_ 1 + I + Л»)* >0, = + 1,..., г.
Тогда задача матричной оптимизации однозначно разрешима. Оп-
тимальные матрицы Л|(] обладают свойствами:_
1. При к > 0 (сглаживание) весовые функции оптимального фильтра при ? < ( находятся из соотношений
Кг = [1п-РпЬ*Рц + ггЧЧ^-ь Л^ = {/„-К^хС^Л'-ь
ш 1'=1+1
7 = (7-1) 7-2, 7-0. = )ГС;_г„
Матрица К у = Л'*<(Р(<) находится по формуле
Кг = КЦРг) = [Е^Сг^Еу + + х
через решение дискретного уравнения Риккати
Рг'+1 = [Е[' — /^('(С'с+г-Бс 4- )]— 7Сс(С<ч-1Е? + ^чОГ + +(/„ - КгСг^АеРуАЦЬ - К^С^У, < Ь' < I - 1,
определяемого начальным условием
/^-х = ¿^(ад,^ + + +ад-1-
Матрицы /г*,¿-и, • ••> ^м+ь вычисляются по формулам
(Ы<ш, й<>1+2, ..., Лм+к) = 1{1*Ра + Г)-1.
Яри А; < 0 (прогноз) весовая функция оптимального фильтра
определяется при ts<1?<t + k — 1 по формулам
/гм< = Лг_1Л_2 • • • Л£+*ЛГИ.*ЛГ(+*.И ■ • • Л^-и
Яри А; = О (собственно фильтрация) весовая функция оптимального фильтра находится из соотношений
V = N№-1 ■ • ■ г' = ^ +1,..., * - 1,
= К Х-1-
Оптимальные коэффициенты /гг (< при I' < Ь являются произведением матриц, в которых только первые сомножители меняются при переходе от £ к £ + 1. Поэтому как следствие теоремы 1.2 были получены рекуррентные соотношения для оптимальных прогнозирующих оценок (теорема 1.3) и оценок интерполяции:
Теорема 1.4. Пусть выполнено условие теоремы 1.2 и все матрицы системы Ау невырождены, Тогда оценки Хгцуи оптимального сглаживания удовлетворяют рекуррентному уравнению
в котором = А'(+1ЛггАг( 1) = и
= Л<+М' - ^1V, £' = £ + 1, £ + 2,..., £ + к.
Здесь матрицы Л^ и Лг( вычисляются по формулам = [1п-К^Сг]А^ ь
К = (/„-[/„-^(^^Т+Г)-1^]^-!^- £ А^'Ф^»«-!))^-!,
¿'=¿+1
7 = (7-1, 7-2, 7-*), > =
а матрицы /г^-, £' = £ + 1, £ + 2,..., £ 4- & — по соотношениям
= (/>*,*+ь А«я-2, •••, ^+0=7(7*^7 + Г)-1,
7= (7ь 72, 7*), 7( = [<?<+($(«+ М)Г,
где матрица Г=(Г('1(»)^*,__1 находится по формулам
г,.,,. = Е
¿'"=<4-1
Ф(£,£') - • ■ ■ £>£', Ф(£',£') = /„.
Решение задачи для стационарного случая, где матрицы системы и решение уравнения Риккати Р не зависят от времени, записывается более компактно (леммы 1.2-1.4).
В разделе 1.5 сформулирована минимаксная задача общей филь-трацин с терминальным функционалом качества в каждый момент времени. Доказано, что она равносильна стандартной линейно-квадратичной стохастической задаче фильтрации, так как она сводится хс двойственной к ней задаче матричной оптимизации (лемма 1.5). Оптимальный минимаксный фильтр записывается в форме Боде-Шеннона (теорема 1.5), а также в форме рекуррентных уравнений (предложение 1.1)-
Во второй главе диссертационной работы рассматриваются линейные стационарные системы наблюдения в дискретном времени с нестационарными начальными условиями. Пусть объект наблюдения и измеритель описываются уравнениями
г(+1 = Ахг + Ет{+1, 2/< = + ts<t<tf,
где хг € Н", ?/; £ Вт, № — стандартный белый шум, А, Е, С, F — детерминированные матрицы соответствующих размеров.
Пусть хщ — оптимальная оценка вектора по измерениям до момента Вектор х(у4 и матрица ковариаций ошибки оценивания Р^ц вычисляются стандартным фильтром Калмана-Бьюси. Ошибку оптимального прогноза вектора по измерениям до момента 4 обозначим е<(0 — Уш ~ ¿/(+>/( ~ У 1+> —СА'х(/{. Будем искать оптимальную оценку в задаче интерполяции г, по измерениям уе, ч < t до момента Ь в виде
к
Хф+к = £</< +
«=1
Известно, что для оптимальности линейной оценки х{/(+к фазового вектора х1 необходимо и достаточно, чтобы были выполнены уравнения Винера-Хопфа Е(х{— = 0, ts < в < t + к.
Эти уравнения выполнены при ts < э <t при любых весовых коэффициентах 1 <\<к. Коэффициенты определяются из системы уравнений Винера-Хопфа при 4+1 < я < Введем обозначения:
Г,- = СА1Е, ¿>0,
1 т1+1 \ (СА \
£ = гй = Щ+2 , с = СА2
\ Щ+к \САк,
в =
/Т0 + Р Г1
0
Г0 + Р
0 о
о о
V IV I Л/
Г*_2 Г/с—а Гo+F/
Теорема 2.1. Пусть ранг матрицы Р = СЕ+Р равен количеству ее строк.
Тогда оптимальная оценка интерполяции вектора по наблюдениям, до момента t+k определяется уравнением Хф^ = где н( = {Р^ + В.)-1Х, Л = ^{СК^^С, л: = {О&У^С, а последовательность векторов (£{) размерности кпу удовлетворяет уравнению
/0 I 0 . • ( СА1и \ /0\
0 0 I . . 0 с£кх 0
£«+1 = ! ; . . ': - + :
0 0 о . . 1 САк~хКг 0
и 0 о . • 0) \ САЧи ) и/
\
в котором Щ — коэффициент усиления Калмана и введены обозначения для первой блочной компоненты ^¡д вектора £( = , и для к + 1-й компоненты е^к-ц уже не входящей в этот вектор: ¿М = Ус+г - САх1/1, сг,А.+1 = у,+к+1 - САк+1Хф.
Ковариация ошибок оптимальных оценок интерполяции равна
сэГ-^ + пу1.
Согласно теореме 2.1. наличие "избыточных" измерений Уг+\, Уг+2, ..., уг+к сверх текущих ..., уменьшило матрицу ковариаций
ошибки оценивания на величину
- <5Г1а = РфСТ(соТ + срфСГг)~1СРф.
Важнейшим вопросом в задаче интерполяции динамического объекта является правильный выбор длины промежутка упреждения, т.е. величины к.
В теореме 2.2 сформулирован рекуррентный способ-расчета матриц /? = /4 как функции величины запаздывания к, не содержащий обращения матриц возрастающей по к размерности. Общее количество вычислений на одну итерацию на шаге к в алгоритме, изложенном в теореме 2.2, линейно по к. Предельная матрица ковариаций рассчитывается спектральным методом для стационарного объекта наблюдения.
Теорема 2.3. Пусть квадратная матрица Т(г)Г* размерности п^-невырождена при+ Р. Пусть матрица Р± размерности (пш—пу)х(пи)—п!/) удовлетворяет уравнениям Fj.Fl = FF1 = 0.
Тогда минимальное значение матрицы спектральных плотностей ошибки оценивания е{ вектора по всем измерениям ув, 5 6 Т., равно
ЗГ(г) = ф(2)(г>(г)т(г)Г1ф*(г), а минимум функционала качества J{h) равен
где * означает операцию /*(г) = /т(г-1) и введены обозначения ф{г) = (/ - Аг)-гЕ (/„. + - Аг)"1^)-1
т(г) = П-Г^РГ1^)^.
Пример. Найдена зависимость от к матрицы Ив случае, когда хи '//(, Щ, <?( — скалярные, и = (?'<, Соответственно, Л и С — числа, Е = (£?1,0), Р = (0,.Рх) и £?х, Рх — числа. Эта зависимость выражается уравнением
1 _ п2*
Нь = С2 А2_1>х_
с — г2 + (р2 - с)(М2к '
где р, г ид находятся из системы: р2-Нг2 = ^12(14-А2)4-С2£,2) ;>г = Г? А,
/( = г/р,ИС = ^+С2Е2_
При к оа предельное значение равно 7?«, = С2Л2/(с — г2). В разделе 2.8 получена явная формула для матрицы коэффициентов Щ оптимального фильтра, построенного по невязкам прогноза наблюдений е<(г) по теореме 2.1.
В третьей главе диссертационной работы способ решения линейно-квадратичной задачи оптимальной интерполяции, представленный во второй главе, применен для систем в непрерывном времени. Объект наблюдения и процесс измерения описываются стохастическими уравнениями Ито
¿(0 = Ах(г) + Еи}Ц),
у{£) = Сх{Ь) + РЧо(*), Ь > г0,
где х — вектор состояний объекта, у — результат измерения, — векторный стандартный винеровский процесс, А, С, Е и F — матрицы соответствующих размерностей.
Начальное данное х(Ц) является случайным вектором, независимым от процесса ад. Известны Ее (¿о) = аг0, соу х{Ц) = Р0. Предполагается, что у{Ц) = 0.
Требуется по измерениям найти оценку ¿(£) век-
тора х(€), для которой величина Е]а:(£)—¿-(¿)|2 минимальна.
Оптимальную оценку обозначим г). Ввиду гауссовского рас-
пределения процессов в уравнениях объекта и измерения оптимальная оценка является линейной функцией от измерений и начальных данных:
£(ф + т)=/ Щ,з)с1у(з)-¡-К^ХО
Л о
с некоторыми весовыми функциями £ и к, причем
Теорема 3.1. Пусть ранг матрицы Г равен количеству ее строк. Определим матрицы И — ГРТ, I ~ (I, О )т,
Пусть матрица = — 1 невырождена.
Тогда оптимальная оценка вектора по наблюдениям до момента 2 + г может быть записана в виде
ЩЬ + т) = ¿(¿Ю+ДГ11оТ\ст(8) + 01Со1етем°(РЕт,С)т -
- /о3 ст{г)0~1{-С,ЕЕт)ем^ 4г(РЕт,С)т] Л"1^),
где стохастический интеграл в утверждении теоремы берется при фиксированном I по процессу Ито е((з) как функции от в:
d£t(s) = йу(г 4- «) - Сх(г + <И = ¿у(Ь + в) - СемЩь) йь\ в > О,
+ т) = £ [ст(£)+01Со1етеМе(ЕЕт, С)т-
- /\т(г)0-1(-С,ЕЕт)ем^ йг{РЕт,С)т] ГГ^ур+в)}.
Весовые функции, стоящие под интегралом в теореме и следствии, не зависят от t, и поэтому основную часть в последней формуле составляет стационарный фильтр, выход которого умножается на матрицу Е^1, зависящую от Р1ц.
Весовые множители стационарного фильтра удовлетворяют системе линейных дифференциальных уравнений, и поэтому сам фильтр можно реализовать без вычисления интеграла при помощи обыкновенного дифференциального уравнения с запаздыванием (следствие 3.2 и следствие 3.3). Однако это уравнение неустойчиво и не пригодно для практических вычислений.
В четвертой главе диссертационной работы поставлена задача И00-оптимальнои интерполяции для объекта с чистым запаздыванием по
с начальным данным £¿(0) = 0.
Следствие 3.1. В условиях теоремы 3.1 оптимальная оценка может быть представлена через измерения 4- з) в виде
возмущению, которая, в силу двойственности, сведена к задаче оптимального управления. Доказано, что решение задач управления и фильтрации сводятся к одному функциональному уравнению. Это уравнение решено способом, включающим спектральную факторизацию. В конце главы рассмотрены два примера, уравнение одного из которых описывает волновое движение. Рассматривается система наблюдения
a(p)x(t) = g(p)w(t),
y(t) = i(p)a:(0+ "(«)>
где x — выход объекта размерности пх, w — возмущение размерности nw> У — измерения размерности пу, v — шум измерения размерности n„, р = dfdt — оператор дифференцирования, а(р), д(р), Ъ(р) — полиномы степени п, т, q соответственно.
Требуется оценить величину z{t) = c{p)x(t) размерности nz, где с(р) — полином. Определим оценку величины zt по наблюдениям г/< до момента времени t + т уравнением
¡(t/t + г) = f™h(s)y(t + t-s) ds,
где г > 0 — длина промежутка упреждения, а функция h(-) имеет преобразование Лапласа в пространстве Харди %°°(С+).
В задаче ^^-оптимальной интерполяции требуется минимизировать по h функционал качества, который определяется как sup +
v.weLH-oo.t), IMI+IM^O 1 iloo(Ks)l2 + И5)12)ds } '
В задаче субоптимальной фильтрации требуется при заданном уровне 7 > 0 найти все такие весовые функции Л, что для всех ненулевых пар (v,w)GL2(~oo,0) выполнено неравенство J(h)<72.
Сформулирована двойственная задача %°°-оптимального управления и доказаны уравнения двойственности (теорема 4.1, следствие 4.1).
На основе общего метода сведения задачи %°°-оптимального управления к решению одного линейного дифференциального уравнения, предложенного А.Е.Барабановым, разработан алгоритм расчета оптимального фильтра в задаче интерполяции.
Задача сводится к решению обыкновенного дифференциального уравнения с постоянными коэффициентами на промежутке [0, т] с дополнительными граничными условиями на обоих концах. Количество
Jlh)
алгебраических уравнений совпадает с количеством неизвестных. Алгоритм также содержит факторизацию скалярного полинома.
Пример. Рассмотрим систему наблюдения, состоящую из уравнений
объекта и измерителя, а также оцениваемой переменной + + ^ ^ = + ^^
л(г) = Сг(г- г),
где А1, Ао,2?ьД)>С — некоторые постоянные. Первое уравнение описывает волновое движение, если полином в левой части имеет комплексные корни. Выходная величина х{1) этого объекта измеряется с погрешностью у{1). Ее требуется оценить по наблюдениям в прошлом и будущем на отрезке + г].
Уравнение центрального фильтра будет
= 7о2/'(*) + 71 У{*) - ¿1 - г) + £ - в) ¿в.
ГДС 7о, 7ь <^1, РьРо выражаются через коэффициенты системы, а гр(г) вычисляется из дифференциального уравнения с постоянными коэффициентами на промежутке [0,т] с заданными граничными условиями. На защиту выносятся следующие результаты-. 1. Алгоритм сведения нестационарной линейно-квадратичной задачи интерполяции к двойственной задаче оптимального управления. —2. Рекуррентные формулы для расчета весовых множителей оптимального фильтра как функции от величины запаздывания.
3. Явные формулы расчета оптимальных нестационарных коэффициентов фильтра и их сведение к стационарному фильтру.
4. Явные формулы для коэффициентов оптимального фильтра для линейно-квадратичной задачи интерполяции систем в непрерывном времени.
5. Алгоритм расчета "Н°°-оптимального фильтра в задаче интерполяции непрерывных систем.
Основные публикации по теме диссертации
[1] Фомин В.В., Штаненко Т.Н. Рекуррентная фильтрация временных рядов с полувырожденной корреляцией. — Санкт-Петербург, 1999. Деп. в ВИНИТИ N 1886-В-99 от 10.06.99.
[2] Самохин Ю.А., Фомин В.Н., Штаненко Т.И. Рекуррентная фильтрация. 4.1. Линейно-квадратичная задача.— Санкт-Петербург, 1999. 20 с. — Деп. в ВИНИТИ от 29.11.99, N 3526-В-99.
[3] Фомин В.И., Штаненко Т.И. Рекуррентная фильтрация. 4.2. Рекуррентные формы представления оптимального фильтра.— Санкт-Петербург, 2000. 28 с. — Деп. в ВИНИТИ от 19.04.00, N 1059-В-2000.
[4] Афанасьева Г.Б., Барабанов А.Е., Штаненко Т.И. Двойственность задач "Н^-оптимального управления и фильтрации для уравнений с запаздыванием. 5 Крымская Международная Математическая школа "Метод функций Ляпунова и его приложения", Алушта, 5-13 сентября 2000 г., с. 14.
[5] Барабанов А.Е., Штаненко Т.И. ^""-оптимальное управление и фильтрация при упреждающих наблюдениях. Воронежская весенняя математическая школа "Понтрягинские чтения-Х1". Воронеж, 39 мая 2000, с. 14.
[6] Барабанов А.Е., Штаненко Т.И. Минимаксная интерполяция волновых процессов по зашумленным наблюдениям. Международная конференция ВБО'2000. Екатеринбург, 30 мая - 2 июня 2000, с. 57.
Введение
1 Рекуррентные формы представления оптимального фильтра
1.1. Линейная фильтрация
1.1.1. Постановка задачи
1.1.2. Погрешность фильтрации как функция помехи.
1.2. Матричная линейно-квадратичная задача оптимизации.
1.2.1. Постановка задачи
1.2.2. Сведение матричной линейно-квадратичной задачи оптимизации к задаче оптимального управления.
1.2.3. Решение линейно-квадратичной задачи оптимального управления
1.2.4. Разрешимость матричной линейно-квадратичной задачи и некоторые свойства ее решений
1.3. Рекуррентные оптимальные фильтры.
1.3.1. Оптимальный прогнозирующий фильтр
1.3.2. Оптимальный одношаговый прогноз
1.3.3. Оптимальный сглаживающий фильтр
1.3.4. Оптимальное одношаговое сглаживание.
1.4. Рекуррентные фильтры в стационарном случае.
1.4.1. Оптимальный прогноз.
1.4.2. Оптимальное сглаживание.
1.4.3. Собственно фильтрация
1.4.4. Упрощенное вычисление калмановского коэффициента.
1.4.5. Пример: скалярный формирующий фильтр.
1.5. Минимаксная фильтрация.
1.5.1. Общие понятия теории минимаксной фильтрации
1.5.2. Решение стандартной минимаксной задачи
1.5.3. Рекуррентная минимаксная фильтрация.
2 Решение задачи оптимального сглаживания в дискретном времени
2.1. Постановка задачи.
2.2. Сведение к оптимизации по коэффициентам при упреждающих измерениях
2.3. Вычисление оптимальных коэффициентов и матрицы ковариаций
2.4. Рекуррентные формулы для оптимальных сглаживающих оценок
2.5. Факторизация матрицы приращения ковариаций.
2.6. Зависимость качества фильтрации от запаздывания.
2.7. Вычисление абсолютно минимальной матрицы ковариаций.
2.8. Явная формула для оптимальной весовой функции
3 Оптимальная интерполяция в непрерывном времени
3.1. Постановка задачи.
3.2. Разделение оптимальной оценки на прошлое и будущее.
3.3. Расчет весовой функции
4 Решение задачи Н°°-оптимального сглаживания
4.1. Постановка задачи 7^°°-оптимального сглаживания.
4.2. Двойственная задача управления.
4.3. Решение задач управления и фильтрации при помощи линейного функционального уравнения.
4.4. И00-оптимальное интерполирование
4.5. Примеры.
В стандартной линейно-квадратичной теории оптимальной фильтрации ставятся три задачи: сглаживание или интерполяция; собственно фильтрация; прогноз или экстраполяция. Они различаются объемом измерений, которые доступны в момент времени когда требуется оценить состояние системы х(1).
Решение задач собственно фильтрации и прогноза дается известным фильтром Калмана-Бьюси, описанным в большом количестве монографий [1, 9, 18, 19, 20]. Популярность этих задач связана, с одной стороны, с прикладной значимостью оценок текущих фазовых векторов и их будущих значений по последним измерениям, а с другой стороны, — с эффективностью вычислительных процедур решения, которые сводятся к рекуррентному фильтру Калмана-Бьюси.
Линейно-квадратичная задача интерполяции исследована значительно меньше. Ее решение может быть представлено в разных видах, в зависимости от соотношения между объемом оцениваемых величин и объемом доступной к моменту оценивания информации. Так, по фиксированному объему измерений можно построить оценки всех фазовых векторов системы на промежутке наблюдения. В данной работе изучается, в основном, другая постановка задачи: имеется фиксированное запаздывание оцениваемого вектора по отношению к последнему доступному измерению, и требуется минимизировать квадратичный функционал качества относительно ошибки оценивания. Функционал может быть либо дисперсией ошибки оценивания либо минимаксным по множеству возмущений относительно этой ошибки, что приводит к линейно-квадратичным постановкам и к 7^°°-оптимизации.
В стандартной постановке общей линейно-квадратичной стохастической задачи оптимальной фильтрации в непрерывном времени объект наблюдения и измеритель описываются уравнениями Ито где ги(-) — стандартный векторный винеровский процесс, описывающий возмущения в объекте и измерителе, ж(£) — фазовый вектор системы, у(£) — наблюдаемая векторная величина, А(Ь), В(¿), -0(0 — матрицы соответствующих размерностей. Начальные данные не зависят от будущих значений возмущений и являются случайными величинами — хо, о) = Уо с заданными первыми и вторыми моментами.
При фиксированном числе г требуется по наблюдениям до момента I + т найти линейную оценку rt+r x(t\t + r) = h(t,s)dy(s), J to которая минимизирует функционал
J (h) = E\x(t) - x(t\t + т) I2.
Обозначим оптимальную оценку x(t\t + г), она определяется матричной весовой функцией h(t,s). В прикладных задачах большое значение имеет вычислительная сложность расчета этой оценки, поэтому вместо явного представления величины x(t\t + r) через приращения у (s) желательно найти рекуррентную форму, в которой приращения оценки определяются лишь несколькими ранее вычисленными величинами и приращениями нового измерения y(t + т).
Если т = 0, то задача называется собственно фильтрации, и ее решение дается знаменитым фильтром Калмана-Бьюси. Пусть возмущения в объекте и измерителе независимы, т. е. D{t)B(t)T = 0, а матрица R(t) = D(t)D(t)T невырождена. Тогда оптимальные оценки собственно фильтрации могут быть рассчитаны при помощи следующего стохастического уравнения: dx(t\t) = A(t)x(t\t)dt +K(t)(dy(t)-C(t)x(t\t)dt),
P(t\t) = A(t)P(t\t) + P(t\t)A(t)T + B{t)B{t)T - P{t\t)C{t)TR{t)~lC{t)P{t\t), K(t) = P(f|i)C(i)Tfl(i)-1 с начальным данным x(to\to) = Ex0, P(t0\t0) = cov(x(tQ)). Здесь P(t\t) — матрица ковариаций ошибки оценивания e{t\t) = x(t) — x(t\t), K(t) — коэффициент усиления Калмана. Уравнение устойчиво, если пара функций (A(t),C(t)) детектируема, что в дальнейшем предполагается.
При т < 0 получается задача прогноза или экстраполяции. Ее решение сводится к собственно фильтрации. Оптимальный фильтр состоит из фильтра Калмана-Бьюси и дополнительного уравнения dx(t + ф) = A(s)x(t + ф), t + r<s<t.
При г > 0 возникает задача интерполяции или сглаживания, в которой требуется оценить вектор x(t) по всем прошлым измерениям у (s), s < t и отрезку будущих измерений у (s), t < s < t + т. Именно этой задаче посвящена данная диссертационная работа.
Одним из основных справочников по линейно-квадратичной теории оптимальной фильтрации считается монография А. Язвинского [32], изданная в 1970 г. В ней сформулированы решения основных задач фильтрации и сопутствующих проблем уравнений Риккати, причем изложение ведется с единых позиций, в основе которых лежат свойства некоррелированности обновляющего процесса de(t) = dy(t) — C{t)x{t\t) dt. Аналогичные решения в дальнейшем публиковались и в других зарубежных [12] и отечественных монографиях [15, 13].
В поставленной задаче оптимальной интерполяции предлагается вычислять оптимальные оценки в соответствии со следующим утверждением, которое цитирует соответствующую опубликованную теорему в части, касающейся уравнения для x(t\t + r).
Теорема 0.1. [32, 15]. Оптимальная несмещенная оценка x{t\t + т) является решением стохастического дифференциального уравнения dx(t\t + т) = A(t)x(t\t + r)dt + S(t + r)K(t + T)(clij(t + т) - C(t)x(t + r\t + r) dt) + +F(t)(x(t\t + T)-x(t\t))dt, t>t0, где F(t) = B(t)B{t)TPit^)"1 и матрица S(t) удовлетворяет дифференциальному уравнению s (i + т) = [Ait) + F(t)}S{t + r) - S(t + r)[A(t + r) + F(t + r)].
В соответствии с этой теоремой оптимальная оценка x(t\t + г) вычисляется как решение стохастического линейного дифференциального уравнения. Этот рекуррентный способ расчета оценки не включает явного интегрирования в каждый момент времени í, и сложность его реализации лишь немного уступает стандартному фильтру Калмана-Бьюси.
Однако, на самом деле этот фильтр неработоспособен и не может применяться для практических вычислений, так как он неустойчив. Докажем это, для простоты, на примере стационарной системы.
Лемма 0.1. Пусть матрицы Ait) = A, Bit) = В, C{t) = С, Dit) = D не зависят от времени, а начальная ковариация P(tQ\to) = Р является решением уравнения Лурье
АР + РАТ + ВВТ - PCTR~1CP = 0.
Пусть пара матриц (А, В) управляема, а пара (А, С) наблюдаема.
Тогда фильтр, сформулированный в теореме 0.1, полностью неустойчив, т. е. его матрица имеет все собственные числа в правой полуплоскости.
Доказательство. Величины x{t\t) и x(t + r\t + т) определяются стандартным фильтром Калмана-Бьюси, в который не входят оценки x(t\t + г). Поэтому в дифференциальном уравнении из теоремы 0.1 они являются внешними входными данными. Общее решение этого дифференциального уравнения определяется его матрицей А = А + ВВТР~1. Докажем, что она антигурвицева.
Пусть К = PCTRrl — коэффициент усиления фильтра Калмана-Бьюси. Уравнение Лурье можно записать в виде
А - КС = -Р(АТ + Р-1ВВТ)Р~1.
Матрица А — КС, являясь матрицей линейной части фильтра Калмана-Бьюси, гур-вицева, что также видно из уравнения Ляпунова
А - КС)Р + Р(А - КС)Т = -ВВТ - PCR~1CP, правая часть которого неположительна, а решение Р > 0.
Следовательно, матрица Ат + Р~1ВВТ — Ат антигурвицева, и ее собственные числа совпадают с собственными числами матрицы линейной части дифференциального уравнения из утверждения теоремы 0.1, что и требовалось доказать. □
Аналогичный неустойчивый фильтр в линейно-квадратичной задаче интерполяции для систем в дискретном времени представлен в [12, 13]. Эти уравнения могут представлять некоторый теоретический интерес, но непригодны для проведения расчетов в приложениях.
В широко известной монографии Р.Ш. Липцера и А.Н. Ширяева [11] также приведены решения всех основных задач оптимальной фильтрации, прогноза и сглаживания как для линейных стохастических гауссовских систем, так и для их прямых обобщений — условно-гауссовских процессов.
Оптимальную оценку в задаче интерполяции предлагается вычислять в виде хШ + г) = хШ) + [ h(t,t + и) (dy(t + и) - C(t + u)x(t + u\t + и) du).
Jo
Это устойчивое уравнение, которое можно назвать полурекуррентным, так как оценка x(t\t) определяется рекуррентно, а дополнительное слагаемое предполагает явное интегрирование по промежутку 0 < и < т.
Для нестационарных систем данное решение можно считать окончательным. Для стационарных систем наблюдения, которые имеют большую практическую область приложения и в которых матрицы А, В, С, D постоянны, а матрица P(t\t) зависит от времени, желательно представить интеграл в таком виде, чтобы его весовые функции не менялись с течением времени и не требовали постоянного пересчета.
Кроме того, в системах с постоянными матрицами уравнений объекта и измерителя практически важно знать зависимость точности оптимальных оценок от величины запаздывания г. Баланс между желаниями разработчика фильтра улучшить его точность за счет увеличения т и уменьшить вычислительные затраты за счет уменьшения т проще всего устанавливается, если имеется явная зависимость оптимальной точности от т. Все эти задачи рассматриваются во главе 2 диссертационной работы для систем в дискретном времени и в главе 3 для систем в непрерывном времени.
В главе 1 изучается задача оптимальной интерполяции для нестационарных систем в дискретном времени. Для задачи собственно фильтрации известны алгебраические преобразования двойственности, сводящие ее к стандартной задаче аналитического конструирования регуляторов для систем без возмущений [21]. В данной работе представлены аналогичные преобразования, сводящие задачу интерполяции к расширенной задаче аналитического конструирования регуляторов, которая решается в два этапа. На этом пути вычисляются коэффициенты нерекуррентного уравнения оптимального фильтра. Затем показано, что эти коэффициенты связаны рекуррентным уравнением и порождают полурекуррентный фильтр, пригодный для вычисления оптимальной интерполирующей оценки.
Стандартная стохастическая линейно-квадратичная задача оптимальной фильтрации предполагает минимизацию дисперсии ошибки оценивания и не является минимаксной. В главе 1 сформулирована детерминированная минимаксная задача оптимальной фильтрации, решение которой в точности совпадает с решением стандартной стохастической задачи. Поэтому рассмотренные в главах 1-3 линейно-квадратичные задачи фильтрации решают двойственные им минимаксные задачи, а полученные результаты являются вкладом в теорию минимаксной интерполяции динамических объектов.
В главе 4 изучается задача "Н°°-оптимальной интерполяции для систем в непрерывном времени. Теория "Н°°-оптимального управления и оценивания началась, по-видимому, с работ Г. Зеймса [38] и бурно развивалась в последние 15 лет. Можно отметить спектральную теорию, изложенную в монографии Б. Френсиса [31] и давшую первые решения простейших задач -оптимального управления, метод пространства состояний или метод двух уравнений Риккати [30], полиномиальный подход X. Квакернаака [35] и многие другие работы, доложенные на специальных секциях крупнейших международных конференций по теории управления.
Явные решения и численные алгоритмы были получены в основном для систем с матричными рациональными передаточными функциями. Это связано, в частности, с большой популярностью метода уравнений Риккати. Для систем с запаздыванием вектор состояний становится бесконечномерным, а уравнение Риккати из матричного преобразуется в операторное. Решение последнего уравнения представляет значительную вычислительную трудность. Лишь в последние годы в работах ряда авторов появляются алгоритмы расчета регуляторов и фильтров в простейших системах с запаздыванием [36]. В задаче оптимальной интерполяции отметим успешную попытку решения операторного уравнения Риккати, представленную в докладе [34].
В конце 90-х годов был разработан новый метод синтеза "Н^-оптимальных регуляторов, основанный на решении одного линейного функционального уравнения и названный также Ф-подходом [26, 27, 28]. Он позволяет непосредственно вычислять параметры оптимальных и субоптимальных регуляторов без обращения к многочисленным вспомогательным процедурам параметризации, матричным уравнениям и другим преобразованиям. В главе 4 этот метод распространен на непрерывные системы с запаздыванием по возмущению. Кроме того, в главе 4 представлена теорема двойственности задач -оптимального управления и фильтрации для систем в терминах вход-выход. По этой двойственности задачи оптимальной интерполяции в непрерывном времени сводятся к соответствующим задачам управления, которые решаются методом линейного функционального уравнения.
Сформулирован численный алгоритм расчета параметров И00-оптимального фильтра для систем со скалярными входом и выходом. Приведены решения в двух частных случаях: для объектов первого и второго порядков. Объект второго порядка может моделировать волновое возмущение, а его интерполяция может быть применена в задачах подавления возмущений на радарном изображении морской поверхности.
Диссертация состоит из четырех глав, введения, заключения и списка литературы.
Заключение
В данной работе приведены решения задач оптимальной фильтрации линейного объекта наблюдения в дискретном и непрерывном времени с показателями качества, свойственными линейно-квадратичной теории и И00-оптимизации.
На защиту выносятся следующие результаты:
1. Преобразование двойственности линейно-квадратичных задач управления и фильтрации в дискретном времени на конечном промежутке путем сведения к матричной задачи оптимизации (п. 1.1 и 1.2).
2. Решение двойственных задач оптимальной интерполяции и аналитического синтеза регуляторов с расширенным набором управлений (теоремы 1.1 и 1.2).
3. Расчет параметров рекуррентных фильтров в задачах интерполяции и прогноза в дискретном времени для нестационарных объектов (теоремы 1.3 и 1.4).
4. Общая формулировка задачи минимаксной фильтрации с терминальным функционалом качества и ее сведение к линейно-квадратичной стохастической задаче (лемма 1.5, теорема 1.5).
5. Выделение стационарного и рекуррентного фильтров в оптимальном интерполяторе (теорема 2.1).
6. Рекуррентный расчет зависимости оптимальной матрицы ковариаций ошибки интерполирования от величины запаздывания (теорема 2.2).
7. Расчет предельной матрицы ковариаций по всем измерениям спектральным методом (теорема 2.3).
8. Явная формула для стационарной и нестационарной частей оптимального интерполятора в дискретном времени (теорема 2.4).
9. Явная формула для стационарной и нестационарной частей оптимального интерполятора в непрерывном времени (теорема 3.1 и следствия из нее).
10. Преобразование двойственности в задачах "Н^-оптимальной интерполяции и управления с запаздыванием (теорема 4.1, следствие 4.1).
11. Алгоритм расчета И00-оптимального фильтра в задаче интерполяции для систем со скалярными входами и выходами (п. 4.4).
12. Примеры расчетов 'Н°°-оптимальных фильтров и соответствующих систем управления для объектов первого и второго порядков (п. 4.5).
1. М. Аоки. Оптимизация стохастических систем. М., 1971, 424 с.
2. А.Е. Барабанов, A.A. Первозванский. Оптимизация по равномерно-частотным показателям (Н-теория). Автоматика и телемеханика. 1992. № 9, с. 3-32.
3. А.Е. Барабанов, Т.Н. Штаненко. % 00-оптимальное управление и фильтрация при упреждающих наблюдениях. Воронежская весенняя математическая школа "Понтрягинские чтения-XI". Воронеж, 3-9 мая 2000, с. 14.
4. А.Е. Барабанов, Т.Н. Штаненко. Минимаксная интерполяция волновых процессов по зашумленным наблюдениям. Международная конференция DSO'2000. Екатеринбург, 30 мая 2 июня 2000, с. 57.
5. P.E. Калман, P.C. Бьюси. Новые результаты в линейной фильтрации и теории предсказания. Техническая механика, 1961, т. 83, сер. Д, № 1, с. 123-141.
6. X. Квакернаак, Р. Сиван. Линейные оптимальные системы управления. М.: 1977.
7. A.II. Колмогоров. Интерполирование и экстраполирование стационарных случайных последовательностей. Изв. АН СССР. Математика. 1941, № 5, с. 3-14.
8. Фильтрация и стохастическое управление в динамических системах. Под. ред. К/Г. Леондеса. М., 1980, 407 с.
9. A.M. JTemoe. Аналитическое конструирование регуляторов. Автоматика и телемеханика, 1960, № 6, с. 5-14.
10. Р.Ш. Липцер, A.FI. Ширяев. Статистика случайных процессов. М., 1974, 696 с.
11. Док.С. Медич. Статистически оптимальные линейные оценки и управление. М.: Энергия, 1973.
12. М.А. Огарков. Методы статистического оценивания параметров случайных процессов. М., 1980, 208 с.
13. O.A. Петров, B.H. Фомин. Линейная фильтрация случайных процессов. Л.: Изд-во Ленингр. ун-та, 1991.15 161718 1920