Управление и оценивание в линейных стохастических системах с дополнительными помехами тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Ляшенко, Елена Александровна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Екатеринбург МЕСТО ЗАЩИТЫ
1995 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Автореферат по математике на тему «Управление и оценивание в линейных стохастических системах с дополнительными помехами»
 
Автореферат диссертации на тему "Управление и оценивание в линейных стохастических системах с дополнительными помехами"

ГЪсударственньга комитет Российской Федерации по высшему образованию Уральский государственный университет им. А.М.Горького

РГб ол

2 2 } 'г--т. На правах рукописи

Ллшенко Елена Александровна

УПРАВЛЕНИЕ И ОЦЕНИВАНИЕ В ЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМАХ С ДОПОЛНИТЕЛЬНЫМИ ПОМЕХАМИ

01.01.02. - дифференциальные уравнения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата фиэшо-математических наук

I

---

Екатеринбург - 1995

Работа выполнена в Уральском ордена Трудового Красного Знамени государственном университете им. A.M. Горького на кафедре информатики и процессов управления.

Научные руководители - доктор физико-математических наук,

профессор В.Е. Третьяков - кандидат фгоико-математических наук, доцент Л.Б. Ряшко Официальные оппоненты - доктор фиоико-математиических наук,

профессор И.Л. Кац - кандидат фгоико-математических наук, доцент A.C. Кощеев Ведущая организация - Институт математики и механики УрО РАН

Защита состоится "ii ^^СМ 1995 г. в часов на (заседании

диссертационного совета К 063.78.03 по присуждению ученой степени кандидата физико-математических наук в Уральском ордена Трудового Красного Знамени государственном университете им. A.M. Горького (620083, г. Екатеринбург, пр. Ленина, 51, комн. 248).

С диссертацией можно ознакомиться в библиотеке Уральского государственного университета.

Автореферат разослан » £~ » Ui&J 1995 г.

Ученый секретарь диссертационного совета

к.ф.-м. н., доцент

Пименов В.Г.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Проблема оценивания фаоовых координат и хонструирования регуляторов в системах с неполной информацией воо-никает в различных прикладных задачах, саяоанных с моделированием динамических объехтов и управлением динамическими процессами.

Раоработхе алгоритмов оценивания я управления посвящено большое количество исследований хах отечественных, так и зарубежных авторов. Детерминированная задача наблюдения впервые была рассмотрена в работах Н.Н.Красовскога и Р.Калмана. Основы теории оптимальной рекуррентной фильтрации были заложены Р.Калманом и Р.Бьюси. Игровой подход I задачам наблюдения и управления при известных ограничениях на помехи применялся Н.Н.Красовским и А.Б.Куржан-схим. Реоультаты по минимаксному оцениванию з постановке, дояусха-ющей рекуррентное решение,принадлежат А.Б.Куржанскому, й Л.Капу, Б.Й.Ананьеву. Основные достижения по оцениванию и управлению в стохастических системах отражены в книгах Р.Ш.Липцера и А.Н.Ширяева, Я.Я.Ройтенберга, М.Х.А.Дэвиса, В.Н.Фомина, Ф.Л.Черноусько и В.Б.Колмановсхого. Обширная библиография приведена также в обоо-рах В.Б.Колмановсхого, К.Т.Леондеса, Б.М.Сотсхого и В.Ю.Щербакова.

Стандартная постановка задачи линейной оптимальной фильтрации требует достаточно подробных сведений о параметрах и начальных данных исходной системы, о статистических характеристиках шумов в объекте а хаяале наблюдений. В реальных приложениях эта информация часто неизвестна, и влияние неучтенных факторов приводит х искажению оценок, а иногда и ж расходимости теоретически сходящегося алгоритма фильтрации (см., например, Сейдж Э., Меяса Дж. "Теория оценивания и ее применение в свяои а управлении"). Методам решения оадачи оценивания при неточной модели процесса и неизвестных хо-зариацлях шумов, а тахже аналшзу вычислительной погрешности при цифровой реалгоадии алгоритмов оценивания я управления посвящено множество статей отечественных и зарубежных авторов.

В настоящей диссертации рассматривается оадача оценивания состояния линейной стохастической системы при помощи фильтра заданной структуры (типа фильтра Калмана). Разного рода неучтенные погрешности моделируются случайными помехами иовестной интенсивности, действующими в самом фильтре. Похаоано, что игнорирование дополнительных помех может привести 5 расходимости фильтра. Предлагается процедура оптимального оценивания, учитывающая такие помехи

на этапе выбора коэффициентов. Демонстрируется устойчивость предложенной процедуры, в том числе и для жестких систем.

Особое внимание в работе уделяется оадаче оценивания с частично шш полностью бесшумными наблюдениями, йспоаызование в атаи случае наблюдателей пониженного порядка поовопяет уменьшить раомер-ность исходной задачи, а, следовательно, и сложность реализации алгоритма оценивания. Новым элементом, внесенным в классическую постановку оадачи, является присутствие случайных помех в динамическом овене наблюдателя. В работе конструируется локально оптимальный наблюдатель, учитывающий воздействие помех в динамическом блоке. Для систем с постоянными коэффициентами исследуются два способа построения стационарного наблюдателя, выводятся уравнения оптимального стационарного наблюдателя с помехами.

В диссертации также подробно рассматривается задача управления линейной системой с аддитивными помехами при неполной информации. Оптимальный (качество управления определяется среднеквадратичным функционалом) регуиятор состоит ио фильтра и обратной свяои, формирующей управление по выходным переменным фильтра. К такому регулятору в системах с аддитивными шумами приводит теорема разделения. В работе показано, что существуют и другие регуляторы той же структуры, доставляющие минимум квадратичному функционалу. Вводится понятие класса эквивалентных регуляторов и дается его конструктивной описание.

На практике неизбежно воонгхают равного рода искажения, сопровождающие аналоговое юга цифровое моделирование динамического блока оптимального регулятора. В работе они представлены дополнительными помехами, действующими в динамическом овене. Показано, что, во-первых, игнорирование дополнительных помех может привести к неограниченному росту значения квадратичного функционала; во-вторых, эквивалентные в классической постановке регуляторы по-разному реагируют на воздействие дополнительных вовмущений.

Привадятся раопнчные способы учета помех в динамическом овене. Сначала решается о а дача выбора оптимального регулятора с дополнительными помехами среди регуляторов, вквивалентных регулятору теоремы разделения. Затем рассматривается более широкий класс регуляторов с оаранее определенной структурой (динамическое овено калма-ковского типа + обратная связь). Для регуляторов этого класса предложены два способа учета дополнительных помех.

Целью работы является:

1) исследование поведения фильтра Калмана-Бьюси, наблюдателя пониженного порядка и регулятора теоремы разделения в присутствии случайных помех в динамическом овене;

2) построение оптимальных наблюдателей (полного и пониженного порядка) и оптимальных регуляторов с дополнительными помехами для линейных стохастических систем.

Общие методы исследования опираются на концепции и реоуль-таты теории оптимального оценивания и управления.

Научная новиона работы (заключается в следующем:

1. Выведены уравнения фильтра, учитывающего присутствие дополнительных помех на втапе выбора кооффициелтов, и доказана его оптимальность.

2. Получены уравнения локально оптимального наблюдателя пониженного порядка с дополнительными помехами в динамическом овеке. Предложены различные способы построения стационарного наблюдателя и выведены уравнения оптимального стационарного наблюдателя с дополнительнымитгомехами.

3. Для линейных непрерывных стохастических систем с неполной информацией впервые вводится понятие эквивалентного регулятора и Дается конструктивное описание класса таких регуляторов.

4. Исследуется поведение регулятора теоремы разделения и эквивалентных ему регуляторов в присутствии дополнительных помех в динамическом блоке. Предложены различные способы учета таких возмущений. Получены уравнения условно оптимального и оптимального регуляторов с дополнительными помехами.

Все основные реоультаты диссертационной работы являются новыми.

Теоретическая н практическая ценность работы, Исследована классическая задача управления линейной системой с аддитивными помехами и квадратичным критерием качества. Построен класс оптимальных эквивалентных регуляторов (формирующих тот же сигнал управления, что а регулятор теоремы разделения).

Рапного рода погрешности, вооникающие при практической реализации классического фильтра Калмана-Бьюси, наблюдателя пониженного порядка Люеябергера и оптимальных регуляторов, моделируются при помоащ случайных возмущении. Показано, что игнорирование дополнительных помех даже малой интенсивности может привести к к расходимости фильтра я неограниченному росту критерия качества управ-

дения. В работе предложены конструктивные способы оптимального учета влияния таких помех, что позволяет получить устойчивые алгоритмы оценивания и управления.

Апробация работы. Результаты работы докладывались иа научных семинарах в Уральском госуниверситете я в Институте математики и механики УрО РАН; на Всесоюзной конференции по механике в Екатеринбурге, 1890 г.; а также на конференциях в Киеве, 1990, 1991, 1992 и 1993 гг.

Публикации. По теме диссертации опубликовано 11 работ.

Структура и объем диссертации. Работа состоит но введения, четырех глав и списка литературы, изложенных на 106 страницах машинописного текста. Список литературы включает 83 наименования.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введения кратко наложено состояние вопроса и основные ре-оультаты работы.

В первой главе решается задача оценивания состояния линейной дискретной стохастической системы при помощи фильтров полного порядка с дополнительными помехами. Глава содержит 5 разделов.

В раод.1 приводится постановка о а дачи и исследуется поведение стандартного фильтра Калмава в условиях дополнительных помех. Рассматривается система следующего вида

х-к+1 = Лкхк -(- (1)

УШ = Ск+1хк+1 +%+ь & — 0,1,2,.., (2)

Здесь хк - п-мерный вектор, ук - т-мерныа вектор; АкяСк- известные матрицы сочтветствующих раомеров, взаимна неоависимые процессы & и г)к - п-мерная и т-мерная веггорные последовательности гауссо-вских величин с нулевыми средними значениями и матрицами ковариа-ций

Ш? - Ег)кт = № (3)

Бк > 0, Ук > 0, 6к[ - 5 - символ Кронекера.

Начальное состояние имеет гауссовское распределение с характеристиками Ег0 — то, Е(г0 - т0)(х0 - т0)Т = А0. Вектор х0 не оависит от

(к и Пк>

Оптимальная среднеквадратичная оценка состояния хк обычно формируется с помощью дискретного фильтра Калмана-Быоси

= Ак*к + Ь+1 [Уш ~Ск+гАкхк), хо^гпо. (4)

Здесь коэффициент усиления определяется следующим образом

*к+1(А) = Пк(А)С1+х(СшПк(А)С*ш + Ук+1у, . (5)

Щ{А) = АкАА\+Зк.

Матрица погрешности Ак = Е(хк - хк){хк - хк)т удовлетворяет рекур-рентньш соотношениям

Дш=фш[Дк), А> = Л>, (6)

Ф*+1(Л) = Пк(А) - Пк(А)С1+1(Ск+1Пк(А)С*ш + Уш)+Ск+1Лк(А).

При этом погрешность оценки £к : Зк = Е\\хк-хк\\2, определяется следом матрицы Ак : Jk — 1г(Ак).

При практической реализации оптимального фильтра присутствие разного рода неучтенных воомущений может привести к его расходимости. В настоящей работе рассматривается класс фильтров следующей структуры

= Ак-к + Рк+ЛУк+1 - ск+\^кгк) + П+1, го ~ т0 -Ь е. (7)

Здесь гк - п-мерныи вектор оценки, ик - независимый случайный п-вектор дополнительных помех с нулевым средним и матрицей коварн-аций Е¡/к1>1 = (Зк>0. Случайный вектор в с характеристиками Е& = О, Е5#т = в > 0, не зависящий от других случайных параметров задачи, моделирует ошибки в задании начального состояния системы (4).

Стандартный фильтр Калмана (4) - (6), который попадает в класс фильтров заданной структуры (7) при г/к = 0, 9 = 0, будем называть фильтром-1.

Во втором пункте разд.1 обсуждается случай, когда присутствие дополнительных помех игнорируется. Оценка, формируемая таким фияьт-ром-2, обозначается Р1^ — При этом реальная погрешность фильтра-2 А^р = Е(хк - - связана с ожидаемой А^ = Ак

следующим соотношением

4а)=41)+п, (з)

Рш=Вк+1РкВ1+1 + дк,и Ро=в, Вш={и-$$1Ск+1)Ак' (9)

В раод.2 для класса фильтров (7) сначала выводятся уравнения локально оптимального фильтра, учитывающего дополнительные помехи на этапе выбора коэффициентов,

= (10) 4%=+<5^+1' =д>+в,

а затем доказывается, что оценка zk3\ формируемая фильтр ом-3, является, в действительности, глобально оптимальной (Теорема 2.1).

В раод. 3 рассматриваются системы с постоянными коэффициентами. Теорема 3.1. Пусть 5 > 0, V > 0. Для того, чтобы у последовательности А^ при любой начальной матрице Л^ > 0 существовал предел Л® = lim Л^ при к оо, не зависящий от необходимо и достаточно, чтобы пара (АТ,СТ) была стабилизируема. При этом матрица В = (1а- Ф(Л(3))СТ1Л~1С)Л устойчива и матрица является единственным симметрическим неотрицательно определенным решением уравнения

A = $(A) + Q. (11)

Теорема определяет также асимптотическое поведение фильтра-1, который является частным случаем фияьтра-3 при Q = О.Уравненве для А^ - асимптотической погрешности фильтра-2, имеет вид

AW = AW + P, (12)

Р = ВРВТ + Q, В = (Jn - ДЫС*У~1С)А.

Для пределов последовательностей матричных коэффициентов F^ — и ^ выполняется

FW = Um F{2) = = ¿WcrV-1, (13)

к-* оо

F® = Um Ff] = Ф{АЩС*У~1 = {А& - Q)CW~K (14)

k—>oo

Во втором пункте раод.З рассматривается класс стационарных фильтров

zk+1^Azk + F{yk+1-CAzk) + vi+l. (15)

Здесь постоянная матрица F выбирается ио множества Т = {Ff матрица (/„ - FC)A - устойчива}. Для любой матрицы F е Т последовательность 1\[F) — Е(хк~Zit(F))(xit~Zjl(F)Y сходится при к-* оо к некоторой матрице T(F), которая и считается погрешностью стационарного

фильтра. Стационарным фильтром-2 напивается фильтр (15) с матрицей коэффициентов Р = а стационарным фильтром-3 - фильтр (15) с Р =

Справедливы следующие утверждения. Теорема 3.2. Последовательность сходится при к -* оо к ма-

трице Л^ - асимптотической погрешности фильтра-3, независимо от начальной матрицы Т0: Т(/^3)) =

Асимптотическая и стационарная погрешность фильтров-1,2 также совладают: Г(ЛЧ) = Л«, Т(№) =

Теорема 3.3. Пусть пара (Лт, Ст) стабилиоируема. Тогда оптимальный стационарный фильтр в классе фильтров (15) задается соотношениями

/г _ р(з)у Т(Г<3)) =

где определяется из уравнения (14), а Л® >0 — единственное неотрицательно определенное решение матричного уравнения (11). Т^ким образом, стационарный фильтр-3 является оптимальным.

Примеры разд.4 иллюстрируют основные результаты первой главы: игнорирование сколь угодно малых помех в фильтре может привести к его расходимости; известный способ регуляризации в данной ситуации неэффективен; использование предложенной в гл.1 процедуры учета дополнительных помех пооволяет добиться устойчивых результатов.

В раод.5 обсуждается задача дискретной фильтрации в жестких системах. Показано, что в то время как погрешность "чистого" фильтра Калмана-Быоси можно сделать сколь угодно малой за счет уменьшения шага А, выбор слишком малого Л приводит к расходимости фильтра-2. Вместе с тем испольоование фильтра-3 дает хорошие результаты.

Во второй главе рассматривается задача оценивания состояния линейной стохастической системы (1) - (3) с частично или полностью бесшумными наблюдениями при помощи наблюдателей пониженного порядка (НПП). Пхава состоит из 3 разделов.

В раод. 6 приводится постановка задачи и выписываются уравнения НПП 1-3 с дополнительными помехами в динамическом звене.

Если первые тп\ компонент вектора наблюдений (2) возмущаются сравнительно малыми шумами, то можно понизить порядок наблюдателя до размерности г = п- пг^. Предполагается, что исходная система (1) -(3) имеет каноническую форму, при отом матрица С* следующей структуры

/г,, 0

О

с = [/т-т1 : о;.

Начальное состояние xq имеет гауссовсжое распределение: Его — то, Е(г0 - mQ)(zQ - то0)т = А.

Класс наблюдателей пониженного порядка состоит из динамического звена и связи

Zfe+i = Mkzk + Dkyk + i/fc+1, (16)

xk = Nkzk + Rkyk> k = 0,1,... (17)

Здесь zk e Rr, xk e Ru — векторы оценок для Tkxk и хк соответственно; параметры наблюдателя Tk)Mk,Dk,Nk,Rk — матрицы соответствующих размерностей; vk — случайный г-вектор, независимый с другими шумами системы, Ei/k = 0, Evkvf = 6kiQfo Qfc > 0.

В качестве начального значения наблюдателя (16) - (17) берется вектор z\ — [0 : /*-т1](гло + в), где 9 — случайный вектор с характеристиками Е9 = 0, Е9Р1 = в > 0.

Ввиду малости помех т]к, обычно принимают ¿J. = у[, что, при некоторых дополнительных ограничениях иа параметры НПП, влечет

» Rk =

о

In—mi

Тк = : /л-m, - RkC]>

о

Ч Чу

(18)

где - (п - п»х) х ть а - (п- т0 х (т - тх).

Для погрешности Лк = Е(хк - хк)(хк - хк)т оценки хк, которая полностью определяется матрицей Ёк — : ЯЦ = [0 : справедливо рекуррентное соотношение

A+i = «i+i (Аь Лк+1) + W~k+i, А0 = А + в, IWА R) = (А - RC)nk(A)(U - RCT + RVHxR\

(ig; (20;

R =

0

Ä1 R2,

0 0 0 Qk+V

В настоящей работе параметры оптимального НПП, как и в случае фильтров полного порядка, определяются задачей

J = tri2M{Ak, Дш) min.

1

(2i:

Если в динамическом свене нет дополнительных помех (^ = 0, 0 = 0) то оптимальные параметры удовлетворяют системе

42i = «W^P). 4> = А,

где Фк+iiA) и Фд.+1(Л) — некоторые матричные функции. Наблюдатель (21) - (22) будем наоывать НПП-1. Оценка формируемая НПП-1, имеет погрепшость 4''-

НПП-2, формирующий оценку определяется следующим обраоом. Пусть Uk £ 0, 9 0, а матрица оадается по-прежнему: = При отом реальная погрешность 4^ НПП-2 свяоана с ожидаемой 4*' соотношениями

4а> = 41)+Сь (23)

= Ü Л » Ga = 6,

U Cri

G^B^f-fi?,, (24)

Gfc+i = Bk+lGkBl+1 + Qk+i-

Здесь Bk+l — (1Л - Д^1С)ЛЬ Bfc — правый нижний блок размерности (п - tt¡i) х (п - rrti) матрицы J?j..

НПП-2 не оптимален, т.к. на этапе выбора кооффициентов Rk+г сведения о дополнительных помехах игнорируются.

Параметры НПП-З, оптимальным обраоом (в смысле задачи (21)) учитывающего информацию о помехах щ, 9, удовлетворяют соотношениям

41 = ^i+i(43))+пщ.

В отличие от фильтров полного порядка, НПП-1,3 являются, вообще говоря, лишь локально-оптимальными. Однахо, в случае частично бесшумных наблюдений, ц]. = 0, оценка является оптимальной в обычном смысле.

В раод.7 рассматриваются системы с постоянными коэффициентами. На основе реоультатов предыдущего раодела выписываются уравнения НПП 1-3. Предполагается, что у параметров соответствующих переходных процессов существуют предельные значения

lim 4° = ¿(:)> Umfií!) = ¿(1). (26)

fc-oo " *-.оо * 4

иш43) = Л(3>, Um 43) = ДСЗ),

причем ДО), Д(3) € » = {R = [0 : h-mi]R/ Я(Д) = (In-RC)A - устойчива}, Д^Д1 : Д2].

Доя НПП-2 справедливо

Я<а> = Д«, Л« = üm 42> = ¿(4 + G, G =

о о

О G

(27)

6 = ВС!В* + д. (28)

Здесь В — правый нижний (п-тпх) х (п-т^) блок матрицы В(Д0)). Наблюдатели с параметрами ю-1), Д(2), Д(3) будем называть асимптотическими (АНПП).

Рассматривается также задача построения стационарного наблюдателя пониженного порядка (СНПП)

2*4-1 = Mzk + Dyk + Vk+1 = Nzk + R,yk,

(29)

N =

0

In—mi

R.=

'Till

R\ R]

, R, = [0 : = ДО : ДЯ,

M=TAN, D = ГАД,, T = {-fij : - Д2С].

Постоянная матрица Ä, выбирается то множества 5R, при ©том у последовательности матриц Ak(R,) из (19), (20) существует предел

Л, = lim Ah{R.)t

к—оо

удовлетворяющий уравнению

A = (h-R.C)n(A)(h-R.C)T + R.VR*+W) (30)

Д(Д) = ЛААТ + S.

Задача построения оптимального СНПН формулируется следующим образом

trA, -* min, д.е»

(31)

где А, удовлетворяет (30).

В работе приводятся необходимые условия экстремума (система нелинейных уравнений), которые задают параметры д(Д аУ (д = о), М3), А?) СНПП-1 и СНПП-З. Погрешность СНПП-2 определяется из (30), если подставить

В отличие от фильтров полного порядка асимптотический и стационарный наблюдатели не совпадают. Иногда, даже при (3=0, стационарный наблюдатель может быть существенно лучше асимптотического. Разница пропадает, если = 0 (первые тх наблюдений бесшумные), т.к. при втом наблюдатель совпадает с фильтром Калмана.

В разд.8 приводятся примеры, демонстрирующие устойчивость НПП к действию дополнительных помех в динамическом овене и преимущество оптимального стационарного наблюдателя по сравнению с асимптотическим. Покапано, что при наличии дополнительных воомугце-ний, точность оценивания наблюдателя пониженной раомерности может быть существенно выше, чем у фильтра полного порядка.

В третьей гладе обсуждается оадача управления линейной системой с аддитивными помехами при неполной информации". Выводятся уравнения для параметров оптимальных регуляторов, не удовлетворяющих теореме разделения. Глава состоит ио 3 разделов.

В разд.9 вводится понятие эквивалентного регулятора и дается конструктивное описание некоторого класса эквивалентных регуляторов. Рассматривается линейная стохастическая система

<Ь = А(|)е(<)Л + В(*)и(<)Л + <€[0,Г], (32)

¿у = С(г)х(0<Й + ¿г].

Здесь г(1) - п-мерный вектор состояния, «({) - г-мерный вектор управления, у(1) - т-мерный вектор наблюдений; А(1), !?(<) и С(1) - непрерывные матрицы соответствующих раомеров; и т/(г) - независимые вннеровские процессы с характеристиками

Е# = 0, Е= 5(0 > 0,

Бй»? = 0, ЕА^* = У(1)(И, У(г) > 0, Е<фй?т = 0.

Начальное состояние системы г(0) = г0 — случайный вектор, не зависящий от £(£) и 1/(0> Ех0 — ш0, Е(г0 - т0)(хц - гга0)т = Л0.

Для управления системой (32) обычно используют регулятор, состоящий го динамического овена

¿г = А(«)«(0Л + В(«)»(0«й + - г(0) = г0 (33)

я обратной свяои

и(<) = - #(<>(*) • ' (34)

Здесь z{t) - n-вектор оценки состояния x(t) системы (32), коэффициенты регулятора F(t) и K(t) ~ матрицы соответствующих размерностей. Качество управления определяется среднеквадратичным критерием г

/[и] = В {/\xT(t)M(t)x(t) + и'(«)Ж*)«(*)]Л + x*(T)Gx(T)}, (35) о

где M(t) > 0, N(t) > 0 - непрерывные симметрические матрицы, G > О - постоянная матрица, Gr = G.

1Ъким образом, состояние z(t) и управление u(t) на отрезке [0,Т] однооначно определяются набором параметров U — (z0, F{t), K{t)). Для регуляторов U = (z0, F(i), K{t)) и V = (z0, F(t)f K{i)) справедлив следующий результат.

Теорема 8.2. Пусть Ф{1) - невырожденная на отрезке [О, Т\ матрица, удовлетворяющая задаче Коши

è(t) = А{г)Ф{1) + Ф(«КД0С(0 + Я(«)ЛГ(<) - A(t)) - B(t)K(t)~ (36)

-®(i)F(i)C(t)i(i), Ф(0) = Ф0.

Тогда управления uft) и û(t), формируемые соответственно регуляторами U в Ü, где параметры U определяются по U соотношениями

z0 = <P0zß, F(i) = mm, K(t) = K(t)0-l(t), (37)

тождественно совпадают на отреоке [0,Т] : u(t) s û(i).

Для регуляторов, параметры которых U и U удовлетворяют условиям теоремы, совпадают и значения критерия (35): /[и] = J[ü\. Таким образом, для фиксированного регулятора U теорема 9.1 позволяет описать класс эквивалентных ему регуляторов.

На эквивалентные регуляторы можно смотреть как на различные реализации одного и того же управления. При этом, динамическое звено (33) не обязательно является фильтром: формируемый км вектор 5(1) может и не быть оценкой состояния x{t) исходной системы (32).

Для систем с неполной информацией в качестве оптимального обычно ис.польоуют регулятор (33), (34), параметры которого удовлетворяют теореме разделения

Zo = mQ, F{t) = A(t)CT(t)V~l(t)t K{t) = N-'itjB^^Lil), (38)

где матрица A(t) = E(r(i) - z(t))(x{t) - z(t))T есть решение задачи

À(t) = A(t)A(t) + A(t)A*(t) - A(t)C\t)V~\t)C{t)A{t) + 5(f), (39)

¿(0) = А,;

а матрица L{t) удовлетворяет

¿(t) = ~AT(t)L(t) - L(t)A{t) + - M(t), (40)

L(T) — G.

йо предыдущих рассуждений следует, что теорема рая деления определяет лишь одну го вооможных реализаций оптимального управления. Действительно, для регулятора (38) - (40) по теореме 9.1 можно построить класс эквивалентных ему регуляторов. Очевидно, что все регуляторы данного класса являются оптимальными.

В раод.Ю рассматривается класс регуляторов U = (¡¿о, F(î),K(i)), эквивалентных регулятору U = (z0, F(t), K{t)) теоремы разделения. Матрицы F(t) и K(t) определяются но соотношений (37) по решению Ф{1) задачи Копт (36).

Всевозможные, неучтенные в классической схеме возмущения будем по-прежнему моделировать дополнительными помехами, действующими в динамическом звене

dz = A(t)z(t)dt + B(t)u{t)dt + F(t){dy - C{t)5{t)dt) + du, ' (41) i(O) = #o(n»o + 0),

где i>(t) - векторный винеровский процесс, независимый с другими шумами системы, Edi' = 0, Edvdvr = Q(t)dî, Q(t) > 0; го0 = Ex0î 9 -случайный вектор, моделзрующий ошибки в задании начального состояния динамического блока, Ев = 0, Еввт = О, 6 > 0.

Поскольку все помехи в задаче независимы, то для функционала (35) легко получить разбиение

J — J0 + J} + J„, (42)

где

т

Jo- ] tr(M[t)Ro(t))dt + tr(0Ro(T)) о

оптимальное значение критерия в случае i/(f) = 0, в — 0, матрица R0(i) удовлетворяет системе

0]

Ro = J(t)Mt) + Ro (i)J^(t) + Г(0, Hfl(0) =

о о

J ; (43)

IS

J.

Je~ jtr(M{t)R$(t))dt

добавка, вызванная влиянием неопределенности начального состояния, |/(<) = 0, 0 £ 0, матрица определяется но задачи

Ri = Л(*)Н*(<) + R3(t)A-{t), R,(0) :

Ф0&ФЪ -Ф0вФ% ~Ф09Ф1 Ф0вФ1

(44)

J„ = j tr{M{i)R»(t))dt

добавка, вызванная дополнительной помехой в динамическом (звене регулятора, 1/(1) ^ 0, в = 0, для матрицы выполняется

É„. = ^(i)Ri/(i) + R„(i)^(t) + Q(i), R„(0) = 0.

(45)

Здесь M(t), £?, A(t), Q(i) и F(t) — блочные матрицы следующей структуры

M{t) =

м(г) М(ъ)

м(о к^щ^кф+мю

G G '

, а = G G

A(t) - F(t)C(t) 0

F(t)C(t) A(î) - B(t)K{t)

Q(t)

Q(t) -Q(i)]

-Q{t) Q{t) J '

r(t) =

F(t)V(t)F*(i) + S(t) -F(t)V(t)P(t)

-F(t)V(t)F*{t) F(t)V(t)Ht)

В силу теоремы 9.1 функционал ^ имеет одинаковое ¡значение для всех регуляторов, эквивалентных регулятору (38) - (40). В то же время для различных представителей этого класса добавки .I$ а принимают ргодичные значения, т.е. оависят от Ф0. При наличии дополнительных возмущений регулятор теоремы разделения может не быть наилучшим в классе эквивалентных регуляторов.

В работе обсуждается задача оптимизации критерия (42) по параметру #0. Полученный таким образом регулятор является оптимальным лишь в классе регуляторов ехвнвапентных регулятору теоремы разделения.

В pao д. 11 рассматриваются стационарные эквивалентные регуляторы

dz = Az{t)dt + Bu(t)dt + F(dy - Cz(t)dt), (46)

u{t) = -Kz(t). (47) Среднеквадратичный критерий имеет вид

J\u\ = üm E\xT(t)Mx(t) + uT(t)Nu(t)}, M > 0, N > 0. (48)

Пара (А, В) ситается стабилизируемой, а пара (А, С) обнаруживаемой. Тогда Т = {F/A- FC устойчива} и К — {К/А - ВК устойчива} непусты. Регулятор (46), (47) с параметрами U = (F,K), Fe F, К е К, будем называть стабилизирующим. Для стабилизирующего регулятора U — (F, К) и регулятора U = (F, К) справедлив следующий результат. Теорема 11.1. Пусть параметры регулятора Ü определяются соотношениями

F = 0F, К = КФ'\ (49)

где Ф - невырожденная матрица, удовлетворяющая уравнению

АФ + Ф{РС+ВК-А)-ФРСФ-ВК = 0. • (50)

Тогда регулятор U будет также стабилизирующим (F е F, К е £).

При этом для соответствующих регуляторам U, V стационарно распределенных состояний А = í Z j , а стационарно распределенных управлений и = -Kz, « = -Кг выполняется

Емт = E5íT, Et¿uT = EimT. (51)

Таким образом, в стационарном случае многообразие регуляторов U, эквивалентных исходному регулятору U, определяется количеством решений матричного уравнения (50). Максимально возможное число решений — Особый интерес представляет случай когда их всего два. Если потребовать невырожденности матрицы Ф - 1п, то для матрицы D = (Ф - 1Л)~1 легко выводится следующее линейное уравнение

D(A - FC) - (А - BK)D - FC — 0,

которое имеет единственное решение, если спектры A- FC и А- ВК не содержат общих точек. В этих обстоятельствах класс эквивалентных регуляторов состоит ио двух представителей: регулятора U = [F, К) а альтернативного ему 0 = ((D~l -f Ia)F, K(D -Ь D).

В разделе рассматривается также класс оптимальных регуляторов V = (Р., К) (эквивалентных регулятору теоремы разделения). Исследуется устойчивость различных представителей класса к действию дополнительных помех.

В отличие от рассмотренной ранее оадачи выбора наиболее устойчивого к действию дополнительных помех "эквивалентного" регулятора, четвертая глава посвящена решению оадачи оптимального управления для более широкого класса регуляторов заданной структуры

¿г = А(*)*(«)Я + В(1 )и{1)<И + ^(*)(<1у - С(«)*(«)А) + du, (52)

*(0) = го<> + 0, »(0 = -К"(*)*(0- (53)

В разд.12 выписана нелинейная краевая задача, которой должны удовлетворять параметры оптимального регулятора с помехами. Численные методы решения таких задач (например, метод Ньютона) существенно зависят от выбора начального приближения. В данном случае естественно искать подходящее начальное приближение в классе регуляторов, эквивалентных регулятору (38) - (40) теоремы разделения.

В разд. 13 рассматривается более простой условно оптимальный регулятор, который получается при учете дополнительных помех в рамках принципа разделения: коэффициент обратной связи #(*) как в регуляторе теоремы рап деления, а коэффициент усиления Р{1) выбирается так, чтобы оценка была оптимальна в классе фильтров оаданной струг-туры (52). Параметры этого регулятора обозначаются К•/(/)■,

формируемые им оценка и управление — гу(1), иу(%). Теорема 13.1. Регулятор (52), (53) с коэффициентом обратной свяои удовлетворяющим соотношениям (38), (40), и коэффициентом усиления Р(<) = Ру{1)\ где

= (54)-

а матрица Лу{1) ~ Е(г(<) - гу(1))(а;(1) - гу{1))~ — решение следующей оадачи

+5(1)+<?(*), Ау(0) = Да + в, является условно оптимальным.

Другими словами, при заданном K(t) = Ky(t) коэффициент усиления Fy(i)> удовлетворяющий (54), (55), минимиоирует значение функционала J из (35) по всем функциям F(t) на отрезке [О,Г].

Отметим, что в процессе доказательства этой теоремы была решена задача оптимального оценивания состояния x{i) непрерывной системы (32). Учет дополнительных помех v(t), $ сводится к увеличению интенсивности шума в объекте и погрешности начального состояния z(0) системы (52) — матриц S(t) и Л0, соответственно. Таким образом, в данном случае можно пользоваться стандартным фильтром Калмана, взяв вместо S(t) матрицу S(t) = S(t) -h Q(t), вместо Д> — матрицу Л0 = Д0 + в.

В раод.14 рассматриваются стационарные регуляторы с дополнительными помехами. Получены необходимые условия, которым должны удовлетворять параметры оптимального регулятора. Наличие аддитивной помехи в динамическом блоке приводит к тому, что ошибка оценивания х - z не ортогональна оценке z. В этой ситуации динамическое звено регулятора перестает играть роль фильтра. Поскольку теорема разделения не выполняется, то для отыскания оптимальных параметров приходится решать нелинейную систему большой размерности (Теорема 14.1).

В работе приведены также уравнения условно оптимального стационарного регулятора, для отыскания параметров которого необходимо решить всего два алгебраических уравнения Риккати (Теорема 14.2).

Список работ по теме диссертации

1. Аронов П.М., Ляшенко Е.А., Ряшко Л.Б. Метод оптимального линейного оценивания для определения динамических характеристик средств измерений // Измерительная техника, 1991; N11, с.Ю - 13

2. Ляшенко Е.А. Оптимальное рекуррентное оценивание в линейных стохастических системах с помощью фильтра, содержащего случайные помехи. Тезисы докладов 19 Региональной конференции молодых математиков. Свердловск, 1988, с.22

3. Ляшенко Е.А. Об устойчивости наблюдателей пониженного порядка к воздействию помеха в динамическом звене. Тезисы докладов конференции "Моделирование и исследование устойчивости систем". Киев, 1993, часть 1, с.88

4. Ляшенко E-.A. Построение оптимальных наблюдателей пониженного порядка в присутствии помех а динамическом звене // Деп. в Вй-

НИТИ 15.11.93, N2834-B93, 16с.

5. Ляшенко Е.А., Ряшко Л.Б. Об устойчивости дискретной фильтрации в жестких системах. Теонсы докладов научной школы-семинара "Моделирование и исследование устойчивости физических процессов". Киев, 1990, с.44

6. Ляшенко Е.А., Ряшко Л.Б. Оценивание состояния дискретной динамической системы при помощи фильтра, содержащего случайные помехи. Теоисы докладов VII-ой Всесоюзной конференции "Управление в механических системах". Свердловск, 1990, с.73

7. Ляшенко Е.А., Ряшко Л.Б. Построение регулятора, устойчивого к помехам в фильтре. Теоисы докладов научной школы-семинара "Моделирование и исследование устойчивости физических процессов". Киев, 1991, с.56

8. Ляшенко Е.А., Ряшко Л.Б. Об оценивании при помощи фильтра, содержащего случайные помехи // АиТ, 1992, N2, с.75 - 83

9. Ляшенко Е.А., Ряшко Л.Б. О чувствительности оптимальных регуляторов к воздействию помехи в динамическом звене. Тезисы докладов конференции "Моделирование и исследование устойчивости процес-

' сов". Киев, 1992, часть 2, с.97

10. Lyashenko Е.А., Ryashko L.B. Discrete-time observers with random noises in dynamic block //.IEEE Trans. Automat. Control, 1995, vol. AC-40, Do.l, pp.165 - 169

11. Ляшенко E.A., Ряшко Л.Б. Построение оптимальных регуляторов в присутствии дополнительных помех // Деп. в ВИНИТИ 09.03.95, N 653 - В95,16с. •

Подписано к печати 14.04.95. Формат 60X84 1/16

Бумага газетная. Печать офсетная.

Уч. изд. л. 1,0. Усл. печ. л. 1,0. Тираж 100 эхо. Зак.

620083 Екатеринбург, пр.Ленина, 51 Ткполаборатория УрГУ