Задачи многократной коррекции управляемых систем тема автореферата и диссертации по математике, 01.01.02 ВАК РФ
Гредасова, Надежда Викторовна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Екатеринбург
МЕСТО ЗАЩИТЫ
|
||||
2012
ГОД ЗАЩИТЫ
|
|
01.01.02
КОД ВАК РФ
|
||
|
005009950
/
Гредасова Надежда Викторовна
ЗАДАЧИ МНОГОКРАТНОЙ КОРРЕКЦИИ УПРАВЛЯЕМЫХ СИСТЕМ
01.01.02 — дифференциальные уравнения, динамические системы и оптимальное управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Екатеринбург - 2012
005009950
Работа выполнена в Уральском Федеральном Университете имени первого президента России Б.Н. Ельцина на кафедре прикладной математики Уральского энергетического института.
Научный руководитель: доктор физико-математических наук,
Ананьев Борис Иванович.
Официальные оппоненты: доктор физико-математических наук,
профессор Кремлев Александр Гурьевич;
Защита состоится 22 февраля 2012 года в 13°° на заседании диссертационного совета Д 004.006.01 при Институте математики и механики УрО РАН по адресу: 620990, Екатеринбург, ул. С. Ковалевской, 16.
С диссертацией можно ознакомиться в научной библиотеке Института математики и механики УрО РАН.
Автореферат разослан января 2012 г.
Ученый секретарь диссертационного совета
кандидат физико-математических наук, доцент Розенберг Валерий Львович.
Ведущая организация: Южно-Уральский государственный
университет (г. Челябинск).
доктор физико-математических
Н.Ю. Лукоянов
Предыстория и актуальность темы
Диссертационная работа посвящена разработке эффективных методов коррекции движения управляемых систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями. Предполагается, что система находится под воздействием неопределенного детерминированного возмущения. Начальное состояние системы также предполагается неизвестным. Кроме того, фазовый вектор объекта может быть не доступен для измерения. Однако по ходу движения измеряется некоторый сигнал, несущий информацию о фазовом состоянии системы. На основании доступной информации требуется сформировать управление, минимизирующее терминальный функционал в расчете на худший случай реализации начальных состояний и неопределенных возмущений.
Таким образом, в работе рассматриваются задачи, которые можно отнести к проблемам управления детерминированными системами с неполной информацией. Данное направление в теории управления имеет довольно длинную историю и достаточно разработанные результаты. Вместе с тем исследования в данной области далеко не закончены и активно продолжаются в настоящее время. Они стимулируются новыми требованиями к качеству управления, развитием технических измерительных средств, новыми задачами создания распределенных систем управления.
Единый подход к решению указанных проблем изложен в монографии1
Н.Н. Красовского и А.И. Субботина, где в главе 15 рассмотрены методы решения весьма общей информационной игровой задачи. В этом подходе предполагается, что по ходу процесса становится известной некоторая выпуклая компактная область, содержащая истинный вектор системы. Способы построения области не уточняются. В этом факте заключаются возможные варианты уточнения постановки задачи. Так, например, в работе2 Н.Н. Красовского область представляется в виде га-мерного прямоугольника со сторонами, параллельными осям координат. В монографии3 А.Б. Куржан-ского изложены методы, связанные с построением в фазовом пространстве т.н. “информационного множества” (далее часто используем сокращение ИМ). Именно эти методы положены в основу решения задач настоящей диссертации. Методы “информационных множеств” использовались в работах
1Красоьский Н.Н., Субботин Л.И. Позиционные дифференциальные игры. М.: Наука, 1974.
2Красовстй Н.Н. Игровая задача о коррекции движения // Прикл. матем. и мех. 1969. Т. 33, вып. 3. С. 386-396. •
3Куроканский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
Б.И. Ананьева, А.Б. Куржанского, Г.С. Шелементьева4, А.Г. Кремлёва0.
Уточним постановку задачи, которую будем называть “задачей однократной коррекции”. Пусть задана управляемая система вида
± = /(*,х, щ и), ге[£0,Т], (1)
где х £ Д" — фазовый вектор системы, не доступный для измерения, и £ Д? — управление, и£ В? — неопределенное детерминированное возмущение. По ходу процесса измеряется вектор
■ •■■■■ У = дЦ,х,ь), у £ Дт. (2)
Вектор-функции f{t,д(£, ■,•) при фиксированном £ предполагаются непрерывными. При фиксированных х, и, V функции /, д считаются кусочно - непрерывными по Ь. Заданы априорные ограничения (хо, «(•)) € Уо, у(-) € XI, где Уо,и, — слабо компактные множества в пространствах А” х ЩЬо,Т\ и ЬЦЬо,Т] соответственно. Для существования и продолжимости решений уравнения (1) примем стандартные условия:
. ; |!/(г,я1,и(г),и(г)) - 1(ь,х2,и{*)МЩ < — аг2||, (3)
: И/^,ж, м, г»)}] < я{1 + ||ж|| 4- ||и|| + ||и||), х £ Д", и £ Д9, V € Др,
где и(-) Е и, «(•) € рго^^Уо, (£, я,) £ О, г = 1,2. Здесь С — компактное подмножество'в [4о, Т\ х кп, Хо,п,ь, х — константы, || ■ || — евклидова норма.
Введем ряд обозначений. Сужение измеримой вектор-функции 1(5), й £ ^о,Т], на отрезок [£о,£] будет обозначаться через £*(•), асужение на отрезок [£, Т) — через х4(-).
Определение 1 (Куржанский А.В.). Информационным множеством (ИМ) Х(1,у,и) системы (1), (2), где и € и, называется совокупность всех таких векторов {о: (4)}, которые могут реализоваться в системе при некоторой паре (а:о,и(-)) £ Уо при условии, что выход уравнения (2) на отрезке [£о,£] почти всюду совпадает с измеренным сигналом 2/4(-).
Ясно, что область Х^,у,и), формально зависящая от сужений уь{-), и‘(-), зависит также и от ограничений Уо. Характер этой зависимости будет уточняться ниже с учетом вида ограничений (интегральные, мгновенные и т.д.). Чтобы подчеркнуть указанную зависимость будем иногда писать #(£,?/,« | У0). В начальный момент имеем Х(^,у,и) = рго^Уо, где проекция будет компактом в силу сделанных предположений.
4Ананьев Б.И., Куржанский А.Б., Шелементпъев Г.С. Минимаксный синтез в задачах наведения и
коррекция движения // Прикл. матем. и мех. 1976. Т. 40, вьш. 1. С. 3-13.
ъКремлев А.Г. Задача коррекции движения квазилинейной системы при квадратичных ограниче-
ниях // Дифф. уравнения. 1984. Т. 20. № 8. С. 1348-1359.
Определение 2. Совместимым множеством У(£, у, и) системы (1),
(2), где и е и, назовем совокупность всех пар {(ж(*),г>4(-))}, для которых найдется элемент (хо, у(-)) Е Уо такой, что выход уравнения (2) на отрезке [£о, 4] почти всюду совпадает с измеренным сигналом г/(-), причем функция ««(•) есть сужение и(-) на отрезке [£,Т].
Для подчеркивания зависимости совместимого множества от У0 будем иногда писать V(4, у, и | У0). Связь информационного и совместимого множеств выражается равенством Х^,у,и) = рго^У(£,?/,«). Совместимые множества обладают полугрупповым свойством: V(в, $(•), «?(•) | V(1,у, и)) = V(з,у,и | У0), где качестве следствия имеем
равенство ИМ: *(«,# | V(*,у,и)) = Х{з,у,и \ У0). Отметим, что
информационные множества также обладают полугрупповым свойством при мгновенных ограничениях на возмущения.
Продолжим формулировку задачи коррекции. Первоначальная цель управления состоит в минимизации функционала Ф(Х(Т, у,и)) в конечный момент времени, где Ф(-) — некоторый функционал, заданный на компактных подмножествах Яп. Функционал предполагается ограниченным снизу и монотонным: Ф(^1) < Ф(Х2), если Х\ с Хг. Область достижимости системы (1) в момент £ по всем параметрам У0 обозначим через Д*(и 1 Уо). Множество Уд будет опускаться, если это не приводит к недоразумениям. В начальный момент времени назначается управление щ, решающее программную задачу
Ф(Д?г(и)) -*• тт„еи • (4)
Такое управление в общем случае определяется неоднозначно. Будем считать, что минимум в задаче (4) существует, и выбрано какое-то управление и0 € А^тшФ(;Гт(и)). Далее назначается некоторый момент времени 5 Е [£о, Т\, вплоть до которого в системе (1) сохраняется управление ид(') и проводится наблюдение согласно уравнению (2). В момент 5 наблюдение прекращается, формируется область достижимости Хт(и„(-) | V{в,у,щ)) и решается вспомогательная программная задача
ЦХт(ив{-) | V(з, у, «о))) -> тшиа(.)еик) = Гв{у, щ). (5)
Здесь и далее множество 11(иг) состоит из всех функций {«((•)}, которые вместе с начальным отрезком и* составляют некоторую функцию и £ и.
Выберем какое-то решение задачи (5) и обозначим его и80(-). В силу свойств функционала Ф значение оптимального функционала в задаче (5) не больше аналогичного значения задачи (4). Вопрос заключается в том,
как выбрать момент окончания наблюдения я. В цитированных выше работах А.Б. Куржанского и его школы предлагалась следующая конструкция.
Пусть У(я, £ | V(Ь,у,и)) означает множество всех продолжений {№(■)} сигнала уг{-) на отрезок [£о>в], где £ < в, при назначенном управлении и & и. Определяются величины
■ Г4(в1|/>ио)=8ирй(.)бУМу(4,У1ио))Г,(»,«о))
- г*(£, у, и0) = ХПШве[41Т] п(в, у, и0).
Теперь задачу однократной коррекции можно сформулировать так.
. Задача 1 (Однократной коррекции). Найти наименьший корень уравнения
■ г,(г,у,щ) = п{у,щ). (7)
Этот, наименьший корень, обозначаемый з, называется моментом коррекции исходного управления щ, которое изменяется на им(-) на оставшемся отрезке управления [5,Т].
Имеются иные постановки задачи, представленные в работах Ф.Л. Чер-ноусько6, Н.А. Парусникова, В.М. Морозова, В.И. Борзова7, В.Н. Афанасьева и др8. В частности, класс управлений может быть из пространства обобщенных, функций первого или более высокого порядка. Многие постаг новки допускают присутствие стохастических или смешанных возмущений, см. работы В.В. Александрова, Б.И. Ананьева, В.Н. Афанасьева, Й.А. Богуславского9, И.А. Дигайловой10, Д.М. Климова, А.И. Матасова.
Практически решение представленной выше задачи 1 достигается при использовании следующей дискретной схемы.
Дискретная пошаговая процедура. Пусть А : £о < £1 < ... < = Т —
разбиение отрезка [к,Т], и |А| = тах{£{ - £4_ 1 :1 < г ^ ЛГ}. Тогда:
.. (а) До начала процесса решается задача (4) и находится оптимальное управление и0, которое сохраняется на начальном отрезке [<с> *1]-
(б) В момент и в последующие моменты и проверяется равенство (7). Если г,(и,у,щ) < г^(у,щ), то управление на следующий отрезок [^,^+1]
0 Черноусым Ф.Л. Минимаксная задача одноразовой коррекции при погрешностях измерений // Прикл. матем. и мех. 1968. Т, 32, вып. 4. С. 587-595.
. 7Парусников Н.А., Морозов В.М., Борзов В.И. Задача коррекции в инерциальной навигации. М.: Изд-во МГУ, 1982.
8Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высшая школа, 2003.
9Богуславский И.А. Прикладные задачи фильтрации и управления. М.: Наука, 1983.
10Дигайлова И.А. Задача фильтрация со смешанной неопределенностью // йзв. РАН. Теория и системы управления. 2001. К* 5. С. 16-24.
не меняется. Иначе на весь оставшийся отрезок [U, Т] назначается новое управление Що(-), а момент i* объявляется моментом коррекции.
Вообще говоря, как отмечалось выше, начальное управление щ может определяться неоднозначно, и момент коррекции может зависеть от этого управления. Однако (особенно в линейных задачах) весьма часто имеем щ н 0. Как видно из построения, управление на отрезке [U,T] вычисляется позиционно, на основе информации г$(■)}.
Научная новизна работы
В данной работе мы несколько обобщаем задачу 1. Если процесс наблюдения не является затратной процедурой, то его следует продолжить после нахождения первого момента коррекции. Таким образом, возникает
Задача 2 (Многократной коррекции). В соответствии с разбиением X до начала процесса вычисляется управление щ (решение задачи (4)), которое сохраняется на начальном отрезке [£o,^i]- На отрезке выбирается управление uhi{-), совпадающее с щ(-), ecmrt(ti,y,u0) < rtl(y,u0). В противном случае i(-) = щго(-), где и^о(-) — одно из решений задачи (5) при s = t\. В последующие моменты U процедура повторяется.
В результате решения задачи 2 возникает управление uo S U, которое корректируется, вообще говоря, более чем в одной точке. В конце процесса подсчитывается результат гТ{у,и0), который по построению не хуже, чем аналогичный результат решения задачи 1. Помимо сформулированной задачи ниже рассматриваются некоторые её модификации. В частности, в том случае, когда допустимо изменение управления в каждый момент разбиения А, получается наилучший результат.
Сформулированные задачи предполагают эффективное вычисление величин (6), умение строить информационные множества и множества достижимости для рассматриваемых систем. В связи с этим укажем один весьма общий способ определения информационных множеств, основанный на методе динамического программирования и предложенный в работах А.Б. Куржанского и П. Варайи11. Пусть уравнение (2) имеет вид У — 9{t>x) + w, у 6 Rm, где возмущение w(-) вместе с начальным состоянием Яд и возмущением v(-) из (1) стеснены ограничением
F(x0)+ / f0(t,v,w)dt ^ 1. (8)
Jta
nKurzhamki А.В., Varaiya P. The Hamilton - Jacobi Equations for Nonlinear Target Control and Their Approximation, // Analysis and Design of Nonlinear Control Systems, (in Honor of Alberto Isidori), Sprimrer-Verlag. 2007. Pp.77-90.
Введём функцию Веллмана V(t,x) = min„(.) J(t,x,v), где функционал J определяется формулой J(t,x,v) = F{xо) + Jtofo{T-,v,y(r) — д(т,х))йт, x(t) = х. Уравнение Веллмана для V(t,x) имеет следующий вид:
Vt = min{-f'{t,x,u,v)Vx + fo{t,v,y{t) -g{t,x))}, V{t0,x) = F(x), (9)
где символ ' означает, транспонирование.
За последние десятилетия методы решения уравнений типа (9) дополнились новыми результатами в случае негладких функций F, /о (см. монографии Ф. Кларка, А.И. Субботина). Если решение уравнения (9) в каком-то смысле найдено, то ИМ запишется в виде неравенства X(t,y,u) = {х : V(t,x)% 1}. .
Отметим еще, что задачи управления по неполным данным типа (4), (5) изучались в работах Т.Ф. Филипповой12.
' Следующие результаты составляют основу личного вклада диссертанта в работы, выполненные в соавторстве.
1. Выведены формулы для оценивания непрерывных линейных систем с совместными квадратичными интегральными ограничениями и вырожденной матрицей Pq.
2. Разработаны алгоритмы многократной коррекции и установлены их свойств для многошаговых нелинейных систем.
3. Разработаны методы оценивания для непрерывных квазилинейных систем при дискретных измерениях.
4. Рассмотрено приложение изложенных методов коррекции движения к задаче выставки инерциальных систем.
5. Исследовано влияние информационных ограничений на параметры коррекции движения.
• i Целью работы является разработка и теоретическое обоснование методов многократной коррекции движения управляемых систем, описываемых ‘обыкновенными дифференциальными или многошаговыми уравнениями, в условиях.неполной информации о фазовом состоянии. По ходу решения основных задач необходимо получить новые результаты по оцениванию для -непрерывных квазилинейных и многошаговых нелинейных систем, а также рассмотреть приложение методов коррекции движения управляемых систем к задаче выставки и исследовать влияние информационных ограничений на параметры коррекции движения.
12Филштюва Т.Ф. Об одном достаточном условии в задаче управления ансамблем движений // Оценивание динамики управляемых движений. Свердловск: УрО АН СССР, 1988. С. Ш-118.
Методы исследования
В работе использованы методы теории управления и оценивания для механических систем в условиях неопределенности, методы динамического программирования, функционального анализа, выпуклого и нелинейного анализа, теории экстремальных задач.
Теоретическая и практическая ценность работы
Диссертация носит в основном теоретический характер. Рассмотренные примеры и приложение к задаче выставки имеют иллюстративный смысл. При определенной доработке и уточнении исходных данных алгоритмы могут представить практический интерес для специалистов в области навигации и управления движущимися объектами. Кроме того, полученные результаты могут быть использованы в учебном процессе при чтении спецкурсов для студентов и аспирантов.
Апробация работы
Основные положения диссертационной работы докладывались и обсуждались на областной научно-практической конференции “Информационно
- математические технологии в экономике, технике и образовании” (Екатеринбург: ГОУ ВПО УГТУ-УПИ, 2005 г.), на 36-й и 38-й региональных молодежных конференциях (Екатеринбург, 2005, 2007 гг.), на IX всероссийском съезде по теоретической и прикладной механике (Нижний Новгород, 2006 г.), на международной конференции “Динамические системы: устойчивость, управление, оптимизация" (ОББСО 08) (Минск, Беларусь, 2008 г.), на IV международной конференции “Математика, ее приложения и математическое образование” (МПМО’11) (Улан-Удэ, 2011 г.), а также на семинарах кафедры “Прикладная математика” института УралЭНИН Уральского федерального университета.
Структура и объем диссертации
Диссертация состоит из введения, четырех глав, заключения и списка литературы из 115 наименований. В тексте содержится 24 рисунка. Работа занимает 113 машинописных страниц.
Краткое содержание диссертации
Во введении описана предыстория и актуальность темы диссертации, приведено краткое содержание диссертации.
Первая глава посвящена решению задачи многократной коррекции для линейных непрерывных систем с квадратичными ограничениями. Для полноты изложения приведены решения всех вспомогательных задач (4)
- (6) для терминального функционала Ф(Хт(и)) = шах ||2?а:||, где || • ||
хеХт{и)
— евклидова норма и D — некоторая матрица. В пункте 1.1 главы изложены основные результаты по оцениванию линейных систем с детерминированными возмущениями, стесненными квадратичными ограничениями. Большинство результатов получено ранее в работах А.Б. Куржанского, И.Я. Пищулиной13 и Б.И. Ананьева14. Однако использование метода динамического программирования позволило охватить также случай вырожденной матрицы Р0 в совместных квадратичных ограничениях ||хо||р0 +
•С OMIqM + Млм)* ^ где ||ж||р = х'Рх, для системы с наблюдением
х = A{t)x.+ B{t)u + C(t)v, to^t^T, y = G(t)x + w(t). (10)
В предположении, что однородная система (10) вполне наблюдаема на любом подотрезке [т,0] С [to> Г], в подпункте 1.1.1 установлен вид ИМ:
X(t,y,u) = {x\V(t,x) ^1}, V(t,x) = \\x\\2P[t)-2x,d(t) + g{t), (И)
где V(t,x) — решение уравнения Веллмана вида (9). Для параметров множества (И) выписаны дифференциальные уравнения с известными начальными условиями, причем для вектора d(t) и скаляра g(t) эти условия нулевые, В силу полной наблюдаемости матрица P(t) будет невырожденной и ИМ будет ограниченным эллипсоидом. В пункте 1.2 приведено выражение для совместимого множества в соответствии с определением 2 V{t,y,u) = |(x,t't(-)) : /trMr)li Q(T)dr + V(t,x) ^ 1 j и формула для минимума rt(y,u) во вспомогательной задаче управления
: “а^елНиЛ-М^.и)) ^Dx\\ -* minttt(.) = rt(y,u), (12)
установленная в работах3’14 при квадратичных ограничениях на управле-ше /<„ 1К*)11ям<Й ^ 1- В пункте 1.3 использована структура множества Y(0, t | V(t,y,u)) всех возможных продолжений сигнала уь(-) и формула для величины наихудшего прогноза rt(s,y,u) (см. (6)), также установленные в указанных работах. На основании приведенных формул сделано следующее замечание.
Если в данной позиции {£,у‘(-)} выполнено равенство (7), где и10 — управление, найденное на предыдущем этапе, и величина h(t) = g(t) -d Р 1d < 1, то следующий момент корректировки может наступить через
13Куржанстй А.Б., Пищулина И.Я. Минимаксная фильтрация при квадратичных ограничениях. 1-Ш,- Дифф.уравнения. 1976. Т.12. № 8, С.1434Л446; № 9, с.1568-1579; № 12, с,2149-2158.
1А Ананьев Б.И. Минимаксная квадратичная задача коррекции движения // Прикл. матем. и мех 1977. Т. 41, вып. 3. С. 43G-445.
сколь угодно малый промежуток времени. Действительно, пусть мы находимся в точке £(£) — центре информационного множества Х(Ь, у,и). Выбирая функцию Л (г) = у{1)-вЦ)х{Ь) так, чтобы /гш ||Д(г)||’ (т)йт = 1—Л(*). получаем продолжение сигнала, при котором ИМ Х(Ь + 6, у, и) состоит из одной точки, и ресурс помех к моменту £ + 5 уже исчерпан. Но тогда приходим к управляемой системе (10), где V — 0, с полной информацией, и на отрезке [Ь -+■ 5, Г] оптимальное управление уже не корректируется.
Для рассматриваемого случая в силу симметрии ограничений можно считать, что начальное управление щ = 0. Если зафиксировать некоторую реализацию помех, то за гарантированный результат управления с помощью пошаговой процедуры из начальной позиции {£,?/(•)}, t > £0, где
и*(-) = 0, естественно принять величину г*(Г) = Пт тах гт(у . М->0у(-)£Г(Т,ЦУ&У,ш)) ^
Щ\), где |А| — диаметр разбиения Л и щ\ — некоторое управление, построенное согласно пошаговой процедуре. Поскольку величина гт(у, и) в нашем случае слабо непрерывно зависит от функции и(-) <Е ££[£, Т], то верно следующее. Для любого е > О существует 6 > 0 такое, что для любого разбиения Л отрезка [£,Т] с диаметром |А| < 5 и любого продолжения у*(•) сигнала ?/(•) при управлении и*(-) = 0 пошаговая процедура приводит к результату управления гт{у, «ол) < Г*{Т) +£■ Если обновляющая функция ш) = у®-отъ £ 11/1(т)и^г ^ 1 фиксирована, то существует последовательность управлений ы0д„, соответствующая разбиениям Х^, [Лгу| -> 0, которая слабо сходится к некоторому управлению и0, причём /4 11«о(т)||^т < 1 и гТ{у,и0) < г*(Г). В заключение главы, пункте 1.4, приведены два примера, иллюстрирующих процедуру многократной коррекции.
Во второй главе рассмотрена задача коррекции для линейных систем с геометрическими ограничениями и многошаговых нелинейных систем. В пункте 2.1 рассмотрены вопросы оценивания для систем вида (10), где
— 0, с дискретными наблюдениями
Ук = вк х(ьк)+ык, к = 1,...,ЛГ, ^+1=Т. (13)
Неизвестные параметры стеснены здесь геометрическими ограничениями ^ ^о> щ(£) € V, ц]к £ XV с выпуклыми и компактными ограничивающими множествами. Приведены рекуррентные формулы для информационного множества и отмечено, что компактнозначная мультифункция ИМ непрерывна по Хаусдорфу на полуинтервале [£*,£*+1) и предел слева Х{Ьк - 0, у, и) существует для всех к = 1,..., N + 1. Выписаны также опорные функции информационных множеств. В пункте 2.2 решается
вспомогательная задача управления по неполным данным. С использованием методики теории управления в условиях неопределенности получена формула для величины минимакса п{у, и) терминального функционала ф(х(Т)). Отмечен частный случай, в котором при ф(х) =| д'х | формула для г^у, и) принимает достаточно простой вид. Пункт 2.3 посвящен собственно задаче коррекции. Здесь определяется множество У(г, £,?/,«) всевозможных продолжений сигнала, которое в силу дискретности измерений является конечномерным выпуклым компактом, и наихудший прогноз гарантированного результата управления по формуле
п(т, у, и) = таху^{т,1,у,и) гт(у, и). (14)
Утверждается, что лишь последующие за ^ измерения в моменты ^+1, ^+2,... могут обеспечить уменьшение прогноза гарантированного результата (14) при Ь — Ьк.В подпунктах 2.3.1 - 2.3.3 приведено описание 3-х возможных алгоритмов коррекции.
Алгоритм пошаговой многократной коррекции. Изменяем будущее управление Щ = Щк ЛИШЬ В некоторые моменты Ьк поступления информации по формуле (13). Для краткости полагаем, что гк(у,и) = пк{у,и), г*(к,у,и) = г*(Ь,У,и), где последняя величина определена в формуле (6). Если в позиции Х^к,у,и) имеем неравенство
тк(у,и)>г*(к,у,и), (15)
то управление ик, найденное на предыдущих шагах, не корректируется. В противном случае, если управление ик к тому же неоптимально, переходим к оптимальному управлению йк в задаче
п(у, и) = пйп,,, тгх.хеХ&у,и) тах„, ф[х(Т)). (16)
В конце процесса получаем величину гт(у, и) как максимум целевой функции ф(-), вычисленной на конечной позиции Х{Т, у, и), а также управление и = и(-,у). Это управление зависит от реализации сигнала уК. Моменты коррекции обозначим {г1; т2)...,тК], где п = <«(, 1 < к < *2 < • • • < гК < N. В частности, совокупность моментов коррекции может быть пустой, что означает удачный выбор начального управления йо(-) и пошаговое уменьшение наихудшего терминального критерия независимо от реализующегося сигнала. Другой крайний случай состоит в совпадении моментов коррекции со всем множеством {41,...,^}. Минимум для г*(к,у,и) можно подсчитать по конечному множеству {^+1,..., £дг}.
Алгоритм коррекции с уменьшенным количеством проверок. В ПОЗИЦИИ X(tk, у, и), где неравенство (15) выполняется и не надо корректировать будущее управление щ, сохраняем это управление вплоть до момента г?*+1 = argminT6{tjt+ь _ >tw} Гк(т, у, и). Если же в момент tk неравенство (15) не выполняется, то полагаем tik+i = 4+1- В момент ^*+1 повторяем процедуру. Алгоритм коррекции с прогнозом на один шаг. Алгоритм аналогичен первому, но вместо неравенства (15) проверяем более простое неравенство гк{у,и) > rk(tk+l,y,u). В принципе, количество коррекций управления здесь может оказаться больше, чем в первом алгоритме. Однако далее показано, что эти алгоритмы по-существу эквивалентны.
Основные результаты для линейных систем собраны в пункте 2.4. Все указанные алгоритмы предваряются подсчетом числа г0 и определением начального оптимального управления щ. Отмечается, что построение ИМ X(t, у, и) с помощью опорных функций — достаточно сложная задача. Поэтому часто прибегают к аппроксимации сверху указанных множеств эллипсоидами или прямоугольниками15,10. Аппроксимация приводит к оценкам сверху для величин rt(y, и) и (14). Установлен следующий результат.
Пусть в системе (10), (13) при и — 0 реализуется некоторый сигнал yN, и зафиксировано начальное оптимальное управление йо. Тогда указанные алгоритмы однозначно определяют последовательность {ti,T2, . . . =
tin 1 ^ Ч < Ч < ■ • ■ < гк ^ N, моментов изменения управления. При этом управление ит, формируемое алгоритмом на отрезке [r^Tj+i], совпадает с оптимальным управлением йп в задаче (16), г = 1,... ,К—1. Гарантированные значения ^ = гп(у,и) критерия качества образуют невозрастающую последовательность: го ^ ^ ^ г к- Здесь имеют место строгие нера-
венства г4 > Гг+i тогда и только тогда, когда реализуется не самый худший сигнал из множества У(rj+i, т*, у, и).
В пункте 2.5 приведены примеры. Во втором примере рассмотрен частный случай простейшего варианта процесса выставки. Здесь в двумерном случае построено точное решение задачи коррекции (ИМ строятся без аппроксимации), приводящее к одному моменту коррекции в середине процесса. Для сравнения дано решение с коррекцией управления на каждой секунде. В последующих пунктах главы рассматриваются нелинейные многошаговые системы. В пункте 2.6 методами динамического программиро-
Костпоусово. Е.К. О полиэдральном оценивании областей достижимости линейных многошаговых систем // Автоматика и телемеханика. 1997, X* 3. С. 57-68.
10Kurzhanski А.В., Valyi I. Ellipsoidal Calculus for Estimation and Control // Boston: Birkhauser, 1996.
вания дано решение задачи оценивания для систем вида
Ъ = Мъ-ищм), У1 = 9ь{хг-ъщ)+щ, 4бТ = {1,...ЛГ}, (17)
где 6 й" - фазовый вектор, у% е В,т — наблюдаемый вектор, ^ и
— помехи, щ — управление. Предполагается, что управляемая система обратима по времени. Начальное состояние и помехи стеснены суммарными ограничениями. Установлено, что информационное множество имеет вид Ъ{у,и) = {х | И^(®,»‘,и‘) < 1}, где И'Цам/*, и*) — соответствующая функция Веллмана. В пункте 2.7 введены множества Ц(х) —
{(^г+1 > ^*+1) •' ]С«=г+1 ЫЫ, щ) < 1 — И^(х, ?/, и*) |, где /г* — замкнутые функции, определяющие ограничения на помехи, и множества Уи(х) = {УЬ+1 : (и^Ш^) € ^4(ж)}, служащие проекциями множеств Ц(х).
Функции /1{, в частности, могут быть индикаторными, что соответствует случаю геометрических ограничений. По введенным множествам определяем минимакс терминального функционала
гг{у,и) — шт11№1 таха:ед'((г/,1) тах„«1е^и^ ф(хц). (18)
Данная функция определена для всех моментов t = 0,..., N. В пункте 2.8 определены множество продолжений сигнала УТ^(у\иТ) = {у[+1 : х £ («4+1, ^1) € Уь{х)}, где 0 < ^ < г < ЛГ, и наихудший прогноз гарантированного результата управления (18) по формуле п(т,у\ит) = , .Л}8?, т/г(у,«). Здесь г^,у\ит) = п(у,и). При геометрических ограничениях с компактными множествами можем записать функцию (18) по методу Веллмана. Действительно, определим функции Веллмана: 5дг(Х) = тах ф(х), 5;_1(Х) = тт 5;(/;(Х, и, ^)), рекуррентно на компактных множествах, где /г{Х,и,У) = и{/,(а:,и,у) : х € X, V € V}. Тогда функция и{у,и) — и)). После введения величины г*(4, у, и) = тт гАт,уь
т\ ’ ’
и ), можем обратиться к неравенству (15) и рассмотреть описанный выше алгоритм пошаговой многократной коррекции. Основные результаты пункта 2.9 состоят в следующем.
Теорема 2.6. Для любой допустимой тройки {х^,и^неопределенных элементов в системе (17) алгоритм пошаговой многократной коррекции и алгоритм коррекции с прогнозом на один шаг приводят к одинаковому сигналу уя и управлению иж, а также к одинаковым моментам коррекции управления. Здесь считаем, что в обоих случаях при прочих равных условиях управление назначается одинаково.
Теорема 2.7. Для всякой допустимой тройки {хо, шЛ’} в системе
(17) алгоритм коррекции теоремы 2.6 однозначно определяет последовательность 0 = го < т\ < Тг < ■ ■ ■ < Ч < N = Тк+1 моментов изменения управления. При этом управление и^, формируемое алгоритмом на отрезке ц + 1,... .7-5+1, совпадает с оптимальным управлением и^[ в задаче
(18), г = 0,... ,к. Гарантированные значения г, = гп(у,и) критерия качества образуют невозрастающую последовательность го ^ г\ ^ ^ ^
гк+1 — гы{у,и). Здесь имеют место строгие неравенства г< > г,-+х, если ^+1 — ^ 2. В случае ц+\ — ц ~ 1 строгое неравенство г* > г<+1 бу-
дет справедливо тогда и только тогда, когда реализуется не самый худший сигнал уп+1.
В пункте 2.10 полученные результаты конкретизируются для линейных систем (17) и квадратичных функций /^(-, ■)• Полученные здесь формулы способы их получения во многом аналогичны приведенным в 1-ой главе. В пункте 2.11 содержатся примеры.
В третьей главе рассмотрены методы решения задач коррекции для квазилинейных непрерывных систем с дискретными измерениями. Задачи управления и оценивания, в том числе и задачи коррекции движения, для квазилинейных систем изучались в докторской диссертации А.Г. Кремлева. Включение излагаемого ниже материала в настоящую диссертацию прежде всего обусловлено новым способом получения оценок фазового вектора состояния системы. Рассматривается система
х = е/(4,х) + -В(£)и + С(£)и, 0 ^ ^ Т, х(0) = хо, (19)
где вектор-функция х) удовлетворяет условиям теоремы существования, единственности и продолжимости решения типа (3). Если уравнение содержит линейные слагаемые Л(£)а;, то оно сводится к виду (19) с помощью невырожденного преобразования координат. Здесь е — малый параметр. Уравнения измерения имеют вид (13). Предполагается, что возмущения стеснены совместными квадратичными интегральными и суммарными ограничениями. Предполагается, что любое решение системы (19) не выходит на отрезке [О, Т] за пределы некоторой ограниченной области V. Размеры области Т> и величина константы в (3) согласованы. Показано, что если ввести обобщенную матричную функцию Д(£) = 2ь=1 ^*5(£ — 4), где 6(£) — функция Дирака, то дискретные наблюдения эквивалентны непрерывным наблюдениям с матрицей Сг(4) и непрерывными возмущениями при наличии совместных квадратичных ограничений 1-ой главы. В пункте 3.1 записано уравнение Веллмана (9), имеющее здесь
вид У{и х) = ||х||2,0 + 1*( -{1/4:)У’СН-1С'Ух - (е/(в,аг) + Ви)'Ух + Цу -Сх\\2к)с1з; V = (1/2)Н ХС'УХ. Здесь у — оптимальный элемент в задаче на минимум. Предполагается, что при всех достаточно малых г уравнение Беллмана имеет единственное решение У(Ь,х), гладкое в областях (и, 4и) х V, г = 0,..., ]\Г, кусочно непрерывное по £ и такое, что его градиент \4(*>ж) удовлетворяет условиям типа (3). При сделанном предположении имеем Х{Ь,у,и) = {а;: У(^,х) ^ 1}. Уравнение Беллмана пытаемся разрешить с помощью ряда ^(£,0:) = приравниванием
коэффициентов при одинаковых степенях е. Для нулевого приближения получим уравнение У°(£, х) = ||а:|]|, + /„*(- и'В'У* - (1/4)У^'СН^С'У^ + |)2/ — у0 = (1/2)Н~1С'УХ. Здесь у0 — нулевое приближение к
оптимальному элементу у. Решение этого уравнения имеет вид У°(£, х) = Ия - ё\\р + гДе параметры удовлетворяют системе дифференциальных уравнений, как в 1-ой главе. Система имеет единственное решение, зависящее только от дискретных измерений ук, матриц С?£ и управления и(-). Для коэффициентов при более высоких степенях £ получаем уравнения
= 0; I > 1, У%х) =
0. Эти уравнения имеют первый порядок по частным производным и линейны относительно неизвестной функции У‘(2, х). Они также не содержат никаких обобщённых функций. Данные факты позволяет использовать метод характеристик для их интегрирования. Положим ]¥* = уг — (1/2)Я Ю^х. Эти функции служат г-ым приближением соответственно к У(£, х*) и 1>(£, х'). Предположим также, что при всех достаточно малых е > 0 система уравнений имеет единственное решение У'(Ь,х), градиент У.х (£, х) которого удовлетворяет условиям типа (3). Последнее предположение оправдывает разложение для У{Ь, х), что даёт возможность построить приближённые решения в пункте 3.2.
Теорема 3.2. Существуют константы с?, с£, не зависящие от £ и такие, что выполняются включения Х{Ь,у,и) С {я : У°[Ь,х) - ес§(1 + |Ы|2) < 1}, {х : У°(£, х) + вс®(1 4- ||х||2) ^ 1} С Х(Ь, у, и). "
Для получения аппроксимаций более высокого порядка вводится вспомогательный критерий у), минимум которого на решениях уравне-
ния (19) равен функции Ш*(Ь,х), а минимизирующим элементом является функция V {Ь,х). Для оптимальных значений исходного и вспомогательного функционалов выполняются некоторые неравенства с константами е‘+1. Следовательно, справедлива
Теорема 3.3. Существуют константы с|, 4, не зависящие от е и такие, что выполняются включения х{г,у,и) С {х : УУ%х) - е‘'+14(1 + ЦгЦ2) <
1}, {г:10(г,х) + £т4(1 + |И|2) < 1} СХ{Ь,у,и).
В пункте 3.3 рассматривается минимаксное управление по неполным данным, а именно, решается задача (12) для < = 1к, к = 1,..., N при ограничениях и(£) € 11. Решение задачи (12) строится на основе итерационной процедуры, заимствованной из работ А.Г. Кремлева. На начальном этапе рассматривается задача для системы нулевого приближения (19) при е = 0. Записано минимаксное значение г°(у,и) функционала для линейного приближения. Затем находятся выражения для итерационных значений г\(у,и). В условиях регулярности и при некоторых дополнительных предположениях о локальной сильной выпуклости ИМ Хк в точке х\ и множества V в точке и°(1) в работах А.Г. Кремлева доказана сходимость критериев г\(у, и) —> Гк{у,и) и управлений м*(£) —► й(£ | ^) почти всюду, где й(£ | 4) — какое-то оптимальное управление при ненулевом £. Указанная сходимость выполняется равномерно по малому параметру 0 < £ ^ £о- В пункте 3.4 приводятся основные построения для решения задачи многократной коррекции. Основные выводы аналогичны полученным в предыдущих главах. Здесь так же, как и в главе 2, определяются множество Уц(у,и) всех возможных продолжений сигнала ук и величина прогноза гк(1,у,и). Для подсчета этих величин использован следующий факт. Для любого ц, > 0 существует е0 > 0 такое, что любое допустимое продолжение для системы нулевого приближения, получаемое по формулам & = Gix(ti) + ди где х{и) = 12]=к+1Р~1(ЬЩЩ9з +
ВисЬ + Х^к), 1Ы1й,- ^ одновременно является до-
пустимым продолжением и для исходной нелинейной системы, у которой 0 < е ^ £о- Параметры здесь находятся из решения импульсных систем х = Р~1С'Н(у - Ох) + Ви, х(0) = 0; к = ||г/ - (?£]|д; /г(0) = 0. В пункте 3.5 приведен иллюстрирующий пример, в котором функция У^,х) вычисляется явным образом.
В четвертой главе диссертации изучаются задачи выставки инерци-альных систем и влияние коммуникационных ограничений на параметры коррекции движения. В пункте 4.1 рассматривается задача математического согласования систем координат двухступенчатой транспортной системы, состоящей из корабля и стартующего с него самолета. Данная задача рассматривалась в работах17,18 чисто статистическими методами.В то
17Бромберг П.В. Теория инерциалышх систем навигации. М.: Наука, 1979.
13Липтон А. Выставка инерциальных систем. М.: Наука, 1971.
же время в работах19,20 отмечается, что статистика возмущений, действующих в инерциальных системах навигации, часто бывает неполной или вообще отсутствует. Поэтому многие вопросы естественно изучать в минимаксной постановке. Упомянутая задача исследуется здесь в детерминированной постановке. На корабле расположена гироплатформа, оси которой образуют базовую систему (правую) координат (БСК), а на самолете имеется другая гироплатформа с осями, образующими зависимую систему (правую) координат (ЗСК). Перед стартом самолета надо совместить оси ЗСК с соответствующими осями БСК, или же оценить углы отклонения и их дрейфы (проекции вектора относительной угловой скорости) с тем, чтобы учесть эти углы при дальнейшем автономном функционировании навигационной системы самолета. Ориентация ЗСК относительно БСК задается тремя углами Крылова, как это обычно принято в морской навигации. Пусть оси ЗСК обозначаются 1,2,3, а оси БСК - соответственно 11,21,31. Системы имеют общее начато, совпадающее с центром масс транспортной системы корабль-самолет. Совмещение ЗСК с БСК производится путем последовательных поворотов по часовой стрелке. Считается, что БСК 1-ой ступени выставлена правильно, т.е. ось 2\ направлена по местной вертикали, ось Зх имеет направление по меридиану на север, а ось 11 — по параллели на запад. При перемещении корабля по поверхности земли указанное направление осей сохраняется. Вдоль каждой из осей ЗСК и БСК установлены акселерометры. В работе приведена нелинейная система дифференциальных уравнений относительно шести переменных О , б с нелинейными уравнениями измерения. Здесь 6* — углы отклонения ЗСК и БСК, б1 — проекции вектора неопределённого дрейфа, возникающего из-за неточности аппаратуры. Если принять, что в результате грубой выставки, предшествующей, как правило, этапу точной выставки, углы в* лежат в пределах нескольких градусов, то нелинейную систему для углов в можно заменить линейным приближением. Для измерения используется разность показаний акселерометров в ЗСК и БСК. Пусть а? - показания акселерометров в ЗСК и а\ — выходы акселерометров в БСК. Тогда имеем о* = тиа\ + тца\ + тиа\ + ги\ у* = а* - а{, г = 1,2,3, где ю': -неопределённые уходы нуля акселерометров, т^ — элементы ортогональной матрицы направляющих косинусов ЗСК относительно БСК. Помехи V в уравнениях для дрейфов и помехи те1 стеснены интегральными ограничениями. В пункте 4.2 приведены уравнения для простейшей модели
п 08 РР" 9лъ>к6е1>г П-Е- Определение и коррекция движения. М.: Наука, 1980.
Ьогуславсшй И.А. Прикладные задачи фильтрации и управления. М.: Наука, 1983.
процесса выставки. В этом случае движение происходит по экватору, и во все время этого движения имеем в1 = в2 нн 0. Тогда отклонение осей ЗСК от ЕСК описывается одним углом 9 = в3. В качестве уравнения измерения берется выход 1-го акселерометра. В пункте 4.3 приведены результаты численного моделирования минимаксных алгоритмов. Предполагается, что корабль совершает определенный, достаточно информативный маневр. Если он стоит на месте, то оценивание происходит хуже, т.к. выпадает вторая компонента вектора измерений. Для простейшей модели это несущественно. Расчеты проводились как для двумерной линеаризованной модели, так и для 6-ти мерной линейной модели с 3-х мерным вектором измерений. Для двумерной модели начальное нулевое управление корректируется два раза в конце процесса. Отметим, что такое же значение минимаксного функционала получается, если корректировать управление на каждом шаге. Коррекция первоначального нулевого управления для 6-ти мерного случая также происходит 2 раза в конце процесса: на 193-ем и 199-ом шаге из 200-от. Последнее значение функционала rj при данных значениях помех равно 34.6197 град., в то время как реальное значение ||0j1| = 5.1920 град., что находится в пределах гарантированного результата. На примере показано, что количество коррекций управления может зависеть от выбора минимаксных управлений, решающих задачу типа (16), хотя значение финального функционала при этом не меняется.
Пункт 4.4 посвящен задаче коррекции при коммуникационных ограничениях. За последнее время возрос интерес к задачам оценивания и управления при коммуникационных ограничениях, что является следствием развития распределённых сетей управления с единым центром обработки информации, возможно находящимся на значительном удалении от объектов наблюдения и управления. Поэтому ограничение мощности канала передачи данных должно приниматься во внимание. Подобные задачи могут возникнуть при исследовании различных режимов поведения удалённых летательных объектов, при корректировке их движения, в частности, при управлении процессом выставки навигационных приборов в момент старта одного летательного аппарата с другого. Упомянем работу21, посвящённую оцениванию, где можно найти дальнейшие ссылки. Предполагается, что на объекте имеется вычислительный комплекс, позволяющий запоминать измеряемую информацию, обрабатывать её с высокой степенью точности, передавать и принимать закодированные сигналы по каналам связи. Сиг-
2lSavkin А. V., Pttersen I.R. Set-Valued State Estimation via Limited Capacity Communication Channel // IEEE Trans, on Auto. Control. 2003. AC-48, no. 4. Pp. 676-680.
налы в центр управления и обработки информации (ЦУиОИ) поступают в дискретные моменты времени словами ограниченной длины, состоящими из целых чисел. Для простоты канал связи предполагается бесшумным и не имеющим запаздывания. Кодирующее устройство в канале связи используется для передачи информации о параметрах ИМ объекта в ЦУиОИ и управляющего воздействия из ЦУиОИ на объект. В ЦУиОИ информация о параметрах ИМ декодируется и используется для расчета моментов коррекции и оптимального управления.
В подпункте 4.1.1 изучается влияние ограничений на оценивание. Задача оценивания рассматривается в постановке пунктов 1.1, 1.2. Из результатов этих пунктов следует, что для построения ИМ X*(t) в ЦУиОИ следует передать параметр h(t) и вектор x(t). Все остальные параметры, в том числе матрицы P(t), в ЦУиОИ известны. Однако удобнее передать величины p(t) = Х(Т, t)x(t) и ф(1) = (1 - h{t))W, где Х(Г, t) - фундаментальная матрица однородной системы (10). Пусть имеют место оценки
UXMU^a, ||C(i)C'(i)IU < С, i|G'Wi?W(?(i)||oo ^ з2,
II^WIIco < d, ||P(t)||oo < ii Vte[0,T], (20)
гДе II • Цоо ~ sup-норма в Дп, и пусть Д — шаг разбиения отрезка [0, Т].
Теорема 4.1. Для всякого числа е > 0 найдём параметры N, q и а из условий nWdgabWftq-1) < е, g > 1, о = s+n3^4dgaA^\ где А = T/N. Тогда a/q < е, выполняются неравенства ^(fcA)-^^ ^ е, к = 0,..., JV, и ip(kA) - z(kA-) € Ва для всех fc = 0,..., JV.
Здесь Ва = {х : ЦагЦоо ^ а} - шар с центром в нуле радиуса а в sup-норме. Этот шар Ва разбивается на qn подшаров вида х • ■ • х IJ, где индексы л независимо пробегают множество {1,..., q}. Вектор х е Ва кодируется последовательностью ф) = (jlt..., jn)t если гб/’х-х /?. Наоборот, каждому набору (jj,.. ,,jn) натуральных чисел, независимо пробегающих множество {1,..., <?}, ставится в соответствие вектор 7(ji,... ,jn)
— геометрический центр множества 1^ х • ■ • х J?. На полуинтервале [(А; — 1) Д, кА), к > 0, решаем уравнение z = Х(Т, t)B(t)u с начальным условием zi{k~l)A) = <Pk-i-B момент к А кодирование-декодирование задаётся формулами (ji, ...,jn) = ф(кА) - з(&Д-)), если <р(кА) - z(kA~) е Ва;
где z(kA~) - предел слева соответствующей
функции в точке к А.
Аналогично, при выборе параметра q из условия 1/(2q) < е выполняются неравенства | xjj(kA) — -фк |< е, к = 0,каково бы ни было число Д. Здесь отрезок [0,1] делим на q частей Ij. В момент кА определим
кодирование-декодирование как 3 = т)(ф(кА)), фк = 7(7). Здесь т]{х) = если х е I]. Величина у(у) = (2,? - 1)/(2д) совпадает с центром множества /'2 при 2 > 0.
Полученные результаты позволяют оценить ТОЧНОСТЬ £ декодируемых величин в зависимости от длины передаваемого слова (определяется параметром д) и частоты передачи (определяется параметром IV). Так, например, при р — 1 < 1о§2 д < Р требуется р бит информации о величине ф за один такт передачи. Будем решать задачу коррекции по декодированным наблюдаемым данным Хрк и фк, удовлетворяющим приведенным неравенствам. Подставим эти данные в формулы вместо <р(кА) и ф{кА) соответственно. Новые значения формул при £ = к А обозначим через гк(и) игк(в,и) соответственно.
Теорема 4.3. Пусть выполнены оценки (20), условия теоремы 4.1, а также 1/(2д) < е. Тогда для всех к = О,...,Я будем иметь | гк(и) — т*(кА,и) |< е (п1/,2||.0|| + 7г(&Д)); | гк(в,и) - г*(кА,9,и) |< е(п1//2(р|| +(7Г2(/сД) + ^(в))1/2). Указанные неравенства выполняются равномерно для всех сигналов с условием Л(Т) < 1.
В силу неравенства | тт^ — тт/ |< тах | 5 — / | в качестве следствия в в 6 ' из теоремы 4.3 получаем соотношение | г*(кА,и) — штщк^гк(9,и) |<
£ (/г1/2||^Ц + (тг2(кА) + тах0фд,г] я2{9))1^) • Это соотношение и неравенства теоремы 4.3 показывают, насколько могут отличаться параметры коррекции движения на объекте (реальные значения) и величины (оценки) этих параметров в ЦУпОИ, если оптимальное управление подсчитывается на объекте.
В подпункте 4.4.2 исследуется задача управления. Пусть = к\А -момент времени, когда выполняется равенство гк1(и) = ы).
В этот момент на объект передаётся сигнал о корректировке управления. Если вычислитель на объекте позволяет решать программную задачу управления (12), то функция ЦУиОИ завершена. Если же не позволяет, то управление должно вычисляться в ЦУиОИ и передаваться на объект. Предполагается, что управление постоянно на полуинтервалах [(/с — 1)Д, кА), к = 1,..., N. Для кодирования-декодирования управления применяется тот же прием, что и выше.
Теорема 4.4 Пусть выполнены условия теорем 4.1, 4.3 и справедливо неравенство 6/д < е, где |[и(| ^ 6 = (5Д)-1/2, Н{1) ^ 61р. Тогда критерии управления на объекте и в ЦУпОИ при использовании кусочнопостоянного управления связаны неравенством | г'(к, и) — г*(к,и) ех
х (п1/2Ц1)|| (а шах, НВ^Н^Г - кА) + 1) + тг(кА)).
Поскольку величины (риф на объекте известны, после передачи и раскодирования оптимального управления значение критерия на объекте будет равно г*(к,и). С другой стороны, символ г*(к,и) означает минимаксное значение функционала в ЦУпОИ при использовании кусочно-постоянного управления и переданных величин Щ, фк. Приведены формулы для указанных значений функционала.
Теорема 4.4 показывает, насколько могут отличаться значение критерия управления на объекте (реальное значение) и величина (оценка) критерия с точки зрения ЦУпОИ, если там вычисляется кусочно-постоянное управление и передаётся на объект. Разность значений возникает вследствие кодирования и передачи данных. Здесь следует иметь в виду, что при ошибках в канале связи и запаздывании информации различие значений может возрасти. В пункте 4.5 содержится иллюстрирующий пример.
В заключении приведены основные результаты диссертации, вынесенные на защиту.
Публикации по теме диссертации ([1], [6] и [10] — из списка ВАК, $> [4]. I11! — труды конференций, [3], [5], [9] — тезисы докладов, [8] —
статья в рецензируемом журнале)
Основные результаты диссертации опубликованы в работах [1]—[11].
[1] Ананьев Б.И., Гредасова Н.В. Многократная коррекция движения линейно-квадратичной управляемой системы // Вестник УГТУ - УПИ. 2005. № 4(56). С. 280-288.
[2] Гредасова Н.В. Примеры решения задач многократной коррекции движения // Проблемы теоретической и прикладной математики. Труды 36-ой Региональной молодёжной конференции. НИСО УрО РАН. Екатеринбург. 2005. С. 258-262.
[3] Ананьев Б.И., Гредасова Н.В. Коррекция решения многошаговой системы в условиях неопределённости // Тезисы докладов конференции “Информационно-математические технологии в экономике, технике и образовании”, Екатеринбург, 11-12 ноября 2005 г. Екатеринбург: Изд-во УГТУ
- УПИ. 2005. С. 5.
[4] Ананьев Б.И., Гредасова Н.В. Коррекция решения многошаговой системы в условиях неопределённости // Информационно - математические технологии в экономике, технике и образовании: сб. материалов областной научно-практической конференции. Екатеринбург: ГОУ ВПО УГТУ -УПИ, 2006. Ч. 1. С.3-11.
[5] Ананьев Б.И., Гредасова Н.В. Методы коррекции движения в задаг
чах навигации. IX Всероссийский съезд по теоретической и прикладной механике. Нижний Новгород. 22-28 августа 2006 г. Аннотации докладов. Изд-во Нижегородского государственного ун-та, 2006. Т. 1. С. 13.
[6] Ананьев Б.И., Гредасова Н.В. Многократная коррекция квазилинейных систем при дискретных наблюдениях // Тр. ин-та матем. и мех. УрО РАН. 2007. Т. 13. № 4. С. 3-13.
[7] Гредасова Н.В. Многократная коррекция квазилинейной системы по дискретным наблюдениям // Проблемы теоретической и прикладной математики. Труды 38-ой Региональной молодёжной конференции. НИСО УрО РАН. Екатеринбург. 2007. С. 286-290.
[8] Ананьев Б.И., Гредасова Н.В. Задача многократной коррекции при геометрических ограничениях на возмущения // Дифференциальные уравнения и процессы управления. Электронный журнал, № 1, 2007. С.63-73. http://www.neva.ru/journal.
[9] Ананьев Б.И., Гредасова Н.В. Задачи коррекции движения при коммуникационных ограничениях // Международная конференция “Динамические системы: устойчивость, управление, оптимизация” (ОББСО 08). 29 сентября - 4 октября 2008 г., Минск. Тезисы докладов. Институт математики НАН Беларуси, 2008. С. 54-55.
[10] Ананьев Б.И., Гредасова Н.В. Задача выставки инерциальных систем и процедура коррекции движения // Вестник Бурятского государственного университета. Математика и информатика. № 9, 2011. Улан-Удэ: Изд-во Бурятского университета. С. 203-208.
[11] Ананьев Б.И., Гредасова Н.В. Использование моментов остановки в задачах коррекции движения // Материалы IV международной конференции ’’Математика, ее приложения и математическое образование”, МП-МО”11, 27 июня - 1 июля 2011 г. Часть 2. Улан-Удэ: Изд-во ВСГТУ. С. 5-9.
Гредасова Надежда Викторовна
ЗАДАЧИ МНОГОКРАТНОЙ КОРРЕКЦИИ УПРАВЛЯЕМЫХ СИСТЕМ
Автореферат
Подписано в печать 17.01.2012 Формат 60x84 1/16. Объем 1 п. л. Тираж 100 экз. Заказ № 3470.
Отпечатано в типографии ООО «Издательство УМЦ УПИ» 620078, Екатеринбург, ул. Гагарина, 35а, оф. 2 тел. (343) 362-91-16,362-91-17
61 12-1/524
ФГАОУ ВПО "Уральский федеральный университет имени первого Президента России Б.Н.Ельцина"
На правах рукописи УДК 517.9
Гредасова Надежда Викторовна
ЗАДАЧИ МНОГОКРАТНОЙ КОРРЕКЦИИ УПРАВЛЯЕМЫХ СИСТЕМ
01.01.02 — дифференциальные уравнения, динамические системы и оптимальное управление
диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель: д-р физ.-мат. наук Б.И.Ананьев
Екатеринбург - 2012
Содержание
Введение ................................................................3
Предыстория и актуальность темы............................3
Актуальность работы и научная новизна....................7
Краткое содержание работы....................................9
Апробация работы..............................................23
Глава 1. Непрерывные линейные системы с квадратичными ограничениями..........................................25
1.1. Оценивание состояний управляемых систем..................25
1.1.1. Оценивание при вырожденной матрице Ро ..........28
1.2. Управление по неполным данным ............................29
1.3. Коррекция движения системы................................31
1.4. Примеры ........................................................35
Глава 2. Линейные системы с геометрическими ограничениями и многошаговые системы........................41
2.1. Оценивание состояний управляемых систем..................41
2.2. Задача программного управления по неполным данным . . 43
2.3. Задача многократной коррекции..............................45
2.3.1. Алгоритм пошаговой многократной коррекции ... 46
2.3.2. Алгоритм коррекции с уменьшенным количеством проверок..................................................46
2.3.3. Алгоритм коррекции с прогнозом на один шаг ... 47
2.4. Основные результаты для линейных систем..................47
2.5. Примеры ........................................................48
2.6. Оценивание состояний нелинейных многошаговых систем . 51
2.7. Управление по неполным данным ............................53
2.8. Задача многократной коррекции..............................54
2.9. Основные результаты для многошаговых систем............56
2.10. Задача коррекции для линейно-квадратичного случая ... 58
2.11. Примеры ........................................................60
Глава 3. Квазилинейные системы при дискретных наблюдениях ........................................................63
3.1. Оценивание состояний квазилинейных систем ..............63
3.2. Аппроксимация информационного множества ..............67
3.3. Минимаксное управление по неполным данным ............70
3.4. Многократная коррекция минимаксного управления .... 73
3.5. Пример ..........................................................76
Глава 4. Задачи выставки инерциальных систем и влияние коммуникационных ограничений на параметры коррекции движения..................................78
4.1. Постановка задачи, уравнения состояния и вектор измерения 78
4.2. Простейшая модель процесса выставки......................82
4.3. Результаты численного моделирования
минимаксных алгоритмов......................................83
4.4. Коррекция движения и коммуникационные ограничения . 89
4.4.1. Влияние коммуникационных ограничений на оценивание ......................................................90
4.4.2. Влияние коммуникационных ограничений на формирование управления..................................94
4.5. Пример ..........................................................98
Заключение...............................102
Литература...............................104
Введение
Предыстория и актуальность темы. Диссертационная работа посвящена разработке эффективных методов коррекции движения управляемых систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями. Предполагается, что система находится под воздействием неопределенного детерминированного возмущения. Начальное состояние системы также предполагается неизвестным. Кроме того, фазовый вектор объекта может быть не доступен для измерения. Однако по ходу движения измеряется некоторый сигнал, несущий информацию о фазовом состоянии системы. На основании доступной информации требуется сформировать управление, минимизирующее терминальный функционал в расчете на худший случай реализации начальных состояний и неопределенных возмущений.
Таким образом, в работе рассматриваются задачи, которые можно отнести к проблемам управления детерминированными системами с неполной информацией. Данное направление в теории управления имеет довольно длинную историю и достаточно разработанные результаты. Вместе с тем исследования в данной области далеко не закончены и активно продолжаются в настоящее время. Они стимулируются новыми требованиями к качеству управления, развитием технических измерительных средств, новыми задачами создания распределенных систем управления.
Единый подход к решению указанных проблем изложен в монографии H.H. Красовского и А.И. Субботина [60], где в главе 15 рассмотрены методы решения весьма общей информационной игровой задачи. В этом подходе предполагается, что по ходу процесса становится известной некоторая выпуклая компактная область, содержащая истинный вектор системы. Способы построения области не уточняются. В этом факте заключаются возможные варианты уточнения постановки задачи. Так, например, в работе H.H. Красовского [59] область представляется в виде n-мерного прямоугольника со сторонами, параллельными осям координат. В монографии A.B. Куржанского [67] изложены методы, связанные с
построением в фазовом пространстве т.н. "информационного множества" (далее часто используем сокращение ИМ). Именно эти методы положены в основу решения задач настоящей диссертации. Методы "информационных множеств" использовались в работах Б.И. Ананьева, А.Б. Куржан-ского, Г.С. Шелементьева, А.Г. Кремлёва [5,6,62-64,67,94,95].
Следуя [5,6,59,67] уточним постановку задачи, которую будем называть "задачей однократной коррекции". Пусть задана управляемая система вида
где х Е Яп — фазовый вектор системы, не доступный для измерения, и Е В? — управление, V Е В? — неопределенное детерминированное возмущение. По ходу процесса измеряется вектор
Вектор-функции /(£, •, •), •, •) при фиксированном £ предполагаются непрерывными. При фиксированных х, и, V функции /, д считаются кусочно-непрерывными по ¿. Заданы априорные ограничения (хо,у(-)) Е "Уо, и(-) Е и, где Уо,и, — слабо компактные множества [51,87,97] в пространствах Яп х и Ь\[¿о, Т] соответственно. Для существова-
ния и продолжимости решений уравнения (1) примем стандартные усло-
вия [3,24,58,80]:
\\f(t,Xi,u(t),v(t)) - f(t,X2,u{t),v(t))\\ < Ас,и,г,- Х2\\,
||/(*,ж,и,г;)|| <*(! + ||z|| + IHI + IHI), xeRn, и Е Rq, veRP,
где и(-) Е U, v(-) Е proj^P^ ^ Vq, (t, xi) E G, i = 1,2. Здесь G — компактное подмножество в [io, T] x Rn, Ag,u,v> h — константы, || • || — евклидова норма.
Введем ряд обозначений. Сужение измеримой вектор-функции :r(s), s Е [¿о? Т], на отрезок [i0,£] будет обозначаться через хь{-), а сужение на отрезок [t,T] — через xt(-).
Определение 1 (Куржанский A.B., [61]). Информационным множеством (ИМ) X{t,y,u) системы (1), (2), где и Е U, называется совокупность всех таких векторов {ж(£)}, которые могут реализоваться в системе при некоторой паре (жо,г>(-)) Е V0 при условии, что выход уравнения (2) на отрезке [¿о, t] почти всюду совпадает с измеренным сигналом
х = f(t,x,u,v), te[to,T]
(1)
y = g(t,x,v), у Е Rm.
(2)
Ясно, что область формально зависящая от сужений уь{-),
ut(•), зависит также и от ограничений Vq. Характер этой зависимости будет уточняться ниже с учетом вида ограничений (интегральные, мгновенные и т.д.). Чтобы подчеркнуть указанную зависимость будем иногда писать Af(t, у, и | Vq). В начальный момент имеем X(to, у, и) = proj^«Vo, где проекция будет компактом в силу сделанных предположений.
Определение 2. Совместимым множеством Y(t,y,u) системы
(1), (2), где и 6 U, назовем совокупность всех пар {(x(t), vt(-))}, для которых найдется элемент (xo,v(-)) Е Vo такой, что выход уравнения
(2) на отрезке [¿о, t] почти всюду совпадает с измеренным сигналом у*(-), причем функция vt{-) есть сужение v(-) на отрезке [i, Т].
Для подчеркивания зависимости совместимого множества от Vo будем иногда писать V(£, у, и | Vo). Связь информационного и совместимого множеств выражается равенством X{t, у, и) — proji?„V(i, у, и). Совместимые множества обладают полугрупповым свойством: V(s, yf(•), ut(') I Y(t,y,u)) = V(s,y,u | Vo), где to ^ t < s < Т. В качестве следствия имеем равенство ИМ: <Y(s, у® (•), wf(-) | V(t,y,u)) = X{s,y,u | Vq). Отметим, что информационные множества также обладают полугрупповым свойством [67] при мгновенных ограничениях на возмущения.
Продолжим формулировку задачи коррекции. Первоначальная цель управления состоит в минимизации функционала Ф(Х(Т,у,и)) в конечный момент времени, где Ф(-) — некоторый функционал, заданный на компактных подмножествах Rn. Функционал предполагается ограниченным снизу и монотонным: Ф(Хх) < Ф(Х2), если Х\ С Хч- Область до-, стижимости системы (1) в момент t по всем параметрам Vq обозначим через Xt(u | Vo). Множество Vo будет опускаться, если это не приводит к недоразумениям. В начальный момент времени назначается управление щ, решающее программную задачу
Ф(Хт(и)) min. (4)
ие U
Такое управление в общем случае определяется неоднозначно. Будем считать, что минимум в задаче (4) существует, и выбрано какое-то управление щ G Arg min Ф(Яг(и)). Далее назначается некоторый момент времени s Е [to,T], вплоть до которого в системе (1) сохраняется управление Uq(-) и проводится наблюдение согласно уравнению (2). В момент s наблюдение прекращается, формируется область достижимости
Xt{us{-) I V(s,y,uo)) и решается вспомогательная программная задача Ф(*т(щ(-) I V(s,y,u0))) -> min =r3(y,uo). (5)
us(-)eU(ug)
Здесь и далее множество \]{и*) состоит из всех функций которые
вместе с начальным отрезком и1 составляют некоторую функцию и £ U.
Выберем какое-то решение задачи (5) и обозначим его usо(-). В силу свойств функционала Ф значение оптимального функционала в задаче (5) не больше аналогичного значения задачи (4). Вопрос заключается в том, как выбрать момент окончания наблюдения s. Для этого выбора в цитированных выше работах А.Б. Куржанского и его школы предлагалась следующая конструкция.
Пусть Y(s, t I V(t,y,u)) означает множество всех продолжений {yt{-)} сигнала у*(-) на отрезок [io,s], где t < s, при назначенном управлении и Е U. Определяются величины
n{s,y,uo)= sup rs(y,u0),
yt{-)eY(s,t\V{t,y,u0)) ^
n(t,y,u0)= min rt(s, у, щ).
se[t,T}
Теперь задачу однократной коррекции можно сформулировать так.
Задача 1 (Однократной коррекции). Найти наименьший корень s уравнения
r*(t,y,u0) =rt(y,uo). (7)
Этот наименьший корень s называется моментом коррекции исходного управления щ, которое изменяется на usо(-) на оставшемся отрезке управления [s, Т].
Отметим, что имеются иные постановки задачи, представленные в работах Ф.Л. Черноусько, В.Б. Колмановского, H.A. Парусникова, В.М. Морозова, В.И. Борзова, В.Н. Афанасьева и др. [26,35,78,91-93]. В частности, класс управлений может быть не из пространства L2, а из пространства обобщенных функций первого или более высокого порядка, как в [5,91,92]. Многие постановки допускают присутствие стохастических или смешанных возмущений, см. работы В.В. Александрова, Б.И. Ананьева, В.Н. Афанасьева, И.А. Богуславского, И.А. Дигайловой, Д.М. Климова [3,7,9,26,31,35,45,55].
Практически решение представленной выше задачи 1 достигается при использовании следующей дискретной схемы.
Дискретная пошаговая процедура. Пусть
Л : ¿0 < ¿1 < • • • < ¿ЛГ = т (8)
— разбиение отрезка [¿о,Т], и |А| = тах{^ — ¿¿-1 : 1 ^ г ^ А^}. Тогда:
(а) До начала процесса решается задача (4) и находится оптимальное управление щ, которое сохраняется на начальном отрезке [¿0^1]-
(б) В момент ¿1 и в последующие моменты и проверяется равенство (7). Если г*(и,у,щ) < г^(у,щ), то управление на следующий отрезок [и,и+1] не меняется. В противном случае на весь оставшийся отрезок [и,Т] назначается новое управление а момент ^ объявляется моментом коррекции.
Вообще говоря, как отмечалось выше, начальное управление щ может определяться неоднозначно, и момент коррекции может зависеть от этого управления. Однако (особенно в линейных задачах) весьма часто имеем г^о = 0. Как видно из построения, управление на отрезке [и,Т] вычисляется позиционно, на основе информации {?/*(•), (•)}.
Актуальность работы и научная новизна. В данной работе мы несколько обобщаем задачу 1. Если процесс наблюдения не является затратной процедурой, то его следует продолжить после нахождения первого момента коррекции. Таким образом, возникает
Задача 2 (Многократной коррекции). В соответствии с разбиением (8) до начала процесса вычисляется управление щ (решение задачи (4)), которое сохраняется на начальном отрезке [¿о5 ¿1]• Ни отрезке [¿1,^2] выбирается управление щ^-), совпадающее с если < гЬ1(у,щ). В противном случае иы(-) = щ^-), где
— одно из решений задачи (5) при в = ¿1. В последующие моменты и процедура повторяется.
В результате решения задачи 2 возникает управление ид 6 и, которое корректируется, вообще говоря, более чем в одной точке. В конце процесса подсчитывается результат гт(у, ид), который по построению не хуже, чем аналогичный результат решения задачи 1. Задача 2 впервые рассмотрена в работе [13]. Помимо сформулированной задачи ниже рассматриваются некоторые её модификации. В частности, в том случае, когда допустимо изменение управления в каждый момент разбиения (8), получается наилучший результат.
Сформулированные задачи предполагают эффективное вычисление величин (6), умение строить информационные множества и множества
достижимости для рассматриваемых систем. В связи с этим укажем один весьма общий способ определения информационных множеств, основанный на методе динамического программирования и предложенный в работах А.Б. Куржанского и П. Варайи [68,69,109,110]. Пусть уравнение (2) имеет вид
y = g(t,x) + w, yeRm, (9)
где возмущение w(-) вместе с начальным состоянием хо и возмущением v(-) из (1) стеснены ограничением
г
F(xq) + J f0(t,v,w)dt^l. (10)
¿0
Введём функцию Беллмана
V(t, х) = min J(t, х, v),
v(-)
где функционал J определяется формулой
t
J(t, X, V) = F(xо) + J /о(г, V, у(т) - д(т, x))dr, x(t) = х.
to
Уравнение Беллмана для V(t, х) имеет следующий вид:
Vt = mm{-f'(t,x,u,v)Vx + fo(t,v,y(t) - g(t,x))} ,
(И)
V(t0,x) = F(x),
где символ ' означает транспонирование.
За последние десятилетия методы решения уравнений типа (11) дополнились новыми результатами в случае негладких функций F, /о (см. монографии Ф. Кларка, А.И. Субботина [102,116]). Если решение уравнения (И) в каком-то смысле найдено, то ИМ запишется в виде неравенства X(t,y,u) = {х : V(t,x) < 1}.
Отметим еще, что задачи управления по неполным данным типа (4), (5) изучались в работах Т.Ф. Филипповой (см. [89]).
В настоящей диссертации разработаны методы решения задач многократной коррекции движения управляемых систем, описываемых обыкновенными дифференциальными уравнениями или многошаговыми уравнениями в условиях неполной информации о фазовом векторе. Предложены алгоритмы коррекции, установлены их свойства. Рассмотрено
приложение к задаче выставки инерциальных систем и исследовано влияние информационных ограничений на параметры коррекции движения.
Краткое содержание работы. В диссертации разрабатываются методы решения задач многократной коррекции движения механических систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями с неполной информацией при непрерывных и дискретных наблюдениях.
Диссертация состоит из введения, 4-х глав, заключения и списка литературы из 116 наименований. В тексте содержится 24 рисунка.
В первой главе работы рассмотрено решение задачи многократной коррекции для линейных непрерывных систем с квадратичными ограничениями. Для полноты изложения приведены решения всех необходимых вспомогательных задач (4) - (6) для терминального функционала Ф(Хт(и)) = тах где || • || — евклидова норма ий- некоторая
матрица. В пункте 1.1 главы изложены основные результаты по оцениванию линейных систем с детерминированными возмущениями, стесненными квадратичными ограничениями. Большинство результатов получено ранее в работах А.Б. Куржанского, И.Я. Пищулиной [66,67] и Б.И. Ананьева [6]. Однако использование метода динамического программирования позволило охватить также случай вырожденной матрицы Ро в ограничениях
где ЦяЦр = х'Рх, символ ' означает транспонирование, для системы с наблюдением
х = А(г)х + в(г)и + С{г)у, и^г^т, у = с(г)х + т(г). (13)
В предположении, что однородная система (13) вполне наблюдаема [33, 58] на любом подотрезке [г, в] С [¿о в подпункте 1.1.1 установлен вид ИМ:
Х(1,у,и) = {х\У(1,х)^1}, У(1,х) = \\х\\2Р{1)-2x^(1)+д(1), (14)
где У(Ь,х) — решение уравнения Беллмана вида (11). Для параметров множества (14) выписаны дифференциальные уравнения с известными
хЕ Хт{и)
Т
(12)
начальными условиями, причем для вектора d(t) и скаляра g(t) эти условия нулевые. В силу полной наблюдаемости матрица P(t) будет невырожденной и ИМ будет ограниченным эллипсоидом. В пункте 1.2 приведено выражение для совместимого множества в соответствии с определением 2
V(t,y,u) = j(W-)) : J \\vt(T)\\2Q{T)dT + V(t,x) < 1
и формула для минимума rt(y, и) во вспомогательной задаче управления
V г ^fnru ^ 11^11 "" = гЖу>и(15)
x€XT{ut{-)\V(t,y,u)) ut(-)
установленная в работах [6,67] при квадратичных ограничениях на управление
т
J 1М*)11я(0<** < 1-
to
В пункте 1.3 использована структура множества Y(0, t | V(i, у, и)) всех возможных продолжений сигнала у1{-) и формула для величины наихудшего прогноза rt(s,y,u) (см. (6)), также установленные в указанных работах. На основании приведенных формул сделано следующее замечание.
Если в данной позиции {£,?/(•)} выполнено равенство (7), где и*0 — управление, найденное на предыдущем этапе, и величина h(t) = g(t) —