Методы адаптивного управления линейными дискретными объектами тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Гречаный, Вячеслав Александрович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1992
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
САНКТ-ПЕТЕРБУРГСКИ! ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
1РЕЧАНЫ11 Вячеслав Александрович
МЕТОДЫ АДАПТИВНОГО УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ДИСКРЕТНЫМИ ОБЪЕКТАМИ
()1.01.09 - математическая кибернетика
АВТОРЕФЕРАТ диссертации на соискание ученей степени кандидата физико-математических наук
САНКТ-ПЕТЕРБУРГ 1992
Работа выполнена на кафедре теоретической кибернетики математяко-механического факультета Санкт-Петербургского государственного университета.
Научный руководитель: доктор физико-математических
наук, профессор В.Н.Фомин. Официальные оппоненты: доктор технических наук,
профессор АЛ.Фрадкоп, кр^лилат физико-матегатичсских пгук с.1.1.>.рятев.
Ведущая организация: Санкт-Петербургский технический
университет. . *
Бащита^осгоигся » ШСисР • 1992 г. в . час, _ши. на заседании специализирован-
ного совета К 063.5?.49 по присуждению ученой стопени кандидата физико-математических назтс в Санкт-Петербургском государственном университете по адресу: 1С89М, Санкт-Петербург, Старый Петергоф, Библиотечная пл., д.2, математико-механический факультет Салкт-Петер-бургско1'0 государственного университета.
С диссертацией можно ознакомиться по адресу: г. Санкт-Петербург, Университетская наб., д. 7/9, научная библиотека С1И1У. ^ '
Автореферат разослан ", Ь " ,/ ^ ^ А 1992г. Ученый секретарь специализированного совета, кандидат физико-математических наук, доцент ' А.Н.Шепелявый
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность теми. Теория адаптивного управление динамическими объектами является одним из наиболее активно развиваемых направлений современной кибернетики. Практическое значение этого направления связано с обилием прикладных задач управления техническими объектами и технологическими процессами при наличии некоторой неполноты знаний об объекте управления (ОУ) и (или) о действугашх на объект помехах. Бее более широкое применение цифровых сВМ в управляющих контурах • различными техническими объектами делает актуальной постановку дискретных задач адаптивного управления. Объекты управления описываются линейными разностными уравнениями, а неполнота знаний может формализована как отсутствие полной информации о значениях параметров бтих уравнений и об аддитивно действующих возмущениях. Управление в условиях указанной параметрической неопределенности, достигающее цели управления (ЦУ/ , обычно называется адаптивным.
В данной работе решаются некоторые задачи адаптивного управ-, ления линейными дискретными объектами, описываемие разностныш уравнениями, в случае, когда возмущения ограничены (в том числе ограничены в среднем) .
Цель работы состоит в установлении условий разрешимости задачи 'субоптимального адаптивного слежения, в исследовании условий применимости алгоритма дискретной самонастройки, а такяб в синтезе адаптивного нелинейного регулятора, основанного на переключении регуляторов иэ заданного набора.
Научная новизна. В диссертации поставлена задача оптимального слежения заданного программного движения,® варианте^ допускающем решение задачи адаптивного субоптималъного слежения (в дискретном времени) . Предложены новые способы построения адаптивных стабилизирующих регуляторов, основанные на дискретной самонастройке и переключении регуляторов из заданного набора (как для минимально-фазовых, так и неминимально-базовых объектов) .
' Методика исследований базируется на использовании аппарата линейной алгебры, теории случайных процессов, методе рекуррентных целевых неравенств, а также методе функций Ляпунова.
Практическая ценность. Предложенные процедуры адаптивного управления могут найти применение при решении специальных задач управления техническими объектами, управления, технологическими процессами в гибких производственных системах, других областях
- А -
адаптивного уграЕлснгог в условиях ггрр'члтпче.скоГ пеогределенности о свойствах объекта или управляемых процессах.
Аптробаття работы. Ссновкые результаты работы докладдаались не семинарах кафедры теоретической кибернетики гатематико-механи-ческого факультета Санкт-Петербургского университета, на Пятом симпозиуме по теории адаптивных систем С Санкт-Петербург, 1С91гЛ и опубликованы в работах £1 - .
Структура и объем, диссертации. Диссертация состоит из введения, трех глав и заключения. Список литературы включает 75 наименований. Объем диссертации страниц машинописного текста.
; КРАТКОЕ СОДЕРлАШиЗ РАНТ К " Бс введении лается обзор известных тгтов по тете диссер-
тации, обосновается актуальность тега, дается общая характеристика работы, формулируются основные результаты.
Первая глава посвящена постановке к решению задач огттигального в адаптивного субоптималъното слежения г случае линейного дискретного стохастического объекта управления.
• в § 1*1 приводится общая, постановка задачи слежения. Принято, что 07 функционирует В'дискретном времени -Ь =0,1,... и описывается яинёйннм разностным уравнением
» А{9)%± , О)
где ЯЦ ( 1<Ц » - вещественные вектогн переменных состояния, управления и возмущения в комеят времени (соответственно размеров н. , т , П) ; ^ей11, йгл' , е .
А ' 6» ~ квадратная и прямоугольная матрицы (соответственно размеров и П*т), зависящие линейно от вектора параметров $ , принимающего значения яз заданного выпуклого компактною множества ^ ,■
Помеха } предполагается последовательностью независи-
мых случайных векторов со свойствами
———
м Щ »£3 , /И Щ О , * ** V Ги+1ЛА 1
(М - символ гатематического ожидания, згеэдочка означает транспонирование соответствующей иатргоы, / СГ/ - евклидова норма вектора V ) . Последние соотношения в (2) понимаются с вероятностью 1 .
Цусть задана последовательность { = <^¿.„5 случайных векторов О, С * которые будем называть программным движением.
- а -
Будем предполагать, что случайные ректор» имеют крнечнце
вторые тенты, удовлетворяющие условию
«ж» (1)
при некоторой вещественной величине Jfc(0/1), называемой дискон-.тнрувдим множителем.
Управляющие воздействия формируются по типу обратных связей вида - '
% * v* , Vi = щ * i»..г, ш
где - измеримые вещественные функции, зависящие от iiadopon
переменных СС* , Я?*) , V»,.».-, J ,
Набор J этих функций наэиваетсщ страте-
гией управления (СУ) . Далее рассматриваются лишь допустимые СУ, обеспечивающие выполнение неравенства
с тем т дисконтирующим множителем X , что ив (з ) . Черед Pj. обозначим множество всех допустимых СУ,
. ¡Задача пленения состоит в установлении факта существования ' СУ Uf > обеспечивающей выполнение неравенстве
где £[&J - заданная непрерывная на гчюлестое 0 матрица (размера и - гап.итая неотрицательная непрерывная
функция аргумента &, ¿е & , $о.
'В § 1.3 приведено решение задачи оптимального слежения в предположении, что параметр 9 в (1}и (S) известен.
Если пара матриц fA',8) в (1) стабилизируемая (т.е. существует матрица Б такая, что матрица Дч ftЕ не имеет корней вне открытого единичного круга } , тогда уравнение Лурье
H^A'tHA-A*Haie,*Ha)~16!'HA + ev (?)
¡imei единственное неотрицательное матричное решение И * о , для которого матрица
А0* А - а( '&4И0)"А Г^Н А (я)
устойчива, т.е. для ее спектрального радиуса у0 заполнено неравенство
Го= (и* / Ас0-/^ < 1 . ^J
tt-M«
Целевое неравенство (б) в этом случае принимает вид
= V ш
где и^ [ & 2 - множество СТ, определяемых обратными связями (4) и обесгочиваицйми выполнение неравенства ( 5) 4
Теорема 1, Првдйоложйм, что в .{1) пара ( А . В) стабилизируемая и дисконтирующий множитель у в (в) удовлетворяет уЬловию
Кромэ того конечен предел
¿Б.(♦$/• »ь +1^1
где для,краткости- обозначено
Тогда рассматриваемая задача оптимального слежения (1) » (10) имвет решение и оптимальная стратегия управления определяется обратной связью
■ Щ* к** ? , (44)
■ где матричный ксзрфютаент « (размеров )п * IV) , .
' к.*-(В*Н&)-* В*НА ,
выражается через'неотрицательное решение Н уравнения Лурье ("?). Устойчивая матрица А« определяется формулой (8) , При зтом найме ныл бе значение функционала (1С) равно
Б §1.3 рассматриваются алгоритма адаптации (варианты метода рекуррентных целевых неравенств) . Д'ля удобства описания представим ОУ (1) в вида >
1Ц =+ , ' гда , АГО+ ,
Примем алгоритм идентификации в виде .
Го,если »^¿^¿а-н^^о •
■I I > в противном случае. ______ Здесь £ - произвольнее положительное число, / I - евклидова норма матрицы » - проектор на множество © 5
ал^^ »0-0 I , V ^ ^ й-6.
Теорема 2. Пусть множество © всевозможных"значений вектора 9 - выпуклый компакт. Тогда с вероятностью 1 для любых 6« , £ алгоритм (13) - (16) будет конечно-сходящимся, т.е. найдется .такое (зависящее от реализации помехи), что ¿¡^з О при всех ± ^ -¿^ , При этом справедлива оценка
у \ '
где & - истинный вектор коэффициентов объекта управления (1 ) . Кроме того, с вероятностью 1 выполнены неравенства
I <?ч+1 - е \ & I е* - е I, -ь^о,*,...
и для всех Ь
1\|*ч-ЯЗеиб Сг + + .
Аналогичное утверждение доказано и в случае, когда случайние величины {_ } обладают свойствами
.М ^ 2 о, М = ^, М ^ * ^ ,
В § 1.4 рассматривается задача адаптивного субоптималъцого слежения.
Теорема 3. Пусть выполнены условия Теоремы 1. Множество © возможных значений вектора 6 - выпуклый компакт» Кроме того, выполнено условие '
М , ... -
Настройка оценок \ \ производится согласно алгоритму адаптации (13}-(16).
Тогда для любого -0О и достаточно малого £ ("параметра алгоритма адаптации) система управлений ( 1], (И) , (Чз) - (Д6) обеспечивает выполнение Щ" (.5] о
где - любое заданное положительное число ( уровень субоптимальности).
В § 1.5 рассматриваются частные варианты задачи слехеняя в случаях, когда программное движение стационарный ненулевой процесс или дрейфует по полиномиальному закону.
§ 1.6 посвящен оцениванию переходного режима в задаче агап-- тивного оптимального слежения (в случае минимально-?азогого С'У) <
Получейн ¡эффективные оценки вектора состояний и управляющих воздействий в крлцшЙ мжент врагат,
Во второй главе рассмотрена задача адаптивно!* Ьтабилизации • линейного дискретного стационарного ОУ, полученного дискретизацией непрерывного объекта, в классе кусочно-постоянных управлений.
Б § ?,»1 рассматривается непрерывный алгоритм самонастройки с "памятью", J-твйнШ непрерывный ОУ описывается уравнением в стандартной $срме
dt- .■,„■' v
где Я(i^ Ot(4), ifdj.A, 8, ef & тет прежний сшсл fcw. (ljj}.
Действующая На объект помеха тЯ4)огранпчена известной положительной ПОСТОЯННОЙ СлГ,
, ЦлР I irrt II & йг ,
а в остальном произвольна.
Управление ti (4f ищется в классе неупрсжлоших стратегий управления
<UH Vitts),s* ± Ь .
Цель управления примем в виде
ßZl & , '¿йГм. f «г-ж* «>. (fii)
-£. «м * "*»
Предполагаячто весь вектор состояния к(4) доступен измерений j введем настраиваемый параметр &Ц) и управление определим е помощь*) обратной связи
где B(i) - подходящая оценка неизвестного вектора & , которая определяется tepas CEisj, tc ± s* -t -
Для любого ёе & и любого X е определим матрицы ) ж Aide) слбдуицшй соотношениями
причем .для матрицы ) предполагается известной положительная постоянная С/ц , такая, что справедлива сценка
i А (я) ы Ca Isef , -(A4J
Тогда с учетом (22) ~ (24) ОУ (18) можно переписать в виде
Если минимум р. (44) будет постигаться при нескольких значений* индекса I , то, до определений, будем вибирать регулятор с нзименьшм индексом.
Теорема 6. Цусть управление, определяемое соотношениями (ЗГ) , (43), (44),удовлетворяет услЬвию "Достаточности" регуляторов
(42) . Тогда для замкнутей систем (1), (38), (39), (43), (44) справедливо утверяшение: для любого ограниченного множества X & существует конечный момент времени "Т , такой, что Траекторий
4 ( ос о £ X ^ при -1 > Т " принадлежат множеству
I ас I 4 £ , '(**>
где Сг - константа из (ЗР), а еЛГ-известный параметр из (42) .
В случае, когда пар?."ентр. 0 неизвестен, адаптивное управ- • ление будем строить с помощью обратной связи (39), в которой правило переключения регулятссов (40 ) определяется соотношениями
(43)-(44) . Лля полупения оценок 04 неизвестного параметра 0 будем использовать алгоритм "Полоска" (13) - (16) .
Теорема 7. Пусть множество <Э возможных значений вектора б - выпуклый компакт. Настройка оценок производится '
согласно алгоритмуадаптации (13) - (16) . Управление, определяемое соотношениями (39) , (43)- (44) удовлетворяет условия., "достаточности" набора регуляторов (42).
Тогда для замкнутой системы (1), (13) - (1б), (39) , ( 43) - (44) справедливо утверждение! ' ,
при достаточно малых значениях параметра алгоритма адаптации £ для любого ограниченного множества Хб существует конечный момент времени Т , тахой, что траектории { ^ рсе е "X % при Ъ ^ т принадлежат множеству
1*1 ± т', ■
где гГ — любое известное положительное число, ¡¡V- константа из (38 ) , р 3 £ £ - параметр из из неравенства ¿42 ) ;
В главе приводится пример, когда набор регуляторов» состояний из двух регуляторов (каяцшй из. которых на является ст&бйли-5ируицим); тем не" менее удовлетворяет условию достаточности (42) и стабилизирует минимально-фазовый 07. ', ...
Приводятся результаты численного моделирования иллюстрирующие результаты третьей главы (для неминимально-фазового объекта).
ЗАКЛЮЧЕНИЕ
■ Основные результаты, полученные в диссертации, могут быть сформулированы следуодим образом:
• 1, Постановка и решение задачи оптимального слежения в случае линейного Дискретного стохастического объекта управления (теорема 1) .
2. Решение варианта задачи адаптивного субоптимального слежения ( теоремы 2, 3) .
3. Синтез стабилизирующего регулятора с "памятью", основанный на дискретной самонастройке (теоремы 4,5).
■ 4« Постановка в решение задачи стабилизации с помощью переключения регуляторов ив веданного набора (в дискретном времени ) г тебрема 6»
5. Решение задачи адаптивного управления линейным дискретным объектом с помощь® переключения регуляторов из заданного набора -теорема 7.
Основные результаты диссертации опубликованы в следующих работах:
1, Гречаный Б.А. Адаптивное отслеживание программного движения в задаче управления линейным объектом, - В кн.: Тезисы докладов 5-го Ленинградского.симпозиума по теории адаптивных систем. _ Л., Ч.З, 1991 с. 46. 2» Гречаный В.А., 'фомин В.Н. Синтез адаптивного регулятора, основанного на переключении регуляторов из заданного набора. Л., 1991 Г,,. 9с. Дея. В-ВИНИТИ Я 3061-391 от 30 июля 1991 г. 3. Гречавый В.А., ЗомиаВ.Н. Адаптивное отслеживание программного движения в задаче управления линейным объектом. Л., 1991 г., ■26 с* Деп.'в ВИНЙТИ Я 3060-Б91 от 30 июля 1991 г.