Методы адаптивного управления линейными дискретными объектами тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Гречаный, Вячеслав Александрович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
1992 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Методы адаптивного управления линейными дискретными объектами»
 
Автореферат диссертации на тему "Методы адаптивного управления линейными дискретными объектами"

САНКТ-ПЕТЕРБУРГСКИ! ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

1РЕЧАНЫ11 Вячеслав Александрович

МЕТОДЫ АДАПТИВНОГО УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ДИСКРЕТНЫМИ ОБЪЕКТАМИ

()1.01.09 - математическая кибернетика

АВТОРЕФЕРАТ диссертации на соискание ученей степени кандидата физико-математических наук

САНКТ-ПЕТЕРБУРГ 1992

Работа выполнена на кафедре теоретической кибернетики математяко-механического факультета Санкт-Петербургского государственного университета.

Научный руководитель: доктор физико-математических

наук, профессор В.Н.Фомин. Официальные оппоненты: доктор технических наук,

профессор АЛ.Фрадкоп, кр^лилат физико-матегатичсских пгук с.1.1.>.рятев.

Ведущая организация: Санкт-Петербургский технический

университет. . *

Бащита^осгоигся » ШСисР • 1992 г. в . час, _ши. на заседании специализирован-

ного совета К 063.5?.49 по присуждению ученой стопени кандидата физико-математических назтс в Санкт-Петербургском государственном университете по адресу: 1С89М, Санкт-Петербург, Старый Петергоф, Библиотечная пл., д.2, математико-механический факультет Салкт-Петер-бургско1'0 государственного университета.

С диссертацией можно ознакомиться по адресу: г. Санкт-Петербург, Университетская наб., д. 7/9, научная библиотека С1И1У. ^ '

Автореферат разослан ", Ь " ,/ ^ ^ А 1992г. Ученый секретарь специализированного совета, кандидат физико-математических наук, доцент ' А.Н.Шепелявый

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность теми. Теория адаптивного управление динамическими объектами является одним из наиболее активно развиваемых направлений современной кибернетики. Практическое значение этого направления связано с обилием прикладных задач управления техническими объектами и технологическими процессами при наличии некоторой неполноты знаний об объекте управления (ОУ) и (или) о действугашх на объект помехах. Бее более широкое применение цифровых сВМ в управляющих контурах • различными техническими объектами делает актуальной постановку дискретных задач адаптивного управления. Объекты управления описываются линейными разностными уравнениями, а неполнота знаний может формализована как отсутствие полной информации о значениях параметров бтих уравнений и об аддитивно действующих возмущениях. Управление в условиях указанной параметрической неопределенности, достигающее цели управления (ЦУ/ , обычно называется адаптивным.

В данной работе решаются некоторые задачи адаптивного управ-, ления линейными дискретными объектами, описываемие разностныш уравнениями, в случае, когда возмущения ограничены (в том числе ограничены в среднем) .

Цель работы состоит в установлении условий разрешимости задачи 'субоптимального адаптивного слежения, в исследовании условий применимости алгоритма дискретной самонастройки, а такяб в синтезе адаптивного нелинейного регулятора, основанного на переключении регуляторов иэ заданного набора.

Научная новизна. В диссертации поставлена задача оптимального слежения заданного программного движения,® варианте^ допускающем решение задачи адаптивного субоптималъного слежения (в дискретном времени) . Предложены новые способы построения адаптивных стабилизирующих регуляторов, основанные на дискретной самонастройке и переключении регуляторов из заданного набора (как для минимально-фазовых, так и неминимально-базовых объектов) .

' Методика исследований базируется на использовании аппарата линейной алгебры, теории случайных процессов, методе рекуррентных целевых неравенств, а также методе функций Ляпунова.

Практическая ценность. Предложенные процедуры адаптивного управления могут найти применение при решении специальных задач управления техническими объектами, управления, технологическими процессами в гибких производственных системах, других областях

- А -

адаптивного уграЕлснгог в условиях ггрр'члтпче.скоГ пеогределенности о свойствах объекта или управляемых процессах.

Аптробаття работы. Ссновкые результаты работы докладдаались не семинарах кафедры теоретической кибернетики гатематико-механи-ческого факультета Санкт-Петербургского университета, на Пятом симпозиуме по теории адаптивных систем С Санкт-Петербург, 1С91гЛ и опубликованы в работах £1 - .

Структура и объем, диссертации. Диссертация состоит из введения, трех глав и заключения. Список литературы включает 75 наименований. Объем диссертации страниц машинописного текста.

; КРАТКОЕ СОДЕРлАШиЗ РАНТ К " Бс введении лается обзор известных тгтов по тете диссер-

тации, обосновается актуальность тега, дается общая характеристика работы, формулируются основные результаты.

Первая глава посвящена постановке к решению задач огттигального в адаптивного субоптималъното слежения г случае линейного дискретного стохастического объекта управления.

• в § 1*1 приводится общая, постановка задачи слежения. Принято, что 07 функционирует В'дискретном времени -Ь =0,1,... и описывается яинёйннм разностным уравнением

» А{9)%± , О)

где ЯЦ ( 1<Ц » - вещественные вектогн переменных состояния, управления и возмущения в комеят времени (соответственно размеров н. , т , П) ; ^ей11, йгл' , е .

А ' 6» ~ квадратная и прямоугольная матрицы (соответственно размеров и П*т), зависящие линейно от вектора параметров $ , принимающего значения яз заданного выпуклого компактною множества ^ ,■

Помеха } предполагается последовательностью независи-

мых случайных векторов со свойствами

———

м Щ »£3 , /И Щ О , * ** V Ги+1ЛА 1

(М - символ гатематического ожидания, згеэдочка означает транспонирование соответствующей иатргоы, / СГ/ - евклидова норма вектора V ) . Последние соотношения в (2) понимаются с вероятностью 1 .

Цусть задана последовательность { = <^¿.„5 случайных векторов О, С * которые будем называть программным движением.

- а -

Будем предполагать, что случайные ректор» имеют крнечнце

вторые тенты, удовлетворяющие условию

«ж» (1)

при некоторой вещественной величине Jfc(0/1), называемой дискон-.тнрувдим множителем.

Управляющие воздействия формируются по типу обратных связей вида - '

% * v* , Vi = щ * i»..г, ш

где - измеримые вещественные функции, зависящие от iiadopon

переменных СС* , Я?*) , V»,.».-, J ,

Набор J этих функций наэиваетсщ страте-

гией управления (СУ) . Далее рассматриваются лишь допустимые СУ, обеспечивающие выполнение неравенства

с тем т дисконтирующим множителем X , что ив (з ) . Черед Pj. обозначим множество всех допустимых СУ,

. ¡Задача пленения состоит в установлении факта существования ' СУ Uf > обеспечивающей выполнение неравенстве

где £[&J - заданная непрерывная на гчюлестое 0 матрица (размера и - гап.итая неотрицательная непрерывная

функция аргумента &, ¿е & , $о.

'В § 1.3 приведено решение задачи оптимального слежения в предположении, что параметр 9 в (1}и (S) известен.

Если пара матриц fA',8) в (1) стабилизируемая (т.е. существует матрица Б такая, что матрица Дч ftЕ не имеет корней вне открытого единичного круга } , тогда уравнение Лурье

H^A'tHA-A*Haie,*Ha)~16!'HA + ev (?)

¡imei единственное неотрицательное матричное решение И * о , для которого матрица

А0* А - а( '&4И0)"А Г^Н А (я)

устойчива, т.е. для ее спектрального радиуса у0 заполнено неравенство

Го= (и* / Ас0-/^ < 1 . ^J

tt-M«

Целевое неравенство (б) в этом случае принимает вид

= V ш

где и^ [ & 2 - множество СТ, определяемых обратными связями (4) и обесгочиваицйми выполнение неравенства ( 5) 4

Теорема 1, Првдйоложйм, что в .{1) пара ( А . В) стабилизируемая и дисконтирующий множитель у в (в) удовлетворяет уЬловию

Кромэ того конечен предел

¿Б.(♦$/• »ь +1^1

где для,краткости- обозначено

Тогда рассматриваемая задача оптимального слежения (1) » (10) имвет решение и оптимальная стратегия управления определяется обратной связью

■ Щ* к** ? , (44)

■ где матричный ксзрфютаент « (размеров )п * IV) , .

' к.*-(В*Н&)-* В*НА ,

выражается через'неотрицательное решение Н уравнения Лурье ("?). Устойчивая матрица А« определяется формулой (8) , При зтом найме ныл бе значение функционала (1С) равно

Б §1.3 рассматриваются алгоритма адаптации (варианты метода рекуррентных целевых неравенств) . Д'ля удобства описания представим ОУ (1) в вида >

1Ц =+ , ' гда , АГО+ ,

Примем алгоритм идентификации в виде .

Го,если »^¿^¿а-н^^о •

■I I > в противном случае. ______ Здесь £ - произвольнее положительное число, / I - евклидова норма матрицы » - проектор на множество © 5

ал^^ »0-0 I , V ^ ^ й-6.

Теорема 2. Пусть множество © всевозможных"значений вектора 9 - выпуклый компакт. Тогда с вероятностью 1 для любых 6« , £ алгоритм (13) - (16) будет конечно-сходящимся, т.е. найдется .такое (зависящее от реализации помехи), что ¿¡^з О при всех ± ^ -¿^ , При этом справедлива оценка

у \ '

где & - истинный вектор коэффициентов объекта управления (1 ) . Кроме того, с вероятностью 1 выполнены неравенства

I <?ч+1 - е \ & I е* - е I, -ь^о,*,...

и для всех Ь

1\|*ч-ЯЗеиб Сг + + .

Аналогичное утверждение доказано и в случае, когда случайние величины {_ } обладают свойствами

.М ^ 2 о, М = ^, М ^ * ^ ,

В § 1.4 рассматривается задача адаптивного субоптималъцого слежения.

Теорема 3. Пусть выполнены условия Теоремы 1. Множество © возможных значений вектора 6 - выпуклый компакт» Кроме того, выполнено условие '

М , ... -

Настройка оценок \ \ производится согласно алгоритму адаптации (13}-(16).

Тогда для любого -0О и достаточно малого £ ("параметра алгоритма адаптации) система управлений ( 1], (И) , (Чз) - (Д6) обеспечивает выполнение Щ" (.5] о

где - любое заданное положительное число ( уровень субоптимальности).

В § 1.5 рассматриваются частные варианты задачи слехеняя в случаях, когда программное движение стационарный ненулевой процесс или дрейфует по полиномиальному закону.

§ 1.6 посвящен оцениванию переходного режима в задаче агап-- тивного оптимального слежения (в случае минимально-?азогого С'У) <

Получейн ¡эффективные оценки вектора состояний и управляющих воздействий в крлцшЙ мжент врагат,

Во второй главе рассмотрена задача адаптивно!* Ьтабилизации • линейного дискретного стационарного ОУ, полученного дискретизацией непрерывного объекта, в классе кусочно-постоянных управлений.

Б § ?,»1 рассматривается непрерывный алгоритм самонастройки с "памятью", J-твйнШ непрерывный ОУ описывается уравнением в стандартной $срме

dt- .■,„■' v

где Я(i^ Ot(4), ifdj.A, 8, ef & тет прежний сшсл fcw. (ljj}.

Действующая На объект помеха тЯ4)огранпчена известной положительной ПОСТОЯННОЙ СлГ,

, ЦлР I irrt II & йг ,

а в остальном произвольна.

Управление ti (4f ищется в классе неупрсжлоших стратегий управления

<UH Vitts),s* ± Ь .

Цель управления примем в виде

ßZl & , '¿йГм. f «г-ж* «>. (fii)

-£. «м * "*»

Предполагаячто весь вектор состояния к(4) доступен измерений j введем настраиваемый параметр &Ц) и управление определим е помощь*) обратной связи

где B(i) - подходящая оценка неизвестного вектора & , которая определяется tepas CEisj, tc ± s* -t -

Для любого ёе & и любого X е определим матрицы ) ж Aide) слбдуицшй соотношениями

причем .для матрицы ) предполагается известной положительная постоянная С/ц , такая, что справедлива сценка

i А (я) ы Ca Isef , -(A4J

Тогда с учетом (22) ~ (24) ОУ (18) можно переписать в виде

Если минимум р. (44) будет постигаться при нескольких значений* индекса I , то, до определений, будем вибирать регулятор с нзименьшм индексом.

Теорема 6. Цусть управление, определяемое соотношениями (ЗГ) , (43), (44),удовлетворяет услЬвию "Достаточности" регуляторов

(42) . Тогда для замкнутей систем (1), (38), (39), (43), (44) справедливо утверяшение: для любого ограниченного множества X & существует конечный момент времени "Т , такой, что Траекторий

4 ( ос о £ X ^ при -1 > Т " принадлежат множеству

I ас I 4 £ , '(**>

где Сг - константа из (ЗР), а еЛГ-известный параметр из (42) .

В случае, когда пар?."ентр. 0 неизвестен, адаптивное управ- • ление будем строить с помощью обратной связи (39), в которой правило переключения регулятссов (40 ) определяется соотношениями

(43)-(44) . Лля полупения оценок 04 неизвестного параметра 0 будем использовать алгоритм "Полоска" (13) - (16) .

Теорема 7. Пусть множество <Э возможных значений вектора б - выпуклый компакт. Настройка оценок производится '

согласно алгоритмуадаптации (13) - (16) . Управление, определяемое соотношениями (39) , (43)- (44) удовлетворяет условия., "достаточности" набора регуляторов (42).

Тогда для замкнутой системы (1), (13) - (1б), (39) , ( 43) - (44) справедливо утверждение! ' ,

при достаточно малых значениях параметра алгоритма адаптации £ для любого ограниченного множества Хб существует конечный момент времени Т , тахой, что траектории { ^ рсе е "X % при Ъ ^ т принадлежат множеству

1*1 ± т', ■

где гГ — любое известное положительное число, ¡¡V- константа из (38 ) , р 3 £ £ - параметр из из неравенства ¿42 ) ;

В главе приводится пример, когда набор регуляторов» состояний из двух регуляторов (каяцшй из. которых на является ст&бйли-5ируицим); тем не" менее удовлетворяет условию достаточности (42) и стабилизирует минимально-фазовый 07. ', ...

Приводятся результаты численного моделирования иллюстрирующие результаты третьей главы (для неминимально-фазового объекта).

ЗАКЛЮЧЕНИЕ

■ Основные результаты, полученные в диссертации, могут быть сформулированы следуодим образом:

• 1, Постановка и решение задачи оптимального слежения в случае линейного Дискретного стохастического объекта управления (теорема 1) .

2. Решение варианта задачи адаптивного субоптимального слежения ( теоремы 2, 3) .

3. Синтез стабилизирующего регулятора с "памятью", основанный на дискретной самонастройке (теоремы 4,5).

■ 4« Постановка в решение задачи стабилизации с помощью переключения регуляторов ив веданного набора (в дискретном времени ) г тебрема 6»

5. Решение задачи адаптивного управления линейным дискретным объектом с помощь® переключения регуляторов из заданного набора -теорема 7.

Основные результаты диссертации опубликованы в следующих работах:

1, Гречаный Б.А. Адаптивное отслеживание программного движения в задаче управления линейным объектом, - В кн.: Тезисы докладов 5-го Ленинградского.симпозиума по теории адаптивных систем. _ Л., Ч.З, 1991 с. 46. 2» Гречаный В.А., 'фомин В.Н. Синтез адаптивного регулятора, основанного на переключении регуляторов из заданного набора. Л., 1991 Г,,. 9с. Дея. В-ВИНИТИ Я 3061-391 от 30 июля 1991 г. 3. Гречавый В.А., ЗомиаВ.Н. Адаптивное отслеживание программного движения в задаче управления линейным объектом. Л., 1991 г., ■26 с* Деп.'в ВИНЙТИ Я 3060-Б91 от 30 июля 1991 г.