Управление механическими системами в условиях неопределенности при помощи кусочно-линейных обратных связей

Ананьевский, Игорь Михайлович

Управление механическими системами в условиях неопределенности при помощи кусочно-линейных обратных связей тема автореферата и диссертации по механике, 01.02.01 ВАК РФ

Ананьевский, Игорь Михайлович АВТОР

доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Москва МЕСТО ЗАЩИТЫ

1998 ГОД ЗАЩИТЫ

01.02.01 КОД ВАК РФ

Диссертация по механике на тему «Управление механическими системами в условиях неопределенности при помощи кусочно-линейных обратных связей»

Автореферат диссертации на тему "Управление механическими системами в условиях неопределенности при помощи кусочно-линейных обратных связей"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ МЕХАНИКИ

На правах рукописи

АНАНЬЕВСКИЙ ИГОРЬ МИХАЙЛОВИЧ

УПРАВЛЕНИЕ МЕХАНИЧЕСКИМИ СИСТЕМАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ПРИ ПОМОЩИ КУСОЧНО-ЛИНЕЙНЫХ ОБРАТНЫХ СВЯЗЕЙ

01.02.01 - теоретическая механика

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

Москва - 1998

Работа выполнена в Институте проблем механики РАН

Официальные оппоненты:

доктор физико-математических наук А. С. Ковалева доктор физико-математических наук, член-корреспондент РАН А. В. Кряжимский доктор физико-математических наук А. П. Маркеев

Ведущая организация:

Институт проблем управления РАН

Защита диссертации состоится "22" октября 1998 г. в 15 часов на заседании диссертационного совета Д 002.87.01 при Институте проблем механики РАН по адресу: 117526, Москва, проспект Вернадского, 101-1.

С диссертацией можно ознакомиться в библиотеке Института проблем механики РАН.

Автореферат разослан "19" сентября 1998 г.

Учёный секретарь диссертационного совета Д002.87.01

кандидат физ.-мат. наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. Понятие "механическая система" широко используется при изучении законов функционирования различных систем во многих областях техники и промышленности. Применение этого термина подразумевает, что динамика исследуемой системы описывается дифференциальными уравнениями, имеющими лагранжеву или га-мильтонову. форму. Очень часто параметры системы (массы, геометрические характеристики и т. д.) неизвестны или определены лишь с некоторой погрешностью. Кроме того, система может испытывать действие неконтролируемых возмущений. Важнейшую роль в этих случаях приобретают алгоритмы управления, которые обеспечивают желаемые режимы работы системы.

Цель. Целью работы является построение алгоритмов управления для механических систем, содержащих неизвестные или неточно заданные параметры и подверженных неконтролируемым возмущениям.

Научная ценность и новизна. Алгоритмы управления, разработанные в диссертации, обладают следующими достоинствами:

— алгоритмы применимы для широкого класса нелинейных динамических систем;

— алгоритмы обеспечивают приведение системы из произвольного начального состояния в заданное терминальное множество за конечное время;

— управляющие силы удовлетворяют наложенным на них геометрическим ограничениям на протяжении всего процесса движения;

— алгоритмы позволяют управлять подверженной неконтролируемым ограниченным возмущениям системой с неизвестными параметрами и, следовательно, робастны.

Указанная выше совокупность свойств отличает алгоритмы, разработанные в диссертации, от известных законов управления.

Наряду с этим в диссертации предложены законы управления при помощи обратных связей, содержащих интегральные слагаемые (т. е. ПИД-регуляторов). Эти законы обеспечивают асимптотическую устойчивость (возможность приведения за бесконечное время) нелинейных механических систем с неизвестными параметрами.

Методы исследований. Применяемые в диссертации подходы основаны на использовании методов теории устойчивости движения, в частности, второго метода Ляпунова и его модификации — метода функционалов Ляпунова - Красовского.

Практическая значимость. Предложенные алгоритмы могут найти применение при управлении робототехническими системами, машинами, транспортными средствами, космическими объектами и т.д.

Апробация работы. Результаты диссертационной работы докладывались и обсуждались на Всесоюзном семинаре "Динамика нелинейных процессов управления" (Таллин, 1987), на VI и VII Всесоюзных конференциях по управлению в механических системах (Львов, 1988 и Свердловск, 1990), на VI Болгарском национальном конгрессе по теоретической и прикладной механике (София, 1989), на XII Международной конференции по нелинейным колебаниям (Краков, 1990), на II Всесоюзной конференции по нелинейным колебаниям механических систем (Н.Новгород, 1990), на V Международной конференции по управлению и средствам связи (Греция, 1995), на IV и V Международных семинарах "Устойчивость и колебания нелинейных систем управления" (Москва, 1996 и 1998), на I и II Международных конференциях "Дифференциальные уравнения и их применения" (Санкт-Петербург, 1996 и 1998), на II Международной конференции по робототехнике и системам управления (Австрия, 1996), на Международной конференции "Управление колебаниями и хаосом" (Санкт-Петербург, 1997), а также на научных семинарах в Институте проблем механики РАН, в Московском и Санкт-Петербургском государственных университетах, Институте проблем управления РАН и др.

Публикации. Основные результаты диссертации опубликованы в 15 работах.

Структура и объем диссертации. Диссертация состоит из введения и четырех глав, содержит 223 страницы, включая 39 рисунков и список литературы из 183 названий.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертации, научная и практическая значимость работы, кратко изложены основные результаты. Приведен обзор отечественных и зарубежных публикаций. Сформулированы результаты, выносимые на защиту.

Из многочисленных публикаций, относящихся к теме диссертации, отметим, в первую очередь, работы Н. Н. Красовского и других ученых екатеринбургской школы. Их исследования развивают, в частности, игровой подход к решению задач управления в условиях неопределенности. Методы, основанные на принципе декомпозиции, предложены в работах Е. С. Пятницкого и Ф. Л. Черноусько. За рубежом построению законов управления для механических систем с неизвестными параметрами посвящены работы М. Корлесса, Г. Лейтмана, X. Нимейера, А. ван дер Схафта и др.

Центральное место в работе занимает изложенный в главе I алгоритм управления механической системой с неизвестными параметрами.

Рассматривается механическая система общего вида, динамика которой описывается уравнениями Лагранжа второго рода

адт дт „

Здесь ? 6 Л" - вектор обобщенных координат системы; р = ? - вектор обобщенных скоростей; 5" - действующие на систему неконтролируемые возмущения; и - управляющие силы; Т - кинетическая энергия системы,

Предполагается, что положительно определенная симметрическая матрица кинетической энергии Л(<?) неизвестна, ее собственные числа А,-, г = 1, п, при любых <7 удовлетворяют условиям

0<т<\{<М, (2)

а ее частные производные равномерно ограничены по норме, т. е.

<П, £>>0, 1=1,..., п. (3)

Предполагается также, что п-мерный вектор неизвестных сил Б удовлетворяет ограничениям

|5| < 50, 50 > 0, (4)

а на п-мерный вектор управляющих сил и наложены условия

Задача. Построить управление, удовлетворяющее ограничениям (3) и переводящее систему из произвольного начального состояния (<7*1?*) в заданное терминальное состояние (<], 0) за конечное время.

Не нарушая общности, можно считать, что д = 0 (что достигается выбором обобщенных координат).

Наряду с возмущениями 5 на систему могут действовать и другие силы, величины которых известны. Предполагается, что ресурсы управления достаточно велики, чтобы компенсировать эти известные силы, а величина [/ - это максимальная допустимая интенсивность управления, оставшегося после такой компенсации.

Управление ищется в форме линейной обратной связи по обобщенным координатам и скоростям (ПД-регулятора)

где а, Ь - кусочно-постоянные функции. Известно, что если а,Ь> 0 постоянны, то в отсутствие возмущений (5 = 0) нулевое решение системы (1),(6) асимптотически устойчиво в целом, т.е. любая траектория системы придет в терминальное состояние (0,0) за бесконечное время. Такое управление, представляющее собой ПД-регулятор, просто по форме и не зависит от матрицы кинетической энергии системы А. Однако оно обладает существенными недостатками. Вдали от терминального состояния управляющие силы велики и не удовлетворяют ограничениям (5). С другой стороны, чем ближе траектория находится к терминальному состоянию, тем меньше становятся управляющие силы. Ресурсы управления используются не в полной мере, что и приводит к бесконечному времени движения.

В главе 1 излагается алгоритм изменения коэффициентов обратной связи а, Ь, который позволяет приводить рассматриваемую систему в терминальное состояние за конечное время при наличии неконтролируемых ограниченных возмущений 5.

Введем в рассмотрение функцию

М < и, и> 0.

и — —ар — Ьд,

(6)

Щч, р) = Мр2 + + г/V/2)

(7)

и зададим семейство эллипсоидов (рис. 1)

ми

лДпй2к

, к £ И. (8)

Рис. 1

Пусть начальная точка траектории находится на эллипсоиде с индексом к, или внутри него, но вне эллипсоида с индексом kt+1. Определим в начальный момент коэффициенты усиления так:

Ьк.=

Ц2 4ИЪ.

Чк. = \fmh~..

Обозначим через tк момент первого попадания рассматриваемой траектории на У/к, к — к* + 1,к» + 2,... . Зададим на полуинтервале [¿ь^-н) коэффициенты формулами

(9)

Алгоритм обосновывается при помощи второго метода Ляпунова. На отрезке траектории, отвечающем индексу к, рассмотрим функцию

У"{ч,р)=Ач,Р) + Ь4я2 + ек(АШ,р).

(10)

Пусть

. , у/т11 у/ти2 , у/т[/ .

Ек = тт{-г-тг,-—-777^}, 5о < -, (11

ЪМУ/1 \b\Z2DiWl "16 ч/ГШ

Тогда на ¿-ом отрезке траектории функция V удовлетворяет неравен ствам

УИ(ч,р) = ¿(М2 + тУ), УЦд.р) = ЬИ2 + МУ,

а ее производная в силу системы (1) — неравенству

\/кI \ ^ ак 2 £кЬк 1 V(?>Р) < -уР - — Я.

и выполнено ограничение |и| < С/.

В главе 1 показано, что время движения по ¿-ому отрезку траекто рии удовлетворяет неравенству

, „ п-к/2 16-23/4М3/2, 16М

tk+l-tk < г2 к'2, г~ — 1п-,

у/тОЩ/п гп

а общее время движения Т, до терминального состояния конечно, т. к не превосходит суммы ряда

Т» < г оо.

оо. к=к.

Ограничение (11) на величину ¿>о представляет собой достаточно« условие приведения системы в терминальное состояние при помощи предложенного алгоритма.

Отметим, что коэффициенты усиления ак,Ьк в законе управления (6) зависят от известных параметров задачи т, М,£/, О и от значения индекса к. В каждый момент индекс к равен номеру минимального эллипсоида, на котором уже побывала траектория системы. Построенное управление не является непрерывным. Последовательность моментов времени в которые вектор-функция и(<) терпит разрыв, стремит« к Т* - моменту достижения системой терминального состояния. Коэффициенты ак и 6(с при этом стремятся к бесконечности, однако управляющие силы остаются ограниченными и удовлетворяют условию (5).

Работоспособность алгоритма продемонстрирована на примере численного моделирования движения двузвенника, управляемого при помощи двух управляющих моментов, приложенных в его шарнирах.

В главе 1 предполагается, что система управляется по каждой степени свободы. Главы 2 и 3 посвящены исследованию систем, у которых число степеней свободы больше, чем число непосредственно управляемых переменных. В частности, в этих главах изучаются механические системы, содержащие упругие элементы.

В главе 2 рассматривается система из 2п расположенных на горизонтальной прямой масс, поочередно соединенных друг с другом упругими пружинами и телескопическими шарнирами с приводами (рис. 2), причем первая масса соединена с неподвижным несущим телом шарниром, вторая с первой - пружиной, третья со второй - снова шарниром и т. д. Такая модель может быть использована для описания телескопического манипулятора с упругими шарнирами.

Рис. 2

Предполагается, что массы и жесткости пружин неизвестны, но лежат в заданных пределах. На управляющие силы наложены ограничения. Все фазовые координаты и скорости системы считаются доступными измерению. Предложен алгоритм управления, позволяющий за конечное время уменьшить упругие колебания системы до некоторого достаточно малого уровня, а "управляемые" координаты (т. е. координаты масс с нечетными номерами) привести в заданные состояния.

Приведение системы в заданное терминальное множество осуществляется в два этапа. Сначала, также используя кусочно-линейное управление, система приводится в некоторую окрестность терминального множества. Затем выделяется подсистема, отвечающая непосредственно управляемым переменным, а влияние на нее оставшейся части системы трактуется как возмущение. Эта подсистема при помощи алгоритма, разработанного в главе 1, приводится в терминальное состояние.

Большой практический интерес представляют задачи о перемещении грузов, содержащих упругие элементы или маятниковые конструкции. В главе 3 рассматриваются простейшие системы такого вида. В одном случае система представляет собой две массы, расположенные на горизонтальной прямой и соединенные пружиной (рис. 3). Обе массы испытывают действие сил сухого трения с переменными коэффициентами трения, зависящими от положения ("шероховатость" прямой в различных местах неодинакова). Предполагается, что массы, жесткость пружины и коэффициенты трения неизвестны, но лежат в заданных пределах. К первой (несущей) массе приложена ограниченная управляющая сила. Требуется за конечное время привести несущую массу в заданное терминальное состояние (состояние другой массы в этот момент произвольно).

Вторая система отличается от первой лишь тем, что здесь одно тело лежит на другом (груз на тележке).

Третья исследуемая система также состоит из двух масс: к несущему телу, перемещающемуся вдоль горизонтальной прямой, подвешено другое тело (маятник на тележке). Исходные предположения и цель управления - те же, что и в первом случае.

Приведем подробнее постановку задачи об управлении системой, изображенной на рис. 3, и этапы ее решение. Уравнения движения системы имеют вид

Здесь х — координата первой массы т\, ф — удлинение пружины, Со — жесткость пружины, /1, /1 — силы трения, имеющие вид

д — ускорение свободного падения, 71,72 — коэффициенты трения, зависящие от положения масс и времени.

Рис. 3

тп\х — соф Ч" и + /1, т2{х + ф) = -С0ф + /2. (12)

/1 = —)-у! (х, <) ГП15, /2 = -8гдп(х + ф) 72(х

Предполагается, что mi, m2, со, ji, 72 неизвестный удовлетворяют условиям

m < mi, ГП2 < М, с < со < С, 0<7<7i(*.*).TS(* + M <Г.

Отсюда вытекает

На управляющую силу, прикладываемую к первой массе, наложены ограничения

М < U-

Задача. Привести несущее тело в состояние (0,0) за конечное время, т. е. перевести систему (12) из произвольного начального состояния в терминальное множество х = х,, х = 0.

Как и выше, управление ищется в форме линейной обратной связи по обобщенным координатам и скоростям (6) с кусочно-постоянными коэффициентами.

Решение задачи осуществляется в два этапа. Введем в рассмотрение

функцию _

Н(х,х,ф,ф) = G + VG2+2[/2x2,

G(x, ф, ф) = (Mi2 + М(х + ф)2 + Сф2) Пусть в начальный момент

Н(х°,±0,ф0,ф°) = Н0.

Положим

CF2 Л 3 F

а=—' /? = 1Г-

Целью первого этапа является приведение системы во множество

За

Н(х,х,ф,ф)<Н. =

(1 -ру

Опишем алгоритм изменения коэффициентов обратной связи в управлении (б). Зададим в начальный момент коэффициенты формулами

Ьо = 73-, а0 = \/ тЬ0.

"О

Справедливо следующее Утверждение 1. Вдоль траектории, начинающейся в точке (я0, х°,ф°, ф°), управляющие силы удовлетворяет ограничению (5) и выполнено неравенство

limH(i) < = а + Ja+PHS.

t-юо V

Из утверждения 1 вытекает, что существует момент, когда Я (<) = Н\. Пусть 41 — первый такой момент времени. Изменим в момент <х коэффициенты в управлении (6). Положим

б1 = я? 01 = я1 = а + \/а+02н1-

Для системы (12), управляемой по закону (6) с новыми коэффициентами, справедливо утверждение, аналогичное утверждению 1. Поэтому существует ti — первый момент времени, когда H(t) = Яг- Изменим в момент <2 коэффициенты в управлении (6) и т. д.

Таким образом, последовательность Hq,H\,Hi-.- задается рекуррентными соотношениями

Нк = а + ^/а + /32Щ_1, к= 1,2...,

а коэффициенты обратной связи в управлении (6) на полуинтервалах времени [</¿,<¿+1) задаются формулами

и2 ,-

Ьк = ~, ак = V тЬк, к = 0,1,...,

Лк

где ífc — первый момент времени, когда функция Я(<) вдоль рассматриваемой траектории впервые станет равной Нк ■

Утверждение! Справедливы следующие соотношения

Я0>Я1>Я2>... , 1пп Нк = -^—.

к-4-оо 1 — (}*

Из утверждения 2 вытекает, что существует такой момент То, что Я(го) = Я». В момент времени То начинается второй этап управления системой.

На втором этапе воспользуемся алгоритмом, изложенным в главе 1. Представим первое уравнение системы (12), описывающее движение первой массы, в виде

пцх-и + Б, 5" = с0ф +Л- (13)

В соответствии с результатами главы 1 достаточные условия приведения первой массы в состояние г = г = 0 могут быть записаны следующим образом:

* = 1шв- (14)

Приведем оценку величины 3 на втором этапе движения. Показано, что в момент начала второго этапа полная энергия Е(¿) системы

(13) удовлетворяет неравенству Е(то) < #*/2, а приращение энергии, обусловленное увеличением коэффициента Ь на втором этапе, — неравенству &Е < Н,/16. Поэтому на втором этапе полная энергия Е[Ь) системы подчиняется ограничению Е{{) < 9/Г./16, и для выполнения

(14) достаточно

< С\ф\ + Р< + Г < 50.

у с° ~

Отсюда вытекает следующее достаточное условие приведения первой массы в начало координат

у/тП

Р <

Работа предложенного алгоритма управления проиллюстрирована при помощи численного моделирования. Рассматривалась система (12) при следующих значениях параметров:

М = ТП 1 = 10 КГ, ГП = ГП2 = 5 кг,

7 = 71 = 72 = 0,2,

С=с0= ЗОН/м, с = 15 Н/м.

Величина I/ была выбрана равной 100 Н. Система переводилась из начального состояния

х° = 2м, <6° = 0,1м, х° = ф° = 0м/с

в терминальное множество х — х = 0, т. е. требовалось остановить первую массу в начале координат.

Основные характеристики движения, вычисляемые при реализации алгоритма, оказались равными:

Н0 = 283,1; #1 = 227,1; Я. = 250,3 кг ■ м2/с2.

Так как Но > Я, > Н\, то на первом этапе движения коэффициенты не изменялись. В момент времени то = 0,61 с произошло первое изменение коэффициентов и начался второй этап.

На рис. 4 представлены зависимости координаты и скорости первой (несущей) массы от времени, а на рис. 5 - зависимости от времени координаты и скорости второй массы. Сплошная кривая соответствует координате, пунктирная — скорости.

Тонкой линией на рис. 6 изображен график зависимости управляющей силы от времени, а жирной - поведение коэффициента а (ступенчатая функция). Несмотря на то, что коэффициенты усиления а, Ь в управлении (6) неограничено возрастают, величина управляющей силы и, как видно из рисунка, удовлетворяет условию (5) со значительным запалом.

Рис. 4 12

/•ч а \

ti i > г 1 « \

Рис. 5

Рис. 6

Для уменьшения влияния на механическую систему некоторых факторов (низкочастотных возмущений, сил сухого трения и т. д.), а также для улучшения качества переходных процессов при формировании управления используют не только мгновенные обратные связи (ПД-регуляторы), но и обратные связи, содержащие интегральные слагаемые (ПИД-регуляторы). Четвертая глава посвящена исследованию асимптотической устойчивости механических систем, управляемых при помощи ПИД-регуляторов.

В главе 4 рассматриваются системы, динамика которых в канонических переменных описывается уравнениями Гамильтона

Предполагается, что матрица кинетической энергии А неизвестна и на систему не действует никаких сил, кроме управляющих сил. Управляющие силы выбираются в виде

Здесь а,Ь - положительно определенные матрицы, <71 (в),<72(в) - интегрируемые на [0, оо) скалярные функции.

Задача. При помощи выбора матриц а, 6 и функций <71 (в), </2 («) в регуляторе (16) обеспечить асимптотическую устойчивость тривиального решения системы (15) с областью притяжения, содержащей любую наперед заданную ограниченную область.

Рассматриваемые в главе 4 системы представляют собой существенно нелинейные системы с последействием. Для их изучения применяется метод функционалов Ляпунова - Красовского. Исследованы регуляторы, содержащие мгновенные обратные связи по фазовым координатам и скоростям и обратные связи с последействием в различных сочетаниях. В частности доказано, что можно обеспечить асимптотическую устойчивость состояния равновесия механической системы, управляемой при помощи ПИД-регулятора, содержащего только интегральные слагаемые:

Р- ~Тч(д,р)+и,

Ч = А-1(д)р.

(15)

и = —ад — Ьд —

(16)

и =

В этом случае для обоснования стабилизируемости системы используется функционал Ляпунова - Красовского следующего вида:

У{1, чг ,Рь) = ^СЧОЛ-ЧОЭД) + ¿хРг (<)+

+ \{Р1 +ер2)д'(Ы1), е,0ид2 > О, где ^ ^

<?!(«)= /" <*«/ 31(*Ыт)с1т,

J0 *¡—в

<32(0 = Г ^(^Л-ЧФМ^Г,

Уо Л-1

<?(*) = ?(«)+£9(0-ОМ

/•оо />£

Р1(<)=/ ¿8 ¿г / Ы*)||?(п)|2Л1, Уе-« «/г

' ¿5 / ¿т ы^НА-ЧпМт-орл-ь О Ь — 8 ¿т

/■СО Г со

Р(= зф)^ < ОО, /5,= / 8д{(а)<1з < 00, 1 = 1,2. ./о Jo

В качестве иллюстрации приведены результаты численного интегрирования системы, описывающей движение в горизонтальной плоскости двузвенника на неподвижном основании. Были использованы следующие два типа регуляторов:

с*

1) и - -bq -a f g(t — s)q(s)ds,

2) и = —b I g(t — s)q(s)ds — aq.

Здесь

g(s) = lOe , a- 75, 6 = 50,

/СО л СХЭ j

ff(s)ds =1, P = Jq s9[s)ds = —.

На рисунках 7 и 8 представлены графики зависимости шарнирного угла qi и угловой скорости qi от времени. Рис. 7 соответствует регулятору 1), рис. 8 - регулятору 2). Угловым скоростям отвечают штриховые линии. Приведенные графики иллюстрируют различие в качестве переходных процессов для системы (15), управляемой при помощи регуляторов 1) и 2).

ГТ\ " \ >! к л i А •щ /V ~

! i i ¡ il

6 s tt -в

Рис. 7

Рис. 8

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ

1. Разработаны законы управления нелинейной механической системой общего вида, динамика которой описывается уравнениями Ла-гранжа второго рода. Предполагается, что матрица кинетической энергии системы неизвестна и на систему действуют неконтролируемые ограниченные возмущения. Предложенные законы управления позволяет переводить систему из произвольного начального состояния в заданное терминальное состояние за конечное время при помощи ограниченной по модулю силы. В приведенных алгоритмах используется линейная обратная связь с кусочно-постоянными коэффициентами: коэффициенты неограниченно возрастают по мере приближения системы к терминальному состоянию, однако управляющие силы удовлетворяют наложенным условиям. Алгоритм обоснован при помощи второго метода Ляпунова. Дана оценка сверху полного времени движения системы. Эффективность алгоритма продемонстрирована на примере численного моделирования динамики двузвенника.

2. Предложен подход, основанный на модификации указанного выше закона управления, позволяющий строить алгоритмы управления упругими механическими системами с неизвестными параметрами.

3. Построен закон управления линейной системой масс, последовательно соединенных шарнирами и пружинами. Такая модель может быть использована для описания телескопического манипулятора с упругими шарнирами. Предполагается, что массы и жесткости пружин неизвестны, но лежат в заданных пределах. На управляющие силы наложены ограничения. Предложенный алгоритм позволяет за конечное время уменьшить упругие колебания системы до некоторого достаточно малого уровня, а "управляемые" координаты (отвечающим степеням свободы с шарнирами) привести в заданные состояния.

4. Разработаны алгоритмы управления различными двухмассовы-ми системами типа "груз на тележке", "маятник на тележке " и т. д., массо-инерционные и упругие характеристики которых неизвестны. При этом обе массы могут испытывать действие сил сухого трения с неизвестными непостоянными коэффициентами. Алгоритмы позволяют при помощи ограниченной управляющей силы приводить несущую массу в заданное состояние за конечное время, а колебания несомой делать достаточно малыми.

5. Исследована асимптотическая устойчивость нелинейных меха-

нических систем, управляемых при помощи обратных связей, содержащих интегральные слагаемые (ПИД-регуляторов), т. е. нелинейных систем с последействием. Рассмотрены регуляторы, содержащие мгновенные обратные связи по фазовым координатам и скоростям и обратные связи с последействием в различных сочетаниях. Доказана возможность стабилизации механической системы с неизвестными параметрами при помощи таких регуляторов.

Основное содержание диссертации представлено в приведенных ниже работах.

Литература

[1] Ананъевский И. М. Метод функций Ляпунова в задаче управления лагранжевой динамической системой// Дифф. уравнения. 1995. Т. 31, № 11.

[2] Ананъевский И. М. Управление механической системой с неизвестными параметрами посредством ограниченной силы// ПММ. 1997. Т. 61, вып. 1.

[3] Ананъевский И. М. Управление линейной механической системой с упругими элементами в условиях неопределенности// Изв. РАН. Теория и системы управления. 1997. № 4.

[4] Ананъевский И. М. Управление двухмассовой системой с неизвестными параметрами// Изв. РАН. Теория и системы управления. 1998, № 2.

[5] Ананъевский И. М. Ограниченное управление механической системой в условиях неопределенности//Доклады АН. 1998. Т. 359, № 5.

[6] Ананъевский И. М., Колмановский В. Б. Об управлении некоторыми механическими системами при неполной информации// Изв. АН СССР. Техническая кибернетика. 1989. № 1.

[7] Ананъевский И. М., Колмановский В. Б. О стабилизации некоторых регулируемых систем с последействием// Автомат, и теле-мех. 1989. № 9.

[8] Ананьевский И. M., Колмановский В. Б. Об устойчивости некоторых управляемых систем с последействием// Дифф. уравнения. 1989. Т. 25 № 11.

[9] Ананьевский И. М. О некоторых приложениях теории устойчивости систем с последействием к задачам стабилизации механических систем// VI нац. конгресс по теор. и прикл. механике. Сб. трудов. Т. 1. София, 1989.

[10] Ананьевский И. М. Прямой метод Ляпунова в задаче управления механической системой// Труды I Междунар. науч.-практ. конф. "Математика и психология в педагогической системе "Технический университет". Одесса, 1996.

[11] Ananievski I. M., Kolmanovski V. В. Stabilization of some nonlinear heredidary mechanical systems// Nonlinear Analysis: Theory, Methods & Applications. 1990. vol. 15, № 2.

[12] Ananievski f. M., Kolmanovski V. B. Stabilization and control of mechanical systems with unknown parameters// Ргос. V Intern. Conf. on Advances in Communication and Control. Greece. 1995.

[13] Ananievski I. M. Bounded control of mechanical system under uncertainty/ / Ргос. II ECPD Intern. Conf. on Advanced Robotics, Intelligent Automation and Active Systems. Vienna, Austria. 1996.

[14] Ananievski I. M. Bounded control of elastic linear mechanical system with unknown parameters// Ргос. I Intern. Conf. "Control of Oscillations and Chaos", St. Petersburg, Russia. 1997. Vol. 1.

[15] Ananievski I. M. Control of elastic mechanical systems under uncertainty/ / Ргос. XXIII Summer School "Applications of Mathematics in Engineering", Sozopol. Heron Press, Sofia, 1998.

Текст научной работы диссертации и автореферата по механике, доктора физико-математических наук, Ананьевский, Игорь Михайлович, Москва

российская академия наук

Институт проблем механики

На правах рукописи

Ананьевский Игорь Михайлович

01.02.01 - теоретическая механика

Диссертация на соискание ученой степени доктора физико-математических наук

V о

Л .V у

^К Рос С I: V'. "г

{рисудилуч зную о^ейъ Шсква ^Т99>8

;' ¡решение от II

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ .............................. 2

ГЛАВА 1 Управление механической системой в

условиях неопределенности посредством ограниченной силы..........................18

ГЛАВА 2 Управление линейной механической системой с упругими элементами в условиях неопределенности............. 55

ГЛАВА 3 Управление двухмассовой системой с неизвестными параметрами.......... 90

ГЛАВА 4 Стабилизация механической системы с

неизвестными параметрами........ 153

ЛИТЕРАТУРА................................. 204

ВВЕДЕНИЕ

Диссертация посвящена построению алгоритмов управления для механических систем, содержащих неизвестные или неточно заданные параметры и подверженных неконтролируемым возмущениям.

Понятие " механическая система" широко используется при изучении законов функционирования различных систем во многих областях техники и промышленности. Применение этого термина подразумевает, что динамика исследуемой системы описывается дифференциальными уравнениями, имеющими лагранжеву или гамильтонову форму. Уравнения движения системы в форме Лагранжа имеют вид

¿дТ дТ п . ,

~ ^г- = ^ + г = 1,..., п, (0.0.1 (И % %

где — обобщенные силы, которые мы будем считать неизвестными, щ — управляющие обобщенные силы (управления). Наряду с этими на систему могут действовать и другие, известные силы. Так как они известны, то их можно компенсировать при помощи управляющих сил. В диссертации предполагается, что такая компенсация уже проведена, а управления щ — оставшиеся после нее управляющие силы.

В качестве функции Лагранжа выступает кинетическая энергия системы Т(д, ¿¡) — положительно определенная квадратичная форма по обобщенным скоростям с коэффициентами, зависящими от обобщенных координат:

1 я

= - £ М^ед. (0.0.2)

I 1,3=1

Очень часто параметры системы (массы, геометрические характеристики и т. д.) неизвестны или определены лишь с некоторой погрешностью. Важнейшую роль в этом случае приобретают алгоритмы управления, которые обеспечивают желаемые режимы работы системы.

Как объект управления механическая система представляет собой существенно нелинейную систему высокого порядка, для которой характерно наличие взаимодействия между степенями свободы. Интенсивность взаимодействия между степенями свободы характеризуется элементами а^ матрицы кинетической энергии системы. Если массо-инерционные параметры системы неизвестны или известны неточно, то функции а^ также неизвестны. Однако во многих случаях границы, в которых они заключены, можно считать заданными. В диссертации предполагается, что матрица кинетической энергии системы Л (д) неизвестна, однако ее собственные числа лежат в заданных пределах при всех возможных движениях системы.

Обобщенные координаты $ и скорости ф считаются доступными измерениям, т. е. фазовое состояние системы в каждый момент времени известно.

Наряду с неизвестной матрицей кинетической энергии А^) еще одним неопределенным фактором выступают неконтролируемые возмущения 5,-. При наличии одного или обоих этих факторов говорят об управлении системой в условиях неопределенности.

Характерным примером рассматриваемой ситуации является управляемое движение системы нескольких связанных тел, массо-инерционные характеристики которых неизвестны.

При этом система может испытывать действие неконтролируемых возмущений. Частным случаем может служить задача о перемещении многозвенным манипулятором груза неизвестной массы, расположенного в схвате.

Цель управления может заключаться в приведении системы в заданное состояние или множество за конечное или бесконечное время. В последнем случае говорят о стабилизации системы. Могут быть и другие цели управления, которые в диссертации не рассматриваются: отслеживание программной траектории, стабилизация около программной траектории, задачи оптимизации и т. д. Высокий порядок системы, ее нелинейность, наличие взаимовлияния между степенями свободы, неизвестность матрицы кинетической энергии, присутствие неконтролируемых возмущений являются основными осложняющими факторами при построении управления для системы (0.0.1).

Построению законов управления для механических систем посвящены многочисленные публикации в отечественной и зарубежной литературе. Алгоритмы, разработанные в диссертации, отличают следующие особенности:

— алгоритмы применимы для широкого класса нелинейных динамических систем;

Наряду с этим в диссертации исследуется асимптотическая устойчивость (т. е. возможность приведения за бесконечное время) нелинейных механических систем при помощи обратных связей, содержащих интегральные слагаемые (ПИД-регулято-ров), т. е. нелинейных систем с последействием.

Применяемые в диссертации подходы основаны на использовании методов теории устойчивости движения, в частности, второго метода Ляпунова.

Диссертация состоит из четырех глав.

Первая глава посвящена изложению и обоснованию " основного" алгоритма управления — алгоритма, обеспечивающего приведение лагранжевой системы из произвольного начального состояния в заданное положение за конечное время. При этом матрица кинетической энергии системы считается неизвестной и на систему действуют неконтролируемые ограниченные возмущениям. В предложенном законе управления используются линейные обратные связи по скоростям и координатам с кусочно-постоянными коэффициентами. Коэффициенты усиления стремятся к бесконечности по мере приближения системы к терминальному состоянию, однако управляющие силы остаются ограниченными и удовлетворяют наложенным условиям. Алгоритм обоснован при помощи второго метода Ляпунова. Работа алгоритма проиллюстрирована на примере численного моделирования динамики двузвенника.

Главы 2 и 3 посвящены исследованию механических систем,

содержащих упругие элементы. В отличие от главы 1, где предполагалось, что система управляется по каждой степени свободы, в главах 2 и 3 рассматриваются системы, у которых число степеней свободы больше, чем число непосредственно управляемых переменных. В этом случае движение системы разделяется на два этапа. Сначала, также используя кусочно-линейное управление, система приводится в некоторую окрестность терминального множества. Затем выделяется подсистема, отвечающая непосредственно управляемым переменным, а влияние на нее оставшейся части системы трактуется как возмущение. Эта подсистема при помощи алгоритма, разработанного в главе 1, приводится в терминальное состояние.

Во второй главе рассматривается линейная механической система, представляющая собой 2п масс, расположенных на горизонтальной прямой и соединенных поочередно упругими пружинами и телескопическими шарнирами с приводами (такая модель может служить для описания телескопического манипулятора с упругими шарнирами). Предложен закон управления, приводящий шарниры в заданные положения и делающий колебания пружин достаточно малыми.

Большой практический интерес представляют задачи о перемещении грузов, содержащих упругие элементы или маятниковые конструкции. В третьей главе рассматриваются простейшие системы такого вида: два тела, соединенные пружиной, либо тело с подвешенным к нему вторым телом (маятник на тележке). К одному из тел (несущему) приложена ограниченная управляющая сила, оба тела испытывают действие сил сухого трения. Считается, что массы тел, жесткость пружины

и коэффициенты трения неизвестны. Предложены алгоритмы управления, приводящие несущие тела в заданные положения за конечное время. Проведено численное моделирование движений рассматриваемых систем, управляемых при помощи указанных алгоритмов.

Для уменьшения влияния на механическую систему некоторых возмущающих факторов (например, действия сил сухого трения) при формировании управления используют не только мгновенные обратные связи (ПД-регуляторы), но и обратные связи, содержащие интегральные слагаемые (ПИД-регуляторы). Четвертая глава посвящена исследованию асимптотической устойчивости механических систем, управляемых при помощи ПИД-регуляторов. В этом случае замкнутая система представляет собой существенно нелинейную систему дифференциальных уравнений с последействием. Для их изучения в главе 4 применяется метод функционалов Ляпунова - Кра-совского. Исследованы регуляторы, содержащие мгновенные обратные связи по фазовым координатам и скоростям и обратные связи с последействием в различных сочетаниях. В частности, показано, что для асимптотической устойчивости положения равновесия механической системы, управляемой при помощи ПИД-регулятора, достаточно, чтобы регулятор содержал только интегральные слагаемые. На примере численного моделирования движений плоского двузвенника проиллюстрировано различие в качестве переходных процессов в системах, управляемых при помощи рассматриваемых регуляторов разных типов.

Приведем краткий обзор работ, посвященных теории упра-

вления движением механических систем. Подробнее остановимся на публикациях, в которых исследуются задачи, близкие по постановке к тем, что рассмотрены в диссертации.

Теория управления - ставшая уже классической область науки, в создание которой внесли значительный вклад H.H. Кра-совский [56, 57, 58, 63, 166], Л. С. Понтрягин [106, 107, 108], Р. Беллман [20, 21], Р. Калман [47, 48, 165] и др.

Большое влияние на формирование теории управления движением оказали исследования А. Г. Бутковского [27, 28, 29], В. И. Зубова [43, 45], А. В. Кряжимского [65, 66, 67, 68, 175], А. Б. Куржанского [70, 167], Ю. С. Осипова [68, 94, 95, 97, 175],

A. И. Субботина [121, 122, 123, 181], Я. 3. Цыпкина [131, 132, 133, 134], Ф. Л. Черноусько [137, 141, 142, 143, 144, 145],

B. А. Якубовича [126, 149], А. Брайсона [22], Г. Лейтмана [170, 171, 172], Ж.-Л. Лионса [74], А. Исидори [163, 164] и др.

Развитию теории управления движением, построению законов управления для механических систем посвящены работы Л. Д. Акуленко [1, 2], Н. Н. Болотника [23, 24], А. С. Ковалевой [51], В. В. Малышева [78], А. А. Первозванского [100, 101], Е. С. Пятницкого [40, 110, 111], В. И. Уткина [124, 125], А. Л. Формальского [71, 127], А. Л. Фрадкова [128, 129], X. Ни-мейера [157, 173], А. ван дер Схафта [177, 178, 179] и др.

Можно выделить два подхода к решению задач управления, постановки которых близки к тем, что рассмотрены в диссертации. Один основан на сведении этих задач к игровым, в которых неопределенные факторы выступают как управляющие параметры, находящиеся в распоряжении противника. Во втором используются методы теории устойчивости движения.

Остановимся подробнее сначала на первом подходе. В работах Ф. Л. Черноусько [138, 139, 140] для системы (0.0.1) разработан метод построения управления, формируемого по принципу обратной связи и приводящего систему из произвольного начального состояния в заданное терминальное состояние за конечное время. При этом предполагается, что матрица кинетической энергии известна.

Метод основан на декомпозиции системы на ряд более простых подсистем с одной степенью свободы каждая, т. е. на сведении исходной задачи управления нелинейной системой (0.0.1) порядка 2п к задаче управления системой п простых независимых линейных уравнений второго порядка. Для этого исходная система (0.0.1) приводится к виду

= + г = 1,...,п, (0.0.3)

где

V = А~1в, и = А~1и. Компоненты вектора С задаются выражениями

^ " / ч... с 1дазк

Ф = - £ ИзтШк + = -г-1- -

э,к=1 (УЯк 2

Исходная задача сводится к задаче об остановке за конечное время каждой из п линейных систем (0.0.3) в заданном состоянии (терминальная скорость равна нулю) и удержании их там. В уравнениях (0.0.3) величины 11{ являются управляющими параметрами, а величины V* трактуются как противодействие противника. При малых скоростях д и некоторых предположениях относительно матрицы А и возмущений 5 ресурсы управляющего игрока оказываются выше ресурсов противника, и такая игровая задача имеет решение [58].

Движение системы разделяется на два этапа. На первом этапе при помощи управления, направленного против вектора скорости, осуществляется торможение системы. Затем, в области малых скоростей, на основе решения игровой задачи строится управление, приводящее систему в заданное состояние фазового пространства.

Отметим, что в процессе движения на втором этапе возникают скользящие режимы.

Данный подход, основанный на декомпозиции, позволяет строить алгоритмы приводящие за конечное время систему в терминальное состояние с ненулевой терминальной скоростью [14].

Изложенный метод декомпозиции применен и в работах других авторов [37, 38, 39].

Прием, подобный методу декомпозиции, применяется в работах В. И. Воротникова [31, 32, 33] для одного частного случая, а именно, для решения задачи переориентации твердого тела при наличии помехи.

Второй подход к решению задач управления для системы (0.0.1), основанный на применении методов теории устойчивости движений, используется значительно шире. Традиционно целью управления в этом случае является либо обеспечение асимптотической устойчивости некоторых решений замкнутой системы, либо обеспечение требуемого качества переходных процессов, либо приведение системы в некоторую окрестность терминального состояния и т. п.

Возникшая благодаря работам А. М. Ляпунова [75] теория устойчивости движения нашла свое развитие в работах

Н. Г. Четаева [146,147], Е. А. Барбашина [16,17,18], Н. Н. Кра-совского [55, 59], И. Г. Малкина [76, 77], В. М. Матросова [83, 84], В. В. Румянцева [113,114,115] и др. Из зарубежных ученых отметим Р. Беллмана [155], К. Кордунеану [158], В. Лак-шмикантама [168], И. Массера [174], Ж. Лассаля, С. Лефшеца [169], Л. Сальвадори [176], Т. Иошизава [183].

Методы теории устойчивости, в частности, метод функций Ляпунова, используются при решении многих практических задач: о стабилизации спутника [19, 35, 64, 73, 93, 114, 116, 135], об устойчивости гироскопических систем [42, 46, 50, 82, 99], о движении твердого тела с полостью, заполненной жидкостью [90, 104], при исследовании движения других систем с распределенными параметрами [28, 41, 49, 71], в задачах небесной механики [19, 79, 81], при исследовании систем автоматического регулирования [45, 100, 112, 131, 133] и т.д. Во многих работах используются подходы, основанные на применении линейного приближения [73, 171].

Остановимся подробнее на публикациях, в которых при помощи методов теории устойчивости исследуются задачи, близкие по постановке к тем, что рассмотрены в диссертации. В первую очередь следует привести здесь работы Е. С. Пятницкого [109, 110]. В них изучаются системы вида (0.0.1) в предположениях, аналогичных тем, что сформулированы в диссертации: матрица кинетической энергии системы неизвестна, система испытывает действие неконтролируемых возмущений, на управляющие силы наложены ограничения

< Ы, г = 1, . . . , 71.

Задачи управления решаются автором без привлечения линей-

ного приближения.

Предложенный Е. С. Пятницким принцип декомпозиции состоит в том, чтобы, во-первых, при помощи управления полностью устранить динамическое взаимовлияние между степенями свободы, а во-вторых, выбрать это управление так, чтобы система двигалась в соответствии с целью управления. Вторая задача заключается в выборе такой вектор-функции v(qit)1 чтобы на траектории системы

qi = Vi(q,t), г = 1,..., п, (0.0.4)

выполнялась цель управления исходной системой. Для выведения исходной системы на движение в режиме (0.0.4) используется управление

щ — —hisign {qi — Vi(t)), г = 1,..., п.

С помощью функции Ляпунова вида

1 п

G = - £ aik(q) (сц - Vi(t)) (qk - vk(t)) * i,k=l

показано, что при некоторых предположениях на начальные состояния и при условии, что силы Qi удовлетворяют ограничениям

sup\Qi\ < hi, г = 1,...,гс, (0.0.5)

через конечный промежуток времени система (0.0.1) будет двигаться в режиме (0.0.2).

Данный подход, в частности, позволяет доказать полную управляемость системы (0.0.1) при условии (0.0.5).

В [111] этот результат обобщен на классы механических систем. Класс определяется заданием ограниченных областей, в

которых могут принимать значения управления и обобщенные силы. Для таких классов установлены необходимые и достаточные условия полной управляемости класса, т. е. полной управляемости любой системы, принадлежащей классу. Рассмотрение совокупности систем объясняется тем, что неопр