Синтез управления в нелинейных механических системах тема автореферата и диссертации по механике, 01.02.01 ВАК РФ
Решмин, Сергей Александрович
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2010
ГОД ЗАЩИТЫ
|
|
01.02.01
КОД ВАК РФ
|
||
|
094618908
На правах рукописи
Решмин Сергей Александрович
СИНТЕЗ УПРАВЛЕНИЯ В НЕЛИНЕЙНЫХ МЕХАНИЧЕСКИХ СИСТЕМАХ
специальность 01.02.01 - теоретическая механика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
'ТЗЯНВ2011
Москва - 2010
004618908
Работа выполнена в Учреждении Российской академии наук Институте проблем механики им. А. Ю. Ишлинского РАН (ИПМех РАН).
Официальные оппоненты: доктор физико-математических наук,
профессор Крищенко Александр Петрович
доктор физико-математических наук, профессор Матюхин Владимир Иванович
доктор физико-математических наук, профессор Формальский Александр Моисеевич
Ведущая организация: Учреждение Российской академии наук
Институт математики и механики Уральского отделения РАН
Защита состоится 20 января 2011 года в 1500 часов на заседании диссертационного совета Д002.240.01 при ИПМех РАН, расположенном по адресу: 119526, Москва, проспект Вернадского, д. 101, корп. 1.
С диссертацией можно ознакомиться в библиотеке ИПМех РАН. Автореферат разослан 30 ноября 2010 года.
Ученый секретарь
диссертационного совета Д002.240.01 кандидат физико-математических наук
Сысоева Е. Я.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Диссертация посвящена построению синтеза управления в нелинейных механических системах. Рассматриваются системы, динамика которых описывается дифференциальными уравнениями, имеющими лагранжеву форму
йдТ дТ гт . . ,
ЩГвГ"1 + <г<' г = 1'-,п; (1)
здесь д'х — обобщенные координаты системы, С/, — управляющие обобщенные силы, <Э; — все прочие обобщенные силы, включая неконтролируемые возмущения, п — число степеней свободы системы, { — время, точкой обозначаются производные по времени, Т(д,д) = 5(^.(5)5, д) = — кинетическая энергия си-
стемы, заданная в виде симметрической положительно-определенной квадратичной формы от обобщенных скоростей через д и д обозначаются п-мерные векторы обобщенных координат и скоростей соответственно, а скобками (•,•) — скалярное произведение векторов.
Предполагается, что на управляющие воздействия в каждый момент времени наложены геометрические ограничения вида
г = 1,... ,п, (2)
где — заданные постоянные.
Актуальность работы
Основные проблемы, возникающие при решении задач управления рассматриваемой системой (1), обусловлены тем, что она представляет собой существенно нелинейную динамическую систему высокого порядка. Ее отличает наличие динамического взаимодействия между различными степенями свободы, которое характеризуется элементами а^(д) матрицы кинетической энергии А(д). Ситуация еще более осложняется, если некоторые из констант Ц^ в (2) равны нулю, т.е. имеет место дефицит управляющих параметров.
Очень часто параметры системы (массы, геометрические характеристики и т. д.) определены лишь с некоторой погрешностью. Еще одним неопределенным фактором выступают неконтролируемые возмущения. В указанных случаях говорят об управлении системой в условиях неопределенности, и здесь важнейшую роль приобретают алгоритмы управления по обратной связи, которые обеспечивают желаемые режимы работы системы. При этом обобщенные координаты д; и скорости считаются доступными измерениям, т. е. фазовое состояние системы в каждый момент времени известно.
Примером механических систем, описываемых уравнениями (1), могут служить манипуляционные роботы, которые являются важнейшей составной частью автоматизированных производственных систем. Для манипуляционных роботов в качестве обобщенных координат обычно выбираются относительные углы или смещения между звеньями. Интенсивность взаимовлияния между различными звеньями задается элементами матрицы .А(д). Если учитывается динамика приводов, то функции ау включают массо-инерционные параметры электродвигателей и редукторов. Уравнения движения манипуляционного робота (в форме Лагранжа) содержат составляющие обобщенных сил (¡и обусловленные силами веса, сопротивления, которые бывают известны лишь приближенно и могут существенно изменяться в процессе эксплуатации. Компоненты Ui имеют физический смысл сил или моментов сил, развиваемых исполнительными устройствами.
Существуют различные методы построения управления динамическими системами.
Классические методы теории автоматического регулирования, применимые к линейным системам, представляют управление в виде линейного оператора от текущего фазового состояния системы. Недостатки такого подхода проявляются как в окрестности заданного терминального состояния, так и вдали от него. Вблизи терминального состояния управление становится малым, и не используются все его возможности. В результате время процесса управления оказывается, строго говоря, бесконечным, и можно рассчитывать лишь на асимптотическое стремление фазового состояния к заданному терминальному состоянию. Вдали же от терминального состояния управление оказывается большим по величине и может нарушать ограничения, которые обычно накладываются на управляющие воздействия. Поэтому учет наложенных ограничений при использовании линейных методов затруднен и часто невозможен. Кроме того, применение методов, основанных на линейных моделях, к нелинейным системам обычно оказывается неоправданным.
Для управления нелинейными системами могут быть использованы методы теории оптимального управления, в создание которой внесли значительный вклад Л. С. Понтрягин и Р. Беллман. Эти методы учитывают различные ограничения, наложенные на управление, а также, хотя и ценой значительного усложнения, и на фазовые координаты. Данные методы позволяют привести управляемую систему в терминальное состояние оптимальным, в том или ином смысле, образом, например, за минимальное время. Однако построение оптимального закона управления для нелинейной системы — задача весьма сложная, и ее точное решение возможно сравнительно редко. Особенно трудным является построение оптимального синтеза управления, то есть управления по принципу обратной связи.
Для решения задач управления в нелинейной постановке были предложены различные подходы в работах Дж. Лейтмана, М. Корлесса, А. Исйдори, X. Нимейера, А. ван дер Схафта, С. В. Емельянова, В. И. Уткина, Е. С. Пятницкого, Ф. Л. Чер-ноусько и др.
Необходимость рассмотрения задач управления системой (1) именно в нелинейной постановке (без перехода к упрощенному линеаризованному описанию) связана с несколькими причинами. Так, управление, построенное для линеаризованной системы, часто оказывается неэффективным при применении в нелинейной системе. Кроме того, при изменении цели управления изменяются как структура, так и параметры алгоритмов управления. Указанные причины также затрудняют синтез универсальных систем управления.
В этой ситуации оказывается целесообразным использовать метод декомпозиции. Различные варианты метода декомпозиции были предложены ранее в работах Ф. Л. Черноусько [4, 5] для построения субоптимального управления в лагранже-вых системах. В диссертации дается их развитие и обобщение. Суть этих методов состоит в преобразовании исходной нелинейной системы [1) с п степенями свободы к совокупности п независимых линейных подсистем вида
Здесь £i — новые (преобразованные) обобщенные координаты, щ — новые управляющие воздействия, — возмущающие силы, включающие как внешние силы так и нелинейные члены, описывающие взаимодействие различных степеней свободы в системе (1). Возмущения v^ в системе (3) трактуются как неопределенные, но ограниченные воздействия, которые можно рассматривать как противодействие противника.
Исходные ограничения (2) на управляющие силы и некоторые дополнительные ограничения, наложенные на обобщенные силы Qi и кинетическую энергию системы, при определенных условиях сводятся к следующим нормализованным ограничениям на управления щ и возмущения уо
Если к системе (3) с ограничениями (4) применить подход теории дифференциальных игр, то для синтеза гарантированного управления получим выражения «¡(ж,-, ±,), решающие поставленную задачу при р4 < 1. Предлагаемые методы построения не приводят к оптимальному синтезу, но включают ряд процедур оптимизации времени процесса. Поэтому их можно называть субоптимальными.
Наряду с задачами управления системами со многими степенями свободы в диссертации рассматриваются задачи синтеза оптимального по быстродействию управления для нелинейных систем второго порядка с одной степенью свободы. При этом учитывается цилиндричность фазового пространства. Задачи такого рода относятся к числу сложных задач управления. Как правило, их решение может быть получено только численно.
Х{ = Ui + Vi, 1=1,..., п.
(3)
Ы < 1, Рг < 1, 1 = 1,..., П.
(4)
Типичной во многих отношениях нелинейной динамической системой с одной степенью свободы, на которой отрабатываются различные методы построения управления, является нелинейный маятник. Помимо нелинейности, характерной особенностью такой системы является цилиндрический характер фазового пространства, обусловленный периодичностью по углу с периодом 2тг. Задачи быстродействия для маятника также рассматриваются в диссертации.
Цель диссертационной работы
Целью является разработка эффективных методов управления сложными механическими системами на основе математических моделей, отражающих основные особенности таких систем: высокую размерность системы, динамическую зависимость между ее степенями свободы, наличие нелинейностей, ограничения на управляющие воздействия и фазовые переменные, неполноту информации о внешних возмущениях и собственных параметрах системы, требование о приведении системы в терминальное состояние за конечное время.
Научная новизна работы состоит в следующем:
— дано развитие метода декомпозиции для построения управления нелинейными лагранжевыми системами, включая такие, у которых число управляющих обобщенных сил меньше числа степеней свободы системы;
— предложено простое управление по обратной связи для выведения перевернутого двойного маятника в окрестность верхнего положения равновесия с малой угловой скоростью;
— построен и детально исследован оптимальный по быстродействию синтез управления в задачах раскачивания и гашения колебаний нелинейного маятника;
— на фазовом цилиндре исследована задача быстродействия для нелинейной системы второго порядка с одной степенью свободы и найдена оценка для амплитуды управления, при которой управление имеет наиболее простую структуру: число переключений не более одного.
Практическая значимость
Эффективность предложенных в диссертации методов продемонстрирована путем построения законов управления для конкретных механических и электромеханических систем, а также компьютерного моделирования динамики этих систем. Результаты диссертационной работы могут использоваться при управлении сложными механическими системами (робототехническими устройствами, маятниками,
космическими объектами, спутниками); при отслеживании траекторий возмущенных механических систем; в учебном процессе при преподавании курсов теоретической механики и теории управления студентам вузов.
Ниже сформулированы результаты и положения, выносимые на защиту:
1. Разработаны законы управления по обратной связи нелинейной механической системой, динамика которой описывается уравнениями Лагранжа второго рода. Предполагается, что матрица кинетической энергии системы близка к некоторой постоянной диагональной матрице и на систему действуют неконтролируемые ограниченные возмущения. Предложенные законы управления позволяют переводить систему из произвольного начального состояния в заданное терминальное состояние за конечное время при помощи ограниченных по модулю обобщенных сил. В приведенных алгоритмах используется идея декомпозиции системы на ряд подсистем второго порядка, а для управления каждой из подсистем применяется игровой подход. Дана оценка сверху полного времени движения системы и указаны способы ее уменьшения. Предложенные алгоритмы адаптированы для отслеживания траекторий возмущенных механических систем. Эффективность алгоритмов продемонстрирована на примере численного моделирования динамики манипуляционного робота и двузвенного манипулятора.
2. Дано развитие метода декомпозиции для построения управления нелинейными лагранжевыми системами в случае, когда число управляющих обобщенных сил меньше числа степеней свободы системы. Вводится в рассмотрение система гладких нелинейных функций обобщенных координат, число функций равно числу управляющих обобщенных сил. Цель управления — выведение системы за конечное время на терминальное множество, заданное множествами уровня выбранных функций, причем требуется, чтобы движение в терминальный момент происходило вдоль множеств уровня. Разработанный метод использован для построения управления по обратной связи, которое обеспечивает раскачивание двойного маятника и выведение его в окрестность верхнего положения равновесия с малой скоростью. Работоспособность алгоритма строго математически доказана, а также подтверждена численным моделированием управляемых движений двойного маятника и экспериментом.
3. Построен и детально исследован оптимальный по быстродействию синтез управления в задачах раскачивания и гашения колебаний нелинейного маятника. Маятник управляется моментом сил относительно точки подвеса. Верхнему и нижнему положениям равновесия соответствует бесконечное множество терминальных точек в фазовом пространстве. Решение поставленных задач основано на принципе максимума и включает в себя аналитическое исследование в комбинации с численными расчетами. В результате для различных значений параметра (максимально допу-
стимого управляющего момента) построены кривые переключений и рассеивающие кривые, ограничивающие области в фазовом пространстве, которые соответствуют разным значениям релейного оптимального управления.
4. Исследована задача быстродействия для нелинейной механической системы с одной степенью свободы. Система описывает динамику инерционного объекта под действием ограниченной по модулю управляющей силы, которая входит линейно, и возмущающей силы, периодической по координате. Терминальное множество представляет собой точки на оси абсцисс фазовой плоскости, причем расстояние между двумя соседними точками равно периоду возмущающей силы по координате. Найдена оценка для амплитуды управления, при которой управление имеет наиболее простую структуру: число переключений не более одного.
Апробация работы
Результаты диссертации докладывались и обсуждались на семинарах:
— Учреждения Российской академии наук Института проблем механики им.
A. Ю. Ишлинского РАН (семинар «Теория управления и динамика систем», руководитель семинара — академик РАН Ф. JI. Черноусько);
— Научно-исследовательского института механики МГУ им. М. В. Ломоносова (семинар им. А. Ю. Ишлинского по прикладной механике и управлению, руководители семинара — профессор В. В. Александров, профессор Ю. Г. Мар-тыненко, профессор Н. А. Парусников);
— Учреждения Российской академии наук Института математики и механики Уральского отделения РАН (семинар отдела динамических систем, руководитель семинара — член-корреспондент РАН В. Н. Ушаков);
— Учреждения Российской академии наук Института проблем управления им.
B. А. Трапезникова РАН (семинар по теории автоматического управления и оптимизации, руководитель семинара — профессор Б. Т. Поляк);
— Нанкинского университета аэронавтики и астронавтики, г. Нанкин, Китай (семинар в Институте исследований вибрационной техники, руководитель семинара — профессор Цзайхуа Ван)
и на конференциях:
— International Conference on Informatics and Control, St.-Petersburg, 1997;
— 4th IFAC Nonlinear Control Systems Design Symposium, Enschede, Netherlands, 1998;
— 4th ECPD Conference on Advanced Robotics, Intelligent Automation and Active Systems, Moscow, 1998;
— 4th EUROMECH Nonlinear Oscillations Conference, Moscow, 2002;
— II Московская конференция «Декомпозиционные методы в математическом моделировании и информатике», Москва, 2004;
— 5th EUROMECH Nonlinear Oscillations Conference, Eindhoven, Netherlands, 2005;
— 16th IFAC World Congress, Prague, Czech Republic, 2005;
— 5th Swedish-Russian Control Conference, Lund, Sweden, 2006;
— XVII, XVIII, XIX Крымские осенние математические школы-симпозиумы по спектральным и эволюционным задачам, Севастополь, Украина, 2006, 2007, 2008;
— IX Международная Четаевская конференция «Аналитическая механика, устойчивость и управление движением», Иркутск, 2007;
— The ECCOMAS Thematic Conference on Multibody Dynamics, Milan, Italy, 2007;
— 14th International Workshop on Dynamics & Control, Moscow—Zvenigorod, 2007;
— 6th EUROMECH Nonlinear Oscillations Conference, St.-Petersburg, 2008;
— 6th Vienna Conference on Mathematical Modelling, Vienna, Austria, 2009;
— Международная конференция «Актуальные проблемы теории устойчивости и управления», Екатеринбург, 2009.
Методы управления, основанные на декомпозиции, опробованы на сложной ме-хатронной системе с дефицитом управляющих параметров. Для эксперимента был выбран двузвенный маятник, созданный в Отделе автоматики и биомеханики Технического университета г. Лодзь, Польша (руководитель отдела профессор Ян Аврей-цевич).
Публикации
Материалы диссертации опубликованы в 23 научных трудах, список которых приведен в конце автореферата. Основные результаты диссертации отражены в двух монографиях и в 10 публикациях в ведущих журналах, определенных Высшей аттестационной комиссией Минобрнауки РФ для публикации научных результатов диссертаций.
Личный вклад автора
Все результаты, представленные в диссертационной работе, получены автором лично или в соавторстве при его непосредственном участии.
Структура и объем диссертации
Диссертация состоит из введения, обзора литературы, пяти глав и списка литературы. Общий объем работы — 240 страниц, включая 63 рисунка и 7 таблиц. Библиография содержит 169 наименований.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении сформулирована цель проведенных исследований, обосновывается актуальность темы диссертации, кратко изложены основные результаты, указана их научная и практическая значимость. Сформулированы результаты, выносимые на защиту. В обзоре литературы обсуждаются публикации других авторов, относящиеся к теме диссертации.
Глава 1. Синтез управления в нелинейной лагранжевой системе на основе декомпозиции
В первой главе рассматривается нелинейная управляемая система, динамика которой описывается уравнениями Лагранжа (1) при ограничениях на управляющие обобщенные силы (2). Предполагается, что все прочие обобщенные силы Qi представляются в виде суммы ограниченных обобщенных сил Gj, |Gj| ^ G? < Uf, и обобщенных сил FJ, которые достаточно малы при малых скоростях и удовлетворяют ограничениям |Fj| ^ F0 (\q\), где F°(f) — некоторая монотонно возрастающая непрерывная функция, определенная при v ^ 0 и такая, что F°(0) = 0. Точный вид функций Gi(q,q,t), Fi{q,q,t) может быть неизвестен. Область D, в которой могут происходить движения рассматриваемой системы, задана в виде независимых ограничений на координаты qï. D = {q : ^ gj ^ g/"}. Предполагается, что матрица кинетической энергии A(q) близка к некоторой диагональной матрице J с положительными постоянными диагональными элементами J,-, так что для любого n-мерного вектора z выполнено неравенство
ц>0, (5)
Здесь fi — достаточно малый параметр, возможные значения которого указаны ниже. Кроме того, предполагается, что < С, С = const >0, i,j,k— 1,... ,n.
Для системы (1) ставится следующая задача управления.
Задача 1. Требуется определить управляющие функции %), которые удовлетворяют наложенным ограничениям (2) и обеспечивают перевод системы (1) из некоторого начального состояния
9(0) = 9°, 9(0) = 9°, 9° 6 В (6)
в заданное конечное состояние покоя
Я(т) = 9*, 9(г) = 0, € О. (7)
Время процесса ущшвлиния т конечно и не фиксируется. Без ограничения общности начальный момент времени принят равным нулю.
Система (1) представляется в эквивалентном виде
¿9; = ^ + И, г = 1,... ,п, (8)
где Vi включают все нелинейные слагаемые и, кроме того, зависят от управляющих и прочих обобщенных сил.
Если предположить, что имеют место неравенства ^ А < 1, где р— некоторые постоянные, то функции Ц можно рассматривать в (8) как независимые ограниченные возмущения, не превосходящие допустимых значений управлений. Тогда исходная нелинейная система распадается на п линейных подсистем (г-я подсистема описывается г-м уравнением (8)), подверженных возмущениям, с одной степенью свободы каждая. Таким образом, решение Задачи 1 сводится к решению п более простых задач управления для подсистем второго порядка.
Скалярное управление Ц, переводящее г-ю подсистему (8) за конечное время из произвольного начального состояния в конечное состояние (9*,0) при любом
допустимом возмущении V;, задается в форме синтеза
[-и?а&хъ, ® = (9)
ГМ = - (2*1® - д*|)1/2^п(® - <?*).
Здесь — положительный параметр управления, связанный с константой р1 соотношением Х{ = [/°(1 — р;)^"1 (конкретное значение X* неизвестно, поскольку неизвестна постоянная р¿). Указанное управление является оптимальным по быстродействию управлением в игровой задаче, в которой Щ и рассматриваются как управления двух игроков [2]. Это управление релейно и принимает свои предельно
Рис. 1. Множество и кривая переключений
допустимые значения: Щ = ±£7®. Кривая переключений ф = состоит из двух
параболических ветвей, которые симметричны относительно точки 0). На рис. 1 изображена некоторая возможная фазовая траектория подсистемы (8). Стрелками указано направление роста времени £.
Проблема заключается в том, чтобы найти такие значения параметров Х^ и ограничения на начальные скорости, при которых предположение об ограниченности функций действительно выполняется.
В двумерном фазовом пространстве 1-й подсистемы вводится в рассмотрение множество П< (рис. 1): ^ = {($,&) : дГ ^ ?< < я?, ф{ ^ Яг ^ =
= При условии (<#,??) 6 произведена оценка
максимальных значений возмущений Ц и получена нелинейная система неравенств, которая задает множество допустимых параметров управления Х(
-1 1/2
«Лшп / «Лшп №
3
(10)
Здесь Зт\п — наименьшая из величин положительная величина 5° зависит от Х^, г~ 1,..., п таким образом, что 5° —» 0 при X, —» 0.
Если параметр ¡1 достаточно мал, так что выполнено условие
М пшцСО? - 04) + Е(ир + С?)2]1/2 ■ . V1'
1
то выражения в правых частях неравенств (10) положительны. Поэтому всегда най-
дутся положительные значения Хи при которых выполняются неравенства (10). Указан конкретный способ выбора допустимых значений Х(, удовлетворяющих этим неравенствам.
Полученные результаты сформулированы в виде теоремы.
Теорема 1. Пусть выполнено условие (11). Тогда синтез управления ре-
шающий Задачу 1, задается соотношениями (9), в которых параметры Х{ должны выбираться так, чтобы выполнялись неравенства (10). Это управление переводит систему (1) из начального состояния (6) в заданное терминальное состояние (7), если в начальный момент времени выполнено условие (</°,<?°) € При этом траектория (ф(<), лежит в области 0,1, а время процесса управления т конечно.
Особое внимание уделено рассмотрению случая, когда в начальном состоянии скорости равны кулю. Предложена незначительная модификация закона управления (9) для того, чтобы уменьшить гарантированную оценку времени управления.
Также в первой главе метод декомпозиции распространен па задачу об отслеживании траектории возмущенной механической системы. Рассмотрена управляемая склерономная механическая система общего вида в предположении, что управляющие силы ограничены и система испытывает действие неконтролируемых силовых возмущений, отклоняющих ее от заданной номинальной траектории движения. Предложен закон управления по обратной связи, который выводит систему на номинальную траекторию за конечное время и удерживает ее на этой траектории.
В качестве примеров приложения разработанных методов приведены задачи управления движением манипуляционных роботов с несколькими степенями свободы. При этом рассмотрены как чисто механические модели манипуляторов, в которых отыскиваются управляющие моменты двигателей, так и манипуляторы с электромеханическими приводами, в которых принимаются во внимание процессы в электрических цепях. Найдено множество значений передаточных чисел редукторов, при которых осуществим предложенный способ управления. Алгоритмы расчета управления иллюстрируются на примере трехзвенного антропоморфного робота-манипулятора. Кроме того, рассмотрена упрощенная модель механического двузвенного манипулятора с безредукторными приводами. Указаны ограничения на параметры системы и значения углов между звеньями при начальной и конечной конфигурациях, при которых осуществима ее декомпозиция и полностью устраняется динамическое взаимовлияние между степенями свободы. Алгоритмы расчета управления иллюстрируются на примере системы двух твердых тел, моделирующей движения руки манипуляционного робота в горизонтальной плоскости.
Глава 2. Метод декомпозиции в задаче управления лагранжевой системой с дефицитом управляющих параметров
Во второй главе получено обобщение метода декомпозиции на случай системы (1) с дефицитом управляющих параметров. Рассмотрена ситуация, когда только первые т (т < п) компонент управляющего вектора U = (Ui,..., U„) могут быть ненулевыми. В этом случае управляющий вектор и ограничения (2) представимы в виде
i/ = (t/1,...,L/m,0,...,0); \Uf\ZVf, г = 1,...,m, (12)
где U? — заданные постоянные. На прочие обобщенные силы также накладывается ограничение |<3j| < Q?, i = 1,... ,п, где > 0 — заданные постоянные. Начальное состояние системы (1) задано:
9(0) = 9°, 9(0) = 9°. (13)
Вводится обозначение L(g), где L — гладкая m-мерная вектор-функция, зависящая от q. В этом случае L = B{q)q, где В — матрица размера т х п с элементами By = dLi/dqj. Терминальное множество q,q определяется движением системы (1) вдоль множеств уровня функций Li(q) (г = 1,..., т):
L(q) = ж* = const, B{q)q = 0. (14)
При некоторых дополнительных упрощающих предположениях относительно матрицы кинетической энергии А и функций Li, сформулированных ниже, рассматривается следующая задача управления.
Задача 2. Требуется построить управление по обратной связи и^,/]), удовлетворяющее ограничению (12) и переводящее систему (1) из состояния (13) па терминальное множество (Ц), где х* — заданный постоянный т-мерный вектор. Время процесса управления т конечно и не фиксируется. Без ограничения общности начальный момент времени принят равным нулю.
Предполагается, что < с, \д2Li/дqjдqk\ К Сь где с и с\ — некоторые
постоянные. Считается, что собственные числа матрицы А(д) при всех 9 лежат на отрезке [а», а*] (0 < а, < а*). Матрицы А и В представлены в блочном виде
Ах АТ А А2
В =
В, в].
(15)
где Ai и В\ — матрицы размера m х т. Затем вводятся обозначения С = В А \ D — В\— ВА^А, Предполагается, что норма матрицы С ограничена при всех q
||С|[ ^ с*. (16)
Матрица С представлена в блочном виде С = ^ С j, где С\ — матрица размера тхт. Считается, что С\ и D — неособенные при всех q матрицы и известны оценки сверху для норм соответствующих обратных матриц (справедливые при всех д):
цсгЧКс:1, р-ЧК^1, (17)
где с» > 0, dt > 0 — некоторые постоянные.
В качестве примера сформулированы достаточные условия (в виде ограничений на матрицу В), при которых выполнены требуемые ограничения (16) и (17). Условие (16) выполнено, если норма матрицы В ограничена. Условие (17) выполнено, если норма матрицы В достаточно мала. Приведена соответствующая лемма.
Для решения Задачи 2 вводится m-мсрный вектор х вспомогательных координат так, что
г = Щ), х = B{q)q. (18)
Из равенств (18) и (1) следует уравнение, описывающее динамику вектора х
х = и + V, (19)
где введены обозначения
п
u = CU, V = CS + J" 1 д-'gjäfc,
S=(Si,...,Sn), Si(q,q,t) = QM, q, t) - £ " <№
В вспомогательной системе (19) m-мерный вектор м рассматривается как новый управляющий вектор, m-мерный вектор v — как неизвестное возмущение. Согласно (13), (14), (18) систему (19) требуется перевести из начального состояния
= L(q°), х° = B(q°)q° (20)
в терминальное состояние
х = х* = const, х = 0. (21)
Для того чтобы учесть исходные ограничения (12), налагаемые на исходное управление U, накладываются следующие ограничения на компоненты нового управления и:
\щ\ ^ Щ, Щ — c*m~1''2 min f/f, г = 1,...,т. (22)
Подобно подходу предыдущей главы, делается предположение о том, что во время движения модули компонент вектора V также ограничены некоторой постоянной г>о" М ^VQ,i = l,..■,n, причем выполнено условие щ — ьо^ X, где X > 0 — некоторая постоянная, подлежащая определению. Тогда и* и г^ в г-м уравнении (19) можно рассматривать как управления двух игроков, причем возможности управления первого превосходят возможности второго. При этом вспомогательная нелинейная система распадается на т линейных подсистем (г-я подсистема описывается г-м уравнением (19)), подверженных возмущениям, с одной степенью свободы каждая. Таким образом, решение Задачи 2 сводится к решению т более простых задач управления для подсистем второго порядка. Управление задается в форме синтеза
ад- ф*), х{ Ф
Ъ = (23)
Ненулевые компоненты искомого исходного управления задаются соотношениями
£/4 = [СгЧ. г = 1,... ,т, (24)
в которых компоненты вектора и задаются соотношениями (23), (18). Неособенная матрица С\ была введена ранее.
Проблема заключается в том, чтобы найти такие значения параметра X и ограничения на начальные состояния, при которых предположение об ограниченности функций V, действительно выполняется.
В двумерном фазовом пространстве г-го уравнения (19) вводится в рассмотрение множество допустимых начальных состояний Пх (рис. 2), ширина которого характеризуется еще одним неизвестными параметром Л:
= |(ж,', : -к < х{ - х* < к,
- ^2Х(Хг - х\ + у/2Х(Н -х1 + 4)}. (25)
Получена формула для ускорений д исходной системы, в правую часть которой управление явно не входит:
' Ех ' Р = >1 '
.Е2. ¿2
■ (26)
Здесь вектор ¿>2 образован из последних п — т компонент вектора 5*. Блочные матрицы Е к Р состоят из матриц ¿1 (д) и Е2(д) размера тхтн (п — т)хт и матриц
Рис. 2. Траектория
и ^2(9) размера т х (п — т) и (п — т) х (п — т) соответственно. Для них имеются выражения
= -0-1ВАг1, F2 = А?АО~1ВА21 + Л^1.
Уравнение (26) использовано для получения оценки модуля приращения вектора скорости, а затем и возмущений во время движения при условии 6 П*
- д°\ < Д? = - |д°| - у/У{Х,к), Ы < ^о = с*Я° + к(\с?\ + Д«)2.
Здесь введены обозначения
У{Х,Щ = х(Н)2Х - 1 ( ^|в°| + ет^2Х + /<$ ) ,
1/2
= £ " ' = т1/2" (§/С + 6С1) ' =(£ ^ п \ /"V72
в которых фигурируют постоянные е, е\, /, ограничивающие нормы матриц Е(д),
дЕ(д)/8д{, ||Я(д)|| е, \\дЕ{д)/дд{\\ «С еь ||^(9)|| ^ /. Заметим, что эти посто-
янные могут быть указаны, если известны постоянные с, сх, с„, введенные ранее. В результате получена система неравенств для определения параметров X и к:
где введено обозначение К(Н) — к,1>с{К)2 — ет1/2. Отметим, что неравенство (28) выполнено при достаточно малых значениях И, причем из него следует положительность функций К{К) и х{К), фигурирующих в знаменателях в правых частях неравенств (29), и функции У(Х,И), стоящей под знаком корня в неравенстве (30). Неравенства (29) выполены при достаточно больших X. Неравенство (30) выполнено в случае достаточно больших значений и0, т. е. в случае достаточно больших возможностей управления.
Основные результаты второй главы сформулированы в виде теоремы.
Теорема 2. Пусть найдены положительные параметры X и Н, удовлетворяющие неравенствам (28), (29) и (30). Тогда синтез управления 1/(д,д), решающий Задачу 2, задается соотношениями (18), (23), (24). Это управление переводит систему (1) из начального состояния (13) на множество (Ц), если соответствующая начальная точка вспомогательной системы (19), определяемая равенствами (20), лежит в области П^ заданной ограничениями (25). При этом траектория (ж<(£), ¿¡(Ь)) лежит в указанной области а время процесса управления т конечно.
Приведен пример: изменение угла между звеньями двойного маятника при помощи управляющего момента сил, создаваемого в точке подвеса маятника. В качестве Ь (см. (18)) выбрана одна функция двух переменных Ь{д) = дг —9ь где и дг — углы отклонения соответствующих звеньев от вертикали. В этом случае в качестве координаты х выступает угол между звеньями. Рассмотрена задача об управлении конфигурацией маятника, когда требуется изменить угол х от некоторого начального значения Я до конечного значения —Я, где Я < 7г/2 — некоторая достаточно малая положительная постоянная. Начальное положение маятника произвольно, однако ради простоты считается, что начальная угловая скорость вращения обоих звеньев равна нулю. Такая вспомогательная задача возникает в третьей главе при решении более сложной задачи раскачивания двойного маятника.
А <
(28)
(29)
(30)
Глава 3. Раскачивание двойного маятника
В третьей главе на основе подхода, разработанного во второй главе, предложено управление по обратной связи для выведения перевернутого двойного маятника в окрестность верхнего положения равновесия с малой угловой скоростью. В качестве управления выступает момент сил, создаваемый в точке подвеса. Постановка задачи формально не подпадает под постановку Задачи 2 второй главы и является более сложной. Однако основные идеи способа управления остаются такими же. При этом незначительно изменяется структура закона управления и значительно усложняется его математическое обоснование. На примере управления данной системой показаны потенциальные возможности использования метода декомпозиции в сложных системах с дефицитом управляющих параметров. Теоретические выводы и работа алгоритмов управления подтверждены результатами компьютерного моделирования и экспериментом.
Рассматривается механическая двузвенная система (рис. 3), состоящая из неподвижного основания Во и двух абсолютно жестких звеньев В\, В2. Элементы конструкции соединены между собой двумя идеальными цилиндрическими шарнирами Oí, 02 таким образом, что оба звена могут совершать движения только в вертикальной плоскости. Центр масс Cj звена В\ лежит на луче OiO?. Положение центра масс С2 звена B¿ не совпадает с положением шарнира 0¡- Система управляется моментом сил М, создаваемым в шарнире 0\.
Уравнения Лагранжа, описывающие движение системы, имеют вид
(m2¿i + /1) q\ + m2li¡g2cos(q2 -qx) q2 - m2hls2sm(q2 - q¡) q2 = M + G¡ + vh
m2hlg2 eos(92 - q{) qi + I2q2 + m2hlg2 sin(q2 - qi) qf = G2 + v2, (31)
G] = g(mil9i + m2li) sin qu G2 = gm2lg2 sin q2.
Здесь введены следующие обозначения: g¿ — угол между прямой C^Cj и вертикальной осью; Igi — длина отрезка 0¡C¿; Zj — длина отрезка 0\02\ rrii — масса звена B¡; Ii — момент инерции звена B¡ относительно оси шарнира 0¡; G¿ — момент, создаваемый силой тяжести в г-м шарнире; v¡ — момент, создаваемый возмущающими силами (например, силами трения) в г-м шарнире; д — ускорение свободного падения.
На управляющий момент накладывается ограничение
\М\ < М°, (32)
где М° — заданная постоянная. Известны предельные возможности возмущений
Рис. 3. Двойной маятник
где и? ^ 0, ь2 ^ 0 — постоянные.
Делается переход к безразмерным переменным 1 /2
Г0 _ дт21д2 , _ о' _ А- п- 11 + 771^ а = 12
2~ МО ' * ~ М°' т2Мг2 ' Р тьМа'
Если у новых переменных Ь', М', г®' опустить штрих, то уравнения (31) и
ограничение (32) примут вид
а дг+ со8(й - д{) д2 = М + + вт(д2 + (34)
сов{д2 - 91) й + /3 й = <?2 - вш(д2 - 91) 9? + «2, (35)
\М\ < 1, (36)
а запись ограничений (33) останется без изменений.
Задача 3. Требуется построить управление д2,9ь 9г)> удовлетворяющее ограничению (36) и переводящее систему (34), (35) из заданного начального состояния
= V, д2Ц0) = 7Г, д^о) = 0, д2(*о) = 0 (37)
в окрестность верхнего полоо/сения равновесия
|gi - 2nk\ < е, |д2-2тгт|<е, к,т = 0, ±1, ±2,...,
(38)
|<Ы<£', |<Ы < e'i
где е, е' — заданные величины, которые могут быть сколь угодно малыми.
Поставленная задача решается в предположении о том, что максимально возможный управляющий момент достаточно велик по сравнению с максимальными моментами силы тяжести в шарнирах, а максимальные возмущения — наоборот, малы. Соответствующие ограничения на константы Gf, wf, v® наложены в процессе решения. Раскачивающее управление М, зависящее от двух положительных параметров X, /, задается в виде
(sign(± — ф), х^ф;
(39)
signi, х = ф, ф(х,х) = ф(х-х)1 Ф(-) = -(2Х\ ■ |),/2sign(.), (40)
X = 92 -91, ¿ = 92-91, (41)
!/ при 9i ^ 0;
(42)
—/ при 9i > 0. Оно релейно и принимает свои предельно допустимые значения М = ±1. Кривая переключений х = ф(х,х), где х — угол между звеньями, состоит из двух параболических ветвей, которые симметричны относительно точки (х,0).
Доказано, что предложенное выше управление может быть использовано для решения Задачи 3. Получена система неравенств (ограничений) для определения допустимых параметров X, /.
Замечание 1. Если подставить соотношения (41) в уравнение (35), то оно примет вид
(¡3 + cos x)g'i = G\ sin(gi + x) - sin x $ + V2 ■ (43)
При x(t) = const и V2(t) = const уравнение (43) имеет первый интеграл
exp (gitgv)
,2 G° cos(gi + х + <р) sin - V2 9i H--"" _
sini
= const, ip = arctg
/ 2 sin л; N \¡3 + eos x) '
Доказательство того, что амплитуда колебаний во время раскачивания увеличивается, основано на анализе найденного первого интеграла.
Управление (39) обеспечивает постепенное увеличение амплитуды раскачивания и стремится поддерживать конфигурацию маятника, сохраняя угол х между звеньями равным х. Однако величина х согласно (42) меняет знак синхронно с раскачиваниями маятника, а точнее одновременно с угловой скорость qi его первого звена. Поэтому весь процесс разделяется на чередующиеся стадии, на которых х = х (координированный режим) или х ф х (переходный режим). Во время координированного режима звенья маятника движутся как единое целое. Во время переходного режима угол между звеньями маятника меняется на противоположный, причем за конечное время. При достаточно малых значениях / темп раскачивания маятника невелик. Анализ первого интеграла (43) показывает, что амплитуда колебаний увеличивается на каждой стадии с координированным режимом движения. Влияние стадий с переходным режимом незначительно. В результате наступит момент, когда маятник окажется вблизи верхнего положения равновесия с достаточно малыми скоростями движения звеньев. Иными словами, исходная система (34), (35) окажется в окрестности положения равновесия (38).
Представлены результаты численного моделирования и эксперимента на реальной модели двойного маятника, подтверждающие работоспособность алгоритма.
Глава 4. Оптимальный по быстродействию синтез управления в задачах раскачивания и гашения колебаний нелинейного маятника
В четвертой главе рассматривается маятник, который может вращаться вокруг горизонтальной оси и управляется приложенным к нему моментом, ограниченным по модулю. В безразмерных переменных уравнения движения маятника имеют следующий вид:
£\ = X2, ¿2 = — sin .Ti + ки, (44)
где xi — угол между маятником и вертикальной осью, к — отношение максимально допустимого управляющего момента к максимальному моменту силы тяжести. Ограничение на безразмерное управление и может быть представлено как:
N01 ^ 1- («)
Начальные состояния для системы (44) произвольны
ц(0) = х°и Х2(0) = х°2, (46)
а терминальные условия соответствуют верхнему неустойчивому (в случае раскачивания) или нижнему устойчивому (в случае гашения колебаний) положению равно-
весия
х\(Т) = 7Г + 27гп, Х2{Т) = 0 (раскачивание),
si(T) = 2тгп, Х2(Г) = О (гашение колебаний), где п — произвольное целое число.
Задача быстродействия формулируется следующим образом.
Задача 4. При различных значениях к > 0 требуется найти управление в форме синтеза, которое удовлетворяет ограничению (45) при всех t е [О, Т] и переводит систему (44) из произвольного начального состояния (46) в терминальное (47) за минимально возможное время.
Из принципа максимума [1] следует, что оптимальное управление принимает значения и = ±1, и для того, чтобы получить его в форме синтеза, достаточно найти кривые переключений и рассеивающие кривые в плоскости xix2, ограничивающие области, где и = +1 и —1.
Кривые переключений состоят из точек, в которых управление u(t) изменяет свой знак при движении вдоль оптимальной траектории. Рассеивающие кривые образованы такими точками, где оптимальное управление может равняться либо 4-1, либо —1, а две оптимальные траектории, начинающиеся в каждой из этих точек, достигают терминального состояния (47) (при одинаковых или разных п) за одинаковое время.
В терминах поля оптимальных траекторий разница между кривыми переключений и рассеивающими кривыми заключается в том, что оптимальные траектории могут только стартовать с рассеивающих кривых, но не могут приходить на них. Также оптимальные траектории не могут совпадать с рассеивающими кривыми. В то же время фазовая точка системы может приходить на кривую переключений, двигаться вдоль нее или стартовать с нее.
В работе построены численно поля оптимальных траекторий и соответствующие картины синтеза оптимального управления для задач раскачивания и гашения колебаний в широком диапазоне изменения параметра k\k~ 0.05, 0.1, 0.2, 0.25, 0.35, 0.36, 0.38, 0.4, 0.42, 0.43, 0.434, 0.5, 0.6, 0.65, 0.7, 0.75, 0.77, 0.79, 0.85, 1, 2 в первом случае, к = 0.3, 0.305, 0.31, 0.62, 0.64, 0.65, 0.75, 0.8, 0.85, 0.92, 0.94, 0.95, 0.96, 0.97, 0.99, 1, 1.01, 1.036, 1.04, 1.05, 1.07, 1.09 во втором случае.
Для примера, поле оптимальных траекторий показано на рис. 4 в случае раскачивания при к = 0.2 и да рис. 5 — в случае гашения колебаний при к = 0.3. Кривые переключений и рассеивающие кривые обозначены менее толстыми и более толстыми линиями соответственно. Оптимальные траектории изображены тонкими линиями. Стрелки показывают направление роста времени вдоль траекторий. На рис. 4 изображен сегмент фазовой плоскости, ограниченный кривыми переключений, проходящими через точки (xi = — 7Г, Х2 = 0) и (a;i = 7г,Ж2 = 0). На рис. 5 изображен сегмент фазовой плоскости, ограниченный рассеивающими кривыми, проходящими
Рис. 4. Оптимальный по быстродействию синтез в случае раскачивания при к = 0.2.
через точки (а^ = — 7г, жг = 0) и (х1 = тг, агг = 0), причем участок, обозначенный прямоугольником, представлен отдельно в крупном масштабе. Полные фазовые портреты могут быть получены путем сдвигов этих сегментов влево и вправо на величину 2тт, п=±1,±2,....
Обнаружены и исследованы тонкие детали структуры поля оптимальных траекторий, включая поведение кривых переключений и рассеивающих кривых. Полученные картины синтеза показывают, как трансформируется структура этих кривых при изменении величины управляющего момента. По мере уменьшения возможностей управления появляются дополнительные кривые переключений и рассеивающие кривые, однако в задаче о гашении колебаний отмечено также исчезновение рассеивающих кривых, что приводит к образованию изломов на кривых переключений. Дополнительно в задаче о гашении колебаний детально исследовано образование на фазовом цилиидре оптимальных траекторий с двумя переключениями управления при постепенном ужесточении накладываемого ограничения. Соответствующие графики приведены в специальной системе координат, в которой' структура решения вдали от терминального множества более наглядна.
Рис. 5. Оптимальный по быстродействию синтез в случае гашения колебаний при к = 0.3.
Глава 5. Бифуркация в задаче быстродействия для нелинейной системы второго порядка
В пятой главе рассматривается нелинейная управляемая динамическая система
JCp + e{tfi) = M, (48)
где J > 0 — постоянная инерционная характеристика системы.
Скалярное управление M(t) называется допустимым управлением, если оно удовлетворяет двум условиям:
1) M{t) — кусочно-непрерывная функция времени;
2) для всех t € [0, +оо)
\M{t)\ < а, а = const. (49)
Функция е(</з) удовлетворяет трем условиям:
1) она периодична с периодом 20;
2) она непрерывно дифференцируема на интервале (—оо, +оо);
3) ее среднее за период значение равно нулю:
20
E{ip)dy = 0. (50)
о
Начальные состояния системы (48) в момент времени t = 0 произвольны:
<р( 0) = #0) = ¿о, (51)
а терминальные условия в некоторый момент времени £ = Т (Т > 0) заданы в виде
где <рт £ [0,20) — фиксированная величина, а п — произвольное целое число. Момент Т попадания в терминальное множество (52) не фиксирован и зависит от выбора управления М(<).
При достаточно больших значениях параметра а, задающего допустимую амплитуду управления, рассматривается следующая задача быстродействия.
Задача 5. Требуется построить управление по обратной связи М(<р,ф), которое удовлетворяет ограничению (49) и переводит систему (48) из произвольного начального состояния (51) в терминальное состояние (52) за минимальное время Т.
Пример 1. В случае управления маятником в уравнении движения (48) 7 и М — момент инерции маятника и ограниченный управляющий момент относительно точки подвеса, а функция е(<р) имеет вид:
где т и I — масса и длина маятника соответственно, д — ускорение свободного падения. Если в терминальных условиях (52) <£>т = 0, то имеем дело с задачей приведения маятника в нижнее устойчивое положение равновесия, а если — ъ — в верхнее неустойчивое. В общем случае (рт может быть произвольным числом из интервала [0,2тг). Полупериод в в этом примере равен тг.
Пример 2. Вращение спутника вокруг собственной оси в плоскости круговой орбиты под действием внешнего или внутреннего управляющего момента описывается уравнением [3, 6, 7]:
Здесь ш — угловая скорость движения центра масс спутника по орбите, А, В, С — его главные центральные моменты инерции, и — угол между осью С спутника и радиус-вектором его центра масс, М — управляющий момент. По предположению А > С. Ось В спутника перпендикулярна плоскости орбиты. Следует отметить, что управляющий момент М может быть как внешним, создаваемым реактивным двигателем, так и внутренним, возникающим благодаря наличию вращающихся внутренних масс (случай спутника-гиростата [7]). Если М = 0, то существуют следующие устойчивые положения равновесия спутника:
<р(Т) = <РТ + 2вп, ф{Т) = 0,
(52)
— тд1 вш <р,
(53)
V = 2жп (<р = 47гп);
(54)
1/ = 7г+2тгп ((р = 2тт + Атт п). (55)
Они соответствуют ориентациям спутника по радиус-вектору (см. (54)) и против него (см. (55)). Пусть требуется перевести спутник в какое-либо из указанных положений с условием и = 0 (ф = 0). Сравнивая терминальные условия (52) с соотношениями (54) и (55), можно определить соответствующие значения рт- </>т = 0 в первом случае, <рт = 2-к во втором случае. В общем случае <рт € [0,4тт) — произвольное число. Полулериод в в этом примере равен 27г.
Для решения Задачи 5 вводятся безразмерные переменные с{<р - tpT)
Ч> =
' - ± t'-~ Ь'
Г*
-Ч 1/2
4) г,
J
м
а '
56)
где через бис обозначены максимумы модулей функции e(tр) и ее производной de/dip, т.е.
Ь = тах|е(^)|, с = max
f ч>
Уравнение (48) формируется в следующем виде (здесь и далее точки используются для обозначения производных по безразмерному времени t', штрих у новых переменных опускается):
ф 4- е(/р) = ки. (57)
Ограничения (49) и соотношения (56) могут быть представлены так:
KOI < 1, ш\ < 1, d£
dtp
(v)
< 1.
(58)
Вид начальных условий (51) не изменится, а терминальные условия (52) преобразуются следующим образом:
<р{Т) = 20п, ф{Т) = 0. Основным результатом пятой главы является следующая теорема.
(59)
Теорема 3. Существует число к, такое, что при к ^ к оптимальное управление в задаче быстродействия (51), (57)-(59) имеет не более одного переключения.
Для к получено явное выражение, которое зависит только от полупериода в: ■ г1/3
к =
при
Сг < 27;
2^со sarctgv^ 3 3
■ + 1 при Ci 27;
Ci =46>(2 + Vef, C2 = 27Ci (l + ^-Ci/27 + lj.
Можно отказаться от ограничения (50), наложенного ранее на среднее значение функции e(i^). В этом случае задача быстродействия не всегда имеет решение при малых к. Однако, когда к > 1, решение задачи быстродействия гарантированно существует. При этом формулировка теоремы остается в силе.
Результаты могут быть использованы при исследовании задач управления некоторыми механическими системами, включая задачи управления маятником и задачи переориентации спутника на круговой орбите или приведения его в состояние с заданной ориентацией. Если амплитуда управления такова, что к ^ к, то количество преключений на каждой оптимальной траектории не более одного. При этом оптимальный синтез имеет наиболее простую структуру и может быть легко построен во всей фазовой плоскости для системы общего вида (48). При к < к могут существовать оптимальные траектории с двумя и более переключениями управления. В предыдущей главе именно в этом диапазоне изменения параметра к построены и исследованы сложные картины оптимального синтеза для маятника.
Список цитируемой литературы
[1] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1983. —392 с.
[2] Красовский Н. Н. Игровые задачи о встрече движений. — М.: Наука, 1970. — 420 с.
[3] Белецкий В. В. Об оптимальном приведении искусственного спутника Земли в гравитационно-устойчивое положение // Космич. исслед.— 1971,— Т. 9, Вып. 3. - С. 366-375.
[4] Черноусько Ф. Л. Декомпозиция и субоптимальное управление в динамических системах // Прикладная математика и механика.— 1990.— Т. 54, Вып. 6.— С. 883-893.
[5] Черноусько Ф. Л. Синтез управления нелинейной динамической системой // Прикладная математика и механика. — 1992. — Т. 56, Вып. 2. — С. 179-191.
[6] Маркеев А. П. Теоретическая механика. — Москва—Ижевск: НИЦ «Регулярная и хаотическая динамика», 2007. — 592 с.
[7] Anchev A. A. Equilibrium attitude transitions of a three-rotor gyrostat in a circular orbit // AIAA Journal. ~ 1973. - Vol. 11, no. 4. - Pp. 467-472.
Список публикаций
Черноусько Ф. Л., Ананьевский И. М., Решмин С. А. Методы управления нелинейными механическими системами. — М.: Физматлиг, 2006.—328 с.
Chernousko F. L., Ananievski I. M., Reshmin S. A. Control of Nonlinear Dynamical Systems. Methods and Applications. — Berlin, Heidelberg: Springer, 2008. — 396 p.
Решмин С. А. Синтез управления двузвенным манипулятором // Изв. РАН. Теория и системы управления. — 1997. — № 2. —С. 146-150.
Решмин С. А., Черноусько Ф. Л. Синтез управления в нелинейной динамической системе на основе декомпозиции // Прикладная математика и механика. -1998.-Т. 62, Вып. 1.-С. 121-128.
Ананъевский И. М., Решмин С. А. Метод декомпозиции в задаче об отслеживании траекторий механических систем // Изв. РАН. Теория и системы управления. - 2002. - № 5. - С. 25-32.
Решмин С. А. Метод декомпозиции в задаче управления перевернутым двойным маятником с использованием одного управляющего момента // Изв. РАН. Теория и системы управления. — 2005. — № 6. — С. 28-45.
Решмин С. А., Черноусько Ф. Л. Оптимальное по быстродействию управление перевернутым маятником в форме синтеза // Изв. РАН. Теория и системы управления. - 2006. -№ 3. - С. 51-62.
Решмин С. А., Черноусько Ф. Л. Оптимальный по быстродействию синтез управления нелинейным маятником // Изв. РАН. Теория и системы управления. -2007.- № 1.-С. 13-22.
Chernousko F. L., Reshmin S. A. Time-optimal swing-up feedback control of a pendulum // Nonlinear Dynamics. — 2007. — Vol. 47, no. 1-3, Special Issue dedicated to the 60th birthday of Professor Giuseppe Rega. — Pp. 65-73.
Решмин С. А. Поиск главного бифуркационного значения максимального управляющего момента в задаче синтеза оптимального управления маятником // Изв. РАН. Теория и системы управления. — 2008.— № 2.— С. 5-20.
Решмин С. А. Бифуркация в задаче быстродействия для нелинейной системы второго порядка // Прикладная математика и механика. — 2009. — Т. 73, Вып. 4.-С. 562-572.
Решмин С. А. Метод декомпозиции в задаче управления лагранжевой системой с дефицитом управляющих параметров / / Прикладная математика и механика. -2010. -Т. 74, Вып. 1.-С. 151-169.
Chernousko F. L., Reshmin S. A. Decomposition and synthesis of control in a nonlinear dynamic system // Proc. International Conference on Informatics and Control (Ю1&С'97). — Vol. 1. —St.-Petersburg: 1997.-June 9-13.-Pp. xlv-lii.
[14] Chernousko F. L., Reshmin S. A. Decomposition of control for nonlinear lagrangian systems // Proc. 4th IFAC Nonlinear Control Systems Design Symposium (NOLCOS'98). - Vol. 1. - Enschede, Netherlands: 1998. - July 1-3. - Pp. 209-214.
[15] Chernousko F. L., Reshmin S. A. Decomposition of control for robotic manipulators // Proc. 4th ECPD International Conference on Advanced Robotics, Intelligent Automation and Active Systems. — Moscow: 1998. — August 24-26. — Pp. 184-189.
[16] Chernousko F. L., Reshmin S. A. Method of decomposition and its applications to uncertain dynamical systems // Proc. 16th IFAC World Congress. — Prague, Czech Republic: 2005.-July 4-8 (on CD, 6 pages).
[17] Reshmin S. A., Chernousko F. L. Method of decomposition for the control of nonlinear dynamical systems // Proc. 5th EUROMECH Nonlinear Oscillations Conference (ENOC-2005).-Eindhoven, Netherlands: 2005.-August 7-12.-Pp. 790-799 (on CD).
[18] Решмин С. А., Черноусько Ф. Л. Оптимальный по быстродействию синтез управления в задачах раскачивания и гашения колебаний нелинейного маятника // Труды IX Международной Четаевской конференции «Аналитическая механика, устойчивость и управление движением». — Т. 3. — Иркутск — оз. Байкал: 2007.-12-16 июня.-С. 179-196.
[19] Chernousko F. L., Reshmin S. A. Time-optimal swing-up and damping feedback controls of a nonlinear pendulum // Proc. of the ECCOMAS Thematic Conference on Multibody Dynamics. — Milan, Italy: 2007. —June 25-28 (on CD, 20 pages).
[20] Awrejcewicz J., Reshmin S. A., Wasilewski G., Kudra G. Swing up a double pendulum by simple feedback control // Proc. 6th EUROMECH Nonlinear Oscillations Conference (ENOC-2008). - St.-Petersburg: 2008. - June 30-July 4 (on CD, 6 pages).
[21] Chernousko F. L., Reshmin S. A. Time-optimal feedback controls of a nonlinear pendulum // Advances in Mechanics: Dynamics and Control: Proceedings of the 14th International Workshop on Dynamics and Control / Ed. by F. L. Chernousko, G. V. Kostin, V. V. Saurin.-Moscow: Nauka, 2008.-Pp. 76-83.
[22] Chernousko F. L., Reshmin S. A. Time-optimal swing-up and damping feedback controls of a nonlinear pendulum // Proc. 6th Vienna Conference on Mathematical Modelling (MATHMOD-2009) / Ed. by I. Troch, F. Breitenccker. - Vienna, Austria: 2009.-February 11-13.-Pp. 428-439 (on CD).
[23] Решмин С. А. Бифуркация в задаче быстродействия для нелинейной системы второго порядка // Проблемы аналитической механики и теории устойчивости. Сборник научных статей, посвященный памяти академика Валентина Витальевича Румянцева. —М.: Физматлит, 2009.— С. 344-356.
СИНТЕЗ УПРАВЛЕНИЯ В НЕЛИНЕЙНЫХ МЕХАНИЧЕСКИХ СИСТЕМАХ
Решмин Сергей Александрович
Автореферат диссертации на соискание ученой степени доктора физико-математических наук
Подписано к печати 18.11.2010
Заказ № 47-2010
Тираж 100 экз.
Отпечатано на ризографе Учреждения Российской академии наук Института проблем механики им. А. Ю. Ишлинского РАН 119526, Москва, проспект Вернадского, д. 101, корп. 1
Введение
Обзор литературы.
Глава 1. Синтез управления в нелинейной лагранжевой системе на основе декомпозиции
1.1. Постановка задачи.
1.2. Декомпозиция
1.3. Анализ управляемых движений
1.4. Определение параметров
1.5. Случай нулевых начальных скоростей
1.6. Отслеживание траекторий механических систем.
Диссертация посвящена построению синтеза управления в нелинейных механических системах. Целью является разработка эффективных методов управления сложными механическими системами на основе математических моделей, отражающих основные особенности таких систем: высокую размерность системы, динамическую зависимость между ее степенями свободы, наличие нелинейностей, ограничения на управляющие воздействия и фазовые переменные, неполноту информации о внешних возмущениях и собственных параметрах системы, требование о приведении системы в терминальное состояние за конечное время. Эффективность предложенных в диссертации методов продемонстрирована путем построения законов управления для конкретных механических и электромеханических систем, а также компьютерного моделирования динамики этих систем.
В диссертации рассматриваются системы, динамика которых описывается дифференциальными уравнениями, имеющими лаграижеву форму с1 дТ дТ . 1 аЬ оси % здесь дг — обобщенные координаты системы, 1]\ — управляющие обобщенные силы, фг — все прочие обобщенные силы, включая неконтролируемые возмущения, п — число степеней свободы системы, t — время, точкой обозначаются производные по времени, Т(д, д) — кинетическая энергия системы, заданная в виде симметрической положительно-определенной квадратичной формы от обобщенных скоростей с[{\
1 1 п Ш й) = АШ, <?} = ^ (°-2)
2 2 через д и д обозначаются п-мерные векторы обобщенных координат и скоростей соответственно, а скобками (•, •} — скалярное произведение векторов.
Подставляя (0.2) в (0.1), приведем уравнения движения к виду + (0.3)
Здесь 11 = (С/х,., ип) — вектор управляющих сил, 5 = (5х,., 5^) — вектор-функция п
5(д, д, I) = я, I) - (0.4)
3,к=1 где Г^ = (Гх-у-д;,., Гщк) — п-мерные векторы с компонентами д(Ьэ 1да5к Т-к ~ ^ " 2"% ' ( }
Предполагается, что на управляющие воздействия в каждый момент времени наложены геометрические ограничения вида Щ^Ц?, ъ = 1 (0.6) где и? — заданные постоянные.
Основные проблемы, возникающие при решении задач управления рассматриваемой системой (0.3), обусловлены тем, что она представляет собой существенно нелинейную динамическую систему высокого порядка. Ее отличает наличие динамического взаимодействия между различными степенями свободы, которое характеризуется элементами а^к{я) матрицы кинетической энергии А(д). Ситуация еще более осложняется, если некоторые из констант и® в (0.6) равны нулю, т.е. имеет место дефицит управляющих параметров.
Очень часто параметры системы (массы, геометрические характеристики и т. д.) определены лишь с некоторой погрешностью. Еще одним неопределенным фактором выступают неконтролируемые возмущения. В указанных случаях говорят об управлении системой в условиях неопределенности, и здесь важнейшую роль приобретают алгоритмы управления по обратной связи, которые обеспечивают желаемые режимы работы системы. При этом обобщенные координаты и скорости ф считаются доступными измерениям, т. е. фазовое состояние системы в каждый момент времени известно.
Примером механических систем, описываемых уравнениями (0.3), могут служить манипуляционные роботы, которые являются важнейшей составной частью автоматизированных производственных систем. Для манипуляционных роботов в качестве обобщенных координат д^ обычно выбираются относительные углы или смещения между звеньями. Интенсивность взаимовлияния между различными звеньями задается элементами матрицы А(д). Если учитывается динамика приводов, то функции включают массо-инерционные параметры электродвигателей и редукторов. Уравнения движения манипуляционного робота (в форме Лагран-жа) содержат составляющие обобщенных сил обусловленные силами веса, сопротивления, которые бывают известны лишь приближенно и могут существенно изменяться в процессе эксплуатации. Компоненты Щ имеют физический смысл сил или моментов сил, развиваемых исполнительными устройствами.
Необходимость рассмотрения задач управления системой (0.3) именно в нелинейной постановке (без перехода к упрощенному линеаризованному описанию) связана с несколькими причинами. Так, управление, построенное для линеаризованной системы, часто оказывается неэффективным при применении в нелинейной системе. Кроме того, при изменении цели управления изменяются как структура, так и параметры алгоритмов управления. Указанные причины также затрудняют синтез универсальных систем управления.
Диссертация состоит из введения, обзора литературы, пяти глав и списка литературы.
1. Айзеке Р. Дифференциальные игры. — М.: Мир, 1967.— 480 с.
2. Айзерман М. А. Классическая механика. — М.: Наука, 1974.
3. Акулеико Л. Д. Асимптотические методы оптимального управления. — М.: Наука, 1987.
4. Акуленко Л. Д. Конструктивное управление движением колебательных систем с дискретными и распределенными параметрами // Прикладная математика и механика. — 1989. — Т. 53, Вып. 4.
5. Акул&нко Л. Д., Болотник Н. Н. Синтез оптимального управления транспортными движениями промышленных роботов // Изв. АН СССР. МТТ. — 1986. № 4.
6. Аиан,ьевский И. М. Управление механической системой с неизвестными параметрами посредством ограниченной силы // Прикладная, математика и механика.— 1997, — Т. 61, Вып. 1.
7. Ананьевский И. М. Ограниченное управление механической системой в условиях неопределенности // Докл. РАН. — 1998. — Т. 359, № 5.
8. Ананьевский И. М. Управление двухмассовой системой с неизвестными параметрами // Изв. РАН. Теория и системы управления. — 1998. — № 2.
9. Ананьевский И. М. Ограниченное управление реономными механическими системами в условиях неопределенности // Прикладная математика и механика. — 2001. — Т. 65, Вып. 5.
10. Ананьевский И. М. Управление реономными механическими системами с неизвестными параметрами // Докл. РАН. — 2001. — Т. 377, № 4.
11. Ананьевский И. М., Добрынина И. С., Черноусъко Ф. Л. Метод декомпозиции в задаче управления динамической системой // Изв. РАН. Теория и системы управления. — 1995. — J\Tfi 2. — С. 3-14.
12. Ананьевский И. М., Решмин С. А. Метод декомпозиции в задаче об отслеживании траекторий механических систем // Изв. РАН. Теория и системы управления. 2002. - № 5. - С. 25-32.
13. Анчев А. А., Меликян А. А. Об оптимальной переориентации спутника на круговой орбите // Изв. АН СССР. МТТ. 1980. - № 6. - С. 35-42.
14. Бардин Б. С., Маркеев А. П. Об устойчивости маятника при вертикальных колебаниях точки подвеса // Прикладная математика и .механика. — 1995. Т. 59, Вып. 6. - С. 922-929.
15. Белецкий В. В. Об оптимальном приведении искусственного спутипка Земли в гравитационно-устойчивое положение // Космич. исслед.— 1971.— Т. 9, Вып. 3. С. 366-375.
16. Беллман Р. Динамическое программирование / Пер. с англ. -- М.: ИЛ, 1960.
17. Беллман Р., Гликсберг И., Гросс О. Некоторые вопросы математической теории управления: Пер. с англ. — М.: ИЛ, 1962.
18. Болотник, Н. Н., Каплунов A.A. Некоторые задачи оптимального управления поворотом твердого тела // Изв. АН СССР. МТТ. — 1980. — № 5.
19. Болотник II. Н., Черноусъко Ф. Л. Оптимизация управления манипуляци-онными роботами // Изв. АН СССР. Техн. кибернетика. — 1990.— № 1.
20. Болтянский В. Г. Математические методы оптимального управления. — М.: Наука, 1968.-408 с.
21. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. — М.: Мир, 1972.
22. Бутковский А. Г. Методы управления системами с распределенными параметрами. — М.: Наука, 1975.
23. Бутковский А. Г. Фазовые портреты управляемых динамических систем. — М.: Наука, 1985.
24. Бутковский А. Г., Доманицкий С. М. О синтезе управляющей части оптимальных систем для некоторых объектов с запаздыванием. — М.: Изд-во АН СССР, 1960.
25. Воротников В. И. О нелинейном синтезе ограниченных управлений при помехах // Докл. АН. 1994. - Т. 337, № 1. - С. 44-47.
26. Воротников В. И. О синтезе ограниченных управлений в игровой задаче переориентации асимметричного твердого тела // Докл. АН. — 1995. — Т. 343, № 5. С. 630-634.
27. Воротников В. И. О построении игровых ограниченных управлений для нелинейных динамических систем // Прикладная .математика и механика. — 1997. Т. 61, Вып. 1. - С. 63-74.
28. Гришин А. А., Ленский, А. В., Охоцимский Д. Е., Панин Д. А., Формалъ-ский А. М. О синтезе управления неустойчивым объектом, перевернутый маятник // Изв. РАН. Теория и системы управления.— 2002,— № 5.— С. 14-24.
29. Добрынина И. С. Моделирование динамики манипуляционных роботов с применением метода декомпозиции управления // Изв. РАН. Техн. кибернетика. — 1995. № 4. - С. 246-256.
30. Добрынина И. С., Карпов И. И., Черноусько Ф. Л. Компьютерное моделирование управления движением системы связанных твердых тел // Изв. РАН. Техн. кибернетика. — 1994. — № 1. С. 167-180.
31. Дунекая Н. В., Пятницкий Е. С. Стабилизация управляемых механических и электромеханических систем // Автоматика и телемеханика.— 1988.— № 12.
32. Емельянов С. В. Системы автоматического управления с переменной структурой. — М.: Наука, 1967.
33. Зубов В. И. Математические методы исследования систем автоматического регулирования. — Л.: Судпромгиз, 1959.
34. Зубов В. И. Лекции по теории управления. М.: Наука, 1975.
35. Калман Р. Об общей теории систем управления // Тр. 1-го конгр. Между-нар. федерации по автоматич. управлению (1FAC).— М.: Изд-во АН СССР, 1961.
36. Калмлн РФалб П., Арбиб М. Очерки по математической теории систем. — М.: Мир, 1971.
37. Капица П. Л. Динамическая устойчивость маятника при колеблющейся точке подвеса // ЖЭТФ. 1951. - Т. 21, Вып. 5. - С. 588-598.
38. Каюмов О. Р. Оптимальное управление эллиптическим маятником // Изв. АН СССР. МТТ. 1985. - № 4. - С. 38-44.
39. Каюмов О. Р. Глобально управляемые механические системы.— М.: Физ-матлит, 2007. 168 с.
40. Ковалева А. С. Управление колебаниями и виброударными системами.— М.: Наука, 1990.
41. Красовский Я. Я. Теория управления движением. — М.: Наука, 1968.
42. Красовский Я. Я. Игровые задачи о встрече движений. — М.: Наука, 1970. — 420 с.
43. Красовский Я. Я. Управление динамической системой. — М.: Наука, 1985.
44. Красовский Я. Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1985.
45. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. — М.: Наука, 1973.
46. Кряжимский А. В. Альтернатива в линейной игре сближения уклонения с неполной информацией // Докл. АН СССР. - 1976. - Т. 230, № 4.
47. Кряжимский А. В. К теории позиционных дифференциальных игр сближения уклонения // Докл. АН СССР. - 1978. - Т. 239, № 4.
48. Кряжимский А. В. Об устойчивом позиционном управлении в дифференциальных играх // Прикладная математика и механика, — 1978.— Т. 42, Вып. 6.
49. Кряжимский А. В., Осипов Ю. С. Устойчивые решения обратных задач динамики управляемых систем // Тр. МИАН СССР. — 1988.
50. Курэюанский А. Б. Управление и наблюдение в условиях неопределенности.— М.: Наука, 1977.
51. Лавровский Э. К., Формалъский А. М. Стабилизация заданной позиции упругого стержня // Прикладная математика и механика. — 1989. — Т. 53, Вып. 5.
52. Лионе Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. — М.: Мир, 1972.
53. Ли Э. Б., Маркус Л. О необходимых и достаточных условиях оптимальности по быстродействию для нелинейных систем второго порядка // Тр. II Междунар. конгр. ИФАК. Базель, 1963. — М.: Наука, 1965. — С. 155-166.
54. Ли Э. Б., Маркус Л. Основы теории оптимального управления / Пер. с англ. — М.: Наука, 1972. —576 с.
55. Малышев В. В., Кибзун А. И. Анализ и синтез высокоточного управления летательными аппаратами. — М.: Машиностроение, 1987.
56. Маркеев А. П. Теоретическая механика. — Москва—Ижевск: НИЦ «Регулярная и хаотическая динамика», 2007. — 592 с.
57. Матюхин В. И. Непрерывные универсальные законы управления манипу-ляционным роботом // Автоматика и телемеханика. — 1997.— № 4.— С. 31-44.
58. Матюхин В. ИПятницкий Е. С. Управление движением манипуляцион-н ых роботов на принципе декомпозиции при учете динамики приводов // Автоматика и телемеханика. — 1989. — № 9. — С. 67-81.
59. Мирошник И. В., Никифоров В. О., Фрадков А. Л. Нелинейное и адаптивное управления сложными динамическими системами, — СПб.: Наука, 2000.— 548 с.
60. Овсеевич А. И. Устойчивость перевернутого маятника при быстрых случайных колебаниях точки подвеса // Прикладная математика и механика. — 2006,- Т. 70, Вып. 5.-С. 844-851.
61. Осипов Ю. С. О стабилизации управляемых систем с запаздыванием // Дифференц. уравнения. — 1965. — Т. 1, № 5.
62. Осипов Ю. С. Дифференциальные игры систем с последействием // Докл. АН СССР. 1971. - Т. 196, № 4.
63. Осипов Ю. С., Пименов В. Г. К теории дифференциальных игр в системах с последействием // Прикладная математика и механика. — 1978. — Т. 42, Вып. 6.
64. Первозванский А. А. Курс теории автоматического управления. — М.: Наука, 1986.
65. Первозванский А. А., Гайцгори В. Г. Декомпозиция, агрегирование и приближенная оптимизация, — М.: Наука, 1979.
66. Понтрягин Л. С. К теории дифференциальных игр // УМН. — 1966. — Т. 21, № 4.
67. Понтрягин Л. С. Линейные дифференциальные игры преследования // Мат. сб. 1980. - Т. 112, № 3.
68. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1983. — 392 с.
69. Пятницкий Е. С. Синтез управления манипуляционными роботами на принципе декомпозиции // Изв. АН СССР. Техн. кибернетика. — 1987. № 3. — С. 92-99.
70. Пятницкий Е. С. Принцип декомпозиции в управлении механическими системами // Докл. АН СССР. — 1988. — Т. 300, № 2. — С. 300-303.
71. Пятницкий Е. С. Критерий полной управляемости классов механических систем с ограниченными управлениями // Прикладная математика и механика.- 1996,- Т. 60, Вып. 5. — С. 707-718.
72. Решмин С. А. Синтез управления двузвенным манипулятором // Изв. РАН. Теория и системы управления. — 1997. — № 2. — С. 146-150.
73. Реи шип С. А. Метод декомпозиции в задаче управления перевернутым двойным маятником с использованием одного управляющего момента // Изв. РАН. Теория и системы управления. — 2005. — № 6. — С. 28-45.
74. Решмин С. А. Поиск главного бифуркационного значения максимального управляющего момента в задаче синтеза оптимального управления маятником // Изв. РАН. Теория, и системы управления.— 2008.— № 2. С. 5-20.
75. Решмин С. А., Черноусько Ф. Л. Синтез управления в нелинейной динамической системе на основе декомпозиции // Прикладная математика и механика. 1998. - Т. 62, Вып. 1. - С. 121-128.
76. Решмин С. А., Черноусько Ф. Л. Оптимальный по быстродействию синтез управления нелинейным маятником // Изв. РАН. Теория и системы управления. 2007. - № 1. - С. 13 22.
77. Субботин А. И. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. - Т. 254, № 2.
78. Субботин А. И. Минимаксные неравенства и уравнения Гамильто-на-Якоби.— М.: Наука, 1991.
79. Субботин А. И., Чепцов А. Г. Оптимизация гарантии в задачах управления,— М.: Наука, 1981.
80. Уткин В. И. Скользящие режимы и их применения в системах с переменной структурой. — М.: Наука, 1974. — 272 с.
81. Уткин В. И. Скользящие режимы в задачах оптимизации и управления. — М.: Наука, 1981.
82. Уткин В. И., Орлов Ю. В. Теория бесконечномерных систем управления на скользящих режимах. — М.: Наука, 1990. — 133 с.
83. Фаронов В. В. Программирование на персональных ЭВМ в среде Турбо-Паскаль.- М.: Изд-во МГТУ, 1991.-580 с.
84. Филимонов Ю. М. К задаче об оптимальном управлении математическим маятником // Диффсренц. уравнения. — 1965.— Т. 1, № 8.— С. 1007-1015.
85. Фомин В. Н.; Фрадков А. Л., Якубович В. А. Адаптивное управление динамическими объектами. — М.: Наука, 1981.—447 с.
86. Формалъский А. М. Управляемость и устойчивость систем с ограниченными ресурсами. — М.: Наука, 1974.
87. Формалъский А. М. О стабилизации двойного перевернутого маятника при помощи одного управляющего момента // Изв. РАН. Теория и систелт управления. — 2006. — № 3. — С. 5-12.
88. Форсайт Дж.; Малькольм М. Моулер К. Машинные методы математических вычислений. — Пер. с англ. М.: Мир, 1980.— 280 с.
89. Фрадков А. Л. Схема скоростного градиента, и ее применение в задачах адаптивного управления // Автоматика и телемеханика. — 1979. — № 9.
90. Фрадков А. Л. Адаптивное управление сложными системами. — М.: Наука, 1990.
91. Цыпкин Я. 3. Адаптация и обучение в автоматических системах. — М.: Наука, 1968.97| Цыпкин Я. 3. Основы теории обучающихся систем, — М.: Наука, 1970.
92. Цыпкин Я. 3. Основы теории автоматических систем. — М.: Наука, 1977.
93. Цыпкин Я. 3., Попков Ю. С. Теория нелинейных импульсных систем. — М.: Наука, 1973.
94. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. — М.: Наука, 1988.101| Черноусько Ф. Л. Декомпозиция и синтез управления в динамических системах // Изв. АН СССР. Техн. кибернетика. 1990.- № 6.- С. 64-82.
95. Черноусько Ф. Л. Ограниченное управление в системах с распределенными параметрами // Прикладная, математика и механика.— 1992.— Т. 56, Вып. 5,- С. 810-826.
96. Черноусько Ф. Л. Синтез управления нелинейной динамической системой // Прикладная математика и механика. — 1992. — Т. 56, Вып. 2. — С. 179-191.
97. Черноусько Ф. Л. Декомпозиция и синтез управления в нелинейных динамических системах // Тр. Мат. ин-та РАН. — 1995. — Т. 211, — С. 457-472.с
98. Черноусько Ф. Л. Оценка множеств достижимости линейных систем с неопределенной матрицей // Докл. АН. — 1996. — Т. 349, № 1.
99. Черноусько Ф. Л., Акуленко Л. Д., Соколов Б. Н. Управление колебаниями,— М.: Наука, 1980.
100. Черноусько Ф. Л., Ананьевский И. М., Решмин С. А. Методы управления нелинейными механическими системами. — М.: Физматлит, 2006. — 328 с.
101. Черноусъко Ф. Л., Болотник Н. Н., Градецкий В. Г. Манипуляционпыс роботы: динамика, управление, оптимизация.— М.: Наука, 1989. — 368 с.
102. Черноусъко Ф. Л., Колмановский В. Б. Оптимальное управление при случайных возмущениях, — М.: Наука, 1978.
103. Черноусъко Ф. Л., Меликян А. А. Игровые задачи управления и поиска.— М.: Наука, 1978.
104. Чиликин М. Г., Ключев В. И., Сандлер А. С. Теория автоматизированного электропривода. — М.: Энергия, 1979.
105. Якубович В. А. К теории адаптивных систем // Докл. АН СССР. 1966. — Т. 166, № 6.
106. Absil P., Sepulchre R. A hybrid control scheme for swing-up acrobatics // Proc. 5th European Control Conference. — 2001. — Pp. 2860-2864.
107. Anchev A. A. Equilibrium attitude transitions of a three-rotor gyrostat in a circular orbit // AIAA Journal. 1973. — Vol. 11, no. 4. — Pp. 467-472.
108. Awrejcewicz J., Kudra G., Wasilewski G. Experimental observations and simulations of a triple physical pendulum // Proc. of the 1st Polish Congress of Mechanics. - Warsaw, Poland, August 28-31, 8 pages (on CD), in Polish: 2007.
109. Awrejcewicz J., Kudra G., Wasilewski G. Chaotic zones in triple pendulum dynamics observed experimentally and numerically // Applied Mechanics and Materials. 2008. - Vol. 9. - Pp. 1-17.
110. Awrejcewicz J., Reshmin S. A., Wasilewski G., Kudra G. Swing up a double pendulum by simple feedback control // Proc. 6th EUROMECH Nonlinear Oscillations Conference (ENOC-2008).- St.-Petersburg: 2008.-June 30-July 4 (on CD, 6 pages).
111. Berghuis H., Nijmeijer H. Global regulation of robots using only position measurement // Systems and Control Letters 21.— 1993.
112. Chernousko F. L. The decomposition of controlled dynamic systems // Advances in nonlinear dynamics and control / Ed. by A. B. Kurzhanski. — Boston Basel Berlin: Birkhauser, 1993. Pp. 1-40.
113. Chernousko F. L., Ananievski I. M., Reshmin S. A. Control of Nonlinear Dynamical Systems. Methods and Applications.— Berlin, Heidelberg: Springer, 2008.— 396 p.
114. Chernousko F. L., Reshmin S. A. Decomposition and synthesis of control in a nonlinear dynamic system // Proc. International Conference on Informatics and Control (ICI&C97). Vol. 1. - St.-Petersburg: 1997. - June 9-13. - Pp. xlv-lii.
115. Chernousko F. L.; Reshmin S. A. Decomposition of control for nonlinear la-grangian systems // Proc. 4th IFAC Nonlinear Control Systems Design Symposium (NOLCOS'98). — Vol. 1,- Enschede, Netherlands: 1998.-July 1-3.-Pp. 209 214.
116. Chernousko F. L., Reshmin S. A. Time-optimal swing-up and damping feedback controls of a nonlinear pendulum // Proc. of the ECCOMAS Thematic Conference on Multibody Dynamics. — Milan, Italy: 2007. — June 25-28 (on CD, 20 pages).
117. Chernousko F. L., Reshmin S. A. Time-optimal swing-up feedback control of a pendulum // Nonlinear Dynamics. — 2007. — Vol. 47, no. 1-3, Special Issue dedicated to the 60th birthday of Professor Giuseppe Rega. — Pp. 65-73.
118. Corless M., Leitrnann G. Adaptive control of systems containing uncertain functions and unknown functions with uncertain bounds // J. of Optimization Theory and Applications. — 1983. — Vol. 42, no. 1. — Pp. 155-168.
119. Fehlberg E. Low-order classical Runge-Kutta formulas with stepsize control and their application to some heat transfer problems. — NASA Technical Report 315, 1969.
120. Fehlberg E. Klassische Runge-Kutta-Formeln vierter und niedrigerer Ordnung mit Schrittweiten-Kontrolle und ihre Anwendung auf Wärmeleitungsprobleme // Computing. 1970. - Vol. 6. - Pp. 61-71.
121. Friedland B., Sarachik P. Indifference regions in optimum attitude control // IEEE Irans. Autom. Control. 1964. - Vol. 9, no. 2. - Pp. 180-181.
122. Garcia Almuzara J. L., Flügge-Lots I. Minimum time control of a nonlinear system // J. Differential Equations. — 1968. — Vol. 4, no. 1.-- Pp. 12-39.
123. Isidori A. Nonlinear Control Systems. — 3 edition. — New York: Springer-Verlag, 1995.
124. Isidori A. Semiglobal practical stabilization of uncertain non-minimum-phase nonlinear systems via output feedback // Proc. IV IFAC Nonlinear Control Systems Design Symp. — Enschede, The Netherlands: University of Twente, 1998.
125. Isidori A. Nonlinear Control Systems.— New York: Springer-Verlag, 1999,— Vol. II.
126. Kaiman R. E. A new approach to linear filtering and prediction problems // Trans. A S ME, ser. D, V. — I960. Vol. 82, no. 1.
127. Krasovskii A. N., Krasovskii N. N. Control under lack of Information. — Boston: Birkhäuser, 1995.
128. Krotov V. F. Global Methods in Optimal Control Theory. — New York: Marcel Dekker Ink., 1996.
129. Kuipers B., Ramamoorthy S. Qualitative modeling and heterogeneous control of global system behavior // Hybrid systems computation and control. — Stanford, California: 2002. March. - Pp. 294-307.
130. Kurzhanski A. B., Valyi I. Evolution and control of uncertain systems // Tuto-rial-92-01. Laxenburg: IIASA, 1992.
131. Leitmann G. Multicriteria decision making and differential games. — New York: Plenum, 1976.
132. Leitrnann G. Deterministic control of uncertain systems // Acta Astronautica. — 1980. Vol. 7. - Pp. 1457-1461.
133. Loria A., Panteley E., Nijmeijer IL, Fossen T. I. Robust adaptive control of passive systems with unknown disturbances // Proc. IV IFAC Nonlinear Control Systems Design Symp. — Enschede, The Netherlands: University of Twente, 1998.
134. Matyukhin V. I. Force / motion control of manipulators with incomplete information // Proc. 4th ECPD International Conference on Advanced Robotics, Intelligent Automation and Active Systems. — Moscow: 1998. — August 24-26. — Pp. 72-77.
135. Nijmeijer H., Rodriguez-Angeles A. Synchronization of mechanical systems. World scientific series on nonlinear science.— World Scientific Publishing Co. Pte. Ltd., 2003.
136. Nijmeijer H., van der Schaft A. J. Nonlinear Dynamic Control Systems. — New York: Springer-Verlag, 1990.
137. Osipov J. S., Kryazhimski A. V. Inverse problem of ordinary differential equations: Dynamical solutions. — London: Gordon and Breach, 1995.
138. Reshmin S. A., Chernousko F. L. Method of decomposition for the control of nonlinear dynamical systems // Proc. 5th EUROMECH Nonlinear Oscillations Conference (ENOC-2005). Eindhoven, Netherlands: 2005.-August 7-12.— Pp. 790-799 (on CD).
139. Rubi J., Rubio A., Avello A. Swing-up control problem for a self-erecting double inverted pendulum // IEE Proceedings Control Theory and Applications. —I2002.-Vol. 149.-Pp. 169-175.
140. Sanfelice R. G. Teel A. R. A "throw-and-catch" hybrid control strategy for robust global stabilization of nonlinear systems // Proc. 26th American Control Conference. 2007. - Pp. 3470-3475.
141. Schaefer I. F., Cannon R. F. On the control of unstable mechanical systems // Proc. IFAC 3d Congress. — London: 1996.
142. Shampine L. E., Waits H. A., Davenport S. Solving non-stiff ordinary differential equations — the state of the art // Sandia Laboratories Report SAND75-0182, Albuquerque, New Mexico; SIAM Review. — 1976. — Vol. 18, no. 3. — Pp. 376-411.
143. Shiriaev A., Egeland O., Ludvigsen H. Global stabilization of unstable equlibri-um point of pendulum // Proc. of IEEE conference on decision and control. — Tampa, Florida: 1998. December. - Pp. 4584-4585.
144. Stephenson A. On a new type of dynamical stability // Memoirs and Proceedings of the Manchester Literary and Philosophical Society. — 1908. — Vol. 52, no. 8, Pt. 2,- Pp. 1-10.
145. Subbotin A. I. Generalized solutions of first-order PDEs: the dynamical optimization perspective. — Boston: Birkhauser, 1995.
146. Utkin V I. Sliding modes in optimization and control. — New York: Springer-Verlag, 1992.
147. Utkin V, Guldner J., Shi J. Sliding Mode Control in Electromechanical Systems. — London: Taylor Sz Francis, 1999.
148. Van der Schaft A. J. L2-gain analysis of nonlinear systems and nonlinear H^ control // IEEE Trans. Autorn. Control, AC-37.— 1992.
149. Van der Schaft A. J. L2-gain and passivity techniques in nonlinear control // № 218 in Lecture Notes in Control and Information Sciences. — Heidelberg: Springer Verlag, 1996. 1st. edition.
150. Van der Schaft A. J., Maschke D. Modelling and control of mcchanical systems. Chap. Interconnected Mechanical systems. — Imperial College Press, 1995.
151. Van der Schaft A. L2-gain and passivity techniques in nonlinear control.— London: Springer, 2000.
152. Xu Y., Iwase M., Furuta K. Time optimal swing-up control of a single pendulum // Transactions of the AS ME. 2001. - Vol. 123. - Pp. 518-527.