Методы синтеза разрывных оптимальных систем самоуправления тема автореферата и диссертации по математике, 01.01.09 ВАК РФ
Баранчикова, Надежда Ивановна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Владивосток
МЕСТО ЗАЩИТЫ
|
||||
1999
ГОД ЗАЩИТЫ
|
|
01.01.09
КОД ВАК РФ
|
||
|
РОССИЙСКАЯ АКАДЕНИЯ НАУК ДАЛЬНЕВОСТОЧНОЕ ОТДЕЛЕНИЕ ИНСТИТУТ ПРИКЛАДНОМ МАТЕМАТИКИ
На правах рукописи
Баранчикова Надежда Ивановна
МЕТОДЫ СИНТЕЗА РАЗРЫВНЫХ ОПТИМАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ
01.01.09 - математическая кибернетика
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель: доктор физико-математических наук профессор Ащепков Л.Т.
Владивосток - 1998
- 2 -ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ...................................................3
Глава 1. ПРИНЦИП МАКСИМУМА ДЛЯ ПОЗИЦИОННЫХ УПРАВЛЕНИЙ................16
§1. Постановка задачи......................................................................18
§2. Принцип максимума в классе позиционных управлений... 20
2.1. Нормальное управление..........................................................20
2.2. Формулировка и доказательство позиционного принципа максимума..................................................................................21
2.2.1. Вариация управления и траектории................................22
2.2.2. Принцип максимума..............................................................25
§3. Связь теоремы с принципом максимума Л.С. Понтрягина. 27
§4. Связь теоремы с динамическим программированием............29
§5. Обобщение теоремы......................................................................32
§6. Примеры..........................................................................................33
§7. Синтез кусочно постоянных управлений................................35
Глава 2. ПРЯМАЯ РЕДУКЦИЯ ЗАДАЧ С ПАРАМЕТРАМИ К ЗАДАЧАМ"
НЕЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ................................................38
§1. Понятие и свойства первых интегралов................................39
§2. Редукция задачи..........................................................................40
2.1. Постановка задачи..................................................................40
2.2. Первые интегралы....................................................................41
2.3. Условия оптимальности..........................................................42
§3. Вычисление производных в задаче нелинейного программирования ......................................................................................42
§4. Случай нескольких поверхностей разрыва............................49
§5« Задача с подвижным правым концом траектории..................51
Глава 3. РАЗВИТИЕ КОНЦЕПЦИИ ДВУХФАЗНОГО ДВИЖЕНИЯ..........................53
§1. Основные понятия........................................................................55
§2. Развитие концепции двухфазного движения..........................58
§3. Синтез линейных систем на фазовой плоскости..................60
3.1. Синтез управления для комплексных корней характеристического уравнения........................................................62
3.2. Синтез управления для действительных корней характеристического уравнения....................................................71
3.2.1. Случай различных ненулевых корней..............................71
3.2.2. Случай нулевого корня......................................................79
3.2.3. Случай кратных корней......................................................84
ЗАКЛЮЧЕНИЕ...................................................................................................89
СПИСОК ИСПОЛЬЗОВАННОИ ЛИТЕРАТУРЫ..........................................................91
ВВЕДЕНИЕ
Проблема синтеза оптимальных систем [51 ] является одной из центральной в теории управления [46, 17] . Она возникла в начале 50-х годов в результате естественного развития классической теории регулирования. В последней, как известно, различаются два принципа управления: програллное и позиционное ( типа обратной связи, синтезирующее ). Синтезирующее управление вырабатывает воздействие на систему по состоянию, в котором она находится и не зависит от начальных состояний. Программное же управление действует по времени и жестко привязано к начальному состоянию. При изменении начального состояния программное управление в общем случае перестает быть допустимым по ограничениям и оптимальным. Синтез оптимальной системы, то есть построение оптимального синтезирующего управления . - конечная цель решения задачи оптимального управления, интересующая инженеров - практиков. Причины интереса становятся понятными, если учесть, что практически все системы автоматического регулирования действуют в условиях помех или возмущений. Эти помехи ( или возмущения ) "сбивают" управляемый объект с расчетной траектории. Расчетное программное управление в такой ситуации бесполезно, так как не обеспечивает даже допустимость траектории. Синтезированные же управления позволяют корректировать управляющие воздействия и для измененных состояний. Как только действие помех прекращается, синтезированная замкнутая система продолжает функционировать наилучшим образом для измененных начальных состояний и далее до
следующих возмущений.
Проблеме построения обратных связей для обеспечения оптимальных переходных процессов посвящено большое число исследований. Тем не менее общей теории синтеза до сих пор не создано. Проблема оказывается чрезвычайно сложной и полно изучена лишь в некоторых простых случаях. Если исключить отдельные примеры, то успех был достигнут только в одной специфической задаче оптимизации линейных систем по квадратичному критерию качества, в которых нет ограничений на управление и состояния системы [42, 29, 32, 35, 14]. Поэтому не случайно наиболее крупные успехи современной математической теории оптимальных процессов относятся к исследованию программых управлений. Именно для них доказан знаменитый принцип максимума Понтрягина. Надежды на эффективное решение проблемы синтеза оптимальных систем с помощью принципа максимума и второго фундаментального метода теории оптимального управления - динамического программирования Беллмана - в общем случае не оправдались.
Основные теоретические подходы к исследованию проблемы синтеза базируются на использовании принципа максимума Л. С. Понтрягина [46, 18, 21], метода динамического программирования Р. Беллмана [17, 30, 36, 42] , достаточных условиях В.Ф. Кротова [39, 40] и применении функций Ляпунова [28, 41,45, 62], а также теории поля экстремалей В.В. Величенко [20].
Достаточные условия в форме принципа динамического программирования приведены В.Г. Болтянским [19]. Он показал, что регулярный синтез, осуществленный на основе принципа максимума, как правило, действительно приводит к оптимальным траекториям. Однако его реализация в конкретных задачах наталкивается на значительные и иногда непреодолимые аналитические трудности.
Функция Беллмана тесно связана с функцией Ляпунова [42], используемой в теории устойчивости движения. Она может рассматриваться [33] как оптимальная функция Ляпунова в задачах стабилизации. Метод оптимального демпфирования В.М. Зубова [28] базируется также на идее использования функций Ляпунова. Теоремы Ляпунова позволяют судить об устойчивости исследуемой системы по полю скоростей, задаваемому дифференциальными уравнениями движения. Применение методологии Ляпунова в исследовании оптимальных процессов также приводит к возможности оценки качества исследуемой траектории по виду правых частей дифференциальных уравнений управляемого движения.
В начале 60-х годов В.Ф. Кротовым был предложен [38, 39, 40] подход к решению задач оптимального управления, заключающийся в замене исходной задачи на более широкую так, чтобы ее решение удовлетворяло отброшенным связям. Этот подход привел к созданию общей теории достаточных условий оптимальности управляемых систем и формулировке общего принципа расширения в задачах управления. В рамках этого направления были предложены общие методы анализа, присущие только нелинейным системам управления оптимальных скользящих режимов, решен ряд важных прикладных задач динамики управляемого полета, управления экологическими системами и другие. Существенный вклад в развитие этого направления исследований внесли работы М.М. Хрусталева [56] по обоснованию необходимости условий Кротова. Связь между функциями Кротова и Беллмана отмечена в [24].
Каждый из перечисленных подходов использует посылки и конструкции, которые определяют, а иногда и ограничивают область его применения. Это априорное предположение гладкости функции Беллмана в [17], неопределенность с выбором вспомогательных
функций в методе Кротова [39] и необходимость решать семейство задач программного оптимального управления с произвольными начальными значениями траектории и проверка ¿-непрерывности поля в теории поля экстремалей [4б, 20].
Среди различных принципов управления в последнее время внимание специалистов все чаще привлекает один, в котором используются управляющие воздействия в виде разрывных функций фазовых координат и внешних воздействий. В ряде случаев [49, 50], именно за счет разрывности обратных связей удается получить максимальный эффект от использования средств автоматики, в том числе и оптимальность.
Исследование систем с разрывными управлениями в большинстве случаев осуществляется на основе развитого в работах А. А. Андронова и его школы метода фазового пространства [2]. Фазовые представления движения предполагают, что состояние системы характеризуется положением изображающей точки в фазовом пространстве системы. По виду траекторий изображающей точки можно судить о свойствах рассматриваемой динамической системы. Более того, выбирая соответствующим образом управляющие воздействия, можно так трансформировать фазовые траектории, чтобы наделить их желаемыми свойствами, например устойчивостью.
Задача синтеза в системах с разрывными управляющими воздействиями обычно сводится в выбору поверхностей в фазовом пространстве, на которых функции управления претерпевают разрывы. При выполнении определенных соотношений в таких системах может возникнуть специфический вид движений - так называемый скользящий режим. Скользящий режим, например, может возникнуть, если в окрестности поверхности разрыва управления фазовые скорости направлены навстречу друг другу (рис. 1). В силу этого после
Рис. 2
попадания на поверхность разрыва изображающая точка не может в течение любого, даже сколь угодно малого, но конечного интервала времени двигаться вне поверхности. Действительно, при любом сходе точки с поверхности разрыва всегда возникает движение, возвращающее изображающую точку на эту поверхность. Следовательно, изображающая точка может двигаться лишь по поверхности разрыва; это движение принято называть скользящим движением (режимом). В реальных системах устройства, осуществляющие скачкообразные изменение функции управления на поверхности разрыва, всегда обладают малыми неидеальностями ( типа запаздывание, гистерезис и т. д.). При возникновении описанной выше ситуации наличие неидеальностей приведет к тому, что переключения управляющего воздействия будут происходить с конечной частотой, а изображающая точка будет совершать колебания в некоторой малой окрестности поверхности разрыва (рис. 2). Поэтому такое движение можно разделить на две фазы - фазу "быстрых" движений к поверхности разрыва и фазу "медленных" движений по поверхности в скользящем режиме. Стоит отметить, что сама концепция двухфазного движения имеет аналог в природе и технике. Например, она отражает последовательность действий человека, берущего небольшой предмет. В этом целеноправленном двигательном акте рука человека совершает быстрое движение в окрестность предмета и более медленное и точное движение к самому предмету. Аналогичные движения совершает в процессе работы и схват манипулятора.
Скользящие режимы обладают рядом привлекательных свойств, благодаря которым они давно уже применяются при решении различных задач автоматического управления. За счет их использования можно уменьшить размерность рассматриваемой системы, обеспечить
нечувствительность к возмущениям и устойчивость системы [50]. В ряде случаев именно во время движения в скользящем режиме реализуется оптимальное управление, доставляющее минимум функционалу, который характеризует качество управляемого процесса [23, 38].
Наиболее полно возможности скользящих движений были выявлены и использованы в работах по теории систем с переменной структурой [25-27, 63-65]. Высокие динамические показатели систем с переменной структурой удается получить на основе следующего подхода. Предполагается, что система состоит из нескольких непрерывных подсистем, называемых в дальнейшем структурами, причем каждая из них может оказаться и неприемлемой с точки зрения качества процесса управления, например, неустойчивой. Задача синтеза управляющего устройства состоит в выборе параметров этих структур и такой последовательности их изменения, чтобы в системе удалось сохранить полезные свойства имеющихся структур, а в ряде случаев получить эффекты, не присущие любой из них. В моменты изменения структуры правые части дифференциальных уравнений, описывающих движение фазовой точки, претерпевают разрывы на некоторых поверхностях в фазовом пространстве системы. Поэтому в системах с переменной структурой возможно возникновение скользящих движений. Преднамеренное введение в систему скользящих режимов и лежит в основе большого числа алгоритмов управления в этом классе систем.
В рамках теории систем с переменной структурой, где неявно предполагается разделение движения на "медленные" и "быстрые", задачи об оптимизации каждого движения (фазы) и в целом обычно не ставились. К числу исключений можно отнести задачи типа слежения [37] и задачу с квадратичным критерием
качества [42, 36, 14]. В диссертации изложена концепция двухфазного быстродействия и на примере системы дифференциальных уравнений второго порядка, подробно изложена ее реализация для всех возможных корней характеристического уравнения.
Новым в проблеме синтеза можно считать предлагаемое в диссертационной работе обобщение принципа максимума Л.С.Понтрягина [46] на класс позиционных управлений (функций фазового состояния и времени [37]). Переход от программных управлений к позиционным не тривиален. В методологическом отношении он требует изменения постановки задачи. В техническом - использования общей теории дифференциальных уравнений с разрывными правыми частями, иной методики игольчатого варьирования управления, малого варьирования поверхности разрыва и представления главных членов приращения функционала. На последнем этапе естественно возникает система линейных дифференциальных уравнений с частными производными для сопряженных функций и условие их непрерывности на поверхностях разрывов управления. В данной работе получены необходимые условия оптимальности для позиционного управления в форме обобщенного принципа максимума.
Необходимые условия оптимальности сводят нахождение оптимального позиционного управления к решению задачи Коши для системы уравнений с частными производными типа Гамильтона-Якоби. Она значительно упрощается, если искомое управление кусочно постоянно. Для некоторых классов задач данное обстоятельство может привести к созданию эффективных аналитических и численных процедур синтеза управления. Некоторые из таких классов рассмотрены в примерах.
В простейших случаях синтезирующее управление можно задать некоторым набором параметров. Так , например, принцип максимума
Л.С. Понтрягина сводит задачу управления к краевой для системы обыкновенных дифференциальных уравнений с разрывными, в общем случае, правыми частями. Она может быть преобразована к задачи оптимизации параметров, если доопределить недостающие начальные значения и задать целевую функцию, как невязку оставшихся краевых условий. В данной работе рассматривается задача параметрического синтеза разрывного управления заданной структуры , которую можно трактовать как задачу оптимизации параметров. Для нее получены необходимые условия оптимальности параметров. Такие задачи уже рассматривались ранее в работах [3, 4, 5 ]. В данной работе оригинальным является способ получения необходимых условий оптимальности, использующий понятие и свойства первых интегралов.
Заключительная часть диссертационной работы посвящена развитию концепции двухфазного быстродействия, имеющей целью обеспечение минимальности времени переходного процесса в сочетании с устойчивостью системы в окрестности точки покоя. На первой фазе строится синтезированное управление, переводящее систему из произвольного фиксированного начального состояния на заданное терминальное множество (кривую строгой скольжения) за минимальное время. На второй фазе находится оптимальная кривая строго скольжения, по которой за минимальное время с помощью синтезированного управления в скользящем режиме осуществляется перевод системы из произвольной точки кривой в конечное состояние. Рассматривается подробно построение синтезирующего управления для стационарной системы линейных дифференциальных уравнений второго порядка.
Диссертация состоит из трех глав. В первой главе рассматривается доказательство аналога принципа максимума Л.С.Понтрягина в классе позиционных управлений. В качестве
объекта исследования выбрана относительно простая задача терминального управления со свободным правым концом траектории