Стабилизация программных движений управляемых динамических систем при наличии ограничений на структуру управлений и погрешностей в информации о параметрах системы тема автореферата и диссертации по механике, 01.02.01 ВАК РФ

Юрков, Александр Васильевич АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Санкт-Петербург МЕСТО ЗАЩИТЫ
2001 ГОД ЗАЩИТЫ
   
01.02.01 КОД ВАК РФ
Диссертация по механике на тему «Стабилизация программных движений управляемых динамических систем при наличии ограничений на структуру управлений и погрешностей в информации о параметрах системы»
 
 
Содержание диссертации автор исследовательской работы: доктора физико-математических наук, Юрков, Александр Васильевич

ВВЕДЕНИЕ.

§ 1. Постановка задач.1В

§ 2. Описание методов.

§ 3. Непрерывные управления.

§ 4. Дискретные управления.

§ 5. Погрешности в информации о параметрах системы.

§ 6. Стабилизация по части переменных и непрямое регулирование.

§ 7. Результаты в приложениях.

1. Электромеханические системы, описываемые уравнениями Лагранжа второго рода.

2. Твердое тело с неподвижной точкой, управляемое приложенным к нему моментом сил.

3. Твердое тело, управляемое установленными на нем маховиками.

4. Твердое тело, управляемое установленными на нем спаренными двухстепенными силовыми гироскопами (гиродинами).

5. Твердое тело, управляемое установленными на нем спаренными трехстепенными силовыми гироскопами в конирующем подвесе.

 
Введение диссертация по механике, на тему "Стабилизация программных движений управляемых динамических систем при наличии ограничений на структуру управлений и погрешностей в информации о параметрах системы"

В диссертации изложены полученные автором результаты в задаче стабилизации программных движений управляемых динамических систем. Задача в общих словах состоит в выборе управлений, обеспечивающих за ограниченное время требуемую точность выполнения программного (т.е. желаемого) движения. Особенностью работы является развитие математической теории, обеспечивающей решение задачи стабилизации при наличии диктуемых практикой ограничений на структуру управлений и информацию о параметрах системы и действующих на нее возмущающих силах.

Излагаемая в работе методика позволяет в рамках единого подхода строить непрерывные и различного рода дискретные (шаговые, релейные, импульсные) стабилизирующие управления. Предполагается, что конструктивные параметры управляемой системы, включая параметры управляющих органов и измерительных устройств, известны неточно: заданы лишь необязательно малые диапазоны изменения этих параметров.

В диссертации указаны многопараметрические семейства стабилизирующих («в большом») управлений для следующих классов управляемых динамических систем:

• твердое тело с неподвижной точкой, управляемое приложенным к нему моментом сил, формируемым на основе информации об угловом положении и угловой скорости тела относительно жестко связанной с телом системы координат;

• твердое тело, управляемое маховиками и силовыми гироскопами; в этом случае дополнительно используется информация о движении маховиков и гироскопов относительно тела;

• системы, описываемые уравнениями Лагранжа второго рода, у которых управлениями являются обобщенные силы, формируемые на основе информации об обобщенных координатах и обобщенных скоростях системы;

• линейные по управлению системы, описываемые системами обыкновенных дифференциальных уравнений первого порядка вида в которых нелинейности и определяемые погрешностями величины принадлежат линейной оболочке столбцов матрицы коэффициентов при управлении. Эти системы выбраны как объект, на примере которого излагается суть разработанной методики решения задач стабилизации. В связи с этим для простоты изложения для таких систем предполагается, что система линейного приближения в окрестности программного движения х = A(t)x + B(t)u может быть сделана экспоненциально устойчивой выбором линейного управления u=M(t)x. Все результаты, полученные для указанных систем при некоторых предположениях справедливы и для общего случая, охватывающего все рассматриваемые в работе динамические системы, - квазилинейных систем иерархической структуры: xt = 4(0x^(0 + +[El+Pi(t,x)]CuJ/)xM +yrt(t,x,p) | к где х; - ni -мерный подвектор вектора фазовых переменных х, i=l.k, -п\ причем 1 хк+1-и - управление; At(t)x, Bi (t), С (t) - известные ограниченные матрицы соответствующих размерностей; Е{- единичные матрицы; Py{t,x) и Р^,х) - матрицы погрешностей; ц/^,х,р) - векторы нелинейностей. Для таких систем требуется, чтобы подсистемы х(. = Al(t)xi + Bi{t)ui были стабилизируемыми, а матрицы CiM{t) и погрешности Py{t,x) и Pt(t,x) удовлетворяли некоторым дополнительным условиям.

Анализируемые классы систем широко исследованы в специальной литературе.

При этом обнаруживаются различные подходы к самому понятию стабилизации движения [19, 21, 31, 69, 75, 76, 82, 88, 93, 95, 105, 125, 126, 129, 130]. В самом общем виде оно может рассматриваться как обеспечение устойчивости программного движения в том или ином смысле. Например, в классической постановке [31] при управлениях непрерывного типа под стабилизацией понимается обеспечение экспоненциальной устойчивости программного движения.

Автор придерживается следующей общей постановки задачи стабилизации, которая в дальнейшем будет конкретизирована применительно к изучаемым классам управляемых динамических систем. Пусть имеется управляемая система, состояние которой в каждый момент времени полностью определяется вектором фазовых переменных х. Такими переменными могут быть, например, обобщенные координаты и обобщенные скорости. Под движением системы при данном управлении будем понимать решение х = x(t,x0,t0)системы уравнений, описывающих ее поведение (х0 - начальное состояние системы). В случае, когда в качестве фазовых переменных выбраны обобщенные координаты и обобщенные скорости q, q, движение системы будет характеризоваться парой (q,q), где q = q(t,q0,q0,t0) - соответствующее начальному состоянию (q0,q0) решение системы уравнений Лагранжа второго рода, замкнутой выбранным управлением.

Пусть хр (t) обозначает программное движение системы. Это движение может быть задано явно как некоторая вектор-функция времени. Однако в практических задачах чаще программное движение определяется неявно посредством ряда предъявляемых к нему требований и для нахождения функции х (t) требуется решить самостоятельную, порой достаточно сложную, задачу [39, 119].

Пусть Gs обозначает заданную ограниченную окрестность начальной точки программного движения, например, шар радиуса S с центром в точке xp(t(]): Gs = {х: [jx - хр (70 )|| < 5}; Ge - заданную ограниченную £-трубку программного движения, например, Gs = {х : ||jc — jc^ )|j < e,t е R+}; и - вектор управлений, которыми мы можем воздействовать на систему. Обычно предполагается, что размерность вектора управлений не больше размерности фазового вектора.

Задача стабилизации программного движения управляемой системы состоит в выборе управлений, при которых любые движения системы, начинающееся в окрестности Gg программного движения, за ограниченное время попадают в окрестность G,, этого движения и в дальнейшем там остаются. Другими словами, в данной формулировке задача состоит в выборе закона управления, обеспечивающего за ограниченное время требуемую точность выполнения системой программного движения для любых начальных состояний из заданного множества. Управления, которые решают сформулированную задачу, будем называть стабилизирующими.

Приведенная выше формулировка задачи дана в работе [105] и рассматривалась в дальнейшем в работах [113-117]. Эта постановка имеет ряд важных, в первую очередь с точки зрения практики, достоинств: не предполагается малость начальной и целевой окрестностей программного движения - они могут быть любыми наперед заданными ограниченными; не требуется обеспечить полезное, но вместе с тем весьма жесткое свойство экспоненциальной устойчивости; не требуется даже, чтобы программное движение при допустимых управлениях было физически реализуемо, т.е. чтобы оно было решением замкнутой системы при каком-либо из допустимых управлений - важно, чтобы система совершала достаточно близкие к программному движения. Конечно, для того, чтобы задача стабилизации имела смысл, программное движение должно быть реализуемо при каком-то управлении, возможно не являющемся допустимым.

Принятая постановка задачи стабилизации допускает без каких-либо существенных изменений изучение случаев, когда в информации о параметрах системы и действующих на нее силах имеются некоторые (не обязательно малые) погрешности, когда есть ограничения на фазовые переменные, структуру и компоненты управления. Последнее обстоятельство важно и с чисто теоретической точки зрения, поскольку позволяет с единых позиций подойти к ранее весьма разнородным задачам стабилизации, например, непрерывной и релейной (см. [31]), которые укладываются в нашу постановку как частные случаи.

Необходимо вместе с тем отметить, что, несмотря на хорошую приспосабливаемость к нуждам практики, рассматриваемая нами постановка задачи все-таки остается абстрактной математической. Прежде всего это связано с рассмотрением бесконечного промежутка времени функционирования системы и не вполне определенного, а лишь ограниченного времени перехода из окрестности в окрестность программного движения. Кроме того, на практике окрестности программного движения задаются не для вектора фазового состояния, а для каждой из его компонент в отдельности, что требует использования не произвольной, а подходящим образом выбранной нормы.

Обеспечение указанных, а также других важных в прикладном отношении требований (например, выбор наилучших в некотором смысле стабилизирующих управлений - см. [8, 50, 55, 128]) можно рассматривать как следующую задачу, один из подходов к решению которой состоит в построении зависящих от параметров стабилизирующих управлений и направленном их переборе. В диссертации мы ограничимся построением многопараметрических семейств стабилизирующих управлений.

Исследования, результаты которых отражены в настоящей диссертации, проводились методами математической теории управления и качественной теории дифференциальных уравнений. При решении задачи стабилизации весьма плодотворным оказался метод функций Ляпунова, развитие которого связано в первую очередь с именами отечественных ученых: В.И. Зубова, Н.Н. Красовского, A.M. Летова, И.Г Малкина, В.М. Матросова, Н.Г. Четаева и др. (см. [23-32, 46, 61, 62, 67, 129]). Автору представляется, что выполненные им исследования лежат в русле идей, характерных для возглавляемой В.И. Зубовым школы, и развивают в первую очередь результаты, полученные Е.Я. Смирновым [32, 105].

Новыми результатами, представленными в диссертации, являются следующие:

• метод анализа перечисленных выше управляемых систем, заключающийся в использовании удачно выбранных функций Ляпунова и построении для них удобных мажорант; этот метод, изложенный на примере линейных по управлению систем, первоначально был разработан для управляемых систем, описываемых уравнениями Лагранжа второго рода, и опубликован в [142-144]. Результаты, полученные для задач стабилизации вращательного движения твердого тела опубликованы в [143, 150, 151];

• методика, позволяющая распространять способы построения стабилизирующих управлений на случай непрямого регулирования; эта методика, основа которой состоит в выделении при необходимости дополнительных стабилизируемых переменных и организации, если необходимо, процесса разгрузки управляющих устройств, изложена в §4, а в §6 применена для решения задач стабилизации вращательного движениям твердого тела с помощью маховиков и гироскопов; конкретные результаты, полученные автором для этих задач, опубликованы в [108-111, 120, 132-135,138];

• методика учета «динамических» погрешностей в информации о параметрах системы, т.е. отклонений от расчетного (без погрешностей) варианта, описываемых собственными дифференциальными уравнениями (при управлении вращательным движением твердого тела с помощью силовых гироскопов к таким погрешностям можно отнести, например, малые упругие деформации элементов подвеса гироскопов); §5 содержит схематичное изложение данной методики, позволяющей за счет выделения из сложного движения исследуемой системы некоторой составляющей его «быстрой» части, определяемой погрешностями, осуществить декомпозицию исследуемой системы, сохранив преемственность в используемом для решения задачи стабилизации математическом аппарате и при увеличении уровня иерархичности исследуемой динамической системы; в §6 показано, как указанная методика работает при необходимости учета различного рода погрешностей в задачах стабилизации вращательного движения твердого тела; результаты, полученные автором для этих задач, опубликованы в [108-111,120, 132-135, 138].

• построение в удобном для приложений виде многопараметрических семейств управлений, в том числе импульсных, которые решают задачу стабилизации при наличии необязательно малых погрешностей в информации о параметрах системы и действующих на нее возмущающих силах; в §4 на примере линейных по управлению систем показано как осуществляется построение импульсных управлений, реализуемых по интегралу от специальным образом выбираемого базового управления, в частности, управлений, организованных по принципу широтно-импульсной модуляции (ШИМ [1]); в §6 построение импульсных стабилизирующих управлений осуществлено для динамических систем, описываемых уравнениями Лагранжа второго рода, и систем, описываемых уравнениями Эйлера-Пуассона; результаты опубликованы в [142-151].

Названные методы развивают, как представляется автору, существенно теорию стабилизации программных движений динамических систем с учетом диктуемых практикой особенностей структуры управлений и получаемой о системе информации, доведя эту теорию до вполне завершенного состояния. Они позволили построить в удобном для приложений виде многопараметрические семейства управлений, в том числе важных в прикладном отношении импульсных, которые решают задачу стабилизации при наличии необязательно малых погрешностей в информации о параметрах системы и действующих на нее силах. Фактически свободные параметры стабилизирующих управлений позволяют решать другие практически важные задачи, такие как выбор наилучших в некотором смысле стабилизирующих управлений, оптимизацию времени перехода в целевую окрестность программного движения и другие.

Хронологически отраженные в диссертации исследования начались с работ, связанных с управлением ориентацией космических аппаратов при помощи силовых гироскопов, в частности, спаренных трехстепенных в конирующих подвесах:

Рис. 1. Кинематическая схема спарки трехстепенных силовых гироскопов в копирующих подвесах.

Спарка состоит из двух идентичных гироузлов. Каждый гироузел образован пятью телами: JJ - внутренняя лира, Т2 - гирокамера, Т3 - ротор, Т4 - малая внешняя лира, Т5 -большая внешняя лира. Роторы гироузлов вращаются с постоянными одинаковыми по величине и противоположными по направлению в начальный момент времени скоростями, так что начальный суммарный кинетический момент спарки нулевой. Повороты больших и малых внешних лир гироузлов спарки синхронизированы в противоположных направлениях при помощи колес и гибких стальных лент. Это дает возможность, поворачивая только большие или только малые лиры гироузлов обеспечивать изменение кинетического момента спарки вдоль фиксированных в носителе осей. При этом обеспечивается многократное усиление прикладываемого к ним вращающего момента за счет энергии предварительно раскрученных роторов.

Использование силовых гироскопических устройств (СГУ) для целей управления ориентацией космических аппаратов сулило и по-прежнему оставляет многообещающие перспективы в связи с возможностями высокоточного регулирования кинетического момента, малым энергопотреблением, габаритами и весом [16, 40, 59, 92, 155]. Вместе с тем при использовании СГУ на этапе разработки системы управления вращательным движением носителя исследователю приходится столкнуться с целым «букетом» задач, которые в общих чертах описаны выше и будут подробно сформулированы в § 1. Именно, управление при помощи описанных СГУ предполагает:

• непрямое регулирование и стабилизацию по части переменных, когда желаемое воздействие гироскопов на носитель должно быть обеспечено надлежащим управлением поворотами гирокамер СГУ;

• ограничения в изменении кинетического момента СГУ, обусловленные невозможностью произвольных поворотов гирокамер («упоры» ограничивают повороты больших и малых лир);

• импульсный характер воздействия на СГУ шаговых двигателей приводов гирокамер;

• непостоянство скоростей собственного вращения роторов гироскопов, обусловленное конструктивными особенностями асинхронных двигателей постоянного тока, приводящих их движение;

• учет конструктивной «расцентровки» больших и малых лир подвеса, приводящая к погрешностям СГУ как инструментов управления (инструментальным погрешностям);

• малые упругие деформации элементов подвеса гироскопов;

• неточности изготовления, сборки, установки СГУ в носителе и др.

Необходимо отметить также, что хотя описанные выше задачи стабилизации схожи по постановке и используемым для решения методам (метод функций Ляпунова) с классическими задачами обеспечения устойчивости программных движений, они не укладываются в последние, отличаясь в первую очередь нелокальным характером. По-существу, это другие задачи, которые до конца 70-х годов не имели приемлемого теоретического решения.

Как и многие другие задачи, связанные с управлением движением механических систем, исторически первыми задачи стабилизации формулировались и решались применительно к управлению движением космических аппаратов. Проблемная в начале 70-х годов [57], задача построения прикладываемых к носителю внешних управляющих моментов, обеспечивающих заданное вращательное движение носителя, благодаря усилиям российских математиков среди которых В.И.Зубов, А.М.Летов, Б.В.Раушенбах, Е.Я.Смирнов, Е.Н.Токарь и другие к началу 80-х годов, была в основном решена. Из работ названных авторов выделим работы В.И.Зубова [31, 24, 32] и развивающие его работы Е.Я.Смирнова [101-106]. В этих работах на основе метода функций Ляпунова [61] построены управления, обеспечивающие решение поставленной задачи в «большом». В работах Е.Я.Смирнова, кроме того, решены вопросы синтеза управлений, обеспечивающих решение задачи стабилизации заданной ориентации твердого тела в условиях неопределенности, когда тензор инерции тела и приложенные к нему внешние управляющие моменты известны лишь с некоторой необязательно малой ограниченной погрешностью.

Необходимые для управления вращательным движением носителя вращающие моменты могут создаваться внешними управляющими органами (реактивными двигателями, магнитными катушками) или содержащимися в носителе приборами управления (инерционными маховиками и силовыми гироскопами). Оставляя в стороне вопрос о целесообразности использования магнитных катушек в рассматриваемых задачах [22], отметим, что управление вращательным движением при помощи реактивных двигателей связано с расходом рабочего тела. Кроме того, реактивные двигатели как правило реализуют управляющие моменты релейного типа и, следовательно, имеют ограниченные возможности с точки зрения точности ориентации. Эти обстоятельства делают целесообразным в соответствующих случаях непрямое регулирование вращательного движения твердого тела, когда необходимые управляющие моменты создаются при помощи содержащихся в носителе вращающихся маховиков или гироскопов, которые обладают преимуществами с точки зрения габаритов, веса, потребляемой энергии [92]. Принципиальный ответ на вопросы, связанные с непрямым регулированием дает работа В.И.Зубова [24], в которой указана аналитическая конструкция закона регулирования, осуществляющего управление вращательным движением твердого тела при непрямом регулировании. Непрямое регулирование в тех или иных аспектах рассматривается также в работах [2, 4, 17, 18, 22, 26, 31-34, 50-52, 70, 73, 79, 92-95].

Инерционные маховики как органы управления наиболее просты из систем, содержащих вращательные массы поэтому достаточно хорошо изучены [2, 4, 18, 22, 31, 32, 50-52, 57, 92, 98]. Они могут быть использованы как для активного управления вращательным движением носителя, так и для пассивной стабилизации. Вместе с тем, они обладают рядом существенных недостатков: большой энергоемкостью при сравнительно небольшом быстродействии, большими габаритами, весом и как следствие, сравнительно небольшой [16] точностью обеспечения заданной ориентации носителя.

Среди систем управления ориентацией с использованием вращающихся масс весьма перспективными считаются системы, содержащие двухстепенные и трехстепенные силовые гироскопы: спаренные и неспаренные [16, 40, 59, 70, 79, 92, 100, 127, 155]. Спарка гироскопов представляет собой пару идентичных гироскопов, повороты гирокамер которых синхронизированы в противоположных направлениях при помощи механической связи, например, гибких стальных лент, а роторы закручены в противоположных направлениях с постоянными одинаковыми по величине и противоположными по направлению в начальный момент времени скоростями. Спарки двухстепенных или трехстепенных силовых гироскопов обладают существенными преимуществами перед инерциальными маховиками: они обеспечивают многократное усиление прикладываемого к ним вращающего момента так, что для создания необходимого для обеспечения ориентации носителя управляющего момента моно использовать приборы, имеющие меньший вес, габариты, большее быстродействие и что, немаловажно, дающие значительную экономию энергии по сравнению с маховиками [16, 40, 92, 155]. Конечно, законы управления гироскопами сложнее, чем маховиками, однако это обстоятельство несколько компенсируется за счет использования в спарках противоположно ориентированных гиророторов и наличия в контуре управления бортовой ЭВМ. Трудности же связанные с синхронизацией поворотов гирокамер трехстепенных гироскопов устраняются при использование подвесов «конирующего» [16, 40, 59, 155] типа. Указанные качества спарок гироскопов при использовании их в системах управления вращательным движением носителя приводят к возможности значительно [16, 40, 155] повысить точность ориентации.

Если вес системы не принимать во внимание, то конструкция из трех спарок двухстепенных силовых гироскопов, действующих по трем взаимно ортогональным осям, обеспечивает, по видимому [16], наилучшие рабочие характеристики, присущие системам гироскопических стабилизаторов. Система, состоящая из двух спарок трехстепенных силовых гироскопов, обеспечивающих управление по трем взаимно ортогональным осям, обладает по сравнению с предыдущей меньшим весом, габаритами, энергоемкостью и позволяют про одной из осей использовать сразу две спарки гироскопов, однако, более сложна в управлении.

Весьма привлекательными с точки зрения технической простоты и веса конструкции являются системы управления вращательным движением космических аппаратов, построенные на неспаренных двухстепенных силовых гироскопах - гиродинах [33, 34, 92, 100]. Однако, наличие так называемых особых взаимных положений гиродинов, в которых изменение суммарного кинетического момента системы в некоторых направлениях оказывается невозможным, делает их весьма сложными в управлении.

Вопрос управления ориентацией носителя при помощи указанных гироскопических систем в аспекте построения прикладываемых к гироскопам управлений, обеспечивающих заданное вращательное движение носителя долгое время оставался малоисследованным. Об этом свидетельствовали не только отсутствие в периодической печати соответствующих публикаций (причиной данного факта была «закрытость» соответствующих исследований), но и освещавшиеся в прессе проблемы с управлением ориентацией станции «Мир». Еще менее исследованным был вопрос о синтезе прикладываемых к спаренным гирокопам управлений, которые обеспечивали бы решение задачи динамической ориентации при наличии погрешностей в изготовлении носителя, гироскопов и установке гироскопов относительно носителя, а также инструментальных погрешностей спарок гироскопов, т.е. погрешностей в изготовлении этих устройств, приводящих к погрешностям их как устройств управления.1

Первые подходы к решению задач управления вращательным движением космических аппаратов при помощи СГУ заключались в изучении систем линейного приближения в окрестности программных движений, см., например, [106].

Автором в кандидатской диссертации [134] были рассмотрены и решены в нелинейной постановке вопросы управления ориентацией твердого тела при помощи двух-и трехстепенных силовых гироскопов, а также дан способ учета различного рода погрешностей в изготовлении носителя, гироскопов и установке последних относительно Ниже в § 1 подробно описываются возможные инструментальные погрешности, учитываемые автором в его исследованиях. носителя. Ключевую роль при этом сыграли использование удобных функций Ляпунова, предложенных Е.Я. Смирновым [105], и декомпозиция исследуемых систем за счет удачного выделения из сложного движения системы некоторой составляющей его быстрой части, определяемой инструментальными погрешностями.

Дальнейшие исследования, проводившиеся в лаборатории проф. Е.Я. Смирнова с участием автора настоящей диссертации, позволили в значительной мере - но не окончательно - закрыть проблему, дав решения задачи стабилизации при помощи непрерывных и различного рода дискретных управлений для динамических систем, описываемых уравнениями Лагранжа второго рода и уравнениями Эйлера-Пуассона. В приложениях это было выполнено прежде всего для задач управления динамической ориентацией космических аппаратов при помощи силовых гироскопов и маховиков. Результаты исследований нашли отражение в монографии [117].

В указанной работе, в частности, дан способ построения импульсных стабилизирующих управлений, реализуемых по интегралу от специальным образом выбираемых - т.н. базовых - управлений. Однако этот способ дал положительный результат только для расчетного (без погрешностей в информации о параметрах системы) варианта.

Автору диссертации удалось, изменив методику анализа поведения функций Ляпунова на решениях исследуемых систем, решить вопрос и в случае с погрешностями [143]. Оказалось, к тому же, что найденная методика, заключающаяся в построении мажорант для подходящим образом выбранных функций Ляпунова, достаточно универсальна и позволяет дать единообразное изложение всех ранее полученных в обсуждаемой задаче результатов. Конечно, идея замены изучения поведения функции Ляпунова изучением свойств специальным образом подбираемых для нее мажорант не нова, и данный пример свидетельствует лишь том, что и в нашем случае она хорошо «сработала» после того, как удалось подобрать подходящую для решения задачи функцию Ляпунова и построить удобную для этих целей мажоранту.

Оказалось также, что для различных динамических систем, названных выше, удалось подобрать функции Ляпунова, исследование которых, если отвлечься от технических подробностей, осуществляется единообразно.

Это позволило, не умаляя общности, изложить материал диссертации на примере линейных по управлению динамических систем общего вида (1.1), для которых для определенности предположена возможность построения функции Ляпунова на основе системы линейного приближения. Это же позволяет говорить об оформившейся теории стабилизации управляемых динамических систем в условиях диктуемых практикой ограничений.

Следует отметить, что для рассмотренных в диссертации, вообще говоря, нелинейных систем уравнений Лагранжа второго рода и сугубо нелинейных систем уравнений Эйлера-Пуассона функции Ляпунова подбирались в значительной мере эвристически. Поскольку универсальных способов построения функций Ляпунова для нелинейных систем, как известно [6], нет, предложенные функции также являются одним из результатов. Некоторые рассуждения о способах подбора и построения функций Ляпунова для рассматриваемых задач даны в §§ 6,12 работы [117].

Результаты, включенные в диссертацию, опубликованы в работах автора, в том числе диссертации [117] и учебном пособии [113] (в соавторстве). Они докладывались на многих отечественных и международных конференциях (см. [34, 114, 118, 119, 136, 137, 139-141, 145, 146, 149], в том числе:

• IX и X Международных конференциях по нелинейным колебаниям, (Киев, 1981; Варна, 1984);

• Международной школе по методу функций Ляпунова (Иркутск, 1989);

• IV конференции по дифференциальным уравнениям и их приложениям (Болгария, Руссе, 1989);

• 2 Российско-Китайский симпозиуме по астронавтике. (Самара, 1992);

• Международном симпозиуме по аэрокосмическим системам (Санкт-Петербург, 1992);

• Международном Конгрессе по вычислительным системам и прикладной математике (Санкт-Петербург, 1993);

• Международной конференции "Stability and Control of Transforming Nonlinear Systems. Int. Conference ". (Москва, 1995);

• Международной научно-практической конференции "Дифференциальные уравнения и их применения" (Санкт-Петербург, 1996);

• IV Украинско-Российско-Китайском Симпозиуме по космической науке и технике. (Киев, 1996);

• International conference on systems, signals, control, computers SSCC'98 (Durban, 1998).

Результаты диссертации обсуждались на следующих семинарах:

• Семинаре отдела общей механики Института механики МГУ (рук. акад. А.Ю.Ишлинский) (Москва, 1995),

• Семинаре Московского филиала Института проблем транспорта РАН (рук. акад. В.М.Матросов) (Москва, 1995),

• Семинаре кафедры теоретической и прикладной механики математико-механического факультета СПбГУ (рук. д.ф.м.н. профессор П.Е.Товстик) (Санкт-Петербург, 1995),

• Семинаре кафедры теоретической кибернетики математико-механического факультета СПбГУ (рук. д.ф.м.н., профессор Г.А.Леонов) (Санкт-Петербург, 1997),

• 8 Всероссийском семинаре по управлению движением и навигации летательных аппаратов", Самара, 1997.

Значительная часть работы нашла отражение в специальном курсе «Управление движением механических систем», читавшемся автором совместно с Е.Я. Смирновым в 1980-1989 гг. на факультете прикладной математики - процессов управления Ленинградского государственного университета [112, 113].

Определяя место исследований, результаты которых отражены в диссертации, необходимо отметить следующее. Предметом исследований являются сугубо нелинейные управляемые динамические системы и квазилинейные системы иерархической структуры, линейные по управлению, покрывающие весьма представительный класс управляемых электромеханических систем. К исследуемым системам не применяются методы линеаризации или усреднения [74]. В задачах стабилизации речь идет об активном управлении при возможных больших (ограниченных) начальных отклонениях от программного движения, а не о пассивной стабилизации в малом [22, 20, 44, 47, 66]. В приложениях, связанных управлением вращательным движением твердого тела с помощью вращающихся масс, рассматриваются силовые, а не измерительные гироскопы [9-12, 15, 3538, 42, 43, 45, 53, 58, 72, 80, 81, 99, 121, 164]. Конструируемые управления являются модальными и не используют принципа самонастройки [5, 49].

Изложение материала диссертации подчинено следующей схеме: в § 1 даны постановки задач, результаты решения которых сведены в диссертации. Второй параграф посвящен описанию методов решения задачи стабилизации и предложенных для этой цели функций Ляпунова. В §§3-6 на примере линейных по управлению динамических систем изложена разработанная автором теория построения непрерывных и различного рода дискретных (шаговых, релейных, импульсных) стабилизирующих управлений. § 7 содержит изложение результатов, полученных автором с использованием этой теории в приложениях: управлении вращательным движением твердого тела и управлении движением электромеханических систем, описываемых уравнениями Лагранжа второго рода. Основное

17 внимание при изложении материала диссертации уделено ключевым моментам работы. Технические подробности, чтобы не загромождать изложения, как правило, опускаются. Однако при этом всегда дается ссылка на публикацию автора, где для изложенного схематично вопроса приведены подробные рассуждения.

В приложении в удобной для анализа форме дан вывод уравнений исследуемых в диссертации управляемых динамических систем, представляющих собой твердое тело с маховиками и силовыми гироскопами; выведены уравнения, описывающие изменение переменных типа параметров Родрига-Гамильтона, используемых для описания взаимного расположения ориентируемых и опорных осей в задачах стабилизации вращательного движения твердого тела; доказан ряд вспомогательных утверждений.

§ 1. ПОСТАНОВКА ЗАДАЧ

Пусть имеется управляемая система, движение которой описывается линейной по управлению системой обыкновенных дифференциальных уравнений y = F(t,y,p) + H(t,y,p)u , (1) где у g R" - фазовый вектор системы, и &U czRr - вектор управлений непрерывного или дискретного типа, р е Р <= R'" - вектор погрешностей, характеризующий неполноту знания конструктивных параметров объекта управления и законов среды, в которой происходит его движение; t eR+ =\t:t>- время, t0 - начальный момент времени. Предположения о правых частях уравнений (1) и погрешностях будут описаны ниже, а допустимые классы управлений U - в конце параграфа.

Программным движением системы (1) назовем вектор-функцию yp(t), заданную при Vt е R+, непрерывно дифференцируемую и ограниченную вместе с производной. Пусть Gs обозначает ограниченную окрестность начальной точки программного движения, a G. -ограниченную s -трубку этого движения. Эти множества могут быть заданы, например, соотношениями:

Gs = {у: \\у - Ур (0|| ^ , Ge = : ||j/ - (0|| < f, teR+} (2) где S, s - заданные положительные числа (0 < s < 8).

Задача стабилизации программного движения системы (1) состоит в выборе управлений u-u(t,y), при которых любые движения этой системы, начинающиеся в окрестности Ge, за ограниченное время попадают в окрестность Gs ив дальнейшем там остаются. Другими словами, задача состоит в обеспечении за ограниченное время требуемой точности выполнения системой программного движения для любых начальных состояний из заданной ограниченной окрестности начальной точки программного движения. Отметим, что поиск стабилизирующих управлений может ограничиваться допустимыми классами U, и эти управления должны решать сформулированную задачу независимо от конкретных реализаций погрешностей из заданных диапазонов.

Опишем условия, которые мы будем предполагать выполненными при рассмотрении динамических систем вида (1). Не умаляя общности, можно считать, что у (t) = 0. В самом деле, достаточно рассмотреть систему в отклонениях х = у-yp(t) х = f(t, х, р) + h(t, х, р) [и - ир СUP)], (3) ^ где f(t,x,p) = F{t,x + yp(t),p)-F(t,yp(t),p), h(t,x,p)=H(t,x + yp(t),p), fс<у, (pb ff^ p) + [ - WЦ у,/}] a up(t,p) - "управление", при котором программное движение ур(/) является решением системы (1):

Предполагается, естественно, что такую функцию ир (t, р) можно найти, т.е. последнее соотношение как система линейных относительно и алгебраических уравнений разрешима. Слово «управление» мы взяли в кавычки, поскольку в его выражение входят неизвестные нам погрешности р и эта функция, вообще говоря, не может быть реализована.

Для начальной и целевой окрестностей программного движения в отклоненных переменных сохраним обозначения Gs и Ge , т.е. в дальнейшем будем полагать

Отметим, что множество Ge в отклоненных переменных не зависит от времени.

Решение задачи стабилизации мы осуществим с использованием прямого метода Ляпунова, т.е. будем подбирать подходящие функции и с их помощью оценивать поведение решений исследуемых динамических систем, замкнутых конструируемыми управлениями. Для названных во введении систем, описываемых уравнениями Лагранжа второго рода и уравнениями Эйлера-Пуассона, подходящие функции Ляпунова будут нами указаны - и это один из результатов диссертации.

Для систем общего вида (1), как известно, нет универсальных способов построения функций Ляпунова, и - занимаясь задачей управления - мы не ставим целью рассмотрение связанных с этим вопросов в настоящей работе. Некоторые соображения, касающиеся различных способов построения функций Ляпунова, можно найти в работах [6, 31, 88, 105]. В связи со сказанным, при решении задачи стабилизации в отношении системы (1) будем предполагать, что выполнены некоторые условия, гарантирующие возможность построения для нее функций Ляпунова.

Мы будем предполагать, что система (3) стабилизируема по линейному приближению, то есть существует вещественная непрерывная и ограниченная матрица M(t) такая, что управление и = M(t)x делает систему линейного приближения для (3) х- Ах + Ви экспоненциально устойчивой. Суть методики решения задачи стабилизации мы изложим для ситуации, когда нелинейности и определяемые погрешностями величины принадлежат линейной оболочке столбцов матрицы коэффициентов при управлении. Объединив их в вектор уг = y/(t,x,p), систему в отклонениях для этого случая запишем в виде у р (0 = F(t, ур (0, р) + H{t, ур (0, р)ир (t, р)

4)

Относительно параметров системы (5) мы будем предполагать, что А((), B(t), и up(t) являются вещественными непрерывными и ограниченными функциями, a y/(t,x,p) непрерывна по t, х и р и ограничена как функция времени. В некоторых случаях будем требовать также непрерывности и ограниченности матрицы B(t).

Для погрешностей р мы будем рассматривать две ситуации. В первой множество Р возможных значений вектор-функций р = pit, х) ограничено и известны диапазоны их возможных значений. Во второй - более общей - ситуации вектор р имеет структуру р- col(px, р2, р2), где символом рх обозначены не зависящие от времени погрешности с априорными оценками диапазонов их возможных значений, а символом р2 «динамические» погрешности, описываемые дифференциальными уравнениями вида <S(t,x,u,p) = 0. В приложениях к таким погрешностям удобно относить часть фазовых переменных системы, которые по каким-либо причинам затруднительно или нецелесообразно использовать при формировании управления.

Представим вектор цг в виде где индексом р снабжена расчетная, т.е. известная точно часть этого вектора, а индексом п -составляющая, обусловленная погрешностями. В соответствии со сделанными предположениями известный нам вектор у/р = i//p(t,x) является непрерывной функцией своих аргументов, ограниченной как функция времени. Вектор у/п = у/п (t, х, р) непрерывен как функция t, х, р и ограничен как функция времени t. В случае с «динамическими» погрешностями мы будем дополнительно предполагать, что вектор цгп имеет структуру а векторы fn и (рп являются непрерывными по t, х, р}, р2, ограниченными как функции времени и обращаются в нуль при отсутствии погрешностей. Таким образом, в наших предположениях вектор у/ (t,x, р) линейно зависит от р2.

Следует отметить, что предположение о возможности преобразования исходной системы (1) к виду (5) является достаточно жестким и сделано исключительно для простоты изложения материала. Более общим случаем, охватывающим все рассматриваемые в работе динамические системы, является случай квазилинейных систем иерархической структуры, когда исходная система преобразуется к виду:

V = VP+V,

6) у/ „(, X , р) = fn(t,X,pl,p1)+ (р „(t , X , р !, р 2)

7) xt = 4(0^ + В;(0 + +[£i+Pi(t,x)]CiM(t)xM + у/^,х,р)

8) к

Здесь xi - п1 -мерный подвектор вектора фазовых переменных я:, i=l.k, ^ п{ = п ; причем i=i хк+\ = и - управление; At(t)x, Bt (У), С (t) - известные ограниченные матрицы размерностей и;хй;, х г, г х и. соответственно; - единичная матрица порядка г ; Py(t,x) и Pl (t, х) соответственно г х и,, - и ^ х /л - матрицы погрешностей; у/^,х,р) - векторы нелинейностей. В работах [105, 107] рассмотрены линейные системы иерархической структуры и указан способ построения функций Ляпунова для таких систем, в предположении, что подсистемы i, = A,(t)x; + Bi(t)ui являются стабилизируемыми, а матрицы ClM(t) и погрешности Py(t,x) и Р,((,х) удовлетворяют некоторым дополнительным условиям. С использованием этих функций стабилизирующие управления могут быть построены по излагаемой в диссертации методике и для выписанных здесь квазилинейных иерархических систем, но это окажется достаточно громоздко и потому в данной работе мы соответствующее изложение опустим.

Предположение о структуре вектора i//n(t,x,p) не является жестким и, по-существу, вытекает из иного способа записи исходных уравнений, когда часть фазовых переменных рассматривается как «погрешности» и система не разрешена относительно старших производных.

В приложениях часто изучаемые динамические системы описываются линейными по управлению системами дифференциальных уравнений. Таковыми являются и рассматриваемые в настоящей работе системы, математические модели которых суть либо уравнения Лагранжа второго рода, весьма удобные при анализе динамических систем, подчиненных голономным нестационарным связям, в частности, электромеханических систем, либо системы дифференциальных уравнений типа уравнений Эйлера и уравнений Пуассона, которые часто используются при изучении вращательного движения твердого тела. В ряде практически важных случаев, например, в случае твердого тела с маховиками и гироскопами, оказывается полезным использование как тех, так и других уравнений: первых - для описания движения вращающихся масс относительно носителя, а вторых - для описания вращательного движения носителя [117].

Оказывается [7, 128], что по ряду причин (например, простота реализации синтезируемого закона управления) задачу стабилизации программных движений для электромеханических систем или твердого тела с вращающимися массами целесообразно решать с учетом специфики используемых для их описания математических моделей: уравнений Лагранжа второго рода или уравнений Эйлера-Пуассона, и доступной измерению информации о движении системы. В связи с этим сформулируем задачи стабилизации программных движений для каждой из названных динамических систем. Для этих систем конкретизируем также и ситуации, когда информация о параметрах системы и действующих на нее возмущающих силах содержит погрешности. Уравнения Лагранжа второго рода имеют вид [13] с» dq J dq где q = (ql,q2,.,qn)* - вектор-столбец обобщенных координат qt; Q - вектор-столбец обобщенных сил, действующих на систему; Т - кинетическая энергия системы.

Известно, что кинетическая энергия системы есть некоторая функция аргументов t,q,q, причем компоненты вектора q входят в Г со степенью не выше второй. В соответствии с этим запишем кинетическую энергию в виде суммы трех однородных относительно компонент вектора q слагаемых: Т = Т0 + ТХ + Т2 , где Т0, 7|, Т2 имеют вид

T0=T0(t,q)- Tx=H"q; T2 = ^q0q; 0 = 0(t,q) (10)

Мы будем полагать, что Т0,Н,в суть непрерывно дифференцируемые скалярная, векторная и матричная функции аргументов tag, ограниченные вместе со своими частными производными в области R+ xD , где D - любое ограниченное подмножество пространства R", а матрица в, кроме того, имеет ограниченную обратную матрицу, удовлетворяя оценкам с положительными константами &х и <92(i9, < «92) хЕп<в<ЭгЕп (11)

Будем считать, что вектор обобщенных сил состоит из двух слагаемых: вектора управляющих сил Qy , который мы будем выбирать, исходя из определенных соображений, и вектора возмущающих сил Qe, которым мы распоряжаться не можем, т.е. Q = Qy+Qe.

Программное движение для системы (9) определим как пару (г, г), где г = r{t) -заданная «-мерная вектор-функция времени. Мы будем считать, что это ограниченная дважды кусочно непрерывно дифференцируемая функция.

Окрестности Gs и Gs программного движения (г, г) системы (9) определим следующими формулами:

Gs={(q,q):\\q-r(t0)\\<Sq, \\q-f(t0)\\<S4 },

Ge={(q,q):\\q-r(t0)\\<e4, \\q-r(*0)|| < s4 }, где 8q,Sq, sq, sq заданные константы 0 < eq < 6q, 0 < s . < 8 . .

Таким образом, для системы (9) задача стабилизации программного движения (г, г) состоит в выборе вектора Qy, при котором любые решения этой системы, начинающиеся в множестве Gs, за ограниченное время попадают в множество Ge ив дальнейшем его не покидают.

Если ввести новые обобщенные координаты по правилу x = q-r(t), x = q-r(t), то структура уравнений (9) в силу линейности оператора предложенной замены не изменится. При этом в новых переменных кинетическая энергия системы примет вид

Т = 1 (х + r(t))* 9{t, х + r(t)) (i + f(t)) + H* (t, x + r(t))(x + r(t)) + Т0(г,х+ r{t)) = ^x9(t,x)x + H* (t,x)x-\-Ta(t,x), где 9(t,x) = 0(t,x + r(t)),

H{t, x) = H(t,x + r(t)) + 0(t,x + r(t))r(t), 1 ,

T0(t,x) = -r (t)9(t,x+ r(t))f(t) + H (t,x + r(t))r(t) + TQ(t,x + r(t)).

В результате указанной замены изучение поведения решений системы (9) в окрестности программного движения (г,г) сводится к изучению поведения решений преобразованной системы в окрестности программного движения (r(t) = 0, r{t) = 0). Поэтому, если это не оговаривается специально, будем считать, что обобщенные координаты q выбраны таким образом, что программное движение системы определяется соотношением r(t) = 0.

Таким образом, начальная и конечная окрестности программного движения для системы (9) будут в дальнейшем заданы формулами

Gs={{q,q)-.\\q\\<8q, Gt={(q,q): \\q\\<s(l, \\q\\<eq), (12)

В случае, когда параметры исследуемой системы (9) известны с погрешностями, будем полагать, что величины 0,H,To,Qe имеют вид

9 = 9р+9п, H = Hp+Hri Т0 =Т0р +Т0п, Qe=Qep+Qm (13)

Здесь нижним индексом р помечены расчетные (т.е. известные точно) величины, а нижним индексом п - погрешности, на которые истинные величины отличаются от расчетных.

Будем считать, что нам известны верхние оценки величин QnHn,Qen и их частных производных первого порядка, а для матрицы 9, кроме того, - положительные константы ^ и 32 , такие, что 9]Еп <0 < &2Еп .

Уравнения Эйлера, описывающие /ршамику вращательного движения твердого тела жестко связанной с ним системе координат Oxyz, имеют вид

Воз + сох9со = М . (14)

В этих уравнениях в - матрица тензора инерции тела относительно его центра инерции С (эта матрица постоянна и определенно положительна); со - столбец координат вектора со угловой скорости тела относительно инерциального пространства; М - столбец координат главного момента внешних сил, действующих на тело, относительно точки С.

Кинематика вращательного движения твердого тела описывается посредством уравнений, определяющих в системе координат Oxyz движение тройки некомпланарных ортов I; (z =1,2,3) инерциального пространства:

Si =(as-a))xs{ (/ = 1,2,3). (15)

Здесь Sj - координатные представления векторов Sj. в системе координат Oxyz, а cos -столбец координат вектора cos угловой скорости триэдра (т.е. тройки ортов) относительно инерциального пространства. Уравнения (12) обычно называют уравнениями Пуассона. Эти уравнения имеют шесть интегралов движения. Если st суть взаимно ортогональные орты, образующие правую тройку, указанные интегралы имеют вид

16) где 5у - символ Кронекера (5и = 1, ёу = 0 при i Ф j).

Задача стабилизации вращательного движения твердого тела состоит в выборе управлений (в данном случае находящейся в нашем распоряжении составляющей Му момента внешних сил М, приложенных к телу), обеспечивающих за ограниченное время требуемую точность выполнения программного вращения тела по отношению к инерциальному пространству.

Интересуясь вращательным движением тела, конкретизировать характер поступательного движения мы не будем.

В задаче стабилизации вращательного движения твердого тела мы будем рассматривать два типа программных движений. На движениях первого типа требуется, чтобы заданным образом вращались связанные с телом три некомпланарные оси, а на движениях второго типа - одна ось. Определим названные программные движения. Пусть тройка ортов в инерциальном пространстве, вращающаяся с угловой скоростью ^относительно этого пространства, а сг,,<т2,а3- тройка ортов в теле, совместимая с тройкой и вращающаяся с угловой скоростью сда относительно тела. Движение тела, /V 25 на котором = <7; (i = 1,2,3), назовем программным движением 1. Движение тела, на котором Щ- и триэдр сг вращается относительно триэдра ^ с угловой скоростью [За], где Р - заданная скалярная величина, назовем программным движением 2. Орты Jt можно трактовать как векторы, задающие направления на некоторые физические ориентиры, например, звезды, планеты и т.п., а орты сг. - как направляющие векторы осей приборов, измеряющих отклонения от направлений на эти ориентиры. Не умаляя общности, будем считать, что и сг (i -1,2,3) суть правые тройки взаимно ортогональных ортов.

Для того, чтобы формализовать задачи трехосной и одноосной стабилизации вращательного движения твердого тела, введем ряд обозначений. Пусть Os{s2s3, 0(т] сг2сг3 - правые декартовы системы координат с началом в заданной (расчетной) точке О тела, причем O^tjC поступательно движется относительно инерциального пространства, оси системы координат Osts2s3 определяются направляющими ортами ,J2,I}, а оси системы координат Осг^сг2сг3 - направляющими ортами <х,, сг2, сг3. Наряду с векторами как геометрическими объектами будем рассматривать их координатные представления (столбцы) во введенных системах координат. Для обозначения координатных столбцов будем использовать те же символы, что и для соответствующих векторов, но без знака « ». При этом отсутствие в обозначении координатного столбца верхнего дополнительного индекса s, сг или и будет означать, что этот столбец является координатным представлением одноименного вектора в системе координат Oxyz. Например, координатные столбцы si,<Ji,a)s,coa представляют векторы ,сг,as,соа в системе координат Oxyz. Наличие в обозначении столбца верхнего индекса s или сг означает, что этот столбец является координатным представлением одноименного вектора в системе координат Osvs2si или Оала2(тъ соответственно. Например, векторам &>s Д, J2, Jz в системе координат Osxs2s3 соответствуют столбцы координат л 1 0 0

S = &S2 > < = 0 5s = 1 0

0 0 1

Векторам a>s,al,cr2,a3 в системе координат Оаха2огсоответствуют столбцы координат

Г "0" "0"

S ®s = > 'Г = 0 а , а 2 = 1 а , сг j = 0

Лз. 0 0 1

Если координатный столбец снабжен верхним индексом и, то это означает, что этот столбец является координатным представлением одноименного вектора в инерциальной системе координат O^rjC, . Например, столбцы s", , s" представляют векторы ,s2 ,s3 в системе координат .

Обозначим S и 2 матрицы перехода от систем координат Os{ s2s2 и

Ост, сг,о"3 соответственно к системе координат Oxyz, а и Sa и Su - матрицы перехода от системы координат Os, s2s3 к системам координат Ocj] а2сг3 и соответственно.

Очевидно, что S = (sl}s2,s3), Е = (<х,,сг2,ст 3), S = *Z*S = ,s2 ,s3), Su =(s ",s2,s3) матрицы, образованные из координатных столбцов s.,crn ,s" (i = 1,2,3) соответственно.

С помощью введенных обозначений опишем информацию о движении тела и ортов ^, сг, которую мы будем предполагать имеющейся при решении задач стабилизации вращательного движения твердого тела. Будем считать, что столбцы s",ai являются известными вектор-функциями времени, имеющими непрерывные и ограниченные производные до второго порядка включительно. В этих условиях столбцы ofa и оу[ являются непрерывно дифференцируемыми и ограниченными вместе со своими производными вектор-функциями времени. Они могут быть легко вычислены по информации о столбцах ст. и s" соответственно. Мы будем считать, что эти вычисления произведены, так что со" и ofs - известные функции времени. Относительно фигурирующей в определении программного движения 2 скалярной величины J3 будем полагать, что она является заданной непрерывно дифференцируемой и ограниченной вместе со своей производной функцией времени.

Будем считать также доступными измерению проекции ортов Jt на орты oi , т.е. элементы матрицы Sa , и проекции на оси системы координат Oxyz вектора со угловой скорости тела относительно инерциального пространства, т.е. столбец со. Как видно из приведенных описаний, для механической системы, представляющей собой вращающееся твердое тело, мы считаем доступными измерению характеристики движения, которые нельзя рассматривать как обобщенные координаты и скорости. Это является одной из причинено которой использование для описания движения этой системы уравнений Эйлера-Пуассона, а не уравнений Лагранжа второго рода, является предпочтительным.

Учитывая характер доступной информации, задачу стабилизации вращательного движения твердого тела целесообразно формулировать в терминах координатных столбцов системы координат Oxyz. Программное движение 1 в этой системе координат определяется равенствами st = <7. (г = 1,2,3) или, что равносильно, матричным равенством = 1. (17)

Пусть со х - координатный столбец вектора угловой скорости тела относительно инерциального пространства на программном движении 1. Очевидно, что copl = cos - 0)G при si = сг. (i -1,2,3) . Учитывая введенные обозначения, столбцы aos, й)а и со j можно представить в виде со, = Sa% (18)

19)

Формулами (17), (19) программное движение 1 определено однозначно, поскольку в соответствии с сказанным выше 2 = £(£), ofa - (t), su=su(t) - известные функции времени.

Программное движение 2 в системе координат Oxyz определяется равенством = ах. Ясно, что при совпадении первых ортов триэдров si и сг. остальные находятся в одной плоскости и, следовательно, связаны соотношениями s2 = сг2 cos а + сг3 sin a, s3 =сг2 sin а + сг3 cos а, ^Ь^^А где а - угол между соответствующими парами ортов s2,cr2 и s3,ст3. Величина а должна удовлетворять дифференциальному уравнению а = -/?, так как на программном движении 2 триэдр вращается относительно триэдра cri с угловой скоростью -/?сг,. Поскольку по условию /3 - известная функция времени, величина а определяется формулой I a = (t,t0,a°) = a0 - jfi(r)dr, (20) о где а0 - параметр. Таким образом, угловое положение тела по отношению к инерциальному пространству на программном движении 2 с точностью до параметра а0 определяется равенством

10 0

0 cosa -sina . (21)

0 sin a cos а si=®i l j

Обозначим a) z координатный столбец вектора угловой скорости тела относительно инерциального пространства на программном движении 2. Легко убедиться, что й) 2 = соs -ооа + у9сг, при = сг,, т.е. с учетом соотношений (18), (21)

5 = Ща), Г(а) = 5ст аР2 2[Г(а)®;-<] + /Яст1 (22)

Следовательно, вектор-функция сор2 определяется с точностью до параметра а0. Таким образом, программное движение 2 определено неоднозначно, так что имеется однопараметрическое семейство программных движений 2.

Множество вектор-функций сор2, определяемых формулами (20)-(22) при всех а0 е R], будем в дальнейшем обозначать Q,p2. В рассматриваемом нами случае множество

Q.p2 ограничено, поскольку ограниченными по условию являются функции a>ss(t),co°(t),j3(t).

Будем считать, что известны точные верхние границы норм вектор-функций coss{t),co°(t) и модуля функции /?(/), которые обозначим через a>s, соа и /3 соответственно. Определим окрестности программного движения 1 формулами jfJ Ga = Ц > : II® -(ор\<8ш, (s,. - ст. I < st ,i= 1,2, з} (23)

G\ ={«,^,52,^3: lo-tfjJ^, jsf-<ri\\<et,i = 1,2,3, teR*} (24)

Для того, чтобы ввести аналогичные окрестности для программного движения 2, определим расстояние p(co,Qp2) от произвольного столбца а> до множества О. р2, полагая

Р(а,£1р2)= inf \(о-(ор2 .

С помощью введенной метрики окрестности программного движения 2 определим равенствами

G2a ={со ,sl}s2,s3 : p(o),Qp2) - сг, || < Sl} (25)

Gl={a>,sx,s2,s3\ р(о),ар2)<ою, -cxj^, *еЛ+} (26)

В соотношениях (23)-(26) <та,sa,оi,coi - заданные константы (0 < £0> < аю, О < si < ст.).

После сделанных предварительных рассуждений задача трехосной стабилизации вращательного движения твердого тела формулируется следующим образом. Указать приложенный к телу внешний управляющий момент М , при котором любые движения тела, начинающиеся в множестве G\, за ограниченное время попадают в множество G\ ив дальнейшем его не покидают.

Задача одноосной стабилизации вращательного движения твердого тела формулируется аналогично с заменой множеств G]s и Gle на G] и G] соответственно.

Отметим сразу, что решение задачи одноосной стабилизации может быть сведено к решению задачи трехосной стабилизации. Для этого достаточно, зафиксировав какое-либо значение а0 параметра арассмотреть задачу стабилизации программного движения, определяемого равенством <У = Е, где 2 = 2Г(а(?,г0,ог )). Это эквивалентно тому, что в задаче трехосной стабилизации вместо триэдра ст. рассматривается некоторый триэдр j. ((<7j,£72,<т3) = 2), вращающийся относительно тела с угловой скоростью d>a = 0Ja -/frx,. Вместе с тем задача одноосной стабилизации вращательного движения твердого тела имеет некоторую специфику, поэтому мы будем решать ее без сведения к задаче трехосной стабилизации.

Решая сформулированные задачи стабилизации вращательного движения твердого тела, мы будем полагать, что вектор М в уравнениях (14) представляет собой сумму вектора управлений Му и вектора возмущений Мв, которым мы распоряжаться не можем, т.е. M=MV + M„.

У в

В условиях, когда имеются погрешности в информации о тензоре инерции тела и действующих на него возмущающих силах, будем считать, что матрица в и вектор Мв известны с точностью до ограниченных слагаемых, оценки сверху на нормы которых известны, т.е. в = вр+вя,М.=Мщ> + Мя, (27) где нижним индексом р снабжены расчетные (известные точно) величины, а нижним индексом п - величины, обусловленные погрешностями, для которых мы будем полагать известными оценки сверху по норме:

9„\\<&п, \\Мт\\<твп. (28)

Кроме того, будем, как и выше, считать, что в оценках

ЗхЕг <9 < &2Ег, (29) которым удовлетворяет определенно-положительная матрица в, величины Зу,92 известные положительные константы (теперь эти константы имеют смысл оценок снизу и сверху соответственно на минимальный и максимальный моменты инерции тензора 9).

Во многих практически важных задачах требуется стабилизировать лишь часть компонент вектора фазовых переменных [14, 93, 95]. Другие компоненты стабилизировать не нужно, однако они должны удовлетворять некоторым ограничениям, диктуемым физической природой рассматриваемой системы. Так, при управлении вращательным движением твердого тела с помощью маховиков и гироскопов стабилизации подлежат переменные а> и s;, характеризующие угловую скорость и угловое положение носителя относительно инерциального пространства. При этом по конструктивным причинам скорости вращения маховиков относительно носителя не могут быть произвольно большими, а гирокамеры гироскопов не могут, вообще говоря, поворачиваться на произвольный угол. Пусть Ti-y - вектор х1 образован компонентами фазового вектора х, которые требуется стабилизировать, а п2 -вектор х2 - прочими его компонентами. Обозначим через и\и2 векторы, образованные компонентами вектора и, соответствующими компонентами векторов х\х2. Не умаляя общности, будем считать, что стабилизации подлежат первые и, компонент векторах, так что х* = (х1* ,х2*), и = (и* ,и2*).

В рассматриваемой задаче программным движением управляемой системы назовем достаточно гладкую вектор-функцию х]р (t) размерности пх. Введем в рассмотрение окрестности программного движения

Gf = {*' ф1 -^(0||<£(1)}, Gf = {х] rfx1 -Jp(t)\\*em,teR+} и множества

G? = {х2: Цх1! < <У(2)}, Gf > = {х2: ||х2|| < s(2\t&

3<J>,£<J> - заданные константы, 0 < s(f> < 5{j), j = 1,2).

Задача стабилизации движения управляемой системы по части переменных состоит в выборе управлений и таких, чтобы любые движения управляемой системы, начинающиеся в многообразии, на котором х1 е Ggl), за ограниченное время попадали в многообразие, на котором х1 е Gy}, и в дальнейшем там оставались, причем во все время движения выполнялось условие х2 е G(2).

Если для механической системы нет ограничений на выбор управлений и, то сформулированная задача укладывается в рамки поставленной выше задачи стабилизации программных движений управляемых систем. Самостоятельный интерес представляют управляемые системы, для которых при решении задачи стабилизации по части переменных использование управлений и1 является нежелательным. Идеальной для таких систем является ситуация, когда решение задачи стабилизации по части переменных можно осуществить, используя лишь управления и2. Так, в рассмотренном выше примере твердого тела с маховиками и гироскопами нежелательным является использование внешнего управляющего момента, реализуемого реактивными двигателями, поскольку это связано с расходом рабочего тела. Предпочтительным является использование для нужд управления только маховиков или гироскопов, для приведения в движение которых используется сравнительно легко восполнимая электроэнергия [92]. На практике выполнение указанного требования не всегда возможно, поскольку в процессе управления переменными х1 с помощью управлений и2 могут нарушиться ограничения на нестабилизируемые переменные х2. В связи с этим процесс управления разобьем на два режима: основной режим и режим разгрузки. В основном режиме и1 = 0, а вектор и2 используется для стабилизации переменных х1 и, если возможно, для удержания переменных х2 в окрестности G'f. В режиме разгрузки, возникновение которого связано с угрозой нарушения ограничений на нестабилизируемые переменные, помимо задачи стабилизации переменных х1 решается задача обеспечения гарантированного выполнения ограничений для переменных х2, например, задача перевода их в достаточно малую окрестность нуля G(2). В этом режиме используется весь вектор управлений и. Таким образом, под задачей стабилизации по части переменных мы будем понимать следующую задачу.

Задача стабилизации движения управляемой системы по части переменных. Указать управление и и правило чередования основного режима и режима разгрузки такие, чтобы любые движения системы, начинающиеся в многообразии, где х1 е Gg', за ограниченное время попадали в многообразие, где х1 е G(J], и в дальнейшем там оставались, причем во все время движения должно выполняться условие х2 е G{2).

К задачам стабилизации программных движений по части переменных относятся задачи стабилизации вращательного движения твердого тела (носителя) с использованием установленных на нем маховиков или силовых гироскопов. Использование этих устройств в системах управления ориентацией космических аппаратов является актуальной инженерно-технической задачей, поскольку, в отличие от реактивных двигателей, не связано со значительным расходом рабочего тела. Расходующие при своей работе электрическую энергию маховики и силовые гироскопы имеют большие преимущества с точки зрения точности управления движением, габаритов, веса. Управление вращательным движением тела (носителя) при помощи установленных на нем маховиков или гироскопов основано на перераспределении кинетического момента механической системы «носитель управляющие устройства» между составляющими систему телами при изменении кинетического момента несомых тел. Изменение кинетического момента маховика осуществляется за счет ускорения или торможения его; изменение кинетического момента гироскопа - в основном за счет поворотов оси вращения ротора при поворотах гирокамеры в подвесе. Управлениями при этом являются проекции прикладываемых к маховику или гирокамере гироскопа моментов сил на соответствующие оси вращения.

Рассмотрим задачи стабилизации вращательного движения твердого тела с использованием маховиков или двухстепенных силовых гироскопов (гиродинов). Режим управления с использованием только маховиков или гиродинов, т.е. режим, когда внешний управляющий момент не используется, будем рассматривать как основной.

Отметим сразу, что управление вращательным движением только в основном режиме, вообще говоря, невозможно, поскольку имеется ряд причин, ограничивающих возможности изменения кинетического момента систем управляющих устройств, содержащих маховики или гироскопы. Выделим из этих причин следующие: для маховиков - наличие ограничений на максимальную скорость собственного вращения; для спаренных гиродинов - наличие ограничений на угловое положение их гирокамер; для систем неспаренных гиродинов - наличие положений элементов системы, в которых изменение ее кинетического момента в одном или нескольких направлениях невозможно. Указанные причины приводят к необходимости в процессе управления вращательным движением носителя время от времени переходить от основного режима к так называемому режиму разгрузки, когда управляющие устройства под действием приложенных к ним управлений переводятся в положение, из которого они с гарантией могут обеспечивать требуемое изменение своего кинетического момента. Для управления движением носителя и компенсации воздействия на него маховиков или гироскопов в период разгрузки используются внешние управляющие устройства, например, реактивные двигатели, реализующие внешний управляющий момент.

Мы рассмотрим следующие системы управляющих устройств: 5 маховиков и s спарок гиродинов. Под спаркой гиродинов мы понимаем пару двухстепенных гироскопов, повороты гирокамер которых синхронизированы в противоположных направлениях. Спарка гиродинов схематично изображена на рис.2.

Рис.2 Спарка гиродинов

Для того, чтобы конкретизировать, о каких именно управляющих системах будет идти речь, введем понятие расчетного варианта для рассматриваемых управляющих систем и опишем возможные отклонения от этого варианта, которые будем учитывать.

Расчетным для маховика будем считать вариант, при котором маховик является твердым телом, динамически симметричным относительно своей оси вращения. Последнее условие означает, что центр инерции маховика лежит на его оси вращения, ось вращения маховика является главной центральной осью инерции, а поперечные главные центральные моменты инерции маховика равны между собой.

В расчетном для гиродина варианте его гирокамера и ротор являются твердыми телами, причем ротор - расчетный маховик, оси вращения гирокамеры и ротора взаимно ортогональны и пересекаются, центры инерции гирокамеры и ротора совпадают и лежат в точке пересечения осей вращения, оси вращения являются главными центральными для обоих тел, ротор вращается с постоянной по величине расчетной скоростью.

Расчетным для спарки гиродинов является вариант, при котором объединенные в спарку расчетные гиродины идентичны, оси вращения гирокамер параллельны, в поворотах гирокамер, осуществляемых в противоположных направлениях, нет рассогласования, и роторы спарки вращаются с расчетными (постоянными, одинаковыми по величине и противоположными в начальный момент времени) скоростями.

Расчетным для системы управляющих устройств вариантом будем считать такой, при котором образующие систему устройства являются расчетными и расчетным образом установлены относительно носителя. Последнее означает, что маховики или гирокамеры гиродинов вращаются вокруг фиксированных в носителе осей, среди которых есть некомпланарные, при этом начальное расположение осей вращения роторов гиродинов (или, что то же самое, начальное расположение их гирокамер) также фиксировано. Разумеется, в расчетном варианте все интересующие нас характеристики устройств (массовые, геометрические и т.п.) предполагаются известными точно.

Любые отклонения от расчетного варианта в системе управляющих устройств будем называть инструментальными погрешностями, подчеркивая тем самым, что они приводят к погрешностям этих устройств как инструментов управления. К таким погрешностям относятся, в частности, упругие деформации элементов управляющих систем, обусловленные их упругой податливостью; отклонения скоростей собственного вращения роторов гиродинов от расчетных, обусловленные конструктивными особенностями двигателей, приводящих роторы в движение; неточности изготовления элементов управляющих устройств, их сборки, установки относительно носителя и т.д.

Конкретизируем указанные выше причины, ограничивающие возможности изменения кинетического момента рассматриваемых систем управляющих устройств. Пусть cij - величина скорости собственного вращения у-го маховика; - величина угла поворота гирокамер у'-й спарки двухстепенных гироскопов. Мы будем полагать, что в процессе движения должны быть выполнены неравенства: для системы маховиков

5^ (у = 1,2,.5), (30) для системы спаренных гиродинов д]\<д^<71/2 (у = 1,2,.Л) . (31)

В неравенствах (30), (31) величины 5q., Sqj суть известные положительные константы.

Пусть Q обозначает столбец управлений, воздействующих на систему управляющих устройств, а М - внешний управляющий момент, приложенный к носителю.

С учетом сказанного задачи стабилизации вращательного движения твердого тела (носителя) при помощи маховиков или силовых гироскопов могут быть сформулированы следующим образом.

Задача трехосной стабилизации вращательного движения твердого тела с помощью маховиков или гироскопов. Указать управления Q и Му и правило чередования основного и разгрузочного режимов, при которых любые движения носителя, начинающиеся в множестве G\ (23) за ограниченное время попадают в множество G). (24) и в дальнейшем его не покидают, причем в течение всего времени движения выполнены ограничения (30), (31).

Задача одноосной стабилизации вращательного движения твердого тела с помощью маховиков или гироскопов формулируется подобно предыдущей задаче с заменой начального и целевого множеств Gls и G] на множества Gl и G: (25) и (26) соответственно.

Поставленные задачи необходимо решить как в условиях, когда информация о системе «носитель - устройства управления» полная и система управляющих устройств расчетная, так и при наличии различного рода погрешностей: как в информации о носителе и действующих на него силах, так и инструментальных погрешностей управляющих устройств.

Управления, решающие сформулированные выше задачи стабилизации, могут конструироваться как непрерывные функции времени и измеряемых характеристик движения. Вместе с тем, в силу конструктивных особенностей составляющих систему управления частей - измерительных устройств, командных устройств и исполнительных органов - информация между ними может передаваться в дискретные моменты времени и в дискретном виде. Например, измерительные устройства могут снимать информацию об объекте управления и передавать ее командным устройствам в дискретные моменты времени, а исполнительные органы могут реализовывать управления, принимающие значения из некоторых фиксированных дискретных множеств. Таким образом, во многих практически важных ситуациях закон управления, реализуемый конкретными исполнительными устройствами, не может быть адекватно описан при помощи моделей непрерывного типа.

Отсюда возникает необходимость исследования различного рода дискретных моделей управления. Дискретные по времени стабилизирующие управления, реализуемые при дискретном поступлении информации о движении управляемой системы, рассмотрены в [117].

Дискретные по уровню управления являются кусочно-постоянными функциями. В зависимости от того, по какому закону осуществляется переключение с одного дискретного значения управления на другое, дискретные по уровню управления подразделяются на шаговые, релейные, импульсные и другие.

Под шаговым будем понимать такое управление, компоненты которого могут принимать лишь заданные дискретные значения (будем называть их уровнями). Для простоты будем полагать, что уровни кратны некоторым положительным числам hn задающим величину шага дискретности для i-й компоненты управления. Шаговое управление иш определим по некоторому непрерывному управлению и. Пусть иг,и2,.,ипкомпоненты управления и (будем называть его базовым), tf - моменты времени, когда осуществляется изменение значений г'-й компоненты иш управления иш, - значение компоненты иш после N-ro переключения с уровня' на уровень, а - значение этой компоненты до первого переключения. Значения зададим рекуррентными формулами и°ш = > «ш- = иш1 + ksigniu, - и»-1), где п{ - целые числа, удовлетворяющие следующим неравенствам: м1.Ц)/А1.-1/2<и1.<(и1.Ц)/А1. + 1/2 Моменты времени tf зададим как моменты нарушения неравенств yj-u^n + b, (32) где Л,- - некоторые положительные числа. Тогда f Ula ПРЫ t^it^t]), [иШ1 при ts[t, ,/, ) z = l,2,.n; Л/" = 1,2,3,.)

Отметим, что наличие констант Дг. в неравенствах (32) гарантирует на любом множестве

R+xD (D - ограниченное подмножество фазового пространства) отделение от нуля интервала времени между соседними переключениями и, как следствие, выполнение условий существования и единственности решений задачи Коши для замкнутой системы. Ниже для шагового управления иш, построенного описанным способом по непрерывному управлению и, будем использовать обозначение иш = {и). Для задания шагового управления необходимо указать базовое управление и числа Д(.

Релейным управлением будем называть управление вида ирл = к<Р(<т) > где К = diag(k],k2,.,kn)- диагональная пхп - матрица, элементы которой суть кусочно-постоянные функции измеряемых характеристик движения; а = (at,cr2,.,cтя)* - вектор управляющих сигналов; (pier) - вектор-функция, компоненты <^.(сг) которой определяются соотношениями р;О/) = Siguierпри \<т.| > /., |^(.(сг(.)|<1 при |<7,|</,, где - неотрицательные числа. Интервал [-/,-,/,] называют «зоной нечувствительности» релейного управления. Вне этой зоны функции (р{ известны точно, а внутри нее - лишь с точностью до оценок. Этим требованиям удовлетворяют различные релейные функции, встречающиеся в литературе (см., например, [105, с. 15], [48, 68, 69, 78, 89, 130]). Для задания релейного управления необходимо указать функции , управляющие сигналы сг- и числа lt.

Импульсное управление характеризуется тем, что его компоненты являются кусочно-постоянными функциями и могут иметь ненулевую абсолютную величину лишь на некоторых промежутках времени, которые будем называть промежутками импульса. Знаки компонент управления и их амплитуды задаются в момент начала импульса и не изменяются на промежутке импульса. Импульсное управление определим формулой uu=K<p{t,er), (33) где К, сг - те же матрица и вектор, что и в определении релейного управления, a (pit, о) -вектор-функция, компоненты cpt (t, сг) которой задаются формулами

37

I <Pi U ) nPUt& [tf, tf + Tf ]

34)

0 npute[tf + ri,tf+l]

Здесь <р{ - кусочно-постоянные функции, tf - момент начала N-го импульса по г-й компоненте управления, причем t? =t0 (t0 - начальный момент времени), xi - длительность импульсов i-й компоненты управления; / = 1,2,.,п N= 1,2,3. Относительно временных промежутков [tf, ], фигурирующих в определении импульсного управления, предполагается, что tf+1 -tf >Тп где Т1 - заданные положительные константы. Для задания импульсного управления необходимо указать функции <р{,кп управляющие сигналы сг , моменты времени tf и числа тпТг

§2. ОПИСАНИЕ МЕТОДОВ

Рассмотрим управляемую динамическую систему (1.3). Суть методики решения сформулированной в §1 задачи стабилизации программного движения состоит в следующем.

Опираясь на структуру правой части указанных уравнений, строятся зависящие от параметров Я скалярные функции v = v(t,x,p,IT), w = w(t,x,p,IJ) и вектор-функция £ = %(t,x, р, П) такие, что на решениях исследуемой системы v = -w+rf (и - £) (1) dv где T] = h —. Принципиальным при этом является выбор такой функции v, чтобы вектор г] дх был независим от погрешностей р, т.е. г/ = 7j(t,x,IJ). Выбором параметров П обеспечивается, чтобы на решениях исследуемой системы, начинающихся в множестве Ge, для Vp е Р выполнялись соотношения

Vj ||jc||2 < v < v2 ||х||2, w, ||x||2 < w < w2 \\xf (2)

77||<X||x||, (3) где v[7wnX,^ - некоторые положительные числа, определяемые параметрами системы, начального множества и диапазонами возможных значений погрешностей.

Из соотношений (1), (2) следует, что если бы можно было реализовать управление и = £, то под воздействием этого управления любые решения исследуемой системы, начинающиеся в множестве Gs, асимптотически стремились бы к программному движению, удовлетворяя экспоненциальным оценкам вида где ах = v, / v2, a2=v1lvl, Д = w2 / v,, Д = w, / v2 = a. Однако, реализовать закон управления и = вообще говоря, невозможно, так как погрешности р нам неизвестны, а управление и может принадлежать допустимому классу, не содержащему Е,.

Построение стабилизирующего управления осуществляется следующим образом. Выбором параметров управления обеспечиваются соотношения: v<-av + j3, v<ae~a{t'4) +b, (4) где a,a,b,/3 - некоторые положительные величины, причем либо Ь, либо и Ь, и /3 могут быть сделаны сколь угодно малыми. Это, учитывая оценки (2), позволяет утверждать, что за ограниченное время вектор х попадает в наперед заданную окрестность нуля и построенные управления являются стабилизирующими.

В каждом конкретном случае анализируемых в диссертации управляемых динамических систем и допустимых управлений процедура получения соотношений вида (4) - своя. Эти процедуры описаны в последующих параграфах.

Вопросы поиска подходящих функций Ляпунова представляют собой нетривиальную задачу [1, 3, 13, 54, 63-65, 67, 71, 77, 82, 91, 96, 107, 124, 131, 154, 157-163, 165, 166]. При анализе сугубо нелинейных систем они, как известно [6], подбираются в значительной мере эвристически и удачный выбор искомой функции в известной мере предопределяет успех в решении задачи синтеза стабилизирующих управлений.

При решении задач стабилизации программных вращений твердого тела с неподвижной точкой отправной послужила идея В.И.Зубова1 об использовании функции Ляпунова типа полной механической энергии системы

Здесь а - положительный параметр, другие величины имеют тот же смысл, что и в § 1. Эта функция использовалась для качественного исследования системы уравнений Эйлера-Пуассона с точки зрения устойчивости программного движения, соответствующего одноосной ориентации S, = <тх, со = 0.

В работах Е.Я. Смирнова [105] для решения задач активного управления вращательным движением твердого тела использовалась функция (в обозначениях § 1) где ау, f - скалярные параметры, С - постоянная матрица, s' = si - Si, а вектор со' определяется равенством либо co' = cos-coa - для трехосной стабилизации, либо со' =cos -соа + P(t)<7} - для одноосной. Особенность этой функции - наличие «перекрестного» члена специальной структуры - последнее слагаемое в (5). Именно введение этого слагаемого позволило решить вопрос о построении внешних управляющих моментов, решающих задачу стабилизации динамической ориентации вращающегося твердого тела при наличии необязательно малых погрешностей в информации о тензоре инерции тела и моменте внешних возмущающих сил.

1 * v = — со всол-а^ - o"j) 2

5)

1 Зубов В.И. Об активном управлении вращательным движением твердого тела. - Дифференциальные уравнения, 1970, т.6, №11, с.2086-2087.

Автор диссертации в своей работе использует аналогичную (5) функцию v = I of М + ^ aijs'*is'j а, х а,], (6) в которой малый параметр / в последнем слагаемом заменен на большой параметр а при «потенциальной» части функции. Это позволило внести некоторые изменения в структуру вектора г/ в (1), устранив малый параметр/в его выражении.

Функция Ляпунова, аналогичная по структуре (6), используется и для анализа управляемых динамических систем, описываемых уравнениями Лагранжа второго рода 1 а v = -q6q + — qAq + q*6CAq (7)

В выражении (7) А, С - постоянные матрицы, а - выбираемый параметр, в - матрица при квадратичном относительно обобщенных скоростей q слагаемом в выражении для кинетической энергии системы (см. (1.10)).

Для анализа управляемых динамических систем вида (1.5), стабилизируемых по линейному приближению управлениями вида u=M(t)x с вещественной непрерывной и ограниченной матрицей, функции Ляпунова выбирались в виде определенно положительных квадратичных форм v = x*Vx, w = xWx, (8) вещественные непрерывные и ограниченные матрицы которых удовлетворяют матричному уравнению Ляпунова

-t где А = А + ВМ. Такой подход к выбору функций Ляпунова в этом случае объясняется желанием автора акцентировать внимание на методике работы с этими функциями, а не на проблеме их поиска. Способ построения функций Ляпунова для общего случая квазилинейных систем иерархической структуры дан в [105].

Анализ различных способов построения функций Ляпунова можно найти в [6]. Один из подходов к конструированию функций Ляпунова в связи с задачами обеспечения глобальной устойчивости программных движений предложен в [88]. Новый подход к построению функций Ляпунова по правой части управляемой системы дан в [85-87]. В этих работах даны критерии построения функций Ляпунова по правой части системы, а также Приведено краткое описание численного построения искомой функции.

В задачах стабилизации по части переменных при непрямом регулировании использование описанной выше методики синтеза управлений возможно после предварительного выделения дополнительных стабилизируемых переменных - обозначим их через % - и введение в рассмотрение функций Ляпунова вида

9)

2 к где v - указанные выше функции, к - выбираемый положительный параметр. Дело в том, что в этих задачах управляющее воздействие, стабилизирующее программное движение при «прямом» регулировании, должно быть создано за счет надлежащего управления исполнительными органами, динамика которых описывается собственными дифференциальными уравнениями. Интуитивно понятно, что если создаваемое этими органами управляющее воздействие через ограниченный промежуток времени окажется близким к какому-либо управлению, стабилизирующему программное движение при «прямом» регулировании, то задача будет решена и при регулировании «непрямом». Таким образом, отклонение управляющего воздействия, создаваемого исполнительными органами, от желаемого стабилизирующего закона управления - выше мы обозначили его через х ~ должно быть стабилизировано в окрестности нуля.

Для дополнительных стабилизируемых переменных на основе исходной системы уравнений и выбранного управления, стабилизирующего программное движение при «прямом» регулировании, выписываются уравнения, которые используются при построении искомых управлений в основном режиме (§1), когда регулирование осуществляется за счет использования лишь компонент вектора управления, соответствующих переменным, не подлежащим стабилизации, т.е. переменным, описывающим динамику исполнительных органов.

При возникновении угрозы нарушения ограничений на переменные, не подлежащие стабилизации, от основного режима переходят к режиму разгрузки, когда исполнительные органы приводятся в состояние, близкое к исходному (стабилизация!), а управление, осуществляющее «прямое» регулирование, обеспечивает стабилизацию программного движения и парирование воздействия не подлежащих стабилизации переменных.

Для индикации необходимости перехода от основного режима к режиму разгрузки можно использовать функции Ляпунова, подобные функциям (6) и (7), но относительно переменных, не подлежащих стабилизации. Достижение выбранной функцией задаваемого уровня в основном режиме, учитывая неравенства (2), служит признаком возникновения угрозы нарушения ограничений для переменных, не подлежащих стабилизации, и, следовательно, - признаком перехода на режим разгрузки. Аналогично, в режиме разгрузки достижение желаемой близости к нулю значений выбранной функции является основанием для перехода на основной режим управления.

Конкретные выражения для функций Ляпунова, используемых для индикации переходов от основного режима к режиму разгрузки для анализируемых в диссертации управляемых динамических систем указаны ниже.

Описанные выше методы работы с предложенными функциями Ляпунова позволяют строить непрерывные и различного рода дискретные (по уровню и времени) управления, решающие задачу стабилизации при наличии погрешностей р е Р из заданных диапазонов. Основными факторами, определяющими возможность применения описанных методов, является независимость вектора 77 от погрешностей р и получение оценок (3) для норм векторов £ и 77 в (1) через известные границы диапазонов погрешностей и параметры начального множества.

При учете «динамических» погрешностей, которые описываются собственными дифференциальными уравнениями и являются скорее конструктивными особенностями управляемой системы, указанные оценки получить не удается из-за появления в уравнениях системы и, как следствие, в выражении для £ старших производных этих погрешностей.

При наличии «динамических» погрешностей, вектор погрешностей имеет структуру р = col(p],p2,р2), где символом рх обозначены не зависящие от времени погрешности с априорными оценками диапазонов их возможных значений, а символом р2 «динамические» погрешности, описываемые собственными дифференциальными уравнениями. Если бы каким-либо преобразованием исходной системы удалось из ее уравнения убрать вектор р2, то в предположении об ограниченности вектора р2 описанная выше методика использования подходящих функций Ляпунова и мажорант для них позволила бы построить стабилизирующие управления. Последующий анализ уравнений для р2 должен дать условия на параметры системы, при которых предположения о принадлежности р2 выбранным диапазонам справедливо.

Для управляемых систем, описываемых уравнениями Лагранжа второго рода, указанную манипуляцию удается осуществить, когда обусловленный погрешностями р2 вектор входит в выражение для обобщенного кинетического момента системы линейно:

L = eq + fn (10) где /„ = fn(t,q,pvр2) - непрерывная функция своих аргументов, ограниченная как функция времени и обращающаяся в нуль, при р2= 0.

Это имеет место, например, для твердого тела с упруго присоединенными элементами. Для вращающегося твердого тела с маховиками и гироскопами подобные ситуации имеют место в случаях, когда, имеются малые упругие деформации элементов подвеса маховиков и гироскопов, когда учитывается динамика приводов и т.д. (см. Приложение).

Линейная неособая замена переменных

6q = 9q + fn (11) выделяет из сложного движения изучаемой системы некоторую составляющую его «быстрой» части, определяемую погрешностями. Из уравнений системы и вектора £ в (1) в результате этой замены удаляются производные динамических погрешностей р2. Необходимо отметить также, что в результате предложенной замены переменных коррекции подвергается и стабилизируемое движение системы, которое при достаточно малых величинах погрешностей будет близко к программному. По отношению к используемым для построения стабилизирующих управлений функциям Ляпунова сказанное означает, что для синтеза стабилизирующих управлений можно использовать функции (5)-(9), в которых стабилизируемые переменные заменены на «близкие» преобразованиями вида (11).

В ряде случаев, как например для трехстепенных силовых гироскопов в конирующих подвесах, при построении стабилизирующих управлений представление вида (10) удобно применить и в расчетном (без погрешностей) варианте, рассматривая отклонения центров инерции элементов подвеса от осей вращения как инструментальные погрешности.

В первом параграфе было отмечено, что по ряду причин а именно из-за стремления построить стабилизирующие управления по возможности наиболее простыми как функции измеряемых характеристик движения, задачи стабилизации программных вращательных движений твердого тела с неподвижной точкой целесообразно формулировать и решать, используя в качестве математической модели уравнения Эйлера-Пуассона. Использование уравнений Лагранжа второго рода в этом случае, хотя и является привлекательным из-за возможности применения для описания взаимного расположения опорных и ориентируемых осей независимых переменных типа самолетных углов, приводит к управлениям весьма сложной структуры. Конкретный вид стабилизирующих управлений, получающихся при решении задачи трехосной стабилизации вращательного движения твердого тела на основе уравнений Лагранжа второго рода приведен в [113, §4].

Использование для описания вращательного движения твердого тела уравнений Эйлера-Пуассона (1.14)-(1.15) позволяет построить, в частности, стабилизирующие управления, являющиеся линейными функциями измеряемых характеристик движения [117]. Однако, применение описанной выше методики синтеза искомых управлений с использованием функций Ляпунова вида (5),(6) затруднено наличием интегралов движения (1.16). Компромиссным оказался подход, при котором изучение поведения выбранной функции Ляпунова на решениях исследуемой системы осуществляется с использованием аппарата параметров Родрига-Гамильтона [7, 41, 128], применяемых для описания взаимного расположения опорных и ориентируемых осей. Этот аппарат позволяет, в частности, не усложняя структуры подлежащих исследованию уравнений, сократить число интегралов движения с шести до одного. Удобным при этом оказывается ввести указанные параметры через элементы конечного поворота, совмещающего не сами опорный и ориентируемый триэдры, как это делается традиционно, а сопряженные с ними, которые определяются столбцами матриц S* и Z* (обозначения §1). Разумеется, и те, и другие параметры эквивалентны с точки зрения описания взаимного расположения опорного и ориентируемого триэдров, однако последние более удобны при алгебраических преобразованиях. При использовании выбранных параметров Родрига-Гамильтона - обозначим их ju0 и ju = (//15/л2,jU^Y - уравнения Пуассона (1.15) с интегралами (1.16) заменяются на эквивалентные им соотношения: jU = ^(ju0Z*co' + Jux'E*a)'), {10 = -^(лЪ*а>'

Мо +1НГ =1, а функция Ляпунова (7) записывается в виде v = ^со'*всо' + 2а/и А/и + со'*вСу, где матрица А и вектор v определяются формулами:

А = f , л а22 +С1ЪЪ а\2 "13 j ^^ —#23

V —fitj3 ~й23 Ctu+a,22j t 3 V i,j=1

Доказательство этих и некоторых других полезных утверждений приведено в Приложении и было опубликовано в [117].

 
Заключение диссертации по теме "Теоретическая механика"

ЗАКЛЮЧЕНИЕ

В диссертации изложены опубликованные автором в [33, 34, 108-120, 132-153] результаты, полученные применительно к задаче стабилизации программных движений управляемых динамических систем. Эти результаты существенно развивают теорию стабилизации программных движений динамических систем с учетом диктуемых практикой особенностей структуры управлений и получаемой о системе информации, доведя эту теорию до вполне завершенного состояния.

Задача стабилизации решена для следующих классов управляемых систем: систем, описываемых уравнениями Эйлера-Пуассона, характерных для задач управления вращательным движением твердого тела при помощи момента сил, формируемого на основе информации об угловом положении и угловой скорости тела относительно жестко связанной с телом системы координат; систем, описывающих вращательное движение твердого тела, управляемого установленными на нем маховиками и силовыми гироскопами; в этом случае дополнительно используется информация о движении маховиков и гироскопов относительно тела; систем, описываемых уравнениями Лагранжа второго рода, у которых управлениями являются обобщенные силы, формируемые на основе информации об обобщенных координатах и обобщенных скоростях системы; линейных по управлению динамических систем, описываемых уравнениями вида (1.1) и квазилинейных систем иерархической структуры; на примере первых изложены основные моменты разработанных методов решения задачи стабилизации.

При решении задачи стабилизации весьма плодотворным оказался метод функций Ляпунова, применение которого потребовало подходящего выбора самих функций и разработки удобных методов для их анализа.

Новыми результатами, составляющими основу диссертации, являются следующие: метод анализа перечисленных выше управляемых систем, заключающийся в использовании удачно выбранных функций Ляпунова и построении для них удобных мажорант; этот метод, изложенный на примере линейных по управлению систем вида (1.1) в §§2-5 и [150], первоначально был разработан для управляемых систем, описываемых уравнениями Лагранжа второго рода, и опубликован в [142-144]. Результаты, полученные для задач стабилизации вращательного движения твердого тела опубликованы в [143, 151]; методика, позволяющая распространять способы построения стабилизирующих управлений на случай непрямого регулирования; эта методика, основа которой состоит в выделении при необходимости дополнительных стабилизируемых переменных и организации, если необходимо, процесса разгрузки управляющих устройств, изложена в §4, а в §6 применена для решения задач стабилизации вращательного движениям твердого тела с помощью маховиков и гироскопов; конкретные результаты, полученные автором для этих задач, опубликованы в [108-111, 132-138, 147]; методика учета «динамических» погрешностей в информации о параметрах системы, т.е. отклонений от расчетного (без погрешностей) варианта, описываемых собственными дифференциальными уравнениями; §5 содержит схематичное изложение данной методики, позволяющей за счет выделения из сложного движения исследуемой системы некоторой составляющей его «быстрой» части, определяемой погрешностями, осуществить декомпозицию исследуемой системы, сохранив преемственность в используемом для решения задачи стабилизации математическом аппарате и при увеличении уровня иерархичности исследуемой динамической системы; в §6 показано, как указанная методика работает при необходимости учета различного рода погрешностей в задачах стабилизации вращательного движения твердого тела; конкретные результаты, полученные автором для этих задач, опубликованы в [108-111, 132-138, 147].

Названные методы позволили построить в удобном для приложений виде многопараметрические семейства управлений, в том числе импульсных, которые решают задачу стабилизации при наличии необязательно малых погрешностей в информации о параметрах системы и действующих на нее возмущающих силах; в §4 на примере линейных по управлению систем вида (1.1) показано как осуществляется построение импульсных управлений, реализуемых по интегралу от специальным образом выбираемого базового управления, в частности, управлений, организованных по принципу широтно-импульсной модуляции (ШИМ); в §6 построение импульсных стабилизирующих управлений осуществлено для динамических систем, описываемых уравнениями Лагранжа второго рода, и систем, описываемых уравнениями Эйлера-Пуассона; результаты, полученные автором для случая импульсных управлений, опубликованы в [140-149].

Полученные автором результаты, объединенные в настоящей диссертации, ранее частично публиковались в диссертации [117] и учебном пособии [113]. Они докладывались на многих отечественных и международных конференциях (см. [34, 114, 118, 119, 136, 137, 139-141, 145, 146]).

СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ t,t0 - текущее время и начальный момент времени; )* - операторы дифференцирования по времени; dt dt ) - оператор транспонирования;

R" - и-мерное евклидово пространство;

R+ - \t :t> /0} - множество значений времени; x = (xvx2,.,xn) - координатное представление вектор-столбца х пространства R" в некотором базисе; при необходимости мы будем различать векторы как геометрические объекты и их координатные представления в различных базисах; Еп - единичная пхп-матрица; diag(x) - диагональная матрица с элементами х,. на главной диагонали; х - в зависимости от контекста знак прямого (декартова) произведения множеств или знак векторного произведения в R2; х*у - скалярное произведение векторов х,у <е R"; м и / * \1/2 x| = (xxl -евклидова норма вектора х е R ;

Ах\\ sup iLp—гр - норма матрицы А, согласованная с евклидовой нормой вектора в R"; м

- для m-мерной вектор функции / это п х т матрица, г-ый столбец дх dxj дх2 дхп которой образован из частных производных г-й компоненты вектор-функции J] по компонентам вектора х; в частности, для скалярной функции / - — обозначает вектордх столбец ее частных производных по компонентам вектора х;

Sinx - диагональная матрица с элементами sinxt на главной диагонали;

Cosx - диагональная матрица с элементами Cosxt на главной диагонали;

Квадратная вещественная матрица А называется симметричной если А = А*, и кососимметричной если А = -А*.

Если А - симметричная пхп -матрица, то соотношения

 
Список источников диссертации и автореферата по механике, доктора физико-математических наук, Юрков, Александр Васильевич, Санкт-Петербург

1. Абдуллин Р.З. Устойчивость нелинейных дифференциальных уравнений с импульсными управлениями: метод сравнения Автоматика и телемеханика, 2000, т. 61, № 11, часть 1, 1796-1807.

2. Александров Ю.С., Сорокин А.В. Управление инерционным маховиком. -«Космические исследования» 1999,. том. 37, № 5, с. 507.

3. Антончик B.C. Методы стабилизации программных движений. СПб.: Изд-во Санкт-Петербургского ун-та. - 1998. - 207 с.4 . Анчев А. А. О стабилизации относительного равновесия спутника с маховиками. -«Космические исследования», 1966, т. 4, № 2, с. 192-202.

4. Арефин И.Г. Алгоритмы адаптивной стабилизации лагранжевых систем: Учеб. пособие. -М.: Изд-во МАИ. 1992. - 38 с.

5. Барбашин Е.А. Функции Ляпунова. М., 1970. 240 с.

6. Бранец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М., 1973, 320 с.

7. Белецкий В.В., Ковалева Е.Д. Оптимизация управления ориентацией солнечной космической электростанции 1987. - 21 с. 7,

8. Бесекерский В.А. Орбитальное гирокомпасирование. Под ред. Б.Б.Самотокина. -СПб.: Политехника. 1993. - 251 с

9. Бороздин В.И. Гироскопические устройства и приборы. М., «Машиностроение», 1990.

10. Бороздин В.Н. Гироскопические приборы и устройства систем управления: Учеб .пособие. -М. Машиностроение, 1990.-271 с.

11. Булгаков Б.В. Прикладная теория гироскопов. М.1955. 355 с.

12. Воронов А.А. Принцип сравнения в теории больших систем на основе прямого метода Ляпунова: Учеб. пособие Моск. ин-т радиотехники, электрон, и автоматики. -1987. 79 с.

13. Воротников В.И. Устойчивость динамических систем по отношению к части переменных. М.: Наука. 1991. - 284 с.

14. Гироскопы, навигационные приборы и комплексы. Под ред. Коновалова С.Ф. М., МВТУ; вып.549, 1990.-160 с.

15. Джекот Э., Лиска Д. Применение гиростабилизаторов в системах управления угловыми положениями космических аппаратов. «Вопросы ракетной техники, 1967, №2, с.73-88.

16. Егоров Г.А., Земляков А.С., Кузьмин Г.А. Управление ориентацией ЛА с помощью системы гиродинов. "Труды научных чтений по авиации и космонавтике", ИИЕТ АН СССР. Москва, 1990.

17. Ермолин B.C. Смирнов Е.Я. Управление ориентацией твердого тела и стабилизация вращений с помощью демпфирующих маховиков. 4 Всесоюзный съезд по теоретической и прикладной механике. Аннотации докладов. 1976. с.21.

18. Жермоленко В.М. Робастная стабилизация параметрически возмущенных систем -Автоматика и телемеханика, 2001, т. 62, № 2, 278-289

19. Жечев М.М. Асимптотическая устойчивость положения равновесия сингулярных механических систем Автоматика и телемеханика, 2001, т. 62, № 3, 383-390

20. Задачи исследования устойчивости и стабилизации движения. Сб. ст. АН СССР, ВЦ Ред. В. В. Румянцев. -1986. 94 с.

21. Златоустов В.А. Садов Ю.А., Сарычев В.А., Торжевский А.П. Обзор работ по пассивным методам стабилизации спутников. В сб. № Всесоюзный съезд по теоретической и прикладной механике. Аннотации докладов. 1968. с. 138.

22. Зубов В.И. Аналитическая механика гироскопических систем. Л., 1970, 318 с.

23. Зубов В.И. Аналитическая конструкция закона регулирования, управляющего вращательным движением твердого тела при непрямом регулировании. -«Дифференциальные уравнения», 1974, т. 10, № 10, с. 1898-1899.

24. Зубов В.И. Об активном управлении вращательным движением твердого тела. -«Дифференциальные уравнения», 1970, т. 6, № 11, с. 2086-2087.

25. Зубов В.И. Об управлении вращательным движением. «Дифференциальные уравнения», 1971, т. 7, № 7, с. 1320-1322.

26. Зубов В.И. Аналитическая динамика гироскопических систем. Л., 1970, 318 с.

27. Зубов В.И. Колебания в нелинейных и управляемых системах. Л., 1962. 631 с.

28. Зубов В.И. Математические методы исследования систем автоматического регулирования. Л., 1959. 324 с.

29. Зубов В.И. Методы Ляпунова и их применение. Л., 1957, 242с.

30. Зубов В.И. Лекции по теории управления. М., 1975,496 с.32.