Оптимальное управление и оценивание движения в некоторых задачах динамики тема автореферата и диссертации по механике, 01.02.01 ВАК РФ

Шматков, Антон Михайлович АВТОР
доктора физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2012 ГОД ЗАЩИТЫ
   
01.02.01 КОД ВАК РФ
Диссертация по механике на тему «Оптимальное управление и оценивание движения в некоторых задачах динамики»
 
Автореферат диссертации на тему "Оптимальное управление и оценивание движения в некоторых задачах динамики"

На правах рукописи

ШМАТКОВ Антон Михайлович

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И ОЦЕНИВАНИЕ ДВИЖЕНИЯ В НЕКОТОРЫХ ЗАДАЧАХ ДИНАМИКИ

01.02.01 — теоретическая механика

Автореферат диссертации на соискание учёной степени доктора физико-математических наук

- 1 НОЯ 2012

Москва — 2012

005054128

005054128

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте проблем механики им. А. Ю. Ишлинского Российской академии наук (ИПМех РАН)

Официальные оппоненты:

член-корр. РАН, доктор физико-математических наук Н. Н. Болотник, доктор физико-математических наук, профессор Ю. Ф. Голубев, доктор физико-математических наук, профессор Т. Ф. Филиппова.

Ведущая организация:

Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В. А. Трапезникова Российской академии наук.

Защита диссертации состоится "21" февраля 2013 г. в 15 часов на заседании диссертационного совета Д002.240.01 при ИПМех РАН по адресу: 119526, г. Москва, проспект Вернадского, д. 101, корп. 1, ИПМех РАН.

С диссертацией можно ознакомиться в библиотеке ИПМех РАН. Автореферат разослан "30" октября 2012 г.

Учёный секретарь

диссертационного совета Д002.240.01 кандидат физико-математических наук

Е. Я. Сысоева

Цель работы заключается в постановке и изучении ряда задач математической теории оптимального управления, допускающих применение аналитических методов для выяснения особенностей поведения динамических объектов.

Актуальность исследуемых задач обусловлена тем, что в математической теории оптимального управления сравнительно мало решённых задач, для которых создан алгоритм, позволяющий сравнительно быстро вычислять синтез, и ещё меньше таких, для которых последний построен в аналитической форме. Основная причина состоит в том, что после применения известного принципа максимума Л. С. Понтря-гина в большинстве случаев приходится решать нелинейную краевую задачу вдвое большей размерности, чем исходная. Однако для приложений в связи с необходимостью построения опорных управлений и оценок полезны полные точные решения задач управления движением при упрощающих предположениях относительно структуры объекта, вида и формы наложенных на него ограничений. Поэтому представляют интерес любые математические модели, где решение в указанном виде возможно, если они отражают реальность лучше, чем те, где оно уже найдено, без введения дополнительных переменных или используют минимальное их количество. В особенности это относится к случаям, когда на систему влияют различные неопределённые факторы: внешние возмущающие силы, неконтролируемые вариации параметров, погрешности в измерении начальных условий. Иногда, как это показано в тексте диссертации, можно сделать полезные выводы в рамках строго детерминированных построений, без расширения фазового пространства задачи для включения дополнительных переменных, описывающих такие факторы. К сожалению, такое удаётся редко. Для создания удовлетворительной модели приходится прибегать к различным способам описания указанных факторов.

Самым распространённым подходом к исследованию неопределён-

ных величин является вероятностный (стохастический) метод. В нём каждому неопределённому вектору сопоставляется некоторое распределение вероятностей с заданной плотностью. Соответствующим математическим аппаратом является теория случайных процессов. Отметим, что вероятностный подход требует знания статистических характеристик исходных неопределённых факторов, что далеко не всегда доступно на практике.

Гарантированный (минимаксный) подход оперирует с множествами, в которых лежат неопределённые векторы. При этом предполагается, что неизвестные помехи локализованы в известных множествах, а в остальном произвольны. Наиболее адекватным математическим аппаратом для его описания должна служить теория дифференциальных игр. Однако она весьма сложна, а многие полезные выводы могут быть получены более простыми способами. В частности, при последовательном её применении в результате аффинных преобразований, сложения и пересечения множеств могут получаться многообразия сложной, и, самое главное, трудно предсказуемой формы, даже если исходные множества в начальный момент времени имели геометрическую форму, требующую небольшого числа параметров для обработки и хранения.

Оценки показывают, что даже в линейном случае без создания принципиально новых моделирующих устройств ни сейчас, ни в обозримом будущем достаточно полные поточечные описания в пространствах большой размерности для сколько-нибудь широкого класса реальных систем не найдут материальной базы для воплощения. Очевидность этого обстоятельства вызывает к жизни попытки ввести множества простой (канонической) формы, приближающие настоящие множества достижимости. Под простой понимается такая форма, которая при соблюдении допустимой точности аппроксимации требует приемлемых вычислительных ресурсов. При этом все входящие в задачу множества заменяются на множества канонической формы. Возникает зада^

ча построения операций над каноническими множествами, результат которых был бы максимально близок в смысле некоторого критерия к результату соответствующих операций над истинными множествами неопределённости.

Во-первых, это многогранники. Наиболее часто употребляют параллелепипеды, причём их грани во многих случаях параллельны координатным плоскостям, что приводит к интервальному анализу. Во-вторых, это эллипсоиды, использовать которые в качестве канонических множеств предложил Р. С. 8сЬ\тсрре в 1968 г.. Метод был развит в (20-24] и др. Используют и более сложные множества.

С точки зрения применения в реальных технических устройствах желательно, чтобы гарантированный способ аппроксимации удовлетворял следующим требованиям.

1°. Геометрические фигуры, которыми в конечном итоге приближают множества достижимости в рамках некоторого метода, должны быть понятны специалистам, которые будут им пользоваться, т. е. инженерам.

2°. Для достижения удовлетворительной точности аппроксимации должно быть достаточно сравнительно небольших вычислительных ресурсов.

Здесь следует принять во внимание то, что переход от реальных устройств к математическим моделям часто порождает значительную ошибку, по сравнению с которой погрешность аппроксимации при использовании множеств канонической формы может оказаться несущественной.

3°. Способ должен допускать сравнение с вероятностным оцениванием.

Дело в том, что реальные неопределённости крайне редко носят чисто случайный или чисто игровой характер. Следовательно, приходится выбирать между гарантированным и вероятностным подходами. Для

этого гарантированный способ должен быть "близок" к вероятностному, а последний, как правило, опирается на гауссовы распределения неопределённых величин.

Метод эллипсоидов удовлетворяет всем указанным требованиям.

В диссертации используются эллипсоидальные оценки, основанные на [22], [23] и многих других исследованиях, выполненных в ИПМех РАН под руководством академика РАН Ф. Л. Черноусько за последние тридцать лет.

Отметим, что все рассматриваемые функции времени таковы, что решения дифференциальных уравнений, в которых эти функции используются, существуют, а все случаи наложения дополнительных ограничений оговорены отдельно. Зависимость всех введённых величин от времени явно указана при их определении и далее может быть опущена ради уменьшения громоздкости формул. Через 1к везде обозначена единичная матрица размерности к X к.

Публикации. Основные результаты диссертации опубликованы в работах [1-19]. Основные результаты, выносимые на защиту и опубликованные в работах [1-10], [18] и [19], получены автором диссертации.

Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и приложения. В приложении собраны рисунки и таблицы ко всем главам диссертации, а конце приведён список соглашений и обозначений, использованных в тексте диссертации.

Количество страниц в диссертации — 280, в том числе иллюстраций — 60.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Введение посвящено описанию некоторых особенностей развития математической теории оптимального управления. Основное внимание уделено трудностям, возникающим при попытке получить в аналитической форме решения задач, важных для практических приложений. Поскольку учесть неопределённые факторы без расширения фазового пространства задачи удаётся редко, то описаны основные подходы, применяемые при рассмотрении систем с неопределёнными параметрами, т. е. вероятностный и гарантированный. Последний рассмотрен более подробно, обоснована целесообразность применения эллипсоидальных оценок, сформулирована цель работы и в сжатом виде изложено содержание всех глав и параграфов.

Первая глава содержит решения ряда задач построения оптимального управления в форме программы и синтеза. Результаты исследования могут быть использованы для создания регуляторов, способных лучше учитывать особенности неопределённых внешних воздействий и конструктивные ограничения, важные для реализации управления.

Предположим, что на динамическую систему действует возмущающая сила, которая иногда резко и на очень короткое время возрастает, но, как правило, сравнительно невелика. Требуется удерживать объект поблизости от заданной точки в пространстве. С этой целью можно построить управляющее устройство, включающее в себя две подсистемы. Первая представляет собой обычный регулятор и предназначена для стабилизации при небольшой величине возмущения, что значительно облегчает конструирование и эксплуатацию. Сила, прикладываемая к объекту в результате её работы, сравнительно мала. Вторая предназначена для компенсации больших импульсных воздействий и соответствующая сила велика. Следовательно, влиянием первой подсистемы на объект во время работы второй можно пренебречь, как и действием

возмущения в отсутствии импульсов, поскольку оба эти фактора одинаковы по порядку величины. С другой стороны, на вторую подсистему должно быть наложено дополнительное ограничение. Именно, требуется не просто привести объект в заданную точку, но и обеспечить в этой точке малую (а лучше нулевую) скорость. Иначе для выполнения поставленной цели возможностей первой подсистемы может не хватить. Получаем задачу оптимального быстродействия для детерминированной модели с требованием получить нулевую скорость в заданной точке в конечный момент времени ("мягкая встреча").

В §2.1 рассмотрена задача оптимального по быстродействию приведения системы в начало координат с нулевой скоростью с помощью ограниченной по модулю силы. Посредством введения автомодельных сопряжённых переменных удалось свести решение двухточечной задачи к отысканию оптимального корня некоторой функции, задаваемой аналитически. Построен численный алгоритм, позволяющий получить полное решение задачи управления в форме синтеза. Найдены коэффициенты обратной связи по ортам векторов положения и скорости, построен алгоритм управления и функция Беллмана. Приведён расчёт примеров с конкретными начальными данными.

В §2.2 исследована задача об оптимальном по быстродействию достижении материальной точкой поверхности сферы с нулевой скоростью посредством ограниченной по модулю управляющей силы. Поверхность проницаема и "посадка" на сферу может производиться как снаружи, так и изнутри. Оптимальное управление в форме программы и синтеза, траектории, время быстродействия и функция Беллмана строятся на основе принципа максимума Понтрягина. Введением автомодельных переменных краевая задача сведена к численному поиску решений алгебраического уравнения четвёртой степени и трансцендентного уравнения. Установлено свойство вырождения краевой задачи, когда оптимальная траектория близка к прямолинейной; построено реше-

ние задачи синтеза в случае вырождения. Эффективность предлагаемого подхода проиллюстрирована конкретными примерами, содержащими расчёты семейств траекторий, и анализом режимов управления.

В §2.3 рассмотрены управляемые движения материальной точки в однородной вязкой среде. Решена задача о приведении за минимальное время этой точки посредством ограниченной по модулю силы на фиксированную сферу как изнутри, так и снаружи. Для произвольного начального положения и любой начальной скорости с помощью принципа максимума Л. С. Понтрягина в явном виде построены оптимальное управление как в форме программы, так и в форме синтеза, время быстродействия и функция Беллмана, а также оптимальная фазовая траектория. Проведены аналитическое и численное исследования решения, обнаружены качественные механические свойства оптимальных характеристик движения: немонотонная зависимость времени быстродействия от величины начального вектора скорости, разрыв функции Беллмана.

В §2.4 исследована задача об оптимальном уклонении материальной точки под действием ограниченной силы от области сферической формы. Решение было найдено согласно следующему алгоритму. Рассмотрим некоторую допустимую траекторию движения. Найдём на траектории такую точку или множество точек, расстояние от которой до начала координат минимально. Для краткости назовём эту точку и соответствующее расстояние критическими. Для каждого набора начальных условий исследуем всё множество возможных траекторий (т. е. множество достижимости), образующееся перебором допустимых управлений, и среди них найдём имеющую максимальное критическое расстояние. Затем определим такое подмножество начальных условий, для которого это расстояние не меньше радиуса препятствия. Следовательно, невозможно избежать встречи с препятствием, если начальные условия не принадлежат найденному подмножеству. Если уклонение возможно, то

не существует траектории, имеющей большее критическое расстояние, чем та, которая может быть найдена по соответствующим формулам. С точки зрения предотвращения попадания на сферу представляется естественным назвать такую траекторию оптимальной, поскольку она проходит на максимально возможном расстоянии от препятствия.

Таким образом, изложенная процедура оптимального уклонения содержит последовательное решение четырёх задач: 1) определение граничных точек множества достижимости; 2) поиск наиболее удалённой от начала координат точки этого множества для каждого момента времени t = Т < оо; 3) нахождение ближайшей к началу координат точки на соответствующей траектории; 4) определение границы области допустимых начальных условий.

Решение первых двух задач найдено аналитически. Построение минимизирующей траектории х*{Т) требует некоторых вычислений, а определение границы допустимой области, т. е. решение четвёртой задачи, также оказалось аналитическим.

В §2.5 рассмотрен случай, когда управляющее воздействие (сила или момент силы) F не может изменяться мгновенно. Это предположение лучше соответствует реальным управляющим устройствам, которым часто присуща значительная степень инерционности, в то время как существующие решения задач оптимального управления часто требуют, чтобы F принимала крайние значения и мгновенно переключалась с одного них на другое.

Пусть скорость изменения F ограничена \F\ < «о, где vo > 0 — заданная постоянная. Будем полагать, что ограничение F0 на абсолютную величину силы не достигается и всегда |F(t)| < Fa. Рассмотрим систему с одной степенью свободы, описываемую уравнениями ¿1 = Х2, тпх2 = F, где xi — обобщённая координата, х2 — обобщённая скорость, m — постоянная инерционная характеристика (масса или момент инерции). При помощи замены переменных хх = {vo/m)х, х2 = (у0/тп)у,

.Р - ъ-0г приведём уравнения движения и ограничение на к виду

¿ = 2/, У = г, ¿ = и, |ы| < 1 (1)

Теперь переменные X, у, г являются фазовыми координатами, а и играет роль ограниченного управления.

С помощью автомодельных переменных удалось понизить порядок системы и построить в замкнутой полностью аналитической форме синтез управления, оптимального по быстродействию для системы (1). Это управление и(х,у,г), выраженное как функция текущих (или начальных) фазовых координат х, у, г, обеспечивает приведение системы (1) на заданное конечное многообразие х{Т) = 0, у(Т) = 0 при произвольном г(Т) за кратчайшее время Т.

Вторая глава посвящена задаче о наискорейшем переводе центра масс манёвренного самолёта из одной заданной точки трёхмерного пространства в другую при фиксированных векторах скоростей в этих точках. В примерах вектор скорости в конце движения равен начальному.

В научной литературе управлению полётом самолётов уделено большое внимание. Наиболее подробно изучены вопросы, связанные со стабилизацией заданных лётчиком параметров движения методами автоматического регулирования. Исследованные задачи выбора оптимальной траектории полёта связаны с поиском наилучших параметров крейсерских режимов полёта, увеличением дальности полёта, уменьшением расхода топлива и прочих вопросов, важных, в первую очередь, для оптимизации лётно-технических характеристик неманёвренных самолётов. В работах, посвящённых оптимизации манёвренных характеристик самолёта, в основном была исследована достаточно узкая проблема оптимизации угловой скорости виража в горизонтальной плоскости без ограничений на координаты самолёта в конце манёвра. Траектории, лежащие в вертикальной плоскости и не сводящиеся к обычным для гражданской авиации (смена высоты полёта, заход на посадку и т. п.),

изучались преимущественно для нужд космической отрасли.

Современные потребности развития и совершенствования манёвренных самолётов приводят к необходимости решения специальных задач оптимального управления, существенных, в частности, для воздушного боя. Например, внезапное нападение противника заставляет предпринимать освоенные на тренировках оборонительные манёвры, одним из которых является "мёртвая петля". Главным отличием настоящей работы от проведённых ранее исследований следует считать то, что здесь скорость в момент окончания манёвра равна начальной. Последнее важно как при уклонении от противника, так и при преследовании цели.

Пренебрежём влиянием ветра, вращением Земли и кривизной её поверхности. Рассмотрим движение центра масс самолёта в трёхмерном пространстве относительно некоторой наземной неподвижной правой декартовой прямоугольной инерциальной системы координат OXYZ, оси ОХ и OZ которой лежат в горизонтальной плоскости. Имеем

mr = G + R + P, тп = const, г = v(t) 6 R3, М = V > const > 0 (2)

Здесь m — масса летательного аппарата, которую будем считать постоянной, г — радиус-вектор центра масс самолёта в системе OXYZ с компонентами х, у и г, G — сила тяжести (гравитационное поле будем полагать однородным), R — главный вектор аэродинамических сил, Р — сила тяги двигателей, v — вектор скорости. В силу сказанного выше предположим, что значение |г'| всегда достаточно велико и ограничение на него можно не учитывать. Будем считать атмосферу изотермической с аппроксимационной зависимостью массовой плотности воздуха р от высоты у вида р = p0exp{-y/h). Вектор R в (2) принято рассматривать в виде суммы трёх векторов: силы лобового сопротивления Rx, направленной против вектора скорости v, подъёмной силы Ry, лежащей в вертикальной плоскости симметрии самолёта и ортогональной Rx, и боковой силы Rz. Последнюю положим равной нулю. Будем считать, что

подъёмную силу Ry можно мгновенно менять как по величине, так и по направлению, причём может быть выражен через безразмерный скалярный коэффициент подъёмной силы Су:

\Ry\ = CyqS, О <СУ<С™, q = pv2/2

где g — скоростной напор, S — площадь крыла самолёта. Пусть скаляр Схо — коэффициент лобового аэродинамического сопротивления при нулевой подъёмной силе, А — коэффициент "отвала" поляры. Тогда модуль силы аэродинамического сопротивления можно представить в форме = (Сха + АСу) qS. Будем полагать, что вектор тяги Р всегда направлен вдоль вектора скорости v. Величина |Р| ограничена минимальной и максимальной допустимыми мощностями двигателей:

Ршт < |Р| < Ртах, Pmin /\G\ = 1/2, Ртах/\G\ = -ВіУ + B2V + B3

где Ві, ІЗ2 и В3 — постоянные коэффициенты, определяемые на основании экспериментальных данных. Введём скаляр и:

Up = 9 (Ртах + Pmin)/ (2|G|) , Um = g (Pmax - Pmi„)/ (2|G|)

\P\/m = Up + uUm, M<1

где g — величина ускорения свободного падения. Это преобразование позволяет перейти от величины |Р| с ограничениями, зависящими от фазовых переменных, к величине и, ограничения на которую от фазовых переменных не зависят.

Разделим обе части дифференциального уравнения для г в (2) на тп: г = v, v = G/m + (Up + uUm - (Cx0 + АСІ) qk) т + Cvqkv

(3)

г, f Є R3, T = v/V, і/ = Ry/\Ry\, (v,t) = 0, к = S/m = const

где через (•, ■) обозначено скалярное произведение двух векторов. Введём коэффициенты нормальной и тангенциальной перегрузки

пу = \Ry\/\G\, 0 <пу<п™, пх = (|Р| - |PX|)/|G|

Тогда можно записать дифференциальные уравнения (3) в виде

г = V, V = /д + дпхт + дпуи, }д = в/тп, |/9| = д (4)

В §2.2 аналитически исследован трёхмерный случай (3), в котором требуется выбрать вектор С|, имеющий фазовые ограничения, а также скаляр и так, чтобы за минимальное время Т привести центр масс самолёта из заданного начального в заданное конечное состояние в фазовом пространстве для системы

г = V, у=(ир + и17т - якСхо - як\с1\гА) т + дкс1 + /д |и| < 1, С1 = Суи, |с,| ~ Су < Сутах, \ci\qk < дп™х

Для примера рассмотрим случай, когда начальная и конечная фазовые точки совпадают. Обозначим через со1 вектор-столбец и запишем

г(0) = г(Т) = со1(0,5000 м, 0), г'(0) = ь(Т) = со!(250м/с,0,0) (5)

Рис. 1. Рис. 2.

На рис. 1 начальная и конечная точка обозначена буквой Т; стрелками показано направление движения по кривым. Оптимальная тра-

ектория 1 имеет переменную кривизну на конечном участке вблизи Т. Время движения по ней составляет Тх гв 24.94 с.

В §2.3 дополнительно введено ограничение на знак кривизны траектории. Поскольку это можно сделать только для плоских кривых, то всюду в полученных ранее формулах следует полагать проекции векторов на горизонтальную координатную ось О г равными нулю и тем самым считать задачу не трёхмерной, а двумерной. Пусть их и иу — проекции V на оси ОХ и ОУ. Введём новое скалярное управление тгс:

г = v, v = (Up + uUm - qkCxо - Ag2n^q~1k~1) т + дпуи + /д М<1, Kl^"»" KI <C?"qk/g

где ух — проекция скорости v на ось ОХ. Условие для траекторий, имеющих неположительную кривизну, имеет вид, аналогичный (6).

Для случая (5), показанного на рис. 1, время движения по оптимальной траектории 2 с неотрицательной кривизной — Т2 « 27.25 с, а по оптимальной траектории 3 с неположительной кривизной — Т3 яв 24.96 с. Заметим, что 2 близка к окружности, но ею не является. Помимо траекторий 1, 2 и 3 существуют ещё три соответствующих оптимальных решения, которые можно получить, если взять кривые, зеркально симметричные приведённым относительно вертикальной прямой, проходящей через точку Т.

Также были вычислены траектории, удовлетворяющие граничным

условиям r(0) = со1(0,5000 м), г>(0) = v(T) = со1(250м/с,0), причём

Тогда можно записать (4) в форме

Условие неотрицательности кривизны траектории имеет вид

(6)

вектор r(T) — любой. Полученные кривые показаны на рис. 2, где Т — начальная точка; I — оптимальное решение с неположительной кривизной и временем движения Г/ и 22.74 с; II — оптимальное решение с неотрицательной кривизной и временем движения Тц ~ 23.58 с. Стрелки обозначают направление движения по траекториям.

Третья глава посвящена дальнейшему развитию метода эллипсоидов с целью получения уравнений в форме, удобной для приложений, решению задач построения аппроксимаций в случае неопределённости ограничений на управление и оптимального выбора этих границ, а также проблеме управления ансамблями траекторий с использованием глобально оптимальных эллипсоидов.

Изложим некоторые его положения по [22], [23]. Пусть Е(х, 0) обозначает эллипсоид, заданный ¿-мерным вектором своего центра х и симметрической неотрицательно определённой I х ¿-матрицей ©. Если 0 положительно определена, то

£(X,0) = {ieR': < 1} (7)

где ^ _ центр, © — матрица. Если какие-либо собственные числа © обращаются в нуль, то под E{x,Q) будем понимать геометрическую фигуру, представляющую собой предел, к которому стремится последовательность эллипсоидов (7) с невырожденными матрицами, соответствующие собственные числа которых стремятся к нулю. В частности, Е(х, ©) может быть точкой. Будем называть эллипсоидами супердостижимости такие эллипсоиды, которые обеспечивают внешние эволюционные оценки для множеств достижимости.

Рассмотрим динамическую систему

x = A{t)x + B(t)w(t) + 0(t), i(l)£R", 4i)SRn (8) w(t)eE(g(t),W(t)), x(t0) e E(a0,Q0) (9)

где векторы g(t) и a0, а также матрицы W(t) и Qq известны. Тогда

x(t) e E (a{t),Q{t)), причём

Q = AQ + QAT + ^-j + g(t)G(t), G(t) = BWBT, Q(t0) = Q0 (10)

à = Aa + Bg + â, a(t0) = a0 (11)

Скалярная функция q(t) подчинена двум условиям. Во-первых, задача Коши (10) должна иметь решение, а во-вторых, q = q(t) > 0 при t >t0- Существующие методы выбора функции q(t) можно разделить на две группы. В обоих случаях вводится функционал L = L(S), гладко зависящий от произвольной симметрической матрицы S. Требуется, чтобы градиент grads L(S) на множестве симметрических матриц существовал и был неотрицательно определённой матрицей. Тогда q — -y/Tr(PQ)/ Tr(PG), причём для получения локально оптимальных эллипсоидов супердостижимости следует использовать соотношение P(t) = grads ¿(5)|s=q{(), минимизирующее скорость роста функционала в каждый момент времени между ¿о и моментом окончания процесса Т. Для получения глобально оптимальных эллипсоидов супердостижимости необходимо решать задачу Коши

Р=-РА- АТР, Р(Т) = grads L(S)|s=Q(r) (12)

Вариант (12) обеспечивает минимальное значение функционала в момент Т. Заметим, что оба варианта совпадают при ¿о = Т.

Часто начальное положение объекта в фазовом пространстве измеряют с весьма высокой точностью. Тогда матрица Qo вырождена и q(to) может обратиться в нуль, что может привести к появлению особой точки в (10). Положение ещё более осложняется, если матрица G тоже вырождена.

В §3.2 предложено искать q(t) в виде суммы qo + tqi + t2q2 + 0(t3) при f0 = 0, назначая соответствующие коэффициенты одновременно с получением членов суммы Q(t) = tQi + t2Q2 + t3Q3 + i4Q4 + 0(t5) при

Q(0) = 0. Получающиеся эллипсоиды не будут относиться ни к локально, ни к глобально оптимальным. Пусть существуют представления

A(t) = А0 + tÄ! + 0{t2), G(t) = Go + tGi + i2G2 + 0(t3)

где A0, Go, Gi, G2 — известные постоянные матрицы. Если выбрать ço = 0, çi = 1 и = 0, то

Q{t) = î2G0 + t3Q3 + j (A0Q3 + Q3Aj + A^q + G0Aj + G2) + 0(t5) Qz = {A0G0 + G0Al + Gj) /2

Оказалось, что такой подход даёт интересные результаты. В частности, выбор q(t) = t и замена Q(t) = tZ(t) в задаче (10) при Q(0) = 0 приводят к линейной по Z задаче

¿ = A{t)Z + ZAr(t) + G{t), G(t) = B(t)W(t)BT(t), Z{0) = 0 (13)

Если Qo Ф 0, то можно решить задачу Коши

Qa = AQa + QaAt, Qa{0) = Qo

Тогда искомая аппроксимация x(t) представляет собой сумму двух эллипсоидов: эллипсоида с матрицей Qa(Ï) и центром a(t) из (11) и эллипсоида с матрицей Q(t) — tZ(t) и центром в начале координат. Эта сумма может быть аппроксимирована одним эллипсоидом известными методами. Для простоты изложения в дальнейшем будем, как правило, полагать Qo = 0 и ограничиваться рассмотрением (13).

В §3.3 вектор w(t) в (8) рассматривается как управление с назначаемыми ограничениями, которые должны быть выбраны оптимальным в смысле некоторого критерия способом. Такого рода задача может возникнуть, в частности, при назначении соотношения мощностей управляющих воздействий по различным фазовым координатам. Например, в технических приложениях может потребоваться так распределить имеющиеся ресурсы управления при конструировании системы,

чтобы множество достижимости имело максимально возможные размеры по определённым направлениям в фазовом пространстве. Это даёт возможность улучшить управляемость при наличии априорных данных об условиях работы реального объекта. Соответствующий выбор должен быть сделан применительно ко всему ансамблю допустимых движений системы, что требует исследования множеств достижимости.

Уравнения (13) позволяют для любой допустимой реализации w(t) с помощью выбора матрицы IF(i) максимизировать функционал

IV (sQ(T)) + V (Л(t)Q(t)) - iIV dt

где Л(t) и постоянная S — произвольные положительно определённые симметрические матрицы, а Т — конечный момент времени. Например, если Е и Л одинаковы и диагональны, то выбор соответствующих элементов этих матриц определяет, насколько для данного практического применения величина максимума проекции множества достижимости на какую-либо ось системы координат важна по сравнению с аналогичными проекциями на другие оси. Назначение положительно определённой матрицы R(t) позволяет ограничивать норму матрицы W(t) и тем самым может отражать ограничения на суммарную максимальную управляющую силу в системе (8). С этой точки зрения задача состоит в выборе мощности каждого из нескольких приводов при ограниченности суммарного веса двигателей, их габаритов, уровня потребления энергии и т. д. В простейшем случае можно положить R(t) = к(Ь)1т, где «(i) — произвольная скалярная положительная функция.

Показано, что решение задачи всегда существует, единственно и имеет вид

W(t) = BTPBR-1, P=-ATP-PA-tA, Р{Т) = ТЕ

В §3.4 рассмотрен случай, когда сами границы допустимых значений х(<о) и w(t) известны неточно. В таких ситуациях можно выбрать

оценку возмущения настолько грубой, что она охватит все возможные варианты. Однако это может привести к неоправданно высокой неопределённости в значениях x(t). В качестве альтернативы можно построить эллипсоид, содержащий множество достижимости системы (8) при неточно заданных элементах матриц Q(t0) и W(t), описывающих границы возможных начальных условий и внешних воздействий (9). Для этого необходимо знать параметры эллипсоида, содержащего возможные значения этих элементов для Q(to) и аналогичного ему для W(t).

Воспользуемся тем, что система (13) линейна по компонентам матриц Z{t) и W(t). Составим вектор ip(t) размерности п(п + 1)/2 из элементов симметрической матрицы Z(t), находящихся не ниже главной диагонали, и вектор uj(t) размерности, не превышающей m(m + l)/2, из соответствующих элементов симметрической матрицы W(t). Оба эти вектора заданы неточно. Построим эллипсоид с матрицей Ф(£0), ограничивающий возможные начальные значения ip(to) и аналогичный эллипсоид с матрицей fi(f), аппроксимирующий cj(t). Тогда поставленная задача сводится к решению системы вида (13), но не для исходных векторов x(t) и w(t), а для ip{t) и ui(t) соответственно. Алгоритм применён к двум простым механическим системам.

В §3.5 изучена ситуация, когда можно управлять матрицей системы (8), (9) и таким образом учитывать всю совокупность возможных траекторий, т. е. управлять их ансамблем.

Пусть A(t) = Л0(<) + eAi(t,u) и i? = i?(t,u), а вектор g(t) = 0. Тогда система (8), (9) примет вид

x=(Ao(t) + eA1{t,u))x + B(t)w + 0(t,u), weE(0,W(t)) (14)

Здесь и € U € R*7 — управление, а скаляр е = const — малый параметр.

Множество достижимости (14) будем оценивать с помощью глобально оптимальных эллипсоидов. Задача состоит в том, чтобы найти такое

управление и для системы уравнений (14), что

IV (CQ{T)) + (Са(Т),а(Т)) min (15)

Здесь С — фиксированная положительно определённая матрица.

В результате проведённого исследования построен алгоритм, позволяющий построить указанное управление с погрешностью по функционалу (15), не превышающей О (є2). При этом удалось уменьшить порядок решаемой краевой задачи до удвоенной размерности вектора x(t), т. е. значения, характерного для такой задачи теории оптимального управления, в которой ансамбль траекторий системы (14) во внимание не принимается.

В §3.6 исследован случай, когда имеется погрешность в исполнении управляющего воздействия, зависящая от его величины. Пусть система (8), (9) имеет вид х = A(t)x + B(t, u)w + ги?(і), где w Є E{0, W(t)) и |it| < 1 — скалярное управление. Здесь, как и в §3.5, множество достижимости будем оценивать с помощью глобально оптимальных эллипсоидов, но вместо (15) будем использовать его упрощённый вариант, а именно L(Q) = Tr(CQ).

Показано, что оптимальное управление может принимать только значения ±1 и 0, причём существуют только такие точки переключения, в которых оно изменяется с ±1 на 0 и обратно, с 0 на ±1. Тем самым исследуемую проблему можно рассматривать как частный случай широко известного класса задач, искомое управление в которых можно назвать оптимальным по расходу топлива.

Четвёртая глава посвящена вопросам сравнения стохастического и детерминированного подходов к оцениванию фазового состояния динамических систем.

В §4.1 выяснены основания, на которых может быть построена математически корректная процедура сравнения гарантированного и ве-

роятностного методов. Пусть динамическая система задана уравнением

х = f{x,t,£)

(16)

где f = f (i) — гауссовский случайный процесс типа белого шума с ковариационной матрицей Rz(t,t') = M{£(í)£T(í')} = Wf(í)¿(í - ?), где (t) — матрица интенсивности шума, М означает взятие математического ожидания, a S(t) — дельта-функция Дирака. Необходимо найти тх = М{я} и матрицу ковариации Dx(t) процесса x(t).

Типичная задача гарантированного априорного анализа точности имеет следующий вид

где возмущающий вектор но = гл,'(£) лежит в заданном множестве Т, которое, например, может быть эллипсоидом. Требуется найти эллипсоид Е(а(£),19(^)), в котором лежит х(£).

Чтобы иметь возможность сравнить результат решения задачи (16) с таковым для (17), тх и Их нужно связать с а и <9. Для этого можно исходить из "правила 3 а", т. е. отождествлять область, вероятность попадания в которую превосходит некоторую заданную постоянную величину (например, 90%), с соответствующей областью (или её оценкой), получаемой в результате применения гарантированного метода.

В §4.2 рассмотрена динамическая система, описывающая движение некоторого технического устройства, подверженного влиянию помехи Т](Ь) и имеющая вид

х = A(t)x + B{t)T](t), х(0) =х0, х Є Rn, T¡(t) Є Rm (18)

Пусть r)(t) — ограниченный по норме центрированный широкополосный шум с интервалом корреляции, намного меньшим всех характерных постоянных времени рассматриваемой динамической системы (18), и с ограниченной дисперсией F(t). Назовём его практически белым шумом.

х — f(x, t, w)

(17)

Пусть xq — ограниченный по норме вектор с распределением, близким к нормальному, и матрицей дисперсии So- Назовём векторы такого типа практически гауссовыми. В частности, будем считать x(t) практически гауссовым на всём интересующем нас промежутке времени. Требуется найти дисперсию вектора x(t) как функцию времени.

Поставленная инженерная задача исследована средствами как вероятностного, так и гарантированного подходов. При переходе от практически белого шума r](t) к белому шуму с корреляционной матрицей <I>(i)5(i — т) по традиции предположим, что Ф(i) = ¡iF(t), где ц — константа, назначаемая из инженерных соображений и имеющая размерность времени. Практически гауссовы векторы заменим гауссовыми с той же дисперсией.

Тогда искомая дисперсия E(i) может быть найдена из уравнения

£ = Л(«)Е + 4- fiG(t), G{t) = B(t)F(t)BT(t), S(0) = E0

При использовании гарантированного подхода согласно §3.1 матрица эллипсоида, ограничивающего сверху значения х(0), будет равна Уо = q2Eo, а для т](t) получим эллипсоид с матрицей U(t) = a2F(t), где для "правила Зет" имеем а = 3. В этом случае x(t) является вектором, для которого внешней гарантированной оценкой будет некоторый эллипсоид Y(t). Тогда можно найти эллипсоид для среднего отклонения x(t) от среднего значения с матрицей Q(t) = Y(t)/a2, подчиняющейся уравнениям (10). Для всех конкретных L(Q), упомянутых в диссертации, функция q(t) и соотношения (10) не зависят от а и в дальнейшем будем полагать а = 1.

Проведено сравнение результатов применения обеих моделей. Указаны случаи, когда гарантированный подход даёт оценку дисперсии более точную, чем стохастический. Показано, что в некоторые моменты времени при определённых условиях матрица Qa в (16) совпадает с матрицей Dx в (17).

В §4.3 установлено, как следует выбирать модель возмущения, чтобы указанные моменты времени можно было назначать специально. Поскольку соответствующее решение в значительной степени уже изложено в [25], то в диссертации приведены только важные для исследуемого вопроса результаты. Это необходимо, поскольку здесь они интерпретируются иным, отличным от оригинальной статьи образом. Оказалось, что использованный способ сопоставления связывает параметры возмущения со свойствами объекта, т. е., если необходимо построить уравнения (16) и (17), дающие эквивалентный разброс значений фазовых координат динамической системы, при составлении модели возмущений требуется учитывать не только свойства самого возмущения, но и характеристики динамической системы, даже если исходное возмущение r](t) от последних не зависит.

В §4.4 составлен алгоритм, позволяющий сравнить результаты действия на динамическую систему процесса со случайными неограниченными приращениями и процесса с произвольными (в частности, детерминированными), но ограниченными приращениями. В качестве первого взят вектор V 6 Rm, каждая компонента которого — винеровский t

процесс, т. е. Vi = J Çi dt, где £ — центрированный белый шум с единич-о

НОЙ интенсивностью, соответствующий компоненте Vi. В качестве второго использовано ограниченное возмущение и G Е(0, Imt), где и € Rm.

В §4.5 в рамках метода эллипсоидов построен аналог фильтра Кал-мана для гарантированной оценки состояния динамической системы

х = A(t)x + B(t)w(t), х е R", w(t) е Rm

(19)

y(t) = H{t)x + v(t), y(t) € Rr

где матрицы A(t), B(t) и H(t) известны, вектор w(t) описывает возмущение, действующее на систему, а вектор v(t) — ошибку наблюдения. Будем аппроксимировать значения w(t) эллипсоидом размерности тпх m с известной матрицей W(t), а значения v(t) — эллипсоидом раз-

мерности г х г с известной матрицей К(<), причём центры обоих эллипсоидов будем считать нулевыми.

Уравнения искомого фильтра имеют вид

где а (О и д(£) — произвольные скалярные функции времени, причём а(0 > 0 и </(£) > 0 при t > ¿о- Интересно, что при £0 = О, Е(0) = О, р(0) = 0, у(0) = 0 замена переменных Е(4) = tZ(t), р(£) =

y{t) = z(t)V~t и выбор at) = ¿/О - 7(0), V(t) = 4/7(0. гДе 0 ^ 7(0 < 1,

Уравнения (21) по форме совпадают с известными уравнениями фильтра Калмана с точностью до множителей, зависящих от 7(t). С точки зрения, изложенной в §4.1, можно сказать, что эти множители увеличивают возможное воздействие факторов w(t) и v(t), входящих в (19), по сравнению со стохастическим случаем, когда W и V характеризуют интенсивности соответствующих шумов. Такой эффект связан с особенностями выбранного способа аппроксимации множеств достижимости. Функцию 7(£) можно назначить, например, в соответствии с требованием ^ Tr (C£(t)) —> min, где С — произвольная постоянная неотрицательно определённая матрица. Тогда

р = А'р + £ЯТ У'"1 (y{t) - Hp), p(t0) = x(to) Ë = A'E + EA'T - E#TV'-1i/£ + BW'Br, £(i0) = E0 A' = A + IJ (2g(t))

W' = q(t) (1 + ait)-1) W, V' = qit) (l + a{t)) V

(20)

(21)

7(0 =

0,

Tr iCZHTV'lHZ) '

TrjCBWBT)

TriCBWBT) > TV (CZHtV~1HZ) ,TriCBWBT) < Tr (CZ^V^HZ)

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ

Получено численно-аналитическое решение задачи о приведении материальной точки в начало координат с нулевой скоростью посредством ограниченной по модулю силы за минимально возможное время. Для того же объекта исследована возможность наискорейшего достижения поверхности заданной сферы в фазовом пространстве как в отсутствие, так и при наличии однородной вязкой среды. Аналитически решена задача определения границы области допустимых начальных условий, позволяющих уклониться от неподвижного сферического препятствия динамическому объекту, управляемому ограниченной силой. В замкнутой форме построен синтез оптимального управления в задаче оптимального быстродействия для линейной системы третьего порядка с инерционным управлением.

Рассмотрена задача о наискорейшем переводе центра масс манёвренного самолёта из одной заданной точки трёхмерного пространства в другую при фиксированных векторах скоростей в этих точках. Найдены численные решения при совпадающих начальных и конечных условиях для траекторий, целиком лежащих в вертикальной плоскости. Показано, что в общем случае решение неединственно, причём наилучшая траектория может менять знак кривизны. Найдены локально оптимальные решения. Рассмотрена задача с учётом ограничения на знак кривизны траектории и вычислены соответствующие оптимальные управления как при фиксированной, так и при свободной конечной точке.

В результате выполнения диссертационной работы получила дальнейшее развитие теория аппроксимации множеств достижимости с помощью эллипсоидов. Построена внешняя гарантированная эллипсоидальная оценка, применимая при любом вырождении как начального эллипсоида, так и эллипсоида, содержащего вектор внешнего возмущения. Показано, что она обеспечивает высокую точность аппроксима-

ции на малых интервалах времени. Исследована задача выбора параметров эллипсоида, содержащего вектор управления. Разработан метод решения проблемы построения гарантированной внешней аппроксимации множества достижимости линейной динамической системы в случае, когда границы допустимых значений неопределённых факторов известны неточно. Рассмотрены с теоретических позиций частный случай неточной реализации управления исполнительными устройствами и случай управляемой матрицы системы. Получены результаты, позволяющие учитывать всю совокупность возможных траекторий ансамбля.

Выяснены основания, на которых может быть построена математически корректная процедура сравнения гарантированного и вероятностного методов описания различных неопределённых факторов. Для динамических систем, традиционно моделируемых методами теории вероятностей, рассмотрена проблема составления математической модели линейной динамической системы с аддитивным неопределённым воздействием по её инженерному описанию. Указаны условия, при которых использование стохастической модели может привести к значительному завышению оценки степени неопределённости фазового вектора по сравнению с ситуацией, когда применяется гарантированный подход. Разработан метод сопоставления результатов действия на линейную динамическую систему процесса, имеющего случайные неограниченные приращения, и процесса с произвольными, в том числе и детерминированными, но ограниченными приращениями. Разработан фильтр, аналогичный известному фильтру Калмана, для получения непрерывной во времени внешней гарантированной эллипсоидальной оценки состояния динамической системы по данным измерений.

Литература

1. Акуленко Л. Д., Шматков А. М.Синтез управления в задаче оптимального по быстродействию приведения материальной точки в заданное положение с нулевой скоростью // ПММ. 1998. Т. 62. Вып. 1. С. 129-138.

2. Акуленко Л. Д., Шматков А. М. Наискорейшее попадание на сферу с нулевой скоростью // Докл. Академии наук. 2001. Т. 379. № 1. С. 28-32.

3. Акуленко Л. Д., Шматков А. М. Оптимальное по быстродействию достижение сферы материальной точкой с нулевой скоростью // ПММ. 2002. Т. 66. Вып. 1. С. 10-23.

4. Акуленко Л. Д., Шматков А. М. Оптимальное уклонение объекта от сферического препятствия // Докл. Академии наук. 2002. Т. 387. № 5. С. 608-612.

5. Акуленко Л. Д., Шматков А. М. Уклонение динамического объекта от неподвижной сферы под действием ограниченной силы // ПММ. 2003. Т. 67. Вып. 2. С. 179-190.

6. Акуленко Л. Д., Шматков А. М. Оптимальное по быстродействию пересечение сферы в вязкой среде // Изв. РАН. Теория и системы управления. 2007. № 1. С. 23-30.

7. Желнин Ю. Н., "Утёмов А. Е., Шматков А. М. Оптимальный по быстродействию манёвр "петля" без потери скорости // Изв. РАН. Теория и системы управления. 2012. № 6. С. 170-185.

8. Овсеевич А. И., Шматков А. М. К вопросу о сопоставлении вероятностного и гарантированного подходов к прогнозу фазового состояния динамических систем // Изв. РАН. Теория и системы управления. 1997. № 4. С. 11—16.

9. Черноусько Ф. Л., Шматков А. М. Синтез оптимального быстродействия в одной системе третьего порядка // Доклады Академии наук. 1997. Т. 354. № 2. С. 174-177.

10. Черноусько Ф. Л., Шматков А. М. Оптимальное по быстродействию управление в одной системе третьего порядка // ПММ. 1997. Т. 61. Вып. 5. С. 723-731.

11. Шматков А. М. Об управлении системами с помехой, ограниченной по величине // Изв. РАН. Техн. кибернетика. 1994. № 4. С. 48-55.

12. Шматков А. М. Об управлении ансамблем траекторий при наличии ограниченной помехи // Изв. РАН. Теория и системы управления. 1995. № 4. С. 82—87.

13. Шматков А. М. Сопоставление стохастического и эллипсоидального оценивания неопределённости для динамической системы с возмущениями, ограниченными по величине // Докл. Академии наук. 2006. Т. 411. № 4. С. 460463.

14. Шматков А. М. О невырожденной локально оптимальной эллипсоидальной аппроксимации оценки состояний линейных систем // ПММ. 2008. Т. 72. Вып. 2. С. 241250.

15. Шматков А. М. Об оптимальном выборе ограничений по управлению // ПММ. 2010. Т. 74. Вып. 1. С. 170-175.

16. Шматков А. М. Оценивание фазового состояния динамической системы при неточно заданных границе« возмущений // Изв. РАН. Теория и системы управления. 2011. № 4. С. 66-72.

17. Шматков А. М. Построение аналога фильтра Калмана для гарантированной оценки состояния динамической системы // Изв. РАН. Теория и системы управления. 2011. № 5. С. 33-40.

18. Chernousko F. L., Shmatkov А. М. Synthesis of time-optimal control in the third order system // Proc. of the International IFAC Workshop "Nonsmooth and Discontinuous Problems of Control and Optimization". June 17-20, 1998, Chelyabinsk.

19. Chernousko F. L., Shmatkov A. M. New results on optimal ellipsoidal estimation for uncertain dynamical systems // Proc. of the World Congress IFAC-2002, v. 15, part 1, 2002, Barcelona, Spain.

20. Schweppe F. C. Uncertain dynamic systems. Englewood Cliffs, New Jersey: Prentice Hall, 1973. 563 p.

21. Курмсанский А. Б. Управление и наблюдение в условиях неопределённости. М.: Наука, 1977. 392 с.

22. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. 320 с.

23. Chernousko F. L. State estimation for dynamic systems. Boca Raton, Florida: CRC Press, 1994. 304 p.

24. Kurzhanski А. В., Valyi I. Ellipsoidal calculus for estimation and control. Boston: Birkhauser, 1997. 321 p.

25. Ким Ю. В., Овсеевич А. И., Решетняк Ю. Н. Сравнение стохастического и гарантированного подходов к оцениванию состояния динамических систем // Изв. АН СССР. Техн. кибернетика. 1992. № 2. С. 87-94.

Антон Михайлович Шматков

Оптимальное управление и оценивание движения в некоторых задачах динамики

01.02.01 — Теоретическая механика Подписано к печати 27.09.2012, Заказ № 18-2012. Тираж 70 экз.

Отпечатано на ризографе ИПМех РАН 119526, Москва, пр-т Вернадского, 101, 1

 
Текст научной работы диссертации и автореферата по механике, доктора физико-математических наук, Шматков, Антон Михайлович, Москва

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ

ИНСТИТУТ ПРОБЛЕМ МЕХАНИКИ ИМ. А. Ю. ИШЛИНСКОГО РОССИЙСКОЙ АКАДЕМИИ НАУК

05201350456

На правах рукописи

ШМАТКОВ Антон Михайлович

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И ОЦЕНИВАНИЕ ДВИЖЕНИЯ В НЕКОТОРЫХ ЗАДАЧАХ ДИНАМИКИ

Диссертация на соискание учёной степени доктора физико-математических наук (специальность 01.02.01 — теоретическая механика)

Москва — 2012

Содержание

Введение................................................4

Глава 1. Использование детерминированных моделей для оптимизации систем

§1.1. Оптимальное по быстродействию достижение заданной точки с нулевой конечной скоростью.....................19

§1.2. Оптимальное по быстродействию достижение сферы с нулевой конечной скоростью..............................33

§1.3. Влияние вязкой среды...............................52

§1.4. Уклонение от неподвижной сферы с помощью ограниченной силы...............................................66

§1.5. Инерционность при реализации управления.........84

Глава 2. Оптимальный по быстродействию манёвр "петля" без потери скорости

§2.1. Постановка задачи...................................98

§2.2. Оптимальное управление в трёхмерном случае.....106

§2.3. Учёт ограничения на знак кривизны траектории... 111

Глава 3. Развитие и применение метода эллипсоидов

§3.1. Общие положения...................................118

§3.2. Новый способ аппроксимации оценки состояния линейной системы на основе метода эллипсоидов..............124

§3.3. Оптимальный выбор ограничений по управлению .. 133

§3.4. Оценивание фазового состояния динамической системы при неточно заданных границах возмущений............139

§3.5. Управление матрицей системы......................146

§3.6. Неточная реализация управления...................152

Глава 4. Сопоставление стохастического и эллипсоидального оценивания неопределённости в динамической системе с возмущениями, ограниченными по величине

§4.1. Обсуждение проблемы..............................163

§4.2. Системы, близкие к стохастическим................167

§4.3. Построение возмущений, одинаково действующих на систему .....................................................173

§4.4. Сравнение воздействия винеровского и ограниченного процессов.................................................176

§4.5. Построение аналога фильтра Калмана для гарантированной оценки состояния динамической системы........182

Заключение..........................................191

Литература..........................................193

Приложение.........................................220

Введение

Как известно, к задачам оптимального быстродействия для материальной точки применимы методы оптимального управления движением в виде принципа максимума Л. С. Понтрягина [122], динамического программирования [122], [26], /-проблемы моментов [74], а также прямые вариационные и численные методы [146], [28]. Однако до настоящего времени решённых задач сравнительно мало (см., например, [108], [67], [25], [97], [18], [208], [81], [43], [68], [98], [209], [44], [19], [63], [210], [136], [20], [80], [21], [135], [107], [64], [137]). Основная причина такого состояния дел в том, что после применения принципа максимума часто приходится решать нелинейную краевую задачу вдвое большей размерности, чем исходная. Поэтому представляют интерес любые модели, для которых может быть построен синтез, если они отражают реальность лучше, чем те, для которых он уже построен, без введения дополнительных переменных или используют минимальное их количество (см., например, [153], [73], [94], [60]).

Ещё в 1964 году А. М. Лётов справедливо указывал [90], что "инженеру мало одних утверждений о существовании или возможности получения частных решений в численном виде с помощью ЭЦВМ". Через десять лет [14] отмечалось, что "работ, посвященных решению детерминированной задачи синтеза оптимальной замкнутой системы терминального управления, в отечественной и зарубежной литературе опубликовано значительно меньше, чем работ, в которых управление ищется в виде программы и(£). Лишь в некоторых из них решение доведено до конечной формы или указана эффективно реализуемая вычислительная процедура решения". Аналогичное утверждение можно найти и в [22]. Двадцать лет спустя [41] положение оставалось прежним: "в настоящее время трудно указать хотя бы одну проблему качественной теории, которая не была бы уже достаточно полно решена для рассматриваемой

задачи. Вместе с тем не легче указать и хотя бы один эффективный

*

алгоритм численного решения задачи, позволяющий быстро и устойчиво получать достаточно хорошие управления, па которых ограничения выполняются с любой заданной точностью". В начале 90-х годов было замечено [237], что "most real-world problems are becoming too complex to allow analytical solution1". В начале XXI века оказалось [179], что "When faced with an optimal control problem, it is tempting to simply "paste" together packages for optimization and numerical integration2", т. е. решение проблемы оптимизации кажется естественным начинать с её численного представления. И в последнее время продвижение вперёд в данной области в основном было по-прежнему связано с прогрессом в сфере компьютерной техники. В итоге современные учебники [226] все примеры построения синтеза в аналитическом виде заимствуют из одного и того же классического набора (см., скажем, [122]).

Однако для приложений в связи с необходимостью построения опорных управлений и оценок большой интерес представляют полные точные решения задач управления движением при упрощающих предположениях относительно структуры объекта, вида и формы наложенных на него ограничений.

В особенности это относится к случаям, когда на систему влияют различные неопределённые возмущения: воздействие противника и другие внешние факторы, неконтролируемые вариации параметров, погрешности в измерении начальных условий. Иногда можно сделать полезные выводы, используя строго детерминированные построения, без расширения фазового пространства задачи для включения дополнительных переменных, описывающих такие возмущения. Например, обычно задачи уклонения от преследования рассматривают в рамках

1 большинство практических задач становятся слишком сложными для аналитического решения

2 При встрече с задачей оптимального управления заманчиво просто "склеить" вместе программы для оптимизации и численного интегрирования

теории дифференциальных игр: [124], [121], [123], [99], [77], [159], [125]. Однако поиск управления, гарантирующего уклонение от неподвижного противника в малой окрестности последнего и отыскание достаточных условий, при которых для начальной позиции существует решение задачи уклонения от столкновения с телесным препятствием, фактически сводится [92] к решению задач оптимального управления с фазовыми ограничениями. В общем случае для создания удовлетворительной модели приходится прибегать к более сложным способам [235].

Самым распространённым подходом к исследованию неопределённых величин является вероятностный (стохастический) метод. В нём каждому неопределённому вектору сопоставляется некоторое распределение вероятностей с заданной плотностью. Соответствующим этому подходу математическим аппаратом является теория случайных процессов. Отметим, что вероятностный подход требует знания статистических характеристик исходных неопределённых факторов, что далеко не всегда доступно на практике. Вместе с тем при недостаточности априорных сведений о вероятностных характеристиках ошибок исходных данных возможно возникновение таких явлений, как ухудшение точности при увеличении количества оцениваемых параметров, а увеличение числа измерений больше некоторого количества не только становится бесполезным, но и затрудняет исследование [173].

Гарантированный (минимаксный) подход оперирует с множествами, в которых лежат неопределённые векторы. При этом предполагается, что неизвестные помехи локализованы в известных множествах, а в остальном произвольны. Наиболее адекватным математическим аппаратом для его описания должна служить теория дифференциальных игр. По существу, именно ей он обязан самим своим появлением. В работах [74], |75] при формулировке правила экстремального прицеливания для дифференциальных игр изучаются общие фундаментальные свойства множеств достижимости. Это родство объясняет и недостат-

ки гарантированного способа. Он предполагает гипотезу о наиболее неудачной возможной реализации помех и его применение приводит к значительному росту допустимых отклонений переменных, описывающих движение системы. Однако теория дифференциальных игр весьма сложна (см., например, [220]) и минимаксный способ стал развиваться в значительной мере самостоятельно, сохраняя, однако, связь с ней [87].

Гарантированный подход обнаруживает связи с вероятностными методами [76], [86]. Кроме того, гарантированный способ оценивания управляемых систем смыкается с теорией дифференциальных включений [24], [147], в частности понятие инвариантного множества дифференциального включения родственно понятию множества достижимости управляемой системы.

В ряде работ (см., например, [23], [11], [13], [12]), предложены способы, соединяющие в себе элементы как стохастического, так и гарантированного методов. Например, в [23] функции распределения вероятностей ошибок исходных данных считаются неизвестными, а задаются лишь некоторые множества, которым могу принадлежать указанные функции. В дальнейшем отыскивается способ решения рассматриваемых задач, гарантирующий достижение поставленной цели при наихудшем возможном распределении ошибок исходных данных. Такой подход также принято называть гарантирующим или минимаксным, хотя он имеет дело не с геометрическими ограничениями на неопределённые величины, а с геометрическими ограничениями на их функции распределения. Однако результат носит вероятностный характер и, естественно, область применимости этого способа ограничена областью применимости теории вероятностей как таковой.

Таким образом, оба подхода имеют как свои достоинства, так и недостатки. Один из главных недостатков гарантированного способа состоит в том, что операции над неопределёнными величинами в общем случае переходят в операции над множествами сколь угодно сложной

формы. Даже если исходные множества в начальный момсттт времени имеют геометрическую форму, требующую небольшого числа параметров для обработки и хранения, то в результате аффинных преобразований, сложения и пересечения множеств могут получаться многообразия сложной, и, самое главное, трудно предсказуемой формы. В [49], [50], [151], [152], [138], [45], [78], [139], [95], [197], [96], [79], [218], [144] изучается структура множеств достижимости, а также предельных множеств достижимости, получающихся при стремлении времени к бесконечности, называемых множествами управляемости и связанных с ними проблем. Выяснилось, что в этом случае могут получаться множества весьма необычного вида [46], [200]. Например, в пространстве форм областей достижимости в случае, когда матрица системы и множество возможных управлений имеют периодическую зависимость от времени, существуют аттракторы [101].

Свойства компактности и непрерывной зависимости множеств достижимости от времени исследовались в работах [192], [203], [229].

Изучение множества достижимости управляемой системы тесно связано с исследованием её множества притяжения, представляющего собой совокупность точек фазового пространства, из которых система может быть приведена в начало координат в течение заданного промежутка времени с помощью допустимых управлений. Соответствующим методам посвящено много работ (см., например [58], [198]). В последние годы в этой области стали использовать теорию линейных матричных неравенств [18], [119], [85].

К численным методам, применимым в общем случае при сравнительно небольшой размерности задачи, следует отнести аппроксимацию множеств объединением точек [47], [48], [230], а также, при несколько большей размерности, способы, которые основываются на теории линейных неравенств, которая выделяет в пространстве фазовых координат многогранники [190], [29], [182], [199], причём вершин может быть

много. В частности, для невыпуклых множеств можно использовать невыпуклые многогранники [227] или представлять множества в форме конечного набора выпуклых сечений [100] и аппроксимировать их выпуклыми многогранниками [115], [84]. При увеличении размерности объём вычислений, необходимый для реализации этих методов, быстро растёт.

Проблема несколько упрощается, если множество достижимости выпукло или может быть удовлетворительно аппроксимировано выпуклым [164]. Соответствующие условия были рассмотрены, например, в [24], [111], [112]. Для линейных систем множества достижимости являются выпуклыми даже при невыпуклых ограничениях на неопределённости, в них входящие (см., например, [160]). Тогда можно применять хорошо развитый математический аппарат опорных функций [129], [126]. В частности, на его основе введено понятие информационного множества, установлены его свойства, предложены способы построения и аппроксимации, рассмотрены совместные ограничения на ошибки измерений и начальные данные, включающие как совместное квадратичное ограничение, так и другие возможные ограничения [74], [86].

В [109], [НО], [ИЗ], [114] получено дифференциальное уравнение в частных производных для опорной функции множества достижимости, введено понятие интегральной воронки управляемой системы.

Оценки показывают, что даже в линейном случае без создания принципиально новых моделирующих устройств ни сейчас, ни в обозримом будущем достаточно полные поточечные описания в пространствах большой размерности для сколько-нибудь широкого класса реальных систем практически невозможны. Очевидность этого обстоятельства вызывает к жизни попытки ввести множества простой (канонической) формы, приближающие настоящие множества достижимости. Под простой понимается такая форма, которая при соблюдении допустимой точности аппроксимации требует приемлемых вычислительных ресур-

сов. При этом все входящие в задачу множества заменяются на множества канонической формы. Возникает задача построения операций над каноническими множествами, результат которых был бы максимально близок в смысле некоторого критерия к результату соответствующих операций над истинными множествами неопределённости. Несмотря на то, что универсальная каноническая форма, по-видимому, не существует, разнообразие форм сравнительно невелико.

Во-первых, это параллелепипеды (см., например, [32], [175], [191], [189], [223], обзор [224]), причём их грани во многих случаях параллельны координатным плоскостям. В этом случае происходит переход к покоординатным оценкам [69] в рамках интервального анализа — давно [225] и хорошо разработанной теории [61], [10]. Дальнейшее развитие в этом направлении ведёт к использованию геометрических сумм отрезков в количестве, превышающем размерность фазового пространства — зонотопам [211]. Можно также употреблять семейства параллелотопов [57], [70], [71], [72].

Во-вторых, это эллипсоиды, использовать которые в качестве канонических множеств было предложено в [232] и [178]. Метод был развит в [233], [86], [160], [185], [193], [213], [214], [105] и многих других работах. Например, его можно применять для систем с импульсным управлением [36], [37], [150], а также для нелинейных систем [149], [148], [194]. Эллипсоиды используют и для аппроксимации множеств притяжения [155], [120], [120].

Обе эти формы можно употреблять совместно. Например, в [52], [51] предложено использовать объединения шаров и параллелепипедов, а также множеств более общего вида.

С точки зрения инженерного применения желательно, чтобы гарантированный способ аппроксимации отвечал следующим требованиям.

1°. Геометрические фигуры, которыми в конечном итоге приближают множества достижимости в рамках некоторого метода, должны

быть понятны специалистам, которые будут им пользоваться.

Реальное применение находит только конкретный результат расчётов, а его можно с удовлетворительной точностью получить многими способами. Уникальной системы уравнений, имманентных техническому устройству, не существует. Его конструктор может оказать большую помощь математикам в составлении адекватной модели этого устройства, если он в состоянии наглядно представить себе те объекты, которыми оперируют теоретики. Другими словами, желательно, чтобы система уравнений с самого начала была ориентирована на определённый метод аппроксимации. Например, весьма полезный пакет программ [215] (см. также [216]) специально приспособлен для аппроксимации множеств достижимости большим количеством эллипсоидов. Однако в абсолютном большинстве тех случаев, когда исследование проходило без непосредственного участия создателей [215], в рамках [215] было использовано приближение либо одним эллипсоидом (см. [53], [181], [183], [196], [201], [231]), либо двумя (см. [202]). Особенно интересна работа [207]. Сначала в ней с помощью [215] искомое множество было построено как объединение большого количества эллипсов, каждый из которых лежит внутри этого множества и касается границы последнего в единственной точке. Затем авторы [207] приложили значительные усилия, чтобы уменьшить количество указ