Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Гагаринов, Петр Владимирович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости»
 
Автореферат диссертации на тему "Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости"

Московский государственный университет им. М.В. Ломоносова

005532068

н " Л

На правах рукописи

Гагаринов Петр Владимирович

Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости '

01.01.02 — дифференциальные уравнения, динамические системы и оптимальное управление

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2013г.

15 АВГ2013

005532068

Работа выполнена на кафедре системного анализа факультета Вычислительной математики и кибернетики в Московском государственном университете им. М.В. Ломоносова.

Научный руководитель: заведующий кафедрой

системного анализа ВМК МГУ, академик РАН, профессор, доктор физико-математических наук Александр Борисович Куржанский

Официальные оппоненты: доктор физико-математических наук,

МИАН имени В.А. Стеклова, ведущий научный сотрудник Михаил Сергеевич Никольский

доктор физико-математических наук, главный научный сотрудник ВЦ РАН профессор Александр Владимирович Лотов.

Ведущая организация: Институт математики и механики

им. Н.Н.Красовского

Уральского отделения Российской академии наук

Защита состоится 11 сентября 2013 года в 15 часов 30 минут на заседании диссертационного совета Д 501.001.43 в Московском государственном университете им. М.В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, 2-й учебный корпус, факультет ВМК, аудитория 685.

С диссертацией можно ознакомиться в научной библиотеке им. A.M. Горького Московского государственного университета им. М.В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, 2-й учебный корпус.

Автореферат разослан 2013 г.

Ученый секретарь

диссертационного совета Д 501.001.43

доктор физико-математических наук, профессор

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Решение задачи управления по принципу обратной связи является центральной в математической теории управления, особенно для систем, функционирующих в условиях неопределённости, конфликта и недостатка информации [1, 2, 3, 4]. Основным стимулом для возникновения соответствующей математической теории явились прикладные задачи управления движением, автоматики, робототехники и.т.д. В настоящее время подобные задачи возникают в моделях управления транспортными потоками, при изучении квантовых процессов, управления энергосистемами, а также в других моделях высоких технологии. Важную роль в решенин подобных задач является сведение их к проблеме достижимости для линейных и нелинейных систем.

Настоящая диссертация посвящена задаче оценивания областей достижимости и попятных областей разрешимости для линейных систем при неопределённости с управлением в форме обратной связи. Построение трубок решений, описывающих эволюцию областей достижимости управляемых систем в прямом и попятном времени, является одним из основных подходов к решению задач синтеза управления и гарантированного оценивания для таких систем. Использование метода динамического программирования, развитого Р. Беллманом[5] и Р. Айзексом[6], в том числе, для систем с неопределённостью, позволяет находить области достижимости как множества уровня функции цены для соответствующей задачи оптимизации. Такая функция цены является решением уравнения в частных производных типа Гамильтона-Якоби-Беллмана-Айзекса (HJBI). Но в общем случае эта функция цены нередко оказываются не всюду гладкой. Понятия обобщённых решений, таких как вязкостные решения П.Л.Лионса и М.Г. Крендалла[7], а также минимаксные решения А.И. Субботина[8] позволили существенно расширить область применимости данного подхода, однако нахождение таких решений требуют значительно вычислительной нагрузки. В тоже время, для линейных систем с выпуклыми ограничениями, обобщённые решения не обязательны, так как функции цены выпуклы и следовательно всюду дифференцируемы по любому направлению. Их можно точно описать при помощи теории двойственности выпуклого анализа. Использование множеств уровня функций цены, их подробное описание и возможность их вычисления позволили разработать эффективные методы описания их сечений в виде трубок достижимости как многозначных функций. Далее последовала теория аппроксимаций выпуклозначных функций при помощи эллипосидальных трубок (см. A.B. Кур-жанский {9, 10, 11, 12, 13, 14, 15, 16, 17]).

В данной диссертации рассматривается теория аппроксимаций для трубок

достижимости при неопределённости. Такие точные трубки в прямом времени имеют самостоятельное значение. В обратном же времени они совпадают по своим основным свойствам с понятиями альтернированного интеграла Л.С. Понтрягина и моста Н.Н.Красовского. Упомянутый альтернированный интеграл был введён в работах [18, 19] при геометрических ограничениях на управление и неопределённость. Дальнейший вклад в изучение свойств данного интеграла внесли М.С. Никольский, Е.Ф. Мищенко, А.П. Пономарев, Е.С. Половин-кин, Н.Х. Розов[20] . (Следует заметить, что предложенные методы вычисления этого интеграла приводят к значительным вычислительным трудностям, связанным с необходимостью искать выпуклые оболочки надграфиков разностей опорных функций в многомерном пространстве. Последнее особенно касается систем высокой размерности.). Описание мостов Н.Н.Красовского дано в рабо-тах[2, 3, 21, 22, 23, 24, 25].

Аппарат эллипсоидального исчисления, разработанный в работах А.Б. Кур-жанского и его соавторов, позволяет искать трубки достижимости при неопределённости в задаче с непрерывной коррекцией в виде "тугих" внешних и внутренних эллипсоидов ("касающихся" изнутри вдоль "хороших" кривых, определяемых фундаментальной матрицей линейной системы). Подход к вычислениям более трудных внутренних эллипсоидальных оценок трубок с параметрами, являющимися решением обыкновенных дифференциальных уравнений описан в работах[10, 11, 12, 13, 14, 15, 16, 17, 26]. Этот поход рассматривался при некоторых условиях невырожденности. Заметим, однако, что поскольку в конструкцию таких тугих эллипсоидальных оценок заложено предположение о равенстве разности опорных функций вдоль направлений касания внутренних оценок и альтернированного множества достижимости, они склонны вырождаться в те моменты, когда данное предположение перестаёт выполняться. Последнее особенно актуально для систем большой размерности при малой размерности управления. Метод регуляризации эллипсоидальных аппроксимаций путем перемешивания нескольких эллипсоидальных оценок, предложенный в работе[27], позволяет преодолеть указанные сложности, в частности и для систем высоких размерностей (п ^ 500). Диссертация же посвящена альтернативному методу регуляризации, основанному на видоизменении структуры самого альтернированного интеграла, для которого получаются невырождающиеся тугие эллипсоидальные аппроксимации.

Цель работы состоит в поиске способа видоизменения (регуляризации) структуры классического альтернированного множества достижимости таким образом, который бы допускал выбор регуляризирующих параметров в процессе чис-

ленного построения эллипсоидальных аппроксимаций и обеспечивал их продолжаемость, а также в построении оценок, связывающих видоизменённое множество достижимости с исходным.

Основные результаты работы,

1. Введены операции квадратичного суммирования и вычитания центрально-симметричных компактов. Исследованы свойства этих операций и получены оценки, связывающие операции квадратичного суммирования и вычитания с алгебраической суммой и геометрической разностью. В частности получены асимптотические оценки квадратичной суммы через алгебраическую сумму для центрально-симметричного компакта и эллипсоида.

2. С использованием новых операций введено понятие квадратично-регуля-ризованного альтернированного множества достижимости, доказана теорема о его существовании и единственности. Построены схемы внутренних и внешних тугих эллипсоидальных оценок с адаптивной регуляризацией для квадратично-регуляризированных альтернированных трубок достижимости. Построены оценки квадратичного альтернированного множества через "обычные" альтернированные множества. Предложена схема комбинирования оценок для разных направлений.

3. Построены алгоритмы проецирования на статические и динамические (обусловленные фундаментальной матрицей системы) подпространства. Построены эллипсоидальные оценки квадратично-регуляризированного альтернированного множества достижимости к моменту и его границы.

4. Введены операции р-суммирования и р-вычитания центрально-симметричных компактов как обобщённые варианты квадратичной суммы и разности. Исследованы свойства обобщённых операций и получены оценки, связыва-ющение результаты применения данных операций для разных значений степени р.

Научная новизна работы. Полученные результаты являются новыми. В работе рассмотрено не изучавшееся ранее квадратично-регуляризированное альтернированное множество достижимости, а также операции операции квадратичного суммирования и вычитания множеств и их обобщения на случай произвольного р > 1. Для регуляризированного множества достижимости получены оценки, связывающие его с исходным классическим множеством. Эллипсоидальные оценки с адаптивным выбором регуляризирующих параметров решают проблему вырождения оценок, представленных в[15] и являются их обобщением.

Теоретическая и практическая ценность работы. Работа носит в основном теоретический характер. Квадратично-регуляризованноый интеграл, а также квадратичные операции суммирования и вычитания могут представлять интерес для дальнейших исследований. Полученные во второй главе схемы адаптивной регуляризации позволяют перейти к практически реализуемым численным алгоритмам и таким образом решать задачу до конца.

Методы исследования. Квадратично-регуляризированный интеграл, который возникает при замене алгебраической суммы множеств квадратичной суммой исследовался в работе с точки зрения решения эволюционных уравнений в виде интегральных воронок. При этом, как и при исследовании свойств квадратичной суммы и разности, использовались элементы выпуклого и многозначного анализа. Кроме того, в диссертации использован аппарат эллипсоидального исчисления [9] а также теории обыкновенных дифференциальных уравнений и экстремальных задач.

Апробация работы. Результаты работы были представлены в виде докладов на научно-исследовательских семинарах кафедры системного анализа факультета ВМиК МГУ (рук. Куржанский А.Б.), отдела динамических систем ИММ УрО РАН (рук. Ушаков В.Н.), а также на международной конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-2013" (Москва, МГУ, апрель 2013 г.)

Публикации. По теме диссертации опубликовано 2 работы.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Общий объем диссертации 104 страниц. Библиография включает 87 наименований.

Краткое содержание работы. Во введении дается краткий обзор литературы, примыкающей по своей тематике к вопросам, рассмотренным в диссертации, раскрываются цели работы, а также дается краткое описание основных результатов, полученных в работе.

В первой главе вводится и исследуется квадратичная операция сложения множеств, которая была нами введена в [28] для повышения эффективности эллипсоидальных аппроксимации альтернированных множеств достижимости [14, 15]) линейных управляемых систем при неопределённости с эллипсоидальными ограничениями на управление, помеху и начальное состояние. Как показано в[19, 29] существование альтернированного интеграла требует ограниченности изнутри интегральных сумм соответствующих трубкам достижимости минимаксного типа с конечным числом коррекций, причём ограничение не должно зависеть от точек коррекции и их числа. В общем случае для упомянутых линей-

ных систем такой ограниченности может не быть, и тем самым существование альтернированного интеграла гарантировать нельзя. Однако, понятие достижимости в д-окрестность, введённое в [15], позволило гарантировать существование альтернированного интеграла для любой системы вышеупомянутого вида для достаточно больших ц. В той-же работе было показано, что достижимость в ^-окрестность соответствует прибавлению шара радиуса ¡ш в интегральных суммах на каждом шаге коррекции, где а - расстояние между соседними точками коррекции. Тем не менее, тугие внутренние эллипсоидальные оценки, рассматриваемые в[15], могут вырождаться даже когда альтернированный интеграл существует. Это происходит из-за того, что при построении оценок использовано предположение о возможности перейти от опорной функции геометрической разности к разности опорных функций вдоль "хороших" направлений, порожденных фундаментальной матрицей системы. Для преодоления данной проблемы в [28] мы обобщили подход с ¿г-окрестностыо, заменив её на Л/-окрестность, заданную функцией М = М{ •), определяющей в каждый момент Ь еТ эллипсоид £(0,М(Ь)), где под эллипсоидом £(а, <5) с центром а и матрицей конфигурации <2 будем понимать множество {ж : (х,1) ^ {1^1)^}. Этот шаг позволил менять размер и форму окрестности в зависимости от динамики "хороших" направлений и предотвращать вырождение внутренних оценок за счет выбора достаточно больших М{£). Более того, для повышения эффективности вычисления параметров эллипсоидальных оценок, вместо аппроксимации множества достижимости мы аппроксимировали видоизменённое множество, отличающееся от исходного тем, что на каждом шаге коррекции эллипсоид £(0,аМ({)) прибавляется не в алгебраическом смысле, а в смысле операции ф квадратичного суммирования централыю-симметрпчных выпуклых компактов, свойствам которой посвящена данная глава. Одним из важных свойств операции ф является то, что она сводит вычисление квадратичной суммы эллипсоидов к суммированию их конфигурационных матриц. Видоизменённое множество уже не является вообще-говоря множеством достижимости, однако свойства операции ф позволяют оценить близость с исходным множеством достижимости [15]). В дополнении к операции квадратичного суммирования также вводится операция квадратичного вычитания ©, обратная к операции ф и обладающая аналогичными свойствами. Свойства операции Ф используются далее во второй главе для получения внутренних оценок видоизменённого множества достижимости через исходное множество.

Первая глава состоит из четырех разделов.

В первом разделе вводится квадратичная операция ф сложения центрально-

симметричных выпуклых компактов Л, В € зутт(Кп), так, что

р(1\л © В) = у/р(1\ М))2 + р(1\т)2 + (I, с(А) + С (В)), (1)

где р(1\Л) - опорная функция множества Л вдоль направления I, определяемая как р{1\Л) = зир{(/,2;)|а; 6 Л}, а г(Д) - множество Л — с(Л) для любого

X

Л С зутт(Кп) с центром с(Л). Замечательным свойством данной операции является то, что при квадратичном сложении эллипсоидов получается эллипсоид с матрицей и центром равными сумме матриц и центров исходных эллипсоидов, т.е.

£(аи (¿О © £(а2, <?2) = £(ах + а2, <?1 + <?2)- (2)

Данное свойство является ключевым для построения эллипсоидальных аппроксимаций квадра-тично-регуляризированного интеграла. Также показано, что данная операция обладает рядом тех-же свойств, что и операция алгебраического суммирования -I- множеств, таких как ассоциативность, коммутативность и непрерывность. Более того, не смотря на то, что данная операция не перестав новочна с алгебраической суммой, при суммировании сначала в квадратичном смысле, а потом - в алгебраическом мы получаем множество, большее чем при обратном порядке суммирования, т.е. (Л Ф В) + С 3 (Л + С) @ В для любых Л, В, С 6 8утт(М"). Наконец показано, что для произвольного направления из К71 для алгебраической суммы произвольного конечного числа множеств из зутт(№1) может быть построена "тугая" по этому направлению (в смысле равенства опорных функций вдоль этого направления) внешняя оценка в виде взвешенной квадратичной суммы тех-же множеств.

Во втором разделе первой главы вводится операция квадратичного вычитания ©, также как операция квадратичного суммирования, через опорные функции как

р(1\Л © В) = со у/р(1\г(Л)У - Р{1\г{В))2 + (г, с(Д) - с (В)), (3)

где со - операция овыпукления функции. Данная операция являющаяся обратной по отношению к операции квадратичного суммирования, является непрерывной и ассоциативной. Ключевым свойсвом, как и для операции квадратичного суммирования, является то, что при а при квадратичном вычитании вложенных эллипсоидов мы получаем эллипсоид с разностью параметров, т.е. £{а\^{) © ^(«2,<Эг) = £{а1 — <22, <31 — (Эг)- Также в данном разделе исследованы другие свойства операции квадратичного вычитания, в частности возможность по ряду направлений построить тугую внутреннюю оценку алгебраической суммы двух центрально-симметричных множеств через квадратичную сумму этих множеств.

В третьем разделе первой главы исследуется связь между квадратичным и алгебраическим суммированием эллипсоидов. Схема регуляризации, введённая в[28], трансформирует исходное множество достижимости, тем самым делая необходимым оценивание близости регуляризованного и исходного множеств. Отличия между последними двумя объектами заключаются в использовании квадратичной суммы эллипсоидов (в регуляризованном множестве) вместо алгебраической суммы (в исходном множестве). Таким образом задача оценивания погрешности регуляризации в[28] может быть сведена к поиску минимальных по включению эллипсоидов £+ и максимальных по включению эллипсоидов £~, таких, что

£1 е £2 С £г + £+

£1 + £~ С £1 ф

где = £{а,1, (~>1), £2 = £{а.2?Я2)— произвольные эллипсоиды. Показано, что для квадратичной суммы двух эллипсоидов по любому направлению из й" существует тугая оценка в виде алгебраической суммы двух эллипсоидов, тогда как тугая внутренняя оценка в виде алгебраической суммы для квадратичной суммы множеств в существует только для некоторых допустимых направлений. Среди тугих оценок нами выделены выделены оценки, минимизирующие погрешность в смысле объёма, т.к. оптимальные по объёму, и доказана их единственность.

В четвертом разделе рассмотрена аппроксимация квадратичной суммы двух эллипсоидов на примере двух двумерных эллипсоидов

* = £(0, до, = ¿(0,02), = ( _11275 04 )'«>=(£ 4 ) •

(4)

На рпс.1а видно, что квадратичную сумму £\ ®£2, обозначенную штриховой линией, удаётся аппроксимировать по любому направлению алгебраической суммой £\ + £+, обозначенной сплошной линией, как и эллипсоиды £+. Направления касания обозначены стрелками. Среди трех внешних оценок жирной линией выделена минимальная по объему оценка. Внутренние оценки алгебраической суммой £\ + £ представлены на рис.1Ь. В отличие от внешних оценок, тугие внутренние оценки существуют только для части направлений, диапазон которых отображен серым цветом. Оценки построены для четырех направлений, три из которых, обозначенные тонкими линиями, соответствуют неоптимальным по объему оценкам, тогда как четвёртая, обозначенная жирной линией, имеет максимальный объем.

(а) Внешние оценки

(Ь) Внутренние оценки

Рис. 1: оценки квадратичной суммы через алгебраическую сумму

Во второй главе рассматривается задача поиска множества достижимости линейной управляемой системы при наличии неизвестной, но ограниченной в геометрическом смысле помехи, а именно системы

на отрезке времени Т с непрерывными матрицами A(t), B(t). C(t), где x(t) — вектор состояний из К™, v(t) — векторное неизвестное возмущение из класса функций Vo, измеримых по Лебегу и удовлетворяющих ограничению v(t) G Q(t), а и = U (t,x) Ç V{t) — управление с обратной связью из класса управлений Uq, обеспечивающих существование и продолжаемость решения системы (5). Мы будем предполагать эллипсоидальных характер ограничений на помеху, управление и начальное состояние:

х° ех0=£(х0,х0).. Q(t)=£(q(t),Q(t)), V(t) = £(p(i),P(t)). (6)

Повышенная актуальность подобной постановки для инженерных приложений требует эффективных численных схем поиска множества достижимости в классе управлений с обратной связью. Предложенный в главе метод основан на эллипсоидальных оценках альтернированного множества достижимости, описанных в[14] и дополненных адаптивной схемой регуляризации для обеспечения продолжаемости эллипсоидальных аппроксимаций. Предлагаемая схема квадратичной регуляризации альтернированного множества, которая естественным образом сочетается с эллипсоидальной конструкцией самих оценок позволяет

/ x(t) = A(t)x(t) + B{t)u + C{t)v(t) 1 x(to) = x°

t €T = [to, ii],

(5)

прозрачным образом трансформировать эллипсоидальные схемы из [14] и тем самым обеспечить невырожденность и продолжаемость оценок через адаптивный выбор регуляризирующих параметров. Вторая глава состоит из восьми разделов.

В первом разделе формулируется задача достижимости для системы (5) в эллипсоидальную окрестность точки, которой соответствует множество достижимости Х(т, ¿о, Х°, М( ■ )), где M(t) ^ 0 - матричная функцию, определяющая конфигурацию эллипсоидальной окрестности точки в каждый момент времени t G Т.. Задаче достижимости в /х окрестность соответствует множество достижимости Х(т, ¿о, <-f°, ■ )), которое является частным случаем множества Х[т, ¿о, Х°. М( • )) п исследовалось в[14]. Также в разделе вводятся верхние и нижние интегральные суммы как множества достижимости с конечным числом коррекций, их конечно разностные аналоги, формулируются условия невырожденности, при которых пределы верхних и нижних сумм совпадают и приводится эволюционное уравнение в виде интегральных ворон, решением которого является альтернированное множество достижимости в эллипсоидальную окрестность точки, а именно

lim<r-1/i+ (X(t + a)~

сг—>0

a£(q(t), Q(t)). (I +<rA(t))(X(t) + a£(0, M(t))) + o£(p(t), P(t))) = 0, (7)

где M(t) € T - неотрицательно определённая матричная функция эллипсоидальной окрестности достижимости. Выберем систему разбиений отрезка [¿о, г]

г

на к + 1 точек п = to + '¿Zcrj, где ст,- G Т,к = > 0- Структура урав-

з=1

нения (7) позволяет заключить, что при упрощяющем предположении A(t) = 0 для "хороших" направлений 1 G M", не требующих овыпукления разности опорных функций, опорная функция p(?|Af0.[s]) конечно-разностного максимального по включению решения Ха [s] = Ха(т, to, Х°, Efc, M( • )) уравнения (7) может быть найдена из соотношения

р(1\Х{Г[8]) = (0,M(71fc))+ff(s)P(7>)))-/j(i|(-<7(e)Q(Tfe))),e е Тк+1

(8)

на всем отрезке Т, где Tt = г;), a <t(s) = s — Tifs),i(s) = max {г ^ 0|т, ^ s}.

Из (8) видно, что выбором достаточно большого M(г¿) на каждом шаге i можно избежать необходимости овыпуклять правую часть (8) и таким образом найти опорную функцию к множеству xa{r,tç,, X13 М(-)) для всех г € Т. Оборотной стороной такого подхода является то, что мы ищем опорную функцию

для множества, которое отличается от исходного множества, соответствующего М( •) =0, погрешностью, вносимой выбором ненулевого М{ •) для обеспечения условия (2.1.10). Подобная схема регуляризации работает и для случая A{t) ф 0, но уже вдоль меняющихся во времени хороших направлений l(t), определяемых фундаментальной матрицей системы (5). Таким образом, если на к-ом шаге итерации в (8) Х~[тк\ ~ эллипсоид, то при М(-) = 0 мы можем воспользоваться известным из еллипсоидального исчисления [9] условием о равенстве опорной функции разности эллипсоидов разности опорных функций этих эллипсоидов для проверки продолжаемости конечно-разностного решения. Однако, поскольку вышеупомянутое условие работает только дня эллипсоидов, при А/( ■) 0, сложение с эллипсоидом <t(s)£(0, М(тк)) уже не позволяет применить данный способ. Тем не менее, если прибавление эллипсоида <r(s)£(0, Л/(т^)) в алгебраическом смысле заменить прибавлением эллипсоида 5(0, a(s)M(тц)) в квадратичном смысле (в смысле операции (1.1.2)), то результат будет оставаться в классе эллипсоидов. Данное соображение и является основной мотивацией для замены алгебраического суммирования на квадратичное.

Во втором разделе изучаются асимптотические свойства суммы Хф£(0, еМ) при малых б > 0, где X е symm(Rn). Нам это потребуется для изучения свойств квадратично-регуляризированного интеграла, поскольку далее в конечно разностной схеме для уравнения(7) при прибавлении на каждом шаге эллипсоида £(0, a(s)M(Tk)) в квадратичном смысле его нужно масштабировать в зависимости от шага а. В данном раздаче нами получены внутренние и внешние асимптотические оценки суммы X ф £(0,еМ) через алгебраические суммы множеств X как шаров, так и эллипсоидов, а также оценена погрешность перестановки квадратичного суммирования с бесконечно-малым эллипсоидом и геометрического вычитания бесконечно-малого множества через оценку разности опорных функций р{1\{Х-еА) © £{0,еМ)) - p(l\X ® £(0,еМ)-еЛ) для X G symmE", int X ф 0, А G symmR" и матрицы М > 0.

В третьем разделе мы, опираясь на свойства квадратичной суммы, вводим квадратично-регуляризированный аналог максиминного множества с к коррек-

+...

циями

*0, Л/( •))=((•• • ( © Мг +

\ V \ <о (о

...®м,+ У -1 (-0(а))А»1 + ... ® + 1т{з)йз \

Т<~1 / 1-1 / Тк } тк

(9)

в котором мы заменили в каждой точке коррекции прибавление в алгебраиче-

п

ском смысле эллипсоида / £(0, М(в)) прибавлением в квадратичном смысле эллипсоида .М,- = £(0, / М(з))с18. Для бесконечно измельчающихся разбиений

П-1

Ед. из (9) в общем случае нет монотонности по включению, которая имеет место для множеств классических множеств с к коррекциями. Поэтому далее мы считаем выполненным предположение 2.3.2 об асимптотической монотонности, которое в частности выполнено, когда кЛР(г) Э ^ 6 Т. Предположе-

ние 2.3.2 означает, что некоторой матричной функции М(-), удовлетворяющей предположению 2.3.1 о невырожденности альтернированных интегралов, и любой бесконечно измельчающейся последовательности разбиений Ё = {Е^}^, с диаметром, стремящимся к нулю, любого номера ко и и любого числа б > 0 существует такой номер к*, что для всех к ^ к* выполнено

Л£'-(т, «о, А"0, Е*. М( ■)) С ¿о, Х°, Е*0, М( •)) + еВ^О). (10)

У условиях предположения 2.3.2 доказывается теорема 2.3.1 о том, что для любой матричной функции М{ ■) минимаксное квадратично-регуляризированное множество (9), а также его конечно-разностные аналог имеют совпадающий Ха-усдорфов предел и этот предел непрерывен по т. На основании теоремы 2.3.1 и схемы доказательства леммы 1.7.3 из [9] доказывается теорема 2.3.2 о том, что квадратично регуляризированное множество достижимости является максимальным по включению решением следующего эволюционного уравнения интегральных воронок:

Пта~1к+(ХЦ + а)-

-*£Ш, д(4)), (1+аА($){Х{1) ® 8(0, аМ{Щ + а£(рЦ), Р(4))) = 0, (И) Х[Ьо]=£(хо,Хо).

Для случая, когда, для множества z(A"?[t]) имеется некоторая внешняя эллипсоидальная оценка £ (О, Х+) мы доказываем теорему 2.3.4 о справедливости внешней оценки "классического" альтернированного множества через квадратично-регуляризированное множество

Х{т, t0, Х°, М_( • )) С Хч(т, t0, Х°, М( • )) (12)

где M-(t) = M-(t)(X+(t), m(t)). В случае, когда для множества z(Af3[r)) имеется некоторая внутренняя эллипсоидальная аппроксимация £(0, X_(t)), доказывается теорема (2.3.5) о справедливости внутренних оценок

Х(т, t0, Х°, М+( ■ )) 2 Х\т, to, Х°, М( • )), (13)

г*е M+(t) = M+(t)(X-(t),M(t)).

В четвертом разделе эволюционное уравнение (2.3.11) используется для построения тугих внутренних эллипсоидальных оценок квадратично-регуляри-зированного множества достижимости. При построении оценок используется схема, применённая в[15, 9] для уравнения (2.1.8) с M(t) = /tl. Свойство оценок быть тугими мы понимаем как равенство опорных функций оценок и множества достижимости вдоль хороших направлений l(t), t G Т, определяемых фундаментальной матрицей X{t,to) системы (5) как l{t) = X {to,t)lo- Следуя технике построения внутренних оценок, применённой в [15] для оценивания классического альтернированного множества достижимости, мы доказываем утверждение 2.4.1 о существовании внутренней тугой эллипсоидальной оценки £~[t] = £(x~(t),X^(t)) множества Xq(t,to,X°,M(-)) на отрезке [¿о, г] вдоль направления /( • ) с параметрами, определяемыми соотношениями

X-(t) = G(A(t)X-(t) + Xl(t)S(t)PHt)) - T(i)X_(t) - тг~ltt)Q{t) + M(t), (14)

где оператор G(A) = A' + A и A"*'(i)À'* (t) = A'-(t), a матрица S(t) и функция n(t) определяются некоторым образом исходя из X-(t),Q(t), P{t) и l{t). Для решения уравнения (14) численными методами предлагается итерационный алгоритм 2.4.6 выбора матрицы M(t), который обеспечивает продолжаемость решения дифференциального уравнения (14), и таким образом гарантирует существование невырожденных внутренних оценок.

В пятом разделе эволюционное уравнение (2.3.11) с применением той же схемы, что и в предыдущем разделе, используется для построения внешних тугих оценок £{х+ (t), X+(t)) с параметрами, определяемыми

X+(t) = G(A(t)X+(t) - X*S(t)QHt)) + Tr(t)X+(t) + n-Ht)P(t) + M(t), (15)

где X+(t)X+(t) = Xf(i), а. матрица S(t) и функция ir(t) также определяются исходя из X+(t),Q(t),P(t) и l(t). Заметим, что при построении внешних оценок следует параллельно строить внутренние оценки, выбирая регуляризатор М{ • ) общим для внутренних и внешних оценок таким образом, чтобы внутренние оценки не вырожд&чись.

В в шестом разделе исследуется несколько схем локально-оптимального выбора параметра S(t) для внутренних эллипсоидальных аппроксимаций исходя из таких критериев, как производная следа конфигурационной матрицы эллипсоида, объёма и опорной функции по некоторому направлению. Также производится сравнительный анализ каждой из схем на примере трехмерной системы.

В седьмом разделе Рассматривается схема внутренних и внешних тугих эллипсоидальных оценок совместно для нескольких направлений. По построению регуляризатор М( ■) в оценках (15)и (14) в общем случае зависит от выбора наг чалыюго направления/0, т.е. A/(i) = M(t,l0),£-[t] =£_[Мо] = £{x~(t), X-{t, k)). Таким образом оценки £_ [i, fo] для разных 10 аппроксимируют квадратичные альтернированные множества Xg(T,t0,X°,A'I(-)) для разных М(-). В данном разделе вводится совместная схема (2.7.1), которая для фиксированного конечного множества направлений L = {7Ь ... ,4} на каждом шаге итерации г, соответствующим времени т; дискретной сетки на Т, позволяет выбрать единый регуляризатор А/*(т,) как

М*(п) = fj(Mt{Ti),..., М*к{п)), (16)

где индексом j отмечена зависимость от направления lj £ L, a. fj— матричная функция, которая каждому набору эллипсоидов 5(0, Qj), j = 1,к ставит в соответствие минимальный по объему эллипсоид Джона[30] £(0,Q*), содержащий эллипсоиды £(0:Qj),j = 1,к. В итоге наличие семейства внешних оценок £+[t,l] = £(x+,X+(t,l)), l 6 L и семейства внутренних оценок £~[t, Z] = £(x-, X-(t. /)), l £ L. полученных при помощи общего регулярнзатора М*(-) позволяет использовать известные формулы для внешней аппроксимации пересечения эллипсоидов и внутренней аппроксимации объединения из[9] и получить £(0, X-zi(t)) - некоторую внутреннюю эллипсоидальную аппроксимация выпуклой оболочки объединения трубок conv |J£(0, X-(t, I)), а также £(0,X+ii(i)) -

leL

некоторая внешняя эллипсоидальная аппроксимация пересечения эллипсоидальных трубок П£(0,Х|_(и)). Наконец наличие £(0,X+,L(t)) и £(0,„Y_£(i)) поз-leb

воляет воспользоваться полученными ранее оценками (12) и (13) для получения более точных оценок классического альтернированного множества достижимости. Данные оценки построены в утверждении 2.7.1.

В восьмом разделе второй главы рассматривается пример применения методов адаптивной эллипсоидальной аппроксимации к колебательной системе с четырьмя степенями свободы во внешнем силовом поле при наличии трения и неизвестной, но ограниченной помехи, где первые четыре компоненты вектора х имеют смысл обобщенных координат, а последние четыре есть обобщенные скорости колебательной системы. Для решения (14) в силу высокой размерности использовался метод Рунге-Кутты 4-го порядка, причем внутренние и внешние оценки вычислялись одновременно за один проход алгоритма. На рисунке и (2а) показан результат визуализации проекций на динамическое подпространство совпадающее с подпространством натянутым на вектора ез,е5 в момент Ь = & внешней и внутренней трубок достижимости, регуляризирующей трубки (темным цветом внутри), а также линий касания внешних и внутренних оценок. В случае проекции на динамическое подпространство эти линии лежат на границе проекций, что объясняется конструкцией динамического подпространства, в то время как для проекций на статическое подпространство (см. рисунок (26)) они могут лежать внутри проекций эллипсоидальных оценок.

Ішйівіи

(а) Проекция на динамическое подпространство

(Ь) Проекция на статическое подпространство

Рис. 2: Проекция на подпространство (хз,х$)

Третья глава посвящена методам проецирования, визуализации трубок достижимости а также эллипсоидальным оценкам альтернированных множеств достижимости к моменту времени. Эллипсоидальные схемы нужнаются в эффективных схемах визуализации, которая затруднена высокой размерностью фазового пространства. Один из путей решения этой проблемы заключается в переходе от многомерных множеств к их проекциям на пространства малой размерности с их последующей визуализацией. Основная идея метода проецирования - построить достаточно проекций эллипсоидальных трубок на трёхмерные

или двумерные пространства, чтобы потом по этим проекциям можно было восстановить структуру решения в многомерном пространстве.

Глава состоит из двух разделов. В первом разделе Для построения указанных проекций вводиться операция координатного проецирования, при этом проецирование на подпространства, эволюционирующие во времени позволяет учесть важные свойства динамики эллипсоидальных оценок. Также рассматриваются примеры проецирования восьмимерных систем как на статические подпространства, не зависящие от времени, так и динамические подпространства, меняющиеся в силу фундаментальной матрицы X(t,to) системы (5).

Во втором разделе вводится понятие альтернированного множества достижимости к моменту времени. На примерах показано, что при наличии внешних и внутренних эллипсоидальных трубок £(х(í), X+(í, /)) и £(x(t), Х- (t, I)) для альтернированного множества на момент времени тугих вдоль кривых 1( ■), í(í0) = I, внешние эллипсоидальные трубки к моменту

1} = (г(т)'Х+(т' 0)1*0 < г < Í}

Т

и внутренние эллипсоидальные трубки к моменту

= u^^W'-^-kojiío < г < Í}

г

не являются тугими оценками для альтернированного множества достижимости к моменту. Также в разделе приведён алгоритм внутренней аппроксимации границы множества достижимости к моменту на основе комбинирования внешних эллипсоидальных трубок к моменту времени.

Четвертая глава посвящена обобщению результатов первой главы, в которой мы ввели понятие квадратичной суммы и квадратичной разности. Интересным направлением дальнейших исследований представляется изучение обобщений данных операций путем перехода в их определениях к произвольному показателю степени р ^ 1. Для любого р€ [1, оо) суммой множеств Л,Ве symm(R") в смысле операции р-суммирования ©р назовем множество А<$РВ, определяемое опорной функцией

р{1\л ©„ В) = (р(1\г{А)У + р{1\z(B))")p + (I, с (А) + с (В)). (17)

По аналогии с операцией р-суммирования множеств ©р вводится операция р-вычнтания множеств через опорную функцию как

р(1\А еР В) = со(р(1\г(А)У - p(l\z{B)Y)í + (I, с(Д) - c(ß)), (18)

Использование операций р— суммирования и р— вычитания вместо алгебраической суммы и геометрической разности позволяет рассматривать целый класс обобщений альтернированного интеграла Понтрягина. В частности интерес представляют пределы множеств

X>«-[s] = "(*№)) ©9 (-*(«)Q(tï)). 5 е Ti+ь Х-[to] = Хо. (19)

Операции р— суммирования и р— вычитания обладают свойствами, похожими на свойства квадратичных операций суммирования и вычитания, а утверждения первой главы можно рассматривать как частный случай связи между квадратичной /»-суммой и р-разностью для р = 1,2.

В заключении сформулированы основные результаты, которые получены в диссертации. Автор приносит глубокую благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач и полезные замечания.

Литература

[1] Понтрягин Л. е., Болтянский В. Г., Гамкрелидзе Р. В.„ Мищенко Е. Ф. Математическая теория оптимальных процессов. Наука, 1961.

[2] Красовский H. Н. Теория управления движением. Наука, 1968.

[3] Красовский H. Н. Игровые задачи о встрече движений. Наука, 1970.

[4] М.М. Lee, L. Markus. Foundations of Optimal Control Theory. Whiley, 1967.

[5] Беллман P. Динамическое программирование. ИЛ, 1960.

[6] Айзеке Р. Дифференциальные игры. Мир, 1967.

[7] Crandall M. G., Lions P.L. Viscosity solutions of hamilton-jacobi equations. Transactions of American Mathematical Society, 277:1-41, 1983.

|8] Субботин A. И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. Институт компьютерных исследований, 2003.

[9] Kurzhanski А.В., Valyi I. Ellipsoidal Calculus for Estimation and Control. Number 3. "Birkhàuser, 1996.

[10] Куржанскнй А. Б. Альтернированный интеграл Понтрягина в теории синтеза управлений. Труды МИАН, 224:234-248, 1999.

[11] Куржанский А.Б., Мельников Н.Б. О задаче синтеза управлений: альтернированный интеграл Понтрягина и уравнение Гамильтона-Якоби. Мат. сборник, 191(6):69-100, 2000.

[12] Kurzhanski А.В., Varaiya P. On ellipsoidal techniques for reachability analysis, part i. external approximations. Optimization Methods and Software, 17:177206, 2001.

[13] Kurzhanski А.В., Varaiya P. On ellipsoidal techniques for reachability analysis, part ii. internal approximations, box-valued constraints. Optimization Methods and Software, 17:207-237, 2001.

[14] Kurzhanski А.В., Varaiya P. On reachability under uncertainty. SIAM J. Control Optim., 41(1):181—216. 2002.

[15] Kurzhanski А.В., Varaiya P. Reachability analysis for uncertain systems - the ellipsoidal technique. Dynamics of Continuous, Discrete and Impulsive Systems, 8(3):347-367, 2002.

[16] Kurzhanski А. В., Varaiya P. Dynamic optimization for reachability problems. Journal of Optimization Theory and Applications, 108(2):227-251, 2001.

[17] Kurzhanski А.В., Varaiya P. Ellipsoidal techniques for reachability analysis, internal approximation. Systems and Control Letters, 41:201-211, 2000.

[18] Понтрягнн Л. С. О линейных дифференциальных играх ii. Доклады АН СССР, 175(4):910—912, 1967.

[19] Понтрягнн Л.С. Линейные дифференциальные игры преследования. Математический сборник, 112(154) (3(7)) :307-330, 1980.

[20] Половинкнн Е. С., Иванов Г. Е., Балашов В., Константинов Р. В.,, Хорев А. В. Об одном алгоритме численного решения линейных дифференциальных игр. Мате.матический сборник, 192(10):95—122, 2001.

[21] Krasovski N. N., Subbotin A. I. Game-theoretical control problems. Springer Verlag, 1987.

[22] Ушаков В. Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения. Известия АН СССР. Техническая кибернетика, (4):29—36, 1980.

[23] Ушаков В. Н., Успенский A.A.,, Токманцев Т.Б. К вопросу стабильности в дифференциальных играх. Труды Института математики и механики УрО РАН, pages 155-177, 2004.

[24] Ушаков В. Н. Процедуры построения стабильных мостов в дифференциальных играх: Дис. д-ра физ.-мат. наук: 01.01.02. Ин-т ма тематики и механики УрО АН СССР, 1991.

[25] Ушаков В. Н. К вопросу стабильности в дифференциальных играх. Позицию иное управление с гарантированным результатом, pages 101-109, 1988.

[26] A. A. Kurzhanskiy, P. Varaiya. Ellipsoidal toolbox, http://code.google.com/ p/ellipsoids, May 2006.

[27] A. H. Дарьин, А. Б. Куржанский. Метод вычисления инвариантных множеств линейных систем большой размерности при неопределенных возмущениях. Доклады Академии Наук, 446(6):607—611, 2012.

[28] Гагаринов П.В. Вычисление альтернированных трубок достижимости линейных управляемых систем при неопределённости. Вестн. Моск. ун-та., (4):17-24, 2012.

[29] Куржанский A.B. Альтернированный интеграл понтрягина в теории синтеза управлений. Труды математического института им. В.А. Стеклова, 224:234-248, 1999.

[30] Boyd S.P., Vandenberghe L. Convex Optimization. Cambridge University Press, 1988.

Публикации по теме диссертации

[31] Гагаринов П.В. Вычисление альтернированных трубок достижимости линейных управляемых систем при неопределённости. Вестн. Моск. ун-та., (4): 17-24, 2012.

[32] Гагаринов П.В. Вычисление проекций трубок достижимости линейных управляемых систем на основе методов эллипсоидального исчисления. Вестн. Моск. ун-та., (1):14—24, 2007.

Напечатано с готового оригинал-макета

Подписано в печать 06.08.2013 г. Формат 60x90 1 /16. Усл.печ.л. 1,0. Тираж 70 экз. Заказ 238.

Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 527 к. Тел. 8(495)939-3890/91. Тел./факс 8(495)939-3891.

 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Гагаринов, Петр Владимирович, Москва

Московский Государственный Университет им. М.В. Ломоносова Факультет Вычислительной Математики и Кибернетики

04201360888

>авах рукописи УДК 517.977

Гагаринов Петр Владимирович

Эллипсоидальные аппроксимации трубок достижимости управляемых систем при неопределённости

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель - доктор

физико-математических наук, академик РАН А.Б. Куржанский

Москва 2013 г.

Аннотация

В диссертации рассматривается задача вычисления и визуализации трубок достижимости линейных управляемых систем при неопределённости когда на управление и помеху наложены эллипсоидальные ограничения, причем управление берётся в виде обратной связи. Предлагаемый метод регуляризации исходной задачи позволяет применить аппарат эллипсоидального исчисления для поиска продолжаемых эллипсоидальных аппроксимаций трубки достижимости в многомерном пространстве.

Введение

Решение задачи управления по принципу обратной связи является центральной в математической теории управления, особенно для систем, функционирующих в условиях неопределённости, конфликта и недостатка информации [30,31,60,86]. Основным стимулом для возникновения соответствующей математической теории явились прикладные задачи управления движением, автоматики, робототехники и.т.д. В настоящее время подобные задачи возникают в моделях управления транспортными потоками, при изучении квантовых процессов, управления энергосистемами, а также в других моделях высоких технологий. Важную роль в решении подобных задач является сведение их к проблеме достижимости для линейных и нелинейных систем.

Настоящая диссертация посвящена задаче оценивания областей достижимости и попя тных областей разрешимости для линейных систем при неопределённости с управлением II форме обратной связи. Построение трубок решений, описывающих эволюцию областей достижимости управляемых систем в прямом и попятном времени, является одним из основных подходов к решению задач синтеза управления и гарантированного оценивания для таких систем. Использование метода динамического программирования, развитого Р. Беллманом [23| и Р. Айзексом [22], в том числе, для систем с неопределённостью, позволяет находить области достижимости как множества уровня функции цены для соответствующей задачи оптимизации. Такая функция цепы является решением уравнения в частных производных типа Гамильтона-Якоби-Беллмана-Айзекса (ШВ1). Но в общем случае эта функция цены нередко оказываются не всюду гладкой. Понятия обобщённых решений, таких как вязкостные решения П.Л.Лпонса и М.Г. Крендалла [77], а также минимаксные решения А.И. Субботина [65) позволили существенно расширить область применимости данного подхода, однако нахождение таких решений трсбуюч значительно вычислительной нагрузки. В тоже время, для линейных систем с выпуклыми ограничениями, обобщённые решения не обязательны, так как функции цены выпуклы и следовательно всюду дифференцируемы по любому направлению. Их можно точно описать при помощи теории двойственности выпуклого анализа. Использование множеств уровня функций цены, их подробное описание и возможность их вычисления позволили разработать эффективные методы описания их сечений в виде трубок достижимости как многозначных функций. Далее последовала теория аппроксимаций выпуклозначных функций при помощи эллипосидальных трубок (см. А.Б. Куржанский -[4,8-10,12,13,15,41,80]).

В данной диссертации рассматривается теория аппроксимаций для трубок достижимости при неопределённости. Такие точные трубки в прямом времени имеют самостоятельное значение. В обратном же времени они совпадают по своим основным свойствам с понятиями альтернированного интеграла Л.С. Поптрягина и моста Н.Н.Красовского. Упомянутый альтернированный интеграл был введён в работах [3,59] при геометрических ограничениях на управление и неопределённость. Дальнейший вклад в изучение свойств данного интеграла внесли М.С. Никольский, Е.Ф. Мищенко, А.П. Пономарев, Е.С. Половинкин, Н.Х. Розов [53] . (Следует заметить, что предложенные методы вычисления этого интеграла приводят к значительным вычислительным трудностям, связанным с необходимостью искать выпуклые оболочки надграфиков разностей опорных функций в многомерном пространстве. Последнее особенно касается систем высокой размерности.). Описание мостов Н.Н.Красовского дано в работах |30,31,69-72,79].

Аппарат эллипсоидального исчисления, разработанный в работах A.B. Куржанского и его соавторов, позволяет искать трубки достижимости при неопределённости в задаче с непрерывной коррекцией в виде "тугих" внешних и внутренних эллипсоидов ("касающихся" изнутри вдоль "хороших" кривых, определяемых фундаментальной .матрицей линейной системы). Подход к вычислениям более трудных внутренних эллипсоидальных оценок трубок с параметрами, являющимися решением обыкновенных дифференциальных уравнений описан в работах [4,8,9,12,13,15,41,80,87]. Этот поход рассматривался при некоторых условиях невырожденности. Заметим, однако, что поскольку в конструкцию таких тугих эллипсоидальных оценок заложено предположение о равенстве разности опорных функции вдоль направлений касания внутренних оценок и альтернированного множества достижимости, они склонны вырождаться в те моменты, когда данное предположение перестаёт выполняться. Последнее особенно актуально для систем большой размерности при малой размерности управления. Метод регуляризации эллипсоидальных аппроксимаций путем перемешивания нескольких эллипсоидальных оценок, предложенный в работе [82], позволяет преодолеть указанные сложности, в частности и для систем высоких размерностей (п ^ 500). Диссертация же посвящена альтернативному метод}' регуляризации, основанному па видоизменении структуры самого альтернированного интеграла, для которого получаются невырождающиеся тугие эллипсоидальные аппроксимации.

Цель работы состоит в поиске способа видоизменения (регуляризации) структуры классического альтернированного множества достижимости таким образом, который бы допускал выбор регуляризирующих параметров в процессе численного построения эллипсоидальных аппроксимаций и обеспечивал их продолжаемость, а также в построении оценок, связывающих видоизменённое множество достижимости с исходным.

Основные результаты работы.

1. Введены операции квадратичного суммирования и вычитания центрально-симметричных компактов. Исследованы свойства этих операции и получены оценки, связывающие операции квадратичного суммирования и вычитания с алгебраической суммой и геометрической разностью. В частности получены асимптотические оценки квадратичной суммы через алгебраическую сумму для центрально-симметричного компакта и эллипсоида.

2. С использованием новых операции введено понятие квадратично-регуляризованного альтернированного множества достижимости, доказана теорема о его существовании и единственности. Построены схемы внутренних и внешних тугих эллипсоидальных оценок с адаптивной регуляризацией для квадратпчно-регуляризированных альтернирован!патрубок достижимости. Построены оценки квадратичного альтернированного множества через "обычные" альтернированные множества. Предложена схема комбинирования оценок для разных направлении.

3. Построены алгоритмы проецирования на статические и динамические (обусловленные фундаментальной матрицей системы) подпространства. Построены эллипсоидальные оценки квадратично-регуляризировапного альтернированного множества достижимости к моменту и его границы.

4. Введены операции ^-суммирования и р-вычитания центрально-симметричных компактов как обобщённые варианты квадратичной суммы и разности. Исследованы свойства обобщённых операций и получены оценки, связывающенпе результаты применения данных операций для разных значений степени р.

Научная новизна работы. Полученные результаты являются новыми. В работе рассмотрено не изучавшееся ранее квадратичио-регулярпзированное альтернированное множество достижимости, а также операции операции квадратичного суммирования и вычитания множеств и их обобщения на случай произвольного р > 1. Для регуляризироваиного множества достижимости получены оценки, связывающие его с исходным классическим множеством. Эллипсоидальные оценки с адаптивным выбором регуляризирующих параметров решают проблему вырождения оценок, представленных в [9] и являются их обобщением.

Теоретическая и практическая ценность работы. Работа носит в основном теоретический характер. Квадратично-регуляризованпоый интеграл, а также квадратичные операции суммирования и вычитания могут представлять интерес для дальнейших исследований. Полученные во второй главе схемы адаптивной регуляризации позволяют перейти к практически реализуемым численным алгоритмам и таким образом решать задачу до конца.

Методы исследования. Квадратично-регулярпзпрованный интеграл, который возникает при замене алгебраической суммы множеств квадратичной суммой исследовался в работе с точки зрения решения эволюционных уравнений в виде интегральных воронок. При этом,

как и при исследовании свойств квадратичной суммы и разности, использовались элементы выпуклого и многозначного анализа. Кроме того, в диссертации использован аппарат эллипсоидального исчисления [10| а также теории обыкновенных дифференциальных уравнении и экстремальных задач.

Апробация работы. Результаты работы были представлены в виде докладов на научно-исследовательских семинарах кафедры системного анализа факультета ВМиК МГУ (рук. Кур-жаиский A.B.), отдела динамических систем ИММ УрО РАН (рук. Ушаков В.Н.), а также на международной конференции студентов и аспирантов по фундаментальным паукам "Ломопосов-2013" (Москва, МГУ, апрель 2013 г.)

Публикации. По теме диссертации опубликовано 2 работы.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Общий объем диссертации 104 страниц. Библиография включает 87 наименований.

Краткое содержание работы. Во введении дается краткий обзор литературы, примыкающей по своей тематике к вопросам, рассмотренным в диссертации, раскрываются цели работы, а также дается краткое описание основных результатов, полученных в работе.

В первой главе вводится и исследуется квадратичная операция сложения множеств, которая была нами введена в [7] для повышения эффективности эллипсоидальных аппроксимации альтернированных множеств достижимости ([8,9]) линейных управляемых систем при неопределённости с эллипсоидальными ограничениями на управление, помеху и начальное состояние. Как показано в |3,19] существование альтернированного интеграла требует ограниченности изнутри интегральных сумм соответствующих трубкам достижимости минимаксного типа с конечным числом коррекций, причём ограничение не должно зависеть от точек коррекции и их числа. В общем случае для упомянутых линейных систем такой ограниченности может не быть, и тем самым существование альтернированного интеграла гарантировать нельзя. Однако, понятие достижимости в /¿-окрестность, введённое в [9], позволило гарантировать существование альтернированного интеграла для любой системы вышеупомянутого вида для достаточно больших /у. В то й-же работе было показано, что достижимость в /¿-окрестность соответствует прибавлению шара радиуса ца в интегральных суммах на каждом шаге коррекции, где а -расстояние между соседними точками коррекции. Тем не. менее, тугие внутренние эллипсоидальные оценки, рассматриваемые в [9], могут вырождаться даже когда альтернированный интеграл существует. Это происходит из-за того, что при построении оценок использовано предположение о возможности перейти от опорной функции геометрической разности к разности опорных функции вдоль "хороших" направлении, порожденных фундаментальной матрицей системы. Для преодоления данной проблемы в [7] мы обобщили подход с /¿-окрестностью, заменив сё на ^'/-окрестность, заданную функцией М — определяющей в каждый

момент Ь 6 Т эллипсоид £(0, М(1)), где под эллипсоидом £(а,С}) с центром а и матрицей конфигурации С} будем понимать множество {х : (ж, I) < (1^1)^}. Этот шаг позволил менять размер и форму окрестности в зависимости от динамики "хороших" направлений и предотвращать вырождение внутренних оценок за счет выбора достаточно больших М(Ь). Более того, для повышения эффективности вычисления параметров эллипсоидальных оценок, вместо аппроксимации множества достижимости мы аппроксимировали видоизменённое множество, отличающееся от исходного тем, что на каждом шаге коррекции эллипсоид £(0,аМ(£)) прибавляется не в алгебраическом смысле, а в смысле операции © квадратичного суммирования центрально-симметричных выпуклых компактов, свойствам которой посвящена данная глава. Одним из важных свойств операции Ф является то, что она сводит вычисление квадратичной суммы эллипсоидов к суммированию их конфигурационных матриц. Видоизменённое множество уже не является вообще-говоря множеством достижимости, однако свойства операции О позволяют оценить близость с исходным множеством достижимости ([9]). В дополнении к операции квадратичного суммирования также вводится операция квадратичного вычитания о, обратная к операции (В и обладающая аналогичными свойствами. Свойства операции © используются далее во второй главе для получения внутренних оценок видоизменённого множества достижимости через исходное множество.

Первая глава состоит из четырех разделов.

В первом разделе вводится квадратичная операция © сложения центрально-симметричных выпуклых компактов А,Ве зутт(М"), так, что

р(1\л О) В) = ¿р{1ПА)У + р{1\г(В))2 + + С (В)), (1)

где (){1\Л) - опорная функция множества Л вдоль направления /, определяемая как р{1\А) = йир{(£, а;)|о; е Л}, а '¿(Л) - множество Л — с(Л) для любого Л 6 йутт(Е") с центром с(Л).

X

Замечательным свойством данной операции является то, что при квадратичном сложении эллипсоидов получается эллипсоид с матрицей и центром равными сумме матриц и центров исходных эллипсоидов, т.е.

£{аиЯх)0д8{а2,СЗо)=Е{а1+а2,С)1+С}2). (2)

Данное свойство является ключевым для построения эллипсоидальных аппроксимации квадра-тнчно-регуляризированного интеграла. Также показано, что данная операция обладает рядом тех-же свойств, что и операция алгебраического суммирования + множеств, таких как ассоциативность, коммутативность и непрерывность. Более того, не смотря на то, что данная операция не перестановочна с алгебраической суммой, при суммировании сначала в квадратичном смысле, а потом - в алгебраическом мы получаем множество, большее чем при обратном порядке

суммирования, т.е. (АфВ)+С Э [А + С)@В для любых А, В,С 6 зуппп(М"). Наконец показано,

что для произвольного направления из Е" для алгебраической суммы произвольного конечного числа множеств из йушш(К") может быть построена "тугая" по этому направлению (в смысле равенства опорных функций вдоль этого направления) внешняя оценка в виде взвешенной квадратичной суммы тех-же множеств.

Во втором разделе первой главы вводится операция квадратичного вычитания 0, также как операция квадратичного суммирования, через опорные функции как

р{1\Л ЭВ) = со у/р{1\г(А)У-р{1\ъ{В)У + (I, с(Л) - с (В)), (3)

где со - операция овыпукления функции. Данная операция являющаяся обратной по отношению к операции квадратичного суммирования, является непрерывной и ассоциативной. Ключевым свопсвом, как и для операции квадратичного суммирования, является то, что при а при квадратичном вычитании вложенных эллипсоидов мы получаем эллипсоид с разностью параметров, т.е. £(а 1,(^1) <Э £(0-2,(^2) — £{а\ ~ «2,^1 — Фг)- Также в данном разделе исследованы другие свойства операции квадратичного вычитания, в частности возможность по ряду направлений построить тугую внутреннюю оценку алгебраической суммы двух центрально-симметричных множеств через квадратичную сумму этих множеств.

В третьем разделе первой главы исследуется связь между квадратичным и алгебраическим суммированием эллипсоидов. Схема регуляризации, введённая в [7], трансформирует исходное множество достижимости, тем самым делая необходимым оценивание близости регуля-ризованпого и исходного множеств. Отличия между последними двумя объектами заключаются в использовании квадратичной суммы эллипсоидов (в регулярпзованном множестве) вместо алгебраической суммы (в исходном множестве). Таким образом задача оценивания погрешности регуляризации в [7] может быть сведена к поиску минимальных по включению эллипсоидов и максимальных по включению эллипсоидов £~, таких, что

£1 е £2 Я £\ +

£\ + £~ С £г © £,,

где £\ = £(а\, С^х), £2 = £((12,(^2) — произвольные эллипсоиды. Показано, что для квадратичной суммы