Интеграл Понтрягина и уравнение Гамильтона-Якоби в задачах оптимального синтеза тема автореферата и диссертации по математике, 01.01.02 ВАК РФ

Мельников, Николай Борисович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2002 ГОД ЗАЩИТЫ
   
01.01.02 КОД ВАК РФ
Диссертация по математике на тему «Интеграл Понтрягина и уравнение Гамильтона-Якоби в задачах оптимального синтеза»
 
 
Содержание диссертации автор исследовательской работы: кандидата физико-математических наук, Мельников, Николай Борисович

Введение

1 Интеграл Понтрягина в задаче синтеза при неопределенности.

1.1 Задача синтеза управлений при неопределенности.

1.2 Альтернированный интеграл Понтрягина.

1.3 Альтернированный интеграл Понтрягина второго рода и теорема о равенстве двух интегралов.

1.4 Максиминная и минимаксная функции цены.

1.5 Решение задачи синтеза при неопределенности.

1.6 Эволюционные уравнения и параметрические аппроксимации множества разрешимости эллипсоидами.

2 Четтеринг в задачах с негладкими ограничениями.

2.1 Группа симметрий и свойства оптимального синтеза.

2.2 Метод решения уравнения Гамильтона-Якоби.

2.3 Примеры построения функции Беллмана.

 
Введение диссертация по математике, на тему "Интеграл Понтрягина и уравнение Гамильтона-Якоби в задачах оптимального синтеза"

В настоящей диссертации методы уравнения Гамильтона-Якоби и альтернированного интеграла Понтрягина использованы для построения и изучения свойств решений нескольких классов задач управления.

Уравнение Гамильтона-Якоби первоначально возникло в классической механике как основа общего метода интегрирования уравнений движения. В теории оптимального управления, оно главным образом применяется для получения достаточных условий оптимальности и построения позиционного управления, называемого также оптимальным синтезом, применительно к различным классам задач, один из которых составляют задачи позиционного управления динамической системой в ситуации конфликта.

Задачи конфликтного управления, часто объединяемые термином дифференциальные игры, начали активно изучаться с середины 1960-х в связи с прикладными задачами (см. монографию Р.Айзекса [1]). По мере развития методов решения разнообразных частных примеров возникла необходимость в их теоретическом обосновании. Среди работ начального этапа отметим работу J1.C. Понтрягина [30], в которой был предложен метод альтернированного интеграла, позволивший сформулировать условия разрешимости соответствующих задач.

Наиболее общий подход к позиционным дифференциальным играм был предложен в работах Н.Н. Красовского и А.И. Субботина в начале 1970-х (см. [17]). Кроме общей формализации задачи, авторами было дано определение стратегий управления, доказана теорема об альтернативе, введено понятие стабильного моста и разработан конструктивный метод построения оптимальных стратегий, получивший название "экстремального прицеливания". В дальнейшем, на основе этих теоретических результатов, были разработаны алгоритмы синтеза позиционных стратегий для различных типов задач (см., например, [40] [5], а также обзор результатов в [61]).

Появление понятия обобщенного решения для нелинейных уравнений первого порядка открыло новые взаимосвязи теории уравнений в частных производных, оптимального управления и дифференциальных игр. Имеется несколько возникших независимо, но эквивалентных подходов (их сравнение см. в [61]). Определение обобщенных решений, данное С.Н.Кружковым [18] для уравнения Гамильтона-Якоби с выпуклым гамильтонианом, использует предельный переход от параболического уравнения второго порядка — "метод исчезающей вязкости", впервые успешно примененный Х.Хопфом к уравнению Бюргерса. Определение минимаксных решений А.И.Субботина, происходит из теории дифференциальных игр. В его основе лежит понятие "стабильного множества"[34]. И, наконец, наиболее известное определение вязких решений для уравнений типа Гамильтона-Якоби, данное М.Крэндаллом и П.Лионсом [47] (см. также [56], [49], [45]), основано на суб- и суперградиентных неравенствах. На иных идеях, связанных с идемпотентным анализом, основан подход В.П. Маслова, позволивший в задачах с выпуклыми гамильтонианами рассматривать уравнение Гамильтона-Якоби как линейное и придать смысл его решениям с разрывными начальными данными при помощи "интегральных тождеств" (см., напр., [14]).

Одной из важных задач теории позиционного управления является синтез управления с обратной связью при наличии неизвестных, но ограниченных внешних помех. Методы исследования этого круга задач во многом опираются на методы теории дифференциальных игр [10], [15], [19], [24], [35], [60], [62].

Первая глава носит обзорный характер. В ней содержится единая современная точка зрения на основные принципы, используемые в задачах управления и дифференциальных играх, предложенная А.Б. Куржанским. Излагаются ключевые идеи и методы применяемых далее конструкций и указываются возможности доведения излагаемых теоретических результатов до эффективных численных процедур. Даны новые доказательства ряда фактов, служащих основой для применения эллипсоидального исчисления к задачам синтеза управлений. Указана связь интеграла Понтрягина с уравнением Гамильтона-Якоби.

В первом параграфе дается постановка задачи о приведении объекта на заданное множество при помощи позиционного управления в условиях воздействия неопределенной внешней помехи. Движение объекта описывается линейной системой x{t) = A(t)x + B(t)u + C{t)v(t), жбГ (0.1) с геометрическими ограничениями на входящие параметры: С Г.

В рамках принимаемой идеализации, информация о помехах v(t) поступает мгновенно, обратная связь и = U(t, х) действует также мгновенно — без запаздывания.

При наличии параметра v(t), играющего, как правило, роль внешнего возмущения, вместо отдельных траекторий рассматривают их совокупности. Задача синтеза управления при неопределенности состоит в отыскании множества разрешимости W*(r,ti,Ai) = W*[r] и позиционной стратегии управления и = U(t,x) таких, что каждое решение (0.1) с начальным значением хТ = х(т) £ W*(r,ti,M) принадлежит наперед заданному терминальному множеству М. в момент времени t\ при произвольном внешнем возмущении v(t) Е Q{t). График многозначной функции W*[r] = W*(r,ti,M) при to < г < t\ называют областью разрешимости. В первом параграфе уточнены классы функций, и упрощен вид системы

В простейшей ситуации, когда х и v не входят в правую часть системы: C(t) = 0 и A(t) = 0, множество W*[t] может быть выражено интегралом многозначного отображения [43]: который по теореме Ляпунова всегда является выпуклым множеством.

При наличии внешнего возмущения, рассматривается хаусдорфов предел J{t, ti, М) альтернированных сумм специального вида по всевозможным разбиениям отрезка интегрирования, получивший название альтернированного интеграла. Он был предложен Л.С. Понтрягиным [30] в конце 1960-х в связи с дифференциальными играми преследования и более детально изучен позднее во многих работах (см. [31] и библиографию там). Во втором параграфе приведены определение и основные свойства этого интеграла.

Попятная конструкция, на основе которой строится интеграл Понтря-гина, предполагает информационную дискриминацию одной из сторон. Именно: предполагается, что текущая информации о помехах появляется с опережением. Этот факт подсказал определение еще одного многозначного интеграла [20]: альтернированного интеграла Понтрягина второго рода J~ (r,ti,M) (другие, неэквивалентные ему определения см. также в [27], [26]), оно приведено в третьем параграфе. В работе [20] А.Б.Куржанским было также сформулировано утверждение о том, что при условии невырожденности 1.1, будем называть его условием "внутренней точки", альтернированные интегралы Понтрягина первого и второго рода совпадают. Этот факт действительно имеет место (теорема 1.1), и его доказательство дано в работе [2*]. Близкий результат был получен в статье [2] другим методом в связи с играми преследования. Кроме того, ранее были получены оценки максимума расстояния между альтернированными суммами двух типов при измельчении разбиения, применительно к задаче аппроксимации множества достижимости многогранниками (см. [28] и ссылки там), однако утверждение о совпадении интегралов не было явно сформулиро

0.1).

0.2) вано. В качестве вспомогательного результата, имеющего и самостоятельный интерес, в работе [2*] доказана также лемма о непрерывной зависимости альтернированного интеграла от целевого множества и подынтегральных функций (лемма 1.7). Отметим, что условие "внутренней точки "не слишком обременительно: его можно гарантировать, заменив терминальное множество подходящим £-раздутием.

В четвертом параграфе доказываются вспомогательные утверждения, касающиеся функций цены — последовательного минимакса V+(t, х) и максимина V~(t, х), введенных А.Б. Куржанским [20] на основе предельных программных конструкций.

Так как альтернированный интеграл Понтрягина является множеством разрешимости задачи синтеза при неопределенности, т.е. максимальным стабильным множеством в смысле определения [17], из результатов [61] следует утверждение.

Теорема. [20] Функции V+(t,x) и V~(t,x) совпадают с вязким решением V(t, х) уравнения Гамильтона-Якоби где Хи(ш) ~ множество всех возможных траекторий, порожденных заданной стратегией и = U(t,x) и произвольным возмущением v(t) £ Q(t), а d2(x[ti],M) — квадрат евклидова расстояния от конечной точки траектории x[ti] до терминального множества.

Следствием теоремы 1.1 и лемм, доказанных в четвертом параграфе, является следующий результат.

Теорема. Пусть выполнено предположение 1.2 и р{1\ — V[t}) — p{l\Q[t]) — выпуклая функция по I при to < t < ti. Тогда функция V(t, х) является классическим решением уравнения Гамильтона-Якоби (1.47), (1.48).

Итак, альтернированный интеграл Понтрягина W[t] задается нулевым множеством уровня функции цены:

0.3) и £ T(t), veQ{t), V{thx) = d2{x,M). (0.4) и, тем самым, с функцией цены

V{t,x) = min max {d2{x[ti],M) | ж(-) <Е Хи{-)} , и *(.)

W[t] = {x : V(t,®) = 0}.

0.5)

Этот результат можно рассматривать как аналог "принципа Гюйгенса"для систем с минимаксным гамильтонианом вида

H(t,x,p) = minmax(p, f(t,x,u,v)).

U V

Следуя [8], напомним коротко соответствующую классическую конструкцию в ситуации, когда гамильтониан Я = Я(р, х) является гладкой функцией, не зависящей от времени явно. В этом случае Я(р, х) есть первый интеграл гамильтоновой системы Р дН "дх1 х дН др'

0.6) и фазовый поток системы (0.6) сохраняет форму dp A dx.

Поверхность Г" € К2" (р, х) называется лагранжевой, если форма р dx является замкнутой на Г". Лагранжева поверхность Гп С R2n(p, х) называется конической, если сужение формы pdx на Гп равно нулю (например, rS, = {(p,*o)}).

В случае, когда лагранжева поверхность Гп (локально) может быть задана в виде графика: р = Р(х), на Гп корректно определена укороченная функция действия Sq(x) = f7pdx, как интеграл вдоль пути 7 С Гп с началом в точке х. Функция Sq(x) удовлетворяет укороченному уравнению Гамильтона-Якоби Я дх при этом

Г" = {(**) :р=Ц(*)}.

Отметим, если Гп — коническая поверхность, то dim(7r(rn)) < п — 1, где 7г : Е2гг(р, х) —v Еп(ж) — ортогональная проекция. Таким образом, коническая поверхность не может быть даже локально представлена в виде графика, и функция действия на ней не может быть определена.

Пусть, дополнительно, гамильтониан Я(р, ж) является положительно однородной функцией "импульса "р:

H(e(ip,x) = efiH(p,x),

0.7)

Тогда фазовый поток Ф^ переводит конические плоскости в конические.

Фиксируем уровень "энергии"{Я = Е}, где Е — некоторая постоянная. Возьмем коническую поверхность Гп. Пересечем Гп с {Я = Е}, полагая gn-1 — р| — Е}, Выпустим траектории гамильтоновой системы (0.6) из точек Sn Sf 1 = 1. При условии, что Sn 1 нехарактеристична, поверхность

Г» = (J 5?"1 oo<t<oo лагранжева и целиком лежит в {Н = Е]. Пусть Гп задана функцией Sq(x). Тогда р dx |Sn-i = 0 означает, что ttS™'1 = {х : S0{x) = const} (0.8)

Итак, принцип Гюйгенса: волновой фронт 7гсовпадает с множеством уровня функции действия Sq(x).

В задаче синтеза при неопределенности роль волнового фронта играет альтернированный интеграл, роль действия — функция цены. Уравнение типа Гамильтона-Якоби с минимаксным гамильтонианом часто называют уравнением Беллмана-Айзекса, а сам принцип Гюйгенса — принципом оптимальности (ср. (0.5) и (0.8)).

Таким образом, в линейном случае (при условии "внутренней точки") множество разрешимости W*[t] задается альтернированным интегралом Понтрягина. Как следствие, для W*[t] выполнено полугрупповое свойство

W*(t, h, М) = W*(t, t, W*(t, tb M)), t<r<t i.

Это позволяет рассматривать многозначное отображение W*[t] при t < t\ как обобщенную динамическую систему. Естественная задача — попытаться найти инфинитиземальный оператор этой полугруппы.

Принципиальная трудность здесь состоит в том, что пространство выпуклых тел, т.е. выпуклых компактных множеств, является лишь полугруппой относительно сложения. Известно, что для произвольной полугруппы G с условием сокращения

VAtB,CeG: А + С = В + С=>А = В существует единственная (с точностью до изоморфизма) минимальная содержащая ее группа, называемая группой Гротендика. Полугруппа выпуклых тел этому условию удовлетворяет. Минимальная группа, называемая в этом случае группой виртуальных выпуклых тел, является векторным пространством, в котором можно строить дифференциальное исчисление. Но "настоящим"выпуклым телом инфинитезимальный образующий полугруппы W*[t] будет лишь при наличии довольно ограничительных условий, например монотонности W*[h] С W*, для всех t\ > h (или наоборот для всех t\ < £2)- В этом случае операция геометрической разности

Минковского) двух выпуклых тел

А - В = {с | с + В С А}. дает непустое выпуклое тело.

Дифференциальное уравнение, описывающее эволюцию данной полугруппы, тем не менее можно получить, не делая подобных предположений. Действительно, выпуклое множество W*[t] однозначно определяется своей опорной функцией

Рт*№= max (/,*). х eW*[f]

Для частной производной по времени нетрудно получить следующую формулу [29]: e^-w/g^i-^-pftiew)!

I i=1 п+1 п+1 г=1 г=1 „

Однако использование этой формулы затруднено необходимостью вычислять выпуклую оболочку положительно определенных функций в тех точках границы х G 8W* [£], где множество YV*[t] имеет особенность. В ряде работ эта трудность преодолевается построением кусочно-линейных аппроксимаций.

Другой подход, развиваемый А.Б.Куржанским, состоит в том, чтобы вместо дифференциальных уравнений для описания динамики множества разрешимости использовать эволюционные уравнения (см., например, [21], [22]), называемые также уравнениями интегральных воронок — "funnel equations" (при наличии фазовых ограничений см. также [44]). Теорема 1.1 о совпадении двух интегралов позволяет использовать два различных эволюционных уравнения: lim a~lh+{W[t - cr], (WM - aV(t)) - aQ(t)) = 0 для альтернированного интеграла Понтрягина и lima~xh-{W~\t - <т], (W"M - aQ{t)) - aV(t)) = 0 сг-И) для интеграла второго рода. Здесь

Z) = maxmin |(ж — z,x — z)l!2\x £ X,z £ zj , хаусдорфова полуметрика, и h-(X,Z) = h+(Z, X).

При помощи эллипсоидального исчисления, предложенного в начале 1990-х А.Б.Куржанским, в монографии А.Б.Куржанского и И.Валия [55] были получены параметрические семейства эллипсоидальных внешних и внутренних аппроксимаций множества разрешимости, описываемые обыкновенными дифференциальными уравнениями на параметры эллипсоидов. В шестом параграфе дан иной вывод этих дифференциальных уравнений, использующий указанные выше эволюционные уравнения. Необходимые формулы для аппроксимаций сумм и геометрических разностей эллипсоидов, взятые из книги [55], приведены в начале параграфа.

Пересечение всех "внешних"эллипсоидов также как и объединение всех "внутренних"эллипсоидов дает в точности множество разрешимости. Это позволяет (см. [55]) заменить W*[t] одним из "внутренних" аппроксимирующих эллипсоидов и применить к нему стратегию "экстремального при-целивани" Н.Н. Красовского. Для каждого вектора х £ int W*[t] найдется хотя бы один такой эллипсоид, а значит х может быть переведен во множество М посредством "эллипсоидальной"стратегии управления, если только выполнено предположение внутренней точки. Отметим также, что эллипсоидальные аппроксимации имеют ряд вычислительных преимуществ, связанных с возможностями использования параллельных вычислений.

Результаты второй и третьей главы относятся к задачам аффинным по управлению

Здесь U — произвольный многогранник в Ер, a Fq : W —^ R, /0 : Шп —> F^x) £ Lin(W R), fi(x) £ Lin(W ЕГ) — функции, класс гладкости которых будет уточнятся отдельно (Lin обозначает пространство линейных функционалов).

Оптимальным синтезом в открытой области О £ W1 начальных данных задачи (0.9), (0.10), при фиксированном терминальном многообразии N, называется функция и(х), х £ О. Если Fi(x), fi(x) — гладкие функции, можно выписать систему уравнений принципа максимума Понтрягина [32]

0.9) (0.10) х = fo(x) + fi(x)u, и £ и, ж(0) = ж0} x{T)£NcRn. дН • дН

0.11)

Н(ф, х) = max {(</>, fo(x) + /i(®)«) - Xo(F0(x) + Fi(x)u) : и €U}.

0.12)

Решение системы (0.11) понимается по Филиппову (см. [42]), а траектории называются экстремалями.

В регулярной ситуации, когда каждая экстремаль является кусочно гладкой кривой, общий метод решения состоит в интегрировании системы (0.11) в обратном времени на каждом отрезке гладкости экстремали. Однако для гамильтоновых систем (0.11), (0.12) общего положения уже со скалярным управлением, ситуацией конечной коразмерности является наличие траекторий со счетным числом неустранимых разрывов (переключений) управления на конечном интервале времени [54]. Такой тип поведения траекторий получил название феномена Фуллера (см. обзор [4]), а сами траектории — четтеринг-траекторий. Феномен Фуллера оказался тесно связан с наличием в системе особых траекторий, вдоль которых управление не восстанавливается однозначно из условия максимума (0.12). Такие траектории целиком лежат на поверхностях разрыва гамильтоновой системы (0.11).

В частности, если и Е [—1,1], то гамильтониан (0.12) можно записать в виде

Н(ф, х) = Н0(ф, х) 4- Нх(ф, х)щ и = sgn#i.

Тогда особыми будут те траектории, которые лежат на поверхности Hi = 0 Чтобы найти управление вдоль особой траектории (x(t)^(t)), необходимо последовательно дифференцировать функцию Hi в силу системы (0.11) до первого появления и:

I * I - О О < * < m - 1.

0.13)

Известно [53], что т = 2q, q Е N или бесконечно. Число q, называется порядком особой траектории (см. [57]). Если условия (0.13) выполнены в окрестности особой траектории четного порядка, а на самой траектории имеет место строгое условие Келли и особое управление является С°°-гладкой функцией, принимающей значения в интервале (—1,1), то любая кусочно гладкая траектория системы (0.11), стыкующаяся с данной особой, не оптимальна [53]. Это означает, что выход на особую поверхность Hi = 0 в подобной ситуации возможен лишь вдоль четтеринг-траектории. Простейшим примером возникновения четтеринга является задача Фуллера, исследованная впервые в 60-х годах (см. например [51],[52] и содержащиеся там ссылки).

Одним из наиболее важных с точки зрения приложений является случай q = 2. Законченная теория особых режимов второго порядка для гладких задач вида (0.9),(0.10) со скалярным управлением развита М.И.Зеликиным и В.Ф.Борисовым в работе [13] (см. также [63]). В рамках этой теории изучено поведение неособых траекторий системы (0.11) в окрестности особого многообразия, доказана теорема о лагранжевых многообразиях и даны достаточные условия их регулярной проектируемости на пространство состояний.

Во второй главе сделан первый шаг в развитии теории Зеликина-Борисова на класс задач с негладкими дифференциальными связями. Принцип максимума Понтрягина в этой ситуации неприменим, поэтому задачи такого типа до сих пор оставались практически неизучены. С целью построить общий метод решения, в первом параграфе рассмотрен специальный класс задач вида

•00

J(u{'))= / x2{r)dr4- min, J о

X = y, y = u\x\q, г* €[-1,1],

0) = ®o, У(°)

0.14) (0.15) зависящих от параметра 0 < q < 1. Для этого класса предъявляется центрально-симметричный синтез и(х, у) и соответствующее семейство траекторий. Для доказательства оптимальности, во втором параграфе строится непрерывно дифференцируемое решение негладкого уравнения Гамильтона-Якоби dV ох Ж дх х* ~2

0.16) с краевыми условиями 0) = 0 и V(x,y) > 0 при (ж, у) ф (0,0), выраженное в терминах гипергеометрических функций.

Теорема. 1. Оптимальный синтез й(х, у) задачи (0.14), (0.15) имеет вид й(х,у)

-1, (®,у)е П 1, (а?,у)еП+ где П , П+ — области, на которые разделена плоскость К2 (ж, у) кривой переключения Г = {(х,у) : у = zb|®|1//Jsgn(®)}, z0 < -y/fi, /3 =

2. Оптимальные траектории, порожденные синтезом й(х,у), представляют собой однопараметрическое семейство автомодельных решений (0.15): каждой траектории (x(t),y(t)) соответствуют постоянные 0 < Л < 1 и Т(Л), такие что л^^.Л-1^!)) =(4(« + Т(Л)Ш + Г(Л))), £ + £ =

3. Функция Беллмана задачи (0.14), (0.15) при q ф | имеет вид

V(x,y) = С(й(х,у))(у2 - /Зй(х,у)\х\^у/2 iF (l -7 1 - 7/2- ^^-Ф)

У h ' 2 у/Щ^у) J ' где 7 = тйг и

JLdё— f(I ->у 1 - /у/2- ^-«Л

В третьем параграфе предлагаемый метод проиллюстрирован двумя примерами: приведены функции Беллмана в предельном случае q = 0 (классическая задача Фуллера) и в случае q = 1/2.

В четвертом параграфе рассмотрен класс дифференциальных игр

1 С°°

J = - I x2[r] dr minmax, (0.17)

2 Jo и v = У> У — \x\q(u — v), и £ [и-,и+], v £ [v,v+]. (0.18) с бесконечным числом переключений управлений на конечном интервале времени. К настоящему моменту достаточно полно изучен вопрос о существовании седловой точки для дифференциальных игр с фиксированным временем окончания (см.,напр. [16], [9]). В тех случаях, когда удается построить функцию цены, как гладкое или вязкое решение соответствующего уравнения типа Гамильтона-Якоби, имеются методы синтеза управлений и оценивания гарантированного результата. Для игр на бесконечном интервале времени подобные результаты общего характера отсутствуют. Для (0.17),(0.18) доказано существование седловой точки и найдены формулы для функции гарантированного результата и стратегий управления.

Предметом рассмотрения в третьей главе является топология фазового портрета в типичных интегральных слоях оптимального синтеза при многомерном управлении в окрестности многообразий, состоящих из особых экстремалей второго порядка. Произвольный многогранник, ограничивающий управление, введением подходящих барицентрических координат может быть преобразован к симплексу. В диссертации рассматривается случай управлений, принимающих значения в двумерном симплексе.

В первом параграфе содержатся основные для этой части работы определения, а также постановка задачи и ее группы симметрий. Найдены особые многообразия Au, А23, А13.

В первом пункте второго параграфа доказывается, что особые многообразия являются интегральными поверхностями оптимального синтеза в фазовом пространстве. Найден явный вид оптимального синтеза и фазовый портрет оптимальных траекторий на пространствах Aij.

Теорема. Оптимальный синтез задачи ограниченный на подмногообразие А^, в точности совпадает с синтезом несимметрической задачи Фул-лера с интервалом допустимых управлений [—2,1].

Во втором пункте второго параграфа получен оптимальный синтез в окрестностях областей Л?-, а также формулы, задающие соответствующие лагранжевы многообразия в кокасательном расслоении. Структура оптимального синтеза в окрестности Л?- представляет собой четтеринг-расслоение Зеликина-Борисова. В третьем пункте описано локальное строение слоев этого расслоения.

В пункте четыре второго параграфа изучен фазовый портрет оптимального синтеза в окрестности Afj.

Четвертый параграф посвящен изучению факторсистемы по действию масштабной группы симметрий Q. Фактор фазового пространства по действию группы Q гомеоморфен трехмерной сфере S3. Синтез оптимальных траекторий имеет качественные отличия от систем со скалярным управлением. Особые многообразия в лежат на трех циклах Л12, А2з, А13 (в исходном фазовом пространстве им соответствуют двумерные многообразия А^, содержащие автомодельные семейства траекторий с бесконечным числом переключений с особого режима на неособый). Область притяжения каждого цикла в <S3 образует открытое полноторие, покрытое полем оптимальных траекторий с накоплением переключений. Интегральные многообразия этого поля образуют (негладкую) модификацию слоения Риба в полнотории (см. также [12]).

В заключительной части четвертого параграфа описывается общий метод нахождения неособых периодических решений, как неподвижных точек отображения Пуанкаре поверхности переключения. С его помощью в общей части границы трех областей притяжения в S3 найдены два неособых периодических решения Виз и #321

Теорема. На фактормногообразии Е7 существует два трехзвенных цикла Bijk и Bjik, каждый из которых соответствует однопараметрическому семейству оптимальных траекторий в фазовом пространстве. На этих траекториях последовательно используются управления, лежащие в каждой из трех вершин симплекса. При этом управления чередуются в порядке, соответствующем индексации, т.е. на одном из циклов вершины чередуются в одном порядке, а на другом — в противоположном. Оба цикла инвариантны относительно четных перестановок из группы симметрий <5>з. Нечетные перестановки переводят циклы друг в друга. При этом на оптимальных траекториях имеет место четтеринг-режим, т.е. фазовая точка приходит в начало координат за конечное время с бесконечным числом переключений управления.

В работе [6*] были найдены и другие неособые периодические решения, лежащие вне областей притяжения особых циклов; исследована их устойчивость, а также вычислены индексы зацепления всех найденных циклов.

Наконец, отметим, что в работе [6*] исследована топологическая структура оптимального синтеза в открытой области, вне границы областей притяжения. Граница областей притяжения является аттрактором системы принципа максимума Понтрягина в попятном времени. Несмотря на вполне наглядное топологическое строение, поведение решений вблизи этой границы отнюдь не тривиально с точки зрения гладкой структуры. Компьютерный эксперимент убедительно свидетельствует, что граница областей притяжения не удовлетворяет требованиям стратификации Уитни [38] и стратифицированным многообразием не является. Кроме того слои модифицированного слоения Риба не являются даже кусочно-гладкими многообразиями, так как изломы накапливаются по мере приближения к границе областей притяжения.

В заключение автор выражает глубокую благодарность своим научным руководителям академику РАН А. Б. Куржанскому и профессору М. И. Зе-ликину за постановку задач и внимание к работе, а также профессору В. Ф. Борисову за полезные обсуждения.