Применение методов интерполяции и сплайн-аппроксимации для синтеза субоптимальных стратегий стабилизации движения летательных аппаратов тема автореферата и диссертации по математике, 01.01.11 ВАК РФ
Чжоу, Гуйхуа
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1994
ГОД ЗАЩИТЫ
|
|
01.01.11
КОД ВАК РФ
|
||
|
РГ6 од
; & ДЙР В?"
ГОСУДАРСТВЕННЫЙ КОМИТЕТ ПО ВЫСШЕЙ ШКОЛЕ РФ
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ИНСТИТУТ С ТЕХНИЧЕСКИЕ УНИВЕРСИТЕТ 3 - МАИ
На правах рукописи
ЧЖОУ ГУРКУА
УДК 62-50
ПРИМЕНЕНИЕ МЕТОДОВ ИНТЕРПОЛЯЦИИ И СПЛАЙН-АППРОКСИМАЦШ ДЛЯ СИНТЕЗА СУБОПТИМАЛЬНЫХ СТРАТЕГИ7! СТАБИЛИЗАЦИИ ДВИЖЕНИЯ ЛЕТАТЕЛЬНЫХ АППАРАТОВ
01.01.11 - Системный анализ и автоматическое управление
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Москва — 1994
Работа выполнена в Московском государственном авиационном институте (техническом университете).
Научный руководитель: доктор физико-математических наук
профессор М. М. Хрусталев.
Официальные оппоненты: доктор физико-математических наук
профессор. А. В. Пантелеев, кандидат технических наук доцент В.В. Дементьева.
Ведущее предприятие: Московский филиал Института проблем транспорта РАН.
Защита состоится " " _ 1994 г. в _ ч. на
заседании совета ДР. 053. 04. И. в Московском государственном авиационном институте (техническом университете).
С диссертацией можно ознакомиться в библиотеке института. Адрес института: 125871, Москва, Волоколамское шоссе, д. 4, МАИ.
Автореферат разослан " " _ 1994 г.
Ученый секретарь Совета
А. Ю. Аржененко
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Динамическое программирование является одним из фундаментальных направлений теории оптимального управления. Основной привлекательной чертой метода динамического программирования является то, что он дает решение не одной задачи, а решает семейство задач с различными начальными условиями и позволяет построить стратегию управления по состоянию системы Суправление с обратной связью). Такая форма решения задачи оптимального управления предпочтительнее при практическом использовании, чем программное управление.
Метод динамического программирования сводит задачу оптимального управления к решению уравнения в частных производных первого порядка - уравнения Беллмана. Для такого уравнения, как известно, отсутствуют регулярные способы численного его решения, да и сам факт существования его решения в том или ином классе функции представляет собой сложную задачу.
За более чем 30 лет развитие метода динамического программирования шло в двух направлениях: теоретического обоснования и разработки численых методов. В настоящее время теоретическое обоснование метода можно считать во многом законченным. Здесь следует отметить работы У,Флемменга.С. Н. Кружкова В.Ф.Кротова, В.Г.Болтянского, М.М.Хрусталева, А.И.Субботина и Р.Лионса.
В отличие от проблемы теоретического обоснования метода динамического программирования, проблема построения на его основе эффективных вычислительных алгоритмов й их обоснование все еде находится в начальной стадии своего развития. В то же время разработка таких алгоритмов очень актуальна в связи с потребностями практики с одной стороны и возможностью аналитического решения уравнения Беллмана лишь в редких случаях с другой. Работы по этой проблеме можно отнести к одному из ниже следующих пяти направлений.
Первое из них это сведение задачи с непрерывным временем к задаче с дискретным, например, применением схемы Эйлера к дифференциальным уравнениям, описывающим управляемую систему и применением к ней теории и вычислительных методов, которые для дискретных систем более обоснованы. При этом часто проводится дискретизация не только времени, но и переменных состояния.
Такой подход использовался для частных задач еще самим Р. Беллманом. Дальнейшее развитие такой подход получил в работах Н.Н.Моисеева, Б.Ш.Мордуховича, Ю.Г.Евтушенко, Э.Полака и других авторов.
Вторая группа методов связана с идеей сведения проблемы решения уравнения Беллмана к конечномерной задаче математического программирования (линейного или квадратичного) пусть даже очень большой размерности. Здесь следует отметить работы R. Gonzalez и Е.Rofman , в которых предложены сходящиеся методы решения уравнения Беллмана. Эта группа методов получила развитие в работах M.М.Хрусталева и А.И.Пронина, M, М. Хрусталева и И. Б. Азанова
Третье направление развития вычислительных методов связано с классической идеей поля экстремалей. Современные варианты таких методов, основанные на экстремалях Понтрягина предлагаются в работах А.В.Фоменко, M.М.Хрусталева и
A. И. Пронина.
Четвертая группа методов связана с предположением о достаточной гладкости функции Беллмана и получением ее разложения в ряды по переменным состояния с коэффициентами, зависящими от времени в окрестности экстремали. Простейший вариант такого метода состоит в линеаризации уравнений управляемой системы в окрестности экстремали, использовании линейно-квадрати^еского приближения для критерия оптимальности и решения линейно-квадратической задачи оптимального управления методами АКОР (аналитического конструирования оптимальных регуляторов), фундамент которых заложен в работах A.M.Летова Для таких задач вид функции Беллмана известен - это линейно квадратическая форма от переменных состояния с коэффициентами, зависящими от времени. Дальнейшее развитие этот подход получил в работах К. У. Мериема, М. В. Тригуб.
Наконец пятое направление разработки численных методов, к которому примыкают результаты диссертации, связано с работами
B.Ф.Кротова и В.З.Букреева . В этих работах в отличие от предыдущей группы, предложено использовать не разложение функции Беллмана в ряд Тейлора для ее аппроксимации, а интерполяцию по точкам, расположенным на семействе узловых линий в пространстве переменных состояния и времени, достаточно равномерно расположенных в области аппроксимации решения
уравнения Беллмана. Для аппроксимации функции Беллмана предлагается использовать многомерные полиномы по переменным состояния с коэффициентами, зависящими от времени. Коэффициенты разложения находится из условия выполнения уравнения Беллмана на узловых линиях. Существенным недостатком метода является то, что система дифференциальных уравнений для коэффициентов является не разрешенной относительно производных, что в общем случае, приводит к необходимости на каждом шаге численного интегрирования обращать матрицу (порядка совпадающего с числом узловых линий). Эта процедура требует большего объема вычислений и может приводить к вычислительной неустойчивости метода. Вычислительный опыт авторов метода и других показал, что метод дает неплохие результаты лишь при небольшом количество узловых линий, что и определяет его прикладную ценность, как метода построения локального синтеза, хотя теоретически он может рассматриваться как метод решения уравнения Беллмана в заданной априори области.(не обязательно малой). Вычислительные эксперименты показали, что метод Кротова-Букреева обладает еще одним недостатком. Коэффициенты степенного полинома могут иметь очень разные порядки, что приводит к трудности их масштабирования и потере точности.
Целью диссертационной работы являются разработка эффективных численных методов для решения задачи оптимального управления и создание программного обеспечения для каждого метода, которое позволило бы сократить объем вычисления и повысить эффективность ее функционирования.
Методика исследования. Исследование проводится с использованием теорий оптимального управления, уравнений в частных производных первого' порядка и обыкновенных дифференциальных уравнений, методов полиномиальной интерполяции и сплайн-аппроксимации, численных методов решения обыкновенных дифференальных уравнений.
Научная новизна. Предложены два новых методов приближенного решения уравнения Беллмана с оценкой точности решения, основанные на аппроксимации зависимости функции Беллмана от фазовых координат многомерными полиномами Лагранжа и сплайнами Бесселя с коэффициентамиот времени. Доказаны теоремы существования и единственность для уравнений, определяющих коэффициенты аппроксимации.
Решена практическая задача стабилизации углового движения вытянутого спутника на круговой орбите.
Практическая ценность. Разработанные в диссертации приближенные методы решения уравнения Беллмана могут быть использованы при проектировании систем управления движением самолетов, космических аппаратов, кораблей, автомобиля, а также в других областях при управлении объектами, которые, можно описать системой обыкновенных дифференциальных уравнений.
Аппробация работы. Основные результаты работы докладывались на научных семинарах кафедры Математической кибернетики и системного 'анализа и управления Московского Государственного Авиационного Института, Института проблемы управления РАН, Московского филиала Института проблемы транстпорта РАН.
Публикации.По теме диссертации опубликованы работы [1-3].
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы, Работа изложена на 99 страницах машинописного текста, 3 страниц таблиц, 12 страниц ресунков и 9 страниц литературных источников.
Краткое содержание диссертации
Во введении дается краткой обзор по теме диссертации.
В первой главе дается постановка задачи оптимального управления,приводятся достаточные условия оптимальности и оценка Кротова,используемые в работе.Она является вспомогательной.
Пусть заданы: интервал 10<Ц .множество ВсТий11 с
непустой внутренностью,проекция которого на Т совпадает .с Т Обозначим через ВСО сечение множества В при фиксированном 1еТ. Пусть также задано непустое компактное множество 0<гР,г.
Рассматривается динамическая система
^ = га,х,и)'ЛбТ С1.1)
Здесь хКхЧо.....хпС1))Т^п и и^СиЧо,... ,игС1))Т б П <ЖГ -
фазовый вектор и векторы управления системы. Функции (1,х,и) -> ^а.х.иЭ: ТхЯпхП -Ж, 1=1,2.....п,непрерывны на ВхП.
Пара С х(.), иС.) ) называется допустимой, если:
1).вектор-функция хШ со значениями в пространстве 1?п непрерывна на Т и обладает кусочно-непрерывной производной, причем хШеВСО;
2). вектор-функция иС1) со значениями в !?г кусочно
непрерывна на Т и удовлетворяет ограничению иСисП;
3).пара вектор-функции СхС.) ,и(.)) удовлетворяет (1.1).
Через Б(1д,Хд) обозначается множество допустимых пар, для которых выполняется начальное условие х(10)=хд. Предполагается, что множество БСг^Хд) не пусто для каждого 1д<:Т и Хд€ВС1д). Задача оптимального управления состоит в том, чтобы:
минимизировать фунуционал
на множестве допустимых пар системы DCIq.Xq). Функции f°(t,x,u) и FCx) непрерывны по своим аргументам.
Определение. Функцию (t,x) ->u°(t,x):B ->Q, .такую,что для любого значения CIq.Xq) определена единственная пара функций СxCU.uCt)),удовлетворяющих на CtQ.tjJ системе (1.1), условиям u(t)=u°(t,x(t)) и (t,x(t))eB,называют стратегией управления на множестве В или управлением с обратной связью на множестве В.
Определение. Стратегия управления u=u°Ct,x) называют оптимальной, если при всех (t0,XQ)eB справедливо равенство I°(t0,x0)=d(t0,x0)= min veDCto>Xo) I(v)
Здесь I°(t0,x0) значение функционала (1.2), соответствующее начальной точке (Iq,Xq) и стратегии u°(t,x).
Определение. Функцию W(T,xT)=-d(r,xT) называют функцией Беллмана для задачи 1.1-1.2,где d(r,xT): =infU€j)(T х ^IC v )
Уравнение
maxU€flCpx(t,x)f(t,x,u)+pt(t,x)-fO(t,x,u)]=0. (t,x)eB (1.3)
fCtj.x) = -FCx), x 6 BCtj) (1.4)
называется уравнением Беллмана
Решение этого уравнения позволяет найти оптимальную стратегию управления, задаваемую отношением u°Ct,x)€ArgmaxU6ß t?5xa,x)fU,x,u)-f0a,x,u)). (1.5)
Вторая глава посвящена разработке метода интерполяционных полиномов Лагранжа приближенного решения уравнения Беллмана. Здесь функция Беллмана аппроксимируется интерполяционными полиномами Лагранжа, в общем случае многомерными с помощью значений функции р на узловых линиях.
В п.2.1 дается общая аппроксимация функции Беллмана с помощью узловых линий.
В п.2.2 рассматривается аппроксимация функции Беллмана
где
интерполяционными полиномами Лагранжа с помощью значений
функции р на узловых линиях в случае, когда траектория
является одномерной. Пусть область построения функиции Беллмана П имеет вид
П = ((t,x): tQ < t < tj, a < x < b > (2.1)
Задается N+l узловая линия в П
x^(U = х^ const, i=0,1,... ,N,
где а = Xq < х^ 5 ... S xN = b, . (2.2)
Вводятся базисные полиномы Лагранжа N х ~ х|с
1JCx5e k4!lCj V^T С2'3>
и обозначается p^t) : = pCt.x^), i=0,l,...N, (2.4)
Функция Беллмана WCt.x) в области П аппроксимируется полиномом N
pCt,x)= Е р,(ОЬ(х) C2.S)
j=0 J J N . .
Обозначим ^Ct) : =pv(t,x<)= £ pf(t)l ¡(x) L_v (2.6)
i. л A j_g J J
N 1
xj " xk "Ри i=j
* П *t - xk
——-— II x _ у при 1*J
xj xi k=0,k*i,k*j xj xk Из условия того, что функция р удовлетворяет уравнению Беллмана на каждой из узловых линий и граничному условию строятся уравнения для определения функции p^(t), однозначно определяющих аппроксимацию (2.5) функции Беллмана. d p.CU
-- = -НС ^CD.t.x (2.7)
Р^Ц) = -FCxi(t13) i=0,1.....N (2.8)
Здесь
H(px;t,x)-maxU€Q [pxU.x)f(L.x.u)-f0(t,x,u)J, (2.9)
где <px - вектор частных производных функции p(t,x) по х.
Установлена следующая теорема.
Теорема 2.1. Пусть функции f'(t,x,u) и f°Ct,x,u) непрерывны и множество Q компактно, тогда существует единственное решение задачи Коши (2.7),(2.8) на всем интервале [t0,t^].
В п.2.3 обобщается способ аппроксимации функции Беллмана интерполяционными полиномами Лагранжа на другие случаи: многомерный случай и случай переменных узловых линий.
В п.2.4 приводится последовательность действий, которые
Ь(х) J 'х=х^
необходимо выполнить для реализации метода численного решения уравнения Беллмана, описанного выше, а также алгоритм оценки отличия субоптимальной стратегии от оптимальной по оптимизируемому функционалу.
Алгоритм приближенного численного решения уравнения Беллмана и синтеза субоптимальной стратегии управления состоит в следующем:
1). Задать область П построения функции Беллмана. В простейшем случае равенством С2.1) Сп=1),
2). Задать узловые линии, достаточно равномерно расположенные в области П. В случае постоянных узловых линий задастся равенствами С2.23 Сп=1),
3). С помощью узловых линий сформулировать полином Лагранжа вида С2.5) в одномерном случае (п=1),
4). Для определения коэффициентов-функций подставить полином Лагранжа в уравнение Беллмана С1.3), требуя точного удовлетворения этому уравнению на каждой из узловых линий, а также удовлетворения граничного условия С 1.4) на узловых линиях при 1=Ц. Результатом этой операции является формирование задачи Коши для определения коэффициентов функций вида С2.7),(2.8) в одномерном случае,
5). Решить задачу Коши тем или иным численным методом интегрирования системы обыкновенных дифференциальных уравнений.
6). Субоптимальная стратегия управления и(1,х), определяется равенством С1.5).В случае,когда операция в(1.5) может быть выполнена аналогически, нет необходимости запоминания стратегии. Управление с обратной связью в форме К-стра-тегии формируется в ходе процесса управления путем вычисления значения функции иС1,х) с некоторым шагом Д1 по времени с помощью С1.5). Между моментами вычисления значения иС1,х) остается постоянным.
7). Используя оценку Кротова оценить близость субоптимальной стратегии к оптимальной.
Детализируем п. 7) алгоритма.
При вычислении оценки Кротова основную трудность представляет реализация операций глобального максимума и минимума по фазовому вектору вида 5ирх€д(уКС1,х), где
ка,х)=[рха.хж1,х,и)+р1а,х)-г°а,х,и)}, сг. ю)
Здесь для нахождения глобального максимума или минимума
испольауон способ перебора значений функции на некоторой сетке.
Алгоритм оценки отличия приближенного решения уравнения Беллмана от точного и отличия по • функционалу субоптимальной стратегии от оптимальной:
7.1). Задает более густую чем в п.2) сеть узловых линий х* (х^*: 0 £ 1 5 >.для реализации приближенного вычисления глобального максимума и минимума.
• 7.2). Интегрируем численно дифференциальные уравнения
—- = - шах ки.х,*СО); C2.ll)
61 0<Ш* 1
—^- = - т1п Ра.хАО); С2.12)
сИ 0<1<И* 1
с начальными условиями
Дт1пС11)=га1по$1^ »Сж^^ЭЭ
в направлении от ^ к ^ о отрицательным шагом.
Здесь $Сх)=рС1^,х)+РСх). Предполагается,что коэффициенты-функции р.-Ш Сп=1), или СО Сп>1) затабулированы и
хранятся в памяти ЭВМ, а частные производные СО),
р^СЪ.х^Ш) вычисляются как производные полинома Лагранжа по формулам С2.6) в одномерном случае Сп=1),
Значения функций Д^^СО и Д^СО запоминаем с некоторым шагом.
7.3). Вычисляем значение функции
и запоминаем с некоторым шагом.
7.4). Вычисляем относительную оценку оптимальности стратегии
дси
беНаСО = -5- х 100'/. 0.14)
тах „ МС^х* (О) 0<Ш* 1
ра.х^СО) +Дт1пС13, если ра.х^СО) >0
Здесь МСО =| и ^а.х^СШ + Дт1пШ> 0
. -Сра.х^СОЬ Д^СО), если ра.х^СО) < 0
и ра.х^Ш) + Дт1пСО < 0 В остальных случаях величина М, а следовательно, и беИаСО не определены.
7.5). Итогом вычисления яеляются неравенства | К10,х0) - бС10,х0) | < Д(10)
- и -
(Р(1д) + Лга1пС1) < КСI,х) < узСЪ.х? а,х)е П,
л
оценивающие отличие значения функционала на субопти
мальной стратегии от нижней грани бид.Хр) и функции р от функции Беллмана V,
Справедлива также относительная оценка
-100-/.<бе11аС10). (2.15)
для тех для которых бе11аС10) определена.
Этот алгоритм аналогически и используется для решения многомерных задач.
Для демонстрации метода в п.2.3 проводятся модельные примеры.
В третьей главе диссертации излагается метод сплайнов Бесселя приближенного решения уравнения Беллмана и дается алгоритм метода для решения практической задачи.
В п.3.1 и п.3.2 дается аппроксимация функции Беллмана сплайнами
Предположим для простоты, что траектория хСО системы является одномерной. Пусть область построения функции Беллмана П имеет вид
П = { а,х): Ц < I < Ц, а < х < Ь >. Интервал [а,Ы разбивается точками а = х0 < х^ < ... < х^ =Ь. Задаются параллельные линии 1А,1=0,1,....М
=С а.хр е П: 10 < I < 11 ), и вводятся обозначения
ПА:= С С1,х): 10 < I < Ц, Х1 < х < х1+1 >. Лх^: =Х|+1"Х^. 1=0,1.....М
^си—ра.х^, 1=о,1.....м.
Функции р^Ш, в аппроксимации функции Беллмана \Л1,х), играют роль коэффициентов, которые подлежат определению. Функция Беллмана в области П^сП аппроксимируется полиномом Р^.х)
Р3а,х) = рЧ1,х) = сиси + с21С1) Сх-х) + (3.1)
+ с31ШСх -х1)2 + с^Ш С х -х,03
х^ х $ Х|+1, 1=0,1.....М-1
где с^Ш с21СО =зАСО
С31Ш = ш?
c4iCU = -¿q <Si<t)+s1+1Ct> C^CO-^U)))
Здесь s^Ct),i=0,l,... ,M - параметры-функции, способ выбора которых дает разные варианты аппроксимации.
Аппроксимация функции Беллмана кубическими сплайнами Бесселя. В этом случае Sj,(t) выбираются следующим образом: 1 Дх( Ах, <
1 1 1=1,2.....М-1 (3.2)
slCt3= Щ Cp2Ct3^lCt»'sMCU=Sx^^CU-PH-lCt)) С3-33 В случае, когда Дх^=Лх = const
siCl) = -¿ГС.*>1+1а)~*,1-1Ш)' 1=1,2.....M_1
Для определения функции p^Ct), задающие аппроксимацию
функции Беллмана, из условия выполнения уравнения Беллмана на
узловых линиях получены следующие уравнения t dtfjCt)
i -НЕ- = "НС SiCUjt.xO
t рДГ.-FCx/ 1 Ы.....М С3-43
Установлена следующая теорема.
Теорема 3.1. Пусть функции f(t,x,u) и f®(t,x,u) в непрерывны и множество П компактно, тогда существует единственное решение задачи Коши (3.4) на всем интервале CtQ,t^].
Простое представление функции Pgx(t, х ^, i=0,l.....М,
через p^Ct), i=0,Г,... ,М упрощает реализацию метода на ЭВМ и увеличивает быстродействие.
Аппроксимация функции Беллмана идеальными кубическими сплайнами, В этом случае s^(t) определяются следующей системой si_1(t)£»xi + Sj,(U SiAx^+top + si+1(t) = t^
ГЯе Pi(t) - ^«(t) f»i+iCt) - p;(t) Ь^ЗСАх, Ax,./1 + -C3'S)
i=l..... M-l
Если каким-то образом определены Sq(1) и s^Ct), то система (3,5) имеется единственное решение. Ее решение представляется В виде:
s(t) = А р (t) С3.6)
где sCO -(Sq(L),...,5^(1)) - векторы производных по х функции ip на узловых линиях при фиксированном t, а f>(t)= C^qCt), . , . ,V>lV,(t)) - значения функциии Pg(t,x) на узловых линиях. Для определения параметр-функций pi(t) получена система уравнений
= -Н^Ш-Л.х^ (3.7)
^сг., э - -тскр 1=о, 1.....м
Теорема 3.2. Пусть функции ГС^х.и) и Л1д,ц) непрерывны и множество 0 компактно, тогда существует единственное решение задачи Коши (3.7) на всем интервале
В п.3.4 обобщается аппроксимация функции Беллмана сплайнами на многомерный случай.
В п.3.5 приводится аналог алгоритма, описанного в гл.2, для решения задачи оптимального управления методом динамического праграммирования с использованием аппроксимации функции Беллмана сплайнами Бесселя.
Для демонстрации метода в п.3.6 приводится модельный пример.
В главе 4 предложенные методы применяются к решению задачи стабилизации углового движения вытянутого спутника на круговой орбите. Эта задача состоит в гашении углового отклонения спутника от положения равновесия с минимальной затратой энергии ( топлива ). Эта задача математически выглядит следующим образом.
1А с!С[
при = Ч , = СОЗЭ- + и, (4.1)
&а0) = &0 , да0) = Ц0, 10<0 , (4.2)
$(0)=0, ч(0)=0, (4.3)
минимизировать функционал
л0 ■
1=| ис 61, (4.4) ^ О
1=Г |и| при |ц|< итах . (4.6) 10
или
Ограничение (4.3) учитывается постредством метода штрафных функций. Поэтому вместо (4.5) минимизируется
1=| (Ан.+Х.^СМ+я^О)), (4.7)
10
а вместо (4.16) следующий
1=| ' |и| сИ+ХС^СО+ч^О)), (4.8)
10
где X - коэффициент штрафа.
Эта задача решалась предложенными методами с различными исходными данными. Для примера приведем результат одиного из
экспериментов, проведенных на ЭВМ с различными исходными данными.На рис.4.1 и 4.2 показаны траектории углового движения спутника с критерием затраты энергии С4,43. На рис.4.3 и' 4.4 представлена функция задаваемая равенством
(2.10), при раэничных фиксированных I и Исходными данными были следующие: метод аппроксимации функции Беллмана - сплайн Бесселя; область построения функции Беллмана П' = < С1,£,я): -12 £ I £ 0, -0,8 ^ & 5 0.8, -0.8 £ ч £ 0.8 >; число узловых линий по ч - 8, по & - 8; Х=1; шаг интегрирования: Ь=0.03; метод интегрирования: многошагвый метод Адамса. С использованием оценкой оптимальности Кротова вычисляется относительная погрешность метода <ЗеНа(1ф) такая, что
К10,.0,д0) - сК10,»0,д0) 5йе1ии
где 1С1о,$0,до) значение функционала на субоптимальной траектории, сКЦ.б^.ЧдЗ неизвестное оптимальное значение функционала. Величина сЗеИаСО задается равенством (2.14), которое для рассматриваемой задачи преобретает вид
дсо
бе11аа) = - х 100 Я ,
где ДСО определяется С2.13), а П^ = С -0.8 < & < 0.8,
-0.8 5 я < 0.8 >. ДСО и Дт^СО вычисляется по п.7) алгоритма,
описанного в гл.2. В таблице С4.1) приведена зависимость
величины шах с!еНаСО от числа узловых линий при выше пере-1е[-12,03
численных исходных данных Таблица 4,1
число узловых линий по & 4 по & 6 по & 8 ПО & 10
по Я 4 по ч б ПО ч 8 по ч 12
шах с!еНаСО и[-12,0) 43.4 % 31.5 К 24.7 У. 11.0 •/.
Важно здесь отметить, как видно из таблицы 4.1, величина
шах с!еКаСО уменьшается с ростом числа узловых линий. иС-12,0]
......г 1.....
____I_____
"Г I
0.7
„I_____
10.3
¡0.4
.......Т'Т
0.3
0.7
Ч ,
-Э. ?-№,. й-О
; 1
5-0.Ч-Й. Э-0.2-0.1
V—
и О'.З О.
II, ¡^
з а. ^ с*.з о ::2±
.6 01? О.!
-0.4
..Л--—[._„
г -Го.з
_I
^0.7
рис.4.1 траектория углового движения спутника 10=-10, &0=-0.6, д0=0.35
— а.8
0.7
0.«
0.3
1 0.4 \ \ — — —
! 1' 0.3 \
1 1 1 1 о.г N > \
I ! 1 / 1 0.1 \ 1 \ т..
). В-0.7-01.6-0 ! 1 .3-0.4-0 1з-о .2-0 лЧУ 2) ¿1 0 .?. 0 .3 0'. 4 С.510 | и .6 О1. 7 о".
1 1 I к N 0.1 1 1-
( I } I 4 \ о.г 1 . 1 /
1 1 ; Чп.э 1 \ | -.1 1
! ; |0, ! !
.....и и. ; | ! | : Г!!]::!
— - ! • ! „1.1... 1
ли 1
рис. 4.2. траектория углового движения спутника 10=-9, &0=0.4, 0.4
/
R<t( thetA.q)
0.0001000
V____________,
1 1 J 1 il —1__J—■—' -n-41. 1
-0.8 -0.0001000 4 \
iркс. 4.3. i функция RCt,&,q) при t=-11.5, ô=0.1.
H<t. theU.o)
0.0010000
\ ^ \
-0.3------ ^J__—' -s—-_ _ 1 1 -0.0010000 ' ' 1'« c.a
рис. 4.4. функция R(t,&-,q) при t=-11.5, &=0.7.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
Итогом диссертации является разработка новых методов приближенного решения уравнения Беллмана в направлении, предложенном В.Ф.Кротовым и В. З.Букреевым с целью повышения быстродействия и устойчивости численных алгоритмов. Основные результаты состоят в следующем.
1. Предложен новый метод интерполяционных полиномов Лагранжа приближенного решения уравнения Беллмана. От известного метода Букреева предлагаемый метод отличается тем, что при вычислении правых частей дифференциальных уравнений для коэффициентов полинома Лагранжа не требуется обращение матрицы большой размерности. Это существенно сокращает время вычислений и повышает вычислительную устойчивость метода.
2. Предложен новый метод сплайнов Бесселя приближенного решения уравнения Беллмана. В основу метода положена аппроксимация функции Беллмана в каждой момент времени кубическими сплайнами Бесселя. Такая аппроксимация носит локальный характер, что дает возможность повысить точность и устойчивость вычисления и сократить объем вычисления.
3. Как для метода интерполяционных полиномов Лагранжа, так и для метода сплайнов Бесселя получены условия, гарати-рующие существование и единственность решения системы обыкновенных дифференциальных уравнений, определяющих коэффициенты, задающие приближенное решение уравнения Беллмана.
4. Разработан алгоритм оценки отличия приближенного Руцким« уршмюиил Поллмппп, полуюипого и помсиш.ю мотодоп п.п.1,2, от точного. В основе алгоритма лежит теория оценки приближенных решений В.Ф. Кротова.
5. Создано программное обеспечение разработанных методов и проведено их тестирование на модельных примерах, показавшее работоспособность метода.
6. С использованием разработанных методов решена задача построения субоптимальных стратегии управления в задаче стабилизации углового положения вытянутого спутника на орбите Земли.
Основные результаты диссертации опубликовании в следующих работах.
1. Хрусталев М.М., Чжоу Г. Приближенное решение уравнения Беллмана при помощи интерполяционных полиномов Лагранжа. / Деп. в ВИНИТИ, 285-В94, 1994 г..
2. Хруст алев М. М., Чжоу Г., Азанов И. Б. Приближенное решение уравнения Беллмана при помощи кубических сплайнов Бесселя. / Деп. в ВИНИТИ, 282-В94, 1994 г..
3. Хруст а л es U.M., Азанов И. Б., Чжоу Г. Аппроксимация функции Беллмана полиномами и линейчатыми сплайнами. / Деп. в ВИНИТИ, 284-В94, 1994 г..