Синтез систем стабилизации управляемых случайных процессов на основе метода стабилизирующих пар тема автореферата и диссертации по математике, 01.01.11 ВАК РФ
Ажмяков, Вадим Викторович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1994
ГОД ЗАЩИТЫ
|
|
01.01.11
КОД ВАК РФ
|
||
|
Российская Академия Наук Институт Проблем Управления
На правах рукописи УДК 519.217.8
АХМЯКОВ Вадим Викторович
СИНТЕЗ СИСТЕМ СТАБИЛИЗАЦИИ УПРАВЛЯЕМЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ НА ОСНОВЕ МЕТОДА СТАБИЛИЗИРУЮЩИХ ПАР
3i.oi.ll - Системный анализ и автоматическое управление)
РГ8 ОД
Автореферат диссертация на соискание учеьой степени кандидата физико-математических наук
МОСКВа 1994
Работа выполнена в Институте проблем управления РАН.
Научный руководитель: доктор технических наук, профессор Е.С. ПЯТНИЦКИЙ
Официальные оппоненты: доктор физико-математических наук A.C. КОВАЛЕВА доктор технических наук, профессор В.Р. НОСОВ
Ведущая организация: Институт системного анализа РАН
Защита состоится << >> 1994 г. в часов
на заседании Специализированного совета Д оог.ев.оз Института проблем управления по адресу: 117342, Москва, Профсоюзная ул.,65. С диссертацией можно ознакомиться в библиотеке Института проблем управления.
Автореферат разослан << >> 1994 г.
Ученый секретарь Специализированного совета к.т.н.
С.А. ВЛАСОВ
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность теш. Исследование математических моделей различных технических, биологических и социально-экономических процессов приводит к необходимости учета наличия в управляемых системах различного рода помех и неопределенностей. В рамках вероятностного подхода, неполнота информации в таких системах интерпретируется как действие на них случайных возмущённей с известными статистическими характеристиками.
При решении задачи синтеза управлений, обеспечивакщяк некоторое качество системы, либо оптзмалышх в смысле заданного критерия возникает вопрос об устойчивости замкнутой системы. Условия, при которых система устойчива, по существу, определяет условия ее работоспособности. Поэтому, актуальной является задача построения стабилизирующих управлений, яря реалчзацш: которых процесс оказывается устойчивым в некотором вероятностной сгисяэ.
. Решение этой проблемы известно лишь для некоторых классов стохастических систем. В настоящей работе рассматривается задача синтеза стабилнзируящего управления для управляемых случайных процессов, порожденных стохастическим дифференциальным уравнением Ито, а также для управляемых марковских цепей. Предполагается, что имеет место случай полных наблюдений состояния системы. Построение стабилизирующих управлений осуществляется в виде управлений с обратной связью.
В данной работе обосновывается метод решения задачи синтеза стабилизирующих управлений, обобщающий на стохастические дифференциальные и дискретные системы принцип стабилизирующих пар для детерминированных систем. Под стабилизирующей парой понимается пара функций - стабилизирующее управление и функция Ляпунова, устанавливающая устойчивость нулевого решения соответствующей замкнутой системы. Основу этого метода составляют стохастические аналрги прямых и обратных теорем Ляпунова об устойчивости.
Как известно, основной трудностью при использовании прямого метода Ляпунова в задачах управления является отсутствие общих способов построения функции Ляпунова. Эти же трудности сохраняются и а стохастическом случае. Вследствие этого, а также в связи с тем, что во многих случаях алгоритмы управления реализуются с,помощью ЭВМ, метод стохастических стабилизирующих пар, предлагаемый в настоящей работе ориентирован на применение ЭВМ. Конструктивный аспект этого метода заключается в численном построении функции Ляпунова в стабилизирующего управления.
Цель работы - разработка критериев асимптотической ста-билизируемости по вероятности и экспоненциальной стабилизк-руемости с вероятностью 1 для непрерывных и дискретных марковских процессов;
- обоснование численного метода построения стохастических стабилизирующих пар (функции Ляпунова и стабилизирующего управления), позволяющих конструктивно решать задачи стабилизации.
Метода исследования. Для получения и обоснования пред-' ложенкнх б работе критериев стохастической стабилизируемости в диссертации используются: общая теория управляемых случайных процессов, теория стохастических дифференциальных уравнений, теория марковских цепей, прямой метод Ляпунова для непрерывных и дискретных стохастических систем. При разработке конструктивных алгоритмов построения стохастических стабилизирующих пар используются методы математического программирования и сеточный метод решения задач оптимизации.
Научная новизна. В диссертации предложен новый подход к решению проблемы синтеза стабилизирующих управлений в задачах стабилизации управляемых марковских процессов. Для случайных процессов, порожденных конечномерными стохастическими дифференциальными уравнениями Ито, этот подход позволяет сформулировать критерии асимптотической и экспоненциальной стабилизируемости нулевого решения в широком классе допустимых управлений, содержащем полунепрерывные сверху по включению Функции.
В работе получены необходимые и достаточные условия асимптотической .и экспоненциальной устойчивости нулевого решения дискретной системы со случайными параметрами, порождающей марковскую цепь. На основе этих условий разработаны критерии стохастической стабилизируемости управляемых цепей Маркова. Приведенные в работе критерии используют как обычные Функции Ляпунова, так и функции Ляпунова из класса слу-* чайных функций.
В диссертации наряду с задачами синтеза асимптотически
устойчивых по вероятности и экспоненциально устойчивых с вероятностью 1 замкнутых динамических систем рассматриваются также задачи построения диссипативных, в соответствующем вероятностном смысле, замкнутых систем. Сформулированы достаточные условия стохастической диссипативности. Разработаны алгоритмы численного решения задач стабилизации, основанные на сведении задачи построения функции Ляпунова в области с выколотой окрестностью нуля к задаче математического программирования на дискретной сетке.
Практическая ценность. Проблемы построения устойчивых замкнутых динамических систем со случайными параметрами возникают в различных задачах оптимального управления. Полным решением задачи стабилизации управляемых систем следует считать пару функций {У(х^), и(х,г)}, состоящую из допустимого управления и(х^) и Функции.Ляпунова, устанавливающей устойчивость замкнутой системы в том или ином вероятностном смысле. Основную роль при построении функции как правило, играют аналитические методы, не позволяющие конструктивно находить стохастическую стабилизирующую пару и(х,ъ)}. Поэтому развитие и усложнение задач теории управления и нелинейных задач механики приводит к необходимости алгоритмизации и численного решения проблемы стабилизации стохастических систем.
В связь с этим разработанные в диссертации критерии стабилизируемости стохастических систем и методы конструктивного построения стохастических стабилизирующих пар имеют теоретическую и практическую ценность.
Апробация работы. Основные результаты диссертации докладывались и обсуждались на научных семинарах ИПУ, на I международном семинаре "Устойчивость и колебания нелинейных систем управления" (Москва, 1992), на I всероссийском совещании "Новые направления в теории систем с обратной связью" (Уфа, 1993), на II международной научно-технической конференции "Актуальные проблемы фундаментальных наук" МГТУ им. Н.Э. Баумана (Москва, 1994).
Публикация. По теме диссертации опубликовано 5 работ, список которых приводится в заключительной части автореферата.
Объем работы. Диссертация состоит из введения, трех глав, заключения и списка цитированной литературы.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ.
Во введении обсуждается актуальность темы, сформулирована цель и определены задачи работы, приведен обзор современных подходов к проблеме синтеза стабилизирующих управлений в задачах управления стохастическими системами, кратко изложены основные положения диссертации.
В первой главе рассматривается класс нелинейных управляемых стохастических динамических систем, описываемых дифференциальными уравнениями Ито
бХ(г)= аСХ(Ъ),и )сИ; + оСХ(Ъ))«Ж(г),
' (1)
Х(в)= х , г,8 « Г»* £ 8 ; о
где х('Ь): о—» я" вектор состояния, имеющий смысл отклоне-
- а -
ния от режима, предписанного целью управления; u : п —»и вектор управления, и с Rr; q={u}- пространство элементарных событий; вектор сноса a(x,u): rnx rr—» r" ; о(х): rn—» rn*" есть матрица размера n*n; W(t), t, е r+- стандартный процесс Винера; a(o,o)s о, о(0)а о. Вероятностное пространство, на котором рассматривается уравнение (1.1.1.), обозначено через (ü,F,Р), где F - о-алгебра подмножеств множества о, р- вероятностная мера на f.
Управление и, применяемое в каждый момент времени t е е R+, является случайным процессом со значениями в сепара-бельном метрическом пространстве и и выбирется в системе (1) в виде функции от x(t), т.е. в форме обратной связи ut= =u(X(t)). Рассматривается задача синтеза управлений, обеспечивающих асимптотическую или экспоненциальную устойчивость нулевого решения х=0 системы (1).
Определение 1.1 Решение x(t)= о замкнутой системы (i) при ut= u(x(t)D называется асимптотически устойчивым по вероятности при t с R*, xo«s g={x: Ixl < Н}, если
а) для любых s С R+ и е > О, Um P(sup lx(t,s,x )l > e)= 0,
X -»0 t > • °
0
б) lim P( Tim X(t,s,x )=0)= 1 .
X —>0 t —°
0
Через x(t,s,xo) здесь обозначено решение замкнутой системы (1.1.1) с соответствующими начальными условиями.
Определение и г Решение x(t)= о замкнутой системы (1) назовем экспоненциально устойчивым с вероятностью 1 (ехр-устойчивым п.й.) при t « R*, если существует конечная почти всюду в а действительная случайная величина K(s,x ) и такое
ЧИСЛО г > О, ЧТО ДЛЯ любых Хо« при ъ £ в с вероятностью 1 справедливо
1хи,з,хо)1 < к(з,хв)1х01ехр(-гЪ).
Сначала исследуется случай, когда в качестве множества допустимых управлений 11 рассмтрнвается множество непрерывных по х функций и(х), а коэффициенты системы (1) при и(х) * % удовлетворяют условиям Ито.
Задача I (Задача об асимптотической стабилизации в об-ластз е.) Требуется найти такое допустимое управление и(х) е « и, при котором нулевое решение х(Оз о замкнутой системы (1) асимптотически устойчиво по вероятности.
Задача п (Задача об экспоненциальной стабилизации в яп.) Требуется найти допустимое управление и(х) « и, при котором нулевое решение х(й)з о замкнутой системы (1) ахр- устойчиво п.н..
Будем говорить, что Функция у(х), заданная на с, принадлежит классу с® если она непрерывна при х « в а дважды непрерывно дифференциируема всюду а области о, кроме, быть может, точки х=о. Если решение замкнутой системы (1), начинающееся в области <1хо1<, с вероятностью 1 выходит на границу этой области за конечное время, каковы бы ни были достаточно малые величины о, Ь8> о, то говорят, что имеет место условие о.
Определение из Управление и(х) • V. со значениями в и, и функцию Ляпунова У(х) « с® , удовлетворяющую критерию асимптотической устойчивости по вероятности нулевого решения х(г)з о соответствующей замкнутой системы (1), будем назы-
вать стохастической стабилизирующей парой (ses- парой) системы (1).
Определение /.4 Систему (1) назовем стохастической стабилизируемой ( в области g), если у системы существует стохастическая стабилизирующая пара: scs= {V(x),u(x)}.
Имеет место следующий критерий стохастической стабили-зируемости.
Теорема 1.2 Для того, чтобы система (1) была, стохастической стабилизируемой в смысле определения 1.4, необходимо, а при выполнении условия D и достаточно, чтобы в G существовала положительно определенная функция Ляпунова v(x) « с® , удовлетворяющая функциональному неравенству
2
LB(V(x)) = m1n (S a (x.u)-gf- ) + 0,5 Z b (x) / Y S
"" u«U 1.1 1 1 . 1.J.1 ,J X1 Xi
SO. (2)
Через C2 обозначим класс непрерывных функций v(x), x«r", дважды непрерывно дифференцируемых на r", кроме, быть может точки х=о. Для решения задачи II устанавливается справедливость следующего утверждения.
Лета 1.г Для экспоненциальной устойчивости с вероятностью 1 нулевого решения x(t)so замкнутой системы (1) прн u=u(x), необходимо я достаточно, чтобы существовала функция v(x) класса сг , удовлетворяющая при некоторых положительных постоянных kt, к2, ks неравенствам
к 1x2 s v(x) s k îxl , (3)
1 2
2
" av " a v/
LV= E a (x.u)-^- + 0,6 £ b W-T-jJ- s -k Ixl . (4) "i«i i i.j.i * . i i
Данное утверждение естественно приводит к определенка,
аналогичному определению 1.3
Определение 1.5 Экспоненциальной стабилизирующей парой (ees- парой системы (1) будем называть пару функций:- управление u(x) « tí со значениями в и и функцию Ляпунова V(x)«ct, удовлетворяющую критерию экспоненциальной устойчивости с вероятностью. г нулевого решения x(t)= о соответствующей замкнутой системы (1).
Систему (i) назовем экспоненциальной стабилизируемой в R" (ехр- стабилизируемой п.н.) если у системы существует экспоненциальная стабилизирующая пара ses= {V(x),u(x)J.
Справедлив следующий критерий экспоненциальной стабилн-зируемости.
Теорема г.3 Для того чтобы система (1.1.1) была вхр-стабилизируемой п.н., необходимо в достаточно, чтобы существовала положительно определенная функция Ляпунова v(x) « с^, удовлетворяющая функциональному неравенству
г
2. ív " з V
L(V(x)) = mine Z a (x,u) > 0,5 Е b (х) L 5
U«U 1.1 i «, j«t J i i
Ixl, (5)
и неравенствам (з), где • k2 > ks ~ полоаятелыше константы.
Задачи! и п рассматривается на расширенном кногестеа допуетткх управлений tíj . Это мкозество содержат разрнвнш Функции u-u(x). На коэффициента систекн (1) накладывается условия: фуякцап n(x,u), о(х) дольни бить непрерывны по совокупности поременхшх п
- 12 -la 1 + ia i ~ С ,
(в)
le I i С , С i О. Каждому разрывному управлении q((х), 1= 7ГТ , ставится в соответствие аппроксимирующая последовательность u^t.x), vez*, i= 1, i , обладающая определенными свойствами. Введение такой последовательности позволяет содержательно определить решения замкнутой системы (1) при и(х) « tí , измеримые относительно о-алгебры, порожденной процессом w(t). Аппроксимирующие последовательности u^ít.x) порождают семейство допредельных уравнений
dX(t)= a(X(t),uv)dt + 0(X{t))dW(t), X(s)= xo,
где uv=(u^,.,.u^), v « z*. Обозначим через xv(t,e,xo) сильное решение системы допредельных уравнений.
Решением системы (1) считается случайная функция 5(t), принадлежащая множеству всех частичных пределов (x(t)} последовательностей xv(t,s,x ) в смысле сходимости почти всюду.
о
Вводится в рассмотрение репрезентативная система стохастических уравнений
dZ(t)= £ с (t)a(Z(t),y*)dt + a(Z(fc))dW(t), k= 77ñ, (7) k«t *
где «„(t)- измеримые функции, удовлетворяющие соотношениям
п
a (t) i о, Е a (t)= 1, a y"=yk(t,z), k= 1,п, есть специальна *
ное многозначное отображение. Пусть (Z(t)} - множество решений системы (7).
Установлена справедливость следующего утверждения.
Теорема 1.4 Пусть функции а(х,и), о(х) непрерывны вместе со своими частными производными по совокупности переменных и, кроме того, 1а I + 1а I з с , 1о I 5 с , с > о .
х и X
Тогда за исключением, быть может, множеств нулевой меры справедливо включение {хШ}с{г(Ъ)}.
Данная теорема позволяет перейти от задач г и IX на кножестёе к аналогичным задачам для системы (7), где Функция у"(I,2) выбирается нз множества 11 полунепрерывных
2
сверху относительно включения функций со значениями в и.
В первой главе приводятся достаточные условия асимпто-гкческой по вероятности и экспоненциальной с вероятностью 1 устойчивости нулевого решения системы (7). На основе этих утверждений об устойчивости формулируются критерии стабили-зяруемости системы {7), аналогичные теоремам 1.2, 1.3, но использующие введенный верхний дифференциальный производящий эператор
1.4 = шах С Е (^а^ (г.у" (г.г))) +
1 ,К«1
« 2 + 0,6 Е ь (г) А э , к= ТТп.
п
'де д= {а^): <*к Ш £ о, Е а (-ь)=1}, У(ъ,г)- множество зна-
*« 1
шний полунепрерывной сверху по включению функции в
'очке Так как из стабилизируемости системы (7) следу-
гт стабилизируемость системы (1), то приведенные критерии >ешают задачи I и II для системы (1) при и(х) « и .
Во второй главе рассматриваются дискретные управляемые
системы со случайными параметрами, заданные на вероятностном пространстве (а.г.Р)
х = г.(х ,и ,«), з > в . в, в« г* ,
»♦'••• о о (8)
X («)= X , и « и, о е О, % 0 *
где х^« яп -вектор состояния, и(« и с йг вектор управляющих воздействий, функции f (х,и,«) непрерывны по совокупности
а
переменных х« я", ие иг для Любого » « о, измеримы по » < а для любых х € я", и « яг . Управление и^, в « г*, выбирается из множества % допустимых управлений с обратной связью и =и (х), кроме того, f (0,0,«)=0 для всех в г е., ® « о.
• • в О
Относительно множества и предпологается, что функции и (х )
a) определены при любом х « б е принимают значения из
в
ограниченного замкнутого множества и;
b) измеримы по Борели, функция f <х ,и (х ),«)-локально
екав
лкпшицева, в при каждых начальных условиях < зо,х^) существует единственное, с точностью до эквивалентности, резенае х (з ,к ,«) уравнения
с о о
х = Г (х ,и (х ),о),
»♦1 а в » «
такое, что вир ЕСхг(в ,х ,«)} < « .
© Р о
в
При этих предположениях соотаотаиия (8) пороздавт марковскую цепь в в". Пусть в(с)={х:1х1 < с}, где константа с > > о такова, что О(С) с о.
Вводятся определения асимптотической устойчивости по вероятности и экспоненциальной устойчивости с вероятностью 1, аналогичные определениям 1.2 , 1.3. Реиавтся две следуй-
щие задачи стабилизации: задача I- об асимптотической стабилизации в области с и задача II- об экспоненциальной стабилизации в Р!п.
Пусть а(х), Ь(х), ч»(х), х « я" - возрастающие, а(х), Ь{х)~ непрерывные функции, а<о)= Ь(0)= ч»(0}= о. Справедлива следующая теорема.
Теорема 2.1. {об асимптотической устойчивости по вероятности) Если для замкнутой системы (8) в области в существует непрерывная по переменной х функция Ув(х), а(1х|) £ ^ V (х) з ь(Ы), а « г* такая, что последовательность
V (х (в ,х ,«)), в « г*, 8 £ в является супермартингалом • ■00 о о
для любого х * в(с) и справедливо неравенство о л
^ -Е*(1хв(8о,хо,»)1), то нулевое решение х^= о замкнутой системы (в) асимптотически устойчиво по вероятности.
Определение 2.3 Управление и^(х) « и со значениями в и, к непрерывную функцию Ляпунова ^(х), удовлетворяющую критерию асимптотической устойчивости по вероятности нулевого решения х^ о соответствующей замкнутой системы (8), будем называть стохастической стабилизирующей парой (вбв- парой) системы (8).
Определение 2.4 Систему (8) будем называть стохастической стабилизируемой, если у системы существует стохастическая стабилизирующая пара 8б8={У (х), и (х)}„
я ® „
Устанавливается справедливость утверждения, обратного
утверждению теоремы 2. к
Леша 2.1, Пусть решение х = о, в, s « z+, s £ в замк-
• о о
нутой системы (в) асимптотически устойчиво по вероятности. Тогда в в существует непрерывная по х функция Ляпунова v^Cx), обладающая следующими свойствами:
a) a(ixf) < vg(x) S b(lxl), x « G,
b) v.(x,Сзо.хо,«))- супермартингал, причем
i -Еч»С1хв(8о,хо,о)1), Xo« 8(C). Из леммы 2.1 вытекает, что управление u^ ( х ), стабилизирующее нулевое решение системы (6) до асимптотически устойчивого по вероятности, будет стабилизирующим также и в смысле устойчивости в L1.
Если F^ есть поток о-алгебр, с которым согласован процесс х (s ,х .«). то имеет место следующий критерий стохастической стабилизируемости системы (а).
Теорема 2.2 Для того чтобы система (8) была стохастической стабилизируемой , необходимо и достаточно, чтобы в G существовала непрерывная функция Ляпунова v^ ( х ), a(lxl) s s v^s ь(Ixt), удовлетворяющая функциональному неравенству
L (V (х))— min EV (f (x,u,w))- EV (x) * -öy(lxl), (9) «" • „«u '
такая, что последовательность Ve(xe(8o,хе,«)) является супермартингалом для u (x)« Argrain EV (f (x,u,u)), x0« B(C).
Задача I решается также для стационарных систем х.ч= f<Vu,w) ' 8 > V V 2+'
. х = х , u * U, »«О.
я О
Для системы (9) приводится критерий стационарной стабилизи-
руемости, аналогичный теореме 2.2.
Наряду с (9) рассматривается вырожденная стационарная
гистема с аддитивным случайным возмущением
х = у (х ,u) + g(x)s (u), s, s г Z*, s > s , .-1 . » о о {10)
х (о) = х , Е =0, u « U, » « Ü. = 0 8 о о
где функция у(х,и) непрерывна по совокупности переменных к(о,о)=о, функция д(х) непрерывна по х, и д(0}=0, д(х)=о при <« Rn\Q, где Q- подмножество G, для которого точка х=о является внутренней.Через z (и) в (Ю) обозначена последователь-
S
есть и- верных независимых гауссовских случайных величин с гулевым математическим ожиданием и единичной дисперсией. 1редполагается, что решение х=0 соответствующей (10) замкнутой детерминированной системы
X = У(х ,U) , S > S , S, S е Z*, а» 1 0 > >„
X = X , U е U, » О
о
[ри u=u(x), асимптотически устойчиво в G.
В этих предположениях для системы (iо) получен критерий :тохастической стабилизируемости.
Теорема 2.3 Для того чтобы система (ю) была стохасти-[еской стабилизируемой, необходимо и достаточно, чтобы в G :уществовала непрерывная функция Ляпунова v(x), а(1х!) s v(x) s b(lxi), удовлетворяющая для почти всех о « а функ--;иональному неравенству
L (V(x))= min ECV(y(x ,u) + g(x ¡F ) - V(x ) < 0, (11)
09 - Я Ш * Л %
u۟
де x = x (s jx iw}, x е в(с).
а « О О 0
Далее во второй главе приводятся необходимые и достаточные условия экспоненциальной устойчивости с вероятностью 1 решения х=0 замкнутой системы (в). Эти условия сформулиро-ванны как в терминах функций Ляпунова из класса случайных Функций v (х,ь>), так и в терминах обычных Функций Ляпунова
v (х). «
Определение 2.6 Управление и^(х) « % со значениями в и, и стохастическую функцию Ляпунова \Мх,<з), устанавливающую экспоненциальную устойчивость с вероятностью 1 нулевого решения замкнутой системы (8) в R", будем называть экспоненциальной стабилизирующей парой (ses-парой) системы (8).
Определение 2.7 Систему (8) будем называть ехр-стабили-зируемой п.н. в R", если в R" у системы существует экспоненциальная стабилизирующая пара : ses={v^ (x,u), iMx)}.
Ограничиваясь функциями Ляпунова вида v^(х), mosho доказать справедливость следующего утверждения.
Теорема 2.5 Для того чтобы система (8) была ехр- стабилизируемой п.н. в r" , необходимо и достаточно, чтобы в r" существовала непрерывная функция Ляпунова \Мх), удовлетворяющая функциональному неравенству
t (v (х))= min ecv Cf (x,u,u)) f ) - V (x) S
u cll
i - k3lxl П.Н., (12)
и такая, что k Ixl * v (x) i k Ixl; где k > о, k > о, k > о.
f • 2 12 3
Поскольку не существует общих методов решения в областях G неравенств типа 9, 11, 12, фигурирующих в теоремах о стабияизируемости, во второй главе вводится понятие и приво-
дятся достаточные условия стохастической диссипативности замкнутой системы (8). Это позволяет перейти от задач I и II к соответствующим задачам, рассматриваемым на множестве г = {х:0 < ц5 1x1 5 М. Для областей г с выколотой окрестностью нуля удается получить решения задач I и II в конструктивной. форме.
В третьей главе предлагаются алгоритмы конструктивного построения стохастических стабилизирующих пар и экспоненциальных стабилизирующих пар для случайных процессов, определенных в первых двух главах. Вводится понятие стохастической диссипативности замкнутой системы (7).
Приведены достаточные условия стохастической диссипативности системы (7) при ук (и, г) « . Задачи I и II для непрерывных систем рассмотрены на множестве
Г={г:0 < ц 5 1г1 * Ь}.
При этом под стохастическими стабилизирующими парами систем (7) и (8) в областях г понимается пара функций-управление, при котором соответствующая замкнутая система является стохастической диссипативной, и функция Ляпунова, удовлетворяющая достаточным условиям такой диссипативности.
Устанавливается, что функция Ляпунова из множества Бсз-пар в в г можно выбирать из параметрического класса функций вида
n
Ч -
V» (г)= Е р ф (2), ч « 2 , е= 1 , ч 1 • • ч
" л" 1 (о!-1)1 (13)
где р - коэффициенты полинома и (г), а через <р (г) обозначе-
• ч •
-гоны степенные мономы
% К - "
Ф (г)= г 1 г г...г " , 1 * о, т= 1,п , 2 5 £ 1 5
* п 1 = 1
Аналогично, функция Ляпунова из эс(5- пары в Г также
строится в классе функций (13). Роль параметров, определяю-
щих класс (13), играют коэффициенты р , е= 1. Стабилизи-
• ч
рующее управление в случае системы (7) имеет вид
уи.г) « агдштпс тах С Е «и)а (г.у" ) )) .
г_ .. . I,»,/ 1 »
у€ц
а < t > «а к
к
.У «Y(t ,Z)
Для системы (9) стабилизирующее управление находится ка
и(х) с Argmin EW (f(x,u,o))}. u«u 4
Задача нахождения коэффициентов ß , е= i,n и построение управлений, стабилизирующих систему (7) до стохастичес-' кой диссипативной может быть сведена к задаче математического программирования, рассматриваемой на дискретной сетке г
h
-d-» min ,
с (ß,z ) + d s о , m= 1,2Mk , (14)
MV n
ß e Q , d > 0 ,
где p=(ß ), Q= {ß: Ißl < 1}, с (ß,z ): -I H (z ),
1 M • в . • e »
Q • ■ 1
1 S m S M , z «T , с (ß,z )= L* (W (z )), И+1 <iaS2K ,
h В Л » ■ et q ■ -!« h h'
n
z « г
m-H_ h h
Для системы (в) задаче нахождения параметров р и построения стабилизирующего управления оказывается возможным поставить в соответствие задачу нелинейного программирования
-d-* min ,
с (ß,x ) + d i 0 , j= TTÜT , (15)
I ■ n
ß « Q , d i 0 .
ГДв Q= {p: !ß| < 1}.
Для решения этих задач применяется метод штрафных функций , позволяющий перейти от {14) я <1в) к задачам безусловной минимизации.
В третьей главе приведены примеры конкретного применения результатов диссертация. Приведены также, полученные с использованием ЭВМ, «гасяешые решения задач стохастической стабилизации для различных управляемых нелинейных стохастических систем второго я третьего порядков.
В заийи&чеяке перечислим основные результаты. ■
1. Для управляемых диффузионных процессов, порожденных конечномерным стохастическим дифференциальным уравнением Нто, разработан метод синтеза управлений, стабилизирующих нулевое решение замкнутой системы до асимптотически устойчивого по вероятности. Основу этого метода, обобщающего на стохастические дифференциальные системы принцип стабилизирующих пар составляют стохастические аналоги прямых и обратных теорем Ляпунова об устойчивости.
2. Решена задача синтеза управлений, стабилизирующих нулевое решение до экспоненциально устойчивого с вероятностью 1.
3. Предложена конструкция, позволяющая на множестве разрывных управлений определять решение замкнутого управляемого уравнения Ито, измеримое относительно потока о- алгебр.
порожденого винеровским процессом.
4. Показано, что метод стохастических стабилизирушрзх пар позволяет решать задачи об асимптотической и экспоненциальной стабилизации диффузионных процессов не только в случае непрерывных управлений, но и для множества допустимых управлений, состоящего из полунепрерывных сверху функций.
5. Для управляемых марковских цепей, порожденных динамическими системами достаточно общего вида, сформулированы н доказаны прямые и обратные утверждения о равномерной асимптотической устойчивости по вероятности и об экспоненциальной устойчивости с вероятностью 1.
6. На основе этих утверждений получены критерии стабн-лизнруемости дискретных стохастических систем в терминах стабилизирующих пар. Показана принципиальная возмоетость использования для решения задач стабилизации Функций Ляпунова из класса случайных функций.
7. Приведены достаточные условия стохастической дисси-пативностн дискретных и непрерывных марковских процессов. Обоснована возможность поиска стохастических стабилизирующих пар с функцией Ляпунова из параметрического класса полиномов.
8. Предложены алгоритмы численного построения стохастических стабилизирующих пар для непрерывных в дискретных систем.
9. Работоспособность разработанных алгоритмов и реализующих их программ проверена в серии численных экспериментов на ЭВМ на ряде конкретных примеров.
Публикация по теме диссертации.
1. Ажмяков В.В. Построение квазиопткмальных стратегий в игровых задачах преследования. - В кн.: I Международный семинар "Устойчивость и колебания нелинейных систем управления" . Тез. докл.!, Москва, 1992.
2. Ажмяков В.В. Об одном методе стабилизации дискретных стохастических систем. - В кн.: I Всероссийское Совещание "Новые направления в теории систем с обратной связью". Тез. докл., Уфа, 1993.
3. Ажмяков В.В. Экспоненциальная стабилизация и синтез дискретных стохастических систем. - Деп. ВИНИТИ, от 4. 10. 1993, N2510-B93.
4. Ажмяков В.В. Стабилизация управляемых стохастических систем. - В кн.: 2-я Международная научно-техническая конференция "Актуальные проблемы фундаментальных наук". М., МГТУ им. Н.Э. Баумана, 1994.
5. Ажмяков В.В., Пятницкий Е.С. Нелокальный синтез систем стабилизации дискретных стохастических объектов управления. - Автоматика и телемеханика, N2, 1994,
Личный вклад соискателя. Все научные результаты, составляющие основное содержание работы, получены автором самостоятельно. В работах, выполненых в соавторстве, соискателю принадлежит общая разработка задачи, формализация задачи, формулировка и доказательство теорем, разработка численных алгоритмов.
акЗЮ. Тир. 100. ИАТ