Оптимальное ограниченное управление и анализ стохастических колебательных систем тема автореферата и диссертации по , 01.00.00 ВАК РФ

Юрченко, Д.В. АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Вустер МЕСТО ЗАЩИТЫ
2001 ГОД ЗАЩИТЫ
   
01.00.00 КОД ВАК РФ
Диссертация по  на тему «Оптимальное ограниченное управление и анализ стохастических колебательных систем»
 
 
Текст научной работы диссертации и автореферата по , кандидата физико-математических наук, Юрченко, Д.В., Вустер

62 11/83

ОПТИМАЛЬНОЕ ОГРАНИЧЕННОЕ УПРАВЛЕНИЕ И АНАЛИЗ СТОХАСТИЧЕСКИХ КОЛЕБАТЕЛЬНЫХ

СИСТЕМ

Юрченко Д.В.

Диссертация представлена членам диссертационного совета Вустерского Политехнического Института на соискание учёной степени кандидата физико-математических наук

Май 2001 года

Одобрена:

Профессор Диментберг М.Ф., Научный руководитель Кафедра механики

Профессор Raymond R. Hagglund, Кафедра механики

Профессор Zhikun Нои, Кафедра механики

Профессор Suzanne L. Weekes, Кафедра математики

Профессор John M. Sullivan, Ученый Секретарь Кафедра механики

Аннотация

В диссертации исследуются задачи синтеза оптимального управления стохастическими динамическими системами с конечным числом степеней свободы, а также проведен динамический анализ стохастических оптимально-управляемых и виброударных систем. В задачах оптимального управления целью является минимизация средней энергии системы. Для этого в систему введено внешнее, ограниченное по абсолютной величине управляющее воздействие. Поставленные задачи синтеза оптимального управления решаются методом Динамического Программирования, который сводит проблему нахождения закона оптимального управления к задаче отыскания решения нелинейного, многомерного, дифференциального уравнения в частных производных. Отыскание решения этого уравнения предложено проводить новым "гибридным" методом, разработанным автором. В диссертации показано, что применение ограниченного по абсолютной величине управления приводит к появлению сильно нелинейных стохастических систем, т.е. систем с нелинейностью вида "з1§пит". Динамический анализ таких систем проводится новым, специально предложенным и разработанным методом Баланса Энергии. В диссертации проведен анализ надежности оптимально-управляемых систем. Полученные аналитические результаты сравниваются с результатами численного моделирования.

Предисловие

Автор диссертации хотел бы выразить признательность своему учителю и руководителю, профессору М.Ф. Диментбергу. Под его руководством были проведены исследования, которые легли в основу этой диссертации.

Автор особенно хотел бы поблагодарить свою супругу за терпение и поддержку оказанную ей на протяжении всего обучения в аспирантуре.

Автор также хочет поблагодарить профессоров Z. Hou, J. Rencis, R. Hagglund, J Sullivan, A. Братуся и В. Ентова, за плодотворное обсуждение некоторых проблем возникших в процессе проведенного исследования.

Отдельно автор хочет поблагодарить кафедру Механики Вустерского Политехнического Института за предоставление возможности и финансовой помощи для обучения в аспирантуре.

Оглавление

Аннотация.....................................................................................................................и

Предисловие...............................................................................................................ш

Оглавление..................................................................................................................IV

Перечень рисунков....................................................................................................уи

Перечень таблиц.........................................................................................................¡х

Список обозначений....................................................................................................х

1. Введение...................................................................................................................1

2. Оптимальное управление........................................................................................8

2.1 Теория стохастического оптимального управления...............................8

2.1.1 Введение..........................................................................................8

2.1.2 Уравнение Гамильтона-Якоби-Беллмана.....................................9

2.1.3 Существующие решения уравнения Гамильтона-Якоби-Беллмана..................................................................................................14

2.2 Задача Майера для системы с одной степенью свободы.....................17

2.2.1 Постановка задачи........................................................................17

2.2.2 Аналитическое решение уравнения ГЯБ во "внешней" области ..................................................................................................................19

2.3 Задача Лагранжа для системы с одной степенью свободы..................21

2.3.1 Постановка задачи........................................................................21

2.3.2 Аналитическое решение уравнения ГЯБ....................................22

2.3.3 Аналитическое решение уравнения ГЯБ для задачи Больца....23

2.4 Численное решение уравнения ГЯБ во внутренней области..............25

2.4.1 Численный метод..........................................................................25

2.4.2 Результаты численного анализа для задачи Майера.................29

2.4.3 Результаты численного моделирования для задач Лагранжа и Больца......................................................................................................35

2.5 Задача Майера для систем со многими степенями свободы...............37

2.5.1 Постановка задачи........................................................................38

2.5.2 Аналитическое решение уравнения ГЯБ во внешней области 41

2.6 Задача Лагранжа для систем со многими степенями свободы............48

2.6.1 Формулировка задачи...................................................................48

2.6.2 Аналитическое решение уравнения ГЯБ во внешней области 48

2.7 Оптимальность закона сухого трения при установившихся колебаниях......................................................................................................50

2.8 Заключение...............................................................................................52

3. Нелинейные, случайные колебания кусочно-консервативных систем............53

3.1 Кусочно-консервативные системы........................................................53

3.2 Метод Баланса Энергии..........................................................................54

3.3 Анализ кусочно-консервативных виброударных систем....................57

3.3.1 Метод Баланса Энергии...............................................................57

3.3.2 Субгармонические колебания виброударной системы.............63

3.3.3 Колебания вторичных структур виброударных систем............65

3.4 Кусочно-консервативные системы: система с управляемым моментом инерции...........................................................................................................69

3.5 Кусочно-консервативные системы: система с управляемой жесткостью.....................................................................................................74

3.6 Кусочно-консервативные системы: маятник с управляемой длиной.75

3.7 Метод Баланса Энергии для систем с сухим трением.........................77

3.8 Надежность систем с сухим трением.....................................................79

3.9 Заключение...............................................................................................84

4. Основные результаты диссертации......................................................................85

5. Рекомендации к дальнейшей работе....................................................................87

Литература..................................................................................................................89

Перечень рисунков

Рисунок 1. Вычислительная область для численного анализа уравнения ГЯБ ...27 Рисунок 2. Линии уровня Н{хх,х2,т) = 1 для // = 1.414 и различных моментов времени т : 0 - сплошная, я/4 - пунктирная, я/2 - точка-тире, я-точка....30 Рисунок 3. Линии переключения для Н{хх,х2,т) = 1 для // = 1.414 и различных моментов времени х : 0 - сплошная, я/4 - пунктирная, я/2 - точка-тире, я-

точка....................................................................................................................31

Рисунок 4. Линии уровня Я(х,,х2,г) = 1 для // = 2.121 и различных моментов времени х : 0 - сплошная, я/Л - пунктирная, я/2 - точка-тире, я-точка....32 Рисунок 5. Линии переключения для // = 2.121 и различных моментов времени

х : 0 - сплошная, я/А- пунктирная, я¡2 - точка-тире, я- точка...................33

Рисунок 6. Относительная разница 8 = {Нсуб -#)/# для // = 1.5.......................34

Рисунок 7. Сравнение линий переключения для задач Майера - сплошная, Лагранжа - тире и г = я¡2; задач Майера - точка-тире, Лагранжа - тире -

точка-точка и т -я...........................................................................................36

Рисунок 8. Сравнение линий переключений для задач Майера - сплошная,

Лагранжа - тире, Больца - точка-тире и х = тт...............................................37

Рисунок 9. Управление в исходных координатах...................................................46

Рисунок 10. Результаты численного моделирования для разных углов: 0 -сплошная, 15° - тире, 30° - точка-тире, 45° - точка-точка, 80° - тире-точка-

точка....................................................................................................................47

Рисунок 11. Абсолютный процент отклонения аналитических результатов от численных для средней энергии системы......................................................62

Рисунок 12. Использование аш для задач субгармонических колебаний виброударных систем. Сплошная линия - отслеживание удара с г = 0.8, а = 0, пунктирная линия - без удара с а = аа5 = 0.069870.........................64

Рисунок 13. Использование ащ для задачи колебаний вторичной структуры.

Сплошная линия - численный результат, пунктирная линия - результаты вычислений с ат...............................................................................................68

с(}

Рисунок 14. Сравнение аналитических и численных результатов. Сплошная линия - численный результат, пунктирная линия - аналитический результат с а ...................................................................................................69

Рисунок 15. Сравнение результатов (£,}/сг2 для системы с управляемым

моментом инерции.............................................................................................73

Рисунок 16. Результаты метода Баланса Энергии (пунктирная линия) и численного моделирования, нормированные к результату, полученному методом стохастического усреднения: круг - 0=10, треугольник - Б=1,

квадрат - 0=0.1...................................................................................................75

Рисунок 17. Маятник с изменяемой длинной. Результаты (Я)^10сг2 как

функция Я. Метод Баланса Энергии - пунктир, численное моделирование -точки....................................................................................................................77

уш

Перечень таблиц

Таблица 1. Максимальная разница шах [(НюЬ -#)/#].................................34

Таблица 2. Безразмерное значение амплитуды / R как функция H=Rl4DQ........................................................................................................79

Список обозначений

А Матрица собственных векторов

В Матрица интенсивности белого шума

Б Матрица спектральной плотности

У Внутренняя область

Е Оператор усреднения

Е Средняя энергия реакции системы

^ Некая вещественная функция

С Внешняя область

Н Функция Беллмана для задачи с терминальным критерием

Н Расстояние до барьера

/ Единичная матрица

К Матрица жесткости

М Матрица массы

() Область вычислений

Я Коэффициент восстановления

Я Максимальное значение приложенного управления

5 Функция Беллмана для задачи с интегральным критерием

$ЪоИ2 Функция Беллмана для задачи Больца

Т Среднее время цикла системы

tf Время окончания процесса управления

Ж Средняя энергия системы со многими степенями свободы

X Перемещение системы

х Скорость системы

У Перемещение системы

у Скорость системы

осщ Коэффициент эквивалентного линейного трения

Г Внешняя область

3 Функция качества Лагранжа

(р Функция качества Майера

/и Безразмерный параметр

О Матрица собственных частот

Я Гауссов белый шум единичной интенсивности

<т Интенсивность белого шума

© Полупериод системы

1. Введение

Теория оптимального управления является сравнительно молодой и хорошо сформированной частью теории управления. Интенсивное развитие космической индустрии и самолетостроения в конце 1940х годов придало теории оптимального управления новый импульс. Бурное развитие военно-промышленного комплекса и запуск первого искусственного спутника Земли показали необходимость развития теории оптимального управления. В связи с тем, что ракето- и самолетостроение, а также смежные с ними области, стали первоочередными направлениями в развитии многих стран, теория оптимального управления стала одним из приоритетных направлений развития науки. Развитие техники привело к необходимости рассмотрения более сложных проблем оптимального управления. Например, в изучаемых математических моделях пришлось вводить в рассмотрение случайные нагрузки, для описания некоторых физических явлений, таких как воздействие турбулентности на летательный аппарат, флуктуации в радиотехнических приборах и прочие. В результате, было положено начало теории стохастического оптимального управления. Хотя сегодня стохастическая теория оптимального управления решает различные задачи, встречаемые в электронике, теории нейронных сетей, экономике, эволюционной биологии, медицине и прочие, в представленной диссертации будут рассмотрены только задачи стохастической динамики.

Таким образом, одной из актуальных задач, связанной со стохастическими системами, является задача стохастического управления, т.е. задача отыскания законов управления, которые вынуждают систему функционировать в заданном режиме. Приближенные аналитические методы

для задач такого типа интенсивно разрабатывались в течение последних лет. Внедрение сверх мощных, современных компьютеров послужило трамплином для развития численных методов, применяемых для решения задач стохастического управления в наши дни. Тем не менее, во многих случаях эти численные методы не позволяют отыскивать законы оптимального управления точно, поскольку в своей основе содержат многочисленные предположения, существенно упрощающие исходную математическую задачу.

Существуют два основных и принципиально отличных друг от друга, подхода для решения задач оптимального стохастического управления. Принцип максимума Понтрягина является одним из них. Математический аппарат детерминированного метода максимума Понтрягина был усовершенствован, что позволило использовать его для решения задач стохастического управления. Несмотря на это, принцип максимума Понтрягина редко применяется для решения практических задач и служит в основном инструментом для решения модельных задач. Существует ограниченное число практических задач, которые удается решить этим методом аналитически.

Альтернативным методом, служащим для решения задач стохастического оптимального управления, является метод Динамического Программирования, предложенный Беллманом. С помощью этого метода решение задачи оптимального стохастического управления сводится к решению квазилинейного уравнения Гамильтона-Якоби-Беллмана (ГЯБ), составленного для функции Беллмана. Решение этого уравнения позволяет получить оптимальный закон управления в поставленной задаче. Кардинальным отличием этого метода от вышеизложенного является то, что в методе Динамического Программирования поставленная задача решается для всех

начальных условий системы. Основная трудность в практическом применении этого метода заключается в необходимости нахождения решения задачи Коши для нелинейного, многомерного уравнения ГЯБ в частных производных во всем фазовом пространстве, что объясняет узкий круг задач, решенных этим методом. Существование и единственность решения уравнения ГЯБ является отдельной, строго математической задачей, изученной в основном для линейных систем с матрицей ковариации, независящей от управления [2, 10] и для систем с невырожденной матрицей ковариации. Метод Динамического Программирования используется в диссертации для построения синтеза оптимального управления.

Одной из наиболее изученных на сегодняшний день задач стохастического оптимального управления является линейно-квадратичная задача [10], сформулированная для линейных систем, находящихся под действием внешнего, случайного возбуждения в виде белого шума. Решение стохастических, линейно-квадратичных задач находится тем же методом, что и решение соответствующих детерминированных задач, за исключением того, что для стохастической системы приходится решать "стохастический" аналог уравнения Риккати. В этом случае получаемое управляющее воздействие не является ограниченным по абсолютной величине, что делает трудным, а зачастую невозможным его практическое применение.

Исходя из выше изложенного, в диссертации рассматриваются и решаются задачи с ограниченным по абсолютной величине, внешним управляющим воздействием. Подобные задачи даже в своей наиболее простой формулировке являются чрезвычайно трудными с точки зрения отыскания аналитического или численного решения. С другой стороны такая постановка

задачи позволяет точнее отразить суть практической задачи в теоретической модели.

Применение ограниченного по абсолютной величине управления приводит к тому, что оптимально-управляемая, стохастическая система становится сильно нелинейной (нелинейность типа "81§пшп"). Динамический анализ таких стохастических систем при помощи существующих асимптотических методов приводит к неточным, а иногда и ошибочным результатам, так как все существующие аналитические методы разработаны для систем со "слабой" нелинейностью. Сильно нелинейные стохастические системы такого вида можно объединить в новый класс систем. Действительно, можно показать на примере не демпфированной, стохастической системы с оптимально изменяемой жесткостью, что её средняя энергия постоянна везде за исключением положений, в которых происходит переключение. Именно эта характерная черта нелинейных систем с оптимальным управлением дала название новому классу - классу кусочно-консервативных систем. Другими словами, этот класс объединяет в себе системы, в которых диссипация энергии происходит только в дискретные моменты времени, благодаря своевременным переключениям. Для анализа такого класса систем в диссертации специально разрабо�