Численные методы построения оптимального управления в системах с запаздыванием тема автореферата и диссертации по математике, 01.01.09 ВАК РФ

Мазурова, Ирина Сергеевна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Тверь МЕСТО ЗАЩИТЫ
2014 ГОД ЗАЩИТЫ
   
01.01.09 КОД ВАК РФ
Автореферат по математике на тему «Численные методы построения оптимального управления в системах с запаздыванием»
 
Автореферат диссертации на тему "Численные методы построения оптимального управления в системах с запаздыванием"

На правах рукописи

Мазурова Ирина Сергеевна

ЧИСЛЕННЫЕ МЕТОДЫ ПОСТРОЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В СИСТЕМАХ С ЗАПАЗДЫВАНИЕМ

Специальность 01.01.09 - Дискретная математика и математическая кибернетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

ТВЕРЬ-2014

Работа выполнена на кафедре компьютерной безопасности и математических методов управления Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Тверской государственный университет»

Научный руководитель:

доктор физико-математических наук, Андреева Елена Аркадьевна, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Тверской государственный университет», заведующий кафедрой компьютерной безопасности и математических методов управления.

Официальные оппоненты:

доктор физико-математических наук, Афанасьев Александр Петрович, Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. A.A. Харкевича Российской академии наук, заведующий Центром распределенных вычислений; доктор технических наук, Болодурина Ирина Павловна, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Оренбургский государственный университет», заведующий кафедрой прикладной математики

Ведущая организация: Федеральное государственное бюджетное учреждение науки Институт системного анализа Российской академии наук

Защита диссертации состоится 18 декабря 2014 г. в 14:00 на заседании диссертационного совета Д.002.017.02 при Федеральном государственном бюджетном учреждении науки Вычислительный центр им. A.A. Дородницына Российской академии наук, расположенном по адресу: 119333, г. Москва, ул. Вавилова, д. 40, конференц-зал.

С диссертацией можно ознакомиться в библиотеке федерального государственного бюджетного учреждения науки Вычислительный центр им. A.A. Дородницына РАН и на сайте http://www.ccas.ru/.

Автореферат разослан /cßujfiA, 2014 г.

Ученый секретарь диссертационного совета,

доктор физико-математических наук, профессор-/ У ^ В.В.Рязанов

2

российская государственная библиотека

20,4 Общая характеристика работы

Актуальность темы. Различные задачи экономики, экологии, физики моделируются с помощью систем интегро-дифференциальных уравнений или системами с распределенным запаздыванием. Эти модели являются нелинейными, поэтому важным вопросом является исследование периодических решений, их управляемости, построение оптимального управления и разработка численных методов и алгоритмов для систем, описываемых интегро-дифференциальными уравнениями.

В частности, системы с распределенным запаздыванием возникают при моделировании системы типа хищник-жертва, в которых введение распределенного запаздывания позволяет учитывать тот факт, что плодовитость особей в популяции хищников не является постоянной и зависит от условий их питания в течение определенного интервала времени. При этом функции распределения характеризуют состояния системы в прошлом, описывая влияние доступной для хищника жертвы на характерном отрезке времени, связанном с ростом популяции жертв, учитывает их характер взросления, погодные условия и др.

Системы с запаздыванием возникают и при моделировании ассоциативной памяти, в которой запаздывание может возникать при передаче сигнала от одного нейрона к другому, а также внешнее воздействие на нейрон может накапливаться на определенном интервале запаздывания, передавая информацию о прошлых состояниях системы.

Одним из самых распространенных и плодотворных подходов к решению задач оптимального управления является сведение их к задачам нелинейного программирования. Среди методов численного решения таких задач градиентные методы часто оказываются наиболее эффективными.

В ВЦ РАН под руководством Ю. Г. Евтушенко была разработана методология быстрого автоматического дифференцирования (БАД-методология), позволяющая с единых позиций определять градиенты для явно и неявно определенных функций и для вычислительных процессов, которые являются результатом дискретизации непрерывных систем, описываемых дифференциальными и интегро-дифференциальными уравнениями. Алгоритмы градиентного типа обычно требуют существенно меньшего количества итераций и меньшего количества вычислений, чем методы без использования производных

Наряду с традиционными методами в последнее время бурно развиваются неклассические методы решения задач оптимального управления, одними из которых являются генетические алгоритмы. Генетические алгоритмы применяются при разработке программного обеспечения, в системах искусственного интеллекта, оптимизации, искусственных нейронных сетях и в других отраслях знаний.

Цепь диссертации. Основной целью диссертации является разработка численных методов и алгоритмов построения оптимального решения для систем с распределенным запаздыванием в многокритериальной задачи.

з

Задачи диссертации. Для достижения этой цели решены следующие задачи:

1. Разработка алгоритма построения оптимального управления на основе методологии быстрого автоматического дифференцирования для модели взаимодействия произвольного конечного числа хищников и жертв и модели искусственной нейронной сети, описываемых системами интегро-дифференциальных уравнений;

2. Разработка модифицированного генетического алгоритма для построения оптимального решения в моделях с распределенным запаздыванием;

3. Анализ применения численных методов к решению задач оптимального управления при различных типах минимизируемых функционалов;

4. Разработка практической реализации численного метода построения оптимального решения для систем с распределенным запаздыванием;

5. Анализ влияние параметров методов и задачи на оптимальное решение системы.

Методы исследования. Используются методы теории оптимального управления, численного анализа, конечномерной оптимизации и математического программирования.

Научная новизна проведенного исследования заключается в следующем: в диссертационной работе разработаны численные методы построения оптимального решения для задач с большим числом управляющих параметров. Разработаны алгоритмы построения оптимального решения для систем, описываемых интегро-дифференциальными уравнениями при различных типах минимизируемых функционалов. Разработан модифицированный генетический алгоритм, позволяющий учитывать большую размерность задачи. Построена обобщенная модель типа хищник-жертва с произвольным числом классов хищников и жертв.

Практическая значимость диссертационной работы состоит в том, что результаты работы могут быть использованы для решения конкретных практических задач, связанных с процессом использования ресурсов: планирование добычи, проведение информационно-образовательной работы, вычисление денежных затрат на добычу ресурсов. Программный код предложенных алгоритмов выполнен в форме независимых модулей, реализованных на языке Java, и может быть использован как составляющий элемент программного комплекса по решению оптимизационных задач. Предложенные в диссертации методы и алгоритмы используются в учебном процессе на кафедре Компьютерной безопасности и математических методов управления Тверского государственного университета.

Апробация диссертационной работы. Результаты диссертационной работы докладывались на международных и всероссийских конференциях: Воронежской весенней математической школы «Понтрягинские чтения —

ХХП» (Воронеж, 2011), Международной Научно-практической конференции «Информатизация как целевая ориентация и стратегический ресурс образования» (Архангельск, 2012), Всероссийской научной конференции с международным участием «Спектральная теория операторов и её приложения» (Архангельск, 2012), X Международной научно-технической конференции "Новые информационные технологии системы" (Пенза, 2012), Третьей Российской школы - конференции для молодых ученых с международным участием "Математика, информатика, их приложения и роль в образовании" (Тверь, 2013), 1 Международной научно-практической конференции «Современные проблемы компьютерных наук (спкн-2013)» (Пенза, 2013), Международной научно-практической конференции "Теоретические и практические вопросы науки XXI века" (Уфа, 2014).

Структура и объем работы. Диссертация состоит из введения, трех птав, заключения и списка литературы из 127 наименования. Общий объем работы составляет 127 страниц, в тексте содержится 19 таблиц и 48 рисунков.

Содержание работы

Во введение отражены актуальность работы, проведен анализ существующих работ в исследуемом направлении, дано общее описание решаемой задачи.

В первой главе рассматривается задача оптимального управления для обобщенной модели хищник-жертва Лотки-Вольтерра. В первом параграфе первой главы поставлена задача оптимального управления в модели хищник-жертва с распределенным запаздыванием. Сформулирован принцип максимума для задач оптимального управления с распределенным и сосредоточенным запаздыванием.

При математическом моделировании процесса взаимодействия популяций с произвольным конечным числом хищников и жертв рассматривается система интегро-дифференциальных уравнений:

/ I» Ли

е,-2>„х,(0 - - л,)-«,(/), / = 1, т, (1)

1=1 7

М

\

=у ¡и) -л')

V /=1 /=1

+

(2)

+ Уj (')£ Гц \РЛ с - *")(*/ (г) - л, у Г - V,- (<), ) = 1, П,

/=1

при заданных начальных условиях

хА0) = х°,х1(в) = ъ(е),ве{-г,0],у;(0) = у° / = 1,т,у = 1,«. (3)

Здесь да, п - количество классов хищников и жертв соответственно, *,(*)>'= 1>т " численность популяции жертв «-ого класса, у^),] = \,п-

численность популяции хищникову-опо класса в момент времени I € [О,Г], /?, - численность популяции жертв ¡-ого класса, недоступная хищникам, е„ ар с]П у^ - действительные положительные коэффициенты,

характеризующие взаимодействие популяций хищников и жертв. Функции распределения -г) характеризуют состояния системы в прошлом,

описывая влияние доступной для хищника жертвы на характерном отрезке времени, связанном с ростом популяции жертв. Функциями управления являются функции и,(*) - скорость отлова популяции жертв /-ого класса, V. (/) - скорость отлова популяции хищников у-ого класса, удовлетворяющие ограничениям

0<;уу(0^т1х, / = 1,/и,у = 1,/1, (4)

где у>т« " максимальные скорости отлова популяции жертв и

хищников соответственно, далее и - (и,.....ит), V = (у,,...,уя).

Заметим, что на управляющие функции могут быть наложены и другие ограничения, зависящие от технологии отлова. Например, на управления могут быть дополнительно наложены суммарные ограничения типа

¿Г,и,(0<В, 0<и,(г)<и/тш1,

ХрМОна. о<;уу(»*ууат. м

Если ставится задача отлова части популяции, то в зависимости от способов отлова в динамических уравнениях можно использовать управление типа и, (0 = а,х,и((), у, (г) = Д>-,у(0 и др.

Оптимальное управление отловом строится из условия оптимизации заданного функционала

Л". v) = )/0«,х,у,и, у)Л + Ф(х(7),ЯП). (5)

о

или решается многокритериальная задача. В частности, если целью отлова является получение максимальной прибыли от продажи популяций, то максимизируемый функционал в задаче (1)-(4) имеет вид

АМ = ТЕЬ,('.*>,-М.щЦ+НрА.у,», (6)

оЬ"1 I J

здесь - стоимость единицы соответствующей популяции,

(/,«,),<?,(/, у,) - стоимость отлова популяции единицу времени, X -

дисконтирующий множитель. Терминальный функционал

^(«.v) = £м((дгДГ)-Д)2 +±NJ^J(T)-BJf

(7)

отвечает за сохранность популяции жертв и хищников в момент времени Т на заданном уровне Д., i = 1 ,т и Bj,j = \,n соответственно.

Граничные условия в виде неравенств

xl{T)>Ai,i-\,m,yj(T)^Вj,j = l,n учитываются функционалом

J,C.V) = ±М, (Ai-xi(T))2\ + ±NJ (в -У (Г)У" (8)

i=i j=\

здесь Mi,i = l,m,NJ,j = \,n - положительные весовые коэффициенты.

Заметим, что если в предложенной модели используется предположение о том, что xl(t)^Ai,i = l,m,yJ(l)^.B/,j = l,n,( е[0,Т], это

предполагает ограничения на выбор коэффициентов динамической системы или использования принципа максимума для задачи с фазовыми ограничениями. С вычислительной точки зрения фазовые ограничения учитываются с помощью штрафного функционала

1=1 О У=| о + (9)

Оптимальное управление м(/), v(/),/ е[0,Г], в задаче (1)-(5) удовлетворяет принципу максимума

- Anf0(t,x(t),KO,a>,4') - !>,( 0<Ч -!>,('

max

OSitiUmn.OSO'ySv,,,,,

У-1

где f0(t,x,y,u,v) --

>1 У I

(=1 >=1 J

а сопряженные функции р,(0. ';,('), / = 1,/и, ¿ = \,и являются решением системы интегро-дифференциальных уравнений:

/ /я Л »1 а

Р,«) = -рМ е-^чМО I+Х>,('К*, (О + р,(<)Х>;,.У; (О

V 1-1 ) Ы 1

л л '+'

е-*, (10)

(11)

/-1

>1

/-1 /=1

+ ¿/)(Ф/(Осв,(*/(<)-*;)- (12)

-'■/ОЕГу, {/^(/-гХхДгЬД,*/!-, 7=1,л,

/-1 ,-г

с условиями трансверсальности на правом конце

Р,{Т) = -А,^(х(Г),у(Г)Ц = 1 ,т, Л(г)-0 при Г > Г. (13)

сЬс,

= 1,«, гДО^О при Г>Г. (14)

Фу

Исходная непрерывная задачи (1)-(5) сведена к дискретной задаче оптимального управления, которая состоит в минимизации функции

= ,ук ,ик ,л>к) + Г0(х" (15)

*=0

при заданных рекуррентных соотношениях:

1И \ Л

**+,=х*+Дйс*| ег±аих} -Д/^Л/(х*-Л,)-Дй»*, / = 1,т, (16) /=1 / у'*=1

= у) + -¿су/Л* + !>„(*'* - */)>

/-1 /=1

/-1 1-4-к

(17)

начальных условиях

= = = (18)

и ограничениях на управление

^».тах. 0<у^у>тя1, 1 = 1,т,у = 1,л) (19)

где Ы = Т/д - шаг аппроксимации, = кА1, г = у-Л1, к = 0,...^, = Т.

Во втором параграфе первой главы разработан численный метод построения оптимального управления на основе метода быстрого автоматического дифференцирования для дискретной задачи оптимального управления (15)-(19). Показано, что в соответствии с методом быстрого автоматического дифференцирования градиент целевой функции /(и, у) по

и* и V*, / = 1,/и,у = \,п,к — 0,д — 1 вычисляется из соотношения (20):

¿и* "I

а множители Лагранжа р* г*, » = 1,/и,у" = 1,и,Л = О,^определяются из рекуррентных соотношений (21)-(21):

р\ v) + рг + МрГ{ег±апхЧ]-М±рГа^ -

л л л

г/ =/<(«, -

у 1=1

-А<Хр*%(4-Ы-ЬЕп^У,*',; (22)

/=1 /=1 /=1

Показано, что в задаче оптимального управления (15)-(19) применение метода быстрого автоматического дифференцирования для вычисления градиента целевой функции в д(п+т) раз менее трудоемко, чем применение прямого метода дифференцирования в зависимости от размерности задачи (п+т) и точности аппроксимации Д/ = 77д.

Проведен анализ влияние параметров метода на оптимальное решение. В частности, показано, что с увеличением на порядок точности метода, экспоненциально увеличивается число итерации алгоритма, показано, что точность метода е составляет 10'9 , дальнейшее увеличение точности не приводит к улучшению результата. В случае если необходим более точный результат, можно воспользоваться методами второго порядка, для этого вторые производные также вычислены в работе. Построено оптимальное управление при различных стартовых значениях управления. Показано, что стартовое управление влияет на скорость работы алгоритма и на значение минимизируемой функции. «Удачное» стартовое управление позволяет сократить количество итераций алгоритма и получить более точное оптимальное решение. Однако стартовое управление не оказывает значительного влияния на структуру решения, так норма разности векторов функций состояния при различном стартовом управлении не превышает 0,01% от длины ве!ггора состояния.

Проведен анализ влияния параметров задачи на динамику системы. В частности, исследовано влияние запаздывания на динамику управляемой и

неуправляемой систем. Ниже на рисунке (I) представлены графики зависимости численности популяций при различных значениях запаздывания г при следующих параметрах неупраатяемой системы:

Т = 200, ш = 1, n = 1, Я, =0, <?, =0.75, сп =0, du= 0, а{ =0.75, Ги =0.1, ап= 0.0375, ¿>,,=0.0375, At = 0.01, [Dc,Te[t-r,/]

Fjt(t,r)-

0,T<£[t-r,t]

XI«)

1 !'•

■ i 11 ! ! ¡i i i

• 1 Н ¡ i I

л ш a а__!

АН i II II! í II Hi !l

i А ЛдЦ A Aiñ МЛМ A in A: 1T\ 11

/vy \JixJ VJ U A¿

-Yl(lLt-5

-VlftLl-3

-ylftlr-j

-Vl(tl_r-1

-Yliftr-0.1

0 20 40 60 80 100 120 НО 160 [!0 МО '

Рис. 1 Графики зависимости численности популяций при различных значениях запаздывания г

По графикам видно, что при малых значениях запаздывания система переходит в состояние равновесия, которое для модели без запаздывания

определяется из условия

Гц Гиьп

В частности, при

определённых выше параметрах задачи, х,=7,5, у1 =12,5. Но при увеличении запаздывания, решение становится периодическим. Периоды колебаний хищников и жертв совпадают, при этом при увеличении запаздывания амплитуда колебаний численности жертв увеличивается до

максимально возможного значения --'- = 20, а амплитуда колебания

хищников с ростом запаздывания увеличивается экспоненциально.

Проведен анализ влияния запаздывания на динамику управляемой системы. Ниже на рисунках (2)-(7) представлены графики зависимости оптимального управления й,(/), й2(0. и численности популяции

х,(<), х2((), у: (0 при различных значениях запаздывания г при следующих параметрах системы:

Г=25, т = 2, п = 1, V) = А/ • тах(Л( - х, (7"),0)2 + N ■ тах(В, - ^ (Г),0)2 =0, е, = 0.75, с,, = 0, й?,, =0.1, ог, =0.75, =0.05, 1 = 1,2, аи =0.038, я12 = 0.03, а21 = 0-035, аи = 0.038, = 0.038, Ь1Х = 0.037, А, =4,Аг= 3, 0<и,£0.1, »' = 1,2, Ы = 0.01, а = 0.1, точность метода е = 0,0000001:

Х1(0_|=1

Х1(0_Г=0.5

хко_1=о.1

Х1(0_Г=5

Рис.2. График зависимости х,(г) при различных значениях _запаздывания г

Рис. 3. График зависимости х2(г) при различных значениях запаздывания г

хад_[=з —хад_1=1

-Х2(0_Р=0.5

—ХЭД_г=0.Х —хад_г=з

— У1а)_г=з —У1(1)_г=1 —У1(0_г=0.5 —У1(1)_г=0.1 —У1(1)_г=5

10 15 20 25 1

Рис. 4. График зависимости "> при различных значениях запаздывания г

VI ОТ« зо 20 10

о

■од*1

0.05

10

15

20

25 I

-иЩ)_Р=5 и1©_г=3 -и1(0_г=-1 -иЩ)_г=0.5

Рис. 5. График зависимости при различных значениях запаздывания г 11

иад0'1 0,05 ; { -u2(t)_r=5 - --u2Ct)r=3 -u2(t)_i=l

j j

-u^il 5 10 15 20 25 t

Рис. 6. График зависимости и2(г) при различных значениях _запаздывания г_

vl(t)U'' 0.05 - 1 1 -vl(t)_r=5 — ------vl(t)_r=3 -Vl(t)_l=l

1

0 5 10 15 20 25 t

Рис. 7. График зависимости v,(/) при различных значениях запаздывания г

Легко видеть, что полученное численными методами оптимальное управление удовлетворяет принципу максимума. Оптимальное управление определяется функцией переключения и имеет конечное число переключений на фиксированном интервале времени. Построено оптимальное решение для различных типов подынтегральной функции G(t, г).

В третьем параграфе первой главы разработан алгоритм построения оптимального управления на основе генетического алгоритма. Разработка генетического алгоритма начинается с конструирования двоичной хромосомы, представляющей закодированные возможные решения этой задачи. Решением задачи (15)-(19) являются т + п векторов длиной q. В соответствии с этим необходимо закодировать (/и + и) • q значений управления. Поскольку на управления наложены ограничения (11), то, при условии, что управления и', v' принимают дискретные значения на заданных отрезках [0,м(пт] и [0,v;ralJ, можно разбить отрезки [0,wjmiJ и [0,vymaJ на 2k - 1 отрезков, и каждое значение управления закодировать с

помощью бинарного кода. Длина хромосомы в этом случае будет составлять k(m + n)-q.

Например, если выбрать к = 3, то управления «' будет принимать дискретные значения из множества:

rn mix ^ ' Ц1Ш|Х ' Ципах ^ ' ^¡тлх ^' Ч max ^' ^ttnax ' Чччал .. i 8 ' 8 ' 8 ' 8 ' 8 ' 8 ' 8 ' 'm"<,'

Соответственно каждое значение можно закодировать последовательностью из 3 бит, тогда закодированное множество значений управления будет:

{ООО, 001,010,011, 100, 101,110,111}.

Длина хромосомы существенно влияет на работы генетического алгоритма, поэтому при большом значении параметра к для решения задачи

(15)-(19) требуются значительные вычислительные ресурсы. Для сокращения размерности задачи в работе предложено кодировать одним геном несколько значений управлений и', у'' , для этого введен дополнительный параметр

алгоритма г„- степень сжатия решения, который, например, позволяет закодировать значения и°, ы',..., и'"'' одним общим значением гена. В

результате длина хромосомы будет составлять —--—- бит.

Далее можно выделить следующие этапы генетического алгоритма: 1. Произвольным способом создается Р хромосом (где Р - размер популяции), т.е. формируются Р векторов, состоящих из 0 или 1, длинной

(т + п) <7 ^ КОТОрЫе представляют собой р наборов управления.

к-(т~п)-д

Рнаборов управлений

00110 . .ТбШГ

10010 . • -ООН

^10001 . . 1001

2. Вьтолняются операции скрещивания и мутации, в результате чего к имеющимся Р хромосомам добавляются еще Рт ■ Р+ Рс ■ Р новых хромосом, где Рт- доля мутированных особей от общего размера популяции, Рс - доля скрещенных особей от общего размера популяции.

Ниже представлена схема одноточечного скрещивания и одноточечной мутации:

Скрещивание: 0 11 (Цф0Х110 10 1110

1 о 1 ?о7>1ТоТ51 1 0001 00

0 110 10 10 110 0

101011000100 001110101110

Мутация: 011100011101011000 011101011101011000

Поскольку задача (15)-(19) является задачей большой размерности, то для ее решения используются операции многоточечного скрещивания и многоточечной мутации. В классическом генетическом алгоритме операция скрещивания и мутации представляет собой одноточечное скрещивание и одноточечную мутацию, однако в задачах большой размерности при использовании этих операций достаточно быстро выделяется один-

единственный генотип, который представляет собой локальный минимум, а затем все элементы популяции проигрывают ему отбор, и вся популяция «забивается» копиями этой особи. По этой причине для решения задачи (15)-(19) используются операции многоточечного скрещивания и многоточечной мутации, при этом количество точек скрещивания и мутации зависит от

(m + n)q

длины хромосомы и вычисляется по формулам Нс • --и

(m + n)q

Нт--- соответственно, где Нт - доля мутированных генов от общего

¿«v

размера хромосомы, Нс- степень скрещивания (доля точек скрещивания от общего размера хромосомы).

3. Оценивается степень приспособленности каждой хромосомы с помощью вычисления состояния системы и минимизируемой функции (15). Для этого каждая хромосома декодируется в набор управлений, а затем вычисляется значения х**1, i = l,m,j = l,n,k = 0,q — l по рекуррентным

соотношениям (16)-(17), с использованием начальных значений (18) и значения I(u,v) по формуле (15).

4. Выбираем Р особей с наименьшим значением минимизируемой функции I(u,v) (процедура селекции).

Шаги 1 - 4 повторяются G раз, где G - число поколений.

Предлагаемый модифицированный генетический алгоритм был реализован на языке Java. Дополнительно реализован модуль, использующий встроенную многопоточность Java, позволяющий проводить серию вычислений при изменении определенного параметра алгоритма в заданном диапазоне значений. Проведенные численные эксперименты позволили определить оптимальные параметры алгоритма.

В четвертом параграфе первой главы проведено сравнение результатов работы метода быстрого автоматического дифференцирования и генетического алгоритма. Показано, что метод БАД работает быстрее, но при этом требует большего объема исходной информации о задаче. Особенностью генетического алгоритма является то, что он обрабатывает не значения параметров самой задачи, а их закодированную форму, и применяет вероятностные, а не детерминированные правила выбора. Преимуществом генетического алгоритма является то, что он прост в реализации, использует только целевую функцию, а не ее производные либо иную дополнительную информацию. Генетический алгоритм может быть использован, когда не работает метод проекции градиента, например, когда функция не дифференцируема, или множество допустимых значений управления не компактное. В частности в поставленной задаче множество допустимых значений управления выбиралось дискретным: и' = {0,0.1}, v^ - {0,0.1}.

Во второй главе решается задача моделирования и обучения искусственной нейронной сети достаточно общей топологии, динамика

которой описывается системой интегро-дифференциальных уравнений. Задача обучения искусственной нейронной сети рассматривается как задача оптимального управления с нефиксированным временем. Сформулированы необходимые условия оптимальности весовых коэффициентов искусственной нейронной сети и внешнего управляющего воздействия с учетом заданных ограничений и вида функционала.

Задача оптимального управления заключается в минимизации функционала:

т

./Оа,и)= ¡Е(х^),а^)МО)Л + Ф(хСП), (23)

о

гае £(х(<),<а(*),и(*))) - энергия рассматриваемой нейронной сети, зависящая от текущей конфигурации сети д-(г), 0)(()- весовые коэффициенты системы, и(/) - внешнее воздействие на систему в момент времени / ; Ф(дс(Г))- терминальное слагаемое - характеризует состояние системы в конечный момент времени

Динамика нейронной сети описывается системой интегро-дифференциальных уравнений:

' г - А

X,-(О = -#*,(') + /,

| +УМ«), (24)

__у

где I е[0,Г], 1 = 1, л, функция *, (/) характеризует состояние »'-го нейрона в момент времени ^ , первое слагаемое - ДхДО характеризует затухание (/?, -скорость затухания возбуждения /-го нейрона), второе слагаемое

характеризует внешнее воздействие на нейрон

всех других нейронов, /¡- функция активации, Шу(т)- весовой коэффициент,

воздействие на 1-ый нейрон, у-го нейрона, при этом ш(7(т) = 0.

третье слагаемое ^мДГ) - внешнее воздействие на нейрон в момент времени

Начальные условия:

х,(О = 0,(О, 0], 8 = тзх£„ (25)

/=1 ,п

г, 61 - запаздывания,

где 0,(0, ' = 1,", - заданные непрерывные функции,

= 1,л, - заданные неотрицательные параметры модели.

Весовые коэффициенты <2^(0 и внешние воздействия и,(0 ограничены

Цдфлу.Мфя,., /,у=1,л,п.в. ^(26) где ау>аь '»У = заданные положительные параметры модели, полагаем й)и(() = 0.

Задача оптимального управления заключается в том, чтобы обучить нейронную сеть таким образом, чтобы минимизировать функционал (23) и построить оптимальные значения весовых коэффициентов, внешнего управляющего воздействия.

Пусть Шl/(t),iyj = l,n - фиксированные весовые коэффициенты,

¿7(Г),1 = 1,и - оптимальные управляющие внешние воздействия, -

оптимальный процесс в задаче (23) - (26), функция Е(х,о>,и) выпукла по и,, тогда оптимальные значения ¡7,(0, (= 1, и находятся из соотношения (27): а, ¥,(/)> а,

¥,(0,1 (ОМ, , где Т,(0= ж&й)' ' = 1л (2?)

а сопряженные функции р.(/) удовлетворяют системе интегро-дифференциальных уравнений (28):

дх,

,+в',+г М. — (28)

+ \ 1 = 1,п,

м ,д

и условиям трансверсальности на правом конце (29):

р,(Т) = -^^Р\х(Т)\ р,(0 = 0, г>Г,/ = Сл,

дх (29)

где 2,(0= | Х<о1;/(.г)х;(5

Во втором параграфе второй главы исходная задача сведена к дискретной задаче оптимального управления, которая решается на основе методологии быстрого автоматического дифференцирования. Проведен анализ влияния параметров задачи и метода на оптимальное решение.

Оптимальное решение построено при различных видах функции активации и различных значениях распределенного и сосредоточенного запаздывания. В частности, ниже представлены графики зависимости функций состояния от величины запаздывания 5 (5 = VI ■ А/) и

соответствующие этой величине запаздывания значения функций состояния в момент времени Т, значения ошибки обучения искусственной нейронной сети и достижимые значения функций состояния при определенных выше параметрах задачи:

Рис. 8. График запаздывания 8

различных значениях

У2 Х,(Т) |А,- Х,(Т)| Црг X 1 достиж.

1 10,99999 2.2455Е-06 2.10244Е-11 1326,631

5 11,000001 1Д122Е-06 2,81522Е-12 400,9746

10 10,99999 9,40602Е-07 3,33994Е-12 151,2506

20 10,99996 2,52603Е-07 1.56804Е-13 40,88523

25 11,000001 1.4365Е-07 2.29828Е-13 30,04821

Табл. 1. Значения дгД значениях запаздывания 8

1оР1 и достижимое значение х^) при различных

___0____2___4___6____8___10 I______

Рис. 9. График зависимости Зс2 (/) при различных значениях запаздывания 8__

У2 Х2(Т) |А2-х2(Т)| ^ОМ достиж.

1 12,000003 3,11012Е-06 2,10244Е-11 1326,631

5 11,999998 1,25324Е-06 2,81522Е-12 400,9746

10 12,000001 1.19317Е-06 3,33994Е-12 151,2506

20 11,9999997 2,52336Е-07 1,56804Е-13 40,88523

25 11,999999 3,30698Е-07 2,29828Е-13 30,04821

Табл. 2. Значения х2{Т), 1ор, и достижимое значение х2(/) 1|РИ

17

различных значениях запаздывания 8

хЗ(Ц8 т

6 ! 4 -г т

о ;

0

-2 4

!

-4

1

Рис. 10. График зависимости х}(() при различных значениях

дг3(/) при различных значениях запаздывания 6

С увеличением запаздывания 6 точность сходимости оптимального решения увеличивается, значение минимизируемой функции уменьшается. Однако увеличение запаздывания 6 приводит к уменьшению множества достижимых значений.

В третьем параграфе второй главы разработан алгоритм построения оптимального управления для задачи обучения искусственной нейронной сети на основе генетического алгоритма. Подобраны оптимальные параметры генетического алгоритма. В четвертом параграфе проведено сравнение результатов работы метода быстрого автоматического дифференцирования и генетического алгоритма для задачи обучения искусственной нейронной сети.

В третьей главе рассматриваются общие сведения о методах сведение исходной многокритериальной задачи к задачам с единым критерием. Исследованы методы сведения многокритериальной задачи к задаче с одним критерием такие, как линейная свертка, способ свертки с неотрицательными весовыми коэффициентами, принцип гарантированного результата. В третьей главе также рассматриваются особенности программной реализации разработанных алгоритмов. В частности, рассматриваются вопросы проектирования пользовательского интерфейса, разработка модульных тестов, компьютерные программы для статистической обработки данных. На основе построенного алгоритма была разработана программа, которая позволяет строить оптимальное управление при различных параметрах

запаздывания 5

VI Х3(Т) |Аз-Хз(Т)| 1оо1 Хз достиж.

1 6,99999 2,51182Е-06 2,10244Е-11 1326,631

5 7,00000008 8,73167Е-08 2,81522Е-12 400,9746

10 6,99999 1,01566Е-06 3,33994Е-12 151,2506

20 6,99999 1,71238Е-07 1,56804Е-13 40,88523

25 7,0000003 3,15961 Е-07 2.29828Е-13 30,04821

Табл. 3. Значения х}(Т), 10р, и достижимое

системы. Программа позволяет вводить все необходимые параметры задачи и метода, находит оптимальное решение системы, строит графики численности популяций и соответствующие им графики управления, выводит минимальные, максимальные и оптимальные значения минимизируемых функциаоналов в зависимости от выбранного критерия оптимальности, а также позволяет сформировать отчет; экспортируя параметры задачи и результаты вычислений в виде числовых значений, таблиц и графиков по заданному шаблону в отдельный документ для проведения дополнительного анализа.

В заключении сформулированы основные результаты диссертационной работы:

В предлагаемой работе рассмотрена задача оптимального управления для модели хищник-жертва, описываемой системой интегро-дифференциальных уравнений. Сформулирован принцип максимума для исходной непрерывной задачи.

Для нахождения численного решения задачи применен метод быстрого автоматического дифференцирования и генетический алгоритм. Разработан модифицированный генетический алгоритм, учитывающий большую размерность задачи. Для повышения скорости сходимости генетического алгоритма и улучшения устойчивости его работы применены модификации, учитывающие особенности решаемой задачи, а именно введен дополнительный параметр алгоритма гю- степень сжатия решения, позволяющий сократить размерность задачи, введены многоточечная мутация и многоточечное скрещивание, подобраны оптимальные параметры алгоритма, позволяющие построить оптимальное решение за наименьшее время.

Проведен анализ влияния параметров методов и задачи на оптимальное управление в модели хищник-жертва.

Показано, что полученные численными методами решения согласуются с принципом максимума для исходной непрерывной задачи.

Проведено сравнение метода быстрого автоматического дифференцирования и генетического алгоритма, в частности, показано, что метод К АД работает быстрее, но при этом требует большего объема исходной информации о задаче. Особенностью генетического алгоритма является то, что он обрабатывает не значения параметров самой задачи, а их закодированную форму, и применяет вероятностные, а не детерминированные правила выбора. Преимуществом генетического алгоритма является то, что он прост в реализации, использует только целевую функцию, а не ее производные либо иную дополнительную информацию. Генетический алгоритм может быть использован, когда не работает метод проекции градиента, например, когда функция не дифференцируема, или множество допустимых значений управления не компактное.

Рассмотрена задача оптимального управления для модели искусственной нейронной сети, описываемой системой интегро-

дифференциальных уравнений.

Сформулирована и решена задача обучения искусственной нейронной сети как задача оптимального управления с нефиксированным временем процесса.

Определены необходимые условия оптимальности для построения весовых коэффициентов нейронной сети с учетом заданных ограничений и вида функционала.

Разработаны численные методы обучения нейронной сети на основе метода быстрого автомагического дифференцирования и генетического алгоритма.

Проведен анализ влияния параметров методов и задачи обучения искусственной нейронной сети на оптимальное решение. Проведено сравнение результатов, полученных методом быстрого автоматического дифференцирования и генетическим алгоритмом.

Разработаны численные методы, позволяющие свести исходную многокритериальную задачу к задаче с единым критерием. Оптимальное управление построено для различных типов функционалов в зависимости от цели управления, которая может заключаться в переводе системы из одного заданного состояния системы в другое, уменьшении затрет, связанных с функционированием системы, или получение максимальной прибыли.

Список работ, в которых опубликованы основные положения диссертации

1. Большакова И.С. Оптимизация нейронной сети, описываемой системой интегро-дифферснциальных уравнений // Математические методы управления: сб. науч. тр. -Тверь: Твер. гос. ун-т, 2009, - С.20-37.

2. Большакова И.С. Оптимизация нейронной сети, описываемой системой интегро-дифференциальных уравнений // Математические методы управления: сб. науч. тр. -Тверь: Твер. гос. ун-т, 2010, - С.46-54.

3. Андреева Е.А., Большакова И.С. Оптимальное управление динамическими системами с запаздыванием // Современные методы теории краевых задач. Материалы Воронежской весенней математической школы "Понтрягинские чтения - ХХГ'. - Воронеж: Издатсльско-полиграф. центр Воронежского гос. ун-та, 2011. - С. 9-10

4. Большакова И.Сп Шаронов ДЛ. Обучение нейронной сетн с запаздыванием // Международный журнал «Программные продукты и системы» №2,2011, - С.35-37.

5. Андреева Е.А., Большакова И.С. Оптимальное управление в модели хищник-жертва с учетом сосредоточенного и распределенного запаздывания // Математические методы управления: сб. науч. тр. - Тверь: Твер. гос. ун-т, 2011,- С.5-15

6. Андреева Е.А., Большакова И.С. Численные методы построения оптимального управления системами, описываемыми интегро-дифференциальными уравнениями // Материалы Международной Научно-практической конференции «Информатизация как целевая ориентация и стратегический ресурс образования». Архангельск, 2012, - С.461-468

7. Андреева Е.Л., Мазурова И.С. Оптимальное управление динамическими системами в многокритериальных задачах // Материалы всероссийской научной конференции с международным участием «Спектральная теория операторов и её приложения». Архангельск, 2012

8. Андреева Е. А. Мазурова И.С. Оптимальное управление в модели хищник-жертва с распределенным запаздыванием // Труды X Международной научно-технической конференции "Новые информационные технологии системы", Пенза, Издательство ПГУ, 2012, - С.256-259

9. Мазурова И.С. Решение задачи оптимального управления методом Б АД // Труды Третьей Российской школы - конференции для молодых ученых с международным участием "Математика, информатика, их приложения и роль в образовании", Тверь, 2013

10. Андреева Е.А., Мазурова И.С. Оптимальное управление динамическими системами в многокритериальных задачах // Труды Третьей Российской школы - конференции для молодых ученых с международным участием "Математика, информатика, их приложения и роль в образовании", Тверь, 2013, - С. 20-25

11. Мазурова И.С. Построения оптимального решения в модели хищник-жертва с помощью генетического алгоритма // Труды I Международной научно-практической конференции «Современные проблемы компьютерных наук (спкн-2013)», Пенза, 2013

12. Andreeva Е.А., Mazurova IS. Optimal control of predator-prey model with distributed delay // Mathematical Modelling and Geometry (Электронный ресурс), 2013, vol. 1, No 3, pp. 38 - 48 - Режим доступа: http://mmg.tversu.ru

13. Андреева E.A., Мазурова И.С. Численный метод обучения искусственной нейронной сети с учетом запаздывания при передаче сигнала // Сборник статей Международной научно-практической конференции "Теоретические и практические вопросы науки XXI века", Уфа, 2014

14. Мазурова U.C. Оптимальное управление в модели хищник-жертва с распределенным запаздыванием // «Образование. Наука. Научные кадры» №3,2014, -С. 218-223

15. Андреева Е.А., Мазурова И.С. Оптимальное управление в модели хищник-жертва с учетом сосредоточенного н распределенного запаздывания// «Фундаментальные исследования» №9 (часть 6), 2014, - С. 1220-1224

Отпечатано ООО «Документ центр» 170100, г.Тверь, б-р Радищева, 29, тел.(4822) 32-26-20, 710-321 усл. печ лис. 1,0, Формат 84 х 60, бумага офсетная, печать офсетная, тираж 100 экз.

14-1; , 3

14341332

2014341332