Анализ дискретной полумарковской модели управления запасом непрерывного продукта при периодическом прекращении потребления тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Иванов, Алексей Валерьевич АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2014 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Автореферат по математике на тему «Анализ дискретной полумарковской модели управления запасом непрерывного продукта при периодическом прекращении потребления»
 
Автореферат диссертации на тему "Анализ дискретной полумарковской модели управления запасом непрерывного продукта при периодическом прекращении потребления"

На правах рукописи

Иванов Алексей Валерьевич

Анализ дискретной полумарковской модели управления запасом непрерывного продукта при периодическом прекращении потребления

Специальность 01.01.05 — Теория вероятностей и математическая статистика (физико-математические науки)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

О1

Москва-2014

О 4 СЕН 2014

005552204

Работа выполнена в федеральном государственном автономном образовательном учреждении высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики»

Научный руководитель

Официальные оппоненты

Ведущая организация

Шнурков Петр Викторович,

кандидат физико-математических наук, доцент

Рыков Владимир Васильевич,

доктор физико-математических наук, профессор, ФГБОУ ВПО «Российский государственный университет нефти и газа им. И.М. Губкина», профессор кафедры прикладной математики и компьютерного моделирования

Калинкин Александр Вячеславович,

доктор физико-математических наук, профессор, ФГБОУ ВПО «Московский государственный технический университет им. Н.Э. Баумана», профессор кафедры высшей математики

Факультет вычислительной математики и кибернетики ФГБОУ ВПО «Московский государственный университет им. М.В. Ломоносова»

Защита состоится 07 октября 2014 года в 16-00 на заседании диссертационного совета Д 212.048.17, созданного на базе федерального государственного автономного образовательного учреждения высшего профессионального образования «Национальный исследовательский университет «Высшая школа экономики», по адресу: 109028, Москва, Б. Трехсвятительский пер., д.З, зал заседаний ученого совета (к.217).

С диссертацией можно ознакомиться в библиотеке Национального исследовательского университета «Высшая школа экономики» по адресу: 101000, Москва, ул. Мясницкая, д.20, и на сайте http://www.hse.ru/sci/diss/.

Автореферат разослан

Я. ¿7/ Ш

Ученый секретарь диссертационного 7у/ Шнурков совета, к. ф.-м.н„ доцент '__ ПетР Викторович

в

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы диссертации. Математическая теория управления запасами является одним из важных направлений современной прикладной математики. Стохастические методы и модели, используемые в теории управления запасами, весьма разнообразны и содержательны. В научной литературе по этому направлению имеется ряд фундаментальных изданий, содержащих обширную информацию об этих моделях и методах. Однако в последние десятилетия в российской научной литературе по прикладной математике отсутствуют издания монографического характера по теории управления запасами. Из современной зарубежной научной литературу упомянем книгу Э. Портеуса (E.L. Porteus)1 , в которой изложены как классические результаты, так и современное состояние стохастической теории управления запасами.

Следует отметить, что стохастические полумарковские модели достаточно редко используются в теории управления запасами. В то же время такие модели могут отражать существенные особенности эволюции рассматриваемых реальных систем. Для анализа этих моделей в общей теории полумарковских процессов разработан мощный и эффективный математический аппарат.

В настоящей работе предлагается и исследуется стохастическая полумарковская модель управления запасом непрерывного продукта, то есть такого, множество значений объема которого является подмножеством множества вещественных чисел. В экономических системах непрерывным продуктом могут являться нефть, бензин, мазут, газ, вода, зерно. Все эти продукты имеют важное значение на внутреннем рынке страны и используются во внешнеторговой деятельности. В реальной экономике имеется много систем (хранилищ или складов), которые предназначены для временного хранения запасов таких продуктов и поставок их непосредственным потребителям.

1 Porteus, Е. L Foundations of stochastic inventory theory. — California: Stanford Business Books, 2002. — 320 p.

Предлагаемая модель предназначена для описания функционирования таких систем. В работе проводится теоретическое исследование проблемы оптимального управления в предложенной полумарковской стохастической модели. Основываясь на результатах проведенного анализа, можно создать методики вычисления оптимальных значений параметров управления. Таким образом, исследование, проводимое в данной работе, является актуальным, как с точки зрения развития теории стохастических полумарковских моделей, так и с точки зрения его использования для создания научно обоснованных методик расчета оптимальных дисциплин управления реальными экономическими системами.

Общая характеристика проведенного исследования. В работе рассматривается система, предназначенная для хранения и поставок потребителю некоторого непрерывного продукта, объем которого ограничен сверху заданной положительной величиной (максимальная вместимость хранилища). Положительные значения объема соответствуют реальному запасу продукта, отрицательное - неудовлетворенному спросу или дефициту. Потребление продукта происходит с постоянной скоростью, параметром управления является время от момента пополнения запаса до момента заказа на следующее пополнение. Пополнение запаса происходит по схеме, в которой учитываются состояния системы до пополнения, а также непосредственно после проведенной операции пополнения. Кроме того, в процедуре пополнения учитываются случайные отклонения от планируемого объема поставки.

Для описания функционирования рассматриваемой системы вводится два случайных процесса. Первый из них непосредственно описывает объем запаса в системе. Второй, условно называемый сопровождающим, представляет собой полумарковский процесс с конечным множеством состояний. Показателем качества управления является стационарный стоимостной функционал средней удельной прибыли (по отношению к единице времени) зависящий от вероятностных характеристик этих процессов. Как известно, он представляет

собой дробно-линейный функционал от вероятностных распределений, определяющих управляющие воздействия. В настоящей работе устанавливается, что оптимальной стратегией управления является детерминированная, которая зависит от состояния полумарковского процесса. Данный результат полностью согласуется с известными теоретическими утверждениями о характере оптимального управления полумарковскими процессами при весьма общих предположениях о структуре множеств состояний и управлений 2. В то же время, в настоящей работе доказывается, что набор оптимальных значений параметра управления представляет собой точку глобального экстремума основной функции рассматриваемого дробно-линейного функционала, для которой получено явное представление.

Кроме этого, в работе продемонстрированы возможности использования полученных теоретических результатов с помощью численных методов. Именно, написана программа, позволяющая вычислять значения основной функции соответствующего дробно-линейного функционала и исследовать ее на экстремум.

Цель работы. Цель диссертационной работы заключается в решении проблемы оптимального управления в рассматриваемой стохастической полумарковской модели управления запасом непрерывного продукта и теоретическом обосновании метода нахождения оптимальной стратегии управления.

Научная новизна работы. В работе получены следующие новые научные результаты.

1. Разработана стохастическая модель управления запасом непрерывного продукта в форме управляемого полумарковского процесса с конечным множеством состояний.

2 Luque-Vasquez, F. Semi-Markov control models with average costs / F. Luque-Vasquez, O. Hernandez-Lerma // Applications Mathematicae. — 1Э99. — v. 26, №3. — P. 315 - 331.

2. Получены явные представления для вероятностных характеристик этой модели, а также для характеристик аддитивного стоимостного функционала, связанного с введенным полумарковским процессом. Такие функционалы по содержанию имеют характер случайных затрат или прибыли, возникающих при эволюции системы.

3. Доказано утверждение о структуре показателя качества управления в поставленной задаче оптимизации. По содержанию данный показатель качества представляет собой стационарный стоимостной функционал средних удельных затрат или средней удельной прибыли. Установлено, что по форме зависимости от вероятностных распределений, задающих управления в каждом состоянии полумарковского процесса, этот показатель представляет собой дробно-линейный функционал. При этом получены явные аналитические представления для подынтегральных функций числителя и знаменателя данного функционала, выраженных через найденные ранее вероятностные и стоимостные характеристики модели.

4. Установлено, что оптимальная стратегия управления в исследуемой стохастической полумарковской модели является детерминированной и определяется точкой абсолютного экстремума основной функции дробно-линейного функционала - показателя качества управления. Основная функция представляет собой отношение подынтегральных функций числителя и знаменателя дробно-линейного функционала и определена в явной форме как функция конечного числа вещественных переменных.

Методы исследования. Для решения поставленной задачи в работе используются следующие математические методы.

1. Общие методы теории вероятностей и теории полумарковских случайных процессов.

2. Методы функционального анализа и теории функций.

3. Аналитические методы классического математического анализа.

Научная и практическая значимость. Результаты диссертации могут представлять интерес для специалистов, занимающихся приложениями теоретико-вероятностных методов в экономических, технических и других областях. Также эти результаты могут являться теоретической основой для будущих исследований, связанных с различными модификациями данной модели и другими полумарковскими моделями управления запасами.

Кроме того, с целью иллюстрации практической значимости полученных теоретических результатов разработана программа, функционирование которой основано на полученном аналитическом представлении основной функции дробно-линейного функционала. Данная программа позволяет по заданным исходным характеристикам модели вычислять значения основной функции и исследовать её поведение в области возможных значений параметров управления с целью нахождения точки глобального экстремума (оптимального управления). Эта программа может быть интересна специалистам, занимающимся разработкой программных продуктов для анализа систем управления запасами.

Апробация работы. Результаты работы были представлены в форме докладов на следующих научных конференциях, симпозиумах и семинарах:

1. Научно-технические конференции студентов, аспирантов и молодых ученых МИЭМ и МИЭМ НИУ ВШЭ 2011,2012,2013 годов;

2. Всероссийский симпозиум по прикладной и промышленной математике. Осенняя открытая сессия (Сочи, сентябрь 2011 г.);

3. Всероссийская конференция "Прикладная теория вероятностей и теоретическая информатика" (Москва, апрель 2012 г.);

4. Международная конференция "Теория вероятностей и ее приложения", посвященная 100-летию со дня рождения Б.В.Гнеденко (Москва, июнь 2012 г.);

5. XXXI International Seminar on Stability Problems for Stochastic Models (Moscow, April 2013);

6. 26-th European Conference on Operational Research (Rome, July 2013).

7. Семинар "Теория риска и смежные вопросы" кафедры математической статистики факультета ВМиК МГУ; руководитель семинара - д.ф-м.н., проф. Королев В.Ю. (Москва, март 2014).

Во всех указанных выше научных мероприятиях автор диссертационной работы принял личное участие.

Публикации. Результаты диссертации опубликованы в 6 работах соискателя, список которых приведен в конце автореферата. Научные работы [1], [2] опубликованы в журналах, входящих в утвержденный ВАК перечень ведущих рецензируемых научных изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени кандидата наук. При этом работы [1], [2] представляют собой развернутые научные статьи, включающие подробное изложение и обоснование полученных результатов. В указанных публикациях содержатся все основные результаты диссертации.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и библиографии. Объем работы составляет 120 страниц текста, в том числе 29 рисунков. Библиография включает в себя 39 наименований.

Краткое содержание работы.

Во введении проводятся обоснования актуальности темы диссертации, рассматриваются примеры конкретных экономических систем, которые можно описать исследуемой в работе математической моделью, содержится описание

целей исследования.

В главе 1 содержится обзор научной литературы, связанной с темой диссертационного исследования и его основными теоретическими результатами.

В главе 2 приводятся описание стохастической полумарковской модели управления запасом, математическая постановка задачи оптимального

управления, получение представлений для всех основных вероятностных и стоимостных характеристик модели, а также их аналитические преобразования, необходимые для проведения дальнейшего исследования.

Подробное содержание главы 2.

Описание и основные характеристики модели. Рассматривается некоторая система, предназначенная для хранения и поставки потребителю запаса определенного вида продукта. Объем запаса продукта описывается случайным процессом дг(£), t > 0 , принимающим значения во множестве (—оо,т],гдет > 0 (т - максимальная вместимость хранилища). Отрицательная величина объема запаса означает наличие неудовлетворенного спроса (дефицита продукта), который компенсируется в дальнейшем в результате очередной поставки. В рассматриваемой модели потребление происходит с постоянной скоростью а > О , а в определенные периоды времени не происходит вообще.

В модели используется дискретизация. Множество возможных значений объема запаса (—оо,т] разбивается на конечное число подмножеств следующим образом:

и ■ и К'-ли и - и [««]•

гпе _(-) _ _(-) _ _(+) _ п. _(+) _ ГДеТЛГ1+1— °°'т0 - т0 _и'ТМ0+1_Т-

Обозначим через £-0(_) = (т^,;Е^ = (т^т^],к £ {1,...,^}, а через = [т« т« е {0.....Ы0 - 1}; Е« = [г«^].

Предполагается, что непосредственное пополнение запаса происходит мгновенно. Обозначим через {£„}"=0 последовательность случайных моментов времени, в которые осуществляется пополнение запаса, а через {^}п=о -последовательность случайных моментов времени, в которые производится заказ на пополнение запаса. Сделанный заказ на пополнение выполняется с

некоторойслучайной задержкой. Таким образом, с вероятностью, равной единице, выполняется соотношение 2:п < ^ < £п+1 >п е {ОД,...,}; = 0.

Приведем описание процедуры пополнения запаса. В начальный момент функционирования системы или в момент окончания очередного пополнения планируется время, через которое будет сделан заказ на следующее пополнение запаса. Такое планирование заключается в нахождении реализации случайной величины - времени от момента очередного пополнения запаса до момента, в который производится следующий заказ на пополнение. Именно, если в некоторый фиксированный момент времени Ьп, произошло пополнение запаса и

в результате этого пополнения запас принял значение х(£п) = х е е[+\ I Е {ОД, то заказ планируется через время где & - случайная величина с

функцией распределения С; (О- При таких условиях с вероятностью, равной единице, выполняется стохастическое соотношение ^ = +

В запланированный момент времени производится заказ на пополнение запаса и начинается период задержки (период подготовки выполнения очередного заказа). В течение периода задержки потребление запаса не происходит. Предполагается, что если состояние системы в момент заказа г'п

принимает значение хЮ = х - а^ в Е^\к е {0,1.....0, а в результате

последующего пополнения объем запаса становится равным х(£п+1) е е

{к, к + 1,..., Л/0}, то длительность задержки - случайная величина зависит от номеров к, I и имеет математическое ожидание /4|} = < 00• Если же в

момент заказа состояние системы х(^) = х- е Е^ \к 6 {ОД,....Л^}, а в результате последующего пополнения объем запаса становится равным х(Сп+1) е Е;(+), I е (ОД,..., Ы0) , то длительность задержки описывается случайной величиной г)*^ > зависящей от номеров к,1 и имеющей

математическое ожидание ^ = <00 ■ Параметры

предполагаются заданными. В рамках развиваемой в дальнейшем теории

задание функций распределения случайной длительности периода задержки не является необходимым.

При выполнении указанных выше условий с вероятностью, равной единице, выполняется одно из равенств Сп+1 - ^ + £п+1 = С„ + и в момент ¿п+1 осуществляется запланированное пополнение запаса.

Непосредственное пополнение запаса представляет собой переход процесса *(£) из одного подмножества в другое. Для описания процедуры пополнения введем следующие системы вероятностных характеристик:

~ вероятности перехода из в ; > = 1,к е

{ОД.....Ы0};

- вероятности перехода из в Е,(+) ; = 1, к в

{ОД.....лу.

Дискретные вероятностные распределения {Д^5} ° ,к Е {ОД, ...,Ы0} и

о, к £ {ОД,..., Л^} предполагаются известными и описывают

планируемое пополнение запаса, зависящее от потребностей системы и возможностей поставщика.

Если в момент пополнения значение процесса х(£п+1) £ Е^,к е {ОД,..., Л/0), то состояние внутри этого подмножества (точный уровень запаса) определяется в соответствии с известной функцией распределения

(+1) — 1 • Вероятностные распределения В^х) предполагаются известными и описывают отклонения от заданных фиксированных значений уровней запаса внутри каждого подмножества с номером I (например, от середины соответствующего интервала). Таким образом, после пополнения запас всегда является положительным и дефицит продукта ликвидируется.

Эволюция процесса *(£) после момента очередного заказа зависит только от номера подмножества состояний, в котором оказался этот процесс в момент заказа. Эволюция этого процесса после момента очередного пополнения также происходит независимо от прошлого и зависит только от номера подмножества состояний, в котором оказался этот процесс в результате пополнения запаса. В этом смысле случайный процесс х(4:), описывающий объем запаса в системе, в моменты заказа и в моменты непосредственного пополнения запаса обладает марковским свойством. Данные особенности рассматриваемой модели будут существенно использоваться в дальнейшем.

Замечание. Будем называть интервал времени между последовательными моментами непосредственного пополнения запаса интервалом (периодом) эволюции системы (основного процесса). Каждый период эволюции можно разбить на две части: первая часть - от момента непосредственного пополнения запаса до момента заказа на следующую поставку; вторая - от момента заказа до момента непосредственного пополнения.

Функционирование рассматриваемой системы связано с доходами от реализации продукта, расходами на хранение и штрафами, возникающими из-за дефицита продукта. Введем следующие обозначения:

С!Ос) - затраты на хранение продукта объемах в единицу времени, где х > 0 (имеется положительный объем запаса продукта);

с2(х) - затраты, связанные с дефицитом величины х в единицу времени, где х < 0;

<7! (ж) - цена единицы продукта при условии, что объем имеющегося в системе (оставшегося) продукта равен х,х > 0 (имеется положительный запас);

д2(х) - цена единицы продукта при условии, что объем имеющегося в системе (оставшегося) продукта равен х, х < 0 (имеется дефицит объема х).

Постановка проблемы оптимального управления. Для математического описания рассматриваемой системы, кроме основного случайного процесса

x(t), t >0 , непосредственно описывающего точный уровень запаса в произвольный момент времени, вводится вспомогательный полумарковский случайный процесс ((t), t > О, с конечным множеством состояний, определяемый при помощи вложенной цепи Маркова.

Предполагается, что объем запаса х(0) = х0 в начальный момент времени является заданной величиной, принадлежащей одному из возможных интервалов разбиения: х0 е к е {ОД, ...,N0}. В частности, возможно, что х0 = т.

Обозначим через (п номер подмножества состояний, в котором оказался процесс x(t) непосредственно после очередного пополнения запаса: Çn = к <=> x(tn + 0) 6 к е {ОД, ...,N0} . В силу того, что в моменты пополнения запаса tn, п е {ОД,...,} случайный процесс х(£) обладает марковским свойством, последовательность случайных величин f<fn}n=o образует цепь Маркова. Определим случайный процесс £(t), связанный с последовательностью {£п}п=о> ПРИ помощи соотношения

at) = C„.t 6 [i„,tn+1),n 6 {ОД,...,}.

Случайный процесс £(t), t > 0, представляет собой управляемый полумарковский процесс с конечным множеством состояний Е = {ОД, ...,NQ}, траектории которого непрерывны справа. В дальнейшем этот процесс будет называться сопровождающим полумарковским процессом. Последовательность (Л является цепью Маркова, вложенной в этот полумарковский процесс. Управление процессом £(t) производится в моменты tn (после определения значения процесса x(tn)).

Параметр управления полумарковским процессом или решение, принимаемое в момент времени tn , обозначается через ип и формально совпадает со случайной длительностью периода времени от момента после очередного пополнения запаса в системе до момента следующего заказа на пополнение запаса. Именно, ип = если (п — к (равенство случайных

величин понимается в смысле совпадения функций распределения). Множество допустимых значений параметра управления U совпадает с множеством неотрицательных чисел U = [0, со).

Вероятностные распределения Go(0.Gi(').-.Gwo(0 . соответствующие каждому состоянию полумарковского процесса ((t) и определяющие значения решений об управлении, принимаемых в каждом состоянии, называются управляющими распределениями. Будем говорить, что набор вероятностных распределений Go(-),Gi(0»-.G«o0). определяет стратегию управления в

рассматриваемой полумарковской модели.

Для того, чтобы формально поставить задачу оптимального управления в математической модели необходимо задать показатель качества управления или целевой функционал. Предположим, что в рассматриваемой стохастической модели определен некоторый аддитивный стоимостной функционал, связанный с полумарковским процессом £(0> характеризующий прибыль, связанную с эволюцией экономической системы.

Обозначим через Vn значение аддитивного стоимостного функционала в момент времени tn + 0, а через А Vn = V(tn+1) - V(tn) обозначим приращение значения данного функционала, образующееся на периоде эволюции (tn,tn+1], где ДГ„ = tn+1 - t„ - длительность периода эволюции. Через V(t) обозначим математическое ожидание значения данного функционала, полученное в результате эволюции полумарковского процесса £(t) на интервале времени [ОД].

В теории случайных процессов известен следующий результат (см., например, книгу A.A. Боровкова3) - при достаточно общих условиях для полумарковской модели имеет место следующий результат:

а)

3 Боровков A.A. Эргодичность и устойчивость случайных процессов. — М.: Эдиториал УРСС, 1999. — 450 с.

где набор {л0,..., я^} представляет собой стационарное распределение цепи Маркова {Сп)п=о> вложенной в полумарковский процесс

с^ = М[ДКП|(П = 1] - условное математическое ожидание приращения аддитивного стоимостного функционала на периоде эволюции, определяемое при условии, что на этом периоде процесс находится в некотором состоянии I е {ОД,..., Ы0};

= М[А/„|<Г„ = г] - условное математическое ожидание длительности периода эволюции, определяемое при условии, что на этом периоде процесс £(£:) находится в некотором состоянии £ £ {0,1,..., Л/0}.

Величина / = /(с0(О.(■),.», Сд,0(-)) представляет собой стационарный стоимостной функционал от вероятностных распределений 6о(0.с1(0.-<6лг0(0- в настоящей работе рассматриваются два вида таких функционалов: средние удельные затраты и средняя удельная прибыль.

Проблема оптимального управления запасом в рассматриваемой модели может быть сформулирована как экстремальная задача без ограничений:

/ = /(СоСО.С1(-).-.Сдг0(-))-»ех4г, С[ е Г,£ е {ОД.....ли (2)

где Г - множество вероятностных распределений, заданных на пространстве допустимых управлений и = [0, оо).

Для решения поставленной экстремальной задачи необходимо установить явную форму зависимости целевого функционала 1 от управляющих вероятностных распределений в^Л 6 {ОД,...,Л?0} . Для этого необходимо найти явные представления вероятностных и стоимостных характеристик полумарковской модели, входящих в правую часть соотношения (1).

Утверждения об аналитических представлениях для вероятностных характеристик полумарковской модели. Общая формула для вероятностей перехода вложенной цепи Маркова Кп)п=о имеет вид

Рц = X ^^ + X ' и Е {0Д.....(3)

к=0 (с=0

Аналитические представления для вспомогательных вероятностных характеристик входящих в формулу (3), определяются в теореме 2.3.1

диссертационной работы. Приведем здесь только выражение для

а(+) "¡+1.к+1

Рк+)= / "¡.к+1

I ¿В^х)

+ |

а(+) "¡+1Л+1

т<+)

п(+)

+

"¡+1 .к /

'1+1

(4)

_ (+)

где 4+\х) = '-^.к е {ОД.....О-

Общая формула для математического ожидания длительности пребывания процесса £(£) в фиксированном состоянии 1 £ {0,1,..., Л/0} до первого выхода из этого состояния имеет вид £

г*=2 +X• 'е{од.....(5)

к=О /с=0

Аналитические представления для вспомогательных вероятностных характеристик Тур.Т^, входящих в формулу (5), определяются в теореме 2.3.2 диссертационной работы. Приведем здесь только выражение для Т^.

/

¿+1,к+1

м+т

,с+)

+ / / + а£> «Г+т<+>

+

/

' 1+1

I [ь + ц^йВМ

йСМ,

(6)

где к £ {0,1,..., ¿}.а величинацк = Е^о^ы Ди представляет собой условное математическое ожидание длительности задержки при условии, что реализуется событие Ак = (*(£„) е

Утверждения об аналитических представлениях для стоимостных характеристик полумарковской модели. Общая формула для математического ожидания прибыли, полученной за время пребывания процесса £(£) в фиксированном состоянии £ 6 {ОД, Д° первого выхода из

этого состояния имеет вид

I

= 2+ 2, '' 6 {од.....(7)

к=0 к=О

Как и в предшествующих формулах (3), (5) для вероятностных характеристик модели, аналитические представления вспомогательных стоимостных характеристик с^.й^, входящих в формулу (7), определяются в теореме 2.3.3 диссертационной работы. Приведем здесь только выражение для

¿+1,к+1

4+) = /

ас+)

"¡Л+1

„с+)

т(+) к+1

+

/

„С+>.

/

<4+)

т<+>

+

г«

т<+)

где к 6 {ОД, ...,0> а вспомогательная функция (х, С) аналитически

выражается формулой с

0 = |[«31 (х -г)-С1(х- -сх(х- , Г < х.

о

По своему вероятностному содержанию эта функция представляет условное математическое ожидание величины прибыли при функционировании рассматриваемой системы на одном периоде её эволюции, которое определяется при следующих условиях:

• в момент очередного пополнения запас продукта равен фиксированной величине х(^) = х £ Е^;

• параметр управления принимает фиксированное значение Г > 0;

• в момент заказа реализуется событие Ак = (хЮ 6

Отметим, что все выражения для вспомогательных вероятностных и стоимостных характеристик полумарковской модели, входящие в правые части формул (3), (5), (7), первоначально представляются в форме двойных интегралов по мерам, задаваемым вероятностными распределениями Сг(*).Вг(0. причем внешним является интеграл по распределению ■)• Такое представление наиболее удобно с точки зрения вероятностного содержания указанных характеристик. Однако в дальнейшем для определения структуры зависимости стационарного функционала средней удельной прибыли от управляющих вероятностных распределений становится необходимым проведение преобразований упомянутых двойных интегралов и приведение их к виду, где внешним является интеграл по распределению £¿(0. При этом данные преобразования зависят от соотношения между параметрами аи а1Ч1 к+1 дая положительной области запаса либо между параметрами и

- для области дефицита запаса. Соотношения между указанными параметрами определяют вид области интегрирования. В тексте диссертации в

явной аналитической форме представлены все выражения для вероятностных и стоимостных характеристик модели с учетом различных соотношений между указанными выше параметрами областей интегрирования.

В главе 3 содержатся теоретические результаты о структуре зависимости стационарного стоимостного показателя качества управления от управляющих вероятностных распределений. Доказано, что этот функционал по форме является дробно-линейным и получены явные аналитические представления для подынтегральных функций его числителя и знаменателя. На основании этих результатов задача оптимального управления в рассматриваемой полумарковской модели сводится к нахождению глобального экстремума функции нескольких вещественных переменных, которая называется основной функцией дробно-линейного функционала.

Отметим, что впервые идея представления стационарного стоимостного функционала, связанного с полумарковским процессом, в дробно-линейном виде была с формулирована В. А. Каштановым4. Подробное описание главы 3.

Аналитическое представление стационарного стоимостного функционала в дробно-линейной форме. Первым важным результатом главы 3 является утверждение теоремы 3.2.1, в которой установлена форма зависимости стационарных вероятностей вложенной цепи Маркова {(п}п=о от управляющих вероятностных распределений С0(-),..., Сдго(-) . При помощи этой теоремы доказано основное утверждение главы 3, а именно, теорема 3.3.1, в которой определяется структура стационарного стоимостного функционала (1). Приведем полную формулировку этого основного результата. Предварительно введем важное понятие вырожденного распределения.

Назовем распределение С(х) вырожденным и сосредоточенным в точке и, если оно представимо в следующем виде:

Теорема 3.3.1. Стационарный функционал средней удельной прибыли, определяемый равенством (1), представляет собой дробно-линейный функционал от вероятностных распределений С;(и;),г £ [О, ...,Л/0}. Данный функционал задается аналитически следующей формулой:

1 ,(ггл г '^ ^- .....-^.к) пт

V > /0 .../0 Ва(ио.....и„о)с1С0(и0) ...с^Ди^)

где подынтегральные функции числителя и знаменателя выражаются соотношениями:

Аа(и0.....ыд,0) = ^ ¿¡(^)0(О(ио, ...,ыг_1,и,+1.....иЫо) , (11)

1=0 "о

Ва(щ.....иНо) = ..........и„в). (12)

¿=о

Функции, входящие в правые части равенств (11) и (12), определяются следующими формулами:

5(0(ыо.....и1-1>Щ+1> — <ил/0) =

= (-1)л'о+'+2 £ (_1) .....и^и,«,(13)

аШЛ

асл,о)|'= (а0,...,«[•_!,— произвольная перестановка чисел

(О.....г-1,1 + 1.....Ы0-),

— число инверсий в перестановке а^0'1', 0(0 (а^Мщ..........иЫо) =

Рк,ак(ик)=[ ркаЛщ1 .....+ 1.....^ ^

Характеристики Т^щ) и (¡¡{щ) определяются выражениями (5) и (7), в которых распределение :) = С,*иД£) является вырожденным и

сосредоточено в точке £ = щ, I £ {0,..., М0}.

Решение проблемы оптимального управления. Теперь проблема оптимального управления запасом формулируется в виде экстремальной задачи

(2), в которой целевой функционал / (бо ('). — . Сл/о0)) определяется утверждением теоремы 3.3.1. Исследование задачи нахождения безусловного экстремума для дробно-линейных функционалов было проведено в работе5. Отметим, что полученные в указанной работе результаты могут быть обобщены и усилены. Можно доказать, что, если основная функция соответствующего функционала, определяемая формулой

_ г ч Аа(и0.....щ0)

СаЫ.....= .....««„)' С }

достигает своего глобального экстремума на множестве = {(и0,...,ицо),щ Е [0,оо),£ е {0,...,М0}} в некоторой фиксированной

точке и, = (и0„...,иЫо,) , то экстремум функционала I (СоС)...., СМо(-)) существует и достигается на вырожденных распределениях вида (9), сосредоточенных в указанных точках (и0,,..., иМо,).

Утверждение теоремы 3.3.1 позволяет получить явное аналитическое представление для основной функции (16) целевого функционала (1), представимого в форме (10). Таким образом, задача оптимального управления запасом в рассматриваемой модели сводится к поиску глобального экстремума явно заданной функции Са(и0,...,иМо) , зависящей от конечного числа вещественных переменных.

В главе 4 приводится описание алгоритма программы, основанного на теоретических результатах, полученных в главах 2 и 3. В этой программе используются средства пакета "МаИлЬ". Данная программа позволяет довести до полного завершения решение рассматриваемой задачи оптимального управления.

В состав программы входят отдельные блоки, позволяющие вычислять значения всех вероятностных и стоимостных характеристик модели, а также значения основной функции исследуемого дробно-линейного функционала, для всех значений параметров управления из заданной области. Помимо численного представления этих математических объектов, в программу входит блок оптимизации, который предназначен для поиска точки глобального экстремума основной функции дробно-линейного функционала.

В ходе выполнения программы не только определяется точка глобального экстремума основной функции (с некоторой заданной точностью), но и проводится численное исследование этой функции в некоторой достаточно малой окрестности предполагаемой точки глобального экстремума. В программе реализованы также графические представления для вспомогательных вероятностных и стоимостных характеристик модели, а также для самой основной функции исследуемого дробно-линейного функционала.

Благодарность. Автор выражает глубокую благодарность своему научному руководителю к.ф-м.н., доценту Шнуркову П.В. за активное участие в научно-исследовательском процессе и помощь в решении вопросов научно-организационного характера; а также за внимание и высококвалифицированное руководство на протяжении работы над диссертацией.

Список работ, опубликованных по теме диссертации.

Работы, опубликованные автором в ведущих рецензируемых научных журналах и изданиях, рекомендованных ВАК:

1. Иванов A.B. Исследование задачи оптимизации в дискретной полумарковской модели управления непрерывным запасом. // Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки. — 2013. — № 3, С. 62 - 87, 1 а.л. (в соавт. с Шнурковым П.В., ; личный вклад автора - 0.5 а.л.).

2. Иванов A.B. Анализ дискретной полумарковской модели управления запасом непрерывного продукта при периодическом прекращении потребления // Дискретная математика. — 2014. — Т.26, №1. — С. 143— 154, 0.66 а.л. (в соавт. с Шнурковым П.В., ; личный вклад автора - 0.33 а.л.).

Работы, опубликованные в других изданиях:

3. Иванов A.B. Полумарковская модель управления запасом непрерывного продукта. // Обозрение прикладной и промышленной математики. Т.18. №4. Научные доклады. ХП Всероссийский симпозиум по прикладной и промышленной математике. 2011. Сочи. С.642-644 0.14 а.л.

4. Иванов A.B. «Анализ проблемы управления запасом непрерывного продукта в стохастической полумарковской модели с периодическим прекращением потребления». // Тезисы докладов. Всероссийская конференция «Прикладная теория вероятностей и теоретическая информатика». — М.: ИЛИ РАН, 2012. — С. 85 - 87. 0.14 ал (в соавт. с Шнурковым П.В.; личный вклад автора 0.07 ал.)

5. Иванов A.B. Анализ проблемы управления запасом непрерывного продукта в стохастической полумарковской модели с периодическим прекращением потребления. И Тезисы докладов. Международная конференция «Теория вероятностей и ее приложения», посвященная 100-

летаю со дня рождения Б.В. Гнеденко. — М. ЛЕНАНД, 2012. — С. 267 - 268, 0.12 а.л. (в соавт. с Шнурковым П.В.; личный вклад автора 0.06 а.л.).

6. Ivanov A., A continuous inventory optimal control problem for discrete semi-Markov model. // Book of abstracts. XXXI International Seminar on Stability Problems for Stochastic Models and VII International Workshop "Applied Problems in Theory of Probabilities and Mathematical Statistics Related to Modeling of Information Systems" and International Workshop 'Applied Probability Theory and Theoretical Informatics". — M.: ИЛИ PAH, 2013. — C. 100 - 102, 0.1 ал. (в соавт. с Шнурковым П.В.; личный вклад автора 0.05 ал.).

Лицензия ЛР N° 020832 от 15 октября 1993 г.

Подписано в печать «23я 2014 г. Формат 60x84/16

Бумага офсетная. Печать офсетная.

Усл. Печ. Л 1 ^ Тираж 110 экз. Заказ №

Типография издательства НИУ ВШЭ 125319, г. Москва, Кочновский пр-д, д. 3