Предельные теоремы для марковских процессов тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Бутковский, Олег Александрович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2013 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Диссертация по математике на тему «Предельные теоремы для марковских процессов»
 
Автореферат диссертации на тему "Предельные теоремы для марковских процессов"

Московский государственный университет имени М. В. Ломоносова Механико-математический факультет

На правах рукописи УДК 519.21

Бутковский Олег Александрович

Предельные теоремы для марковских процессов

01.01.05 — теория вероятностей и математическая статистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

2 3 МАЙ 2013

0050&ии»~

Москва - 2013

005060080

Работа выполнена на кафедре теории вероятностей механико-математического факультета МГУ имени М. В. Ломоносова.

Научный руководитель: доктор физико-математических наук,

профессор

Булинский Александр Вадимович

Официальные оппоненты: доктор физико-математических наук,

профессор

Богачев Владимир Игоревич

Московский государственный университет механико-математический факультет кафедра теории функций и функционального анализа

доктор физико-математических наук, профессор

Гущин Александр Александрович

ведущий научный сотрудник Математический институт имени В. А. Стеклова РАН

Ведущая организация: Санкт-Петербургское отделение

Математического института имени В. А. Стеклова РАН

Защита диссертации состоится 7 июня 2013 г. в 16 часов 45 минут на заседании диссертационного совета Д 501.001.85 при Московском государственном университете имени М.В. Ломоносова по адресу: 119991, ГСП-1, Москва, Ленинские горы, МГУ, механико-математический факультет, аудитория 16-24.

С диссертацией можно ознакомиться в Фундаментальной библиотеке МГУ имени М.В. Ломоносова (Ломоносовский пр-т, 27, сектор А, 8 этаж). Автореферат разослан 7 мая 2013 г.

Ученый секретарь

диссертационного совета Д 501.001.85 при МГУ, доктор физико-математических наук, профессор

В.Н. Сорокин

Актуальность темы

Марковские процессы играют важную роль в современной теории вероятностей. Модели, описываемые с помощью марковских процессов, находят применив в различных задачах физики, химии, биологии, финансовой математики. Эти процессы были введены A.A. Марковым1, а основы общей теории марковских процессов заложены А.Н. Колмогоровым2. В дальнейшем марковские процессы изучались в работах В. Дёблина, Дж. Дуба, P.JI. Добруши-на, Т. Харриса, Е.Б. Дынкина, A.A. Юшкевича, JI.H. Васерштейна, Р.З. Хась-минского, Д. Алдоуса, Е. Нуммелина, П. Туоминена, Ш. Мейна, Р. Твиди, П. Диакониса, Э. Мулина, А.Ю. Веретенникова, Г. Робертса, М. Хайрера, Дж. Матингли, Ю. Переса и многих других ученых. Упомянем здесь также монографии Е.Б. Дынкина3, Р.З. Хасьминского4, Ш. Мейна и Р. Твиди5, посвященные данной теме.

Традиционными примерами марковских процессов являются броуновское движение (винеровский процесс) и пуассоновский процесс. К ним также относятся решения стохастических дифференциальных уравнений, процессы Jle-ви, процессы рождения-гибели, случайные блуждания на группах и многие другие.

При широких предположениях6,7 марковский процесс имеет единственную инвариантную меру и его маргинальные распределения слабо сходится к ней. Изучение скорости сходимости этих распределений является значительно более сложной задачей. Для ряда интересных марковских процессов неизвестны вообще никакие оценки скорости сходимости. Отметим, что даже в "простых" ситуациях, когда пространство состояний конечно, во многих случаях известные оценки скорости сходимости очень далеки от оптимальных. В этой связи укажем на диссертацию Е. Вилмер8, написанную под руководством П. Диакониса. В ней изучается "простая" марковская цепь, для которой существующие методы не позволяют получить адекватные оценки скорости сходимости. Поэтому для установления такого рода оценок ей потребовалось разработать новые методы. Оценкам скорости сходимости (маргинальных) распределений конечных марковских цепей посвящена также и недавняя мо-

1 A.A. Марков (1906). Распространение закона больших чисел на величины, зависящие друг от друга. Язв. физ.-матем. общ. Казан, у пив. 15 135-156.

2A.N. KOLMOGOROFF (1931). Über die analytischen Methoden in der Wahrscheinlichkeitsrechnung. Math. Ann. 104 415-458.

3Е.Б. Дынкин (1963) Марковские процессы. М.: ФИЗМАТЛИТ.

4Р.З. Хасьминский (1969). Устойчивость систем дифференциальных уравнений при случайных возмущениях их параметров. М.: Наука.

5S. Meyn, E.L. Tweedie (2009). Markov Chains and Stochastic Stability. N.Y.: Cambridge Univ. Press.

ea.a. Боровков (1999). Эргодичность u устойчивость случайных процессов. м.: Изд-во УРСС.

7А.В. Булинский, А.Н. Ширяев (2005). Теория случайных процессов. М.: ФИЗМАТЛИТ.

SE. WlLMER (1999). Exact Rates of Convergence for Some Simple Non-Reversible Markov Chains. Ph.D. Thesis. Harvard University.

нография Д.А. Левина, Ю. Переса и Е. Вилмер9.

Изучение упомянутой скорости сходимости важно не только с теоретической, но и с практической точки зрения, так как подобного рода результаты позволяют оценить погрешность алгоритмов Монте Карло по схеме марковской цепи (Monte Carlo Markov Chain, MCMC), см., например, монографию П. Бремо10, а также обзоры П. Диакониса11,12 и ссылки там же. По словам П. Диакониса11, "применение этих алгоритмов (Метрополиса-Гастингса, Ланжевена, построения выборки по Гиббсу и других) к сложным многомерным вычислениям произвело революцию в прикладной математике. <...> Говорить о практических приложениях МСМС все равно, что говорить о практических приложениях формулы для решения квадратного уравнения. Эти результаты используются действительно в любой области научного исследования, <...> а в физике и химии МСМС вычисления вошли в число стандартных методов".

Настоящая диссертационная работа посвящена, главным образом, получению явных верхних оценок скорости сходимости маргинальных распределений марковских процессов к инвариантной мере в различных вероятностных метриках. Помимо этого изучается и сходимость таких распределений для процессов, родственных марковским. Получение соответствующих нижних оценок скорости сходимости также является важной задачей, так как позволяет показать, насколько плох может быть тот или иной алгоритм МСМС. Однако это направление исследований находится за рамками данной диссертации. Укажем здесь только на работы9,13.

Большое внимание в диссертации уделено и нелинейным марковским процессам (НМП), т.е. процессам, чьи переходные функции зависят не только от текущего состояния процесса, но также и от текущего распределения процесса. Такие процессы возникают при изучении асимптотического поведения большого числа слабо взаимодействующих друг с другом марковских процессов. НМП были введены Г.П. Маккином14 в связи с некоторыми задачами статистической механики. В дальнейшем такие процессы изучались в работах целого ряда авторов, упомянем здесь монографии В.Н. Колокольцова15 и А.С. Шнитмана16. НМП могут обладать необычными эргодическими свой-

"D. Levin, Y. peres, е. Wilmer (2008). Markov Chains and Mixing Times. Providence: Am. Math. Soc.

l0P. BrEMAUD (1999). Markov chains: Gibbs fields, Monte Carlo simulation, and queues. N.Y.: Springer.

up. Diaconis (2009). The Markov chain Monte Carlo revolution. Bull. Amer. Math. Soc. (N.S.) 46 179-205.

12P. Diaconis (2012). Some things we've learned (about Markov chain Monte Carlo). Preprint, available at htrtp : //vwv-stat. Stanford. edu/~cgates/PERSI/papers/somethinga .pdf

l3A.Yu. Veretennikov (2006). On lower bounds for mixing coefficients of Markov diffusions. In: iYom Stochastic Calculus to Mathematical Finance; The Shiryaev Festschrift, 623-633. Berlin: Springer.

MH.P. McKean (1966) A class of Markov processes associated with nonlinear parabolic equations. Proc. Natl. Acad. Sci. USA. 56 1907-1911.

15V.N. Kolokoltsov (2010). Nonlinear Markov processes and kinetic equations. Cambridge Tïacts in Mathematics 182. Cambridge: Cambridge Univ. Press.

16 A.-S. Sznitman (1991). Topics in propagation of chaos. In: Éc. Été Probab. St.-Flour XIX. Lecture Notes in Math. 1464 165-251. Berlin: Springer.

ствами. Изучение этих свойств — также одна из задач настоящей диссертации.

Полученные в диссертации результаты применяются для исследования асимптотического поведения распределений сильных решений стохастических функциональных дифференциальных уравнений (СФДУ, другое название — стохастические дифференциальные уравнения с запаздыванием) и стохастических уравнений Власова-Маккина (УВМ). Напомним, что упомянутые уравнения обобщают в различных смыслах классическое понятие стохастического дифференциального уравнения (СДУ). А именно, коэффициенты сноса и диффузии УВМ зависят дополнительно от текущего распределения процесса, а в СФДУ снос и диффузия имеют "память" и могут зависеть от прошлого состояния процесса. В диссертации также рассматривается вопрос о перенесении известных результатов об эргодических свойствах решений СДУ на решения СФДУ и УВМ.

Цель работы

Диссертация посвящена исследованию марковских и родственных марковским случайных процессов. Ее главные задачи состоят в следующем:

1. Найти достаточные условия для существования и единственности инвариантной меры у невозвратных по Харрису марковских процессов.

2. Оценить скорость сходимости маргинальных распределений марковских процессов к инвариантной мере в метрике Васерштейна.

3. Изучить скорость сходимости распределений сильных решений стохастических дифференциальных уравнений с запаздыванием к инвариантной мере.

4. Получить достаточные условия для равномерной эргодичности нелинейных марковских цепей.

5. Оценить скорость сходимости распределений сильных решений уравнения Власова-Маккина к инвариантной мере.

Научная новизна

Все результаты диссертации являются новыми. Перечислим основные из них.

1. Получены субгеометрические оценки скорости сходимости маргинальных распределений однородных марковских процессов к инвариантной мере в метрике Васерштейна.

2. Показано, что обобщенное условие Веретенникова-Хасьминского достаточно для субэкспоненциальной сходимости к инвариантной мере распределений сильных решений стохастических дифференциальных уравнений с запаздыванием.

3. Найдены достаточные условия (носящие оптимальный характер), гарантирующие существование и единственность инвариантной меры, а также равномерную эргодичность нелинейной марковской цепи. С их помощью установлены экспоненциальные оценки скорости сходимости распределений сильных решений стохастического уравнения Власова-Маккина к инвариантной мере.

4. Получены новые достаточные условия равномерной эргодичности однородной марковской цепи, которые выражаются в терминах спектрального радиуса вспомогательного марковского оператора.

Методы исследования

В работе активно использовались методы теории вероятностей, случайных процессов и функционального анализа. Применялись метод каплинга, техника сжимающих отображений, метод Хайрера-Маттингли, неравенство Пинскера, неравенство Харнака, метрики полной вариации, Леви-Прохорова и Васерштейна, а также центральная предельная теорема для стационарных процессов с различными условиями перемешивания.

Теоретическая и практическая ценность

Диссертация носит теоретический характер. В ней предложен новый единообразный подход к оцениванию скорости сходимости распределений марковских процессов в метрике Васерштейна. Этот подход может быть применен для изучения асимптотического поведения различных процессов: решений СФДУ, решений стохастических уравнений в частных производных, марковских процессов с переключением.

Также полученные результаты могут использоваться для оценки погрешности и времени работы алгоритмов МСМС.

Аппробация работы

По теме диссертации были сделаны доклады на следующих семинарах:

• Большом семинаре кафедры теории вероятностей под рук. академика РАН А.Н. Ширяева (мехмат МГУ, 2012);

• семинаре «Асимптотический анализ случайных процессов и полей» под рук. профессора A.B. Булинского и доцента А.П. Шашкина (мехмат МГУ, 2010-2013);

• Городском семинаре по теории вероятностей под рук. академика РАН И.А. Ибрагимова (ПОМИ РАН, 2013);

• семинаре отдела дискретной математики МИАН под рук. профессора A.M. Зубкова (2010);

• северобританском семинаре по теории вероятностей под рук. профессора И. Дьёндь (университет Эдинбурга, 2013);

• вероятностном семинаре университета Стратклайда под рук. профессора X. Мао (Глазго, 2013);

• вероятностном семинаре университета Хериот-Ватт под рук. профессора С.Г. Фосса (Эдинбург, 2013);

• семинаре «Теория вероятностей» исследовательской лаборатории им. П.Л. Чебышева под рук. доцента В.В. Высоцкого и доцента Е.Ю. Шми-левой (СПбГУ, 2012).

Также основные результаты диссертации докладывались на следующих международных конференциях:

• "2nd Northern Triangular 8егшпаг"(Стокгольм, Швеция, 2010);

• "Visions in Stochastics: Leaders and their Pupils" (Москва, 2010);

• «Ломоносов-2011» (Москва, 2011);

• "3rd Northern Triangular Seminar" (Санкт-Петербург, 2011);

• "Stochastic Analysis, Modelling and Simulation of Complex Structures" (Ульм, Германия, 2011);

• "Modern Stochastics: Theory and Applications IH" (Киев, Украина, 2012). Работа автора поддержана грантами РФФИ 10-01-00397а и 13-01-00612а. Публикации

Результаты диссертации опубликованы в 8 работах (в том числе 4 статьи в журналах, рекомендованных ВАК), список которых приведен в конце автореферата. Работы [3] и [4] опубликованы в журналах, удовлетворяющих достаточному условию включения в перечень ВАК. А именно, эти журналы ("The Annals of Applied Probability" и "Stochastic Processes and their Applications") входят в систему цитирования Web of Science.

Структура диссертации

Диссертация состоит из введения, трех глав и списка литературы, насчитывающего 88 наименований. Общий объем диссертации составляет 105 страниц.

Краткое содержание диссертации

Для того чтобы описать выполненное исследование, введем необходимые обозначения. Будем предполагать, что все случайные объекты рассматриваются на некотором вероятностном пространстве (fi, Т, Р). Пусть X = (^п)пет, где Т= Z+ или Т= R+, — это однородный марковский процесс (с дискретным или непрерывным временем), принимающий значений в измеримом пространстве (Е,£). Введем переходные функции Р*(х,А) Px(Xt € А), где х е Е, А € £, t € Т. Как обычно, для t — 1 мы будем опускать верхний индекс и писать Р{х,А).

Пусть V(E) — это множество всех вероятностных мер на (Е, £). Введем марковские переходные операторы стандартным образом. А именно, для переходного ядра Р: Е х £ —> [0,1], измеримой функции /: вероятностной меры /I G V(E) положим

Pf (*)•■= [ /(f) Р(х, dt); Pß(dx) := f P(t,dx) fx(dt).

Je Je

Кроме того, определим fi(f) := fE f(x) ß(dx).

Говорят, что мера 7г € V(E) является инвариантной для процесса X, если Рь7Г = 7г при любом t е Т.

В диссертации изучаются достаточные условия, при которых марковский процесс X имеет единственную инвариантную меру 7Г. Также исследуется скорость сходимости p(La.w(Xt), 7г) к 0 при t оо для различных вероятностных метрик р. Напомним, что Law(£) обозначает распределение случайного элемента

Определение 1.2.1. Множество А £ £ называется малым для марковской переходной функции (ядра) Р, если существует такое е > 0, что для всех х,уеА

^ 1-е,

где расстояние по вариации dxv между вероятностными мерами ¡х, v £ V(E) определяется формулой

dTV(fi,u)--2 sup \ц(А) - v{A))I, fi,ueV{E).

АеВ(Е)

Примером малого множества является, например, любое одноэлементное подмножество Е.

Пусть на пространстве Е задана метрика d. Напомним, что расстояние Васерштейна (Монжа-Канторовича-Рубинштейна) Wd между вероятностными мерами (л,, v £ V(E) определяется следующим образом:

Wd(n, и) := inf / d{x,y)\(dx,dy),

xe)C(ß,v) Jexe

здесь fC(n, v) — это множество всех вероятностных мер на (Е х Е, £ ® £) с проекциями ц и v.

Отметим, что если пространство Е снабжено дискретной метрикой dQ(x,y) := I(z ^ у), х,у € Е, то Wdo{fi,u) = dTV{ß,v)l2 для е V{E). Всюду 1(Л) обозначает индикатор множества А.

Перейдем теперь к рассмотрению содержания диссертации. Во введении дается обзор литературы, относящейся к скорости сходимости маргинальных распределений марковских процессов к инвариантной мере, приводится краткий обзор основных результатов, а также описывается структура диссертации и взаимосвязь различных глав.

В первой главе изучаются марковские процессы, которые имеют единственную инвариантную меру и сходятся к ней слабо, но не по вариации. Как обсуждается в параграфе 1.3, различные марковские процессы с бесконечномерным пространством состояний обладают именно такими свойствами. К этим процессам относятся, например, сильные решения многих СФДУ.

Как подробно объяснено в параграфе 1.1, для таких процессов имеет смысл рассматривать сходимость маргинальных распределений именно в метрике Васерштейна. При этом стандартные методы5,17,18 исследования скорости сходимости в метрике полной вариации не могут быть применены непосредственно. Это связано с тем, что такие методы существенным образом используют неразложимость марковского процесса, локальную компактность пространства состояний и опираются на анализ малых множеств переходного ядра. Однако если пространство состояний бесконечномерно, то в большинстве типичных ситуаций марковский процесс не является неразложимым, пространство состояний не локально компактно, а все малые множества процесса могут быть вырожденными, т.е. состоять не более чем из одного элемента. Поэтому для изучения сходимости в метрике Васерштейна автором был предложен новый способ, развивающий идеи М. Хайрера, Дж.К. Маттингли и М. Шётцова19.

Нам понадобятся также следующие определения.

Определение 1.2.2. Множество А £ £ называется d-малым для марковского переходного ядра Р, если существует такое £ > 0, что

Wd{P(xf-),P(y,-))^(l-e)d(x,y), х,у & А. (1)

Отметим, что наше определение d-малого множества (предложенное в работе автора [3]) отличается от определения19, так как в правой части неравенства (1) присутствует множитель d(x,y).

17Р. Tuominen, R.L. Tweedie (1994). Subgeometric rates of convergence of /-ergodic Markov chains. Adv. Appl. Prob. 20 775-798.

lsR. Doue, G. Fort, A. Guillin (2009). Subgeometric rates of convergence of f-ergodic strong Markov processes. Stoch. Process. Appl. 119 897-923.

19M. Hairer, J.С. Mattingly, M. Scheutzow (2011). Asymptotic coupling and a general form of Harris' theorem with applications to stochastic delay equations. Prob. Theory Ret. Fields 149 223-259.

В частном случае, когда й(х,у) — 1(х ф у), понятия малого множества и ¿-малого множества совпадают. В общем же случае, неравенству (1) удовлетворяет более широкий класс объектов. Можно привести пример переходного ядра С? (пример 1.3.1 диссертации), которое не имеет ни одного нетривиального малого множества, однако при этом любое измеримое множество является ¿-малым для

Определение 1.2.3. Говорят, что измеримая функция У: Е —> [0, оо) является функцией Ляпунова для переходного ядра Р, если существуют неограниченная вогнутая дифференцируемая функция <р: К+ —» М+ с <р(0) = 0 и постоянная К ^ 0 такие, что

Перед тем как мы перейдем к основной теореме главы 1, напомним, что метрика полной вариации является нерасжимающей. А именно, для каждой марковской полугруппы (Рг)^о и любых 0 ^ в ^ í справедливо неравенство

Метрика Васерштейна Ивообще говоря, не обязана быть нерасжимающей. Однако, как подробно объяснено в работе19, естественно рассматривать только такие метрики Васерштейна, которые являются нерасжимающими для процесса X. Действительно, в общем случае, условие Ляпунова недостаточно даже для слабой сходимости распределений марковской цепи к инвариантной мере. Отметим еще раз, что условие нерасжимаемости само по себе также не влечет сходимость маргинальных распределений. Именно сочетание нерасжимаемости и условия Ляпунова, а также существование "хорошего" ¿-малого множества обеспечивает существование и единственность инвариантной меры процесса и субгеометрическую сходимость его маргинальных распределений в метрике Васерштейна.

Определим для функции /: М+ —»• (0, оо)

Так как Н} возрастающая, то обратная функция Щ1 определена корректно. Основным результатом главы 1 является следующая теорема, описывающая предельное поведение марковских процессов с дискретным временем.

Теорема 1.2.1. Пусть пространство (Е, ¿) является польским, £ совпадает с борелевской а-алгеброй В(Е), а метрика ¿ нерасжимающая и ограниченная единицей, т.е.

РУ ^У-<роУ + К.

(2)

йту{Р\х, ■), Р\у, ■)) < ¿гу(Р5(х, •). Р\У, 0). у е Е.

\Ул(Р(х, •), Р(у, •)) < <*(*, у) < 1, х, у € Е.

Предположим, что существует функция Ляпунова V, удовлетворяющая (2). Пусть также нижнее множество уровня {х € Е : У{х) ^ Л} является ¿-малым для марковского ядра Р при некотором Я > ¡р~1(2К). Тогда процесс X имеет единственную инвариантную меру ж и

Более того, для любого е > 0 найдутся постоянные С\ > О и С% > О такие, что при всех х е Е

Отметим, что на практике вычисление функции Н~1, фигурирующей в (3), и получение явных оценок скорости сходимости для различных функций <р обычно не представляет трудности. Конкретные примеры таких вычислений могут быть найдены в статье20.

Теперь перейдем к теореме, аналогичной теореме 1.2.1 для марковских процессов с непрерывным временем. Пусть X = (Х^^о ~ это однородный строго марковский процесс, а о — связанная с ним марковская полугруппа. Напомним, (см., например, монографик?, стр. 144) что если марковский процесс имеет траектории, то строго марковское свойство вытекает из феллеровского свойства. Нам потребуется следующее понятие (обобщение определения 1.2.3 для процессов с непрерывным временем).

Определение 1.2.4. Говорят, что измеримая функция V: Е —> [0, оо) является функцией Ляпунова для марковской полугруппы (Р«)г>сь если существуют неограниченная вогнутая дифференцируемая функция : М+ —> К.+ с <р(0) = 0 и постоянная К ^ 0 такие, что для любого t ^ О

Пусть L — это расширенный производящий оператор марковского процесса X (см., например, книгу21, стр. 285). Тогда неравенство (4) выполняется, если функция V принадлежит области определения L и

LV < -tp о V + К,

где К > О, а <р : Ж+ —^ IL)- — это неограниченная вогнутая дифференцируемая функция, имеющая <р(0) = 0.

20R. Doue, G. Fort, E. Moulines, P. Soulier (2004). Practical drift conditions for subgeometric rates of convergence. Ann. Appl Probab. 14 1353-1377.

21D. Revuz, M. Yor (1999). Continuous Martingales and Brownian motion, 3rd Edn. Comprehensive Studies in Mathematics, 293. N.Y.: Springer.

Wd(Pn(x,.),7r) <

(3)

Теорема 1.2.4. Пусть пространство (E,d) является польским, £ = ¡3(E), а метрика d ограничена единицей и является нерастягивающей при всех t^ to для некоторого to ^ 0, т.е.

Wd{P\x, ■), Р\у, •)) < d{x, у) < 1, x,yeE,t^t0.

Предположим, что существует функция Ляпунова V, удовлетворяющая (4). Пусть также нижнее множество уровня {х G Е : V{x) < R} является d-малым для марковского ядра Р1 для всех t ^ to и любого R > 0.

Тогда процесс X имеет единственную инвариантную меру 7Г, при этом n(tpoV) ^ К. Более того, для любого е > 0 найдутся постоянные С\ > 0 и Сг > 0 такие, что для всех х S Е

•■WW)S,>0- (5)

Некоторые частные случаи теорем 1.2.1 и 1.2.4 рассматривались ранее. Например, если <р(х) = Хх, где А > 0, то оценки скорости сходимости, полученные в статье19, следуют из (3) и (5). В случае если метрика d дискретна, т.е. d = do, то из (3) и (5) вытекают оценки, установленные в работах18'20'22. Итак, теоремы 1.2.1 и 1.2.4 обобщают соответствующие результаты, полученные в указанных статьях.

Наряду со сходимостью мер в метрике Васерштейна Wd, изучают также сходимость мер в метрике Леви-Прохорова ра- Эта метрика для вероятностных мер fi, v, заданных на польском пространстве (E,d), определяется следующим образом

pd(n, и) := inf {£ > 0: P(d(£, 77) > е) < е}.

Law({)=^ rj: Law(f])=v

При этом, если метрика d ограничена (а именно такой случай изучается в теоремах данной главы), то, как не трудно видеть, метрики Васерштейна и Леви-Прохорова эквивалентны:

pd(ß, v)1'2 < Wd(ß, + 1 Ы/i, и), V(E).

Здесь В := supx yGEd(x,y). Поэтому оценка скорости сходимости в одной из этих метрик влечет явную оценку скорости сходимости в другой метрике. Таким образом, полученные нами оценки (3) и (5) могут быть переформулированы в терминах метрики Леви-Прохорова.

Во второй части главы 1 установленные теоремы применяются для получения оценок скорости сходимости сильных решений СФДУ. В этой связи

22S. Jarner, G. Roberts (2002). Polynomial convergence rates of Markov chains. Ann. Appl. Probat. 12 224-247.

напомним, что свойства инвариантной меры решений СДУ исследовались в работах Р.З. Хасьминского, Н.В. Крылова, А.Ю. Веретенникова, В.И. Бо-гачева, М. Рёкнера, Ф.-Ю. Ванга, C.B. Шапошникова, А. Гуйэна и других ученых. Укажем на обзор23, содержащий обширную библиографию. К настоящему времени получены различные достаточные условия существования и единственности инвариантной меры, изучены ее свойства, а также при широких предположениях установлена скорость сходимости к ней маргинальных распределений решений СДУ в метрике полной вариации.

Получению достаточных условий существования и единственности инвариантной меры решений СФДУ посвящены работы19,24'25. Скорость сходимости распределений решений СФДУ к инвариантной мере изучена менее. Это связано с тем, что решение СФДУ — это марковский процесс, принимающий значения в бесконечномерном не локально компактном пространстве. Кроме того, как обсуждается в статье19, во многих интересных случаях маргинальные распределения решений СФДУ сходятся слабо, но не по вариации.

Зафиксируем г > 0, n,m G N, и пусть С= С([—г, 0],®.™) — это пространство непрерывных функций на [—г, 0] со значениями в К", снабженное равномерной нормой II • II. Как и в работе19, введем следующее семейство метрик на пространстве С:

dß(x,y) = lA(\\x-y\\/ß), ß >0.

Рассмотрим стохастическое уравнение с запаздыванием

Г dX(t) = f(Xt) dt + g(Xt) dW(t), t > 0, . .

\X0 = x, W

где f:C—¥ Mn, g: С —ï Mnxm, W — это m-мерное броуновское движение, х € С — начальное условие, и, как обычно, мы используем обозначение Xt(s) := X(t + s), —г < s ^ 0. При этом понятно, что процесс X = (Xt)t^o> принимающий, при каждом t ^ 0 значения в пространстве (С, В (С)), является марковским.

Подчеркнем, что в уравнении (6) записи X(t) и Xt несут разный смысл. А именно, X(t) — это случайная величина, в то время как Xt — это случайный элемент со значениями в пространстве С.

Обозначим J Л/1 норму Фробениуса матрицы М, т.е. |||М||2 = 2 My. Будем предполагать, что для коэффициентов сноса и диффузии выполнены следующие условия:

гзВ.И. Богачев, Н.В. Крылов, М. Рёкнер (2009). Эллиптические и параболические уравнения для мер. Успехи матем. наук. 64 5-116.

24A.A. Gushchin, и. Küchler. (2000). On stationary solutions of delay differential equations driven by a Lévy process. Stock. Process. Appt. 88195-211.

25Yu.Yu. Bakhtin, J. Mattingly (2005). Stationary solutions of stochastic differential equations with memory and stochastic partial differential equations. Commun. Contemp. Math. 7 553-582.

• снос удовлетворяет одностороннему условию Липшица, а диффузия — липшицева, т.е. существует такое L > 0, что для всех х,у £ С

2{f(x)-f(y),x(0)-ym++Mx)-9(y)\l2<L\\x-y\\2; (7)

• / непрерывна и ограничена на ограниченных подмножествах С; (8)

• диффузия ограничена, т.е. sup||g(a;)| < оо; (9)

хес

• диффузия невырождена, т.е. для любого а: € С у матрицы д(х) существует правая обратная матрица д~1{х) и

sup Iff"1 (х) III <00. (10)

хес

Здесь (■, •) обозначает стандартное скалярное произведение в Rn. Для действительного b мы пишем Ь+ := шах(Ь, 0). Определим также

/ / N т, N «(0) v(0) \ » Trg(v)gT(v)

А+ = sup (g(v)gT(vЫ^т, r-Ш, Л = sup >у '. vec |и(0)| |и(0)|' V£c п

Будем говорить, что функция h: С —> М" удовлетворяет обобщенному условию Веретенникова-Хасъминского, если найдутся такие а€ [0,1], М > 0 и х > 0, что

(h{x),x{0)) -x\x(fi)\a, х е С, |ж(0)| > М. (11)

Теорема 1.3.2. Пусть выполнены условия (7)-(10). Предположим, что коэффициент сноса может быть разложен на два слагаемых:

№ = Мх) + Мх(о)), хес, (12)

причем функция f\ в разложении (12) ограничена. Предположим также, что коэффициент сноса f удовлетворяет (11) для некоторого а € (0,1]. Тогда сильное решение СФДУ (6) имеет единственную инвариантную меру 7г и Law(Xt) сходится к-к в метрике Васерштейна Wds субэкспоненциально (при 0 < а < 1) или экспоненциально (при а = 1). Другими словами, для любого ¡3 > 0 существуют положительные константы С\ и такие, что

Wd0(P\x, .),0 ^ Ci ехр{Сг\\х\\а - C2ta^)}, х € С, t > 0.

Если же (11) выполнено с а = 0 и х > пЛ/2, то сильное решение СФДУ (6) имеет единственную инвариантную меру к, однако Law(Xt) сходится к 7г в метрике Васерштейна Wdp лишь полиномиально, т.е. для любых/3 > О и е > 0 существует С > 0 такое, что

Wd9{P\x, •), тг) < С{1 + ||х||2+2*°)Г*°+£, x<=C,t> 0,

где xq = (х — пА/2)А+1.

Полученная теорема обобщает результаты18,26,27.

Во второй главе исследуются свойства нелинейных марковских процессов с дискретным и непрерывным временем. Как отмечалось выше, данный класс процессов может иметь необычные эргодические свойства. Например, если пространство Е состояний конечно, то по аналогии с "классическими" однородными марковскими цепями можно было бы считать, что положительность элементов матрицы переходных (за один шаг) вероятностей обеспечивает сходимость к единственному стационарному распределению. Однако для нелинейных марковских процессов это уже не так, как показывает пример 2.1.1, приводимый далее.

Пусть X = (X£)nsZ+ — это нелинейный марковский процесс с пространством состояний (Е,£), начальным распределением Lscw(Xq) = ¡iy /л S V(E), и переходными вероятностями

Р{Х^+1еВ\ХЦ = х)=Р,п(х,В),

где х € Е, В е £, ть 6 Z+ и /in := Law(-X£). Отметим, что если функция Р„(х, В) не зависит от меры v, то процесс X является марковским (в этом случае переходную вероятность процесса^ будем обозначать Р(х,В), опуская аргумент и).

Напомним, что процесс X называется равномерно эргодическим, если у него существует стационарное распределение тт и для некоторых констант С > 0, в > 0 и всех n€Z+ выполнено соотношение

sup drvifj-n, т) < Се~вп. цеР(Е)

Если процесс X — марковский, то достаточным условием для существования и единственности стационарной меры, а также равномерной эргодичности является условие Добрушина. Оно состоит в следующем: найдется а > О такое, что

sup dTV(P(x, ■),Р(у, •)) < 2(1 - а). (13)

х,уеЕ

Другими словами, это условие означает, что все пространство состояний мало. Для произвольных ¿í, V € V(E) условие (13) также гарантирует экспоненциальную скорость сходимости:

dTv{v„, vn) < 2(1 - а)", п е Z+. (14)

Естественным аналогом условия (13) для нелинейных марковских процессов является следующее требование: существует а > 0 такое, что

sup sup йту{Р^х, ■), РЛУ, О) < 2(1 - а). (15)

fi,vsP(E) х.уеЕ

2вА.Ю. Веретенников (1987). Об оценках скорости перемешивания для стохастических уравнений. Теория вероятн. и ее примен. 32 299-308.

27А.Ю. Веретенников (2000). О полиномиальном перемешивании и скорости сходимости для стохастических дифференциальных и разностных уравнений. Теория вероятн. и ее примен. 44 312-327.

Однако оказывается, что в отличие от марковского случая, при любом О < а < 1 данное ограничение может быть недостаточным даже для слабой сходимости fin к стационарной мере. Приведем соответствующий пример.

Пример 2.1.1. Пусть X — это нелинейная марковская цепь, принимающая значения в измеримом пространстве (Е,£) = ({1,Предположим, что матрица переходных (за один шаг) вероятностей имеет вид

р = />({2}) А (1 - 7/2)) V 7/2 (КШ) А (1 - 7/2)) V 7/2\ " V(K{2})A(l-7/2))v7/2 (К{1}) А (1 — 7/2)) V 7/2/ '

где 0 < 7 < 1 — некоторый параметр. Данная марковская цепь удовлетворяет условию (15) с а = 7 и имеет стационарное распределение тт = (¿i + <5г)/2. С другой стороны, при любом а € [7/2,1 — 7/2], а ф 1/2, и начальном распределении /¿о(а) := а5\ + (1 — а)52 мера цп = /хп(а) не сходится к 7г при п —» оо.

Итак, для нелинейных процессов условие Добрушина не гарантирует равномерную эргодичность (и, более того, не гарантирует даже существование инвариантной меры, как демонстрируется далее). Покажем теперь, как можно дополнить это условие оптимальным образом так, чтобы новое условие уже являлось достаточным для равномерной эргодичности. Следующее утверждение является основным результатом главы 2.

Теорема 2.1.1. Пусть процесс X удовлетворяет условию (15) для некоторого а > 0.

(г) Если при этом существует A G [0, а] такое, что для д, v е V{E) и х € Е выполнено неравенство

dTV{Pli{x, •), Р„(х, •)) ^ Adzv(/x, f). (16)

то у процесса X существует единственная инвариантная мера 7Г. Кроме того, если А < а, то

drv&n, тг) ^ 2(1 - (« - Л))", П е Z+. (17)

В случае А = а имеем d,Tv(fJ-n, т) < 2/(Лп), п 6 Z+.

(гг) Ограничение Л ^ а в условии (16) оптимально. А именно, для любых 0 < а < А < 1 существуют процессы X = (Xn)neZ+, У — (Yn)neZ+ и Z — (Zn)n€z удовлетворяющие условиям (15) и (16), а также мера /х € V(E), для которых верны утверждения: процесс X имеет более одной стационарной меры, процесс У не имеет ни одной стационарной меры, drv(,Z^,ir) -fa 0 при n-ï 00.

Если процесс X является марковским, то условие (15) совпадает с условием (13), а условие (16) выполнено автоматически, если выбрать Л = 0. При этом скорость сходимости, описываемая формулой (17), совпадает с соответствующей скоростью сходимости для марковских процессов, как показывает (14). Таким образом, теорема 2.1.1 расширяет классический результат Доб-рушина28.

Интересно отметить, что в главе 1 изучались марковские процессы, для которых условие Добрушина является слишком сильным. При этом обсуждалось, как можно его ослабить (рассматривать d-малые множества вместо малых). Однако для нелинейных марковских процессов, исследуемых в главе 2, условие Добрушина является слишком слабым (т.к. не обеспечивает даже существование инвариантной меры) и необходимо усиливать это условие.

Во второй половине главы 2 исследуются эргодические свойства стохастических УВМ. Напомним, что УВМ — это стохастическое дифференциальное уравнение, в котором коэффициенты сноса и диффузии могут зависеть от текущего распределения процесса. Поэтому ему соответствует нелинейное уравнение Колмогорова-Фоккера-Планка. Нами получены явные оценки скорости сходимости распределений сильных решений УВМ в метрике полной вариации.

Наконец, в третьей главе с помощью новой модификации каплинга Вас-серштейна находятся достаточные условия для равномерной эргодичности однородной марковской цепи. Эти условия выражены в терминах спектрального радиуса вспомогательного оператора. Напомним, что метод каплинга для изучения эргодических свойств марковских цепей был предложен В. Дёб-линым29. В дальнейшем этот метод получил развитие в работах Дж. Дуба, Л.Н. Васерштейна, Дж. Питмана, Д. Гриффитса, Е. Нумеллииа, Г. Ториссо-на, Т. Линдвалла и других ученых. Дж. Питман и Д. Гриффите предложили также различные конструкции максимального каплинга, являющегося оптимальным в некотором смысле. Однако, как показано в статье30, никакая конструкция максимального каплинга не может быть марковской. Это существенно усложняет получение оценок скорости сходимости. С другой стороны, в работе Л.Н. Васерштейна31 была предложена марковская конструкция каплинга, близкого к оптимальному. Им рассматривались процессы со счетным пространством состояний.

Мы модифицируем подход Васерштейна и применяем его идеи к процессам, имеющим произвольное пространство состояний. Это позволяет нам най-

28Р.Л. добрушин (1956). Центральная предельная теорема для неоднородных цепей Маркова I. Теория вероятн. и ее примен. 1 72—89.

29W. Doeblin (1938). Exposé de la théorie des chaínes simples constantes de Markov á un nombre fini d'états. Rev. Math. Union Interbalkanique. 2 77-105.

30D. Griffeath (1975). A maximal coupling for Markov chains. Z. Wahrsch. Verui. Gebiete. 31 95—106.

31Л.Н. Васерштейн (1969). Марковские процессы на счетном произведении пространств, описывающие большие системы автоматов. Пробл. передачи информ. 5 64-72.

ти новые достаточные условия равномерной эргодичности марковского процесса.

Предположим, что для каждого х € Е переходное ядро Р имеет плотность относительно некоторой и-конечной меры Л, т.е.

Р(х,А) = j p{x,v)A(dv), Ае£.

Пусть функция р(х, v) измерима по паре аргументов. Для u,v € Е определим

q(u,v) ~dTv{P(u, -),P{v,-))/2.

Введем новую марковскую цепь (т]п)пеп — (Vn¡ Vn)neN с пространством состояний ЕхЕ. Зададим переходное ядро Ф этой марковской цепи следующим образом:

Ф(х,А) := J <pi(x,yi)<p2(x,y2)A{dy1)A(dy2),

где х е Е2, А е £2, х = (ж1, а;2) и

<Pi(x,u) := q(xl,x*)~l (р(х\и)-р(х1,и) Лр(х2,и)), ip2(x,u) := qix1^2)'1 (p(x2,u) -p(x1,u) Ap{x2,u)) .

Рассмотрим оператор А : Lx —> Lж, для которого

Af(x) :=q(x)Exf(m).

Здесь Loo = Loo(E2, £2, А x Л). Пусть r(A) — спектральный радиус оператора А. Основной результат главы 3 формулируется следующим образом.

Теорема 3.1.4. Оператор А имеет спектральный радиус г (А) ^ 1. Если же г(А) ф 1, то процесс X имеет единственную инвариантную меру ж. Более того, в этом случае для любого е > 0 найдется положительная константа С такая, что для любого х € Е верно неравенство

dTV(Pn(x, *), 7г) ^ Ce""!'"WK1"8), п е Z+.

Автор очень благодарен научному руководителю профессору Александру Вадимовичу Вулинскому и профессору Александру Юрьевичу Веретеннико-ву за постановку задач, помощь в работе, многолетнюю поддержку, ценные советы и неизменное внимание, а также профессору Алексею Михайловичу Кулику и доценту Алексею Павловичу Шашкину за полезные обсуждения.

Работы автора по теме диссертации

[1] О.А. Бутковский. О сходимости нелинейных марковских цепей. ДАН". Математика, 447:5, 2012, стр. 483-485.

[2] О.А. Бутковский. Предельное поведение критического ветвящегося процесса с иммиграцией. Матем. заметки, 92:5, 2012, стр. 670-677.

[3] О.А. Butkovsky. Subgeometric rates of convergence of Markov processes in the Wasserstein metric. The Annals of Applied Probability, 2013, 28 p. Available online at www.imstat.org/aap/future_papers.html.

[4] O.A.Butkovsky, A.Yu. Veretennikov. On asymptotics for Vaserstein coupling of Markov chains. Stochastic Processes and their Applications, 2013, 24 p. doi:10.1016/j.spa.2013.04.016

В этой работе А.Ю. Веретенникову принадлежат постановка задач, лемма 2.1, подход к доказательству теоремы 2.1 и предложения 2.1, а также идея примера 3.4. Остальные результаты (лемма 2.2, реализация доказательства теоремы 2.1, теоремы 2.2 и 2.3, а также теоремы 3.1-3.3 принадлежат диссертанту).

[5] О.А. Butkovsky. On ergodic properties of nonlinear Markov chains. Abstracts of Communications of the Int. conference "Modern Stochastics: Theory and Applications III", 2012, p. 37-38.

[6] O.A. Butkovsky. Coupling method for strongly ergodic Markov processes. Abstracts of Communications of the Int. conference "Stochastic Analysis, Modelling and Simulation of Complex Structures", 2011, p. 32.

[7] O.A. Butkovsky. Coupling method for estimating beta-mixing coefficients of Markov processes. Abstracts of Communications of the 3rd Northern Triangular Seminar, 2011, p. 6-7.

[8] O.A. Бутковский. Асимптотическая оценка расстояния по вариации между однородными марковскими процессами. Тезисы докладов секции "Математика и механика" конференции "Ломоносов-2010", Москва, 2010, стр. 1.

Отпечатано в отделе оперативной печати Геологического ф-та МГУ Тираж ¡¿% экз. Заказ X» (9

 
Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Бутковский, Олег Александрович, Москва

Московский государственный университет имени М.В.Ломоносова механико-математический факультет

на правах рукописи УДК 519.21

04201357622

Бутковский Олег Александрович

Предельные теоремы для марковских процессов

01.01.05 теория вероятностей и математическая статистика

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата физико-математических наук

Научный руководитель: доктор физ.-мат. наук, профессор А.В.Булинский

Москва 2013

Оглавление

Введение 4

1 Сходимость маргинальных распределений марковских процессов в метрике Васерштейна 11

1.1 Мотивация ..............................11

1.2 Оценки скорости сходимости для процессов с дискретным и непрерывным временем.......................15

1.3 Примеры и приложения.......................20

1.3.1 Модель авторегрессии....................21

1.3.2 Стохастические уравнения с запаздыванием .......22

1.4 Доказательства теорем 1.2.1 и 1.2.4 ................27

2 Сходимость маргинальных распределений нелинейных марковских процессов 44

2.1 Сходимость распределений нелинейных марковских цепей ... 44

2.2 Уравнение Власова-Маккина с малым возмущением.......48

2.3 Доказательства теорем 2.1.1 и 2.2.1 ................50

2.4 Севастьямовский ветвящийся процесс с иммиграцией......63

3 Сильная и слабая эргодичность марковских цепей 70

3.1 Построение каплинга и достаточные условия эргодичности ... 71

3.1.1 Модификация каплинга Васерштейна...........71

3.1.2 Достаточные условия эргодичности ............74

3.2 Примеры и приложения.......................77

3.3 Доказательства............................81

3.3.1 Построение каплинга.....................81

3.3.2 Установление основных теорем третьей главы ......84

Список основных обозначений

:= "положить по определению"; N множество натуральных чисел; Z - множество целых чисел;

множество целых неотрицательных чисел; К множество действительных чисел;

множество действительных неотрицательных чисел; 1(А) - индикатор множества А; 6Х дельта мера, сосредоточенная в точке х\

В(Е) а-алгебра борелевских подмножеств метрического пространства

Т(Е) множество всех вероятностных мер на (Е, В{Е) )\

Т/(Е) множество вероятностных мер на {Е) В(Е)). интегрирующих

неотрицательную измеримую функцию /;

а А Ь = тт(о, 6), а V Ь = тах(а, 6), а+ = а V 0, где а, Ь е М;

{а}, [а], [а] соответственно дробная часть, нижняя целая часть и верхняя

целая часть действительного числа а;

(•, •} стандартное скалярное произведение в М";

г1ту{цм), с1]([1.1у), У/^р^и) расстояния между вероятностными мерами ц и и соответственно в метриках полной вариации, взвешенной полной вариации и Васерштейна;

(О. Т. Р) вероятностное пространство;

Ьал¥р(Х) распределение случайной величины X по мере Р; X = У равенство по распределению случайных величин X и У; Рг{х,А) переходная функция однородного марковского процесса;

Введение

Марковские процессы играют важную роль в современной теории вероятностей. Модели, описываемые с помощью марковских процессов, находят применив в различных задачах физики, химии, биологии, финансовой математики. Эти процессы были введены A.A. Марковым [18, 19], а основы теории марковских процессов были заложены А.Н. Колмогоровым в статье [62]. В дальнейшем марковские процессы изучались в работах В. Деблина, Дж. Дуба, P.J1. Добрушина, Т. Харриса, Е.Б. Дынкипа, A.A. Юшкевича, JI.H. Васерштейпа, Р.З. Хасъминского, Д. Алдоуса, Е. Нуммелина, П. Туоми-нена, Ш. Мейиа, Р. Твиди, П. Диакониса, Э. Мулина, А.Ю. Веретенникова, Г. Робертса, М. Хайрера, Дж. Матипгли, Ю. Переса и многих других ученых. Упомянем здесь также классические и современные монографии, посвященные марковским процесам: [13, 14, 25, 65, 68].

Традиционными примерами марковских процессов являются броуновское движение (вииеровский процесс) и иуассоповский процесс. К ним также относятся решения стохастических дифференциальных уравнений, процессы Jle-ви, процессы рождения-гибели и многие другие.

Известно, что при широких предположениях, см., например, [3. 4, 26], марковский процесс имеет единственную инвариантную меру и слабо сходится к ней. Изучение скорости сходимости, маргинальных распределений марковских процессов к этой мере является значительно более сложной задачей. Более того, во многих, казалось бы, "простых'" ситуациях, даже тогда, когда пространство состояний конечно, неизвестны никакие оценки скорости сходимости. Так, во время Санкт-Петербургской летней школы по вероятности и статистической физике (2012) профессором Ю. Пересом был сформулирован целый ряд открытых проблем именно такого рода. В этой связи отметим также недавнюю диссертацию Е. Вил мер [87] под руководством П. Диакониса,

посвященную оценкам скорости сходимости распределений конечной марковской цени специального вида.

Изучение упомянутой скорости сходимости важно не только с теоретической, но и с практической точки зрения, так как подобного рода результаты позволяют оценить погрешность алгоритмов Монте Карло по схеме марковской цепи (Monte Carlo Markov Chain, MCMC). Эти алгоритмы (Метрополиса-Гастингса, Ланжевена, построения выборки но Гиббсу и другие) играют важную роль в вычислительных задачах химии, физики, биологии, информатики, криптографии, см., например, монографию П. Бремо [31], а также обзоры П. Диакониса [39] и Г. Робертса и Дж. Розепталя [80] и ссылки там же.

Настоящая диссертационная работа посвящена, главным образом, получению явных верхних оценок скорости сходимости маргинальных распределений марковских процессов в различных вероятностных метриках. Помимо этого изучается и сходимость таких распределений для процессов, родственных марковским. Большое внимание уделено нелинейным марковским процессам.

Получение соответствующих нижних оценок скорости сходимости также является важной задачей, так как позволяет показать насколько плох может быть тот или иной алгоритм МСМС. Однако это направление исследований находится за рамками данной диссертации. Упомянем здесь только работы [51, раздел 5], [85].

Для того чтобы кратко описать выполненное исследование, введем необходимые обозначения. Пусть задано измеримое пространство (Е,£). Для измеримой функции /: Е —> [0, оо) введем Vf(E) как множество вероятностных мер на (Е,£), которые интегрируют /. Множество всех вероятностных мер, заданных на (Е,£), мы будем обозначать V{E). Если ß Е Vf{E), то определим также /х(/) := fEf{x) ß(dx).

Введем марковские переходные операторы стандартным образом, а именно, для переходного ядра Р: Е х £ —[0,1], измеримой функции ip: Е —> К и вероятностной меры v £ V(E) положим

Р<р(х):= / ip(t)P(x,dt); Pv{dx) := / P{t,dx)v(dt). Je JE

Напомним (см., например, обзор В.И. Богачева и A.B. Колесникова [2, глава 1]), что для полу метрики d па пространстве Е полу расстояние Ва-серштейна, (Мопжа-Канторовича-Рубинштейпа) Wj между вероятностными мерами ¡1, V G V{E) определяется следующим образом:

Wd(ß,v)\= inf / d(x,y)\(dx,dy), хеС(цм) JEXE

где Су) это множество всех вероятностных мер на (Е х Е, Е <g> Е) с проекциями ß и v. Если функция d является метрикой, то и Wd также является метрикой ([2, стр. 11]).

Для вероятностных мер ц, и G Vf(E) и измеримой функции f: Е [0,оо) определим также взвешенное расстояние в метрике полной вариации

df(fi,u) := sup / g(x)(ß(dx) — v(dx)).

о- Ы</ JE

В частности, если функция / тождественно равна 1, то взвешенное расстояние в метрике полной вариации совпадает с обычным расстоянием в метрике полной вариации, которое мы будем обозначать djv-

drv(p,v) :=2 sup \ц(А) - v(A))\, eV(E).

АеВ(Е)

Отметим также, что если пространство Е снабжено дискретной метрикой do(x,y) := 1(ж -ф у), х.у G Е, то расстояние Васерштейиа равно половине расстояния в метрике полной вариации, т.е. Wd0(ß, ъ>) — dTv{ß,v)/2 для ^ueV(E).

Будем предполагать, что все случайные объекты рассматриваются на некотором вероятностном пространстве (О,^7, Р). Пусть X = (Хп)пец\ ОДе Т = Z+ или Т = М+, это однородный марковский процесс (с дискретным или непрерывным временем), заданный на измеримом пространстве (Е, Е), с переходными функциями Pt(x.A) := Px(Xt G А), где х G Е, A G Е, t G Т. Как обычно, для t = 1 мы будем опускать верхний индекс и писать Р(х,А).

Говорят, что мера 7Г G V(E) является инвариантной или стлциионарной ([68, стр. 229]) для процесса X, если

Рг7Т = 7Г, t G Т.

Марковский процесс X называется экспоненциально эргодическим ([68, стр. 363]), если у пего существует стационарное распределение7Г и для любого х е Е и некоторых С — С(х) > 0, в > 0 выполнено соотношение

(Ьу(Р\х, •), 7г) < С{х)е~*, г € т. (0.0.1)

Если же функция С в (0.0.1) может быть выбрана не зависящей от ж, то процесс X называют равномерно эргодическим ([68, стр. 393]). Наконец, если вместо (0.0.1) выполнено более слабое соотношение йту{Р*(х, •), 7г) —> 0 при t оо для любого х £ Е, то говорят, что процесс X является слабо эргодическим ([68, стр. 316]).

Перейдем теперь к описанию содержания диссертации. Диссертация, объемом 105 страниц, состоит из введения, трех глав и списка литературы, насчитывающего 88 наименований.

В первой главе изучаются марковские процессы, которые имеют единственную инвариантную меру, слабо сходятся к ней, но не являются эрго-дическими ни в каком смысле. Оказывается, что многие бесконечномерные марковские процессы, например, сильные решения стохастических функциональных дифференциальных уравнений (СФДУ) обладают именно такими свойствами (см. параграф 1.3).

Как подробно объяснено в параграфе 1.1, для таких процессов имеет смысл рассматривать сходимость маргинальных распределений именно в метрике Васерштейна. При этом имеющиеся методы исследования скорости сходимости в метрике полной вариации не могут быть применены непосредственно. Это связано с тем, что эти методы существенным образом используют либо неразложимость марковского процесса ([41, 42, 44, 59, 68]), либо существование спектральной щели в некотором подходящем пространстве ([53]). Поэтому для изучения сходимости в метрике Васерштейна автором был предложен новый способ, развивающий идеи [54]. С его помощью удалось обобщить соответствующие результаты работ [41, 42, 44, 54] и установить явные субгеометрические оценки скорости сходимости распределений марковских процессов в этой метрике.

Во второй части главы 1 установленные теоремы применяются к исследованию эргодических свойств сильных решений СФДУ. Достаточные условия,

гарантирующие, что сильное решение СФДУ имеет единственную инвариантную меру изучались в ряде работ. Упомянем здесь статьи A.A. Гущина [49], М. Шётцова [43], Ю.Ю. Бахтина и Дж. Маттингли [29]. Нами установлены новые оценки скорости сходимости распределений сильных решений СФДУ к единственной инвариантной мере.

Для формулировки полученных результатов напомним следующий факт о предельном поведении распределений1 сильных решений стохастических дифференциальных уравнений (СДУ). Пустьn,meN. Рассмотрим СДУ вШ1

dX(t) = f{X(t))dt + g(X(t))dW(t), (0.0.2)

где /: Жп —> К", д: К" —)• К'!Х"', W это m-мерпое броуновское движение. Пусть коэффициенты сноса / и диффузии д являются линшицевыми. Введем

х / / N Т/ \ v v \ к Ъ-дМдЧу)

Х+ = sup(g(v)g1 {v)—, -г-), А = sup v

уешп \У\ \У\' „ека п

иф о

Будем говорить, что функция /г: Еп —> удовлетворяет условию Вере-тенникова Хасьмииского, если найдутся такие постоянные л £ [0,1], М > 0, г > 0, что

(Ь(х),х) < -ф|а. х е Кп, |ж| ^ М. (0.0.3)

Здесь (•,•) обозначает стандартное скалярное произведение в К77.

Теорема 0.0.1 ([9, 10, 41]). Предположим, что коэффициент диффузии, д СДУ (0.0.2) ограничен и невырожден.

(г) Если коэффициент сноса / удовлетворяет (0.0.3) с а £ (ОД], то сильное решение СДУ (0.0.2) имеет единственную инвариантную меру 7г и является слабо эргодическим. Более того найдутся такие постоянные С\ > 0, С2> 0, что

с1ту(Р*(х, -),тг) ^ Сг1ехр{С1||ж||а - С2^/(2_л))}. х е М", г > 0.

(гг) Если коэффициент сноса / удовлетворяет (0.0.3) с а = 0 и г > пА/2 то сильное решение СДУ (0.0.2) также имеет единственную инвариантную меру 7г и является, слабо эргодическимВ этом, случае Ьа\^'(.Хг) сходится к 7Г лишь полиномиально. А именно, для, любого е > 0 существует

1 Напомним что в дисертации изучаются маргинальные распределения

такое С > 0, что

Фгу(Р*(х, -),7т) < С(1 + ||ж||2+2г0)Г'0+е, х G i > О, где т0 = (г - пА/2)Л+1.

Мы обобщаем данную теорему на случай сильных решений СФДУ. А именно, мы показываем, что если снос и диффузия СФДУ удовлетворяют аналогичным условиям, то распределение сильного решения СФДУ сходится к единственной инвариантной мере в метрике Васерштейна экспоненциально, субэкспоненциально или полиномиально, в зависимости от значения параметра а в (0.0.3).

Во второй главе исследуются свойства нелинейных марковских процессов с дискретным и непрерывным временем. Нелинейные марковские процессы (т.е. процессы, чьи переходные функции зависят не только от текущего состояния процесса, но также и от текущего распределения процесса) были введены Г.П. Маккином [67] в связи с некоторыми задачами статистической механики. В дальнейшем такие процессы изучались в работах целого ряда авторов, упомянем здесь монографии В.Н. Колокольцова [63] и A.C. Шнит-мана [82]. Нелинейные процессы возникают естественным образом при изучении предельного поведения большого числа слабо взаимодействующих друг с другом марковских процессов ([37], [46], [84]) и имеют приложения в различных областях физики и математики (см., например, [45] и ссылки там же).

Как показано в [70] па примере нелинейного случайного блуждания, изучаемый класс процессов может обладать необычными эргодическими свойствами. Так, неразложимая нелинейная марковская цепь может иметь бесконечное число инвариантных мер, что невозможно в случае "классических" однородных марковских цепей (см. [68, предложение 10.1.1 и теорема 10.4.9]).

В диссертации получены достаточные условия для существования и единственности инвариантной меры. Кроме того, установлены оценки скорости сходимости распределений нелинейной марковской цени в метрике полной вариации.

Во второй половине второй главы исследуются эргодические свойства стохастических уравнений Власова-Маккина (УВМ). Напомним, что УВМ это

стохастическое дифференциальное уравнение, в котором коэффициенты сноса и диффузии могут зависеть от текущего распределения процесса. Мы частично переносим утверждение теоремы 0.0.1 на случай таких уравнений и получаем явные оценки скорости сходимости распределений сильных решений УВМ в метрике полной вариации.

В третьей главе с помощью новой модификации каплинга Васерштейна, находятся достаточные условия для равномерной эргодичности однородной марковской цепи. Эти условия выражены в терминах спектрального радиуса вспомогательного оператора. Напомним, что метод каплинга для изучения эргодических свойств марковских цепей был предложен В. Дёблиным [40]. В дальнейшем этот метод получил развитие в работах Дж. Дуба [13], JI.H. Васерштейна [8], Дж. Питмана [75], Д. Гриффитса [48], Е. Нумеллина [71] и других ученых. Дж. Питман и Д. Гриффите предложили также различные конструкции максимального каплинга, являющегося оптимальным в некотором смысле. Однако, как показано в [48], никакая конструкция максимального каплинга не может быть марковской. Это существенно усложняет получение оценок скорости сходимости.. С другой стороны, в работе Васерштейна [8] была предложена марковская конструкция каплинга, близкого к оптимальному.

Мы модифицируем подход Васерштейна и применяем его идеи к процессам, имеющим произвольное пространство состояний. Это позволяет нам найти новые достаточные условия для равномерной эргодичности марковского процесса. При этом оказывается, что скорость убывания в в (0.0.1) связана со спектральным радиусом некоторого оператора полугруппы. Дальнейшая модификация конструкции каплинга позволяет работать также и со слабо эргодическими марковскими процессами и получать оценки, зависящие от начального состояния процесса.

Результаты диссертации докладывались на ряде международных конференций и опубликованы в следующих работах автора: [5]-[7] и [32]-[36].

Благодарности. Автор очень признателен профессору A.B. Булинскому и профессору А.Ю. Веретениикову за постановку задач, помощь в работе, многолетнюю поддержку, ценные советы и неизменное внимание, а также профессору A.M. Кулику и доценту А.П. Шашкипу за полезные обсуждения.

Глава 1

Сходимость маргинальных распределений марковских процессов в метрике Васерштейна

В данной главе исследуется скорость сходимости маргинальных распределений марковских процессов к инвариантной мере в метрике Васерштейна. Глава состоит из четырех параграфов. В первом из них объясняется, почему необходимо рассматривать упомянутую скорость сходимости именно в метрике Васерштейна, а не, скажем, в метрике полной вариации. Основные результаты автора для процессов с дискретным и непрерывным временем содержат теоремы 1.2.1 и 1.2.4. В параграфе 1.3 полученные результаты применяются к оценке скорости сходимости одномерных распределений сильных решений СФДУ. Доказательства теорем 1.2.1 и 1.2.4 даются в параграфе 1.4. Содержание данной главы непосредственно следует работе автора [32].

1.1 Мотивация

Пусть X = (Хп)пет, где Т = Ж+ или Т=М+, это однородный марковский процесс (с дискретным или непрерывным временем), заданный на измеримом пространстве (Е,Е) с переходными функциями Рь(х,А) := Рх{Х1 £ А), где начальное состояние х £ Е. множество А £ Е и t £ Т.

Прежде всего,