Предельные теоремы и оценки скорости сходимости в теории экстремальных значений тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Новак, Сергей Юрьевич
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2014
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
На правах рукописи
Новак Сергей Юрьевич
ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ И ОЦЕНКИ СКОРОСТИ СХОДИМОСТИ В ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗНАЧЕНИЙ
01.01.05 - теория вероятностей и математическая статистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук
. сЬ-Ш
2 О ФЕВ 20Ц
Санкт-Петербург
2013
005545219
005545219
Работа выполнена на кафедре экономики и статистики факультета науки и технологии Мидлсекского университета.
Официальные оппоненты:
Гущин Александр Александрович
доктор физико-математических наук, профессор, ведущий научный сотрудник ФГБУН Математический институт им. В.А. Стеклова Российской академии наук
Невзоров Валерий Борисович
доктор физико-математических наук, профессор, профессор Математико-механического факультета ФГБОУ ВПО «Санкт-Петербургский государственный университет»
Питербарг Владимир Ильич
доктор физико-математических наук, профессор, главный научный сотрудник ФГБОУ ВПО «Московский государственный университет им. М.В. Ломоносова».
Ведущая организация:
ФГБУН Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук.
Защита состоится «_»_2014 г. в «_» часов на заседании диссертационного совета Д 002.202.01 в ФГБУН Санкт-Петербургского отделения Математического института им. В.А. Стеклова Российской академии наук по адресу: 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27, к. 311.
С диссертацией можно ознакомиться в библиотеке ФГБУН Санкт-Петербургское отделение Математического института им. В.А. Стеклова Российской академии наук.
Автореферат разослан «_»_2013 г.
Ученый секретарь
диссертационного совета Д 002.202.01,
доктор физико-математических наук А.Ю. Зайцев
Общая характеристика работы
Актуальность темы. Теория экстремальных значений является одним из наиболее динамично развивающихся разделов теории вероятностей и математической статистики. Её истоком можно считать классическую теорему Пуассона об асимптотике распределения числа редких событий; ряд задач имеет более глубокую историю (см., к примеру, Муавр (1738), Задача ЬХХ1У).
Актуальность исследования асимптотических свойств распределений экстремальных значений связана с приложениями в страховом деле, финансах, метеорологии, гидрологии (см. Эмбрехтс, Клюпельберг, Микош (1997), Бейрлант, Гогебер, Тойгельс, Сегерс (2004)). К примеру, популярной мерой риска, используемой крупнейшими банками, является УаИ (экстремальная квантиль). Задача оценивания вероятности выхода за высокий уровень имеет приложения в страховом деле.
Основы современной теории экстремальных значений заложили в начале 20-го века Мизес (1923, 1936), Фреше (1927), Фишер и Типет (1928), Гнеденко (1943). Работа де Хаана (1970) завершает классический период развития теории, посвященный изучению распределений экстремальных значений в последовательностях независимых одинаково распределённых случайных величин (с.в.).
В то время как классическая теория экстремальных значений имеет дело с последовательностями независимых одинаково распределённых с.в., финансовые приложения часто демонстрируют зависимость наблюдений. Это делает актуальным изучение асимптотических свойств распределений экстремальных значений в стационарных последовательностях случайных величин.
Значительный вклад в развитие теории экстремальных значений для последовательностей стационарно связанных случайных величин внесли Ньюэл (1964) и Лойнес (1965), которые фактически ввели понятие экстремального индекса. Дальнейшее развитие теории связано с работами Бермана (1962), Лидбеттера (1974), О'Брайена (1974, 1987), Мори (1977), Хсина (1987) и др..
Хсин, Хюслер и Лидбеттер (1988) установили, что предельным распределением одномерного эмпирического точечного процесса выходов за высокий уровень, учитывающего местоположение экстремумов, является сложно-пуассоновское распределение. Это связано с тем, что в последовательностях зависимых случайных величин экстремальные значения обычно появляются кластерами.
Мори (1977) показал, что класс распределений общих процессов выходов за высокий уровень в последовательностях стационарно связанных с.в. богаче класса сложно-пуассоновских процессов. Хсин (1987) охарактеризовал предельное распределение общего двумерного процесса выходов за высокий уровень в последовательностях стационарно зависимых случайных величин в терминах двумерных точечных процессов.
Диссертация посвящена исследованию асимптотики распределения случайных величин и процессов, возникающих в теории экстремальных значений для последовательностей стационарно связанных с.в.. Рассматриваются такие задачи, как характеризация класса V предельных распределений общих точечных процессов, возникающих в теории экстремальных значений, оценивание скоро ста сходимости в соответствующих предельных теоремах, статистическое оценивание характеристик распределений, рассмат-
риваемых в теории экстремальных значений, установление нижних границ точности оценивания характеристик распределений с тяжёлыми хвостами.
В диссертации получена характеризация распределений двумерных точечных процессов из класса V в терминах одномерных точечных процессов, описаны свойства распределений из класса V, установлены свойства маргинальных распределений.
Важную роль при изучении асимптотики распределения экстремальных значений играет задача установления оценок скорости сходимости в соответствующих предельных теоремах. Вопрос является нетривиальным даже в случае теоремы Пуассона. Многие известные авторы работали над указанной задачей, в том числе Прохоров (1952), Лекам (1965), Серфлин (1975), Чен (1975), Шоргин (1977), Барбур и Иглсон (1983), Барбур и Холл (1984), Деовельс и Пфайфер (1986, 1988).
Асимптотику расстояния по вариации в теореме Пуассона в случае независимых одинаково распределённых случайных величин установил Прохоров (1952). Роос (2001) получил оценку точности пуассоновской аппроксимации в терминах расстояния по вариации с неулучшаемой константой. Однако вопрос о точности сложно-пуассоновской аппроксимации в стационарных последовательностях долгое время оставался открытым, равно как и вопрос о точности пуассоновской аппроксимации в ряде задач теории экстремальных значений для выборок случайного объёма. Решению этих задач посвящена одна из глав диссертации.
В статистике экстремальных значений основное внимание уделяется задачам оценивания характеристик распределений с тяжёлыми хвостами. Актуальность указанной тематики связана с приложениями к финансам и страховому делу, где наблюдения зачастую оказываются зависимыми, а их распределения имеют тяжёлый хвост.
Основной характеристикой распределения с тяжёлым хвостом является показатель скорости убывания хвоста распределения. Оценка показателя скорости убывания хвоста распределения входит в конструкцию оценок экстремальной квантили и вероятности выхода за высокий уровень в последовательности стационарно связанных случайных величин.
В последние десятилетия эта тематика развивается весьма интенсивно (см. Хилл (1975), Холл (1982), Хойслер и Тойгельс (1985), Голди и Смит (1987), Декерс, Айнмаль, де Хаан (1989), Эмбрехтс, Клюпельберг, Микош (1997), Бейрлант, Гогебер, Тойгельс, Сегерс (2004)). В диссертации предложены новые оценки показателя скорости убывания хвоста распределения, экстремальной квантили, вероятности выхода за высокий уровень, доказана их состоятельность и асимптотическая нормальность при минимальных ограничениях на коэффициенты перемешивания, построены под-асимптотические доверительные интервалы, предложен алгоритм выбора управляющего параметра непараметрических оценок.
Важным направлением в статистике экстремальных значений является тема нижних границ точности оценивания характеристик неизвестного распределения. Этой тематике посвящены, в частности, работы Холл и Вэлш (1984), Донохо и Лю (1991), Пфанцаль (2000), Дреес (2001), Бейрлант, Буко, Веркер (2006). Однако имеющаяся литература
даёт лишь частичное решение указанной задачи: найден порядок скорости убывания нижней границы, асимптотическая нижняя граница выводится при ограничениях на класс рассматриваемых оценок.
В диссертации впервые получены неасимптотические нижние границы точности оценивания характеристик распределений с тяжёлыми хвостами, выявлены соответствующие информационные функционалы.
Многие оценки в статистике экстремальных значений входят в группу статистик, являющихся самонормированными суммами (СНС) случайных величин. Таковы ряд оценок показателя скорости убывания хвоста распределения, экстремального индекса, элементы конструкции оценок экстремальной квантили и вероятности выхода за высокий уровень. Группа СНС статистик включает также статистику Стьюдента, ядерную оценку функции регрессии, оценку функции интенсивности отказов.
Раздел статистики, связанный с самонормированными суммами случайных величин, интенсивно развивается в последние десятилетия (см. Чуй (1946), Эфрон (1969), Малер (1981), Славова (1985), Холл (1987), Бенткус и Гётце (1996), Жине, Гётце, Мейсон (1997), Шао (1997), Чистяков (2001)).
В диссертации получены оценки скорости сходимости в ЦПТ для распределений самонормированных сумм независимых и стационарно связанных случайных величин; решена долго остававшаяся открытой задача получения оценок скорости сходимости с явными константами; показано, что в неравенстве типа Берри-Эссеена для статистики Стьюдента константа не может быть лучше, чем 1/\/2е; установлено, что аналог неравномерного неравенства Берри-Эссеена, вообще говоря, не имеет места для самонормированных сумм случайных величин.
Цель работы. Основная цель работы — исследование асимптотических свойств распределений случайных величин и процессов, применяемых в задачах теории экстремальных значений, характеризация класса предельных распределений соответствующих случайных величии и процессов, получение оценок скорости сходимости в указанных предельных теоремах, разработка статистических методов оценивания характеристик распределений с тяжёлыми хвостами но выборкам стационарно связанных случайных величин, установление нижних границ точности оценивания характеристик распределений с тяжёлыми хвостами, выявление соответствующих информационных функционалов.
Научная новизна. Все основные результаты диссертации являются новыми и состоят в следующем:
1) Дана характеризация класса V предельных распределений эмпирического точечного процесса выходов за высокий уровень (ПВВУ). Элемент Р 6 V, являющийся двумерным точечным процессом, охарактеризован как процесс, являющийся композицией двух одномерных точечных процессов: пуассоновского тг(-) и процесса у(-) со стохастически непрерывными траекториями и маргинальными распределениями, удовлетворяющими условию (15). Найдены необходимые и достаточные условия слабой сходимости распределения эмпирического точечного процесса выхода за высокий уро-
вень к распределению произвольного заданного процесса РбР.
2) Получены оценки скорости сходимости в предельных теоремах для процесса выходов за высокий уровень. Точность аппроксимации распределения процесса выходов за высокий уровень соответствующим кластер-пуассоновским распределением оценена в терминах расстояния по вариации.
3) Предложен метод оценивания и получены оценки точности сложно-пуассоновской аппроксимации для распределения вектора количеств выходов за высокий уровень, получены утверждения типа ЗПЛ и оценки точности пуассоновской аппроксимации распределения числа длинных "повторов" в случайных последовательностях (задача имеет приложения к анализу последовательностей ДНК), а также оценки точности пуассоновской аппроксимации в ряде других задач теории экстремальных значений, получено обобщение на многомерный случай теоремы Бредли (1983) о задании независимой копии случайного вектора на одном вероятностном пространстве.
4) Предложен новый подход к изучению асимптотики распределения самонормированных сумм (СНС) случайных величин, решена долго остававшаяся открытой задача получения оценок типа Берри-Эссеена с явными константами для СНС случайных величин, в том числе для статистики Стьюдента. Оценки с явными константами получены впервые. На основе указанных оценок построены под-асимптотические доверительные интервалы для оценок показателя скорости убывания хвоста распределения. Установлено, что неравномерное неравенство типа Берри-Эссеена в общем случае не имеет места для самонормированных сумм с.в.. Впервые получены оценки скорости сходимости в ЦПТ для распределений самонормированных сумм стационарно связанных с.в..
5) В задачах статистического оценивания характеристик распределений с тяжёлыми хвостами предложены непараметрические оценки показателя скорости убывания хвоста распределения, вероятности выхода за высокий уровень и экстремальной квантили, доказана их состоятельность и асимптотическая нормальность в условиях слабой зависимости при минимальных ограничениях на коэффициенты перемешивания, предложена процедура выбора управляющего параметра непараметрических оценок.
6) Получены нижние границы точности оценивания характеристик распределений с тяжёлыми хвостами, выявлены соответствующие информационные функционалы.
Основные результаты работы.
1. Дана характеризация класса предельных распределений общих эмпирических точечных процессов, возникающих в теории экстремальных значений.
2. Установлены оценки скорости сходимости в предельных теоремах для распределений процесса выходов за высокий уровень, вектора количеств выходов за высокий уровень в последовательности стационарно связанных случайных величин, ряда других задач теории экстремальных значений.
3. Получены оценки точности сложно-пуассоновской аппроксимации для распределения вектора количеств выходов за высокий уровень, получены утверждения типа ЗПЛ и оценки точности пуассоновской аппроксимации распределения числа длинных "повторов" в случайных последовательностях, оценки точности пуассоновской аппроксимации в ряде других задач теории экстремальных значений, получено обобщение на многомерный случай теоремы Бредли о задании независимой копии случайного вектора
на одном вероятностном пространстве.
4. Предложен новый подход к оцениванию точности нормальной аппроксимации для распределений стьюдентизованных сумм независимых и стационарно связанных случайных величин, получены оценки с явными константами точности нормальной аппроксимации для распределений СНС, доказана невозможность неравномерной оценки типа Берри-Эссеена для статистики Стьюдента в общем случае.
5. Статистическое оценивание характеристик распределений с тяжёлыми хвостами по выборке стационарно связанных случайных величин: предложены новые оценки показателя скорости убывания хвоста распределения, экстремальной квантили и вероятности выхода за высокий уровень для распределений с тяжёлыми хвостами, доказана их состоятельность и асимптотическая нормальность в условиях слабой зависимости при минимальных ограничениях на коэффициенты перемешивания, предложен алгоритм выбора управляющего параметра.
6. Получены нижние границы точности оценивания характеристик распределений с тяжёлыми хвостами, выявлены соответствующие информационные функции.
Методы исследования. В работе применяются методы теории вероятностей и математической статистики. Кроме того, используется ряд конструкций, предложенных автором.
Теоретическая и практическая значимость работы. Работа носнт преимущественно теоретический характер. Её результаты являются вкладом в развитие теории экстремальных значений и ряда других разделов теории вероятностей и математической статистики. Разработанные методики могут быть использованы за пределами круга задач теории экстремальных значений. Практическая ценность работы определяется созданием методики оценивания характеристик распределений с тяжёлыми хвостами по выборкам стационарно связанных случайных величин. Предложены новые оценки показателя скорости убывания хвоста распределения, экстремальной квантили и вероятности выхода за высокий уровень, а также алгоритм выбора управляющего параметра. Указанные задачи имеют приложения к проблеме оценивания финансовых рисков. Результаты диссертации могут найти применение в исследованиях, проводимых в МГУ им. М.В. Ломоносова, МП РАН им. В.А. Стеклова, ПОМП РАН им. В.А. Стеклова, СПбГУ, Новосибирском государственном университете, ИМ СО РАН, МГТУ им. Н.Э. Баумана, ДВНЦ РАН.
Апробация работы. Основные результаты диссертации докладывались на многих международных конференциях и семинарах: международная конференция "Measuring Risk in Complex Stochastic Systems", Берлин, 1999; международный научный семинар, ЕТН, Цюрих, 2001; международный научный семинар, Технический Университет, Эйнд-ховен, 2001; международная конференция "Recent advances in Probability and Statistics", Лондон, Brunei University, 2002; международный научный семинар по теории вероятностей и математической статистике Оксфордского университета, Оксфорд, 2003; международный научный семинар по теории вероятностей и математической статистике, Royal Holloway University, Лондон, 2003; 11-й симпозиум международного финансового
общества, Стамбул, 2004; международная конференция "Financial Stochastics", Лондон, Brunei University, 2005; международная конференция "Modern stochastics: theory and applications", Киевский национальный университет, Киев, 2006; международная конференция "Recent advances in Probability, Statistics and Financial Stochastics", Middlesex University, Лондон, 2007; семинар кафедры теории вероятностей и математической статистики, университет Мельбурна, Мельбурн, 2007; международный научный семинар по теории вероятностей и математической статистике, Leeds University, 2007; международная конференция "Combinatorial and probabilistic inequalities", Институт Ньютона Кембриджского Университета, Кембридж, 2008; международный статистический симпозиум, Университет Джорджии, США, 2009; международный научный семинар кафедры теории вероятностей и математической статистики, Университет Мельбурна, 2010; 6th Finance Conference, Португалия, 2010; научный семинар кафедры теории вероятностей и математической статистики, Киевский национальный университет, Киев, 2011; научный семинар отдела случайных процессов, Институт Математики, Киев, 2011; 5-я международная конференция "Предельные теоремы теории вероятностей и их приложения", Новосибирск, 2011; научный семинар ИПУ, Москва, 2011; научный семинар по теории вероятностей и математической статистике Санкт-Петербургского отделения Математического института РАН под руководством академика РАН И.А. Ибрагимова, Санкт-Петербург, 2011; международная конференция CFE-11, Лондон, 2011; международная конференция "Теория вероятностей и её приложения", Москва, 2012; международная конференция "Statistics and Probability IMS-SWUFE", Ченду, Китай, 2013.
Публикации. Список работ по теме диссертации приведен в конце реферата. Основные работы, в которых отражены результаты диссертации: [1]-[23].
Личный вклад автора. Все основные результаты, выносимые на защиту, принадлежат соискателю. Из совместных публикаций в диссертацию включен лишь материал, который был получен непосредственно соискателем. Все работы, за исключением [22], выполнены без соавторов. Вкладом автора в работу [22] является теорема 3.8.
Структура и объём диссертации. Диссертация состоит из введения, шести глав и списка литературы из 417 наименований. Общий объем диссертации - 232 страницы.
Содержание работы
Во введении обсуждаются методы и задачи исследования, даётся обзор истории вопроса, описывается структура и содержание работы, вводятся основные обозначения.
В главе 1 описывается предложенный автором подход к задаче получения оценок скорости сходимости в предельных теоремах теории экстремальных значений (метод рекуррентных неравенств), а также рассматривается ряд задач теории экстремальных значений, связанных с выборками случайного объёма.
Пусть X,Xi,Xi,... - стационарная последовательность случайных величин, Мп = max Xí , р = р(и) := 1Р(Х > и).
1<!<П
Метод рекуррентных неравенств позволяет получать для вероятности IP (Мп < и) оценки сверху и снизу (теорема 1.1), с помощью которых выводятся оценки точности аппроксимации
1Р(Л/П < и) и е~пЬ
в предельных теоремах для Мп, где b = Ь(г,и) = 1Р(ХГ > и, Mr-i < и). В частности, теорема 1.2 устанавливает оценку скорости сходимости вида 0(п~1 + р) в случае т-зависимых с.в., что точнее оценки 0(п~х^ + п^р), полученной по методу блоков.
Важную роль в описании асимптотики распределения выборочного максимума последовательности стационарно связанных случайных величин играет понятие экстремального индекса. Необходимые и достаточные условия существания экстремального индекса устанавлены в теореме 1.5.
Рассмотрим строго стационарную последовательность X, Х\, Х-г,... случайных величин. Пусть (Л'*; К') = supp С(Х) и и = ип < К*. Обозначим Мт.п = maxm<*<n .Y* ,
0Я ее в"(г,и) =Р(Л/1,г<и|Х1>и), 0В =0°(r,") =1Р(Л/г>и)/гР(Х>и),
где г — гп € {1,..., п}.
Теорема 1.5 Пусть последовательность {ип} удовлетворяет соотношению
О < limiiif п1Р(Х>и„) < HmsupnP(X>un) < сю
п—
и условию перемешивания (£){ип}). Последовательность {X¡,i > 1} имеет экстремальный индекс если и только если
Hin lim sup ¡0 — 0R(r, un) I = 0 .
Последнее соотношение равносильно следующему:
lim lim sup \в — вВ(г, u„)| = 0.
г-¥оо п—юа
Далее метод рекуррентных неравенств применяется при изучении ряда специальных задач, привлёкших внимание исследователей. Теоремы 2.1-2.11 посвящены задаче о распределении максимума частичных сумм (МЧС) случайных величин. Эту задачу изучали многие известные авторы, в т.ч. Эрдёш и Реньи1, Деовельс, Эрдёш, Грил, Ре-
lErdös Р., Rényi А. (1970) On a new law of large numbers. — J. Anal. Math., v. 22, 103-111.
вес2, Деовельс, Деврой, Линч3, Чаки, Фёлдеш, Комлош4, Фролов, Мартикайнен, Штай-небах5, Питербарг6, Штайнебах7. В работе найдено предельное распределение МЧС в спектре ситуаций Inn к = к(п) п, получены оценки скорости сходимости в предельной теореме для максимума частичных сумм, а также результат типа ЗПЛ.
Пусть X,Xi,X2,... - последовательность независимых одинаково распределённых случайных величин,
Cm = Cm(fc) = Хт+1 + . . . + Xm+k i
(то > 0, к > 1). Обозначим
Я; s R'n{k) = max С •
7 " 0<!<П
Случайная величина Я*(&) есть максимум частичных сумм Эрдёша-Реньи.
В основе результатов о МЧС лежит теорема 1.6. Она устанавливает оценки IP (Я* < х) сверху и снизу.
Теорема 1.6 получена методом рекуррентных неравенств. Этот метод оказался эффективным средством получения оценок скорости сходимости в ряде предельных теорем теории экстремальных значений. Так, с помощью этого метода получена неулучша-емая по порядку оценка скорости сходимости в предельной теореме для распределения длины наибольшей серии "успехов", а также впервые оценена скорость сходимости в предельной теореме для МЧС (теорема 1.14).
Теорема 1.13 устанавливает предельное распределение МЧС в спектре ситуаций Inп <^к = к(п) -С п. Обозначим
ип = ^2\n[nk-1\j2\ii(nk-1) ) , а„ = u„/Vk ,
■ф(у,а) = -y-y2/2 + (l+y)3aG((l+y)a),
где G{x) есть ряд Крамера. В теореме 1.13 рассматриваются следующие возможные ситуации: при п —>■ оо,
ufc™-1 -> 00, 1&С-Ю (Ат), и2па™ -> const > О
2Deheuvels P., Erdos P., Grill К. and Revesz P. (1987) Many heads in a short block. — Math. Statist. Probab. Theory (M.L.Puri et al., eds.), v. A, 53-67.
3Deheuvels P., Devroye L. and Lynch J. (1986) Exact convergence rates in the limit theorems of Erd5s-Renyi and Shepp. - Ann. Probab., v. 14, 1, 209-223.
4Csaki E., Foldes A., Komlos J. (1987) Limit theorems for Erdos-Renyi type problems. — Studia Sci. Math. Hung., v. 22, 321-332.
5Frolov A.M., Martikainen A. and Steinebach J. (2001) On the maximal excursion over increasing runs. — In: Asymptotic methods in probability and statistics with applications (St.-Petersburg, 1998), 225-242. Stat. Ind. Technol., Birkhaiiser: Boston, MA.
6Питербарг В.И. (1991) О больших скачках случайного блуждания. — Теория верояти. и её примен., т. 36, .V 1, 54-64.
7Steinebach J. (1998) On a conjecture of Revesz and its analogue for renewal processes. — In: Asymp. Methods Probab. Statist. (B.Szyszkowicz, ed.), 311-322.
где т > 1. Отметим, что
(ln(n/fc))1+2/m « к « (ln(ri/lfc))1+2/(m-1) ,
если (Ат) выполнено;
(hi(п/к))2+т к~т -> const (п -> ос),
если имеет место
Приведём следующие следствие теоремы 2.11: если условие (Aj) выполнено, то
Р (R*n{k)/Vk - un{l + c1an+c2a?;l) < z/un^j -5- ехр(-е~7\/27? ) (п ос),
где Cl = G(0), с2 = G'(0) + 2.5G2(0).
Далее в главе 1 рассмотрен ряд задач, в которых объём выборки является случайным. Обозначим
Л/, max-fi — S.,(t\: max XL f ,
где 50 = 0, 5П = Хг + ... + X„ (n > 1), MO = max{n > 0 : Sn < t} .
Задача имеет финансовые приложения. К примеру, банк открыл кредитную линию на сумму в t единиц, выбираемую траншами .. ■. Сведения об асимптотике
распределения Mt позволяют ответить на вопрос о величине наибольшей из выплат.
В теоремах 1.17-1.19 получены оценки скорости сходимости и асимптотические разложения в предельной теореме для Mt. Лемма 1.20 устанавливает экспоненциальное неравенство для |/u(i) — IE/i(i)|.
Теоремы 1.21-1.23 посвящены распределению числа
МО
Nt(x) = Y, ^ + ^ " S"«> ^ i=1
выходов за высокий уровень до момента iiit). Отметим, что < х} = {Nt(x) < к},
где Xk.t является к-м по порядку неубывания элементом {Х1;... , X^(¡j, t — В тео-
ремах 1.21-1.23 получены оценки скорости сходимости и асимптотические разложения в предельной теореме для Nt(x).
Пусть X,Xi,...,Xm,Yi,...,Yn - независимые одинаково распределенные случайные величины с дискретным множеством состояний.
Будем говорить, что в последовательности Х\,... , Х„ имеет место "повтор" длины > к, если Xi+i = Xj+i,... ,Xi+k = (3i,j < n — k). Будем говорить, что в после-
довательностях Xi,..., Хт, Yi,... ,Yn имеет место "общий фрагмент" длины > к, если Xi+1 = Yj+1,...,Xi+k = Yj+h (Эг < m-k,j < п-к).
Обозначим через N* число повторов длины >к в последовательности Xt,... ,Хп и через \\'т,„ число общих фрагментов длины > к среди Хь ..., Хт, Yi,..., Yn . Пусть М* - длина наибольшего повтора в последовательности Хх,... ,Хп , и пусть Мт,„ -длина наибольшего общего фрагмента в последовательностях Хг,..., Хт, Ух,..., Yn .
Поскольку количество повторов длины > к случайно, это задача о числе выходов за высокий уровень в выборке случайного объёма.
Задача изучения распределения длины наибольшего повтора и распределения числа длинных общих фрагментов в дискретных последовательностях имеет приложения в биологии при анализе "значимых" фрагментов последовательностей ДНК. Многие известные авторы работали над указанной задачей, в т.ч. Зубков и Михайлов8, Михайлов9, Арратия10, Гордон11, Ватерман12, Карлин13, Ост14 .
Зубков и Михайлов8 доказали теорему Пуассона для ЛГ*. Арратия и др.15 нашли предельное распределение Мт,п ■
Дт,„ = шах |Р(Л/т,„ < к) - ехр (-тп(\-р)рк) ] О к
если т —> оо,п оо,т ~ п, где р = Р(Х = У). Арратия и Ватерман12 получили результат типа ЗБЧ для Мп . Арратия и др.11 показали, что если 1 — с+ < (1п ш)/ 1п тп < с+, где
с+ = 1о5р9 - 1, р = Р(Х = У), д = Р№ = Х2 = Ха),
то существует е > 0 такое, что Дт>„ = <Э(п~Е) при т —» оо, п —> со.
В теоремах 1.28-1.35 установлены оценки скорости сходимости в предельных теоремах для числа длинных "повторов", получены утверждения типа ЗПЛ. Указанные результаты уточняют соответствующие утверждения Зубкова, Михайлова, Арратии, Гольдштейна, Гордона, Ватермана.
Обозначим то' = т — к +1, п' = п-к+1, А = (т'-1)(п'-1)(1-р)р*-'+ (т'+п'-^р4 ,
р, = тахра , с, = ^(1/р„), Ат п(к) = |Р(Мт,„ < к) - схр (-А) |,
аел
Л*(п,к) есть аналог Дт,„(/г) с заменой Л/т,„ на М* , символ ¿ТУ означает расстояние по вариации, С(ттхщп) = П(А). Отметим, что р2 < р, р2 < д < р, , 1 > с+ > с» > 1/2; если распределение С(Х) является равномерным, то с+ = с, = 1.
8Зубков A.M., Михайлов С.Г. (1979) О повторениях s-цепочек в последовательности независимых величин. — Теория вероятн. и её примен., т. 24, J\- 2, 267-279.
9Михайлов В.Г. (2001) Оценка точности сложной пуассоновской аппроксимации для распределения числа совпадающих цепочек. — Теория вероятн. и её примен., т. 46, .V 4, 713-723.
10Arratia R., Goldstein L. and Gordon L. (1989) Two moments suffice for Poisson approximation. — Ann. Probab., v. 17, № 1, 9-25.
uArratia R., Gordon L. and Waterman M.S. (1990) The Erdos-Renyi law in distribution, for coin tossing and sequence matching. — Ann. Statist., v. 18, 2, 539-570.
l2Arratia R. and Waterman M.S. (1989) The Erdos-Renyi strong law for pattern matching with a given proportion of mismatches. — Ann. Probab., v. 17, .V 4, 1152-1169.
13Karlin S. and Ost F. (1987) Counts of long aligned word matches among random letter sequences. — Adv. Appl. Probab., v. 19, № 2, 293-351.
14Karlin S. and Ost F. (1988) Maximal length of common words among random letter sequences. — Ann. Probab., v. 16, jY' 3, 535-563.
I5Arratia R., Gordon L. and Waterman M.S. (1986) An extreme value theory for sequence matching. — Ann. Statist., v. 14, № 3, 971-993.
Теорема 1.25 Если п> к и т > к > 1, то
dTV{Wm^irm,„) < А"1 {1~е'х) т'п'(2Ш) (2kq2k + {т'+п'-1)(р2к+qk)) .
Следствие 1.26 Если т -> оо, п —> оо, (lnmn)/(inin{m,n}) —> 0, то
max Am,„(fc) = о((т+п)(mn)~c+ (Inmn)1+c+ + (mn)^2c-(Inmn)1+2c') . 1<к<тЛп ' V /
Теорема 1.27 Если п > Зк > 3, то
dTV(K-,K,k) < Л*"1 (l-e"V) ((n*)3(2fe + l) (p2k+qk) + 2(kn')2q2k) + 2kn'pk , где A* = Ущк = (п — Зк + 1) рк(1 + (n-3fc)(l-p)/2), £«л.) = П(А*), n* = n-fc.
Следствие 1.28 При п —> оо,
шах Д*(п, /Ь) = Ofп1_2с+(1пя)1+с+ + п2"4<;-(1пп)1+2сЛ .
l<fc<n/3 V /
Пусть log означает логарифм по основанию 1 /р,
/„ = logn2 - log In In л + log((l—p)/2), gn = log n2 + log log n .
Теорема 1.30 С вероятностью 1
liminf (Л/* — /„) = — 1,
n—*co
lim sup (Л/* — g„) / log In Inn = 1.
n—>oo
Рассмотрим ситуацию, когда внутри "повтора" допускается не более г несовпадений, и пусть jV* (г) - число таких повторов длины > А; в последовательности Xi,..., Хп , Л/*(г) - длина наибольшего повтора в последовательности ..., Хп , ^„^„(г) - число повторов длины > к в последовательностях ЛГЬ ..., Хт, Yl...., Yn , Mm,n(r) ~ длина наибольшего "повтора" в последовательностях Xi,..., Хт, Yj,..., Yn . Аналоги теорем 1.25 - 1.30 получены также для N*(r), Мт,п(г) и Wm,n(r).
Исходным объектом теории экстремальных значений является число выходов за высокий уровень
п
Nn = Nn(x) = ЧЪ > *}> i=i
где A'i, А'г,..., X„ - рассматриваемая выборка. Результаты о распределении порядковых статистик следуют из результатов о распределении Nn(x): если выборка записана в порядке неубывания как > ... > Хпл , то
{Хт.п <х} = {Аг„(а;) < т}.
В главе 2 изучается точность пуассоновской и сложно-иуассоновской аппроксимации распределения числа выходов за высокий уровень. История вопроса восходит к теореме Пуассона.
Если Xi,..., Хп - независимые одинаково распределенные случайные величины, то число выходов за высокий уровень (число экстремальных значений) Nn имеет Биномиальное распределение В(п,р), где
р = 1Р(Л" > X).
В задачах теории экстремальных значений р обычно мало, и C(Nn) допускает аппроксимацию распределением Пуассона П(Л), где А = TENn.
Задачу оценивания точности пуассоновской аппроксимации изучали многие известные авторы, в т.ч. Барбур, Деовельс, Лекам, Прохоров, Пфайфер, Серфлин, Холл. Прохоров16 установил асимптотику расстояния по вариации dTV (B(n,p); П(пр)):
dTl,(B(n,p); П(пр)) =p/V2Íre(l + 0(p+l/y/ñp)y (1)
Роос17, опираясь на результаты Деовельса и Пфайфера18, обобщил (1) на случай независимых неодинаково распределённых 0-1 случайных величин. Пусть
п
лг„ = 5>
¿=1
где {Ii, i > 1} - независимые случайные величины со значениями в {0,1}. Положим
п п
Pi = , А = Х>, e =
i=1 1=1
Обозначим через 7Г>, случайную величину с распределением Пуассона П(А). Барбуру и Иглсону19 принадлежит оценка
п
d^iN^njKX-'il-e-^Pl (2)
! = 1
Роос17 (см. также Чяканавичюс и Роос20) получил оценку с неулучшаемой константой: <irv№;4) < 3Ö/4e(l-V^)3/2. (3)
16Прохоров Ю.В. (1952) Асимптотическое поведение биномиального распределения. — УМН, т. 8, 3(55), 135-142.
17Roos В. (1999) Asymptotic and sharp bounds in the Poisson approximation to the Poisson-binomial distribution. - Bernoulli, v. 5, № 6, 1021-1034.
18Deheuvels P. and Pfeifer D. (1986) A semigroup approach to Poisson approximation. — Ann. Probab., v. 14, № 2, 663-676.
19Barbour A.D. and Eagleson G.K. (1983) Poisson approximation for some statistics based on exchangeable trials. - Adv. Appl. Probab., v. 15, № 3, 585-600.
20Cekanavicius V. and Roos B. (2006) An expansion in the exponent for compound binomial approximations. Liet. Matem. Rink., v. 46, 67-110.
Барбур21 и Борисов и Рузанкии22 получили асимптотические разложения для TEh(Nn) для класса функций h.
Теорема 2.1 уточняет асимптотику второго порядка в оценке (3).
Пусть [■] означает целую часть, и положим
р'п = max Pi," е = min|l; (27г[А—р*])-1^2 + 2<5/(1—р*/А) J ,
S = A-i(i i* = A"4l -e-x)j2pl
;=i !=i
Теорема 2.1 Справедливо неравенство
dTV (jVn; 7ГЛ) < 30/4е + 2S*s + 2S2. (4)
Если X, Xi,.. ■, Xn - одинаково распределенные случайные величины, то правая часть (4) имеет вид Зр/4е(1 -Ь О(р)), тогда как правая часть (3) есть Зр/4е(1 + O(^fp)).
В теореме 2.3 предложено новое доказательство результата Прохорова-Рооса об асимптотике расстояния по вариации dTV(Nn\ 7Гд), показано, что главный член асимптотики dTV(Nn\7Гд) может быть выражен в терминах специального преобразования распределения Пуассона.
Далее рассматривается более общая ситуация, когда jV„ = Q ■> гДе {0} ~~ независимые случайные величины со значениями в Z+ = {0,1,2,...}. Барбур и Иенсен23 оценили |E/i(iVn) — Е/г(7гЛ)| для функций h, таких что ||h||i = 1. В теореме 2.5 получены оценки точности пуассоновской аппроксимации Ci) в терминах расстояния по вариации dTV и расстояния Джини-Канторовича-Васерштейна dG . В теоремах 2.6 и 2.7 результат теоремы 2.5 обобщен на случай слабо зависимых случайных величин.
Теоремы 2.12 и 2.13 посвящены проблеме сложно-пуассоновской аппроксимации распределения числа выходов за высокий уровень в случае стационарно связанных случайных величин. Отметим, что данная задача является частным случаем проблемы аппроксимации распределений сумм случайных величин безгранично делимыми законами, рассматривавшейся многими известными авторами (см. Зайцев24).
Пусть Х,ХиХ2,...- строго стационарная последовательность случайных величин, {п, Cr.ii • ■ ■} - независимые случайные величины, причём С(ж) = ЩА'д),
£(Cr,i) = C(Nr\Nr > 0) (i > 1), Cr,о = 0,
q = P(Nr(u) > 0), k = [n/r] , r' = n- rk,
21Barbour A.D. (1987) Asymptotic expansions in the Poisson limit theorem. — Ann. Probab., v. 15, \o 2, 748-766.
22Borisov I.S. and Ruzankin P.S. (2002) Poisson approximation for expectations of unbounded function of independent random variables. — Ann. Probab., v. 30, No 4, 1657-1680.
23Barbour A.D., Jensen J.L. (1989) Local and tail approximations near the Poisson limit. — Scand. J. Statist., v. 16, 75-87.
243айцев А.Ю. (2003) Об аппроксимации выборки пуассоповским точечным процессом. — Записки научных семинаров ПОМИ, т. 298, 111-125.
где и = ип, и пусть Nn = Сг,i • Отметим, что случайная величина N„ име-
ет сложно-пуассоиовское распределение. Коэффициенты перемешивания а(1),р(1), чр{1) определены в Приложении.
Теорема 2.12 устанавливает, что при естественных предположениях слабая сходимость C(Nr\Nr > 0), где п 3> г = г„ 1, является необходимым и достаточным условием слабой сходимости C(Nn) к сложно-пуассоновскому закону. Оценка точности сложно-пуассоновской аппроксимации C(Nn) дана в теореме 2.13.
Теорема 2.13 Если п > г > I > 0, то
dTV(Nn ; Ñn) < cn,rrp + (2kl + r')p + nr"V,! , (5)
da (Nn ■ Ñn) < rp minjnp; | y/2 np¡e | + (2 kl + r')p + ,
где c„,r = тт{1-е-"р;3/4е+(l-e-np)rp} и 7n,¡ = min{4a(l)<fr-,P(l)}.
Оценка (5) точна в следующем смысле: в случае независимых наблюдений (г = 1,1 = 0) она совпадает с наилучшей оценкой точности пуассоновской аппроксимации.
Теоремы 2.16, 2.18 и 2.20 посвящены характеризация класса предельных распределений и оцениванию точности сложно-пуассоновской аппроксимации распределения вектора количеств выходов за высокие уровни в последовательности стационарно связанных случайных величин. Обозначим
Яп = ъ + ... + £п,
где & = (H.{Xi>x1},l{xi>Xi > x2},...,l{xm-i>Xi > хт}).
В теореме 2.16 показано, что условие C¡ является необходимым и достаточным для слабой сходимости Ñn к сложно-пуассоновскому случайному вектору с независимыми компонентами (ввиду ограниченности места мы не приводим здесь условия C¡, С, Д, Д{ип})- Утверждение 2.17 и теорема 2.18 устанавливают необходимые и достаточные условия слабой сходимости C(Nn) в общем случае, когда условие С(- не предполагается выполненным. Теорема 2.20 оценивает точность аппроксимации распределения вектора £(Ñn) многомерным сложно-пуассоновским распределением.
Распределение вектора Ñn аппроксимируется многомерным сложно-пуассоновским распределением П(А-д, £(С)), где к = [n/r], г е {1, ■ • •, п}, q = F(Nr(um) >0),
£(С) = C(Ñr\Ñr(xm) > 0). Положим г' = п—гк, ц пусть C(Y) = П(kq,C{(¡)).
Теорема 2.20. Если п > г > I > 0, то
dTV (Ñn-Y) < (1 - e~np)rp + (2nr~1l+r')p + nrmm{/3(¿); «(/)} ,
где к(1) = 2(l+2/rn)(2m-1rn2a2(0)1/(2+m) если т2^т~^2а(1) < 1, иначе к(1) = 1.
Слагаемое (1 — e~"p)rp здесь связано с применением оценки (2); вместо (2) можно использовать любую другую оценку точности пуассоновской аппроксимации биномиального распределения, например, (4).
При выводе оценок точности сложно-пуассоновской аппроксимации для распределения вектора количеств выходов за высокий уровень используется полученное в лемме 2.22 обобщение на многомерный случай теоремы Бредли о задании независимой копии случайного вектора на одном вероятностном пространстве.
Пусть (X, Y) - случайные векторы, принимающие значениями в IR.' х IR*™ , и пусть а - коэффициент равномерного перемешивания, соответствующий ст-алгебрам ст(Х) и a(Y). Обозначим = тах,-<т |i>;| (» е Ига).
Лемма 2.22 Случайные векторы X,Y и Y могут быть заданы на одном вероятностном пространстве так, что Y не зависит от X, Y = Y и
Р(|У-У|>у) < 2{m+3)/2Km/2a + 2F(\Y\>Ky) (у > 0,К&Т$).
Глава 3 посвящена точечным процессам выходов за высокий уровень (ПВВУ). Дана характеризации класса предельных распределений ПВВУ, оценена скорость сходимости в соответствующих предельных теоремах.
Если {Xi} - строго стационарная последовательность случайных величин, то экстремальные значения, вообще говоря, появляются не но одиночке, а гроздьями (кластерами). Обозначим через £(С) предельное распределение кластера. Тогда
ДNr | Nr > 0) =► ЦС) (6)
для некоторой последовательности {г = г„} натуральных чисел, такой что
п » г„ » 1.
Если условие перемешивания Д{и„} выполнено, то существуют последовательности {in} и {'п}> такие что
п » rn » ln » 1, пг~1а%ъ -»• 0, (7)
где а„ = ап(1п,ип) - коэффициент а-перемешивания. Распределение С(0 не зависит от выбора последовательности {гп}, удовлетворяющей (7). Определим точечный процесс Nn(-,un) равенством
п
Nn{B,un) = Y,4i/n£B,Xi>un} (ВСВ( 0;1]). (8)
1=1
Случайная мера Nn(-,un) учитывает местоположение экстремумов (выходов за уровень un), но не их размах.
Хсин, Хюслер и Лидбеттер25 показали, что если (6) выполнено для последовательности {г,,}, удовлетворяющей соотношению (7), то
Nn(-,un)=> N(-),
где N(-) - сложно-пуассоновский точечный процесс с распределением кластера и интенсивностью А, удовлетворяющей соотношению
lim P(JV„ = 0) = е"А (ЗЛ > 0). (9)
тг->эс
И наоборот, если ЛГ„(-,к„) слабо сходится к точечному процессу N(-), то N(-) есть сложно-пуассоновский процесс на (0; 1] с интенсивностью А, удовлетворяющей соотношению (9). Если А > 0, то (6) выполнено для некоторой случайной величины £ и последовательности {г„}, таких что имеет место (7).
В то время как процесс (8) подсчитывает местоположения выходов за один и тот же уровень и„, процесс
{jV„(iin(í)),í>0} (10)
выходов за высокий уровень имеет дело с размахом выбросов.
В теореме 3.2 найдены необходимые и достаточные условия слабой сходимости ПВВУ (10) к сложно-пуассоновскому процессу.
Пусть {u„(-),n > 1} - последовательность функций на [0; оо), такая что функция ип(-) возрастает для всех достаточно больших п, ип(0) = оо,
limsupnIP(X„ > un(t)) < оо (0 < t < оо),
п—»ОС
lim Р(Мп < un(t)) = e"f (t > 0).
п—юс
Пусть {tt(s), s > 0 } - пуассоновский процесс с интенсивностью 1, и пусть С Cii Сг> ■ • • -последовательность н.о.р.с.в. со значениями в N. Обозначим
т(0
W) = £ о- (и)
3 = 1
Отметим, что {Q(t),t > 0} - сложно-пуассоновский скачкообразный процесс (иными словами, Q{B) := fBQ(dt) является сложно-пуассоновским точечным процессом с ле-беговской мерой интенсивности и распределением кластера £(())■
Теорема 3.2 устанавливает необходимые и достаточные условия слабой сходимости ПВВУ (10) к сложно-пуассоновскому процессу (11).
Теорема 3.2 Предположим, что условие перемешивания Д выполнено. Тогда АГ„К(-)) =><?(■) (п-юо),
25Hsing Т., Hüsler J., Leadbetter M.R. (1988) On the exceedance point proccss for stationary sequence. — Probab. Theory Rel. Fields, v. 78, 97-112.
если и только если условие С выполнено.
Процессы (8) и (10) - одномерные. Наиболее общим процессом, рассматриваемым в теории экстремальных значений, является процесс N*, учитывающий как расположение экстремумов, так и их размах. Теорема 3.4 описывают необходимые и достаточные условия слабой сходимости эмпирического процесса выходов за высокий уровень М* к сложно-пуассоновскому процессу.
Для всякого борелевского множества А С (0; 1] х [0; с») обозначим
п ¡=1
Отметим, что Щт]{ипЦ)) = Л^((0;в] х [0;<))-
Пусть N* - сложно-пуассоновский точечный процесс на (0; 1] х [0; оо) с лебеговой мерой интенсивности и распределением кластера
Теорема 3.4 Пусть выполнено условие перемешивания А . Тогда
К => ,
если и только если условие С выполнено.
Результаты о сходимости к сложно-пуассоновскому процессу играют роль ЦПТ в теории экстремальных значений. Однако класс предельных распределений указанных эмпирических процессов богаче класса сложно-пуассоновских процессов.
Далее рассматривается задача аппроксимации распределений эмпирических процессов выходов за высокий уровень в общем случае, когда предельное распределение, вообще говоря, не является сложно-пуассоновским.
Теоремы 3.6-3.8 посвящены одномерному процессу выходов за высокий уровень, учитывающему размах выбросов. Общий процесс /V* , учитывающий как расположение экстремумов, так и их размах, рассматривается в теореме 3.9 и следствии 3.10.
Положим Мп(г, I) = (Лгг(и„(^)),.,ЛГг(и„(гт))), и пусть I = (¿1,...,£т), где 0 < ¿1 < ... < ¿т < 1. Обозначим через £(£ ,гс) случайный вектор с распределением
С(С(£, п)) = С (1\п(г,I) | Лгг(и„(гто)) > 0) .
Теорема 3.6 Предположим, что существует скачкообразный процесс {7(£),4 £ [0; 1]} со стохастически непрерывными траекториями такой, что
С(?,П)=>(7(*1),...,7(0) (12)
для любых т > 1 и I, где последовательность натуральных чисел {г = г„} удовлетворяет (7). Тогда
{Мы{ипЦТ)),Ь € [0; 1]} =ф. {Мт{з,1),1 е [0; 1]} (13)
для любых s > О, Г > О, где NT(s,t) = X^li*'7j(i)> {7j(')>0 < t < 1} - независимые копии 7(-)i пуассоновский процесс ttt{s) не зависит от {7j(0}-
Процесс {NT(s,t)} обладает свойством
Л/т (as, •) = NT(s, a-) (Va e [0; 1]) . Отметим, что соотношение (13) может быть представлено в виде
(13*)
Положим
z(t) = ст (0 < t < 1), (14)
где случайная величина £(i) не зависит от £ и имеет распределение Бернулли B(t).
Теорема 3.7 Если {Nn(un(t)),t G [0;Х]} слабо сходится к скачкообразному процессу, то тогда существует скачкообразный процесс {~f(t),t £ [0;1]} со стохастически непрерывными траекториями, такой что (12) и (13*) выполнены. Маргинальные распределения процесса у удовлетворяют соотношению
7(i) = Z(i) (0 < t < 1), (15)
где случайные величины {Z(t)} определены уравнением (14).
Точность аппроксимации распределения процесса {jVn(u„(-))} оценена в следующей теореме.
Теорема 3.8 Для всякого п > г > I > 0,
7Г
dTV (Nn(«„(•)); < (1 - еГпр)гр + r'p + 2nplf r + ß(l)n/r. (16)
i=i
В доказательстве теоремы 3.8 используется оценка точности пуассоновской аппроксимации биномиального распределения, и слагаемое (1 — е~пр)гр в (16) связано с применением оценки (2); вместо (2) можно использовать любую другую оценку точности пуассоновской аппроксимации биномиального распределения, например, (4).
Мори26 и Хсин27 охарактеризовали класс предельных распределений ПВВУ N* = N*! в терминах двумерных точечных процессов. Теорема 3.9 и следствие 3.10 устанавливают, что класс предельных процессов для ПВВУ есть класс процессов N* , образованых одномерными точечными процессами.
26Mori Т. (1977) Limit distributions of two-dimensional point processes generated by strong-mixing sequences. — Yokohama Math. J., v. 25, 155-168.
27Hsing T. (1987) On the characterization of certain point processes. — Stochastic Processes Appl., v. 26, 297-316.
Пусть {7(t), t 6 [0; 1]} - скачкообразный процесс. Для всякого борелевского множества А С (0; 1] х [0; 1) обозначим
K,M) = I Е Ыу+М—ГМ)-
Точечный процесс N* = jV*^ имеет следующие свойства: (Р1) приращения N* вдоль горизонтальной осп независимы,
(Р2) N*((a; b] х В) = Аг*((0; Ь — а]х В) для любого борелевского множества В С [0; 1), (РЗ) {Л£((0;а] х [0;i)), t € [0; 1)} = {NT(a,t), t в [0; 1)}.
Теорема 3.9 Предположим, что выполнено условие перемешивания Д. Если существует скачкообразный процесс {7(i), t £ [0;1]} со стохастически непрерывными траекториями, такой что (12) выполнено, то Лг*т =>• N* ■
Из теоремы 3.7 и теоремы 3.9 вытекает
Следствие 3.10 Предположим, что выполнено условие Д. Если N*T слабо сходится к точечному процессу N*, то существует скачкообразный процесс (7(i), t € [0; 1]} со стохастически непрерывными траекториями, такой что (12) выполнено и
N* = N; .
Глава 4 посвящена задачам статистического оценивания характеристик распределений с тяжёлыми хвостами. Данная тематика имеет приложения к проблеме оценивания финансовых рисков.
Распределение С(Х) имеет тяжёлый правый хвост, если
Р(Х > х) = L(x)x~l'a (а > 0),
где функция L медленно меняется: lim L(xt)/L(x) = 1 (Vi > 0). Обозначим через T-L
ж—>ос
класс таких распределений.
Число а = 1/а является показателем скорости убывания хвоста распределения (ПСУХР). Если Ь(х) = С + о(1), то С называется константой хвоста распределения.
Распределение с тяжёлым хвостом принадлежит к одному их трёх типов предельных распределений для выборочного максимума. Интерес к задаче оценивания характеристик распределения с тяжёлым хвостом связан также с тем, что в финансовых и страховых приложениях распределение наблюдений часто имеет тяжёлый хвост.
Класс распределений с тяжёлым правым хвостом является непараметрическим, что делает задачу оценивания характеристик распределения С(Х) нетривиальной. Многие известные авторы работали над указанной задачей, в т.ч. Хилл28, Холл29, Голди и
28Hill В.М. (1975) A simple general approach to inference about the tail of a distribution. — Ann. Statist., v. 3, 1163-1174.
29Hall P. (1082) On estimating the endpoint of a distribution. — Ann. Statist., v. 10, № 2, 556-568.
Смит30, Смит31, Декерс, Айнмаль, де Хаан32, Хойслер и Тойгельс33, Бейрлант, Гогебер, Тойгельс, Сегерс34.
Голди и Смит30 предложили RE-оценку
п п
а™ = а™(х) = £1п(лух)1{Х; > > (17)
индекса а (соответственно, 1 /а%Е является RE-оценкой показателя скорости убывания хвоста распределения а). Она относится к типу оценок, построенных по элементам выборки, выходящим за высокий неслучайный уровень. Другой известной оценкой является оценка Хилла28. Она относится к типу оценок, построенных по верхним порядковым статистикам. Приведены аргументы, свидетельствующие в пользу оценок первого типа.
Для оценивания показателем скорости убывания хвоста распределения предложена статистика аП:1П, являющаяся обобщением RE-оценки. Для RE-оценки и статистики ап,т найдены асимптотика средне-квадратичной ошибки и теоретически оптимальное значение управляющего параметра (в случае выборки из последовательности независимых одинаково распределённых случайных величин). Установлена состоятельность статистики ап,т и оценки константы хвоста распределения в случае строго стационарной последовательности случайных величин при условии перемешивания
^VV(z)<oo. (18)
¡>1
Асимптотическая нормальность RE-оценки доказана при дополнительном условии
lim = 0 (19)
/->эо
(теоремы 4.2 и 4.4). Построены асимптотические и (в случае независимых случайных величин) под-асимптотические доверительные интервалы. Предложена процедура выбора управляющего параметра указанных непараметрических оценок. Результаты моделирования выборок из распределений с тяжёлыми хвостами свидетельствуют в пользу предложенной процедуры.
Теоретически оптимальное значение управляющего параметра зависит от индексов второго порядка в асимптотическом разложении 1Р(Х > х). Ряд авторов рассматривали задачу оценивания параметров второго порядка по выборке из распределения вида
1Р(АГ > х) = сх~1/а (1 + dx~p + o(x~fi)) , (20)
30Goldie С.М. and Smith R.L. (1987) Slow variation with remainder: theory and applications. — Quart. J. Math. Oxford, v. 38, 45-71.
31 Smith R.L. (1987) Estimating tails of probability distributions. - Ann. Statist., v. 15, 3, 1174-1207.
32Dekkers A.L.M., Einmahl J.H.J, and de Haan L. (1989) A moment estimator for the index of an extreme-value distribution. - Arm. Statist., v. 17, jV 4, 1833-1855.
33Haeusler E. and Teugels J.L. (1985) On asymptotic normality of Hill's estimator for the exponent of regular regulation. — Ann. Statist., v. 13, № 2, 743-756.
34Beirlant J., Goegebeur Y., Teugels J., Segers J. (2004) Statistics of extremes. — Chichester: Wiley.
где а > О, b > О, с > О, d ф 0. Класс распределений (20) является непараметрическим. Предложены оценки индексов ß и wx = , доказана их состоятельность (утверждения 4.5 и 4.6).
Задача оценивания экстремальных квантилей имеет важные приложения к финансам: с точностью до знака, экстремальная квантиль является мерой риска, известной как "Value-at-Risk" (VaR). Результаты моделирования выборок из распределений с тяжёлыми хвостами показывают, что эмпирическая оценка экстремальной квантили не точна. Другие имеющиеся в литературе оценки (см., к примеру, Макнил33) также оказались не точны.
Предложена оценка экстремальной квантили и оценка функции Мп(х) = Е{Х — х\Х > х}, используемой при построении другой популярной меры риска, известной как "Expected Shortfall". Предложена процедура выбора управляющего параметра оценок, в теореме 4.7 доказана состоятельность оценок при условии (18). Асимптотическая нормальность оценок экстремальной квантили и функции М„(х) доказана при дополнительном условии (19) (теоремы 4.8 и 4.10). Результаты моделирования выборок из распределений с тяжёлыми хвостами свидетельствуют о предпочтительности предложенной оценки экстремальной квантили по сравнению с эмпирической оценкой.
Далее рассматривается задача оценивания вероятности Fc(y) := 1Р(Х > у) выхода за высокий уровень в последовательности стационарно связанных случайных величин. Предложена оценка вероятности Fc(y), доказана её состоятельность при условии (18) (теорема 4.11) и асимптотическая нормальность при дополнительном условии (19) (теорема 4.12), предложена процедура выбора управляющего параметра.
Важным направлением в статистике экстремальных значений является задача определения нижних границ точности оценивания характеристик неизвестного распределения с тяжёлым хвостом. Этой тематике посвящены работы Бейрлант, Буко, Веркер36, Холл и Вэлш37, Донохо и Лю38, Дреес39, Пфанцаль40 и др.. Однако указанная литература даёт лишь частичное решение задачи: найден порядок скорости убывания нижних
07 ОО in
границ ' , а также асимптотические нижние границы при тех или иных ограничениях на класс рассматриваемых оценок и распределений. Например, Бейрлант, Буко и Веркер36 рассматривают класс оценок показателя скорости убывания хвоста распределения, являющихся Ор{ 1) равномерно по классу рассматриваемых распределений, а возможные значения показателя скорости убывания хвоста распределения должны принадлежать интервалу фиксированной длины. Дреес39 получил асимптотическую нижнюю границу для класса аффинных оценок показателя скорости убывания хвоста рас-
35McNeil A.J. (1998) On extremes and crashes. — Risk, v. 11, p. 99-104.
36Beirlant J., Bouquiaux C., Werker B.J.M. (2006) Semiparametric lower bounds for tail index estimation. - J. Statist. Plann. Inference, v. 136, № 3, 705-729.
37Hall P. and Welsh A.H. (1984) Best attainable rates of convergence for estimates of parameters of regular variation. — Ann. Statist., v. 12, № 3, 1079-1084.
38Donoho D.L. and Liu R.C. (1991) Geometrizing rates of convergence II, III. — Ann. Statist., v. 19, 633-667, 668-701.
39Drces H. (2001) Minimax risk bounds in extreme values theory. — Ann. Statist., v. 29, У" 1, 266-294.
40Pfanzagl J. (2000) On local uniformity for estimators and confidence limits. — J. Statist. Plann. Inference, v. 84, 27-53.
пределения, возможные значения показателя скорости убывания хвоста распределения должны принадлежать интервалу фиксированной длины.
В работе найдены нижние границы точности оценивания характеристик распределений с тяжёлыми хвостами, при этом не требуется, чтобы возможные значения показателя скорости убывания хвоста распределения принадлежали интервалу фиксированной длины; выявлены соответствующие информационные функционалы; получен аналог теоремы Пфанцаля40 о невозможности оценивания с оптимальной точностью равномерно по шарам в метрике Хеллингера (теорема 4.15); найдены нижние границы точности оценивания функции распределения выборочного максимума (теоремы 4.19-4.21). Нижние границы точности оценивания экстремальных квантилей получены впервые.
Семейство ~Н распределений с тяжёлыми хвостами весьма богато, и в литературе по статистике распределений с тяжёлыми хвостами принято37 рассматривать непараметрический класс
Г(Ь) = {Р е Н : вир\с~1ха" (1 - - ^х1**г < оо} ,
:г>1
где Ъ,ср - положительные числа. Если функция распределения (ф.р.) Р € то
1-^(;г) = сг:г;-аг(1 + 0(:г;-',0,г)) (х оо).
Теорема 4.16 устанавливает нижнюю границу точности оценивания ПСУХР. Используемый подход основан на построении двух "близких" ф.р. и /ч. Обозначим аI = аР , а* = 1/а, , есть матожидание, соответствующее Пусть
г = 6/(1 + 26) , ^ = ((4/п)6; л/п/2], = (8г/пе)ге"г2/"/2.
Теорема 4.16 Для любых Ь > 0 и а £ ■/„ существуют ф.р. ^о,^ е Ь), такие что для любой оценки ап показателя скорости убывания хвоста распределения и любой оценки ап индекса а
та(х-(4/пУч*'")'1 Ц/2{&п/аг-1)2 > гп,
ш а~т1Ьс(1 - (4/п)Ч/4) -1)2 > . (21)
Если ап в (21) заменить на ЯЕ-оценку, то левая часть (21) будет отличаться от правой части лишь на множитель ег/\/2г ■
Аналогичные теореме 4.16 нижние границы установлены также для оценок константы хвоста распределения и оценок экстремальной квантили.
Значительный класс статистик, возникающих в теории экстремальных значений, имеет вид самонормированных сумм случайных величин. Таковыми являются, к примеру, ряд оценок показателя скорости убывания хвоста распределения и экстремального индекса. Конструкция предложенной оценки экстремальной квантили также включает
СНС. К классу статистик, являющихся СНС, относятся также статистика Стьюдента и ряд непараметрических оценок плотности"11 и функции регрессии.
В главе 5 решена долго остававшаяся открытой задача получения оценок типа Берри-Эссеена с явными константами для самонормированных сумм (СНС) случайных величин.
Задача получения оценок скорости сходимости в ЦПТ восходит к Ляпунову42. Поскольку сумма случайных величин нормируется стандартным уклонением, которое в практических ситуациях обычно не известно и заменяется его оценкой, приходим к задаче о точности нормальной аппроксимации для статистики Стьюдента. Многие известные авторы работали над указанной задачей, в т.ч. Чун43, Бенткус44, Эфрон45, Жине, Гётце, Мейсон46, Гётце и Бенткус47, Холл48, Чистяков49.
В случае независимых наблюдений автором впервые получены оценки с явными константами точности нормальной аппроксимации для распределений самонормированных сумм случайных величин, включая случай неодинаково распределённых случайных величин (теоремы 5.2 и 5.3). Оценки скорости сходимости в ЦПТ для самонормированных сумм получены также в случае стационарной последовательности зависимых случайных величин (теоремы 5.4 и 5.7). На основе указанных оценок предложены под-асимптотические доверительные интервалы для оценок показателя скорости убывания хвоста распределения. Получены оценки точности нормальной аппроксимации распределений квадратичных функционалов сумм независимых случайных векторов. Неравенство типа Берри-Эссеена с явными константами для распределения статистики Стьюдента получено впервые (теоремы 5.13 и 5.18). Показано, что константа в неравенстве типа Берри-Эссеена для статистики Стьюдента не может быть лучше, чем 1/%/2е (утверждение 5.16). Установлено, что неравномерная оценка типа Берри-Эссеена для статистики Стьюдента не может имеет место без дополнительных предположений. Предложено новое доказательство характеризации нормального распределения в терминах самонормированных случайных величин. Свойство распределения быть симметричным охарактеризовано в терминах матожиданий самонормированных случайных
41Terrel G.Ii, and Scott D.W. (1980) On improving convergence rates for nonnegative kernel density estimators. — Ann. Statist., v. 8, .Y> 5, p. 1160-1163.
42Liapunov A.M. (1901) Nouvelle forme du théorème sur la limite des probabilités. — Mem. Acad. Imp. Sei. St.-Petersburg, v. 12, 1-24.
43Chung K.-L. (1946) The approximate distribution of Student's statistic. — Ann. Math. Statistics, v. 17, 447-465.
44Bentkus V. (1994) On the asymptotical behavior of the constant in the Berry-Esseen inequality. — J. Theor. Probab., v. 7, № 2, 211-224.
45Efron B. (1969) Student's i-test under symmetry conditions. — J. Amer. Statist. Assoc., v. 64, 12781302.
46Giné E., Götze F. and Mason D.M. (1997) When is the Student ¿-statistic asymptotically standard normal? - Ann. Probab., v. 25, № 3, 1514-1531.
47Bentkus V. and Götze F. (1996) Berry-Esseen bound for Student's statistic. — Ann. Probab., v. 24, .V 1, 491-503.
48Hall P. (1987) Edgeworth expansion for Student's i-statistic under minimal moment conditions. — Ann. Probab., v. 15, № 3, 920-931.
49Chistyakov G.P. (2001) A new asymptotic expansion and asymptotically best constants in Lyapunov's theorem. - Theory Probab. Appl., v. 46, 226-242, 516-522.
величин.
Квадратичные функционалы от сумм независимых случайных векторов. Пусть (X, У), (Х1, Ух),... - независимые одинаково распределенные пары случайных величин, такие что ЕХ = ЕУ = 0, ГО= 1, где
П П
= Е Х1, 5П,Г = £ , 2п=5п,х + (22)
1=1 ¿=1
(с е Е,). Обозначим
П = (пЕ[Х|3/2 + |с|ГО5п,г) , г2 = |с|!г(Е|Х|У2 + 2Е|Х||Г|Е|5„,у|),
гз = (е|Х| + пЕ|Х|3/2 + |с|ЕГ2 + 2(с|Е|Г[Е1/3!5п.х|3Е2/3|5„,у|3/2) .
Теорема 5.1 Для любого х 6 К
А„ г |Р {гп <х)~ Ф(я)| < 9гсЕ|Х|3/%/2тг + 2(п + г2 + г3) • (23)
Само-нормированные сул1мы случайных величин. Пусть (X, У), (Хь У\),... - пары случайных величин, У; > 0. Один из разделов посвящен оцениванию точности нормальной аппроксимации для распределений статистик
5„/Г„, Зп/у/Т\,
где = Xi, Тп = .
Теорема 5.2 устанавливает оценку типа Берри-Эссеена с явными константами для распределения статистики ^„д = 3„/Тп . В качестве приложения теоремы 5.2 получены оценки типа Берри-Эссеена в ЦПТ для ядерной оценки функции регрессии (следствия 5.8 и 5.9) и функции интенсивности отказов (следствия 5.10 и 5.11). В теореме 5.3 найдена асимптотика Е5„/Гп вплоть до слагаемого порядка 0(п~2) и асимптотика Е(5„/Т„)2 вплоть до слагаемого порядка 0(п~3).
Теоремы 5.4 и 5.7 устанавливают оценки скорости сходимости в ЦПТ для самонормированных сумм стационарно связанных случайных величин. Для т-зависимых случайных величин при Е|Х|3 + ЕУ3/2 < оо из результата теоремы 5.4 следует оценка порядка 0(п-1/2).
Поскольку суммы случайных величин в приложениях обычно нормируются оценкой стандартного уклонения, естественно встаёт вопрос о точности нормальной аппроксимации для распределения статистики = 8п/Тп2 , которая тесно связана со статистикой Стьюдента : если У = X2 , то
{и > х} = { С > х/у/1 + х2/п} .
Теорема 5.13 устанавливает оценку с явными константами точности нормальной аппроксимации для распределения статистики £* . Приведём следующее следствие теоремы 5.13.
Следствие 5.14 Пусть (X, Y), (Xi, У1),... - независимые одинаково распределенные пары случайных величин, такие что Y > О,
ЕХ = О, EX2 = 1, Е|Х|3 + EF3/2 < 00 .
Тогда равномерно по х > О
-ЛгГ1/2(1 + о(1)) < P(5n/(Tn/EF)1//2 <х)~ Ф(х) < Вп~1/2(1+о(1)) (24)
при п —> оо, где
А = Е|Х|3 + 9/\/27Г + -у/яуз^ + 2Е|Х| + 8|ЕХК| jesfbiWY, В = С„Е|Х|3 + 4|1ЕХУ|/е\/2^ЕУ.
В случае Y — X2 из (24) следует соответствующий результат для t„ . Утверждение 5.16 устанавливает, что константа в неравенстве Берри-Эссеена для tn и /не может быть лучше, чем
Показано, что неравномерная оценка вида
|p(i* <х) -Ф(ж)| < Сд{х)ЩХ\гп~1/2 ИЕ), (25)
где С - абсолютная постоянная и 0 < д(-) | 0, вообще говоря, не имеет место. Теорема 5.18 предлагает неравномерную оценку скорости сходимости в ЦПТ для i* при более жёстких моментных ограничениях. Константы в неравенствах теорем 5.13 и 5.18 точны в следующем смысле: показано, что для определённых распределений оценки теорем 5.13 и 5.18 для tn отличаются от оценок в равномерном и неравномерном неравенствах Берри-Эссеена для Sn/^/n лишь на множитель (1 +о(1)).
Заключительная глава содержит необходимые сведения по теории вероятностей и математической статистике, используемые в диссертации.
Публикации автора по теме диссертации
[1] Новак С.Ю. (1991) О распределении максимума случайного числа случайных величин. — Теория вероятн. и её примен., т. 36, Х- 4, 675-681.
[2] Novak S.Y. (1993) On the asymptotic distribution of the number of random variables exceeding a given level. — Siberian Adv. Math., v. 3, № 4, 108-122.
[3] Novak S.Y. (1994) Asymptotic expansions for the maximum of random number of random variables. — Stochastic Process. Appl., v. 51, № 2, 297-305.
[4j Новак С.Ю. (1994) Пуассонова аппроксимация числа длинных "повторов" в случайных последовательностях. — Теория вероятн. и её примен., т. 39, Л- 4, 731-742.
[5] Novak S.Y. (1995) Long match patterns in random sequences. — Siberian Adv. Math., v. 5, № 3, 128-140.
[6] Новак С.Ю. (1996) О распределении отношения сумм случайных величин. — Теория вероятн. и её примен., т. 41, № 3, 533-560.
[7] Novak S.Y. (1996) On extreme values in stationary sequences. — Siberian Adv. Math., v. 6, № 3, 68-80.
[8] Новак С.Ю. (1997) О распределении максимума частичных сумм Эрдёша-Реньи. — Теория вероятн. и её примен., т. 42, в. 2, 274-293.
[9] Новак С.Ю. (1997) Статистическое оценивание максимального собственного числа матрицы. — Известия ВУЗов (Матем.), т. 41, .V> 5, 49-52.
[10] Novak S.Y. (1998) On the limiting distribution of extremes. — Siberian Adv. Math., v. 8, № 2, 70-95.
[11] Novak S.Y. (2000) On self-normalized sums. — Math. Methods Statist., v. 9, № 4, 415-436.
[12] Novak S.Y. (2002) On self-normalized sums. Supplement. — Math. Methods Statist., v. 11, № 2, 256-258.
[13] Novak S.Y. (2002) Multilevel clustering of extremes. — Stochastic Process. Appl., v. 97, № 1, 59-75.
[14] Novak S.Y. (2002) Inference on heavy tails from dependent data. — Siberian Adv. Math., v. 12, № 2, 73-96.
[15] Novak S.Y. (2003) On the accuracy of multivariate compound Poisson approximation. — Statist. Probab. Lett., v. 62, № 1, 35-43.
[16] Новак С.Ю. (2004) О самонормированных суммах случайных величин и статистике Стью-дента. — Теория вероятн. и её примен., т. 49, .V3 2, 365-373.
[17] Novak S.Y. (2006) A new characterization of the normal law. — Statist. Probab. Letters, v. 77, Л* 1, 95-98.
[18] Novak S.Y. (2007) Measures of financial risks and market crashes. — Theory Stochast. Processes, v. 13, № 1, 182-193.
[19] Novak S.Y. (2010) Lower bounds to the accuracy of sample maximum estimation. — Theory Stochast. Processes, v. 15(31), № 2, 156-161.
[20] Novak S.Y. (2010) Impossibility of consistent estimation of the distribution function of a sample maximum. — Statistics, v. 44, ДЬ 1, 25-30.
[21] Novak S.Y. (2011) Extreme value methods with applications to finance. — London: Chapman & Hall/CRC Press. ISBN 9781439835746
[22] Novak S.Y. and Xia A. (2012) On exceedances of high levels. — Stochastic Process. Appl., v. 122, 582-599.
[23] Новак С.Ю. (2013) О точности оценивания характеристик распределении с тяжёлыми хвостами. — Теория вероятн. и её примен., т. 58, Xs 3, 1-13.
Мидлсекский университет
На правах рукописи
05201450700 Новак Сергей Юрьевич
Предельные теоремы и оценки скорости сходимости в теории экстремальных значений
01.01.05 - Теория вероятностей и математическая статистика
Диссертация на соискание ученой степени доктора физико-математических наук
Санкт-Петербург
2013
Введение
Теорияэкстремальных-значенийявляется-одним- из-наиболее -динамично-развивающихся разделов теории вероятностей и математической статистики. Её истоком можно считать классическую теорему Пуассона об асимптотике распределения числа редких событий; ряд задач имеет более глубокую историю (см., к примеру, Муавр (1738), задача ЬХХ1У).
Актуальность исследования асимптотических свойств распределений экстремальных значений связана с приложениями в страховом деле, финансах, метеорологии, гидрологии (см. Эмбрехтс, Клюпельберг, Микош (1997), Бейрлант, Гогебер, Тойгельс, Сегерс (2004)). К примеру, популярной мерой риска, используемой крупнейшими банками, является УаЯ (экстремальная квантиль). Задача оценивания вероятности выхода за высокий уровень имеет приложения в страховом деле.
Основы современной теории экстремальных значений заложили в начале 20-го века Мизес (1923, 1936), Фреше (1927), Фишер и Типет (1928), Гнеденко (1943). Работа де Хаана (1970) завершает классический период развития теории, посвягцён-ный изучению распределений экстремальных значений в последовательностях независимых одинаково распределённых случайных величин.
В то время как классическая теории экстремальных значений имеет дело с последовательностями независимых одинаково распределённых с.в., финансовые приложения часто демонстрируют зависимость наблюдений. Это делает актуальным изучение асимптотических свойств распределений экстремальных значений в последовательностях стационарно связанных случайных величин.
Значительный вклад в развитие теории экстремальных значений для последовательностей стационарно связанных случайных величин внесли Ньюэл (1964) и Лойнес (1965), которые фактически ввели понятие экстремального индекса. Дальнейшее развитие теории связано с работами Бермана (1962), Лидбеттера (1974), О'Брайена (1974, 1987), Мори (1977), Хсин (1987) и др..
Хсин, Хюслер и Лидбеттер (1988) установили, что предельным распределением одномерного эмпирического точечного процесса выходов за высокий уровень, учитывающего месторасположение экстремумов, является сложно-пуассоновское распределение. Это связано с тем, что в последовательностях зависимых случайных величин экстремальные значения появляются кластерами, и распределение числа редких событий слабо сходится к сложно-пуассоновскому закону.
Мори (1977) показал, что класс распределений общих процессов выходов за высокий уровень в последовательностях стационарно связанных с.в. богаче класса сложно-пуассоновских процессов. Хсин (1987) охарактеризовал предельное распределение общего двумерного процесса выходов за высокий уровень в последовательностях стационарно зависимых случайных величин в терминах двумерных точечных процессов.
Диссертация посвящена исследованию асимптотики распределения случайных величин и процессов, возникающих в теории экстремальных значений для после-
довательностей стационарно связанных с.в.. Рассматриваются такие задачи, как характеризация класса V предельных распределений общих точечных процессов, возникающих в теории'экстремальных значений^оценивание скорости-сходимости в соответствующих предельных теоремах, статистическое оценивание характеристик распределений, рассматриваемых в теории экстремальных значений, установление нижних границ точности оценивания характеристик распределений.
В диссертации получена характеризация распределений двумерных точечных процессов из класса V в терминах одномерных точечных процессов, описаны свойства распределений из класса V, установлены свойства маргинальных распределений.
Важную роль при изучении асимптотики распределения экстремальных значений играет задача установления оценок скорости сходимости в соответствующих предельных теоремах. Вопрос является нетривиальным даже в случае теоремы Пуассона. Многие известные авторы работали над указанной задачей, в том числе Прохоров (1952), Лекам (1965), Серфлин (1975), Чен (1975), Шоргин (1977), Барбур и Иглсон (1983), Варбур и Холл (1984), Деовельс и Пфайфер (1986, 1988).
Асимптотику расстояния по вариации в теореме Пуассона в случае независимых одинаково распределённых случайных величин установил Прохоров (1952). Роос (2001) получил оценку точности пуассоновской аппроксимации в терминах расстояния по вариации с неулучшаемой константой. Однако вопрос о точности сложно-пуассоновской аппроксимации долгое время оставался открытым, равно как и вопрос о точности пуассоновской аппроксимации в ряде задач теории экстремальных значений для выборок случайного объёма. Решению этих задач посвящена одна из глав диссертации. Указанные задачи имеют приложения в страховом деле при изучении распределения размера максимальных выплат страховыми компаниями.
В статистике экстремальных значений основное внимание уделяется задачам оценивания характеристик распределений с тяжёлыми хвостами. Актуальность указанной тематики связана с приложениями к финансам и страховому делу, где наблюдения зачастую оказываются зависимыми, а их распределения имеют тяжёлый хвост.
Основной характеристикой распределения с тяжёлым хвостом является показатель скорости убывания хвоста распределения. Оценка показателя скорости убывания хвоста распределения входит в конструкцию оценок экстремальной квантили и вероятности выхода за высокий уровень в последовательности стационарно связанных случайных величин.
Экстремальная квантиль широко используется банками как мера финансовых рисков. Один из методов определения страховых ставок также основан на использовании экстремальных квантилей.
В последние десятилетия тематика оценивания характеристик распределений
с тяжёлыми хвостами развивается весьма интенсивно (см. Хилл (1975), Холл (1982), Хойслер и Тойгельс (1985), Голди и Смит (1987), Декерс, Айнмаль, де
Хаан (1989), Эмбрехтс, К-люпельберг,--Микош- (1997-), Бейрлант,-Гогебер, Тойгельс.-------
Сегерс (2004). В диссертации предложены новые оценки показателя скорости убывания хвоста распределения, экстремальной квантили, вероятности выхода за высокий уровень, доказана их состоятельность и асимптотическая нормальность при минимальных ограничениях на коэффициенты перемешивания, построены пода-симптотические доверительные интервалы, предложен алгоритм выбора управляющего параметра непараметрических оценок. Полученные теоретические результаты, алгоритм выбора управляющего параметра и результаты тестирования на моделированных и реальных финансовых данных свидетельствуют в пользу предложенного подхода, в то время как ранее известные подходы оказались неудовлетворительны (см. "ужас оценки Хилл а" [326], "ужас оценки максимального правдоподобия" [122], стр. 357, 365, 406, и [232, 231]).
Важным направлением в статистике экстремальных значений является тема нижних границ точности оценивания характеристик неизвестного распределения. Этой тематике посвящены работы Холл и Вэлш (1984), Донохо и Лиу (1991), Пфанцаль (2000), Дреес (2001), Бейрлант, Буко, Веркер (2006). Однако имеющаяся литература даёт лишь частичное решение указанной задачи: найден порядок скорости убывания нижней границы, асимптотическая нижняя граница выводится при ограничениях на класс рассматриваемых оценок.
В диссертации впервые получены неасимптотические нижние границы точности оценивания характеристик распределений с тяжёлыми хвостами, выявлены соответствующие информационные функционалы.
Многие оценки в статистике экстремальных значений входят в группу статистик, являющихся самонормированными суммами (СНС) случайных величин. Таковы ряд оценок показателя скорости убывания хвоста распределения, экстремального индекса, элементы конструкции оценок экстремальной квантили и вероятности выхода за высокий уровень. Группа СНС статистик включает также статистику Стьюдента, ядерную оценку функции регрессии, оценку функции интенсивности отказов.
Раздел статистики, связанный с самонормированными суммами случайных величин, интенсивно развивается в последние десятилетия (см. Чун (1946), Эфрон (1969), Малер (1981), Славова (1985), Холл (1987), Бенткус и Гётце (1996), Жине, Гётце, Мэйсон (1997), Шао (1997), Чистяков (2001)).
В диссертации получены оценки скорости сходимости в ЦПТ для распределений самонормированных сумм независимых и стационарно связанных случайных величин; решена долго остававшаяся открытой задача получения оценок скорости сходимости с явными константами; показано, что в неравенстве типа Берри-Эссеена для статистики Стьюдента константа не может быть лучше, чем
установлено, что аналог неравномерного неравенства Берри-Эссеена, вообще говоря, не имеет места для самонормированных сумм случайных величин.
Основная цель работы - исследование асимптотических свойств распределений случайных величин и процессов, применяемых в задачах теории экстремальных значений, характеризация класса предельных распределений соответствующих случайных величин и процессов, получение оценок скорости сходимости в указанных предельных теоремах, разработка статистических методов оценивания характеристик распределений с тяжёлыми хвостами по выборкам стационарно связанных случайных величин, установление нижних границ точности оценивания характеристик распределений с тяжёлыми хвостами, выявление соответствующих информационных функционалов.
В работе применяются методы теории вероятностей и математической статистики. Кроме того, используется ряд конструкций, предложенных автором.
Глава 1
Оценки скорости сходимости в предельных теоремах для выборочного максимума
В этой главе описывается предложенный автором подход к задаче получения оценок скорости сходимости в предельных теоремах теории экстремальных значений, а также решается ряд задач теории экстремальных значений, связанных с выборками случайного объёма.
1.1 Метод рекуррентных неравенств
Пусть X, Х2,... - стационарная последовательность случайных величин. Перепишем выборку ..., Хп в невозрастаюгцем порядке:
*!,» > • • • > ХПгП . , (1-1)
Случайные величины (1.1) называются порядковыми статистиками,
Мп = Х^п
есть выборочный максимум, Хк<п ~ к-й максимум. Обозначим
п
ЛГп(х) = ЦХ1 > х} .
¿=1
Случайная величина Мп(х) называется числом выходов за уровень х. Легко видеть, что
{Хт,п <х} = {ЛГ„(ж) < т) (1 < т < п).
Поэтому Хт^п = гшп{ж : ЛГп(а;) < ш} .
В теории экстремальных значений стационарно связанных случайных величин хорошо известен метод блоков Берншнейна. Он предлагает разбивать выборку
объёма-п-на-блоки длины--т-=-г(п-)-, 1 С г < п--и-удалять из них подблоки-длины— -----
I = 1(п) г. Тогда урезанные блоки "почти" независимы, и можно применять аппарат ТЭЗ для независимых случайных величин.
Примером результа, полученного методом блоков, является следующий факт: если
limsupnP(X>un) < оо, (1.2)
п—>оо
и
[п/к]
lim lim sup У2 IP(Xi+i > un\Xi > un) = 0 , (D')
k—>00 71—>oo
t=l
to [212]
lim |P(Mn <u)~ Pn(X < u)| = 0 .
n—>oo
Недостатком метода является невысокая точность аппроксимации 1Р(МП < ип).
Метод рекуррентных неравенств состоит в составлении и решении рекуррентных неравенств для Р(М„ < и). Он позволяет получать для вероятности Р(М„ < и) оценки сверху и снизу, с помощью которых выводятся оценки точности аппроксимации в предельных теоремах для Мп . В ряде задач (к примеру, в задаче о длине наибольшей серии "успехов" [284]) метод рекуррентных неравенств позволил получить неулучшаемые оценки скорости сходимости в соответствующих предельных теоремах.
Предположим, что и = ип, и обозначим р := 1Р(Х > и) > О,
b = b(r, и) = Р(ХГ > и, Mr_ 1 < и),
если г > 1, b = Р(ХП > и) если г = 1. Заметим,что
{Мп <и} = {Mn_! <и}\ {Мп_г < и, Вп} .
Таким образом,
Рп := Р(М„ <и)= Р(МП_! < и) - Р(М„_Г < и, Вп). (1.3)
События {Мп_г < и} и Вп обычно "почти независимы". Поэтому
Рп * Рп-1 - ЬРп-г и (1 - Ь)Рп.х = ... = (1 - Ъ)п~тРт .
Так как Рг обычно близко к 1, получим
Р(М„ < и) « е-"6. (1.4)
Следующая теорема устанавливает оценку точности аппроксимации (1.4) в случае стационарной последовательности с.в., удовлетворяющей условию </?-перемеши-вания.
Пусть /л = /i(r, и) = (1 + у/1 -4(r + l)b )/2, Rn = 0 если 4(г + 1)Ъ > 1,
Яп . = /).= /М*1 ______If 4(r + Z)b.< 1
Qn = Qn(r,u,l) = (l-b)n-2r-l(l-(2r+l)p)-(r+l)b-<p(l), Vn = Vn(r,u,l) = (l-rbyn^+l»+<p(l).
Теорема 1.1 Если r,l Е IN , г > 1, г + I < п и п > Зг + 21, то
тах{^; Qn} < JP(Mn <u)<Vn. (1.5)
Следующая теорема посвящена оцениванию IP (Мп < и) в случае (m — 1)-зависимых случайных величин.
Теорема 1.2 Если случайные величины {Xi, г > 1} (т—1)-зависимы, 8mb <1 и п > 4m, то
(1 - b)n~4m - 2m(b+2p) < Р(Мп < и) < + (e-1+4m6)mp/(l-mp) . (1.6)
Замечание 1.1. Соотношение (1.6) получено методом рекуррентных неравенств. Оно означает, что точность аппроксимации (1.4) есть 0(п~1 +р). Что касается аппроксимации по методу блоков, имеет место следующая оценка [212, 284]:
IP(Мп<и) - JPn/r(Mr<u)\ < 1Р(Mr{n/r}>u) + (an(l) + 2lp)n/r + (е[п/г})~1, (1.7)
если 1 < I < п/к < п. В случае (ш—1)-зависимых с.в. естественно положить в (1.7) I = т. Тогда г = \/2тп минимизирует правую часть (1.7), и точность аппроксимации (1.7) есть 0{п~1!2 + п^^р).
Замечание 1.2. Отметим, что при 1<г<г и 0 < I < m
> и) F(Mr+m > и) - JP(Mr+l > и)
-:- >b{r,u)> ----(1.8)
г т — 1
(первое из неравенств (1.8) принадлежит О'Брайену [288]). В частности,
Р(МГ>и)/г > b{r,u) > (P(M2r>и) — Р(МГ>и))/г. (1.9)
Условие (D') было введено Лойнесом [220]. Оно означает отсутствие асимптотических кластеров экстремальных значений.
Более общим, чем (D'), является условие Ватсона [403]
lim P(Xi+1 > ип\Хг >ип) = 0 (Vi 6 IN). (1.10)
п—>оо
Следующая теорема дополняет результат О'Брайена [288], показавшего, что условие Ватсона (1.10) влечёт (1.12).
Теорема 1.3 Предположим, что lim ср(1) = 0 и
1—юо
О < limM^F^^it^Xlimsup-nF^^uö^'OO. - ----(1-11)
п->оо п->оо
Если
Р(Мп < ип) - ехр (—ггР(Х > ип)) -> 0, (1.12)
то имеет место (1.10).
Отметим, что
Р(Х < ип) - ехр (-nP(X > ип)) = 0(п-1)
(см. (2.65)).
1.2 Экстремальный индекс
Экстремальный индекс позволяет описывать асимптотику распределения выборочного максимума Мп = maxi<j<nXi по отношению к максимуму п независимых копий с.в. X. Этот раздел посвящен понятию экстремального индекса (ЭИ) и его роли в описании асимптотики распределения экстремальных значений выборки.
Пусть X, Х\,Х2,... - стационарная последовательность с.в..
Определение 1.1. Последовательность {Xi,i > 1} имеет экстремальный индекс в, если
P(Mn < ип) -exp(-0nPpf>«n)) 0 (1.13)
для любой последовательности {«„}, такой что
О < lim inf nP(X >ип) < lim sup nP(X >un) < oo . (1-14)
71—>oo n—юО
Иными словами, последовательность {Xi,i > 1} имеет ЭИ 9, если
Р(МП < ип) - Рбп(Х < ип) -> 0 (1.13*)
для любой последовательности {ип} удовлетворяющей (1.14).
Согласно традиционному определению ЭИ [212, 122], последовательность с.в. {Xi, г > 1} имеет экстремальный индекс в если (1.13) выполнено для каждой t > 0 и ип = un(t), таких что выполнено (1.15). Использование (1.14) вместо (1.15) позволяет сделать определение ЭИ более гибким.
Рассмотрим, к примеру, последовательность X,Xi,X2,... н.о.р.с.в. с геометрическим распределением Р(Х = k) = (1 — р)рк~1, к > 1, р е (0; 1). Тогда (1.15)
не выполнено (заметим, что (3.10) равносильно (1.15), см. Теорему 1.7.13 в [212]), и Мп не имеет предельного распределения. Тем не менее,
п!Р(Х > [1о^/рп] + з) = рМ^/Р») ,
и (1.13) выполнено с 9 = 1. Следовательно, последовательность имеет экс-
тремальный индекс.
Если последовательность {Хг,г > 1} имеет ЭИ 9, условие перемешивания Д{и„} выполнено и пР(Х > ип) —» т при п —> оо (т.е. ип есть асимптотическая верхняя квантиль уровня т/п), то
Ит Р (Мп < и[пвт/1]) = е~* (V* > 0).
71->00 4 1 ' "
Таким образом, знание ЭИ и верхней квантили позволяет строить нормирующую последовательность для Мп: если 9 - оценка ЭИ и ип - оценка ^с_1(1/п), то
1Р (Мп < пМ/4]) « е-4 (V* > 0).
Пусть К* обозначает правую грань носителя С(Х), и = ип,
п
р = 1Р(Х > и), Мт,п = тах Хк, ЛГП = V* > и} .
тп<к<п ' *
г=1
Будем считать, что р > 0. Обозначим
вп{г, и) = Р(М1;Г < и\Хх > и), 9В{г, и) = Р(МГ > и)/гЩХ > и). Если и < К*, то
0 < 0Я(г,«) < 1, 0 < 9В{г, и) < 1.
Как уже было отмечено,
Р(МП < и) « ехр 9В(г,и)пр^ (ср. с (1.7)). Согласно теореме 1.1 (см. также теорему 1.2),
Р(МП < и) и ехр вЛ(г, и)пр). Следовательно, 9п и 9В можно использовать для аппроксимации 9.
Необходимые и достаточные условия существания экстремального индекса изучались рядом авторов. Лидбеттеру принадлежит следующее утверждение.
Утверждение 1.4 [211] Предположим, что (3.10) и условие (D{un}) выполнено для последовательности {un} такой, что
3" lirnnP(X>ип)Щ0,Ъс)~: (1.Т5)"
п—>оо
Тогда последовательность {Xi,i > 1} имеет экстремальный индекс в, если и только если
lim limsup |0 - вВ{[п/г],ип)\ = 0 . (1.16)
Соотношение (1.16) означает, что в можно аппроксимировать с помощью относительно "больших" блоков.
Теорема 1.5 Пусть последовательность уровней {ип} удовлетворяет соотношению (1.14) и условию перемешивания (£){un}). Последовательность {Xi,i > 1} имеет экстремальный индекс в, если и только если
lim limsup \в-в\г,ип)\ =0. (1.17)
r-юо „^оо
Соотношение (1.17) равносильно следующему:
lim limsup |0 — 0В(г, ип)\ = 0 . (1.18)
»■-> ОО п^оо
Утверждение теоремы 1.5 устанавливает возможность аппроксимации 0 с помощью относительно "малых" блоков.
Отметим, что 1/0 можно интерпретировать к�