Статистический анализ и проверка гипотез о распределении экстремумов временного ряда

Родионов, Игорь Владимирович

Статистический анализ и проверка гипотез о распределении экстремумов временного ряда тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Родионов, Игорь Владимирович АВТОР

кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ

Москва МЕСТО ЗАЩИТЫ

2013 ГОД ЗАЩИТЫ

01.01.05 КОД ВАК РФ

Диссертация по математике на тему «Статистический анализ и проверка гипотез о распределении экстремумов временного ряда»

Автореферат диссертации на тему "Статистический анализ и проверка гипотез о распределении экстремумов временного ряда"

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М. В. ЛОМОНОСОВА

МЕХАНИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬТЕТ

На правах рукописи УГ

Родионов Игорь Владимирович

СТАТИСТИЧЕСКИЙ АНАЛИЗ И ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИИ ЭКСТРЕМУМОВ ВРЕМЕННОГО РЯДА

01.01.05 — теория вероятностей и математическая статистика

Автореферат

диссертации на соискание учёной степени кандидата физико-математических наук

2014

005545115

Москва 2014

005545115

Работа выполнена на кафедре теории вероятностей механико-математического факультета Московского государственного университета имени М. В. Ломоносова.

Научный руководитель:

доктор физико-математических наук,

главный научный сотрудник Питербарг Владимир Ильич.

Официальные оппоненты:

доктор физико-математических наук Маркович Наталья Михайловна, Институт проблем управления РАН, главный научный сотрудник лаборатории №38.

кандидат физико-математических наук, Кудров Александр Владимирович,

Центральный экономико-математический институт РАН, научный сотрудник лаборатории

вероятностно-статистических методов и моделей в экономике.

Ведущая организация:

Санкт-Петербургский государственный университет.

Защита диссертации состоится 14 марта 2014 года в 16 часов 45 минут на заседании диссертационного совета Д 501.001.85 при Московском государственном университете имени М. В. Ломоносова по адресу: Российская Федерация, 119991, Москва, ГСП-1, Ленинские горы, д. 1, МГУ, механико-математический факультет, аудитория 16-24.

С диссертацией можно ознакомиться в Фундаментальной библиотеке МГУ имени М. В. Ломоносова.

Автореферат разослан

Учёный секретарь диссертационного совета

Д 501.001.85 при МГУ

доктор физико-математических наук,

профессор

В. Н. Сорокин.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Классическая теория экстремумов — асимптотическая теория распределения максимума

Мп = max(Xi,..., Хп),

где Хх,...,Хп - независимые одинаково распределённые случайные величины, — начала активно развиваться около полувека назад, хотя её корни уходят глубоко в историю математики. В основе теории лежит фундаментальный результат, полученный Фишером и Типпетом1 и позднее обобщённый Б.В. Гнеденко2 - теорема об экстремальных тинах, также известная как теорема Фишера-Типпета-Гнеденко, которая описывает все возможные формы распределения Мп при линейной нормировке. Строго говоря, Б.В. Гнеденко доказал, что если для некоторых числовых последовательностей ап > 0, Ьп случайная последовательность ап(Мп — Ьп) имеет невырожденное предельное распределение, т.е. существует такая невырожденная функция распределения G(x), что

Р (ап{Мп - Ьп) < х)-► G(x), (1)

n—loo

то G принадлежит одному из трёх экстремальных типов (т.е. существуют такие константы а > 0 и Ь, что функция распределения Н(х) := G(ax + Ь) в точности равна одной из указанных ниже функций распределения):

Тип I: G0(x) = ехр(—е~г), iSR.

Тип II: Gy(x) = I ехР(-^/7)> ^ > 0,7 > О,

О, X < 0.

Тип III: G.7(x) = { ехР(-(-^)1/7)' * < 0,7 > 0,

i 1, X > 0,

где Go(x) - так называемое распределения Гумбеля, С?7(х) - класс распределений Фреше, a G-7(x) - класс распределений Вейбулла. Параметр 7, возникающий в теореме Фишера-Типпета-Гнеденко, называется экстремальным индексом. Пусть F{x) - маргинальная функция распределения случайной последовательности {Xi}~¡^. Тогда в случае независимых наблюдений верно

Р(Мп < х) = Fn(x),

'Fisher R.A., Tippet, L.H.C.. Limiting forms of the frequency distribution of the largest or smallest member of a sample. Proc. Cambridge Phil. Soc., 24 (1928), 180-190.

2Gnedenko B.V.. Sur la distribution limite du terme maximum d'une série aléatoire. Ann. Math., 44 (1943), 423-453.

т.е. (1) можно переписать в следующем виде:

Fn(a^x + bn)-(2)

п—юо

Если для некоторых числовых последовательностей ап > 0 и Ьп выполнено (2), то говорят, что F принадлежит области притяжения распределения G, и пишут F £ D{G). Известны критерии, дающие необходимые и достаточные условия принадлежности F области притяжения того или иного экстремального типа (см. например 3 или 4). Однако есть распределения, которые не принадлежат ни одной из трёх областей максимального притяжения, например, пуассоновское распределение.

К сегодняшнему дню классическая теория экстремумов сформировалась полностью и имеет большое количество различных приложений (см. например книгу Гумбеля5). Позднее, начиная с работ Крамера, Лойнса, Бермана, Лидбеттера и Уотсона. возник интерес к расширению классической теории на последовательности зависимых случайных величин и на стационарные процессы с непрерывным временем. Развитие шло в следующих направлениях: создание Теории для гауссовских процессов с непрерывным временем (Крамер) и стационарных последовательностей (Берман, Лидбеттер), а также доказательство результатов классической теории для некоторых типов зависимостей случайных величин (Уотсон, Лойнс).

Впоследствии Лидбеттер, Лингрен и Ротцен3, объединив два этих направления, создали достаточно общую теорию, которая включала и полученные к тому моменту результаты для гауссовских стационарных последовательностей и процессов. Так, Лидбеттер6 7 показал, что результаты классической теории, при некоторых ограничениях на зависимость далеко отстоящих членов последовательности, остаются в силе для стационарных последовательностей и некоторых важных нестационарных случаев. При этом предложенное Лидбеттером условие перемешивания оказалось слабее, чем такая существовавшая на тот момент форма ограничения зависимости, как предложенное Розенблаттом8 в 1956г. условие сильного перемешивания, использованное им при доказательство центральной предельной теоремы для так называемых "слабо зависящих" случайных величин. Итак, приведем то

3Leadbetter M.R, Lindgren G., Ro^"™ H.. Extremes and related properties of random sequences and processes. Springer Statistics Seri~- ßerlin-Heidelberg-New York: Springer, (1983).

4Fereira A., Haan L. de extreme value theory. An introduction. Springer Series in Operations Research and Financial Engine" 'n9- N. Y.: Springer, (2006).

5Gumbel Е.Д- Statistics of Extremes. New York, Columbia Univ. Press, год!

6Lead>"»t,er M.R.. On extreme values in stationary sequences. Z. Wahrscheinlichkeitstheorie verw. Gebiete 28 fif4), 289-303.

'Leadbetter M.R.. Extremes and local dependence in stationary sequences. Z. Wahrscheinlichkeitstheorie verw. Gebiete, 65 (1983), 291-306.

8Rozenblatt M.. A central limit theorem and strong mixing condition. Proceedings of the National Academy of Sciences USA, 42 (1956), 43-47.

условия перемешивания, о котором идет речь. Пусть

Fi1,...,i,Xxb---,xn) = P(Xh <xu...,Xin <хп),

где {Хг},>1 - стационарная в узком смысле случайная последовательность. Обозначим Fiu...tin(u) = ^^..„¿„(u,... ,и) для любого набора индексов ¿1,... , г„. Пусть ип - некая числовая последовательность. По определению, случайная последовательность удовлетворяет условию D(un), если найдётся такая последовательность чисел {ап./}, п,1 = 1,2,..., и последовательность натуральных чисел 1п, где 1п = о(п) и anjn —> 0 при п —> оо, что для любого набора индексов ц, ■ ■ ■ ,ip,ji, ■ ■ ■ ,jq такого, что

1 < ц < ... < ip < ji < ... < jq < n и ji-ip>ln, выполнено неравенство

~ Fh,-,iP(un)Fjl,...,jJun)\ < a„Ai.

Для исследования областей притяжения в теореме об экстремальных типах в случае зависимых последовательностей (см., например, работу Лойнса9), а также в задаче нахождения вероятности превышения заданного уровня максимумом по зависимой последовательности (см. работу Уотсона10) используется условие D'(un), гарантирующее отсутствие предельной кластеризации высоких экстремумов:

[п/Щ

lim sup п YJ Р(Х 1 > un,Xi> и„) 0 при к —> оо, "-400 ¿=2

где [.] обозначает целую часть числа. Точечные процессы превышения заданного уровня в применении к стохастической теории экстремумов впервые были рассмотрены Лидбеттером11. Он показал, что моменты превышения очень высоких уровней носят стохастический характер и что для таких уровней этот точечный процесс при выполнении условий D(un) и D'{un) сходится по распределению к пуассоновскому процессу. В дальнейшем метод Лидбеттера в применении к стационарным процессам был использован в таких работах, как 12 13.

9Loynes R.M.. Extreme values in uniformly mixing stationary stochastic processes. Ann. Math. Statist., 30 (1965), 993-999.

10Watson G.S.. Extreme values in samples from m-dependent stationary stochastic processes. Ann. Math. Statist., 25 (1954), 798-800.

llLeadbetter M.R.. Point processes generated by level crossings. In: Stochastic point processes, Ed. P. A. W. Lewis. New York: Wiley, (1973).

12Кузнецов Д.С.. Предельные теоремы для максимума случайных величин. Вестник МГУ, Сер. Машем. Механ., 3 (2005), 6-9.

13Kudrov А.V., Piterbarg V. I.. On maxima of partial samples in Gaussian sequences with pseudo-stationary trends. Liet. matem. rink., 47(1) (2007), 1-10.

Задача оценки экстремального индекса с использованием выборки как независимых, так и зависимых случайных величин, была предметом исследования большого количества авторов (см. 14 15 16 17 18). Одной из наиболее известных оценок экстремального индекса является оценка Хилла14. Пусть последовательность независимых одинаково распределённых случайных величин имеет функцию распределения Р, которая принадлежит области максимального притяжения Фреше. Определим

^ к-1

¿—О

где < Х(2) < ... < Х(п) - вариационный ряд выборки {^¡}™=1- Тогда при п —> оо, к = к(п) —> оо и к/п —> 0 оценка Хилла 7я сходится по вероятности к экстремальному индексу.

Другой, не менее известной оценкой экстремального индекса является оценка Пикандса19:

Х(п-2к) ~ Х(п-4к)

Если Р £ £(С?7), где 7 & И, то при тех же условиях на п и к, что и для оценки Хилла, оценка Пикандса 7р сходится по вероятности к экстремальному индексу. Известно также20, что оценка максимального правдоподобия, построенная по первым (максимальным) к членам вариационного ряда, при тех же условиях напи^; сходится по вероятности к экстремальному индексу, при условии, что 7 > —1/2.

В работе16 показано, что при выполнении условия второго порядка на функцию распределения F

Цт х-т * =

А 7Р

где параметры 7 > 0, р < 0, а функция А{Ь) — знакопостоянная, причём

14Hill B.M.. A simple general approach tu inference about the tail of a distribution. Ann. Statist., 3 (1975). 1163-1174.

15Hoal P.. On some simple estimates of an exponent of regular variation. Journal of the Royal Statistical Society, B44(1982), 37-42.

16Hausler E., Teugels J.L.. On the asymptotic normality of Hill's estimator for the exponent or regular variation. Ann. Statist., 13 (1985), 743-756.

"Dekkers A.L.M., de Haan L.. On the estimation of the extreme-value index and laige quantile estimation. Ann. Statist., 17 (1989), 1795-1832.

18Hsing T.. On tail index estimation using dependent data. Ann. Statist., 19 (1991), 1547-1569.

"Pickands J. III. Statistical inference using order statistics. Ann. Statist., 3 (1975), 119-131.

20Drees H., Ferreyra A., de Haan L.. On maximum likelihood estimation of the extreme value index. Ann. Appl. Probab., 14 (2003), 1179-1201.

lim A(t) = 0, при n -> oo, к — k(n) -> со и k/n 0 оценка Хилла Удивляется асимптотически нормальной

где N(0,1) - стандартная нормальная случайная величина, Л - конечный параметр и lim укА (?) = А. Известно, что при похожих условиях оценки

n-> oo

Пикандса и максимального правдоподобия также являются асимптотически нормальными оценками экстремального индекса (см. 4).

Задача различения распределений - одна из важнейших задач математической статистики, которая являлась предметом изучения множества авторов (см. 21 22 23 24). Одним из ключевых инструментов при решении данной задачи является лемма Неймана-Пирсона, которая позволяет найти равномерно наиболее мощный критерий для различения двух произвольных распределений при использовании отношения правдоподобий. Довольно часто используется также метод отношения максимальных правдоподобий (RML-test), впервые использованный в работе21 (см. 25 26). Решение некоторых задач различения распределений, принадлежащих области максимального притяжения Гумбеля. можно найти в работах 27 28.

Метод Лапласа асимптотических,оценок интегралов, содержащих большой параметр, широко известен и применяется для решения многочисленных задач математики, физики, механики и техники (см. монографию 29). В

отличие от классического метода Лапласа, когда изучается асимптотическое

разложение интеграла L{А) = / f(x)exs(-^dx при А -> +оо, в диссертации

__ +00

исследовано асимптотическое разложение интеграла £-(А) = f e~s^dx при

А —> +оо и lim = +оо, что позволяет оценивать стохастические инте-

х—k+оо шх

21Сох D.R.. Tests of separate families of hypotheses. Proceedings of the Fourth Berkeley Symposium in Mathematical Statistics and Probability, Berkeley, University of California Press, (1961), 105-123.

22Atkinson A.. A method for discriminating between models (with discussions), J. R. Statist Soc. Ser. В 32 (1970), 323-353.

23Dyer A.R.. Discrimination procedure for separate families of hypotheses. J. Am. Statist. Assoc., 68 (1973), 970-074.

24Bain L.J., Engelhardt M.. Probability of correct selection of Weibull versus gamma based on likelihood ratio. Commun. Stat. Ser. A 9 (1980), 375-381.

25Dumonceaux R., Antle C.E.. Discrimination between the log-normal and the Weibull distributions. Technometrics, 15 (4) (1973), 923-926.

26Dumonceaux R., Antle C.E., Haas G.. Likelihood ratio test for discrimination between two models with unknown location and scale parameters. Technometrics, 15 (1) (1975), 19-27.

27Gupta R.D., Kundu D.. Discriminating between Weibull and generalized exponential distributions. Computational Statistics and Data Analysis, 43 (2) (2003), 179 - 196.

28Kundu D., Raqab M.Z.. Discriminating Between the Generalized Rayleigh and Log-Normal Distribution. Statistics, 41 (6) (2007), 505-515.

29Федорюк M.B.. Метод перевала. M., (1977).

гралы, возникающие в задаче различения близких гипотез.

Задача различения близких гипотез о распределениях является ключевой для теории контигуальных мер (см. монографию30, а также 31). Пусть {f(x, в), 9 G G} - некое семейство плотностей распределений. При выполнении некоторых условий регулярности, наложенных на это семейство плотностей (подробнее см.32), распределение логарифма отношения правдоподобий при условии, что выборка взята из распределения с плотностью f(x, в), слабо сходится к нормальному закону при п —> оо

где t(n) = n"1/2, h —- произвольная константа, а Г(0) - функция, зависящая от распределения.

Цель и задачи исследования.

Целью диссертации является изучение предельного поведения статистических оценок экстремального индекса в условиях зависимости и загрязнения наблюдений и проверка близких статистических гипотез об экстремальном индексе распределения. Среди задач исследования выделяются следующие.

• Асимптотический анализ поведения точечных процессов высоких экстремумов при условии загрязнения данных.

• Изучение асимптотических свойств оценок экстремального индекса в условиях растущего загрязнения.

• Построение общих критериев различения гипотез о распределениях из области максимального притяжения Гумбеля.

Научная новизна.

Представленные в диссертации результаты являются новыми, полученными автором самостоятельно. Основные результаты диссертации следующие.

• Доказана пуассоновская предельная теорема для высоких экстремумов временного ряда с сезонной составляющей и монотонным трендом.

30Русас Дж.. Контигуальность вероятностных мер. М.: Мир, (1975).

31Чибисов Д.М.. Лекции по асимптотической теории ранговых критериев. МИАН, Лекц. курсы НОЦ, 14 (2009), 3-174.

3JLe Cam L.. On the assumptions used to prove asymptotic normality of maximum likelihood estimates. Ann. Math. Stat., 41 (1970), 802-828.

L In

UfW)

i=1

• Доказана состоятельность и асимптотическая нормальность оценки Хилла экстремального индекса для модели с асимптотически растущим аддитивным загрязнением.

• Найдено асимптотическое распределение отношения правдоподобий, построенного по первым членам вариационного ряда выборки, для близких гипотез о распределениях вейбулловского и лог-вейбулловского типов.

Методика исследования.

В диссертации используются как классические методы теории вероятностей и теории случайных процессов, такие как предельная теорема Фишера-Типпета-Гнеденко1,2, метод отношения правдоподобий30, метод представления Реньи33, теорема Калленберга34, так и методы математического анализа, такие, как метод Лапласа и метод перевала29, а также специальные методы стохастической теории экстремумов, такие как лемма Лидбеттера11.

Теоретическая и практическая значимость.

Диссертация носит теоретический характер. Ее результаты могут найти применение в стохастической теории экстремумов, теории контигуальных мер, а также использоваться в финансовой сфере.

Апробация работы.

По теме диссертации были сделаны доклады на следующих семинарах механико-математического факультета МГУ им. М. В. Ломоносова:

• Большом семинаре кафедры теории вероятностей под руководством действительного члена РАН, профессора А. Н. Ширяева (2013 г.),

• Семинаре "Гауссовские случайные процессы"под руководством проф. В.И. Питербарга (2009-2013 гг., неоднократно),

а также на семинаре "Статистика экстремальных значений" под руководством д.ф.-м.н., гл.н.с. Н.М. Маркович, Институт проблем управления РАН (2013).

Результаты диссертации докладывались на:

• Международной конференции "Ломоносов-2011" (МГУ, Москва, 2011)

• Международной конференции "Теория вероятностей и её приложения", посвященной столетию со дна рождения Б.В.Гнеденко (МГУ, Москва, июнь 2012)

• Международной конференции "Ломоносов-2013" (МГУ, Москва, 2013)

"Reiss R. Approximate Distributions of Order Statistics. Springer, Berlin, (1989).

34Kallenberg О. Random measures. N.Y.: Academic Press, (1983).

• International Workshop "Stochastic, Analysis and Geometry" (Ульм, сентябрь 2013);

Публикации.

Результаты диссертации опубликованы в пяти работах, из которых две — в журналах из перечня ВАК, одна депонирована в ВИНИТИ. Список работ приведен в конце автореферата [1-5].

Структура и объем работы.

Диссертация изложена на 70 страницах и состоит из введения, двух глав и списка литературы, включающего 46 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении приводится краткий обзор исследований, посвященных вопросам статистической теории экстремумов. Историческая справка подкрепляется соответствующими ссылками на научные работы. Кроме того, во введении объясняется актуальность темы и научная новизна предпринятого автором исследования.

В первой главе диссертации рассматриваются статистические оценки характеристик экстремумов в модели выборок с загрязнениями. В первом параграфе рассматривается модель

Yi,n = Xi + anrrii + anh ^^ , г, n e N, n oo (3)

где {X{, i = 1,2,...} — строго стационарная случайная последовательность, {rrii, i = 1,2,...} — тренд, ведущий себя стационарным образом в определенном ниже смысле (например, сезонная составляющая), h — монотонная функция, ап — последовательность нормировочных констант из теоремы Фишера-Типпета-Гнеденко35. Предполагается, что функция распределения F(x) случайной величины Х\ является максимально устойчивой. Далее, определяется случайный загрязненный процесс высоких экстремумов ограниченных борелевских подмножествах В действительной прямой:

g{B) = #{k:Yk>anz + bn,kenB}, п = 1,2,..., (4)

где символом # обозначается число точек конечного множества; ап,Ьп — те же последовательности нормировочных констант из теоремы Фишера— Типпета—Гнеденко, соответствующих функции распределения F; z — действительное число. На точечный процесс высоких экстремумов налагаются следующие условия.

35Fereira А., Haan L. de.. Extreme value theory. An introduction. Springer Series in Operations Research and Financial Engineering. N. Y.: Springer, (2006).

Условие 1. Последовательность {rrij, i = 1,2,...} ограничена сверху:

m := sup rrii < оо. ¿=1,2,...

Обозначим

Wi = апх + Ьп — anmi — anh{—),

wn = апх + Ьп — апт — anh, где h = sup/¡.(я). Обозначим также £г(/) = #{fc : Yk > anz + bn,k e /}.

xeB

Введем условие типа Лидбеттера36 слабой зависимости далеко отстоящих больших значений в модели (3).

Уоговие 2. Найдутся семейство чисел {ап,г}> n,l = 1,2,..., и последовательность натуральных чисел {/п}, такие, что 1п = о(тг), anjn —>• 0, для любых z, для любых неотрицательных целых г и s и произвольных множеств натуральных чисел I — {¿1,..., ip}, J — {ji,..., jq}, таких, что

1 < ii < ¿2 < ... < ip < ji < ... < jq < 71, ji -ip~Z l„,

выполняется неравенство

\P(m = Г,Ш = s)~ Р(Ш = г)Р(Ш = 5)1 < anA,

Следующее условие, как и предыдущее, являющееся стандартным для вероятностной теории экстремумов, гарантирует отсутствие предельной кластеризации высоких экстремумов30.

Условие 3. Выполняется равенство

lim lim sup п V Р{Хi > wn;Xj > wn} = 0.

fc-юо n_voo „ . „ 2sJj gn/fc

Далее, вводится "выборочная функция распределения" значений сезонной составляющей для наблюдаемых Yi, а также аналогичную функцию для монотонного тренда

, . _ #{г : гщ < х, l^i^n} в _ #{г : < х, i € пВ} nW" п ' - •

Обозначим

Ф.(®) = lim Ф„(х); Нв{х) = lim Н?(х).

п—юо п—>ос

36Leadbetter M.R, Lindgren G., Rootfen H.. Extremes and related properties of random sequences and processes. Springer Statistics Series. Berlin-Heidelberg-New York: Springer, (1983).

Обозначим также

{е z, z £ R если 7 = 0; z-^I{z > 0}, если 7 > 0; {-z)~l^I{z < 0}, если 7 < 0. ■■

Основной результат первого параграфа касается предельного распределения случайного точечного процесса £"(5).

Теорема 1. Пусть в модели (4) F 6 D(Gy), где 7 6 Я. Предположим, что выполнены условия 1—3. Тогда если 7 > 0, то для всех z, а если 7 < 0, то для всех z > т случайный точечный процесс экстремумов слабо

сходится при п —> оо к пуассоновскому точечному процессу с функцией интенсивности

+ 00

л г(в) = J f,(z-t)d(m^(t)+HB(t)),

—00

где ц — мера Лебега на действительной прям,ой.

Во втором параграфе первой главы исследуется состоятельность и асимптотическая нормальность оценки Хилла экстремального индекса37 в модели

Yi,n = Xi + mt>, n = 1,2,..., (5)

где Х^ — последовательность независимых, одинаково распределенных случайных величин, функция распределения которых F принадлежит области максимального притяжения Фреше с индексом 7; 1 < г < п, п — 1,2,..., — аддитивное загрязнение, максимальная величина которого может расти вместе с п. Обозначим Сп := max{|m,-in|, 1 < i < гг}, будем считать, что асимптотика последовательности Сп нам известна. Оценкой Хилла экстремального индекса 7 для модели (5) назовём статистику

1 fc-i

7я = Г Е1п^(п-о) - Чу(«-*)). (6)

к »=о

где (У(х) < У(2) < ... < У(„)) — вариационный ряд выборки {У,п}"=1. Предположим, что функция распределения F имеет плотность, обозначим ее F'. Автором показано, что в случае, если загрязнение существенно меньше о„, где ап - последовательность нормировочных констант из теоремы Фишера-Типпета-Гнеденко, оценка Хилла (6) сохраняет свойства состоятельности и асимптотической нормальности.

Основным результатом параграфа является следующая

37НШ D.M.. А simple general approach to inference about the tail of a distribution. Ann. Statist., 3 (1975), 1163-1174.

Теорема 2. Пусть для некоторой последовательности кп, такой, что кп/п —> 0 при п —> оо и к„ —» оо, выполняется соотношение тг^— —>

'Ми)

О (или, что эквивалентно, существует е > О, такое, что с„/ап = 0{к{п)~1~е)). Тогда оценка Хилла (6) сходится по вероятности к 7 при п —> оо. Кроме того, если функция распределения ^ удовлетворяет условию

_ д.-1/Т о/, ,

7Р

для всех х > 0, где р < 0 и А{Ь) — положительная или отрицательная функция с Нш^ооА(Ь) = 0, то при всех кп, таких, что А 0 (или,

что эквивалентно, ^ = О 2 дм некоторого е > 0 при п оо), верно соотношение

-7

где ЛГ — стандартное нормальное распределение, кп —► оо, /с„/гг 0, п ->• оо и

lim у/кпА ( — ) = Л

с конечным А.

Вторая глава диссертации посвящена задаче нахождения критериев различения близких гипотез о хвостах распределений из области максимального притяжения Гумбеля. Пусть {Xi,i = 1,... ,п} - независимые одинаково распределенные случайные величины, имеющие плотность распределения f(x,7). Исследуется асимптотическое поведение отношения правдоподобий

ТУ Л, Л _ • • • , Xn-^ + l.ni 7 + ¿(fcn, ц))

FTy У ~л 1 (.'J

построенного по верхним к„ членам вариационного ряда выборки при п —> оо, кп —> оо, —> оо для семейства плотностей

"-U

7) = С{х, 7) ехр(-7)). (8)

Обозначим

SC®, 7) = 7) - In С(®, 7). Будем считать, что С(х, 7) = 61(7) 4- С2(y)x~ß + R(x), ß > 0, при х оо, где остаточный член R(x) = o(x"ß) не зависит от 7 и четырежды непрерывно дифференцируем, а функция S(x, 7) строго монотонна по а: и четырежды непрерывно дифференцируема по паре переменных при х > 10(7) > О-Следующие условия регулярности, налагаемые нами на семейство распределений f(x,7), назовём условиями регулярности первого типа.

1. Существует е — £(7) > 0 такой, что ^т^ +оо при х +оо.

2. Любая из частных производных функции S(x, 7) вплоть до четвертого порядка Ф 0 или = 0 при х > 2:0(7), а также имеет конечный или бесконечный предел при х +оо.

3. Существует конечный предел при х +оо выражений вида

' где ^х' ^ — любая частная производная функции S(x, 7) вплоть до третьего порядка и F(x, 7) ф 0 при х > £оЫ-

4. Для fc = 1,2,3 выполнено lim

х->+00 1п 5(2,7)

водные не равны 0 тождественно.

= 1, если эти частные произ-

Стоит заметить, что класс распределений, удовлетворяющий условиям регулярности первого типа, довольно широк и содержит такие семейства распределений, как, например, семейство вейбулловского типя или нормальное семейство распределений. Обозначим

/п - кп

где F(x, 7) - функция распределения, имеющая плотность f{x, 7), а 7) = inf{i : F{x,7) < t}. Также будем писать Sxy(an/kn,"f + t(kn,u))

d2S(x,7) I

вместо о v,^ и аналогично для других частных произ-

водных функции S(x, 7). В следующей теореме найдено предельное распределение отношения правдоподобий Rn(u) для лёгких хвостов при медленно растущей последовательности кп:

Теорема 3. Пусть для семейства плотностей f(x, 7) выполнены условия регулярности первого типа, п —> оо, кп —» оо, причём выполнено огедующее условие: Зг, 0 < е < 2, такой, что

lim „ . = 1.

п->со (In f-Y

Тогда при t(kn,u) = jrs*i(al/k ''7) и п 00 выполнено

d. „ { и2 2

1пД„(и) Л N

Если же исследовать асимптотическое поведение отношения правдоподобий 11п{и) (7) при п оо, —¥ оо и быстро растущей последовательности кп (кп ~ где а е (0,1)) для семейства плотностей /(2,7) (8), то нам потребуются несколько другие условия регулярности, налагаемые нами на это семейство:

1. Существует г = £(7) > 0 такой, что +°о при х -> +оо.

2. Существует 5 = 0(7), 5 е [0,1), такое, что lim /^»Д = 0.

Х->+00

3. Любая из частных производных функции S(x, 7) вплоть до четвертого порядка ф 0 или = 0 при х > 2:0(7), а также имеет конечный или бесконечный предел при х -> +оо.

4. Существует конечный предел при х +оо выражений вида г&^Ъхф 7)' где l) ~ Л1°бая частная производная функции S(x, 7) вплоть до третьего порядка и F(x, 7) ф 0 при х > Хо{у)-

5. Для к = 1,2,3 выполнено lim -у-^—г

х-»+ос mail,7j

водные не равны 0 тождественно.

= 1, если эти частные произ-

Класс распределений, удовлетворяющий условиям регулярности второго типа, содержит такие семейства распределений, как, например, семейства лог-вейбулловского и вейбулловского типов или лог-нормальное семейство распределений. Обозначим

(

Н(х)

/ 57(у, 7) exp (-S{y, 7 ))dx

СО

f exP(—S(y,j))dx

-S7(x, 7)-

-5x7 (a;, 7)

' 5x^,7) (5x(X,7))2+ №,7))3

_ Sxx{x, 7)

При ЭТОМ функция Я (г) = - si(x£) (1 + °(1)) ПРИ Ж

Теорема 4. Пусть для семейства плотностей f(x, 7) выполнены условия регулярности второго типа, п -»■ 00, fc„ 00, причём выполнено следующее условие: Бе, 0 < е < 2, такой, что

lim ^ = 1.

п-+оо 71е

Тогда ггри t(kn) = -4U выполнено

•/kl S^(an/kn ,7)

Y/i ^ А i _лг г_

2 '

lnii^u) - \/КН{ап/кп) Л exp ( -ЛГ | —

и2 2

при п —> +оо.

Стоит заметить, что как в теореме 3, так и в теореме 4 предельное распределение логарифма отношения правдоподобий R„(u) не зависит от 7, что весьма удобно для построения критерия.

Далее, во второй главе также исследовалась задача нахождения вероятностей редких событий для рассматриваемых типов распределений. Изуча-

•+■ 00

ется поведение интеграла F(q) = f exp(—S(x))dx при q +00. Пусть для

функции S{x) выполнены следующие условия регулярности:

1. ^ +оо при х -»• +00.

2. Начиная с некоторого хд > 0, S(x) - строго монотонная функция.

3. Начиная с некоторого х\ > 0, S{x) четырежды непрерывно дифференцируема. Кроме того, первая, вторая и третья производные функции S(x, 7) имеют конечный или бесконечный предел при х —> +оо.

dk+1S(x)

4. Для к = 1,2,3 lim , = 0.

1-++00

Легко видеть, что как условия регулярности первого типа, так и условия регулярности второго типа оказываются слабее данных условий, поэтому следующий результат может применяться для оценки стохастических интегралов, возникающих в задаче различения близких гипотез во второй главе диссертации.

Лемма 1. Пусть функция S(x) удовлетворяет условиям регулярности 1)-

4)-

Тогда при q —+00

F(q) = exp(-S(q)) ¿cfc + o(c2)

a=o

где ck = Mk (g^) |x=9, M =

Автор благодарит научного руководителя доктора физико-математических наук, профессора Питербарга Владимира Ильича за постановку задач и постоянное внимание к работе. Автор высоко ценит содействие, оказанное работе сотрудниками кафедры теории вероятностей механико-математического факультета МГУ имени М. В. Ломоносова.

РАБОТЫ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

[1] Родионов, И. В., "Пуассоновская предельная теорема для высоких экстремумов временного ряда с сезонной составляющей и строго монотонным трендом". Вестн. Моск. ун-та. Сер. 1. Матем. Механ., 1, 12-17 (2012).

[2] Родионов, И. В., "О свойствах оценки Хилла экстремального индекса для выборок с загрязнениями". Вестн. Моск. ун-та. Сер. 1. Матем. Механ., 1, 3-6 (2014).

[3] Родионов, И. В., "Асимптотическое разложение Лапласа вероятностей редких событий для одного класса распределений из области максимального притяжения Гумбеля". Современные проблемы математики и механики, Математика, 8(3), 108-115 (2013).

[4] Родионов, И. В., "О различении близких гипотез о распределениях вейбулловского и логнормального типов по первым членам вариационного ряда". Деп. в ВИНИТИ 03.12.2013, №349-В2013, 37 (2013).

[5] Родионов, И. В., "Discrimination between close hypotheses about distributions of the Weibull and the log-Weibull types by the first order statistics". Международная конференция "Теория Вероятностей и ее Приложения", посвященная 100-летию со дня рождения Б.В. Гнеденко, Тезисы докладов, 172173, Ленанд, Москва, 2012.

Отпечатано в отделе оперативной печати Геологического ф-та МГУ Тираж /оо экз. Заказ № £

Текст научной работы диссертации и автореферата по математике, кандидата физико-математических наук, Родионов, Игорь Владимирович, Москва

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М. В. ЛОМОНОСОВА

Механико-математический факультет

0420145627»

На правах рукописи УДК 519.217

Родионов Игорь Владимирович

СТАТИСТИЧЕСКИЙ АНАЛИЗ И ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИИ ЭКСТРЕМУМОВ ВРЕМЕННОГО РЯДА

Специальность 01.01.05 - теория вероятностей и математическая статистика

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель: доктор физико-математических наук, главный научный сотрудник В. И. Питербарг

Москва 2013

Содержание

Введение 3

1 Статистические оценки характеристик экстремумов в загрязненных выборках 12

1.1 Пуассоновская предельная теорема для высоких экстремумов 12

1.1.1 Условия. Формулировка теоремы........................12

1.1.2 Доказательство теоремы 1.4..............................15

1.2 Оценка Хилла для выборок с загрязнениями..................21

1.2.1 Состоятельность оценки..................................23

1.2.2 Асимптотическая нормальность оценки................25

2 Различение близких гипотез о хвостах распределений 26

2.1 Условия регулярности. Формулировка основных результатов главы ..............................................................26

2.2 Вспомогательные леммы..........................................32

2.3 Доказательство теоремы 2.1......................................41

2.4 Доказательство теоремы 2.2......................................53

Введение

Настоящая работа состоит из двух глав. В первой главе диссертации рассматриваются статистические оценки характеристик экстремумов в модели выборок с загрязнениями. Классическая теория экстремумов — асимптотическая теория распределения максимума

Мп = шах(Хь .. .,Хп),

где Х\,...,Хп - независимые одинаково распределённые случайные величины, — начала активно развиваться около полувека назад, хотя её корни уходят глубоко в историю математики. В основе теории лежит фундаментальный результат, полученный Фишером и Типпетом ([1]) и позднее обобщённый Б.В. Гнеденко ([2]) — теорема экстремальных типов, также известная как теорема Фитера-Типпета-Гнеденко, которая описывает все возможные формы распределения Мп при линейной нормировке. Строго говоря, Гнеденко доказал, что если для некоторых числовых последовательностей ап > 0, Ьп случайная последовательность о,п{Мп — Ъп) имеет невырожденное предельное распределение, т.е. существует такая невырожденная функция распределения что

Р (Мг^ь«, < Л —> од, (о.1)

\ ап ) п->оо

то С принадлежит одному из трёх экстремальных типов (т.е. существуют такие константы а > 0 и 6, что функция распределения Н{х) Оах + Ъ) в точности равна одной из указанных ниже функций распределения):

Тип I: Со (ж) = ехр(-е~ж), х еИ.

тип п.- адн шф("я"1/7)' х > °'7 >

* 0, х < 0.

Тип III: С_7(а)=< ^рН"^), < 0,7 > 0,

^ 1, а: > 0,

где Со(х) - так называемое распределения Гумбеля, С7(.т) - класс распределений Фреше, а С_7(ж) - класс распределений Вейбулла.

Параметр 7, возникающий в теореме Фишера-Типпета-Гнедепко, называется индексом экстремального значения (extreme value index). Пусть F(x) - маргинальная функция распределения случайной последовательности {Хг}^. Тогда в случае независимых наблюдений верно

Р(Мп < х) = Fn(x), т.е. (0.1) можно переписать в следующем виде:

Fn(anx + bn) -> G(x). (0.2)

n—»00

Если для некоторых числовых последовательностей ап > 0 и Ъп выполнено (0.2), то говорят, что F принадлежит области притяжения распределения G, и пишут F £ D(G). Известны критерии, дающие необходимые и достаточные условия принадлежности F области притяжения того или иного экстремального типа (см. например [3] или [4]). Однако есть распределения, которые не принадлежат ни одной из трёх областей максимального притяжения, например, пуассоновское распределение.

К сегодняшнему дню классическая теория экстремумов сформировалась полностью и имеет большое количество различных приложений (см. например книгу Гумбеля [5]). Позднее, начиная с работ Крамера, Лойнса, Бермана, Лидбеттера и Уотсона, возник интерес к расширению классической теории на последовательности зависимых случайных величин и на стационарные процессы с непрерывным временем. Развитие шло в следующих направлениях: создание теории для гауссовских процессов с непрерывным временем (Крамер) и стационарных последовательностей (Берман, Лидбеттер), а также доказательство результатов классической теории для некоторых типов зависимостей случайных величин (Уотсон, Лойнс).

Впоследствии Лидбеттер, Лингрен и Ротцен3, объединив эти направления, создали достаточно общую теорию, которая включала и полученные к тому моменту результаты для гауссовских стационарных последовательностей и процессов. Так, Лидбеттер ([6], [7]) показал, что результаты классической теории, при некоторых ограничениях на зависимость далеко отстоящих членов последовательности, остаются в силе для стационарных последовательностей и некоторых важных

нестационарных случаев. При этом предложенное Лидбеттером условие перемешивания оказалось слабее, чем такая существовавшая на тот момент форма ограничения зависимости, как предложенное Розенблаттом [8| в 1956г. условие сильного перемешивания, использованное им при доказательстве центральной предельной теоремы для так называемых "слабо зависящих" случайных величин. Итак, приведем то условия перемешивания, о котором идет речь. Пусть

Fiu...,in(x 1,... ,хп) = Р(Хи < xi,.. .,Xin < хп),

где {Xj}j>i - стационарная в узком смысле случайная последовательность. Обозначим Fiu_,in(u) — Fiu_jn(u,..., и) для любого набора индексов ?4,..., гп. Пусть ип - некая числовая последовательность. По определению, случайная последовательность удовлетворяет условию D(un), если найдётся такая последовательность чисел {anj}, п, / = 1,2,..., и последовательность натуральных чисел 1п, где 1п — о(п) при п —> оо, что для любого набора индексов ..., гр, ji,..., jq такого, что

1 < ßi < ... < гр < ji < ... < jq < n и ji - ip > ln, выполнено неравенство

\Fiu...,ip,ju...,jq{un) — Fiu„^ij}(un)Fju __jq(un)| < otn,in,

где anjn ->• 0 при n оо.

Для исследования областей притяжения в теореме об экстремальных типах в случае зависимых последовательностей (см., например, работу Лойнса [9|), а также в задаче нахождения вероятности превышения заданного уровня максимумом по зависимой последовательности (см. работу Уотсона [10]) используется условие D'(un), гарантирующее отсутствие предельной кластеризации высоких экстремумов:

[п/к]

lim siip п ^^ Р{Х 1 > ип, Xi > ип) —> 0 при к —> оо,

71—>00 . „

г—г

где [.] обозначает целую часть числа. Точечные процессы превышения заданного уровня в применении к стохастической теории экстремумов

впервые были рассмотрены Лидбеттером [11]. Он показал, что моменты превышения очень высоких уровней носят стохастический характер и что для таких уровней этот точечный процесс при выполнении условий 0{ип) и 0'(ип) сходится по распределению к пуассоновскому процессу.

В настоящей работе доказана пуассоновская предельная теорема для высоких экстремумов стационарного в узком смысле временного ряда с монотонным трендом и почти периодической составляющей. Доказательство основано на методе, впервые использованном в работе [11] и позднее в таких работах, как [12] и [13].

Задача оценки индекса экстремального значения с использованием выборки как независимых, так и зависимых случайных величин, была предметом исследования большого количества авторов (см. [14], [15], [16], [17], [18]). Одной из наиболее известных оценок индекса экстремального значения является оценка Хилла [14]. Пусть последовательность независимых одинаково распределённых случайных величин имеет функцию распределения .Р, которая принадлежит области максимального притяжения Фреше. Определим

где Х(!) < Х(2) < ... < Х(п) - вариационный ряд выборки Тогда

при п —оо, к = к(п) —> сю и к/п —У 0 оценка Хилла 7# сходится по вероятности к .

Другой, не менее известной оценкой индекса экстремального значения является оценка Пикандса [19]:

Если Р е 1)(С7), где 7 е Я, то при тех же условиях на п и к, что и для оценки Хилла, оценка Пикандса 7р сходится по вероятности к индексу экстремального значения. Известно также [20], что оценка максимального правдоподобия, построенная по первым (максимальным) к членам вариационного ряда, при тех же условиях на п и к сходится по вероятности к индексу экстремального значения, при условии, что

А;-1

7р:= (1п2)-'"

(п—2к) ~ ^(п-Ак)

7 > -1/2.

В работе [16] показано, что при выполнении условия второго порядка на функцию распределения F

i-F(tx) _ -1/7 /

Ит * = x-U^h-\

A TP

где параметры 7 > 0, р < 0, а функция A(t) - знакопостоянная, причём

lim A(t) = 0, при п —> оо, к = к(п) —»ooufc/n—>0 оценка Хилла 7я ¿->00

является асимптотически нормальной

v^(7//- 7) ^ 72)

где А^(0,1) - стандартная нормальная случайная величина, Л - конечный параметр и lim — Л. Известно, что при похожих условиях

п-> оо

оценки Пикандса и максимального правдоподобия также являются асимптотически нормальными оценками индекса экстремального значения (см. [4]).

В первой главе настоящей диссертации показано, что при некоторых условиях на аддитивное загрязнение оценка Хилла индекса экстремального значения остаётся состоятельной, а при выполнении условия второго порядка - и асимптотически нормальной.

Вторая глава диссертации посвящена задаче различения близких гипотез о распределениях из области максимального притяжения Гумбеля по первым членам вариационного ряда.

Задача различения распределений - одна из важнейших задач математической статистики, которая являлась предметом изучения множества авторов (см. [21], ]22], [23], [24]). Одним из ключевых инструментов при решении данной задачи является лемма Неймана-Пирсона, которая позволяет найти равномерно наиболее мощный критерий для различения двух произвольных распределений при использовании отношения правдоподобий. Довольно часто используется также метод отношения максимальных правдоподобий (RML-test), впервые использованный в работе [21] (см. [25], [?]). Решение задачи различения распределений, принадлежащих области максимального

притяжения Гумбеля, можно найти в работах [26], [27].

Метод Лапласа асимптотических оценок интегралов, содержащих

большой параметр, широко известен и применяется для решения

многочисленных задач математики, физики, механики и техники (см.

монографию [28]). В отличие от классического метода Лапласа, когда

изучается асимптотическое разложение интеграла L{А) = f f(x)exs^dx

при Л +оо, в диссертации исследовано асимптотическое разложение интеграла Li А) = Г e~s^dx при Л -» Н-оо и lim -Д^- = +оо, что

4 ^ зт-Я-оо 1пт

позволяет оценивать стохастические интегралы, возникающие в задаче различения близких гипотез.

Задача различения близких гипотез о распределениях является ключевой для теории контигуальных мер (см. монографию [29], а также [30]). Пусть {/(ж, #), 0 £ в} - некое семейство плотностей распределений. При выполнении некоторых условий регулярности, наложенных на это семейство плотностей (подробнее см. [31]), распределение логарифма отношения правдоподобий при условии, что выборка взята из распределения с плотностью f(x:0), слабо сходится к нормальному закону при п —» оо

( Üf(^0 + t(n)h)^

In---

V П №,в) \ i=1 /

где Ь(п) — п-1/2, а К - произвольная константа.

Во второй главе диссертации нами рассмотрена задача различения близких гипотез о распределениях по первым кп членам вариационного ряда, где п —> оо, кп —> оо и кп/п —> 0. Стоит заметить, что слабая сходимость логарифма отношения правдоподобий к невырожденному закону наблюдается при Ь(кп), отличном от (кп)~1//2 и зависящем от распределения, из которого сделана выборка, а сам вид предельного закона зависит от скорости стремления последовательности кп к бесконечности.

Опишем более подробно структуру диссертации.

В первой главе диссертации вводится модель случайного временного ряда с асимптотически растущим загрязнением. В первом параграфе

главы на временной ряд накладывается условие строгой стационарности, а загрязнение представляется в виде суммы почти периодической числовой последовательности и монотонной функции. На случайный точечный процесс высоких экстремумов ограниченных борелевских множеств действительной прямой, построенный по рассматриваемому временному ряду, наложены классические для теории экстремумов условия Б (в форме, аналогичной предложенной Лидбеттером) и И'. Основным результатом параграфа является теорема 1.4, в которой доказывается, что рассматриваемый точечный процесс слабо сходится к пуассоновскому точечному процессу с известной функцией интенсивности. Существенным элементом доказательства является лемма 1.5, являющаяся модификацией известной леммы Лидбеттера, которая позволяет разбить случайную последовательность на блоки, максимумы по которым оказываются независимыми.

Во втором параграфе первой главы временной ряд предполагается состоящим из независимых и одинаково распределённых случайных величин, функция распределения которых Р принадлежит области максимального притяжения Фреше, а на аддитивное загрязнение накладывается условие на рост модуля его максимума. Для этой модели рассматривается оценка Хилла индекса экстремального значения. Основным результатом параграфа является теорема 1.6, в которой доказывается, что при определённом условии на рост максимума модуля загрязнения рассматриваемая оценка является состоятельной, а при дополнительном условии второго порядка на функцию распределения Р и более сильных условиях на рост загрязнения - и асимптотически нормальной.

Во второй главе диссертации рассматриваются семейства распределен и и вейбулловского и лог-вейбулловского типов, которые принадлежат области максимального притяжения Гумбеля. В первом параграфе главы вводится отношение правдоподобий для близких гипотез о рассматриваемых распределениях, построенное по первым кп членам вариационного ряда, а также описываются два типа условий регулярности, накладываемые на соответствующие семейства распределений. Во втором параграфе доказан вспомогательный результат, касающийся

асимптотического разложения Лапласа вероятностей редких событий для рассматриваемых типов распределений, а также показано, что наложенные в первом параграфе условия регулярности действительно определяют распределения, принадлежащие области максимального притяжения Гумбеля. Основными результатами главы является теорема 2.1, в которой доказано, что асимптотическое распределение логарифма отношения правдоподобий для распределений из области максимального притяжения Гумбеля при специальных условиях регулярности, наложенных на последовательность кп и распределение, слабо сходится к нормальному закону с известными параметрами, а также теорема 2.2, в которой доказывается, что асимптотическое распределение разности логарифма отношения правдоподобий для распределений из области максимального притяжения Гумбеля и определённой функции от п — кп-ой порядковой статистики выборки при более слабых условиях, наложенных на'последовательность кп и распределение, слабо сходится к нормальному закону с теми же параметрами. В третьем и четвёртом параграфах приведены доказательства теорем 2.1 и 2.2 соответственно.

Результаты диссертации опубликованы в статьях автора [42], [44] и [43]. Основные результаты докладывались на конференциях:

1. "Ломоносов-2011" (МГУ, Москва, 2011)

2. "Теория вероятностей и её приложения", посвящёнпая столетию Б.В.Гнеденко (МГУ, Москва, июнь 2012)

3. "Ломоносов-2013" (МГУ, Москва, 2013)

4. Workshop "Stochastic, Analysis and Geometry" (Ульм, сентябрь 2013); а также на семинарах:

1. Большой семинар кафедры теории вероятностей (механико-математический факультет МГУ, руководитель — академик РАН, проф. А.Н. Ширяев);

2. Семинар "Гауссовские случайные процессы "(механико-математический факультет МГУ, руководитель — д.ф.-.м.н., проф. В.И. Питербарг);

3. Семинар "Статистика экстремальных значений"(Институт проблем управления РАН, руководитель — д.ф.-м.н., гл.н.с. Н.М. Маркович)

Автор выражает огромную благодарность своему научному руководителю — Владимиру Ильичу Питербаргу за постановку задач, постоянную поддержку и многочисленные обсуждения.

1 Статистические оценки характеристик экстремумов в загрязненных выборках

1.1 Пуассоновская предельная теорема для высоких экстремумов

1.1.1 Условия. Формулировка теоремы

В этом параграфе мы введём точечный процесс высоких экстремумов для выборок с неслучайными загрязнениями, а также сформулируем пуассоновскую предельную теорему для этого процесса. Итак, рассмотрим модель

Уг = Хг + стг + с/1(яг), г = 1,2,..., (1.1)

где {Хг, г = 1,2,...} — строго стационарная случайная последовательность, {т^, г — 1, 2,...} — неслучайный тренд, ведущий себя стационарным образом в определенном ниже смысле (например, сезонная составляющая), /г — неслучайная монотонная функция, с и б — малые параметры. Предполагается, что функция распределения Р{х) случайной величины Х\ является максимально устойчивой.

Определим случайный точечный процесс высоких экстремумов ограниченных борелевских подмножествах В действительной прямой:

£(В) = #{к:Ук>апг + Ьп,кепВ}, п = 1,2,..., (1.2)

где символом ф обозначается число точек конечного множества; ап,Ьп — последова�