Аппроксимация второго порядка и бутстреп для усеченных сумм и L-статистик тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Грибкова, Надежда Викторовна
АВТОР
|
||||
доктора физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
2011
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
ГРИБКОВА Надежда Викторовна
АППРОКСИМАЦИЯ ВТОРОГО ПОРЯДКА И БУТСТРЕП ДЛЯ УСЕЧЕННЫХ СУММ И Ь-СТАТИСТИК
01.01.05 — теория вероятностей и математическая статистика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
-8 ДЕК 2011
Санкт-Петербург 2011
005005309
Работа выполнена на кафедре "Прикладная математика" ФГОУ ВПО "Петербургский государственный университет путей сообщения".
Научный консультант: доктор физико-математических наук,
профессор
Никитин Яков Юрьевич
Официальные оппоненты: доктор физико-математических наук,
профессор
Бенинг Владимир Евгеньевич
доктор физико-математических наук, профессор
Ермаков Михаил Сергеевич
доктор физико-математических наук, профессор
Розовский Леонид Викторович
Ведущая организация: Математический институт им. В.А.Стеклова
Российской академии наук (МИРАН).
Защита состоится " £ (, " е ка^р А 2011 года в I Ь часов на заседании диссертационного совета Д 002.202.01 в Санкт-Петербургском отделении Математического института им. В.А.Стеклова РАН по адресу 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27, к. 311.
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского отделения Математического института им. В.А.Стеклова РАН по адресу 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27.
Автореферат разослан " 2.( " и о л Га Л 2011 года.
Ученый секретарь
диссертационного совета Д 002.202.01 доктор физико-математических наук
А.Ю.Зайцев
Общая характеристика работы
В диссертации исследуется асимптотика второго порядка распределений усеченных сумм, L-статистик и их бутстреп-версий, изучаются свойства порядковых статистик, устанавливаются новые формулы, соотношения.
Актуальность темы. ¿-статистики - это краткое название линейных функций членов вариационного ряда. Впервые использование взвешенных сумм порядковых статистик в качестве оценок параметров распределений было предложено и обосновано, согласно историческому очерку С.Стиплера1, П.Дэниеллом2 в 1920 году.
Хорошо известно, что L-статистики и, в частности, усеченные суммы элементов вариационного ряда играют ключевую роль в теории робастных статистических выводов (см., например, книгу Р.Маронна и др.3 и более ранние монографии П.Хыобера4, Ф.Хамиеля и др.5). Изучение асимптотических свойств L-статистик на протяжении последних 50-60-ти лет привлекало внимание многих известных ученых, таких, как Дж.Тьюки, П.Бикел, С.Стиглер, Г.Шорак, Д.Мэйсон, В. ван Цвет, П.Хыобер, П.Холл и др.
Значительный интерес к L-статистикам, был обусловлен, конечно, в первую очередь приложениями, ио существовала и другая немаловажная причина чисто теоретического интереса к ним - это своеобразная, связанная с упорядочением природа зависимости слагаемых, образующих ¿-статистику, которая делает изучение ее асимптотики довольно трудным. Необходимость развития асимптотической теории ¿-статистик начиная с 70-х годов ХХ-го века стимулировала открытие в этой области новых подходов и методов. В частности, в работе П.Бикела0 было впервые упомянуто о возможности аппроксимации ¿-статистик [/-статистиками второго порядка. Впервые этот подход был успешно применен Р.Хелмерсом7 для получения неравенств типа Берри - Эссеена для ¿-статистик. Асимптотическая теория [/-статистик была существенно продвинута в 80-90-е годы, что позволило эффективно использовать метод [/-статистической аппроксимации для исследования асимптотических свойств симметричных статистик.
Как ¿-статистики, так и [/-статистики являются симметричными функциями элементов выборки, то есть принадлежат классу так называемых
1Stigler, S.M., Simon Newcomh, Percy Daniell and the history of robust estimation 1885-1920 // J. Amer. Statist. Assoc., 1973, v. 68, по..Ш, p. 872-879.
2Daniel!, P.J. Observations weighted according to order // American Journal of Mathematics, 1920, v. 42, p. 222-236.
3Maronna, R., Martin, R. D. and Yohai, V. Robust Statistics - Theory and Methods, Wiley, New York, 2006.
4Хыобер, П. Робастностъ в статистика, M.: Мир, 198-1.
5Хамиель Ф.Р., Рончегт Э.М., Рассеу И.Д., Штаэль В.А. Робастностъ в статистике. Подход на основе функций влияния, М.: Мир, 1989.
6BickeI, P.J., Edgeworth expansions in nonparametrie statistics // Ann. Statist., 1974, v. 2, p. 1-20.
7Helmers, R., A Berry - Esseen theorem for linear combinations of order statistics // Ann. Probab., 1981, v. D p. 342-347.
симметричных статистик. В диссертации свойства усеченных сумм и L-статистик анализируются, в том числе, в контексте теории симметричных статистик. Часть результатов диссертации связана с работами В.ван Цвета8, Х.Путтера и В. ван Цвета9, В.Бенткуса и др.10.
Влияние крайних членов вариационного ряда на асимптотику сумм исследовалось многими авторами, начиная с работ Д.Дарлинга (1952), Д.З.Арова и А.А.Боброва (1960), В.А.Егорова и В.Б.Невзорова (1974, 1975), П.Холла (1978), можно упомянуть также более поздние работы Ш.Чёргё и др. (1986, 1988, 2001), Л.Пенга (2001), Р.Кулика (2008). В многомерной ситуации (при упорядочивании по норме) этот вопрос изучался Ю.А.Давыдовым и А.В.Нагаевым (2004), в контексте бутстрена влияние крайних членов изучали П.Деовельс, Д.Мэйсон и Г.Шорак (1993), П.Бикел, Ф.Гётце и В.ван Цвет (1997). Если вопросы, относящиеся к асимптотике первого порядка усеченных сумм (то есть класс возможных предельных законов, условия сходимости к ним, необходимые и достаточные условия асимптотической нормальности и т.д.) изучены достаточно полно в работах Ш.Чёргё и др.11, П.Гриффина и В.Пруита12 и других авторов, то до недавнего времени имелось совсем мало работ, посвященных уточнениям. Фактически нам известна только одна статья13, в которой получены некоторые оценки скорости сходимости к нормальному закону для усеченных сумм в общем случае, когда доля отсекаемых по краям наблюдений является последовательностью, которая может, в частности, стремиться к 0 при п —> со, где п - объем исходной выборки (и эти оценки не оптимальны), и совсем не существовало работ, посвященных получению разложений типа Эджворта в этой общей ситуации.
Еще одно направление исследований связано с получением разложений типа Эджворта для усеченного среднего - хорошо известной оценки параметра сдвига - и для его бутстреп-версии. До недавнего времени явный вид формул разложения Эджворта для этой статистики не был известен даже в случае стандартной неслучайной нормировки, тем более - в случае стьюдентизации. В статье П.Холла и А.Падманабхана14 авторы пишут о том,
8vaп Zwet, W.R., A Berry - Esseen bound for .symmetric statistics // Z. Wahrsch. Verw. Gebiete, 1984, v. 66, p. 425-440.
9Putter, II., van Zwet, W.K., Empirical Edgeworth expansions for symmetric statistics // Ann. Statist, 1998, v. 26, p. 1540-1569.
L0Bentkus, V., Götze, F., van Zwet, W.R., An Edgeworth expansion for symmetric statistics // Ann. Statist., 1997, v. 25, p. 851-896.
11 (Jsörgö, S., HaeiisleT, E., Mason, D.M., The asymptotic distribution of trimmed sums // Ann. Probab., 1988, v. 16, p. 672-699.
12 Griffin. P.S., Pruitt, W.E., Asymptotic normality and subsequential limits of trimmed sums // v4rm. Probab., 1989, v. 17, p. 1186-1219.
13Егоров, B.A., Невзоров, В.Б., Некоторые оценки скорости сходимости сумм порядковых статистик к пормальному закону // Зап. научи, семинаров ЛОМИ, 1974, т. 41, с. 105-128.
14 Hall, P., Padmanabhan, A.R., On the bootstrap and the trimmed mean //J. Multivariate Analysis, 1992, v. 41, p. 132-153.
что в случае (стыодентизованного) усеченного среднего получение разложения Эджворта в явном виде очень сложно, и предлагают заменить аналитические трудности бутстрен-моделированием. В данной работе мы все же получаем явный вид формул асимптотических разложений для этой статистики и ее стыодентизованной версии.
Бутстреп-мстод, предложенный Б.Эфроном15 в 1979 году, получил широкое распространение в последние три десятилетия. Этот метод предполагает интенсивное компьютерное моделирование и демонстрирует результаты, сопоставимые с теми, что дают классические процедуры, а в ряде случаев превосходит их в эффективности. Свойство корректности второго порядка, означающее тот факт, что бутстреп-распределение статистики точнее приближает ее истинное распределение, чем предельный закон, если таковой существует, вызвало огромный интерес исследователей в конце 80-х и 90-е годы ХХ-го века и породило шквал публикаций на эту тему. Доказательство корректности второго порядка, как правило, опирается на разложения Эджворта (см., например, монографию П.Холла16), поэтому тематика, связанная с получением асимптотических разложений типа Эджворта, приобрела в последние годы новое звучание и актуальность.
Еще один круг проблем, рассмотренных и диссертации, касается получения представлений типа Бахадура - Кифера, означающих связь квантильного и эмпирического процессов. Впервые такое представление для выборочной квантили было открыто Р.Бахадуром (1966), результат Бахадура был уточнен Дж.Кифером в серии работ (1967-1970). Получение представлений типа Бахадура - Кифера17 является задачей теории эмпирических процессов18, которая имеет фундаментальное значение для математической статистики и продолжает интенсивно развиваться.
Получаемые в диссертации представления типа Бахадура - Кифера используются в данной работе для конструирования ¿/-статистических аппроксимаций для усеченных сумм.
Цель работы. Основная цель работы - исследование асимптотических свойств распределений усеченных сумм случайных величин, L-статистик и их бутстреп-версий: оценивание скорости сходимости к нормальному закону, нахождение асимптотических разложений, доказательство корректности бутстреп-аппроксимаций. Особый интерес для нас представляет случай слегка усеченной суммы, когда доля отсекаемых по краям элементов вариационного ряда стремится к нулю при стремлении объема выборки к бесконечности, и случай усеченного среднего, играющего важную роль в теории робастной
15Еfron, В., Tibshirani, R.J., An Introduction to the Bootstrap, Chapman and Hall, N.Y., 1993.
16Hali, P., The Bootstrap and Edge.worth Expansion, Springet-Vorlag, New Yurk, 1992.
"Deheuvek, P., Mason, D.M., Bahadur - Kiefer - type processes // Ann. Probab., v. 18, 1990, p. 669-697.
18Shoradc, G.ft., VVcltoer, J.A., Empirical Processes with Applications to Statistics, Springer, 2009.
статистики. Целью работы является также дальнейшее изучение свойств кваитильных процессов, получение для них новых формул, оценок и представлений.
Общая методика исследования. Для доказательства основных результатов по аппроксимации распределений нормированных и стыодентизованных усеченных сумм мы конструируем стохастические {/-статистические аппроксимации, оцениваем остаточные члены этих аппроксимаций, применяем результаты из теории {/-статистик и теории симметричных статистик, свойства правильно меняющихся функций. При изучении случайных нормировок (стьюдентизации) мы строим также аппроксимации оценок асимптотической дисперсии суммами независимых случайных величин.
Существенную роль при построении этих {/-статистических аппроксимаций играет уинсоризация исходных случайных величин и специальные представления типа Бахадура - Кифера, справедливость которых мы доказываем в качестве вспомогательных результатов. При получении эмпирических асимптотических разложений мы используем ядерные оценки плотности, оцениваем их точность. В части, касающейся корректности бутстреп-метода, применяются факты и результаты из теории бутстрепа, методы гармонического анализа, оценки для моментов порядковых статистик. Для доказательства результатов типа Бахадура - Кифера мы используем свойства порядковых статистик, экспоненциальные неравенства Бернштейна, Хёфдинга и Петрова.
Научная новизна и основные результаты. Все результаты, представленные в диссертации, являются новыми, к наиболее существенным из них относятся следующие.
1. Найден новый подход к исследованию асимптотики распределений нормированных и стыодентизованных усеченных сумм независимых одинаково распределенных случайных величин. Этот подход основан на оригинальной {/-статистической стохастической аппроксимации, для построения которой мы используем уинсоризацию исходных случайных величин и специальные представления типа Бахадура - Кифера. Предлагаемая нами аппроксимация отличается от приближений, использующих линейную и квадратичную группы слагаемых разложения Хёфдинга, и имеет по сравнению с ними более простую и удобную для работы структуру.
2. Впервые получены асимптотические разложения типа Эджворта для нормированных и стыодентизованных усеченных сумм, причем рассмотрена общая ситуация, когда доли усечения ап = кп/п и /?„ = тп/п (п - число наблюдений, кп, тп - номера порядковых статистик, по которым происходит усечение, тш(кп,тп) —> оо, п —> оо) являются последовательностями, которые могут стремиться к нулю при п —> оо (слабое усечение). При этом
предполагается, что исходное распределение не имеет конечной дисперсии.
3. Получены оптимальные по порядку оценки скорости сходимости в центральной предельной теореме для последовательностей нормированных усеченных сумм. При этом впервые доказано, что в случае, когда исходное распределение F не имеет конечного второго момента, оптимальной оценкой скорости сходимости к нормальному закону является оценка порядка где г„ = тт(кп,т„).
4. Исследован вопрос о состоятельности бутстрси-апироксимации для усеченного среднего. Впервые доказано, что модифицированный т < п -бутстреп (т - объем бутстреп-выборки, гп/п -> 0, т —> оо) без каких-либо условий обеспечивает состоятельную оценку распределения нормированного усеченного среднего. В то же время классический бутстреп Эфрона (т = п) и нормальная аппроксимация не состоятельны, если исходное распределение имеет промежутки (интервалы непулевой длины, имеющие нулевую F-меру), граничащие с квантилями, в которых происходит усечение.
5. Найдены асимптотические разложения типа Эджворта для бутстреп-версий нормированного (и стьюдентизовашюго) усеченного среднего. С помощью полученных разложений доказана корректность бутстреиа второго порядка, то есть тот факт, что бутстреп-аппроксимация для усеченного среднего при определенных условиях на порядок точнее, чем нормальная аппроксимация.
6. Получены новые специальные представления типа Бахадура - Кифера для последовательностей выборочных квантилей уровня ап е (0,1), в том числе, для "хиостоаых", когда ап может стремиться к 0 или к 1. Найдены tie встречавшиеся ранее представления для сумм порядковых статистик, находящихся между ап-й выборочной и соответствующей генеральной квантилями. Впервые доказана справедливость представлений Бахадура - Кифера для квантилей бутстреп-выборки.
7. Получены новые, оптимальные по порядку оценки типа Берри - Эссеена для L-статистик при слабых моментных ограничениях и для усеченных L-статистик. Исследован вопрос о состоятельности бутстреп-аппроксимации распределений нормированных L- статистик.
Теоретическая и практическая значимость. Диссертация носит в основном теоретический характер, хотя некоторые ее результаты, особенно относящиеся к бутстреп-методу, применимы и в прикладной статистике. Методы и подходы, разработанные в диссертации, могут быть использованы для решения близких задач теории U- и L-статистик, в робастной статистике. Апробация. Результаты диссертации докладывались на следующих симпозиумах и конференциях:
о 14-15, 29-й Международные семинары по проблемам устойчивости сто-
хаотических моделей, Суздаль, 1991 г., Пермь, 1992 г., Светлогорск, 2011 г. о Международная конференция "Асимптотические методы в теории вероятностей и математической статистике", С.-Петербург, 1998. о 3-й Санкт-Петербургский международный симпозиум по моделированию, С.-Петербург, 1998.
о 8, 9, 10-я Вильнюсские международные конференции по теории вероятностей и математической статистике, Вильнюс, Литва, 2002, 2006, 2010.
о 24-я Европейская конференция статистиков, Прага, 2002. о XI, XII, XIV, XVI-я Всероссийские школы-коллоквиумы по стохастическим методам, Сочи, 2004, %005, 2007 г., Санкт-Петербург, 2009 г. о VI, VII, XI-й Всероссийские симпозиумы по прикладной и промышленной математике, Санкт-Петербург, 2005 г., Кисловодск, 2006, Сочи, 2010 г. о 22-я Международная северная конференция по математической статистике (NORDSTAT-2008), Вильнюс, Литва, 2008.
По результатам диссертации были сделаны доклады: на семинаре по предельным теоремам теории вероятностей в 1998 г. (руковод. - проф. В.В.Петров); на семинаре отдела PNA (Probability, Networks and Algorithms) математического центра CWI в Амстердаме, Нидерланды, в 2002 г. (руковод. -Р.Хелмерс); на городском семинаре по теории вероятностей и математической статистике в 2005, 2008, 2010 годах (руковод. - акад. И.А.Ибрагимов).
Соавтором Р.Хелмерсом были сделаны доклады в университетах Амстердама (2003), Гонконга (2004, 2007), Тель-Авива (2006), Сиднея (2008).
Публикации. Список работ по теме диссертации приведен в конце реферата. Основные результаты диссертации опубликованы в статьях [1]-(11] в журналах и изданиях, рекомендованных ВАК (перевод статьи [5] опубликован в журнале J.Math.Sci, входящем в систему цитирования SCOPUS, статья [6] опубликована в книге, изданной VSP, Utrecht, статьи [8|-[9] опубликованы в журнале Mathematical Methods of Statistics, входящем в систему SpringerLink). Работы [12]-[17] - это статьи, опубликованные в трудах конференций и препринты.
Основные результаты диссертации опубликованы также в сборниках тезисов упомянутых выше конференций.
Работы [8|-[11| и [14] выполнены в соавторстве с Р.Хелмерсом (Нидерланды). В работе [8] соавтору принадлежит постановка задачи и идея использования ядерных оценок плотности в теореме 2.3, доказательство всех результатов принадлежит автору, в работе [9] соавтором предложено доказать теорему 2.7, касающуюся метода бутстреп-экстраполяции Бикела - Яхавы, в работе [10] - предложение о включении раздела 3 (Некоторые применения), в [11] - улучшение формулировок, [14] - это статья обзорного характера по полученным в работах [8]-[9] результатам.
Структура и объем диссертации. Диссертация состоит из сведения, семи глав, разделенных на параграфы, и списка литературы. Библиография содержит 181 наименование. Общий объем диссертации составляет 251 страницу.
Обзор содержания работы
Во введении дается обзор литературы, относящейся к теме диссертации, обсуждаются задачи и методы исследования, описывается структура и содержание работы, вводятся основные обозначения.
В главе 1 мы изучаем асимптотические свойстра распределений усеченных сумм вида:
Т! /,:п 71
s, = X> - хi n — xi:n, (i)
г— I г~ п—m„ + l
где кп, тп - целые, 0 < кп < п - тп < п, и rriin(кп,тп) —> оо при п -* оо, Xi:n - порядковые статистики, соответствующие выборке Х\,...,Хп независимых одинаково распределенных случайных величин (с.в.) с функцией распределения (ф.р.) F. Мы рассматриваем, в том числе, и случай слегка усеченных сумм, когда тах(кп,тп)/п -* 0, п —> оо, при этом в большинстве результатов предполагается, что распределение F имеет тяжелые хвосты, т.е. что EXi = оо. В этой главе мы получаем оценки типа Берри - Эсссена порядка 0(гп1/12), гп — тт(кп,тп), для нормальной аппроксимации Sn и доказываем, что этот порядок является неулучшаемым без предположения конечности EXf. Кроме того, мы получаем разложения типа Эджворта для (слегка) усеченных сумм и их стыодентизованных версий.
Введем непрерывную слева инверсию F~L, определенную равенством F-l{u) = inf{x : F(x) >и}, 0 < и < 1, 0) = F~l{0+), и пусть Fn и F~l обозначают эмпирическую ф.р. и ее инверсию соответственно. Определим квантиль = F~l(y) распределения F уровня 0 < v < 1.
Положим ап = кп/п, Д, = тп/п, и пусть Wi(n), г = 1,..., п, обозначают Х„ уинсоризованные вне (^а„,6-/3„], то есть \Уг{п) = V (Xt A где
s A t = min(s, t), sVt = max(s, t).
Определим квантильную функцию Qn(u) := £a„ V (F'^u) A £i-pn) и два первых кумулянта Wi(n):
= J^ Qn{u) du , <?щп) = J^ (Qn{u) - Mw(u))2 du .
(2)
Положим ai = liminfn^oo an, a2 = limsnp,,^ a„, bx = liming«, (1-/?„), 62 = limsupn^oo (1 — /?„) и предположим, что a2 < &ь
Пусть / = Р' обозначает плотность исходного распределения, если она существует. Определим две последовательности:
I ап I /Зп
<7Рп
(3)
Величины <2ап, определены при всех достаточно больших п, если выполнено следующее условие:
[А\]. Инверсия F~1 дифференцируема в II = С/аиС/б, где 11а, {¡ь С (0,1) -два открытых множества, причем
(О, б), если 0 = а\ = «2, иа Э (0, а2], если 0 = а\ < а2, [«1,02], если 0 < а! < а2,
(1 — е, 1), если 61=62 = 1, Щ Э [61,1), если 61 < 62 = 1, (61,62], если 61 < 62 < 1,
(4)
(с некоторым 0 < е < 1 в случаях, соответствующих первой строке (4)). Пусть /г - вещественнозначная функция, определенная на множестве (см. (4)). Возьмем произвольное 0 < В < оо и для всех достаточно больших п определим величины
= йир
щ<в
Ф1_Д,,Л(В) = эир
(5)
где Л о Г'1 (и) = /г (Р_1(и)).
В формулировках результатов используются следующие предположения. Иг]- 9о„ V д/зп —> 0, при п —> оо.
Из] Для любого 0 < В < оо
Фа .(В)—О,
Рп
■фг_/з> (В)—,0, п -> 00.
Положим Тп = п~1Бп и определим ф.р. нормированной с.в Тп :
РТп(х) = Р (г„ - М««, 1 - &)) < г) ,
где ц(ап, 1 — (Зп) = ¿в - генеральное усеченное среднее.
Прежде всего мы доказываем, что в условиях [Л^-Из] выполнены необходимые и достаточные условия асимптотической нормальности Тп (Ш.Чёргё и др. (1988)), поэтому вир1бД\Ртп(х) - Ф(а')1 = о(1) при п —> оо, где Ф -стандартная нормальная ф.р.
Положим rn = ки Л тп. Следующая теорема дает оценку скорости сходимости распределения нормированного усеченного среднего Тп к стандартному нормальному закону.
Теорема 1.1 Предположим, что выполнены условия Тогда
д
sup |FTb(z) - Ф(ж)| < -7=(il.„ + i2,n + ¿3,n + ¿4,„) + Cr~c, (6)
ieK Vn ; w
E|m(n)|3 1 ( а /Зп \
oi,n —-з-> 02, n =- 777—г + '
er:
w<„> ""w
(\ 5/3 / ч 5/3
—+ \ ,
V = (anlog/cn^ari:7k(B) +ßn\ogmn4>1_^ik{B)) ,
для любого с > 0, где /1, В, С > 0 - постоянные, зависящие только от с.
Теорема 1.1 дает оценку скорости сходимости к нормальному закону распределения Тп и в случае слабого усечения, когда an V ßn —> 0, при этом исходное распределение F может не иметь конечных моментов. В главе 1 приводится следующий пример: пусть ф.р. F такова, что F(x) = 1 - F(x) = 2(iogli|)" для всех х: N > хо, где р, х() > 0. Вычисление величин 5iiU в этом случае показывает, что в правой части (6) мы имеем оценку порядка 0(r~d) с некоторым 0 < d < 1/2, если lim sup,,^ < оо. При этом оценка
порядка 0(г,;1/2) возможна в том и только в том случае, если Jfc„ ж п и т„ ж п. Однако мы можем получить оценку порядка 0(гп^3) (например), если возьмем кп, тп ~ п1»^.
Для того, чтобы получить более простые по форме оценки, чем (6), имеющие порядок г„1//2, нам требуются несколько более строгие ограничения.
[ЛУ • Предположим, что
aJ2 ß3/2
lim sup-777—г < оо, lim sup---- < оо.
n^oo n-oo °wbl)j(t,\-ßj
Если выполнено [А!2], то qUn = О и qßn = О при п -> оо,
причем [А'2] выполняется, если выполнено следующее немного более строгое ограничение:
[А'£\. Предположим, что
Ит sup < оо, lim sup ---- < оо.
Если ага V ßn —* 0, то условие [А2] выполняется, если limsupa._>_00 jjj^j)
<
оо и lim supz_>+00 1xf(if < °°> последнее справедливо, например, если ф.р. F имеет плотность при всех достаточно больших |ж|, правильно меняющуюся на бесконечности с показателем р < — 1.
Следующее условие является усилением условия [A3]:
[Л3]. Для любого В > О
=0 (шЫ ■ =0 (/(ejbgj ■
Теперь можно сформулировать результат, дающий оценку в более простой форме, чем в теореме 1.1. Пусть, как и прежде, гп = кп/\ тп.
Теорема 1.2 Предположим, что условия [Л1], [А'2] и [Л3] выполнены. Тогда svp\FTn(x)-<!>(x)\<Cr-V2, (7)
хбМ.
где G - некоторая положительная постоянная, не зависящая от п.
Оптимальность оценки (7) (в случае бесконечной дисперсии у F и в отсутствие симметрии) следует из наших результатов по разложениям Эджворта.
Следующее утверждение касается слегка усеченного среднего в случае, когда EXi < 00, т.е. в случае легких хвостов.
Теорема 1.3 Предположим, что EX'f <00, ап V ßn —> 0, п —* 00, и что выполнены условия [Лх], Кроме того, предположим, что для любого В >
О Ф0п^(В) = oft/fôjlog*»)-1) « Vi-ß^iB) = o((m.ßn)\ogmnrl)
при п —> сю. Тогда
aup\FTn(x) - Ф(.т)| - o(r"J/2). (8)
16R
Далее в главе 1 приведено несколько следствий теорем 1.1 - 1.3. Первое следствие касается случая слегка усеченной суммы, когда ф.р. F принадлежит области притяжения устойчивого закона.
Обозначим RVfj° класс регулярно меняющихся на бесконечности функций: g € RV™ g(x) = \х\р L(x) для \х\ > х0 с некоторыми хо > 0, р е R, и L(х) - положительной медленно меняющейся Fia бесконечности функцией. Нам понадобится следующее условие регулярности плотности f на хвостах:
[Я]. Предположим, что f G RV™, где р = — (1 + 7), 7 > 0, и что
\f(x + Ax)-f(x)\=o[f(x)\^-\), когда Ах = о(|г:|), при |а;| —> оо.
Следующее утверждение справедливо для слегка усеченных сумм в случае правильно меняющейся на бесконечности плотности.
Следствие 1.1 Предположим, что ап V /?„ —> 0 при п —> оо, условие [Л1] выполнено с некоторым е > 0, и плотность / удовлетворяет условию [/?] с О < 7 < 2 на множестве Р~г(и). Тогда: (г) оценка (7) справедлива;
(и) кроме того, если 7 = 2 и а1 < оо, то оценка (8) также имеет место.
Второе следствие касается классического случая усечения на уровне центральных порядковых статистик.
Следствие 1.2 Предположим, что 0 < й[ < 62 < 1 и что выполняется условие [Л1]. Кроме того, предполоэ!сим, что плотность / удовлетворяет условию Гелъдсра порядка д> 0 на множествах с = а, Ъ. Тогда
хбК У/п
где С > 0 - не зависящая от п постоянная.
Следующая группа результатов главы 1 касается разложений типа Эджворта. Определим
7зж„, = / (Q„(u) - fiw )3 du, Jo
где, как прежде, С?п(и), 1Щл) ~ квантильная функция и среднее с.в. и
положим
Г 2 (»Щ*) - &0 , я2 ОЩ») - 6-Д.)
^ = _ 7Ю + п Дб^О •
Определим две последовательности вещественных чисел
_ 7з,1К(п) _ 62ЛУМ
Л1« ~ ТЗ > Л2(„) - —
В главе 1 доказывается, что в условиях [/^-[Лз] для ф.р. Fyn имеет место разложение типа Эджворта, мы находим для Fiero явную формулу:
Ф)
п^} = -
где ф = Ф',
G^s) = Ф(х) ~ + Щп))(х2 - 1) + (9)
1 ( a„(l-g„) | Д,(1-Д,Г.
" V ДбО Д6-/0
а Ьп/ащп) имеет смысл асимптотического смещения (несмотря па отсутствие каких-либо моментных предположений в наших результатах).
Если выполнены условия [Л1] и [Лу, то второй член С?„(:е), то есть Сп(х) — Ф(ж), для любого фиксированного х есть величина порядка 0(г^2), п —» оо.
Чтобы доказать неулучшаемость в общем случае порядка оценки
скорости сходимости к нормальному закону распределения усеченной суммы, мы рассматриваем ситуацию, когда ап V /?„ —» 0, существует плотность / = Р" при всех достаточно больших |э:|, и эта плотность правильно изменяется на бесконечности с показателем р = — (1 4- 7), где 0 < 7 < 2 (предполагая также отсутствие симметрии ф.р. ^ и усечения, иначе С„(х) = Ф(ж)). Используя свойства Караматы для урезанных моментов, мы находим, что в этом случае
Следующая теорема утверждает справедливость асимптотического разложения для распределения нормированной усеченной суммы.
Теорема 1.4 Предположим, что условия [Л1]-[Лз] выполнены. Тогда
С С
вир |Гт„(ж) - (Зп(а;)| < — (¿1,„ + 62,„ + 53,„) + хбЕ п пЛ>4
С:
+ ^(Л5,п + Лв,п)+С4Г-с, (11)
п
для любого с > 0 и некоторых постоянных С{ > 0, г = 1,... ,4, не зависящих
4 / \2+£ / \2+е
от п, где = ^ = а2 ) + % (с
произвольным £ > 0), ¿зп - то оке, что и б2„, по се = 0, кроме того 84 п =
где В > 0 есть некоторая постоянная, зависящая только от с. Наконец, ¡(А! +за2 )6„|
<5б,п = *—(п' —1. Постоянные С{ в правой части (11) зависят только от сие. <п>
Для формулировки дальнейших результатов потребуется еще одно предположение:
\Ь]. Существует 0 < в < 1 такое, что Птзир,,^^ пя/г„ < оо.
Следующий результат относится к случаю слегка усеченной суммы (ап V Рп —> 0) и бесконечного второго момента у распределения Г (ЕХ% = оо).
Теорема 1.5 Предположим, что ап V (Зп —> 0, п —► оо, условия [Л1] и [Ц выполнены и плотность исходного распределения / удовлетворяет условию [Д] с 0 < 7 < 2. Тогда
,п . , _ . .. л /(1оЕА;п)5/4 (1огтп)5/4
Далее в главе 1 мы получаем разложения тина Эджворта для стыо-дентизованных (слегка) усеченных сумм. Определим эмпирическую квантильную функцию Qn{u) = Хкп-П\/ F~l{u)f\Xn-mr>:n, и оценки подстановки
№vw = / Qn(u)du, a2w = / (Qn(u) - flw )2 du J 0 J 0
для /IwM и crj^ j соответственно.
Определим ф.р. етыодентизовапной усеченной суммы
Fr„,.Ç(ar) = Р(а^пП1'2(Тп - ц(ап, 1 - Д,)) < я).
Мы доказываем, что разложение Эджворта для FTntS(x) дается формулой
п(х) = Ф(х) + ((2х2 + 1)А1(„, + 3(.т2 + 1)А2(„, - 6, (12)
Нп
где - величина, определенная в (10). Положим
An,s =
(13)
где
, , > a?/2 /logfcn\3/4
*(„) = В[log^2„ + + logm„(g2n + ^-ф» (В))],
где В > 0 - некоторая постоянная,
3/2
ад = (в)
Si(n)
aW(n)
а,"/ ~ , , /log 1/2 ф
,3/2
+
a^2 log Атп
+
I-B -i-(B) /?;У2 log m„
logm„
m„
1/2
r/4 log/crl^n+log /logfcn logTOn^
o5(n) =-2-= ^ —;--1--•
naWH V kn rrin )
Величина A„ts определяет порядок остаточного члена в стохастической аппроксимации разности — 1 суммой независимых с.в. (см. лемму 1.2).
Следующий результат утверждает справедливость разложения Эджворта для етыодентизовапной усеченной суммы (в том числе, для слегка усеченной).
Обозначим 5п величину, стоящую в правой части (11) (см. теорему 1.4). Теорема 1.6 Предположим, что условия [Ai], [/Ц] и [A3] выполнены. Тогда sup |FTn,s(x) - Нп(х)\ < C(Sn + ¿n,s), (14)
xeR
где С > О - некоторая постоянная, не зависящая от п, 8„ts — &n,s + £i=As(n)> 5us{n) = logfcn(^9a„ + *r) + logmn(^=^„ + S2,s(n) = (log кп)г qln + (log mnf qfin + log kn log mnqanqPn(qUn +qpn).
Теперь сформулируем результат типа Эджворта для стыодентизованной статистики Т„, параллельный теореме 1.5.
Теорема 1.7 Предположим, что ап V /?п —♦ 0, п —> оо, условия [Ai] и [L] выполнены, и плотность удовлетворяет условию [Я] с 0 < 7 < 2. Тогда
1П . , „ , .. Л /(log/U5/4 (logm„)5/4\ , ч
sup IFTnj{x) - Hn(x)I = О 1 + 1 ё 3/7 , n - 00. (15
*eR V к' mil }
В завершение обзора содержания главы 1 опишем построение {/-статистической аппроксимации для с.в. Т„ и для оценки подстановки ее асимптотической дисперсии, которые играют ключевую роль в доказательствах. Положим 1„(Хг) = 1{х,< {„}> где = Р~1(г/), 0 < и < 1, и 1 а ~ индикатор события А. Определим [/-статистику степени 2 с ядром, зависящим от п:
п
ьп+Ип = ^ + ^ м' (16)
где
ьп,г = ^(ВД - = - 1а„(Х0)
+ £а„1а„№) + &-Д. (1 - 11-Д,(Х0) - ,
И
+ /¿^¡(^-^ - - &)) (!н№) - (1 - А.))] •
Заметим, что
ЕЬ„£ = 0, г = 1,... , шгф,л = °> =0, г, 3 = 1,...,п (1^3).
поэтому, как n в случае разложения Хёфдинга, приближение посредством (16) означает аппроксимацию суммой с некоррелированными слагаемыми.
Следующая лемма дает оценку точности аппроксимации Тп суммой U-статистики вида (16) и смещения Ьп (см. (10)).
Лемма 1.1 Предполооким, что условия [yli] и [Л2] выполнены. Тогда для любого с > 0
р(\п^2(Тп - fi(an, 1 - /?„)) - {Ln + Un + 6n)| > Д„) = 0(г"с), (17) где Д„ = Л(Д„,„ + Дд«),
ti/íb
и А, В > 0 - постоянные, зависящие только от с.
Ключевой леммой при доказательстве результатов для стыодептизованного
;2 ¡„г
независимых одинаково распределенных случайных величин
варианта Тп является утверждение об аппроксимации j — 1) суммой
Лемма 1.2 Предположим, что условия [Л]] и [А2] выполнены. Тогда для любого с > 0
PflSr* - 1 - ^ > AAn,s) = 0(г-% (19)
где Д- величина, определенная в теореме 1.6, Vn = Vn¿ + Vn 2,
м= Ж)-ñ-
7(Cwü-ñ-W«
и
¿=i
Л, В > 0 (В - константа, появляющаяся в ¿i(n), i = 2,- некоторые постоянные, не зависящие от п. Кроме того, EVn = 0 и EI-j^-) = П(Е(Щ(П))* . 2 , „2 А
В главе 2 доказывается, что то п-бутстреп-аппроксимация (п - объем исходной выборки, т - объем бутстреп-выборки; т/п —> 0 при т —» оо) распределения усеченного среднего является состоятельной без каких-либо предположений относительно исходного распределения Р. В то же время классический бутстреп Эфрона (случай т = п) и нормальная аппроксимация не состоятельны, если имеются промежутки ненулевой длины нулевой .Р-меры такие, что их границами являются квантили, в которых происходит усечение. Рассматриваются два варианта усеченного среднего:
1 х ,1-/3
= = (2°)
где а, ¡3 > 0 - фиксированные числа, а < 1 — /?, [к] здесь и далее обозначает целую часть числа к.
Пусть Х^,. • •, Х*т обозначает бутстреп-выборку объема т = т(п) из эмпирического распределения с ф.р. Рп, основанного на первых п наблюдениях Х\,... ,Хп исходной с.в.; Р*п обозначает бутстрен-эмпирическую ф.р., Х{.п1 < •• ■ < Х*т.т - соответствующие порядковые статистики. Здесь и далее мы используем сокращенное обозначение т, опуская аргумент п. Определим т ф п-бутстреп-двойников усеченных средних:
} т—[Рт] ^
Тп'т" = т - [ат] - ЦЗт] ' Т"'т<2> = \ - а-/3 }а
1 ' 11 1 ¡=н+1 н а
(21)
где а и 0 те же, что и в (20). Хорошо известно, что обе версии усеченного среднего служат статистическими оценками параметра сдвига
/3) = 1 " Р-1 (и) йи (22)
^ Р ¿а
-генерального усеченного среднего. Бутстреп-версия параметра ц(а,(3) дается формулой цп{а,Р) = Рп1{и)аи = Тн2Г Введем и-е (0 < и < 1)
квантили Г, Я, и Р^. & = Р"1 (и), = Сш:т = (КУ'П-
Прежде всего мы показываем, что п1/2{ТП{2) - ТП{1)) 0, Р-п.н., п —> оо, и
что т1/2(Т*Ш(2) - Т*тт) 0, Р-п.н., тт(п,т) оо. (Здесь и всюду далее Р* обозначает вероятностную бутстреп-меру, имеющую атомы 1 /п в точках Х^п, Е* обозначает соответствующее математическое ожидание). Из этих соотношений следует, что предельные распределения (если они существуют) обеих версий усеченного среднего, определенных в (20), одинаковы; то же замечание справедливо для распределений соответствующих бутстреп-двойников. Поэтому мы будем далее использовать следующие сокращенные обозначения: Тп = Г„ш, Т*Щ1П = Т^ , ^ = 1, 2.
Мы показываем в главах 3, 4, что асимптотические свойства второго порядка (разложения Эджворта) двух вариантов усеченного среднего и соответствующих их бутстреп-версий различны, и что ТП(2) является более подходящим определением усеченного среднего в контексте бутстрепа. Определим две величины
А = sup{x : F(x) < а} - а) ; В = sup{x: F(x) <1-0}- 1 - /3),
которые обращаются одновременно в нуль тогда и только тогда, когда инверсия F-1 непрерывна в точках а и 1 — ¡3. Введем вспомогательные с.в. Yi, имеющие функцию распределения G(x):
ГХ,- + Л, Xi < Yi={Xu Z«<Xi< ОД = ^Xi — B, 6-/3 < Xi.
' F(x - A), x <£И + А F(x), £a + A<X< KF{x + B),
г = 1 ,...,n. Определим обратную функцию G~l(u) = inf{a; : G(x) > и} и квантили распределения G: rja = G~l(a) = + Л , щ^р = G_1(l — /3) = £i-/3 • Введем с.в. У;, уинсоризованные вне интервала (г]а, r/i-/}], т.е.
Wi = r]aV(YiArh^)y i= l,...,n, (23)
соответствующая им квантильная функция имеет вид Q(u) = rja V (G-1(u) А г?1_/з). Определим первые два центральных момента И^:
Q(u) du, (Q(u) ~ 4w)2 du. (24)
jo ./u
Пусть (Zi, ¿Г2, Z3) обозначает нормально распределенный случайный
вектор Л/"(0, С) с нулевым математическим ожиданием и ковариационной
матрицей
а(1 - а) а(т]„ - fiw) -а/3 a(Va ~ fiw) <?w РЫ-P ~ Vw) -а/3 Pfa-p-w)
Положим Z = (1 - а - (З)'1 ( - Л max(0, Zi) + + J3 max(0, Z3)). Обозначим Fz Ф-Р- с.в. Z. Мы предполагаем, что rja ф Щ-р, т.е. что оцг > 0.
Следующая теорема есть основной результат главы 2, она состоит из двух частей: мы доказываем, во-первых, версию классической теоремы С.Стиглера, дающей асимптотическое распределение усеченного среднего и, во-вторых, m С n-бутстреп-аналог этой теоремы.
Теорема 2.1 Предположим, что crjy > 0- Тогда
(г) sup Р(тг1/2(ГП — fx(a,P)) < х) — Fz{x)\ —> 0, п —* оо; ген
(й) sup Р*(тп1/2(Т*т - Тп) <x)~Fz{x) —0, та оо, m/n -> 0. xeR
Кроме того,
(И') если (mloglogn)/п —» 0, тп —> оо, то в (И) есть сходимость Р-п.н.
Отметим, что условие т/п —> 0 необходимо для сходимости к предельному распределению только в том случае, если длина хотя бы одного из промежутков Л и Б не равна нулю. Однако, если А — В — 0, то предельное распределение является нормальным при единственном условии, что п Л m —* оо. Следующее утверждение есть прямое следствие теоремы 2.1.
Следствие 2.1 Предположим, что aw > 0, тогда
(t) sup P*(m,/2(Tn,m - Тп) < х)-Р{nl'2(Tn - fi(a,ß)) < х)| 0, хек 1
тп —► 00, тп/п —» 0 .
(¿') Б (г) имеется сходимость Р-rut., если тп —> со, (mloglogn)/n —► 0.
Далее в главе 2 обсуждаются некоторые применения полученных результатов. Так как предельное распределение n1/,2(T„ — ß(a,ß)) имеет, вообще говоря, ненулевое среднее ЕZ, естественно оценивать параметр ß(a, ß) с помощью статистики Тп — rTx/2EZ (см. (25), ниже). Для оценки асимптотического смещения ЕZ мы предлагаем применить m n-бутстреп-процедуру. Определим
EZ = т1/2Е*(Г*1т - Т„), a2n,m = т (Е*(Тп*,т - Тп?) - Ez\ (25) Мы доказываем следующее утверждение о состоятельности этих оценок. Утверждение 2.1 Если стуг > 0, mo
EZ - EZ 0, <T2n,m/Var(Z) 1,
при тп —» oo, тп/п —» 0. Кроме того, сходимость здесь имеет место Р-п.н., если (m\og\ogn)/n —► 0 при m —> оо.
Величины Е*(7^т) и <г2п,т легко вычислить, используя метод Монте-Карло.
Полученные результаты применяются в главе 2 для построения доверительного интервала для параметра (i(a,ß). Результаты главы 2 иллюстрируются компьютерным моделированием.
В главе 3 устанавливается справедливость разложений Эджворта для нормированного и стьюдентизованного усеченного среднего. Оценивая
входящие в формулы этих разложений неизвестные параметры, мы получаем эмпирические разложения Эджворта.
Мы снова рассматриваем два варианта усеченного среднего, определенные в (20), и предполагаем, что инверсия F~~1 непрерывна в точках а и 1 — (3.
Определим уинсоризованные с.в. И7, = V (X,- Л и квантильнуго
функцию <2(н) — V (Г"1 (и) Л и € (0,1). В дополнение к первым
двум центральным моментам И^ (см. (24)) определим третий момент: 73^ = /у {(}{и) — ц\у)ъ ¿и и положим
¿2,IV = ~~ + ~ ^
Предположим, что ф ^..¿3 (т.е. а\/ >0). В главе 3 показано, что формулы разложений Эджворта для усеченных средних ТП(1) и ТП{ отличаются только асимптотическим смещением Ъп, поэтому мы используем объединяющее обозначение Т„, подчеркивая различия между ГП(1) и ТП[2) в тех случаях, когда это необходимо. Определим функцию распределения
v (1 - а - ß) 1<TW )
(27)
нормированного Т„. Положим Ai = 7з,К'/,ти'> ^2 = ö-i.w/о\у Мы доказываем, что разложение Эджворта для Ft„(x) имеет вид
Gn(x) = Ф(х) - ((Ах + ЗА2)(х2 - 1) + бу^-М , (28)
оу/п \ . аw/
где Ф - стандартная нормальная ф.р., ф — Ф', Ьп = ЬП(1) - асимптотическое смещение, которое для ТП(2) определяется формулой
Ь =A_i_»(l-a) + ßil-ß)\ m
1 №а) + f{b-ß) /' (29j
а для ТП(1) имеет вид
bnm = ö,l(2) - &[.],„ (30)
где
an - [an] ( \ ßn- [ßn] ( . ns , \
b[.],n = (M<*> ^ {»(<*, ß) ~ ii-i8 J ■
Для формулировки результатов потребуется следующее условие:
[Ci] Предположим, что функция распределения F имеет плотность f = F' в окрестностях точек причем /(£,,) > 0, f =- а, 1 - ß. Кроме того, предположим, что плотность f удовлетворяет условию Гёльдера порядка а > 0 в точках то есть существует постоянная С, такая, что
|/(ж) — /(£^1 < С\х — £„|а, для всех х, принадлежащих окрестности ь> = а,\-(3.
Теперь сформулируем первый результат о разложении Эджворта для нормированного усеченного среднего.
Теорема 3.1 Предположим, что выполняется условие [Ci]. Тогда
sup |FTn{x) - Gn(x)\ = o(n"1/2-p), n -> oo, (31)
xeR
для любого p < min(a/2,1/4). Кроме того, если a > 1/2 в условии [Ci], то имеет место оценка
sup |FT„(x) - Gn(x)I = o( (l0gvn4)S/4), П - oo. (32)
лей V " ' '
В главе 3 мы получаем разложения Эджворта и для стыодентизованного усеченного среднего. Определим
= / <3п(и) ¿и, як'п ~ / (<3п(и) - т,п)2 д,и, (33)
Л ' 70
где С?п(и) = (,„п:.п V А С(1-,з)п:г1) - эмпирическая квантильная функция.
Определим функцию распределения стьюдентизованного усеченного среднего:
\(l-a-(f) 'ffw.n
Положим
Нп(х) = Фф + ( (2х2 + 1)Al + 3(а;2 + 1)Аз _ М . (34)
О\jn \ fflY)
Следующая теорема утверждает справедливость разложения Эджворта для стьюдентизованного усеченного среднего.
Теорема 3.2 Предположим, что выполняется условие [Ci]. Тогда
sup\FTn,s{x) - Нп(х)\ = о{пп -> оо, (35)
хбй
йля любого р < min(a/2,1/4). Кроме того, если а > 1/2 в условии [Ci], mo имеет место оценка
suplFT„,s(x)-Hn(x)\ = 0(-^^), п^ оо. (36)
тел ^ /
Для того, чтобы получить эмпирическое разложение Эджворта мы заменяем А], Л2, Ьп и а\у в (28) и (34) их статистическими оценками. Неизвестные параметры моментного типа оцениваются методом подстановки эмпирической ф.р. Так мы получаем оценку Л1 = Для оценки
Л2 и Ъп требуется оценить значения плотности /(£а) и /(£]-/з). Для этого мы используем ядерные оценки со ступенчатым ядром: д(х) = 1{|х'| < 1/2}, в качестве ширины ядра используется 5 = гГ1^. Тогда
оценки для значений плотности определяются равенствами: /(&,) = п-з/4 Еп=1 1{2пх/4|х. _ < 1}> где V — а,\— /3.
Заменяя все неизвестные величины их оценками в формулах (28) и (34), мы получаем эмпирические разложения Эджворта:
х) = Цх) - + 3\2)(х2 - 1) + 6^-Ьп »
6 у/п у о и', п ) '
Нп(х) = Ф(х) + ~( (2а;2 + 1)А1 + 3(*2 + 1)Л2 - ) ,
Ьу/п ^ а\¥,п у
где (Тц/П - корень из оценки асимптотической дисперсии (см. (33)).
В следующем утверждении устанавливается справедливость эмпирических разложений Эджворта.
Теорема 3.3 Предположим, что условие [С\] выполнено с а — 1, то есть что в окрестностях квантилей £1-/3 существует положительная плотность /, удовлетворяющая там условию Липшица. Тогда для любого с > О
>А1 (У/4}=0(^С), п-сх), (37)
хе&
вир IРгп,з(х) - Нп(х)
хея
* (10^/4)5/4} = °(П_С)> П (3§)
где А{ (г = 1,2) - некоторые постоянные, зависящие только от с.
В заключение, мы доказываем, что результаты главы 3 не могут быть получены в качестве следствий общего результата Х.Путтера и В. ван Цвета (см. сноску 9, стр. 4) для симметрических статистик, поскольку их условия не могут быть выполнены для усеченного среднего.
В главе 4 доказывается справедливость разложений Эджворта для бут-стреп-версий усеченного среднего, находятся явные формулы для члена порядка гпл^ (корректирующего асимметрию и смещение; т - объем бутстреп-выборки). Опираясь на эти разложения и результаты главы 3, мы
доказываем корректность второго порядка т ф п-бутстреп-аппроксимации для усеченного среднего, т.е. доказываем, что т ф п-бутстреп-аппроксимация ф.р. усеченного среднего и стьюдентизованного усеченного среднего является более точной, чем нормальная аппроксимация. В главе 4 показано, что в общем случае т ф п-бутстрепа свойство корректности второго порядка усеченного среднего ТП(1), заданного первой из формул (20), может быть достигнуто только при дополнительной коррекции смещения, в то время как для ГП(2), заданного второй из формул (20), коррекция не требуется.
Для того, чтобы сформулировать некоторые из результатов главы 4, будут нужны следующие предположения:
\С[] Предположим, что функция распределения Р имеет плотность f = Р' в окрестностях точек причем /(&-) > 0, у = а, 1 - В. Кроме того, предположим, что плотность / удовлетворяет равномерному условию Гёльдера порядка а > 0 в окрестностях точек т.е.
существует постоянная С такая, что ¡/(г) — /(у)| < С\х — у\а, для всех х, у, принадлежащих окрестности V = а, 1 — /3.
[СУ Для некоторого 0 < с? < 1 т = О , п Л т —* оо.
В главе 4 показано, что формулы разложений Эджворта для бутстреп-версий (в "бугстреп-мире") совпадают с соответствующими формулами для нормированного и стьюдентизованного усеченных средних (в "реальном мире"), если заменить входящие в эти формулы величины их оценками подстановки. Справедливость этих разложений доказывается в условиях [С{] и [Сг]. Из-за ограниченности объема автореферата мы не будем формулировать теоремы 4.1, 4.2 о справедливости разложений Эджворта для бутстреп-версий усеченных средних. Вместо этого мы приведем некоторые их следствия, касающихся корректности второго порядка бутстреп-аппроксимации.
В дополнение к предыдущим обозначениям, относящимся к главам 2 и 3, наряду с величинами И7;, определенными в (23), введем их бутстреп-версии: = £ап-.п V {X* Л _/?)„;„), г = 1,... ,т„ определим соответствующую им квантильную функцию С}*т(и) = Ст:ш V ((Р^)~1(и) А
Как и прежде, мы отмечаем, что разложения Эджворта для двух версий бутстреп-двойников усеченного среднего отличаются только смещением, поэтому мы используем объединяющее обе версии обозначение Т*т, уточняя, какой из вариантов имеется в виду там, где это необходимо. Определим ф.р. нормированной бутстреп-версии усеченного среднего: (х) =
I?* < \ ги /^гси-г-«,) /
стьюдентизованного усеченного среднего ЬТ. 5(ж) — Р I (х-а-д-^' ^ х
где Кк,т)2 = /о (<2т(и) - ^ И = /„ ^и) ¿И
Определим величину Ь = + ■ Следующее утверждение
является следствием теорем 4.1 и 4.2 главы 4 и теорем 3.1 и 3.2 главы 3. Оно справедливо для Тп - ТП(2) и Т*т = Т*>тт, т.е. для усеченного среднего, определенного второй из формул (20) и для соответствующей бутстреп-версии.
Следствие 4.1 Предположим, что условия [С[] и [Сг] выполнены. Тогда
Fi. (х)
FT (х) = -ф(х) - 4=
"И1 ; VV™ V"
-(A! + 3A2)(x2-l) + &
,п,т ,fi
+1) + ~А2(Х2 + 1) — Ь
,П ,т
где для к = 1,2: = o(n~ll2~p) для любого р < min(o/2,1/4) при п —» оо, Д/с,п,т = 0 (m"~1^2n~s) d/ш любого s < а/2, P-n.7t. при п Л т —» оо, Д^т = о (т-1/2-р) для любого р < min(a/2,1/4, d/(4(2 — d))) Р-п.н. при п Am -* оо.
Отметим, что гп может быть здесь как меньшего порядка, чем п, т.е. т п, так и большего, т.е. то ^ п. Граничный случай т — п соответствует стандартному "простому" непараметрическому бутстрепу Эфрона.
Из наших результатов следует, что корректность второго порядка т ф n-бутстреп-аппроксимации, т.е. граница порядка о{гГ1!2), для усеченного среднего может быть достигнута тогда и только тогда, когда т/п —» 1 при п —» оо, то есть когда т = п + о(п). Кроме того, если мы предположим выполненным условие: т = п + 0(пТ) с некоторым 0 < г < 1, то получим, что — ^ =0 (п~3/2+г). Из этого соотношения и следствия 4.1 вытекает следующий результат для m ф п-бутстреиа.
Теорема 4.3 Предположим, что условие [С[] выполняется, и пусть т = п + 0(пг), 0 < г < 1. Тогда для любого р < min(a/2,1 — г, 1/4)
sup I Fl.
xeR n'ra<2>
sup\F}.m ,s (x) - FT s (*)| = о in-1/2-") ,
xeR ' <2> <2) 4 '
(39)
(40)
Р-п.н., Т1 —» оо.
Далее в главе 4 мы объясняем, почему использование усеченного среднего Т„т, заданного второй из формул (20), предпочтительней в контексте бутстрепа. Мы доказываем, что для ТП(1) (см. первую из формул (20))
результат, аналогичный теореме 4.3 (т.е. корректность второго порядка), может быть получен только при введении дополнительной коррекции смещения, без которого в общем случае может быть получена только оценка О (mm(n, m)-1/2). Этот факт составляет содержание теоремы 4.4.
В п. 4.3 главы 4 мы обсуждаем возможность получения корректности второго порядка для бутстреп-аппроксимации за сокращенное время моделирования, т.е. когда m < n (m/n —> 0, т —> оо). Эта возможность связана с использованием полученных нами разложений Эджворта в сочетании с бутетреп-экетраполяцией Бикела - Яхавы. Подробно обсуждается метод бутстреп-экстраполяции, доказываются соответствующие результаты: теоремы 4.5 и 4.6.
В п. 4.4 главы 4 выводятся следствия (теоремы 4.7, 4.8) для случая "простого" бутстрепа, когда т = п.
В п. 4.5 главы 4 приведены результаты численного моделирования, которые иллюстрируют наши результаты по корректности второго порядка т ф п-бутстреп-аппроксимации.
В главе 5 изучаются свойства выборочных квантилей и их бутстреи-версий, доказываются результаты типа Бахадура - Кифера. Результаты главы 5 носят вспомогательный для наших целей характер, они служат основой построения [/-статистических аппроксимаций. Вместе с тем они новые и имеют самостоятельный интерес.
Приведем некоторые из результатов главы 5. Пусть кп - последовательность натуральных чисел такая, что 0 < кп < п, и гп = кп Л (1 — кп) —> оо, п —> оо. Положим ап = кп/п, и пусть = F~l(an), i0nn-n = Fnl{an) обозначают соответственно генеральную и выборочную квантили уровня ап. Определим два числа
О < а\ = liminf ап < аг = limsup ап < 1. (41)
п—оо „_ оо
В формулировках результатов п. 5.2 используются следующие условия.
[Вх]. Функция Fдифференцируема в некотором открытом множестве U С (0,1) (т.е. плотность / = F' существует и положительна в F~1(U)), кроме того,
(0,е), 0 = oi =а2, (1-е, 1), oi = а2 = 1,
U Э (0, я2] 0 = ах < а2, U D [аи 1), 0 < <ц < а2 = 1, [аь аз], 0 < аг < а2 < 1, (0,1), ах = 0, о2 = 1,
(42)
с некоторым 0 < е < 1 в случаях, соответствующих первым строкам (42).
[2?2]- r^1 logn —> 0, п —> со.
Отметим, что условие [Д] соответствует условию гладкости [Лх] из главы 1, отнесенному к одной из участвующих в [Лх] последовательностей.
Пусть И - вещественнозначная функция, определенная на множестве Г'1 (II) (см. (42)). Возьмем произвольное 0 < С < оо и для всех достаточно больших п определим
%an,h{C) = SUP
|(|<С
(43)
где h о F~l(u) — h (F"l(u)). Кроме того, определим функцию Фa„,h{G), которая получается из Фа„д(С) заменой logr„ на logn в (43).
Пусть G(x), х £ R, обозначает вещественнозначную функцию, д = G' - ее производную, если она существует, и пусть (g/f)(x) и (|ff|//)(x) обозначают отношения д(х)/f(x) и \g{x)\jf(x) соответственно.
Теорема 5.1 Предположим, что гп —> оо, п —> оо, условие [£?j] выполнено и функция G дифференцируема на множестве F_1(U). Тогда
С(Саяп:П) - G(U = -fofo.) - ^¿J] j(6J + Дп(а„), (44)
где для любого с > О
Р(|Я„К)| > Дп) = 0(г~с), п-* оо,
Дп = Л K(l-an))^ (!^)3/4M(eaj + B(Qn(i_an))i/2 (C)t
где А, В и С - некоторые положительные постоянные, зависящие только от с.
Кроме того, если дополнительно условие [Вг] также выполняется, то (44) имеет место и для любого с > О
P(|-ftn(Qn)| > А«) = О (п~с) , п
оо,
где Д„ получается из Дп заменой log гп на log п и заменой функции Фвп,а (С)
функцией Ф„пя (С).
Следующий результат дает представление для сумм порядковых статистик, находящихся между генеральной квантилыо уровня ап и соответствующей выборочной квантилыо. Именно это представление лежит в основе квадратичного члена [/-статистической аппроксимации для усеченных сумм.
Теорема 5.2 Предположим, чтогп —> оо прип —> со, условие [Si] выполнено и функция G дифференцируема на множестве F^iJJ). Тогда
L
] fj (G(x) - G(C J) dFn(x) = -~[Fn(U) ~ F(UJ\j(U) + Rn(an), (45)
где для любого с > О
Р(|Дп(«п)| > А„) = О (г~с) , п оо,
Дп = А (ап( 1 - ап))3/4 (^)5/4 ^(и) +Ва„(1 - (С), где А,
В и С - некоторые положительные постоянные, зависящие только от с.
Кроме того, если дополнительно условие [Вч\ также выполняется, то (45) имеет место и
Р(|йп(а„)| > Дп) = 0 (тГс), п - оо,
для любого с > 0, где Д„ получается из Д„ заменой ^ гп на log п и заменой функции (С) функцией Фап а (С).
Далее в п. 5.2 формулируются следствия теорем 5.1-5.2, в которых остаточный член дается в более простой форме, рассматривается несколько примеров.
В п. 5.3 главы 5 формулируются и доказываются аналогичные результаты для бутстреп-версий квантилей. Пусть 0 < а < 1 - фиксированное число, «[„] = Кп(£пп:п), б - функция, определенная и дифференцируемая в окрестности квантили = /"""'(о:), д - ее производная.
Лемма 5.4 Пусть в некоторой окрестности £п существует плотность / = Г', причем /(£«) > 0. Предположим, что выполнено условие [С2]-Кроме того, предположим, что функции /, д удовлетворяют равномерному условию Гёльдера (см. [С{] выше) порядка а > 0 е окрестности Тогда
С(Ст:ш) ~ С(и.п) = - К(?ап:п) ~ ^Ы] у({«п:п) + К, (46)
где Р* > т~1/2~р) = о(т~с) Р-п.н. при п А т -» оо, для любого р < тт(а/2,1/4, <1/(4(2 - д))).
Заметим, что если а > 1/2 в условии Гёльдера и д. = 1 в условии [6'2], то остаточный член Щп в (46) имеет бахадуровского типа порядок о(т~3/4+<г) Р-п.н. для любого е > 0. Следующая лемма является бутстреп-версией теоремы 5.2 (для фиксированного а £ (0,1)).
Лемма 5.5 Предположим, что выполнены условия леммы 5.4. Тогда
гСт.п
(ат:тп
= ~2 ~ -^"(Сап:«)]2 у{£ап:п) + Кч (47)
где Р* > = о(тп~с) Р-п.н. при п А т —> оо для любого р <
шш(а/2,1/4, ¿/(4(2 -<*))).
В главе 6 рассматриваются статистики вида Ьп = тГ1^2 с\уП е Ж. Мы получаем некоторые оценки скорости сходимости распределений нормированных с.в. Ьп к нормальному закону, т.е. неравенства типа Берри -Эссеена. Положим
1 "
Ъ = п тах |С;>П - 7з = - Кп|3#|^:п|3,
2<1<п п ^—^
1=1
Рп(х) = Р р» < ж}, где аЬп = (1)Ь„)1/2, ОЬп - дисперсия Ьп.
Мы получаем следующее обобщение результата В. ван Цвета для ¿-статистик (см. сноску 8, стр. 4).
Теорема 6.1 Предположим, что 0 < 01п < оо. Тогда
эир \Рп(х) — Ф(х)| < С
хеЖ
где С - абсолютная полооюителъиая постоянная.
7З + 63№1}3 ЬЧЭД}2
о "Т" о
-1/2
(48)
Если Е|^"х|3 < оо, то из (48) следует оценка В. ван Цвета. Однако теорема 6.1 имеет и другие следствия. Из нее мы выводим следующий результат.
Теорема 6.2 Предположим, что Е|Х1| < оо, а1п > 0 и что сг п = 0 для г = 1,2,п - 1,7г. Тогда
зир|К(х)-Ф(х)|<С
гбК
/ЬЕ[Х1
V
+
/ЬЕ|Х1
V
г"1/2.
где С - абсолютная положительная постоянная.
В главе 7 изучается состоятельность бутстрен-аипроксимации распределений ¿-статистик с весами с^п, определенными с помощью весовой функции J(u), и б (0,1), по формулам: (г) = ^(¿¿тг) или (И) с^п =
f^1ynJ(u)du, г = 1,...,тг. Мы показываем, что имеется некоторое различие в асимптотических свойствах распределений бутстреп-версий Ьп для этих двух типов весов. При одних и тех же естественных моментных предположениях условия гладкости, налагаемые на функцию 3, достаточные для состоятельности бутстреп-аппроксимации, в случае (И) более мягкие, чем в случае (г). Воспользуемся интегральным представлением Ьп, причем в случае (г) будем обозначать ¿-статистику Вп, а в случае (гг) - Тп. Иными словами:
5» = С ^(«Ш«) ди- Тп= [1 ^(и)3(и) ¿и, Jo ио
где ^-'(и) - инверсия эмпирической ф.р., ./„(и) = 3 (¡¿у) , ^ < и <
Введем т ф n-бутстреп-версии статистик Sn и Тп, которые определяются формулами
= f Ю"1 («)4»(и) du, т; = f (f;)-1 (u)j(u) du. Jo Jo
Введем величину t(J,F) = f^ F~l(u)J(u) d.u, статистическими оценками которой могут служить Sn и Тп. Бутстреп-версия параметра т(,7, F) -это величина r(J, Fn) = fj F"1 (и) J(v) du — Тп, получаемая из t(J,F) подстановкой эмпирической ф.р. Обозначим
оо оо
a\j, F) = J J J(F(x))J(F(y))\F(mm(x, у)) - F(x)F(y)} dx dy
—00—ОО
асимптотическую дисперсию L-статистики и положим для краткости а2 =
Среди других результатов мы доказываем следующее утверждение о корректности бутстреп-аппроксимации для L-статистик.
Теорема 7.7 Предположим, что ЕХ2 < оо, А = 8ирце(-д ^ ] J(m)| < оо, функция J удовлетворяет условию Гёлъдера порядка а > 0 па (0,1) и ег = a(J, F) > 0. Тогда
sup |Р{МТп -т)<х}~ P*{V^CC ~Тп)<х}\ = 0(1),
sup < х} _ р .{Ут(Ъ-Тя) < ^ = о(1) f
sip IP < _ р .{УВД-г,) < я}| = 0(1) | (49)
х О-П. Gm
Р-п.н., пЛт->оо.
В теореме 7.6 мы доказываем, что соотношения (49) верны, если заменить в них Тп и Т* на Sn и S* соответственно, но при дополнительном условии, что функция J удовлетворяет условию Гёльдера порядка а > 1/2 на (0,1).
Публикации автора по теме диссертации Статьи в журналах и изданиях, рекомендованных ВАК:
[1] Грибкова Н.В. Об оценке скорости сходимости к нормальному закону усеченных линейных комбинаций порядковых статистик // Матем. заметки, 1987, т. 42, № 5, с. 739-746.
[2] Грибкова Н.В. О скорости сходимости к нормальному закону конечно усеченных линейных комбинаций порядковых статистик // Теория вероятн. и ее примеч., 1988, т. 33, № 4, с. 781-784.
[3] Грибкова Н.В. Об аналогах неравенства Берри - Эссеена для L-статистик. - В сб. Проблемы устойчивости стохастических моделей, Труды семинара ВНИИ системп. исследов., М 1991, с. 41-49. Англ. перев.: On analogues of the Berry - Esseen inequality for L-statistics //J. Math. Sci. (TV. Y.J, 1994, v. 72, No. 1, p. 2872-2879.
[4] Грибкова Н.В. Оценки скорости сходимости распределений L-статистик к нормальному закону в условиях, близких к условиям сходимости // Теория вероятн. и ее примеи. т. 37, № 4, 1992, с. 774.
[5] Грибкова Н.В. Об аналогах неравенства Берри - Эссеена для урезанных линейных комбинаций порядковых статистик // Теория вероятн. и ее примен., 1993, т. 38, № 1, с. 176-183.
[6j Gribkovа N. V. Bounds for absolute moments of order ststistics. - In Exploring Stochastic Laws: Festschrift in Honor of the 70th Birthday of Acad. V.S.Korolyuk (A. V.Skorokhod et al. Eds.), Utrecht: VSP, 1995, p. 129-134.
[7j Грибкова H.В. Бутстреп-аппроксимация распределений L-статистик// Зап. научи, семинаров ПОМИ, 1999, т. 260, с. 84-102. Апгл. перев.: Bootstrap approximation of distributions of the L-statistics // J. Math. Sci. (N. Y.), 2002, v. 109, No. 6, p. 2088-2102.
[8| Gribkova N.V., Helmers, R. The empirical Edgeworth expansion for a Studen-tized trimmed mean // Math. Methods Statist., 2006, v. 15, p. 61-87.
[9] Gribkova N.V., Helmers, R. On the Edgeworth expansion and the M out of N bootstrap accuracy for a Studentized trimmed mean // Math. Methods Statist., 2007, v. 16, p. 142-176.
[10] Грибкова H.B., Хелмерс, P. О состоятельности M <С iV-бутстреп-аппроксимации распределения усеченного среднего // Теория вероятн. и ее примен., 2010, т. 55, вып. 1, с. 3-18.
[11] Грибкова Н.В. Хслмсрс, Р. Аппроксимация второго порядка для слегка усеченных сумм // Теория вероятн. и ее примен., 2011, т. 56, вып. 4, с.
Работы, опубликованные в других изданиях:
[12] Deheuvels P., Gribkova N. V., Nevzorov V.B. Bootstrapping order statistics and records. - In Proc. of 3-rd St.-Petersburg Workshop On Simulation (S.M.Ermakov et al. Eds.), 1998, St.-Petersburg, p. 349-355.
[13] Грибкова H.B. О свойствах порядковых статистик бутстреп-выборки вблизи выборочной квантили // Обозр. прикл. и промышл. матем., т. 12, в. 3, 2005, с. 656-657.
[14] Gribkova, N.V., Helmers R. On the bootstrap accuracy for the trimmed mean: a survey of some recent developments. - In Proc. of the 5-th SEAMS-GMU Intern. Confer, on Mathematics and its Applications, 2007, Yogyakarta, p. 55-68.
[15] Грибкова H.B. Аппроксимация второго порядка для слегка усеченных сумм случайных величин // Обозр. прикл. и промышл. матем., т. 16, в. 2, 2009, с. 257-258.
[16] Грибкова Н.В. Асимптотическая аппроксимация типа разложения Эджворта для слегка усеченных сумм // Обозр. прикл. и промышл. матем., т. 17, в. 6, 2010, с. 863-864.
[17] Gribkova N.V., Helmers R. On the Bahadur - Kiefer representation for intermediate sample quantiles (представлено в журнал); arXiv:1106.2260vl [math.PR],
Подписано в печать 30.09.2011. Формат 60x84/16. Печать цифровая. Усл. печ. л. 2,0. Тираж 100. Заказ 8135b.
Отпечатано с готового оригинал-макета, предоставленного автором, в типографии Издательства Политехнического университета. 195251, Санкт-Петербург, Политехническая ул., 29. Тел.:(812)550-40-14 Тел./факс: (812) 297-57-76
Введение
1 Аппроксимация второго порядка распределений усеченных сумм
1.1 Введение и основные обозначения.
1.2 Оценки точности нормальной аппроксимации.
1.3 Асимптотические разложения.
1.4 Случай легких хвостов у .Р.
1.5 Аппроксимация [/-статистиками.
1.5.1 [/-статистическая аппроксимация усеченной суммы
1.5.2 Аппроксимация оценки асимптотической дисперсии
1.6 Доказательства.
1.6.1 Доказательство результатов раздела 1.2.
1.6.2 Доказательство результатов раздела 1.3.
1.6.3 Доказательство результатов раздела 1.4.
2 Усеченное среднее. Асимптотическое распределение и т п -бутстреп
2.1 Введение и основные обозначения.
2.2 Асимптотическое распределение Тп и Т*т, состоятельность т -С п-бутстрепа.
2.3 Некоторые применения.
2.4 Доказательства.
2.5 Численный пример
3 Асимптотические разложения типа Эджворта для усеченного среднего
3.1 Введение.
3.2 Формулировка результатов.
3.3 Асимптотическая аппроксимация смещения.
3.4 [/-статистическая аппроксимация.
3.4.1 Аппроксимация для усеченного среднего.
3.4.2 Аппроксимация оценки асимптотической дисперсии
3.5 Доказательства.
3.5.1 Доказательство теоремы 3.1.
3.5.2 Доказательство теоремы 3.2.
3.5.3 Доказательство теоремы 3.3.
3.6 О связи с результатом для симметрических статистик.
4 Корректность второго порядка бутстреп-аппроксимации
4.1 Введение.
4.2 Формулировки результатов.
4.3 Об эмпирических разложениях Эджворта, т ф n-бутстрепе и экстраполяции.
4.4 "Простой" бутстреп (т = п).
4.4.1 "Простой" бутстреп для Т„(2).
4.4.2 "Простой" бутстреп для ТП(1).
4.5 Численное моделирование, примеры.
4.6 Доказательства.
4.6.1 Вспомогательные результаты.
4.6.2 Доказательство теорем 4.1 и4.2.
5 Вспомогательные результаты типа Бахадура — Кифера
5.1 Представления для эмпирической квантили фиксированного уровня
5.1.1 Формулировки лемм.
5.1.2 Доказательство леммы 5.1.
5.1.3 Доказательство леммы 5.2.
5.2 Представления для выборочных квантилей в случае последовательностей, представления для "хвостовых" квантилей
5.2.1 Формулировки результатов.
5.2.2 Доказательство теоремы 5.1.
5.2.3 Доказательство теоремы 5.2.
5.2.4 Доказательство следствия 5.3.
5.3 Представления для т ф п-бутстреп-квантили.
5.3.1 Формулировки лемм.
5.3.2 Доказательство леммы 5.4.
5.3.3 Доказательство леммы 5.5.
6 Неравенства типа Берри — Эссеена для L-статистик
6.1 Введение.
6.2 Обобщение результата В вал Цвета.
6.3 Усечение на уровне центральных порядковых статистик.
6.4 Фиксированное усечение
6.5 Вспомогательные результаты.
6.5.1 Оценки моментов порядковых статистик.
6.5.2 Неравенства для моментов.
7 Бутстреп для L-статистик
7.1 Введение
7.2 Асимптотические свойства нормирующих постоянных.
7.3 Бутстреп-аппроксимация распределений.
В диссертации исследуются асимптотические свойства распределений усеченных сумм, ¿-статистик - линейных функций порядковых статистик - и их бутстреп-версий; под усеченной суммой мы будем понимать, как обычно, сумму элементов вариационного ряда, в котором удалено некоторое количество крайних наблюдений.
Хорошо известно, что ¿-статистики и, в частности, усеченные суммы играют ключевую роль в теории робастных статистических выводов (см. например, [17], [18], [85], [110]). Впервые использование взвешенных сумм элементов вариационного ряда в качестве оценок параметров распределений было предложено и обосновано, согласно историческому очерку С.Стиглера [137], П. Дэниел л ом [57] в 1920 году.
На протяжении примерно полувека, начиная с конца 40-х годов XX-го столетия, изучение асимптотических свойств распределений ¿-статистик привлекало внимание многих видных ученых, таких, как Дж.Тыоки, П.Бикел, С.Стиглер, Г.Шорак, Д.Мэйсон, В.ван Цвет, П.Хьюбер, П.Холл и др.
Значительный интерес к ¿-статистикам был обусловлен, конечно, в первую очередь приложениями, поскольку ¿-статистики могут служить оценками параметров, причем надлежащий выбор коэффициентов ¿-статистики позволяет сводить к минимуму нежелательное влияние посторонних и резко выделяющихся наблюдений, что делает эти оценки устойчивыми (робастными). Однако существовала и другая немаловажная причина чисто теоретического интереса к ним - это своеобразная, связанная с упорядочением природа зависимости слагаемых, образующих ¿-статистику, которая делает изучение ее асимптотики довольно трудным. Необходимость развития асимптотической теории ¿-статистик начиная с 70-х годов ХХ-го века стимулировала открытие в этой области новых подходов и методов. В частности, в работе П.Бикела [35] было впервые упомянуто о возможности аппроксимации Ь-статистик [/-статистиками второго порядка. Впервые этот подход был успешно применен Р.Хелмерсом [89] для получения неравенств типа Берри - Эссеена для ¿-статистик. Асимптотическая теория [/-статистик была существенно продвинута в 80-90-е годы, что позволило эффективно использовать метод [/-статистической аппроксимации для исследования асимптотических свойств симметричных статистик. Как ¿-статистики, так и [/-статистики являются симметричными функциями элементов выборки, то есть принадлежат классу так называемых симметричных статистик. В диссертации свойства усеченных сумм и ¿-статистик анализируются, в том числе, в контексте теории симметричных статистик.
Дальнейшая часть введения организована следующим образом: в п. 1-4 приведен краткий обзор литературы, относящейся к теме диссертации: п. 1 посвящен предельным распределениям усеченных сумм и ¿-статистик, п. 2 - оценкам скорости сходимости и асимптотическим разложениям, п. 3 -представлениям типа Бахадура - Кифера, в п. 4 кратко изложена суть бутстреп-метода. В п. 5 мы даем обзор основных результатов диссертации, в п. 6 даны сведения о публикациях и апробации работы. Формулировки и доказательства результатов приведены в основных главах 1-7
1. Об асимптотике первого порядка для усеченных сумм и Ь-статистик
Пусть Х\, Х2, • -. обозначает последовательность независимых одинаково распределенных случайных величин (с.в.) с функцией распределения (ф.р.) У\п < ■ • • < Уп п — первые п наблюдений, упорядоченные по абсолютной величине. Влияние крайних членов вариационного ряда па асимптотику сумм исследовалось многими авторами. В работах Д.Дарлинга [58], Д.З.Арова и А.А.Боброва [1], П.Холла [78], Дж.Тюгелса [142] изучалось предельное распределение статистик вида Тп,к = ~ ^-и-1-п, когда к е
N фиксировано и распределение Р принадлежит области притяжения устойчивого закона с показателем 0 < а < 2. Они показали, что при определенном выборе последовательностей нормирующих постоянных ап, Ьп статистика (Тп,к — 0"п)/Ьп сходится по распределению к невырожденной с.в., причем предельное распределение отличается от устойчивого закона, к которому сходится неусеченная сумма. В недавней работе Ю.А.Давыдова и А.В.Нагаева [59] этот результат был обобщен на многомерный случай упорядоченных по модулю независимых одинаково распределенных случайных векторов.
В работе Ш.Чёргё и др. [52] такая же задача рассматривалась в более естественной с точки зрения статистических приложений постановке: авторы рассматривали с.в. вида Тп^т = ^'г=к+1 Хгп, где Х1п < ■■■ < Хпп — порядковые статистики, соответствующие выборке Х1,., к, тп фиксированные натуральные числа. В работе [52] найдены условия, при которых распределение с.в. (Тп к гп—ап)/Ьп сходится к невырожденному пределу, когда Р принадлежит области притяжения устойчивого закона с показателем О < а < 2, ап, Ьп - определенные последовательности нормирующих постоянных, предельные распределения при фиксированных к, тп полностью описаны в [52]. Оказалось, что в случае 0 < а < 2 удаление даже одного крайнего наблюдения меняет тип предельного распределения.
Совершенно иное асимптотическое поведение демонстрирует статистика Тп,к,т = в случае, когда к и т не фиксированы, а являются последовательностями 1 < кп < п — тп < п, причем такими, что кп А тп —► оо, п —> оо. Именно этот случай в основном рассматривается в данной работе. Здесь и далее аЛЬ := тт(а, Ь), аУ Ь := тах(а, Ь). Хорошо известно, что с точки зрения асимптотики распределений различными оказываются ситуации, когда: (г) усечение производится на уровне центральных порядковых статистик 0 <
ЦшЫ^п/п < Нт зир(п — тп)/п < 1; (и) общий случай, когда Нгп кп/п — О и /или Нт8ир(п — тп)/п = 1.
Если \хткп/п = \\ттп/п = 0, кп Л тп —> оо, п —> сю, то статистика Тп^уГП называется слегка (или слабо) усеченной суммой.
В 1973 году С.Стиглер [136] получил результат, являющийся теперь классическим, для усеченного среднего Тп = (п — [ап] — [Р'п})~1 Х)Г=[ст]+1 п■ где 0 < а: < 1 — (3 < 1 ([к] — целая часть числа к), а, /3— фиксированные числа. В работе [136] для произвольной ф.р. Р найдено предельное распределение определенным образом нормированной с.в. Тп и доказано, что это предельное распределение является нормальным тогда и только тогда, когда квантили уровня а и 1 — /3 определены однозначно, т.е. когда инверсия Р1(гг) = т£{.?; : Р{х) > и}, 0 < и < 1, непрерывна в точках а и 1 — (3.
В работах Ш.Чёргс и др. [55], П.Гриффина и В.Пруитта [77] результат С.Стиглера обобщен на случай произвольных урезающих последовательностей, когда кп А гпп —» оо. В [55] были найдены необходимые и достаточные условия существования последовательностей ап. 6П, таких, что (Тп^т — ап)/Ьп —> N(0,1) (эти условия будут приведены в главе 1); в [77] другим методом были найдены эквивалентные необходимые и достаточные условия. Кроме того, в работах [55], [77] характеризован класс частичных пределов последовательности распределений с.в. (Тпкт — ап)/Ьп и описаны достаточные условия для того, чтобы .Р принадлежала области частичного притяжения конкретного распределения из этого класса. В [77] показано, что в частном случае слабо усеченных сумм, когда (кп V тп)/п —> 0, кп А тп —у оо, п —* оо, этот класс частичных пределов остается еще довольно широким, хотя и определяется нормальными законами. Элементы этого класса имеют следующую форму: + /(— д(N3), где /V], N3 - независимые стандартные нормальные с.в., т > 0, /, д - произвольные неубывающие выпуклые функции.
Асимптотическая нормальность Ь-статистик вида Ьп = сг.пХг где с,.п - вещественные числа, при различных вариантах предположений о Р и о весах сг.п была доказана в работах П.Бикела [34], Х.Чернова и др. [51],
З.Говиндараюлу [73], Д.Мура [115], Д.Мэйсона [111], С.Стиглера [135], [138], Г.Шорака [128], [129]. Наиболее общие результаты были получены Г.Шораком [129], С.Стиглером [138] и Д.Мэйсоном [111]. Существование многих вариантов предположений, определяющих асимптотическую нормальность L-статистик, объясняется хорошо известным фактом, обсуждавшимся в ряде работ (см, например [90], [138]), состоящим в возможности перенесения тяжести условий с ф.р. F на веса cVfl, и наоборот. Для целей статистических приложений предпочтительными являются, конечно, варианты условий, которые налагают меньше ограничений на исходную ф.р. F.
2. Аппроксимация второго порядка распределений усеченных сумм и L-статистик
Следующей задачей после нахождения предельных распределений является оценивание скорости сходимости и получение уточняющих асимптотику разложений.
Получению оптимальных оценок порядка п~1//2 в центральной предельной теореме для L-статистик предшествовало множество работ, в которых не были найдены оптимальные оценки, но последовательно развивались подходы к решению этой задачи. Одной из первых работ в этом направлении была статья В.Розенкрактца и Н.О'Рэйлли [123], в которой с использованием разложения Скорохода была получена оценка порядка га-1/4. Близкие к оптимальным оценки порядка (logn/n)1/2 для усеченных сумм были получены В.А.Егоровым и В.Б.Невзоровым [8]. В работе [65] те же авторы получили оценку порядка 7?Г1/2 для L-статистик в случае равномерного исходного распределения и оценку порядка log n/n1/2 в общем случае.
Первые оптимальные результаты, дающие оценки порядка п-1/2, стали появляться в конце 70-х годов XX века. В [45] С.Бьёрв методом П.Бикела [35] впервые получил оценку порядка n~1/f2 для усеченных L-статистик, т.е. для случая, когда сцп = 0 для г < an, г > п — ßn, 0 < а < 1 — ß < 1. Однако его результат при слабых ограничениях на коэффициенты - равномерной по п ограниченности среднего арифметического модулей весов - налагал суровые ограничения на исходное распределение, требуя существования трех непрерывных производных у в открытой области, содержащей отрезок [а,1-Р].
Специально для усеченного среднего неравенство типа Берри - Эссеена было доказано Ветом [147].
Наконец, в работах Р.Хелмерса [86], [89] были получены оптимальные оценки скорости сходимости к нормальному закону распределений ¿-статистик общего вида в предположении существования конечного третьего момента у ^ и при некоторых дополнительных условиях гладкости ^ и весовой фугкции Ь-статистики. Асимптотические разложения для ¿-статистик с гладкой весовой функцией были найдены в работах В. ван Цвета [144], [145] и Р.Хелмерса [87], [88], [90] .
Следует отметить, что примерно в эти же 70-е годы аналогичные задачи решались для класса ¿/-статистик, оценка оптимального порядка для которых была получена впервые Х.Каллаертом и П.Нансеном [47]. Метод, с помощью которого Р.Хелмерс получил неравенство типа Берри - Эссеена для ¿-статистик в [89], состоял в аппроксимации ¿-статистики и-статистикой второго порядка и последующем применении результата [47] к аппроксимирующей [/-статистике.
В начале 80-х годов стала ясна общая основа, связывающая между собой эти два важных класса статистик и решающая роль разложений Хёфдинга [95]. В 1984 году ван Цвет опубликовал работу [146], в которой он получил неравенство типа Берри - Эссеена, опираясь только на свойство симметричности функции, определяющей статистику, независимость и одинаковую распределенность наблюдений. В [146] были получены два следствия, касающиеся двух частных случаев симметричных статистик: V- и ¿-статистик. Каждое из этих следствий содержало и даже усиливало лучшие их известных к тому времени результатов [47], [88], относящихся к этим специальным случаям.
В 1989 году К.Фридрих [70], используя другой медод доказательства, основанный на мартингальной технике, обобщил результат В ван Цвета в двух направлениях: во-первых, он отказался от предположения симметричности статистики; во-вторых, — от предположения одинаковой распределенности наблюдений, предположив лишь независимость, условия моментного типа и в определенном смысле [70] гладкость статистики. Результат К.Фридриха также содержит в качестве следствий оптимальные по порядку оценок результаты, имевшиеся к тому времени для II- Ь- и Д-статистик (см. примеры в [70]).
Получению асимптотических разложений для распределений широкого класса статистик, допускающих стохастическое разложение, была посвящена работа Д.М.Чибисова [19] 1980 года.
В 1997 году в статье В.Бенткуса и др. [28] была установлена справедливость разложения Эджворта при определенных моментных (и некоторых других) ограничениях для нормированной симметричной статистики, найдена формула разложения, дана оценка остаточного члена аппроксимации ф.р. ее разложением, имеющая порядок 1 /п. В [28] приведены также следствия основного результата для классов С/-статистик, Ь-статистик с гладкой весовой функцией и для некоторых других симметричных статистик.
В работе Х.Путтера и В. ван Цвета [121] 1998 года найдено разложение типа Эджворта для стьюдентизованной симметричной статистики. Для оценки асимптотической дисперсии симметричной статистики (для стьюдентизации) в этой работе использовалась разновидность оценки "складного ножа".
3. О представлении Бахадура — Кифера
Классическое представление Бахадура - Кифера было получено Р.Бахадуром [25] и уточнено Дж.Кифером в серии работ [102]—[104]. Оно позволяет заменить квантильный процесс эмпирическим процессом, умноженным на (—1), с Р-п.н. равномерной ошибкой порядка где п - объем выборки (см., например,
52], [61], [63], [133]).
Представление типа Бахадура - Кифера и некоторые другие связанные с ним представления играют важную роль в построении предлагаемых нами IIстатистических аппроксимаций при доказательстве результатов глав 1, 3-4.
Пусть ., Хп — выборка независимых одинаково распределенных с.в. с ф.р. F. Обозначим = F~l(a) квантиль уровня 0 < а < 1 функции распределения. F, £,апп ~ соответствующую эмпирическую квантиль, Fn — эмпирическую ф.р. Положим Na = Л{г : Хг <
Теорема (Р.Бахадур [25], 1966). Предположим, что F имеет по крайней мере две непрерывные производные в некоторой окрестности причем F" ограничена в этой окрестности и F'(£a) = /(£а) > 0. Тогда Na — an где Rn((jj) = Ор.пн (n-^Oog^^^oglogn)1/4).
Здесь Rn = Ор-пн (rn) означает, что Rn/rn ограничено Р-п.н. Очевидно, что (Na - an)/(nf(£a)) = (Fn(fa) - «)//(£„). Результат Р.Бахадура был уточнен Дж.Кифером в серии статей [102]—[104] 1967-70-х годов. В частности, Дж.Кифер показал, что в условиях теоремы Бахадура r ,Un-Sa + {Fn(ta)-g)/f(Za) 25/43-3/4а1/4(1-а)1/4 ™Р n-3/4(loglogn)3/4 ЯЫ
Р-п.н. при любом выборе знака.
Другой результат этого типа с оценкой остатка по вероятности приведен в монографии Р.Райса [125]. Предположим, что плотность / удовлетворяет условию Липшица в окрестности £а и > 0. Тогда
Conn = Sa - (Fnitc) - + где Р (liinl > A(\ogn/n)3^) < Вп~с для любого с > 0, где Л, В > 0 -постоянные, не зависящие от п.
Обобщения представления Бахадура на случай зависимых наблюдений были получены П.Сеном [127] в 1968 году и В.Ву [148] в 2005 году
В главе 5 мы получаем ряд новых специальных представлений типа Бахадура - Кифера для последовательностей выборочных квантилей уровня ап 6 (0,1), в том числе, для "хвостовых" , когда ап может стремиться к 0 или 1.
Мы получаем не встречавшиеся ранее представления для сумм порядковых статистик, находящихся между ап-й выборочной и соответствующей генеральной квантилями. Мы доказываем также справедливость представлений Бахадура - Кифера для квантилей бутстреп-выборки.
4. О бутстрепе Эфрона
В последние три десятилетия, начиная с 1979 года, когда была опубликована статья Б.Эфрона [66], в которой он предложил новый метод и его название, бутстреп получил широкое распространение в математической статистике и ее приложениях. В настояжщее время существует обширная литература, посвященная бутстрепу (см., например, монографии и обзоры [23], [31] [67], [80], [114], [119], [140], а также статьи, например, [20]-[24], [30], [36], [41]-[43], [64], [69], [71]-[72], [75], [79], [81]-[83], [91]-[93], [120], [126], [134], [139]).
Бутстреп используется для определения доверительных областей, оценки дисперсий, коррекции смещений, в многомерном статистическом анализе, для анализа и прогнозирования временных рядов и в других задачах статистики. Опишем кратко суть этого метода, опираясь на работы [36], [66], [134].
Пусть Х\,., Хп - выборка независимых одинаково распределенных с.в. из распределения F е Т0, Тп = Тп(Хь ., Хп) = TИ(F„; Р) - случайная величина, которая нас интересует (обычно Тп - статистика), которая симметрична по своим аргументам (т.е. порядок наблюдений не оказывает влияние на значение Тп), Рп - эмпирическая ф.р. Обозначим Ьп = С(Тп) закон распределения Тп и предположим, что Ьп сходится к некоторому невырожденному пределу Ь.
Пусть вп = вп(Р) = 7(Ьп) - интересующий нас параметр, который является функционалом от Ьп. р
Предположим, что вп{Р) —в(Р) для всех Р € Е0. Обычно, если Ьп или Ь известно, то вп(Р) или в(Р) вычисляются непосредственно. Если Ьп неизвестно, а Ь известно, то дп(Р) оценивается посредством в(Р)- Заметим, что даже если Ьп и Ь известны, они могут зависеть от /<\ которое неизвестно.
Идея бутстрепа состоит в следующем. Пусть Рп — некоторая оценка Р (если
Рп = т.е. эмпирическая ф.р., то мы получаем непараметрический бутстреп, если Рп получено подстановкой в известную формулу Р оценок ее неизвестных параметров (в параметрической модели), то получаем параметрический бутстреп; возможно также получение оценки путем сглаживания эмпирической ф.р. Рп и т.д.). Эфрон [66] предложил оценивать вп(Р) подстановкой Рп вместо F, то есть оценивать вп(Р) посредством в = 9п(Рп). Заметим, что Рп не обязательно принадлежит множеству которое может включать в себя, например, только непрерывные функции, тогда, скажем, Рп = Рп не будет в р него входить. Мы предположили, что 0п(Р) —> 9(Р) для всех Р € ^о р
Говорят, что бутстреп "работает"(корректен), если 9п(Рп) —► 9(Р) для всех Р £ 3°,о (множество примеров корректности бутстрепа и ее отсутствия можно найти, например, в [20]—[24], [36], [140]). Однако даже если 9(Р) не определено, может иметь смысл вопрос, является ли 0п(Рп) близким к 9п(Р).
Для оценивания 9п(Р) с использованием бутстрепа (когда бутстреп-выборки производятся с повторением значений) нужно выполнить следующие шаги:
1. Оценить посредством Рп.
2. При данной функции Рп произвести повторную выборку (с возвращением) размера т: ., Х^ — независимые (условно при условии Рп) одинаково распределенные с. в. с ф.р. Рп.
3. Вычислить Т;п = Тт{Х{,., Х*т- К) .
4■ Оценить распределение Ь(Тп\Х\,., Хп] Р) посредством распределения
Цп,п = ЦТМ = ЦТт(Х*,. к) | Рп) (см. ниже).
5. Оценить 9п = 9п(Р) = 7(Ьп) посредством 9*т = 9т(Рп) = 1(Ь*тп) .
Для выполнения п.4 (т.е. нахождения распределения) возможен т.н. "идеальный бутстреп". Действительно, бутстреп-ф.р., очевидно, равна
1 ТП тп
Р*(Т,; <«) = РСС < ь\рп)) = — Е • • • Е .,хп) < ¿).
1=1 ¿т = 1
Однако этот способ уже при средних значениях п требует огромного объема вычислений и трудно реализуем. Второй способ, который обычно и применяют на практике, состоит в использовании метода Монте-Карло. Для оценки
Р* (Т*п < t) производится В повторных выборок размера m из Fn, для каждой выборки вычисляется значение статистики Т^, в результате чего получаем выборку Т^,. объема В. Распределение L*rn п оценивается посредством эмпирического распределения, соответствующего выборке Т^ , г = 1,., В.
Необходимым условием корректности бутстрепа для вп = 6n(F) является корректность аппроксимации ф.р. Р(Тп < t) посредством Р*(Т^ < t).
Одной из наиболее привлекательных сторон бутстрепа является то, что аппроксимация распределения Ln статистики Тп ее бутстреп-распределением L*m п оказывается зачастую на порядок точнее, чем аппроксимация предельным распределением L, если таковое имеется. Этому свойству, называемому корректностью второго порядка, посвящена значительная часть литературы по бутстрепу. Примеры, в которых реализуется это свойство, можно найти, например, в [23], [24], [31], [80], [134]. Причина, по которой это происходит, объяснена, например, в монографии П.Холла [80]. Краткое объяснение этому состоит в следующем: в ситуации, когда ф.р. Тп допускает асимптотическое разложение в "реальном мире"1 (как правило, вблизи нормальной ф.р., т.е. это разложение Эджворта), для ф.р. бутстреп-версии статистики также справедливо асимптотическое разложение в "бутстреп-мире", может быть при несколько более жестких ограничениях. Слагаемые этого разложения, как правило, идентичны разложению в "реальном мире", в котором все зависящие от F величины заменены их эмпирическими вариантами (т.е. оценками подстановки Fn). Таким образом, в силу состоятельности оценок подстановки и в условиях действия (усиленного) закона больших чисел для моментных параметров разложений функции распределения Р (Тп < t) и Р*(Т7^ < t) оказываются на порядок ближе друг к другу, чем каждая из них к предельной ф.р. (первому слагаемому разложения, т.е. Ф(ж) - стандартной нормальной ф.р. - в случае асимптотической нормальности).
Свойству корректности второго порядка для усеченного среднего посвящена
1 Термины "реальный мир" — real world — и "бутстреп-мир" — bootstrap world — были предложены Ж.Сванепулом (см. [139]-[140]).
глава 4 диссертации.
Другой полезной и интересной чертой бутстрепа является его чрезвычайная гибкость и адаптивность. В оригинальной статье Б.Эфрона [66] предлагалось применять метод при т = п, впоследствии этот вариант был назван "простым" бутстрепом (т ф n-бутстреп впервые появился в работе [36]), и именно такой выбор является наилучшим, если иметь в виду свойство корректности второго порядка, так как ведущие члены разложений Эджворта порядка п-1/2 (в реальном мире) и т~(в бутстреп-мире) при этом выборе оказываются ближе всего друг к другу. Однако, если бутстреп не состоятелен (в этом случае о корректности второго порядка говорить не приходится), то его все же можно заставить корректно работать, если использовать т ф n-бутстреп ("m out of п bootstrap"[40] в англоязычной литературе), когда т = о(п), т —> оо. Если выборочное пространство "вычерпывается" в большем на порядок объеме, чем выбирается из него бутстреп-выборка, то такие свойства распределения Тп, которые не может "заметить" простой бутстреп, когда (ш = га), что приводит к его некорректности, улавливает модифицированный m га-бутстрел (т = о(п), т —> оо), что делает его корректным, например, для распределений экстремумов выборки и рекордов (см., например, [7], [63]). Это свойство т <С п-бутстрепа для случал выбора без повторений было обнаружено Ф.Гётце [74] и изучалось Дж.Политисом и Дж.Романо [118] (см. также [119]). В случае, когда бутстреп-выборка производится с повторением, данный эффект т п-бутстрепа изучался Ж.Сванепулом [139], П.Деовельсом и др. [64], П.Деовельсом и В.Б.Невзоровым [7], П.Бикелом Ф.Гётце и В. ван Цветом [38], П.Бикелом и Дж.Реном [40], П.Бикелом и А.Саков [42], Ф.Гётце и др. [75].
В главе 2 диссертации мы приводим и изучаем еще один пример того, как модифицированный т <С n-бутстреп корректно аппроксимирует распределение статистики в ситуации, когда простой бутстреп не корректен. Это пример усеченного среднего.
5. Структура и краткое содержание работы
Основные результаты диссертации изложены в главах 1-7, которые разделены на параграфы, каждая из глав снабжена коротким введением. Нумерация утверждений отдельная для каждого типа утверждений в каждой главе. Нумерация формул тройная и указывает номер главы, номер параграфа и номер формулы в параграфе.
В главе 1 изучается асимптотика второго порядка распределений усеченных сумм вида где кп, тп - целочисленные последовательности, 1 < кп < п—тп < п, такие, что кГ1 Атп —► оо. В этой главе приведены результаты, касающиеся оценок скорости сходимости в центральной предельной теореме и разложений типа разложения Эджворта для ф.р. нормированной и стьюдептизованной статистики Тп, в том числе, в случае слегка усеченной суммы, когда (кп V тп)/п —> 0.
Основные результаты этой главы не требуют каких-либо моментных предположений, в получаемых из них следствиях мы акцентируем внимание па наиболее интересном для нас случае, когда исходное распределение имеет тяжелые хвосты, подразумевая под этим отсутствие конечной дисперсии у исходного распределения. Наши оценки скорости сходимости при определенных условиях регулярности имеют порядок гй1^2, где гп = кпАтп, и мы доказываем, что если ЕХ^ = оо, то этот порядок является неулучшаемым. Для этого мы рассматриваем случай, когда Р имеет правильно меняющуюся плотность / на бесконечности, и показываем, что (при отсутствии симметрии распределения Р и равенства правой и левой долей усечения) точным порядком главного слагаемого разложения Эджворта является кп -Ь тпп
Если вопросы, относящиеся к асимптотике первого порядка для усеченных сумм (то есть класс возможных предельных законов, условия сходимости к ним, необходимые и достаточные условия асимптотической нормальности и т.д.) были изучены ранее достаточно полно в работах Ш.Чёргё и др. [55], г П1 г=1 г=1 г=п—тл+1
П.Гриффина и В.Пруитта [77] и др. (см. п. 1, выше), то до недавнего времени имелось совсем мало работ, посвященных уточнениям. Фактически нам известна только одна работа В.А.Егорова и В.Б.Невзорова [8], опубликованная в 1974 году, в которой получены некоторые оценки скорости сходимости к нормальному закону для усеченных сумм в общей ситуации, когда доли отсекаемых по краям наблюдений являются последовательностями. В [8] при несколько более жестких, чем у нас, ограничениях были получены оценки порядка (к^гп/г„)1/2.
Асимптотические разложения типа разложения Эджворта, представленные в главе 1, получены в нашей работе впервые. Мы даем оценки остаточного члена аппроксимации распределения нормированной (и стьюдентизованной) статистики Тп ее асимптотическим разложением, которые при определенных условиях регулярности имеют порядок кй3'/сп)5/4+т^3^4(к^тп)5/4 (то есть порядок остаточного члена в представлении Бахадура: (—3/4), но не в терминах степени п, а в терминах соответствующих степеней кп и тп).
Метод доказательства основных результатов главы 1 базируется на стохастической [/-статистической аппроксимации Тп. Мы оцениваем должным образом погрешность этой аппроксимации и применяем соответствующего типа известные результаты к аппроксимирующей [/-статистике. Хотя метод II-статистической аппроксимации хорошо известен в литературе и применялся во многих работах (см., например, [89], [90], [121]), предлагаемая здесь аппроксимация является оригинальной, она отличается от обычно исользуемого в таких случаях приближения первыми даумя группами слагаемых (линейным и квадратичным) разложения Хёфдинга. Линейный член нашей аппроксимации -сумма независимых одинаково распределенных уинсоризованных вне интервала [£а„,£1-/?п) с.в., где £а„, - квантили, соответствующие усекающим процентилям ап = кп/п, [Зп = тп/п, квадратичный член аппроксимации связан с представлением типа Бахадура - Кифера для сумм порядковых статистик, находящихся между квантилями уровней ап, 1 — /Зп и соответствующими им выборочными квантилями (см. п. 5.2).
В главе 2 изучается корректность бутстреп-аппроксимации распределения усеченного среднего. Мы доказываем, что т <С п-бутстреп-аппроксимация (где п - объем исходной выборки, т - объем бутстреп-выборки) является состоятельной без каких-либо предположений относительно исходного распределения Р. В то же время классический бутстреп Эфрона (случай т = п) и нормальная аппроксимация не состоятельны, если имеются промежутки ненулевой длины, имеющие ^-меру нуль, такие, что их границами являются квантили, в которых происходит усечение. Попутно мы даем другое, более простое и естественное, доказательство классического результата С.Стиглера [136] о предельном распределении усеченного среднего, основанное на аппроксимации суммой независимых одинаково распределенных уинсоризованных с. в. Результаты главы 2 сопровождаются численным моделированием, которое иллюстрирует наши теоретические выводы.
Глава 3 посвящена получению разложений типа Эджворта и эмпирических разложений типа Эджворта для нормированного и для стьюдентизованного усеченного среднего. Результаты этой главы связаны со статьями П. Холл а и А.Падманабхана [83], а также Х.Путтера и В.ван Цвета [121]. В статье П.Холла и А.Падманабхана [83] авторы указывали на сложность получения явных формул разложения Эджворта для ф.р. не только стьюдентизованного, но и нормированного усеченного среднего, они высказали предположение, что эти формулы, по-видимому, должны зависеть от значений плотности в точках, где происходит усечение, и предлагали "заменить аналитические трудности бутстреп-моделированием" [83]. В данной работе мы все же получаем явный вид формул асимптотических разложений для этой статистики и ее стьюдентизованной версии.
В главе 3 представлены результаты, полученные в совместных работах с Р.Хелмерсом [157]—[158], в которых мы находим простые явные формулы разложений Эджворта для ф.р. нормированного и ф.р. стьюдентизованного усеченного среднего, которые, действительно, зависят от значений плотности в точках, где происходит усечение. Следует заметить, что часть результатов главы 3, в принципе, содержится в более общих результатах главы 1, однако у усеченного среднего из-за нормировки множителем (п — [ап] — [/Зп]) ~1 (а, (3 — фиксированные доли усечения 0<а<1 — /3 < 1) и из-за возможного наличия дробных частей у ссп и (Зп (см. главу 3), асимптотическое смещение и, следовательно, разложение Эджворта зависят от этих дробных частей, мы вычисляем асимптотическое смещение в п. 3.3. Учитывая эти нюансы и прикладное значение усеченного среднего, мы отдельно рассмотрели этот случай, предпочитая дать в случае усеченного среднего независимое доказательство, тем более, что используемые при этом рассуждения оказываются полезными далее в главе 4, посвященной бутстрепу.
Оценки остаточных членов аппроксимации ф.р. разложениями Эджворта в случае усеченного среднего имеют классический бахадуровский порядок п~3//4(к^п)5//4, порядок остатка связан с применением [/-статистической стохастической аппроксимации, использующей представление Бахадура.
Кроме того, в главе 3 мы получаем эмпирические разложения Эджворта. Для этого все неизвестные величины, входящие в формулы разложений Эджворта, заменяются их статистическими оценками. Мы используем для оценки параметров моментного типа оценки подстановки эмпирической ф.р., а для оценки значений плотности распределения /, присутствующих в разложениях, простые ядерные оценки со ступенчатым ядром, порядок состоятельности которых оценивается в пп. 3.5.3.
В п. 3.6 главы 3 мы соотносим наши результаты с результатами Х.Путтера и В. ван Цвета [121] для симметричных статистик. Мы доказываем, что наши результаты, касающиеся разложения Эджворта для (стьюдентизованного) усеченного среднего, не могут быть выведены в качестве следствий очень общего результата статьи [121] (теоремы 1.2), поскольку по крайней мере одно из условий [121] не может быть выполнено в случае такой "негладкой" статистики, как усеченное среднее, кокой бы гладкой ни была ф.р. F в окрестности квантилей, где происходит усечение.
В главе 4 изучается корректность второго порядка т ф га-бутстрепаппроксимации распределения усеченного среднего. Прежде всего, мы доказываем справедливость разложений Эджворта для бутстреп-версий ф.р. нормированного и стьюдентизованного усеченного среднего и даем явные формулы разложений в предположении, что плотность / удовлетворяет равномерному условию Гёльдера некоторого порядка 0 < а < 1 в окрестности квантилей, где происходит усечение, и что т = О (п^) для некоторого 0 < с? < 2, когда т —> оо. Оценки точности аппроксимации ф.р. разложениями даются в терминах а и Доказательства также основаны на ¿/-статистического типа аппроксимации, но теперь в "бутстреп-мире".
Используя разложения Эджворта, полученные в главе 3, и их бутстреп-версии, найденные в главе 4, мы доказываем корректность второго порядка бутстреп-аппроксимации ф.р. усеченного среднего при условии, что т — п + О (пг), где г < 1, и даем оценку погрешности в терминах а и г, приведены также следствия для случая простого бутстрепа, когда т = п. Корректность второго порядка бутстрепа для усеченного среднего была доказана также в [83]. Доказательство в [83] в базировалось только на факте существования разложения Эджворта и не использовало явных формул, которые не были известны авторам. Однако в [83] рассматривался только случай т = п, причем при более жестких ограничениях гладкости, налагаемых на ф.р. Р.
В разделе 4.3 исследуется корректность т -С п-бутстрепа в сочетании с экстраполяцией Бикела - Яховы (о бутстреп-экстраполяции см., например, [43], [41]). Мы доказываем для случая усеченного среднего, что экстраполяция позволяет получить корректность второго порядка за сокращенное время вычислений. Результаты главы 4 сопровождаются моделированием, которое иллюстрирует теоретические выводы.
Одним из основных выводов главы 4 является также тот факт, что корректность второго порядка связана со способом определения усеченного среднего. Так, мы доказываем, что определение усеченного среднего Тп = ^ (и) с1и, 0 < а < 1- /3 < 1, Гп — эмпирическая ф.р., является более подходящим в контексте бутстрепа, чем усеченное среднее вида Тп = п-[ап]-[/?п] Y^i=[an]+1 > и что при втором способе задания для достижения корректности второго порядка т ф п—бутстрепа требуется дополнительная коррекция смещения при центрировании.
Глава 5 касается представлений типа Бахадура - Кифера. Как уже отмечалось, представления для выборочной квантили и для сумм порядковых статистик, расположенных между генеральной и соответствующей выборочной квантилями, составляют основу нашей [/-статистической аппроксимации.
В разделе 5.1 мы получаем представления для квантилей фиксированного уровня 0 < а < 1 при более мягких предположениях гладкости плотности / в окрестности квантили, чем в работах [25], [102]—[104]. Мы оцениваем остаточные члены представлений по вероятности, так как именно этот тип оценки остаточного члена необходим, когда мы применяем эти результаты для аппроксимации ф.р. изучаемых статистик. Леммы этого параграфа применяются при доказательстве результатов главы 3.
В разделе 5.2 мы получаем соответствующие представления в случае, когда уровень квантили зависит от п, т.е. является последовательностью 0 < ап < 1, которая, в частности, может стремиться к 0 (или к 1), последнее соответствует случаю "хвостовых" (точнее, "intermediate" ,англ.) квантилей. Представления типа Бахадура - Кифера для хвостовых квантилей, полученные в п. 5.2, являются новыми. Они применяются при доказательстве результатов главы 1.
В разделе 5.3 мы доказываем справедливость представлений типа Бахадура - Кифера "в бутстреп-мире" (т.е. для бутстрепированных квантилей). Иными словами, мы получаем бутстреп-версии лемм раздела 5.1. Эти бутстреп-версии получены в данной работе впервые. Они используются при доказательстве результатов главы 4.
В главе 6 рассматриваются линейные комбинации порядковых статистик. Результаты этой главы связаны с работой В.ван Цвета [146]. Мы получаем иную, чем в [146], оценку абсолютного третьего момента Ь2—проекции L-статистики, что позволяет получить для L-статистик ряд новых полезных следствий основной теоремы В.ван Цвета [146]. Так, в частности, в главе 6 неравенства типа Берри - Эссеена для ¿-статистик доказываются при более слабых моментных ограничениях, чем в [146], тяжесть условий переносится с ф.р. .Р на веса //-статистики, относительно которых предполагается гладкость и убывание к нулю на краях комбинации. Рассмотрен случай усеченной на уровне центральных квантилей ¿-статистики и случай, когда отброшено лишь фиксированное число крайних членов вариационного ряда.
В качестве вспомогательных результатов в п. 6.5 мы получаем оценки абсолютных к-х моментов порядковых статистик посредством абсолютных моментов порядка 5 > 0 исходного распределения, в том числе, в наиболее интересном случае, когда к > 6.
Глава 7 посвящена исследованию корректности бутстреп-аппроксимации распределений ¿-статистик. Изучается состоятельность бутстрепа в случае, когда веса ¿-статистики определяются при помощи весовой функции J(u), и в (0,1), по формулам: (г) с^ = ^(^у) или (И) сг,п = ¡г{^l)/nJ{u)du, г = 1,., п. Показано, что второй способ имеет некоторое преимущество в контексте бутстрепа, поскольку корректность т ф п—бутстрепа достигается в этом случае при несколько более мягких условиях.
6. Публикации и апробация работы
По теме диссертации опубликовано 33 работы, из которых 11 - это статьи в журналах и изданиях, рекомендованных ВАК. Публикации по теме диссертации перечислены в конце списка литературы. Работы [149]-[164] - это статьи в периодических журналах и других изданиях, [165]—[181] - тезисы докладов в сборниках конференций.
Результаты диссертации докладывались на следующих симпозиумах и конференциях: о 14-15 и 29-й Международные семинары по проблемам устойчивости стохастических моделей, Суздаль, 1991 г., Пермь, 1992 г., Светлогорск, 2011 г. о Международная конференция "Асимптотические методы в теории вероятностей и математической статистике", С.-Петербург, 1998 г. о 3-й Санкт-Петербургский международный симпозиум по моделированию, С.-Петербург, 1998 г. о 8, 9, 10-я Вильнюсские международные конференции по теории вероятностей и математической статистике, Вильнюс, Литва, 2002, 2006, 2010 г. о 24-я Европейская конференция статистиков, Прага, 2002 г. о XI, XII, XIV, XVI-я Всероссийские школы-коллоквиумы по стохастическим методам, Сочи, 2004, 2005, 2007 г., Санкт-Петербург, 2009 г. о VI, VII, XI-й Всероссийские симпозиумы по прикладной и промышленной математике, Санкт-Петербург, 2005 г., Кисловодск, 2006, Сочи, 2010 г. о 22-я Международная северная конференция по математической статистике (NORDSTAT-2008), Вильнюс, Литва, 2008 г.
По результатам диссертации были сделаны доклады: на семинаре по предельным теоремам теории вероятностей в 1998 г. (руковод. - проф. В.В.Петров); на семинаре отдела PNA (Probability, Networks and Algorithms) математического центра (CWI) в Амстердаме, Нидерланды, в 2002 г. (руковод. - Р.Хелмерс); на городском семинаре по теории вероятностей и математической статистике в 2005, 2008, 2010 годах (руковод. - акад. И.А.Ибрагимов).
1. Аров, Д.З., Бобров, A.A. О крайних членах вариационного ряда и их роли в сумме независимых величин// Теория вероятпн. и ее примен., i960, т. 5, вып. 4, с.415-435.
2. БИЛЛИНГСЛИ, П. Сходимость вероятностных мер, М.: Наука, 1977, 351 с.
3. Боровков, A.A., Могульский, A.A. О больших и сверхбольших уклонениях сумм независимых случайных векторов при выполнении условия Крамера. I, II// Теория вероятн. и ее примен., 2006, т. 51, вып. 2, с. 260-294, вып. 4, с. 641-673.
4. ГРИБКОВА, Н.В., ЕГОРОВ, В.А. О робастных оценках параметра сдвига, являющихся линейными комбинациями порядковых статистик// Вестник Ленинград. Унив. (Матем.), 1978, № 13, вып. 3, с. 24-27.
5. Деовельс, П., Невзоров, В. Б. Бутстреп для максимумов и рекордов// Зап. научн. семинаров ПОМИ РАН, Вероятность и статистика 3, 1999, т. 260, с. 119-129.
6. Егоров, В.А., Невзоров, В.Б. Некоторые оценки скорости сходимости сумм порядковых статистик к нормальному закону// Зап. научн. семинаров ЛОМИ, 1974, т. 41, с. 105-128.
7. Егоров, В.А., Невзоров, В.Б. О скорости сходимости к нормальному закону линейных комбинаций абсолютных порядковых статистик// Теория вероятн. и ее примен., 1975, т. 20, № 1, с. 207-215.
8. НЕВЗОРОВ, В.Б. Рекорды. Математическая теория, М.: Фазис, 2000, 256 с.13. петров, В.В. Суммы независимых случайных величин, М.: Наука, 1972, 414 с.
9. Хампель, Ф.Р., Рончетти, Э.М., Рассеу, П.Д., Штаэль, В.А. Робастностъ в статистике. Подход на основе функций влияния, М.: Мир, 1989.18. хьюбер, П. Робастностъ в статистике, М.: Мир, 1984.
10. ЧИБИСОВ, Д.М. Асимптотическое разложение для распределения ста- тистики, допускающей стохастическое разложение. I, II// Теория вероятн. и ее примеч., 1980, т. 25, вып. 4, с. 745-756, 1981, т. 26, вып. 1, с. 3-14.
11. Arcones, М.А., Gine, е., The bootstrap of the mean with arbitrary bootstrap sample size// Ann. Inst. Henri Рогпсаге, 1989, v. 25, p. 457-481.
12. Arcones, M.A., Gine, E., On the bootstrap of U and V-statistics// Ann. Statist., 1992, v. 20, p. 655-674.
13. ATHREYA, K.B. Bootstrap of the mean in the infinite variance case// Ann. Statist., 1987, v. 15, p. 724-731.
14. Вabu, G., Rao, C. Bootstrap methodology. In: Handbook of Statistics (C.Rao, editor), 1993, v. 9, p. 627-679, Elsevier Sciense Publishers.
15. В abu, G., slngh, K. On one term Edgeworth correction by Efron's bootstrap// Sankhya, 1984, v. 46, p. 219-232.
16. BAHADUR, R.R. A note on quantiles in large samples// Ann. Math. Statist., 1966, v. 37, p. 577-580.
17. Del Barrio, E., Matra'n, C., Cuesta-Albertos, J. A. Necessary conditions for the bootstrap of the mean of a triangular array// Ann. Inst. Henri Pomcare Probab. Statist, 1999, v. 35, p. 371-386.
18. Bentkus, v., Gotze, F., Zitikis, R. Lower estimates of the convergence rate for {/-statistics// Ann. Probab., 1994, v. 22, p. 1707-1714.
19. Bentkus, V., Gotze, F., van Zwet, W.R. An Edgeworth expansion for symmetric statistics// Ann. Statist., 1997, v. 25, p. 851-896.
20. Bentkus, v., jlng, B-Y. , Zhou, w. On Normal Approximations to u -statistics// Ann. Probab., 2009, v. 37, p. 2174-2199.30. beran, R, Estimated sampling distributions: the bootstrap and competitors// Ann. Statist., 1982, v. 10, no 1, p. 212-225.
21. Beran, R. Bootstrap methods in statistics// Jber. Deutsch Math.-Verem, 1984, v. 86, p. 14-30.
22. BERTAIL, P. Second-order properties of an extrapolated bootstrap without replacement under weak assumptions// Bernoulli, 1997, v. 3, no. 2, p. 149179.
23. Bickel, P.J. On some robust estimators of location// Ann.Math.Statist., 1965, v. 36, p. 847-858.34. blckel, P.J. Some contribution to the theory of order statistics. In: Proc Fifth Berkeley Symp. Math. Statist. Prob., 1967, v.l, p. 575-591.
24. BlCKEL, P.J. Edgeworth expansions in nonparametric statistics// Ann. Statist, 1974, v. 2, p. 1-20.
25. BlCKEL, P. J., Freedman, D.A. Some asymptotic theory for the bootstrap// Ann. Statist., 1981, v. 9, p. 1196-1217.
26. BlCKEL, P.J., Gotze, F., van Zwet, W.R. The Edgeworth expansion for /-statistics of degree two// Ann. Statist., 1986, v. 14, p. 1463-1484.
27. BlCKEL, P.J., Gotze, F., van Zwet, W.R. Resampling fewer than n observations: gains, losses and remedies for losses// Statistica Simca, 1997, v. 7, p. 1-31.
28. BlCKEL, P. J., Lehmann, E.L. Descriptive statistics for nonparametric models. II. Location// Ann. Statist., 1975, v. 3, p. 1045-1069.
29. BlCKEL, P.J., Ren J.J. The m out of n bootstrap and goodness of fit tests with double censored data. In: Robust Statistics. Data Analysis and Computer Intensive Methods (Ed. H. Rieder), Lecture Notes in Statistics, SpringerVerlag, 1995.
30. BlCKEL, P.J., Sakov, A. Extrapolation and the bootstrap// Sankhya, 2002, v. 64, Ser. A, Pt. 3, p. 640-652.
31. BlCKEL, P.J., SAKOV, A., On the Choice of m in the m out of n Bootstrap and its Application to Confidence Bounds for Extreme Percentiles, Preprint, California Univ., Berkeley, 2005.
32. BlCKEL, P.J., YAHAV, J. Richardson extrapolation and the bootstrap// J. of Amer. Statist. Assoc., 1988, v. 83, p. 387-393.
33. Bingham, N.M., Goldie, C.M., Teugels, J.L. Regular variation. Cambridge: Cambridge Univ. Press (Encyclopedia Math. Appl.), v. 27, 1987.
34. BJERVE, S., Error bound for linear combinations of order statistics// Ann. Statist., 1977, v. 5, № 2, p. 357-369.
35. Bjerve, S., Error bounds and asymptotic expansions for linear combinations of order statistics, Unpublished Ph.D. thesis, Berkeley, 1974
36. Callaert, H., Janssen, P., The Berry Esseen theorem for /-statistics// Ann. Statist., 1978, v. 6, № 2, p. 417-421.
37. Chanda, K.C. Bahadur Kiefer representation properties of intermediate order statistics., Statist. & Prob.Lett., Amsterdam: North-Holland, 1992, v. 14, p. 175-178.
38. Chernoff, H., Gastwirth, J,I., Johns, M.V. Asymptotic distribution of linear combinations of functions of order statistics with application to estimation// Ann. Math. Statist., 1967, v. 38, p. 52-72.
39. Csorgo, M., Csorgo, S.,Horvats, L., Mason D.M. Weighted empirical and quantile processes// Ann. Probab., 1986, v. 14, № 1, p. 31-85.
40. Csorgo, M., Csorgo, S.,Horvats, L., Mason D.M. Normal and stable convergence of integral functions of the empirical distribution function// Ann. Probab., 1986, v. 14, № 1, p. 86-118.
41. Csorgo, S.,Horvats, L., Mason, D.M. What portion of the sample makes a partial sum asymptotically stable or normal?// Probab. Theory Related Fields, 1986, v. 72, p. 1-16.
42. Deheuvels, P., Mason, D.M. Bahadur Kiefer - type processes// Ann. Probab., 1990, v. 18, p. 66^-697.
43. Deheuvels, P., Mason, D.M., Shorack, G.R., Some results on the influence of extremes on the bootstrap// Ann. Inst. Henri Pomcare, 1993, v. 29, p. 83-103.
44. EGOROV, V.A., NEVZOROV, V.B., Limit theorems for linear combinations of order statistics// Lecture notes in mathematics, 1976, № 550, p. 63-79.
45. EfrON, B. Bootstrap methods: another look at jackknife// Ann. Statist., 1979, v. 7, p. 1-26.
46. Efron, B., Tibshirani, R.J. An Introduction to the Bootstrap, Chapman and Hall, New York, 1993.
47. GlNE, E., ZlNN, J. Necessary conditions for the bootstrap of the mean// Ann Statist., 1989, v. 17, p. 684-691.
48. Ghosh, M, Parr, W., Singh, K, Babu, G. A note on bootstrapping the sample median// Ann. Statist., 1984, v. 12, p. 1130-1135.
49. GOVINDARAJULU, Z. Asymptotic normality of linear combinations of functions of order statistics In: Proc. Nat. Acad. Sci., 1968, v. 59, p. 713-719.
50. GÖTZE, F. Asymptotic approximations and the bootstrap, I.M.S. Bulletin, 56th AMS-Meeting, 1993.
51. Götze, F., A.Rackauskas, A. Adoptive choice of bootstrap sample size. In: State of the art in Probability and Statistics, L.M.S. lecture notes, Ser.36, 2001, p. 286-309.
52. Griffin, P.S. Asymptotic normality of Winsorized means// Stochastic Processes Appi, 1988, v. 29, p. 107-127.77. griffin, p.S., pruitt, W.E. Asymptotic normality and subsequential limits of trimmed sums// Ann. Probab., 1989, v. 17, p. 1186-1219.
53. Hall, P. On the extreme terms of a sample from the domain of attraction of a stable law// J. London Math. Soc., 1978, v. 18, p. 181-191.
54. Hall, P. Asymptotic properties of the bootstrap for heavy-tailed distributions// Ann. Probab., 1990, v.18, p. 1342-1360.
55. Hall, P., Padmanabhan, A.R. On the bootstrap and the trimmed mean// J. of Multivariate Analysis, 1992, v. 41, p. 132-153.
56. Hampel, F.R., Ronchetti, E.M., Rousseeuw, P.J., Stahel, W.A. Robust Statistics. The Approach Based on Influence Functions, John Wiley & Sons, New York, 1986.
57. HOEFFDING, W A class of statistics with asymptotically normal distribution// Ann Math Statist , 1948, v 19, no 3, p 293-325
58. HOEPFDING, W. Probabilities inequalities for sum of bounded random variables// J. Amer.Statist.Assoc., 1963, v. 58, p. 13-30.
59. HUBER, P.J. Robust Statistics, John Wiley & Sons, New York, 1981
60. JANSSEN, A., Invariance principles for sums of extreme sequential order statistics attracted to Le'vy processes// Stochastic Process. Appl, 2000, v. 85, p. 255-277.
61. JlNG, B.Y., WANG, Q. Edgeworth expansion for /-statistics under minimal conditions// Ann. Statist., 2003, v. 31, p. 1376-1391.
62. KALLENBERG, O., Foundations of Modern Probability, Springer, New York. 2002.101. kasahara, Y., maejima, m. Limit theorems for trimmed sums// J. Theoret. Probab., 1992, v. 5, p. 617-628.
63. KIEFER, J.C. On Bahadur's representation of sample quantiles// Ann. Math. Statist., 1967, v. 38, p. 1323-1342.
64. KIEFER, J.C. Deviations between the sample quantile process and the sample df. In: Nonparametric Techniques in Statistical Inference (M. Puri, ed.), 1970, p. 299-319, London, Cambridge Univ. Press.
65. KlEFER, J.C. Old and new methods for study order statistics and sample quantile. In:Nonparametric Techniques in Statistical Inference (M. Puri, ed.), 1970, p. 349-357, London, Cambridge Univ. Press.
66. KlEFER, J.C., Wolfowitz, Jac. Selected papers, Springer, New York, 1980.106. knight, k. On the bootstrap of the sample mean in the infinite variance case// Ann. Statist., 1989, v.17, p. 1168-1175.
67. Lepage, R., Woodroofe, M., Zinn, J. Convergence to a stable distribution via order statistics// Ann. Probab., 1981, v. 9, p. 624-632.
68. Maronna, R., Martin, R. D., Yohai, V. Robust Statistics Theory and Methods, Wiley, New York, 2006.111. mason, D. m. Asymptotic normality of linear combinations of order statistics with a smooth score function// Ann. Statist., 1981, v. 9, p. 899-904.
69. MORI, T. The strong law of large numbers when extreme values are excluded from sums// Z. Wahrsch. Verw. Gebiete, 1976, v. 36, p. 189-194.
70. PENG, L. Estimating the mean of a heavy tailed distribution// Statistics & Probability Letters, 2001, v. 52, p. 255-264
71. POLITIS, J., ROMANO, J. A general theory for large sample confidence regions based on subsamples under minimal assumptions// Ann. Statist., 1994, v. 22, p. 2031-2050.119. politis, J., Romano, J., wolf, M. Subsamplmg, Springer, New York, 1999.
72. PUTTER, H. Consistency of resampling m,ethods, Ph.D. thesis, Leiden University, 1994.121. putter, H., van Zwet, W.R. Empirical Edgeworth expansions for symmetric statistics// Ann. Statist., 1998, v. 26, p. 1540-1569.
73. Ql, Y., Cheng, S. Convergence rate of distribution of trimmed sums// Chinese Ann. Math., Ser. B, 1996, v. 17, p. 349-364.
74. Rosenkrantz, W., O'Relly, N. Applications of the Skorokhod representations to the rate of convergence for linear combinations of order statistics// Ann. Math. Statist., 1972, v. 43, p. 1204-1212.
75. REISS, R.-D. On the accuracy of normal approximation for quantiles// Ann. Probability, 1974, v. 2, p. 741-744.
76. Shorack, G R Probability for Statisticians, Springer, New York, 2000
77. Shorack, G R , Wellner, J A Empirical processes with application in statistics, Wiley, New York, 1986
78. SlNGH, K On the asymptotic accuracy of Efron's bootstrap// Ann Statist, 1981, v 9, p 1187-1195
79. Stigler, S M Linear functions of order statistics// Ann Math Statist, 1969, v 40, p 770-788
80. STIGLER, S M The asymptotic distribution of the trimmed mean// Ann Statist, 1973, v 1, p 472-477137. stigler, S M Simon Newcomb, Percy Darnell, and the history of robust estmation 1885-1920// J Amer Statist Assoc , 1973, v 68, JY° 344, p 872879
81. STIGLER, S M Linear functions of order statistics with smooth weight functions// Ann Statist, 1974, v 2, № 4, p 676-693
82. SWANEPOOL, J A note on proving that the (modified) bootstrap works// Comrrmn Statist, Part A, 1986, v 15, № 11, p 3193-3203140. swanepool, J A review of bootstrap methods// South African J Statist , 1990, v 24, p 1-34
83. TALAGRAND, M The missing factor m Hoeffdmg's inequalities , Ann Inst Henri Pomcare, 1995, 31, p 689-702
84. TEUGELS, J L , Limit theorems on order statistics// Ann Probab , 1981, v 9, p 868-880
85. WET, T.De. Berry Esseen results for the trimmed mean// South. African J.Statist., 1976, v. 10, p. 77-96.
86. Wu, W.B. On the Bahadur representation of sample quantiles for dependent sequences// Ann. Statist., 2005, v. 33, no. 4, p. 1934-1963.ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ Статьи
87. Gribkova, N.V., Helmers, R. On the M fewer than N bootstrap approximation to the trimmed mean // Theory Probab. Appl, 2010, v. 55, № 1, p. 42-53; Preprint: PNA-E 0810, December 2008, CWI, Amsterdam.
88. Gribkova, N.V., Helmers, R. On the Bahadur Kiefer representation for intermediate sample quantiles // (представлено в журнал); e-print: arX-iv:1106.2260vl math.PR],
89. Gribkova, N.V. On bootstrap L-statistics// International Confer. "Asymptotic Methods in Probability and Mathematical Statistics", June 24-28, 1998, St-Petersburg, Abstr. of Commun., p. 103-106.
90. Gribkova, N.V., Helmers, R. The empirical Edgeworth expansion for a studentized trimmed mean// 8-th Intern. Vilnius Confer, in Probability Theory and Mathem. Statistics, June 23-29, 2002, Vilnius, Abstr. of Commun., p. 107-108.
91. Gribkova, N.V., Helmers, R. The empirical Edgeworth expansions for a Studentized Trimmed Mean// 24-th European Meeting of Statisticians, August 19-23, 2002, Prague, Abstr. of Commun., p. 207.
92. ГРИБКОВА, H.B. Корректность второго порядка бутстреп-аппроксимации распределения стьюдентизованного урезанного среднего// Обозр. прикл. и промышл. матем., т. 11, вып. 4, 2004, с. 789-790.
93. ГРИБКОВА, Н.В. Эмпирическое разложение Эджворта для стьюдентизованного урезанного среднего// Обозр. прикл. и промышл. матем., т. 11, вып. 4, 2004, с. 790.
94. ГРИБКОВА, Н.В. Бутстреп для стьюдентизованного усеченного среднего// Обозр. прикл. и промышл. матем., т. 12, вып. 1, 2005, с. 139-140.
95. ГРИБКОВА, Н.В. О свойствах порядковых статистик бутстреп-выборки вблизи выборочной квантили// Обозр. прикл. и промышл. матем., т. 12, вып. 3, 2005, с. 656-657
96. Грибкова, Н.В. О состоятельности М <с iV-бутстреп-аппроксимации распределения усеченного среднего в отсутствие его асимптотической нормальности// Обозр. прикл. и промышл. матем., т. 14, вып. 4, 2007, с. 656-657.
97. Gribkova, N.V. On the M fewer than N bootstrap approximation to the trimmed mean// 22-nd Intern. Nordic Confer, on Mathematical Statistics (NORDSTAT), Vilnius, June 16-19, 2008, Abstr. of Commun., p. 63.
98. Грибкова, Н.В. Асимптотика второго порядка для слегка усеченных сумм случайных величин// Обозр. прикл. и промышл. матем., т. 16, вып. 2, 2009, с. 257-258.