Принцип инвариантности для случайных процессов и полей с перемешиванием тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Порывай, Денис Владимирович
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2006
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
На правах рукописи
УДК 519.12,519.214.5,519.234.22
ПОРЫВАЙ Денис Владимирович
ПРИНЦИП ИНВАРИАНТНОСТИ ДЛЯ СЛУЧАЙНЫХ ПРОЦЕССОВ И ПОЛЕЙ С ПЕРЕМЕШИВАНИЕМ
01.01.05 — теория вероятностей и математическая статистика
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2006
Работа выполнена на кафедре теории вероятностей Механико-Математического факультета Московского Государственного Университета им. М.В. Ломоносова
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
доктор физико-математических наук, профессор А. В. Булинский
доктор физико-математических наук, профессор В. И. Оселедец
кандидат физико-математических наук, доцент А. В. Прохоров
Центральный Экономико-математический институт РАН
Защита диссертации состоится " 12 11_щщ._ 2006 г. в
16 часов 15 минут на заседании диссертационного совета Д.501.001.85 в Московском государственном университете им. М.В. Ломоносова по адресу: 119992, ГСП-2, Москва, Ленинские горы, МГУ, Механико-Математический факультет, аудитория 16-24.
С диссертацией можно ознакомиться в библиотеке Механико-Математического факультета (Главное здание, 14 этаж).
Автореферат разослан " 12 " апреля 2006 г.
Ученый секретарь диссертационного совета Д.501.001.85 в МГУ, доктор физико-математических наук, профессор
Т.П. Лукашенко
¿006 fr 7S7i
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Важное место в теории вероятностей занимает изучение предельных закономерностей для процессов, образованных с помощью суммирования случайных величин. К таким процессам относятся, например, процессы частных сумм, эмпирические процессы, ядерные оценки. В статистической физике для описания гиббсовских случайных полей1 используются процессы частных сумм, индексированные множествами2. В математической статистике применяются предельные теоремы для ядерных оценок (см., например, книгу Л.Девроя и Л.Дьерфи3).
Одной из наиболее часто используемых предельных закономерностей является слабая сходимость распределений процессов в определённом функциональном пространстве к некоторому, как правило, гауссовскому закону, который не зависит от распределения допредельных случайных величин. Такого рода закономерности являются предметом исследований многих работ (см., например, книгу П.Биллингсли4 и там же ссылки), где они объединены под названием принципа инвариантности или функциональной центральной предельной теоремы. Согласно фундаментальной теореме Прохорова для доказательства принципа инвариантности в пространстве непрерывных функций необходимо и достаточно установить сходимость конечномерных распределений и плотность траекторий изучаемых процессов.
В диссертации получены новые предельные теоремы (слабые принципы инвариантности) для различных классов случайных процессов и полей, обладающих перемешиванием. Особенностью налагаемых условий является то, что учитывается зависимость только одной случайной величины и бесконечного набора случайных величин.
Вопрос об асимптотическом поведении процессов частных сумм, порождённых независимыми случайными величинами, хорошо изучен (см., например, книги И. А. Ибрагимова и Ю. В. Линника5, и А. Н. Ширяева6). Практика показывает что, случайные системы могут быть
'X. О. Георгий. Гиббсовские меры и фазовые переходы. Перев. с англ М.:Мир, 1992.
2K.Alexander, R.Pyke. A uniform central limit theorem for eet-indexed partial-sum processes with finite variance. Ann. Probab. 1986. V. 14. № 2. P. 582-597.
'Л.Деврой, Л.Дьерфи. Непараметрическое оценивание плотности. L1 -подход. Перев. с англ. М.:Мир, 1988.
4П.Биллингсли. Сходимость вероятностных мер. Перев. с англ. М.:Наука, 1977.
'И.А.Ибрагимов, Ю.В.Линник. Независимые и стационарно связанные величины. М.:Наука, 1965.
«А.Н.Ширяев. Вероятность-1, Вероятность-2. 3-е из ' "'""""0,2004.
наделены определёнными условиями зависимости. Примерами случайных систем с зависимостью служат марковские процессы и поля, мартингалы и др. Широкий класс зависимых случайных полей X = {Х<,г 6 Zd},d ^ 1, позволяет охватить понятие перемешивания. Суть этого понятия состоит в измерении зависимости ст-алгебр, порождённых непересекающимися наборами компонент процесса или поля, с помощью различных коэффициентов перемешивания, например, коэффициентов а-, /3-, </>-, ^перемешивания (определения и основные свойства см., например, в статье7). А именно, рассматривается коэффициент
ae(I, J) = ае(сг{Хиг € I},cr{Xj, j G J}),
где в качестве ае берётся один из коэффициентов перемешивания, а I и J - конечные непересекающиеся подмножества и задаётся оценка для него, зависящая от взаимного расположения I, J. Естественно предполагать, что с удалением друг от друга индексных множеств I и J значение оценки должно убывать, в то время как с ростом самих множеств зависимость может накапливаться.
Значительные результаты в области предельных теорем при условиях зависимости, формулируемых в терминах коэффициентов ае(/, J), были получены И. А. Ибрагимовым, Е. Болтхаузеным, М. Вичурой, Е. Рио, Ю. А. Давыдовым, А. В. Булинским, П. Дуканом, Дж. Дедеке-ром и другими авторами (см., например, книгу8 и там же ссылки). Отметим, что условия справедливости большинства предельных теорем сводятся к моментным ограничениям, стандартным для таких утверждений, и требованиям к скорости убывания коэффициентов перемешивания.
Используя для описания зависимости поля X коэффициенты ае(/, J), когда ае = а и множество I одноточечно, а множество J может состоять из бесконечного числа элементом, Дж. Дедекером в работе9 была доказана сходимость конечномерных распределений процессов частных сумм, индексированных множествами. Несколько позже в статье10 была установлена плотность этих процессов при этом были вовлечены коэффициенты ае(7, J), когда ае = <р, множество I двухточечное,
7R.C.Bradley. Basic propertiee of strong mixing conditions. A survey and aome open questions. Probab. Surv. 2005. V.2. P.107-144.
•А.В.Булинский. Предельные теоремы в условиях слабой зависимости. Изд-во МГУ. 1989.
'J.Dedecker. A centra] limit theorem for stationaxy random fields. Probab. Theor. Rel. Fields. 1998.
V. 110. P. 397-426.
,0J.Dedecker. Exponential inequalities and functiona) central limit theorems for random fields. ESAIM: Probability and Statistics. 2001. V. 5. P.77-104.
а множество J может содержать бесконечное число элементов. Кроме условий на зависимость поля накладывались также моментные ограничения и ограничения на энтропию семейства индексирующих множеств. Последнее условие нужно для непрерывности предельного гаус-совского процесса.
Многие методы непараметрической статистики основаны на асимптотических свойствах оценки Надарая и Ватсона и производных от неё оценок (подробное изучение этого вопроса см. в книге Воска11). В недавней работе Зиглера12 устанавливается ряд предельных закономерностей оценки аргумента максимума регрессионной функции, при этом предполагается независимость наблюдаемых случайных величин. Напомним, что использование непараметрического подхода для оценки аргумента максимума функции плотности берёт своё начало с известной работы Парзена13. Естественно возникает вопрос о справедливости результата Зиглера для зависимых наблюдений. Недавние работы Псшоника и Яо (см., например,14) посвящены изучению, так называемых, условных эмпирических процессов, индексированных множествами, которые имеют вид оценки Надарая и Ватсона. Для таких процессов доказана функциональная центральная предельная теорема в предположениях экспоненциального убывания коэффициента сильного перемешивания и ограничениях на энтропию класса индексирующих множеств. При изучении вопросов финансовой математики часто используются локально полиномиальные оценки, которые являются естественным обобщением оценки Надарая и Ватсона. В работе15 получена асимптотическая нормальность локально полиномиальной оценки для сильно перемешивающихся случайных величин. Представляет интерес доказательство аналогичного результата для более широкого класса зависимых случайных величин.
Цель работы
Диссертация посвящена исследованию перемешивающихся случай-
"B.Bosq. Nonparametric Statistics for Stochastics Processes. Lecture Notes in Statistics. 1998. № 110. Springer.
"K.Ziegler. On nonparametric kernel estimation of the mode of the regression function in the random design model. J. Nonpar. Statist. 2002. V. 14. P. 749-774.
"E.Parzen. On estimation of a probability density function and mode. Ann. Math. Statist. 1962. № 33. P. 1066-1076.
"W.Polonik, Q.Yao. Set-indexed conditional empirical and quantile processes based on dependent data. J. Multivar. Anal. 2002. № 80. P. 234-255.
"J.Fan. Local polynomial estimation of regression functions for mixing processes. Scand. J. Stat. 1997. Л» 24. P. 165-179.
ных процессов и полей. Основные задачи работы: установить принцип инвариантности для сглаженных процессов частных сумм, индексированных множествами, при условиях, учитывающих зависимость только одной случайной величины и бесконечного набора случайных величин; получить новую версию локального принципа инвариантности для эмпирических процессов; изучить предельные поведения различных ядерных оценок при новых условиях на перемешивание случайных величин.
Научная новизна
Основные результаты работы являются новыми и состоят в следующем.
1. Разработана новая модификация техники реконструкции перемешивающихся случайных полей, которая позволяет использовать энтропийный метод доказательства плотности распределений процессов частных сумм.
2. Для сглаженных рандомизированных процессов частных сумм установлен принцип инвариантности в условиях, учитывающих зависимость только одной случайной величины и бесконечного набора случайных величин.
3. Для перемешивающихся случайных величин впервые получена асимптотическая нормальность непараметрической оценки аргумента максимума регрессионной функции.
4. Получена новая версия локального принципа инвариантности для эмпирических процессов, образованных перемешивающимися случайными величинами.
Указанные результаты являются новыми и обоснованы строгими математическими доказательствами. Точные формулировки основных утверждений приведены ниже.
Методы исследования
В работе используются как традиционные методы теории вероятностей и случайных процессов (техника реконструкции и дискретной аппроксимации, развитие метода Линдеберга, энтропийный метод, мо-ментные неравенства), так и методы математического анализа (формула Тейлора, теорема Лебега о плотностях, теорема Фубини, теорема Арцела-Асколи и др.).
Теоретическая и практическая ценность
Диссертация носит теоретический характер. Ее методы и результаты могут найти применение при решении асимптотических задач теории вероятностей и математической статистики.
Апробация работы
Результаты диссертации докладывались на Всероссийском симпозиуме по прикладной и промышленной математике (Сочи, 27 сентября - 3 октября 2004 г.), на XXVI конференции молодых учёных мехмата МГУ (Москва, 2004 г.), а также на научных семинарах, проводимых в МГУ под руководством профессоров А. В. Булинского и В. И. Питер-барга (2003-2005 г.). Исследования автора были поддержаны грантом РФФИ 03-01-00724.
Публикации
Результаты диссертации опубликованы в 5 работах автора, список которых приведен в конце автореферата.
Структура диссертации
Диссертация состоит из введения, списка обозначений, двух глав (разбитых на параграфы) и списка литературы, насчитывающего 100 наименований. Общий объем диссертации - 100 страниц.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении формулируются основные определения и даётся обзор работ по предельным теоремам для случайных процессов и полей с перемешиванием. В заключении изложена структура диссертации.
Описание перемешивания поля X — {Xi, г £ Zd} потребует определения некоторых коэффициентов зависимости <т-алгебр IX, V с У, где 5 _ «г-алгебра всех измеримых множеств исходного вероятностного пространства (П, Р). Нас будут интересовать коэффициент сильного перемешивания
a(tt,V)= sup |соу(%,1к)|, ueu,vev
коэффициент абсолютной регулярности
/3(U,V) = isup £ jcov(E^,IVj)[,
(ij)eixJ
♦
где верхняя грань берётся по всем разбиениям и (Vj)jeJ соот-
ветственно И и V - измеримым, коэффициент <р - перемешивания
<р{К, V) = зирЦЩЩУ) - Р(С/)| : и € и, V 6 V и Р(У) > 0),
и коэффициент гр - перемешивания
/I Р(ипУ)
•ф{иУ) = зир( 1 4 '
¥{УЩи)
: и £ и,Р(С/) > 0, Г € 7,Р(У) > о) .
Введённые коэффициенты перемешивания удовлетворяют следующим неравенствам (см., например,7)
2а(11, V) ^ < <Р(и,У) ^
0 ^ а(1С,У) < 1 0 < /0(11, V) < 1,0 < <р(ПУ) < 1,0 < ф{П,V) < оо.
Положим р(ГьГ2) = шЩа: - у\\ : х е Тиу е Г2}, где Г1,Г2 С ЪА и ||х|| = тахц^для х = (х1,...,ха) е Л&. Для п € N.к,тп е N и {оо}, определим коэффициенты перемешивания
аех(п,к,тп) = 8ир{ае(стх(Г1),о-л-(Г2)) :
Й(Г1> < к, Я(Г2) < ТП, р(Ти Га) ^ я}, (1)
где множества Г1 и Г2 отделены некоторой гиперплоскостью в К**, <тх(Г) есть ст-алгебра, порождённая полем X на множестве Г С Й(Г) обозначает число точек в множестве Г С Для х,у,г > 1 полагаем гех(х,у,г) = аел'([а:], [у], [г]), где [•] - целая часть числа, а в качестве зех берётся ах, 0х, <рх или фх. Заметим, что коэффициент аех(х,у, г) является невозрастающей функцией по переменной х и неубывающей по переменным у и г. Для удобства записи будут использоваться обозначения аэх<т(п) = аех(п,к,т), &ху00(р) — виртаэ^т(п),
оо,оо(п) = 8иРкае^оо(п)- Индекс X в формуле (1) будет опускаться,
когда из контекста понятно для какого процесса вычисляется коэффициент перемешивания.
Псше X называется ае*)00-перемешивающимся, если Нт,,-^ ае^ (п) = 0. В диссертации при изучении асимптотических свойств случайных полей в качестве мер зависимости нами будут рассматриваться коэффициенты перемешивания ае*100, к = 1,2, то есть в формуле (1) в качестве Г1 будут вовлечены лишь одноточечные и двухточечные подмножества Ъл.
В Главе 1 основным объектом исследования является семейство сглаженных процессов частных сумм, которые определяются (см., например,2) на классе А некоторых борелевских подмножеств единичного куба [0, l]d следующим образом:
Zn(A) = n~d/2 J]) IпА П Cj\Xj, Л e A, n G N, jezd
где для j = (ji,..., jd) единичный куб C: = (jj -1, ¿1] x • • • x 1, jj, пЛ = {nx, x G Л} и |Г| - мера Лебега множества Г С К1*. Кроме того, предполагается центрированность поля X.
Назовём борелевские подмножества А к В единичного куба [0, l]d эквивалентными, если |ЛЛВ| = 0, а множество классов эквивалентности обозначим £. Теоретико-множественные операции на £ вводятся на представителях классов эквивалентностях. Тогда di(A, В) = \ААВ\ -метрика на £ и (£,dx) - полное метрическое пространство. Так как процессы Zn имеют ¿¿-непрерывные тректории, то их можно рассматривать непрерывными на £. Будем считать семейство А вполне ограниченным подмножеством (£, d£). Тогда пространство С {А) является сепарабельным и полным.
Скажем, что имеет место (слабый) принцип инвариантности, если процессы Zn сходятся по распределению в пространстве С {А) к процессу aZ при п —> оо, где Z - стандартное броуновское движение и а1 — Ylkez^iXoXk). Под упомянутым броуновским движением Z понимается центрированный гауссовский процесс с выборочными траекториями из С(А) такой, что E(Z(A)Z(B)) = \А П В\ для А, В е А. Существование процесса Z установлено в16 при определённых условиях на энтропию класса А. В разделе 1.1 следуя9,10, воспроизводится проверка для всех Ai,..., Ад - борелевских подмножеств [0, l]d, у которых мера Лебега границы равна нулю, сходимости конечномерных распределений
(ZM,ZM) *(Z(Ai),Z(Ag)), когда X - строго стационарное симметричное случайное поле и ИкеТ*ЩХоХк\ < со. Заметим, что в случае (рассматриваемом нами в теореме 1.1) симметричных случайных полей выполнено равенство Е(Хо\a{Xk, к ф 0}) = 0, которое, как было показано в17, не гарантирует плотность семейства распределений Zn.
"R.M.Dudley. Sample functions of the Gaussian process. Ann.Probab. 1973. V. 1. P 66-103.
1TM.El.Machkouri, D.Voln^. Contre-exemple dans le théorème central limite fonctionnel pour les champs aléatoires réels. Annales de ПНР. 2003. V. 2. P. 325-337.
В разделе 1.2 устанавливается плотность распределений процессов {Zn(A), A G Л} в пространстве С (А). Для этого используется следующее условие на энтропию (с включением) семейства А. Пусть для некоторой строго убывающей функции д(е), е € (0,1], такой, что д(е) —► ос при е 0+, сходится интеграл 1
I(е-1Я(Ё))1/25(е)<& < оо, (2)
о
где Я(е) = \og Nj(e, A,di) и Nj{e,A,d£) обозначает минимальное натуральное число к ^ 1, при котором существуют измеримые множества 1 ^ i < к такие, что для каждого А € А найдётся некоторое г, при котором \ < е и Д-1^ Ç A Ç Af\
Заметим, что гауссовский процесс {Z(A), А € Л} имеет выборочные траектории из С(А), если для семейства А справедливо (2) (см.16).
Определим для семейства Л экспоненту метрической энтропии г = inf{s > 0 : log Ni(e,A,di) = 0(е~') при е -»■ 0+}. Нетрудно видеть, что при г < 1 энтропийное условие (2) выполнено. Тем самым условию (2) удовлетворяют все классы множеств, рассмотренные в2. Приведём примеры некоторых из них.
Рассмотрим класс множеств, у которых границы являются образами (d — 1)-мерной сферы на [0, l]d, при диффеоморфизме, имеющем равномерно ограниченные производные порядка к. В этом случае г = (d — 1)/к (см. Дадли) и, кроме того, г < 1 если d < к + 1. Большой класс семейств множеств включают, так называемые, классы Вапника-Червоненкиса, для них г = 0. В качестве примеров таких классов множеств приведём семейство многогранников в [0, l]d, имеющих не более чем m вершин, а также семейство всех эллипсоидов в [0,1]".
Сформулируем главный результат раздела 1.2.
Теорема 1.1. Пусть поле X является симметричным и образовано одинаково распределёнными случайными величинами (с.в.) Xj. Пусть А - семейство борелевских множеств из [0, l]d, удовлетворяющее энтропийному условию (2). Кроме того, пусть выполнены следующие условия:
(a) Е|Хо|" < оо при некотором s > 2;
(b) limsupEiOf2T(e)-0x (<7,/d(e) - 1,1, /2т(е)/д(е)) < оо, здесь г = s/(s - 2) и /(е) = (е-*Н(е))Ч*д(е),
где д фигурирует в (2). Тогда семейство распределений процессов Zn = {Zn(A) : А £ А} плотно в пространстве С (Л).
Заметим, что /2т(е) и /2т(е)/д(в) растут со степенной скоростью к бесконечности, когда е 4- 0. Таким образом, условие зависимости (Ь) предполагает лишь степенную скорость убывания к нулю коэффициентов Ду(п, 1, m(n)) при п оо.
Доказательство теоремы 1.1 основано на обобщении энтропийного метода, развитого в работе2 для сумм независимых с.в., на слабо зависимые поля. Важным моментом доказательства является привлечение, так называемой, техники реконструкции (см., например, §1.2.2 в18). Кроме того, применяются различные усечения исходных с.в., должные аппроксимации элементов класса А, а также различные максимальные неравенства.
Недавно Дедекером9 была установлена сходимость конечномерных распределений процессов Zn при условиях, учитывающих а-зависимость лишь <rx({j}) и с* (Г), где p({j}, Г) ^ п,п € N. В то же время условие плотности распределений процессов Zn в С (А) использовало (^-зависимость crx({i,j}) и <гу(Г), где p({i,j}, Г) > n, n 6 N.
В теореме 1.1 получены достаточные условия плотности распределений Zn в терминах семейств коэффициентов вида ßx(n,l,m),m € N, то есть в (1) в качестве не вовлечены двухточечные подмножества Zd (а лишь Ti, имеющие Ц(Гх) = 1). Разумеется, налагаются также ограничения на моменты поля X и на структуру класса А.
В разделе 1.3 доказывается плотность процессов частных сумм
zn(t) = n-W Xi> П< = (0. *], t e [о, l]d, П € N,
je nn,nz"
в пространстве D[0, l]d при существовании у величин Xj абсолютных моментов порядка строго больше 2d и условии перемешивания, выраженном только в терминах коэффициентов aid,2d, то есть учитывается зависимость между двумя <7-алгебрами, порождёнными лишь конечными наборами случайных величин.
Теорема 1.7. Пусть поле X таково, что при некотором р > 2d
F\Xj\p < Мр < оо, j € Zd. Пусть для всех натуральных и > v ^ 2, удовлетворяющих условию
"P.Doukhan. Mixing. Propertiee and examples. Lecture notes in Statistics 85. Springer. New York. 1994.
и + v ^ 2d + 2, выполняется неравенство
f> + íyW-^faAn))^ < оо.
n=l
Тогда семейство распределений {Zn(t),t € [0, l]*1} плотно в пространстве D[0, l]d.
Следует отметить, что в теореме 1.7 не предполагается стационарность поля X в отличие от недавнего результата Дедекера, где возникают условия на коэффициенты с*1)00 с целью получения аналогичного результата о плотности распределений. В доказательстве теоремы 1.7 используется техника Морица19, а также метод работы20, в которой устанавливается принцип инвариантности для положительно зависимых случайных полей. Кроме того, в разделе 1.3 устанавливается теорема о плотности распределений Zn при условиях зависимости, формулируемых в виде неравенств для ковариаций степеней порядка 2d+2 исходных с.в.
Глава 2 посвящена изучению асимптотических свойств ядерных и связанных с ними оценок. Предполагается, что данные наблюдений могут быть описаны строго стационарной последовательностью случайных величин, зависимость которой выражается в терминах коэффициентов ai>00, <¿>i)00 и ¥>2,оо- Показано, как перемешивание наблюдений влияет на выбор последовательности локализующих окон, а при изучении условных эмпирических процессов на - энтропию класса индексирующих функций (для получения асимптотической нормальности изучаемых оценок). Доказывается центральная предельная теорема для ядерной оценки аргумента максимума регрессионной функции и локально полиномиальной оценки.
В разделах 2.1 и 2.2 изучаются асимптотические свойства ядерных оценок регрессионной функции F(f\x) = Е(/(У)|Х = х), здесь / входит в некоторый класс У измеримых функций, отображающих польское пространство X в R, (X, У):Г2->КйхХиа;6 R"*. Предполагается, что наблюдения с.в. (X, Y) описываются строго стационарной последовательностью Е = {(X¿,Y¿),i € Z} перемешивающихся с.в. (Xi, Yi) : Ç! If1 х Ï. Для статистической оценки F{f\x), следуя
"F.Moricz. A general moment inequality fer the maximum of the rectangular partial suma of multiple series. Acta math.Acad.sci.hung. 1983. V. 41. Jfr 3-4. P. 337-346.
"A.V.Bulinski, M.S.Keane. Invariance principle for associated random fields. J.Math.Sci. 1996. V. 81. M 5. P.2905-2911.
Надарая-Ватсону, используют величины
где формально полагают 0/0 = 0, ядро К(-) ^ 0 задаётся на Ж*1, И = Нп > 0 - параметр сглаживания, / 6?, гЕК'ипеН. Для упрощения записи формулируемых теорем далее считаем (1 = 1.
В разделе 2.1 устанавливается сходимость конечномерных распределений семейства {у„(/|х), / € 2"}, 1/„(/|я) = х/пЛ3^/^) -Для этого используются условия перемешивания, формулируемые в терминах коэффициентов а1)0С и <£1,оо- Для обеспечения моментных условий порядка 4 + е, налагаемых на с.в. /(Уо), требуется ограниченность плотностей (по мере Лебега) р(г) и р* , г*) распределений с.в. и (Х1,Хк), соответственно. Моментные условия могут быть ослаблены до порядка 2 + е, если предположить ограниченность носителя ядра К (см. теорему 2.10 в разделе 2.4). Доказательство сходимости конечномерных распределений процессов ип(/\х) использует метод Линдеберга для а1)00-перемешивающихся с.в. Главная трудность при обобщении этого метода на схему серий состоит в отсутствии для этой схемы аналога И^-эргодической теоремы. В нашем случае удаётся обойтись без И,1 -эргодической теоремы благодаря следующему обстоятельству. При вводимых ниже условиях ковариационная функция предельного гауссовского процесса оказывается такой же, как у предела процессов 1>п(/\х), построенных по последовательности Н независимых с.в.
Всюду далее предполагается, что х е Ш фиксировано и р(х) > 0. Введём также следующие наборы условий.
А1. Функция ^(.Л/г!«) непрерывна, а функции р(г) и Р(/\г) дважды непрерывно дифференцируемы по г в некоторой окрестности точки х для всех /1, /2, / € Эг.
А2. Ядро К ограничено на К и удовлетворяет соотношениям:
У К (г) (¿2 = 1, I г2К(г) Лг < оо, к к
К(~г) = К{г) для г € К, г3К(г) -)• 0 при г-юо. АЗ. Плотность р(г) ограничена на К. Распределение пары (Х\, Х^),
где к > 1, имеет плотность Pk{z\,zk) по мере Лебега такую, что suV(zltzk)eV Pk(z\>zk) < оо.
A4. h = h(n) таковы, что y/nh5 -*со<ооипЛ->оо при п оо. Пусть nh"1 —У оо и nhH 0 при некоторых si < 5 и s2 > 1.
А5. Е|/(Уо)|р < <х> для всех / е У и Qi,oo(n) = 0(п~ь) при п оо, где
12 6
р> —— V-г- V 4 и
Si + 1 si - 1
2р p((si 4- 3)р - 12) p({s2 + 3)р — 8) р-4 (р — 2)((si + 1)р — 12) 2(р — 1)(р — 4)
А5'. Е|/(Уо)|р < оо для всех / € У и <pil<X3(n) = 0(п~ь) при п оо, где
P + l (p-l)(p-4) V 2(p — 4)
Теорема 2.1. Пусть справедливы условия AI - A4, А5 (или А5').
Тогда для каждого m > 1 и любых f\,..., /т € У имеем
• • •, fn(/m|a;)) >Г(со/х(ж), Е2) при п оо,
где К - нормальный закон с параметрами с^ц{х) = co(/i(/i|i),..., м(/т|®))
и е2 =
= + I z2K(z)dz/p(x),
я
= (Wjl®)-WWWW) / ^(^//ФО-
В качестве приложения теоремы 2.1 рассмотрим случай, когда семейство И состоит из ограниченных функций /. Например, условная эмпирическая мера получается, если в определении величины Fn(f\x) положить / = 1с, где 1с - индикатор множества С из некоторого класса измеримых множеств С.
Следствие 2.1. Пусть - семейство ограниченных функций и выполнены условия AI - A3. Пусть a:i(n) = 0(п~ь) при п —> оо для некоторго 6 > 2. Тогда при выборе h(n) = n-1 Inn,п > 1, справедливо утверждение теоремы 2.1.
Мы не предполагаем существование плотности Лебега с.в. последовательности S. В приложениях это позволяет рассматривать так называемую логистическую регрессию, в которой У принимает только дискретные значения. Результат теоремы 2.1 является новым и расширяет область применений недавних работ Воска11, Полоника и Яо14, а также Зиглера12.
В разделе 2.2 изучается вопрос о плотности семейства {v„(f\x), f € 7} в пространстве состоящем из функционалов и, заданных на
3", таких, что \\v\y = supy€3- \u(f)\ < сю. При этом условие на перемешивание случайных величин {(Aj,Yi),i 6 Z} выражается в терминах коэффициента <р2,оо> в отличие от предшествующих работ, где использовалась зависимость двух бесконечных наборов случайных величин (когда расстояние между ними растёт).
Пусть пространство (L,dp(-)),p ^ 1 состоит из всех действительнозначных функций заданных на X таких, что d?p{f) = supz6R F(\f\p\z) конечно. Для пары функций (/, д) из LxL таких, что / < д, определим сегмент [/, д] как множество всех функций v, удовлетворяющих неравенству f ^ v ^ д. Назовём е-сегментом такой сегмент [/, </], что dp(f— д) < е. Энтропия с включением ЩЗ", е, dp(-)) определяется как логарифм минимального числа е-сегментов, покрывающих подмножество пространства (L,dp(•)). Обозначим 7Р< = /0* et_1 е, dp(-)) de.
Доказательство плотности процессов vn{f\x) в пространстве Г3(У) проводится, так называемым, методом цепной реконструкции21. Рассмотрим следующие условия.
А6. h = h(n) таковы, что Vnh5 —►со<ооипЛ-*оо при п оо.
А7. Совместное распределение > 1, имеет плотность
Pk(zi,zk) по мере Лебега такую, что для всех (zi, zjt) € R2 справед-
fc=2
Кроме того, пусть sup¡^ \di/dz'(F(f\z)p(z))\ < оо для j = 2,3 в некоторой окрестности точки х.
"P.Doukhan, P.Maaeart, B.Rio. Invariance principles for absolutely regular empirical processes. Annales de lTnstitut Henri Poincaré Probabilités et Statistiques. 1905. № 31. P. 393-427
ЛИВО
\pk{z\,zk) - p{zx)p{zk)\ ^ e{k)p(zi)p{zk), 6(h) < 1,
n
Bl- T,k>0k(P2,oo{k) < oo, nh3(P-2V(p-4) -ЮО (n -)■ oo), Ip,t < ОС для t = 3/{p — 1) при некотором p > 7.
ос (ra oo), Ip,t < oo
для f = Ь/(р - 1) при некоторых 3<6<5ир> (36+ 5)/(5 — b).
ВЗ. А»,«(Л) = 0(/Гь), Et>oVu(fc) < oo (n oo) при
некотором b > 1, l2,t < oo для t = 1.
Теорема 2.5. Пусть выполнены Al, A2, Аб при cq = О, А7 и одно из условий В1 - ВЗ. Тогда семейство процессов {vn(f\x), / G У} плотно в пространстве (ГС(ЭГ), || • ||у).
Целью раздела 2.3 является установление асимптотической нормальности непараметрической оценки аргумента максимума В регрессионной функции тп(х) = Щу\Х = х), х Е К, где (X, У) - двумерная с.в., а У - интегрируемая с.в. Для аппроксимации функции тп(х) используется оценка Надарая-Ватсона гпп^(х) — rn,h{x)/Pn,h(x)> где
•W.) - i £ вд (V) ■ - л t * •
1=1 4 ' 1=1 N '
Как и ранее, предполагается, что наблюдения с.в. (X, У) могут быть описаны строго стационарной последовательностью 3. Зависимость величин последовательности 3 будет измеряться с помощью коэффициентов перемешивания а^)00(п) и к = 1,2.
Доказательство основного результата раздела 2.3 опирается на ряд вспомогательных теорем, которые представляют самостоятельный интерес. Теоремы, полученные в настоящем разделе, обобщают недавние результаты работы22, где были доказаны аналогичные утверждения для независимых последовательностей 3.
Нам потребовались равномерные по аргументу х из некоторого отрезка I С R оценки разностей р^\(х) — р&Цх) и г%\(х) — г^\х). При установлении этих оценок возникают дополнительные ограничения, отличные от А2, на выбор ядра К. Введём следующее условие.
А8. Ядро К интегрируемо /й К(х) dx = 1 и существует непрерывная .7-ая производная К^ с ограниченной вариацией на R Кроме того, Ит)гИоо l^+^C^ar)! = 0 для всех 1 = 0,... J.
"K.Ziegler. On nonparametric kernel estimation of the mode of the regression function in the random design model. J. Nonpar. Statist. 2002. V. 14. P. 749-774.
Отметим, что ограниченная вариация плотности К на R предполагается (см., например,23) для обеспечения хороших энтропийных свойств класса функций
Мы будем предполагать, что на некотором отрезке I существует и единственен максимум т(в) функции т(х). Более того, существует пара вложенных отрезков I С J, удовлетворяющая следующему требованию
А9. Функция т(х) ограничена на J, 30 6 I Ve > 0 : т{в) > suPieJ:|*-0|>£ mix)i т{х) непрерывна в точке 0, р(х) отделима от нуля и ограничена на J.
Введём оценку величины 0, как решение уравнения fh„th(0n,h) = suP*e/ ™n,h(x)- Заметим, что существует, если ядро К непрерывно.
Предполагается, если не оговорено противное, что последовательность h такова, что с\гп < Лп < С2Г„, где 0 < С\ < < оо и (r„)n^i -детерминированная числовая последовательность, причём тп —► 0, когда п ос.
Сформулируем основной результат раздела 2.3. Теорема 2.6. Пусть выполнено условие А8 при j = 0,1,2. Предположим, что К{х) = К(—х) и К(-) ^ 0, кроме того, lim^-^o х3К(х) = О, Нт|хИоох4|А-№(х)1 = 0, /„х2К(х)dx < оо, ¡лх3\К^(х)\<1х < оо. Пусть справедливо условие А9, J^tli < оо, и при некотором
р > 4 имеет место одно из следующих двух условий:
1. Е|Уо|р < с», ahoo(k) = 0(k~b) при Ь >
2. Е|Уо|р < оо, <pi1<x>(k) = 0(к~ь) при Ь >
Предположим, что функция Е(|Уо|р|-^о = х) является непрерывно дифференцируемой, функции т(х) и р(х) три раза непрерывно дифференцируемы, причём т'2)(0) < 0, a Var(>o|Xo = х) = E((Vo — т(я))2|Хо = х) непрерывна в некоторой окрестности точки 0. Плотность р(х) ограничена на R. Совместное распределение (Xi,X/t), где к > 1, имеет ограниченную на R2 плотность по мере Лебега. Пусть т„ таковы, что пт® —> оо и nrj —► d2 < оо при п —► оо. Тогда имеет место слабая сходимость
при п —> оо,
"D.Pollard. Convergence of Stochastic process««. New York:9pringer. 1984
где 74 - нормальный закон с параметрами
--^ай?/^»'*
R
Раздел 2.4 посвящён изучению локально полиномиальной оценки, позволяющей учесть не только значения регрессионной функции т, но и её поведение (например, выпуклость) в окрестности точки х. Ранее локально полиномиальные оценки исследовались в работах Стоуна24, Кливленда и др. Предполагается существование непрерывной (д+1)-ой производной функции m(z) в точке х, тогда справедливо разложение по формуле Тейлора
m(z) » т(х) + • • • + т(ч\х){г - x)9/q\ = 0О + • • • + Р9{г - х)4, (3)
где знак « означает равенство с точностью до членов порядка o(\z — х\ч). Коэффициенты ...,Д,) оцениваются методом взвешенных наименьших квадратов, а именно,
где ядро К(-) ^ 0 задано на R, h > 0 - размер окна, х € R и п € N.
Пусть набор (До, • • •, Aj) есть решение задачи (4) (здесь и далее для упрощения записи индекс п опускается), тогда из (3) следует, что выражение k\flk(x) является оценкой величины т^(х), к = 0,..., q. Заметим, что в случае q = 0 локально полиномиальная оценка /?о сводится к оценке Надарая-Ватсона регрессионной функции т(х).
Наша цель состоит в установлении асимптотической нормальности вектора /3(х) = ..., /Зд(х))Т в случае а1)00-перемешивающихся
стационарных последовательностей Е с.в., имеющих моменты порядка р > 2. Для аос.оо-перемешивающихся последовательностей H аналогичный результат был получен в работе25. Метод, используемый нами при доказательстве асимптотической нормальности вектора 0(х),
"C.j.Stone. Consistent nonparametric régression. Ann.Stat. № 5. P. 595-645.
"J.Fan. Local polynomial estimation of régression fonctions for mbdng processes. Scand.J.Stat. 1997. № 24. P. 165-179.
является модификацией метода Линдеберга для схемы серий а^оо перемешивающихся с.в.
Нам потребуется ряд обозначений. Пусть ЛУ = с1*1ае (К^Х^ — ж)),
/1 (Х!-х) ... №-х)*\ /У,
\1 (Хп-х) ... (Хп-х)")' \У„
где Я/, {г) = К (г/к)/И. Мы будем предполагать положительную определённость матрицы ХТ'>УХ, что равносильно существованию почти наверное по крайней мере <?+1 точки множества {X;: К[{Х{—х)/Ь) > 0}. В этом случае нетрудно видеть, что решение /3 задачи (4) имеет вид (Хт\¥Х) ~1 Хт. Положим
(ТПп,0 • • • ТПп.д \ / <п,0
: ],<;„=( ; ТПпЛ ... ТПп,2, / \ <п,9
где
^ - £ £ (^У**рл^)' ад-««-
В этих обозначениях нетрудно убедиться в том, что
Введём также следующие матрицы:
• • Ия \ _ /и» ... \ / /VI
• ; Ьм- 5 ! ■" ;
Рд ■■■ И2, / ■•■ I \ И2д+\
где \1} = /в г'К(г) <1г и = /в г* К2(г) ¿г. Рассмотрим наборы условий:
С1. Совместное распределение с.в. (Хх,Х^),к > 1, имеет плотность Рк по мере Лебега на К2, такую, что зирк>1 Рк{%\, < оо для всех {г\,гк) из некоторой окрестности точки (х,х) € К2.
С2. Ядро К интегрируемо на И, ограничено и имеет ограниченный носитель виррЯ С [—1,1].
СЗ. к = к{п) таковы, что пЛ2,+3 —»СдСооипЛ-^оо при п —► оо. Пусть пЛ" оо и п/г*2 -4 0 при некоторых < 2д 4- 3 и вг > 1.
С4. вир^! Е(|У] |р + |У{|Р|Х! = = 2.) < оо для всех и ^ из
некоторой окрестности точки сц,оо(п) = 0(п~ь), где р > 2,
Предположим, что распределение с.в. ЛГ1 имеет плотность р, р(х) > О, функции р(г) и <т2(г) = Е((У - т{г))2\Х = г) непрерывны в точке х е К.
Теорема 2.10. Пусть справедливы условия С1 - С4. Тогда при п -> оо имеем
у/пк <Ка8{1,..., н"}ф(х) - 0{х)) Х(А, Е2),
где А = со'МГ]рт{я+х\х)/(д + 1)!, Е2 = о2{х)М-хММ~х/р{х)-
Отметим, что в классе ограниченных ядер К, имеющих компактный носитель, при д = 0 теорема 2.10 даёт утверждение теоремы 2.1. [
Автор выражает благодарность своему научному руководителю профессору А.В.Булинскому за постоянное внимание к работе и многочисленные ценные советы.
ч
Работы автора по теме диссертации
[1] Д.В.Порывай. Плотность в подпространстве £)[0,1]** некоторого класса процессов частных сумм. Вестник МГУ. Серия 1, "Математика. Механика". 2003. № 6. С. 3-6.
[2] Д.В.Порывай. Принцип инвариантности для некоторого класса зависимых случайных полей. Теория вероятностей и математическая статистика. 2004. № 70. С. 114-124.
[3] Д.В.Порывай. Принцип инвариантности для условных эмпирических процессов. УМН. 2004. № 59. Т. 5. С. 159-160.
[4] Д.В.Порывай. Асимптотическая нормальность оценки Надарая-Ватсона. Обозрения прикладной и промышленной математики. 2004. Т. XI. № 4. С. 899-901.
[5] Д.В.Порывай. Принцип инвариантности для условных эмпирических процессов, образованных зависимыми случайными величинами. Известия РАН. 2005. Т. 69, № 4, С. 117-136.
f
I
I i
,1 ;
i
) *
i,
i »
i
t
i i
t t
!
) í i
Издательство ЦПИ при механико-математическом факультете МГУ им. М.В. Ломоносова. Подписано в печать ОТ О^.йО Формат 60x90 1/16. Усл. печ. л. ^¿ь
Тираж ШО экз. Заказ /£
ft
2.006 Д
1£7Л
75 71
Основные обозначения.
Введение.
Глава 1. Принцип инвариантности для процессов частных сумм индексированных множествами
1.1 Сходимость конечномерных распределений процессов частных сумм.
1.2 Плотность рандомизированных процессов частных сумм в пространстве С {А)
1.3 Плотность процессов частных сумм в пространстве
D[О, l]d.
Глава 2. Принцип инвариантности для условных эмпирических процессов.
2.1 Асимптотическая нормальность оценки Надарая и Ватсона.
2.2 Плотность условных эмпирических процессов
2.3 Асимптотическая нормальность оценки аргумента максимума регрессионной функции
2.4 Асимптотическая нормальность локально полиномиальных оценок.
Исследование асимптотических свойств различных классов случайных процессов и полей занимает важное место в теории вероятностей и математической статистике. Решение большинства статистических задач, таких как проверка гипотез или построение критических областей, основано на предельных соотношениях для выборочных статистик, то есть на аппроксимации распределений вероятностей одних процессов (полей) другими. Теоремы об асимптотических распределениях в теории вероятностей и математической статистике во многом опираются на теорию слабой сходимости вероятностных мер в метрических пространствах (см., например, [2]), развитие которой связано прежде всего с именами А. Н. Колмогорова, Дж. Дуба, М. Донскера, Ю.В. Прохорова, А. В. Скорохода, В.М. Золотарёва, А. А. Боровкова, Р. Дадли, К. Ферника, JI. Ле Кама, С. Варадарайна и других учёных.
Целью данной диссертационной работы является исследование предельных закономерностей таких объектов, как процессы частных сумм, индексированные множествами, условные эмпирические процессы и ядерные регрессионные оценки, образованных перемешивающимися случайными величинами.
Во многих задачах асимптотической теории изучается поведение определенным образом нормированных сумм случайных величин или случайных векторов в различных функциональных пространствах. Как правило, указанные суммы берутся по конечным множествам индексов растущих в определённом смысле к бесконечности. В наиболее простом случае множества индексов расположены на целочисленной прямой, однако вопросы изучения многомерных структур в статистической физике ([12]) требуют рассмотрения множеств индексов более сложной природы, например, образующих некоторый подкласс множеств на целочисленной решётке При изучении эмпирических процессов наряду с понятием индексирующих множеств используется понятие индексирующих функций, когда суммируются не сами случайные элементы, а значения функции от них, принадлежащей определённому классу. Для того, чтобы предельный процесс был задан в удобном для исследования пространстве приходится налагать некоторые ограничения на класс индексирующих функций или индексирующих множеств. Во многих случаях распределение предельного процесса оказывается гауссовским. Поведение выборочных функций гауссовского процесса описано в известной работе [66] в терминах понятия метрической энтропии. Там же дан пример гауссовского процесса, который не является непрерывным при нарушении определённого условия на энтропию.
Общая теория суммирования независимых случайных величин была создана трудами А. Н. Колмогорова, А. Я. Хинчина, Б. В. Гнеденко, Г. Крамера, П. Леви, В. Феллера, В. М. Золотарева, И. А. Ибрагимова, Ю. В. Линни-ка, В. В. Петрова и многих других ученых, см., например, [18]. Суммирование независимых случайных величин естественным образом применяется при изучении свойств процессов с независимыми приращениями, к которым относится, в частности, броуновское движение. Как показывает практика, гипотеза о независимости приращений процесса во многих случаях несостоятельна. При изучении свойств различных стохастических систем, в которых случайные элементы каким-либо образом зависимы, наиболее часто выделяются следующие классы зависимых процессов и полей: мартингалы и близкие им объекты, марковские процессы и поля, процессы и поля с перемешиванием, гиббсовские поля, положительно и отрицательно ассоциированные семейства случайных величин. Достаточно широкий класс зависимых случайных процессов и полей позволяет охватить понятие перемешивания. Так, во многих случаях зависимость случайных процессов, которые образуют регрессию, просто описывается в терминах перемешивания.
Описание перемешивания поля X = {Х(, i £ "Zd} потребует определения некоторых коэффициентов зависимости cr-алгебр It, V С Нас будут интересовать коэффициент сильного перемешивания a(U,V)= sup |cov(I|/, ueu,vev коэффициент абсолютной регулярности
0(11, V) = ± sup £ |cov(Itt,Iv,)|, i,j)e/xj где верхняя грань берётся по всем разбиениям и (Vj)jej соответственно IX и V - измеримым, коэффициент <р - перемешивания p(U, V) = 8up(|P(tf| V) - ЦЦ)\ : U е U, V в V и P(F) > 0), и коэффициент ф - перемешивания
Р(£/ П V)
Ф{Ч,У) = sup
UeU,F(U) >0,V eV,F(V)>0
Об этих и некоторых других коэффициентах перемешивания см. [50].
Введённые коэффициенты перемешивания удовлетворяют следующим неравенствам
2a(U, V) ^ 0(U, V) < <p(U,V) К |VCU,V), 0 < a(U, V) < i 0 < p(U, V) ^ 1,0< <p(U, V) < 1,0 < ф(11, V) < оо.
Положим р(ГьГ2) = inf{||a; - у\\ : х е Тиу е Г2}, где ГЬГ2 С Zd и ||ж|| = для х = (жь ., xd) G Rd. Для п £ N, fc, тп € N U {оо}, следуя [5], введём коэффициенты перемешивания aex(n,k,m) = sup{ae((7x(ri),ax(r2)) : Й(ГХ) ^ Л, Й(Г2) ^ т,р(ГьГ2) ^ п},
1) где множества Гх и Г2 отделены некоторой гиперплоскостью в Md, сгх(Г) есть сг-алгебра, порождённая полем X на множестве Г С Zd. Для x,y,z ^ 1 полагаем гех(х, у, г) = гех([х], [у], [z]), где [•] - целая часть числа, а в качестве гех берётся ах, {3х, ipx или фх. Заметим, что коэффициент гех(х, у, 2:) является невозрастающей функцией по переменной х и неубывающей по переменным у и z. Для удобства записи будут использоваться обозначения &k,m{n) = эех(п, к, т), aeg00(n) = supm ae£m(n) и ae*|00(n) = supfc эе^п). Индекс X в формуле (1) будет опускаться, когда из контекста понятно, для какого процесса берётся коэффициент перемешивания. О свойствах случайных полей в терминах этих и других коэффициентов см., например, [5, 4], [55] и [62].
Основное удобство использования введённых коэффициентов перемешивания состоит в том, что при рассмотрении вместо поля X поля {fi(Xi), i Е где {fi,i G Zd} - неслучайные измеримые функции, значения соответствующих коэффициентов перемешивания могут только уменьшиться. Некоторые коэффициенты перемешивания, например, коэффициент линейной корреляции (см. [46]), не удовлетворяют этому свойству.
Напомним, поле X называется m-зависимым, если для любых двух подмножеств Гх,Г2 С И1 таких, что р(Г1,Г2) ^ га, следует независимость сг-алгебр o"x(ri) и сгх(Г2). Примером последовательности случайных величин, которая является m-зависимой, но не (га — 1)-зависимой, служит процесс скользящего среднего Х( = а^- Ч-----\-ата'i-m+ъ где {en}n£Z ~ последовательность независимых случайных величин, (ai,. ,am) - ненулевая последовательность действительных чисел.
Процесс X называется эе&.т-перемешивающимся, если Hindoo аsjfm(n) = 0. Связь между введёнными типами перемешивания и зависимости можно изобразить следующей схемой: ш-зависимость агоо оо-перемешивание
4 ' it
Фоо,оо-перемешивание =Ф- «/^оо-перемешивание =>• /Зоо,оо-перемешивание
В этой схеме отражены лишь те коэффициенты перемешивания, которые рассматриваются в диссертации, однако, существуют и другие коэффициенты перемешивания, например, коэффициент максимальной корреляции, изучавшийся А. Н. Колмогоровым и Ю. А. Розановым.
Результат [48] показывает, что Д*,,оо-перемешивание случайного строго стационарного поля на Zd эквивалентно ш-зависимости.
Существуют примеры из статистической физики, см., например, [16], которые свидетельствуют о том, что требование ^»00)00-перемешивания также является слишком ограничительным.
Имеет место следующий интересный факт. Если для «оо^-перемеши-вающегося гауссовского стационарного процесса не выполнено условие т-зависимости, то для него также не выполнено условие ^оо,оо-перемешивания (см. §2.1 в [62]). Существует пример стационарного гауссовского процесса, который является аоо>00-перемешивающимся, но не удовлетворяет условию Ах>,оо-перемешивания (см. [19]).
В работе [49] показано, что для строго стационарных случайных полей, кроме очевидных неравенств а^к(п) < ак>00(п) и а^^(п) ^ одДп + 1), существует не так уж много соотношений между коэффициентами перемешивания схк,т(п)- Отметим, что эти коэффициенты с ростом п могут вести себя как любая наперёд заданная невозрастающая числовая после-| довательность. В работе [9] дан пример случайного поля X, для которого lim„>oo ак,т{п) = 0 при всех конечных к,ти а?оо,оо{п) = 1/4.
Пример ^о^оо-перемешивающейся последовательности случайных величин может быть построен (см. [2]) при помощи представления числа из единичного отрезка в виде непрерывной дроби. В работе [47] содержится ряд примеров строго стационарных последовательностей зависимых случайных величин, для которых коэффициенты ^00,00 и "000,00 эквивалентны.
Важно упомянуть результат М. И. Гордина о том, что последовательности перемешивающихся случайных величин могут быть аппроксимированы последовательностями мартингал-разностей, подробное изучение этого вопроса см., например, в [96].
Наряду с перемешиванием для описания зависимости случайного поля используется понятие ассоциированности, см., например, [7, 53]. Зависимость ассоциированного случайного поля описывается с помощью ковари-аций функционалов от удаляющихся бесконечных наборов, образованных элементами случайного поля. Отметим, что не каждое ассоциированное случайное поле обладает перемешиванием и обратно. Эти два подхода для описания зависимости случайных систем взаимно дополняют друг друга и представляют удобные инструменты для исследований.
Во многих ситуациях предпочтительнее рассматривать зависимость между ограниченным и бесконечным наборами элементов случайного поля, когда расстояние между ними растёт. В дальнейшем при изучении асимптотических свойств случайных полей в качестве мер зависимости нами будут рассматриваться коэффициенты перемешивания эе&)0о> к = 1,2, то есть в формуле (1) в качестве Гх будут вовлечены лишь одноточечные и двухточечные подмножества ЪА.
Поясним почему вопрос о получении предельных теорем для перемешивающихся величин весьма тонок. Хорошо известно, что для независимых одинаково распределённых величин с конечной (ненулевой) дисперсией справедлива центральная предельная теорема (ЦПТ). Оказывается, "внесение" в условия этой теоремы сколь угодно малой зависимости может нарушить ЦПТ, как показывают результаты [14, 74].
Имеющиеся работы С. Н. Бернштейна, И. А. Ибрагимова, Ю. В. Линни-ка, Ю.А. Давыдова, М.И. Гордина, А. В. Булинского, И. Г. Журбенко, П. Дукана, И. Рио, П. Масара, Дж. Дедекера и ряда других авторов содержат результаты о нормальном приближении [б, 8, 17, 52, 54, 59, 63], принцип инвариантности для эмпирических процессов [58, 64, 84], свойства ядерных оценок регрессионных функций [15, 99], моментные неравенства для случайных последовательностей [1, 56], результаты об экстремумах функции регрессии [81, 100].
Пусть X = {Xi,i Е Щ является стационарной последовательностью случайных величин с нулевым средним и конечной дисперсией. Обозначим Sn = Одип из способов (см. [13, 96]) доказательства асимптотической нормальности n~l!2Sn состоит в том, чтобы аппроксимировать Sn последовательностью мартингал-разностей и затем воспользоваться ЦПТ из [41]. При этом необходимо предполагать эргодичность последовательности X и сходимость n~1Var(5'ri) -> а2 > 0 при п —> оо.
К сожалению, для изучения стационарных полей этот подход не применим, поскольку возникающие естественным образом cr-алгебры устроены значительно сложнее, чем в одномерном случае. Установление многих предельных теорем для случайных полей основано на методе Стейна [90].
В работе [42] методом Стейна была доказана ЦПТ при условиях зависимости, предполагающих степенное стремление к нулю коэффициентов <2i,oo (п) и «2,2(п), когда п оо. Использование ограничений на коэффициент «2,2 связано с тем. что для оценки величин, возникающих при использовании метода Стейна, приходится требовать или существование моментов более высоких порядков, чем второй, или вводить дополнительные коэффициенты перемешивания.
Установить ЦПТ для стационарных случайных полей при существовании моментов лишь второго порядка и условии перемешивания в терминах только коэффициента ai)00 удалось Дедекеру. Доказательство основано на развитии идеи Рио ([87]), относящейся к обобщению метода Линдеберга на случай стационарных случайных полей и использовании новых ковариационных неравенств. Чтобы привести формулировку результата [55], нам понадобятся некоторые дополнительные обозначения.
Удобно считать действительное случайное поле X заданным на вероятностном пространстве (Rz<i, Q3zd, Р), как тождественное отображение X :Rzd Rzd и Xi : Rz" Ж, Х((си) = uji для всех и G Rz". Определим для каждого к Е Zd оператор сдвига Tk : Rz —> R2 такой, что г-ая координата его образа равна [Т&(о;)]; = для всех ш £ Rz . Множество A G Q5zd называется инвариантным, если Tk(A) = А для любых к € Zd. Наименьшую сг-алгебру всех инвариантных множеств обозначим 3. Случайное поле X называется строго стационарным, если Т^ о Р = Р для всех k£Zd.
Пусть Г С Zd, положим
9Г = {г 6 Г : 3j £ Г такое, что |г — j| = 1}.
Если Г - конечное подмножество Zd, то обозначим 5(Г) = Введём семейство (Гп)пем конечных подмножеств Zd, удовлетворяющих соотношениям lim jjrn = +оо и lim (ЦГпГ^ЯГп) = 0. (2)
П-¥ + 00 П—>+00
Напомним, что согласно Ь2-эргодической теореме (см. [12]) последовательность (ttrn)15(rn) сходится к условному математическому ожиданию Е(Х0|ОГ) bL2.
Приведём теперь результат для перемешивающихся случайных величин, полученный Дедекером.
Теорема 0.1 ([55]). Пусть X - строго стационарное центрированное случайное поле и EXq < оо. Рассмотрим следующие условия:
Га1,<х>{\Щ)
22 Q2Xo{u)du< 00, (з) kez* 0 здесь QXo(u) = inf{i : Р(|Х0| > t) ^ и} и i,oo(|fc|) < 00. (4) kezd
Пусть справедливо или условие (3), или условие (4), тогда имеет место сходимость (jjrn)1/2S(rn) Sy/rj, где е ~ N(0,1) не зависит от 7] =
В работе [55] теорема 0.1 получается как следствие более общей ЦПТ, в которой условия зависимости выражены в терминах следующего проекционного критерия:
ВД^Хо^еЬ1, (5) fceFo1 где %|(Х0) = E(Xo|a{vf}), V} = {j в Zd : j <iex 0}, V0* = Ц? П {j G Zd : Ii — j I ^ г} для i ^ 2, </ex обозначает отношение лексикографического порядка между элементами из Ъа. Утверждение теоремы 0.1 останется верным, если условие (3) или (4) заменить на (5).
Отметим, что случайная величина £y/rj, возникающая в слабом Пределе, не является гауссовской, в отличие от случая когда предполагается эргодичность, то есть независимость сг-алгебр а(Х,о, Xk) и 3 для всех к € Если дополнительно к условиям теоремы 0.1 предположить сходимость к нулю коэффициента <22,2, то слабым пределом в утверждении теоремы будет являться нормальная величина с дисперсией г) = ^ь^лЩХоХк). Как следствие, из теоремы 0.1 получается результат Болтхаузена [42].
После доказательства ЦПТ естественно возникает вопрос о получении плотности процессов частных сумм, индексированных множествами. Глава 1 в основном посвящена изучению вопроса о плотности (теорема 1.1) процессов, индексированных множествами. В разделе 1.2 рассматриваются сглаженные процессы частных сумм, которые определяются на подклассе Л всех борелевских подмножеств единичного куба Id следующим образом:
Zn{A) = n~d'2 bnj{A)Xh А е Л, n G N, (6) jezd где для j = (ju . Jd) единичный куб Cj = (л - 1 ,ji] x ••• (jd - 1 ,jd]} bnj(A) = \{nA)C\Cj\ и nA = {nx, x £ А}. Заметим, что в (6) лишь конечное число слагаемых отлично от нуля.
Множитель bnj(A) в соотношении (6) введён для того, чтобы при доказательстве плотности процессов {Zn(A) : А £ Л} не возникали граничные условия на множества из Л (например, их гладкость). Как было замечено в [29], когда Л - класс Вапника-Червоненкиса ([30]), для справедливости принципа инвариантности множители bnj(A) в (6) можно не писать. В некоторых приложениях процессы nd/2Zn(A) рассматриваются как случайные меры множества А. А именно, если каждому j-ому узлу решетки приписать случайную массу Xj, то мера множества А будет определяться как сглаженная сумма масс узлов решетки, попавших в расширение пА.
Отметим, что, когда d, = 1 и Л - класс множеств (0,t],t £ [0,1], траектории процесса Zn(A) представляют собой классические непрерывные случайные ломаные с узлами (г'/n, Si/^/n), г = 0,., п. Сходимость распределений этих случайных ломаных к мере Винера впервые была установлена Донскером для независимых одинаково распределённых случайных величин.
Пусть Л - замыкание Л по псевдометрике di(A, В) = Д А, В 6 Л. Скажем, что имеет место слабый принцип инвариантности, если процессы Zn сходятся по распределению в пространстве С (Л) к процессу y/rjZ при п оо, где Z - стандартное броуновское движение, не зависящее от случайной величины г). Под упомянутым броуновским движением Z понимается центрированный гауссовский процесс с траекториями из С(Л) такой, что Е(Z(A)Z(B)) = для А, В £ Л. Существование процесса Z установлено в [6G] при условии сходимости (которое является в определённом смысле оптимальным) следующего энтропийного интеграла
J (е~г log N(e, Л, dLj) ^ ds < оо, (7) где N{e,A,di) ~ наименьшее число открытых шаров радиуса £ (в псевдометрике di), образующих покрытие семейства Л. При введённом выше энтропийном условии (7) видим, что Л - компакт и, следовательно, С {Л) -сепарабелыюе пространство.
Асимптотическое поведение процессов {Zn(A) : А £ Л} исследовалось в ряде работ, см., например, [10, 31, 55]. При этом основные мотивы изучения подобного рода объектов связаны с вопросами возникающими при изучении гиббсовских случайных полей.
В случае независимых случайных полей установление предельных соотношений для процессов, индексированных множествами связано, прежде всего, с именами К. Александра, Р. Пайка и Р. Басса, см. [29, 31, 35, 37]. В работе [36] получены закон повторного логарифма и принцип инвариантности для схемы серий независимых случайных величин. Для этого используется результат Скорохода о вложении любой последовательности независимых центрированных случайных величин в броуновское движение. Необходимые и достаточные условия для справедливости принципа инвариантности, когда Л - класс Вапника-Червоненкиса, найдены в [29].
С точки зрения дальнейшего обобщения (см., например, теорему 1.1 и [56]) на случай полей с перешиванием ключевыми являются методы, применяемые в работах [31, 35]. Доказательство плотности семейства распределений Zn основано на установлении сходимости по вероятности к нулю верхней грани абсолютных значений процессов Zn(A) по всем множествам А малой меры, принадлежащих определённому классу. Для этого сначала нужно воспользоваться ограниченностью вполне класса множеств, которому принадлежит А, чтобы построить конечную е-сеть этого класса множеств. Таким образом верхняя грань сведётся к сумме максимумов по конечным наборам множеств из е-сети и верхней грани по всем разностям множеств А и их лучшим приближением из е-сети. Каждое из полученных слагаемых оценивается с помощью неравенства Бернштейна. Вкратце описанный метод, называемый методом метрической энтропии (metric entropy) или цепной реконструкции (chaining), был использован в работе [35] при получении плотности распределений и доказательства функционального закона повторного логарифма для процессов Zn. Основная идея доказательства плотности в статье [31] состоит в приближении исходного процесса некоторым гауссовским процессом так, чтобы их разность, в определённом смысле, была мала. Для этого используются симметризация, усечение, аппроксимация процессами, принимающих дискретные значения, и неравенство Бернштейна. Главное отличие методов получения плотности процессов {Zn(A) : A G Л} в работах [31, 35] состоит в том, что в [35] процедура усечения величин Xj проводится на каждом этапе цепной реконструкции, тогда как в [31] процедура усечения проводится один раз в самом начале доказательства. Отметим, что результаты работ [31, 35] потребовали привлечения энтропийного условия с включением, которое является более ограничительным, чем (7). А именно, предполагается сходимость интеграла
J (е-1Н{£)у2 de < оо, (8) где Я(е) = logiVj(£, Л, cIl) и Ni(e,A,db) обозначает минимальное число к ^ 1, при котором существуют измеримые множества 1 ^ г ^ к такие, что для каждого A G А найдётся некоторое г, при котором \Af] \ а\1]\ ^ £ и А\1] С А С Af\Заметим, что N{e,A,d£) ^ поэтому условие (8) влечёт (7).
Как показано в диссертации [77], ограничение на энтропию с включением класса А в (8) существенно для справедливости принципа инвариантности, устанавливаемого в работах [31, 35] для независимых случайных полей из L2. А именно, при замене условия (8) на (7) семейство процессов Zn перестаёт быть плотным в С (А).
В работе [56] для строго стационарных центрированных случайных полей X, зависимость которых выражается в терминах одного из коэффициентов q;ii00, <£>i)00 или v?2,oo> получена плотность семейства {Zn{A) : А е А} в трёх ситуациях:
1) класс Л состоит из параллелепипедов [0,t] = [0,ti] х . [0,^], t 6 Id, и E|Xo|p < со при некотором р > 2;
2) класс Л удовлетворяет энтропийному условию (7) и Хо - ограниченная величина;
3) для класса Л выполнено энтропийное условие (8) и ЕХд < оо.
Плотность семейства {Zn(A) : A G Л}, установленная в [56], вместе с предыдущим результатом [55] о сходимости конечномерных распределений процессов 5(ГП) и предположением о регулярности множеств класса Л приводят, в силу фундаментальной теоремы Прохорова, к принципу инвариантности. Как было показано в работе [78], из условий теоремы 0.1 не следует плотность. А именно, для любого р > 0 построены строго стационарное центрированное случайное поле X такое, что Е|-Х"о|р < оо и ф 0}) = 0, а также семейство множеств Л, удовлетворяющее (8), для которых плотность семейства распределений {Zn(A) : А £ Л} не имеет места. Таким образом, для установления плотности процессов Zn условие (5) должно быть усилено. Сформулируем основные результаты статьи [56].
Теорема 0.2([56]). Пусть X - строго стационарное поле центрированных случайных величин. Предположим, что Е|Хо|р < оо при некотором р> 2 и существует в > 0 такое, что сходится ряд
Voo" W<00. (9)
Тогда семейство процессов {Zn([0, £]):££ Id} плотно в пространстве непрерывных функций, заданных на {[0,£] : t Е Id}.
Согласно результату [14, 74], условие Е|Х0|Р < oo, р > 2, по существу, когда зависимость поля выражается в терминах перемешивания. Действительно, в [74] дан пример сильно перемешивающейся стационарной последовательности случайных величин с произвольно быстрым убыванием коэффициентов перемешивания такой, что ЕXq < oo и ЦПТ не имеет места. В случае d = 1 в работе [59] установлено, что теорема 0.2 останется верной, если условие (9) ослабить, положив в = 0.
Теорема 0.3([5б]). Пусть X - строго стационарное поле, состоящее из ограниченных и центрированных случайных величин. Пусть класс множеств Л удовлетворяет энтропийному условию (7). Предположим также, что сходится ряд
00
X^"Vl,oo(fc)<00. (10) к= 1
Тогда семейство процессов {Zn(A) : A Е Л} плотно в пространстве С (А).
В [77] установлено, что теорема 0.3 перестаёт быть справедливой, если предположение об ограниченности величин X; заменить на существование абсолютных моментов любого порядка.
Теорема 0.4([56]). Пусть X - строго стационарное центрированное поле. Пусть энтропия с включением семейства А удовлетворяет соотношению (8). Предположим, кроме того, что справедливо одно из следующих условий: i) ех04 < oo и Efcxj^'WM < ii) Е|Хо|р < оо при некотором р> 4 и <£>2,оо(&) = 0(к~
Тогда семейство процессов {Zn(A) : А Е А] плотно в пространстве С(А).
Вопрос о том, насколько близки предполагаемые в теореме 0.4 условия зависимости к оптимальным, остаётся открытым.
В разделе 1.2 (см. также [24]) доказана плотность семейства процессов {Zn{A) : А Е Л} для рандомизированных случайных полей, зависимость которых определяется в терминах коэффициентов /3i)jn, т £ N. Процедура рандомизации поля X состоит в его замене на поле еХ, где е - поле Радемахера, не зависящее от X. Напомним, что поле Радемахера е определяется как поле, образованное независимыми случайными величинами, принимающими значения 1 и —1 с равными вероятностями. Таким образом, для класса рандомизированных полей в теореме 1.1 удалось получить плотность процессов Zn при ограничениях, требующих существования некоторого абсолютного момента строго больше второго порядка, условии перемешивания более слабом, чем в теореме 0.4, и условии на энтропию семейства А близком к (8). В случае решётчатого поля условия зависимости могут быть сформулированы в терминах коэффициентов перемешивания <*i,mj ш 6 N. Заметим, что в случае рандомизированных случайных полей выполнено равенство К(Хо\сг{Хк, к ф 0}) = 0, которое в случае стационарного поля X влечёт сходимость конечномерных распределений однако, как было сказано выше, не гарантирует плотность семейства Zn. Также важно отметить, что в теореме 1.1 нами не предполагается строгая стационарность поля X, а требуется лишь одинаковая распределённость элементов случайного поля X. Для доказательства упомянутого результата метод работы [31] обобщается на слабо зависимые поля с помощью, так называемой, техники реконструкции (см., например, [62, §1.2.2]), основанной на результате статьи [39]. Кроме того, применяются различные усечения исходных величин, должные аппроксимации элементов класса Л, а также различные максимальные неравенства.
Наряду с вопросом об оптимальности первого индекса в коэффициенте перемешивания <^2,оо для справедливости результата о плотности процессов Zn, возникает также вопрос об оптимальности оо во втором индексе этого коэффициента перемешивания. Ответ на этот вопрос содержится в разделе 1.3 (см. также [23]). Оказывается (теорема 1.7), что процессы частных сумм, индексированные параллелепипедами [0, £ Id, плотны в пространстве D[0, l]d при существовании абсолютных моментов порядка строго большего 2d и условии перемешивания, выраженном только в терминах коэффициента a2d,2d- Иначе говоря, учитывается зависимость между двумя а-алгебрами, порождёнными лишь конечными наборами случайных величин. Упомянутые процессы частных сумм, индексированные параллелепипедами, определяются следующим равенством
Zn(t)=n-d/2S{nUtDZd), где t = (гь ., td) е Id, П( = (0,*i]x,.,x (О, td]. В теореме 0.2 для установления аналогичного результата налагаются ограничения на коэффициент а^осм т0 есть учитывается <т-алгебра, образованная бесконечным набором случайных величин. При определении процессов Zn(t) мы не использовали сглаживание в силу того, что индексирующие множества £ образуют класс Вапника-Червоненкиса, и в этом случае, как было замечено в [29], для справедливости плотности сглаживание не требуется. Результат теоремы 1.6 о плотности процессов Zn(t) получен без предположения о стационарности даже одномерных распределений поля X. В теореме 1.7 устанавливается результат аналогичный теореме 1.6 при условиях зависимости, формулируемых в виде неравенств для ковариаций степеней порядка 2d+2 исходных величин. Для установления этого результата о плотности распределений используется техника, аналогичная [51], где доказан принцип инвариантности для положительно зависимых величин, а также моментные неравенства для сумм зависимых мультииндексированных величин, полученные в [1] и [62].
Теория суммирования случайных процессов и полей находит широкое применение при изучении асимптотического поведения статистических оценок различных величин. В Главе 2 исследуются непараметрические оценки, они не требуют такой точной спецификации статистической модели, как в параметрическом случае, однако, как правило, имеют более медленную скорость сходимости. Обратимся к классической задаче оценивания неизвестной плотности наблюдений. Пусть данные Х\,., Хп — независимые одинаково распределённые случайные векторы со значениями в имеющие общую плотность распределения р. Оценка плотности есть последовательность pi, р2) • • ■, где рп{х) = рп(х,Х1,. ,Хп) является действительнозначной борелевской функцией своих аргументов при каждом п и плотностью на при фиксированных п, Х\,., Хп.
Для определения степени аппроксимации обычно (см. [15]) выбирают L1-расстояние Jn = JRd \pn(z) —p(z)\dz, выбор которого мотивируется тем, что оно инвариантно относительно монотонных преобразований координатных осей и всегда определено.
Все оценки плотности основаны на теореме Лебега о плотностях (см., например, [21, с.387]): для почти всех х, где 0(х, h) - замкнутый шар радиуса h с центром в точке х. Выражение под знаком предела в левой части (11) равно
И)
ЦХгеО^к))/\0(x,h)l так что его можно аппроксимировать величиной г=1 где h = hn - последовательность положительных чисел (или последовательность локализующих окон) и К - борелевская функция (ядро), удовлетворяющая условиям К ^ О, fRd K(z) dz = 1. Ядерная оценка (12) плотности была введена Розенблатом и Парзеном ([83, 88]).
Объектами изучения главы 2 данной диссертационной работы будут ядерные и связанные с ними оценки.
Результат работы [60] состоит в том, что для ядерной оценки все типы сходимости Jn к 0 эквивалентны между собой и равносильны следующим соотношениям на параметр сглаживания h : lim hn = 0, lim n(hn)d = оо. (13) n-> ОО П-Л ОО
Таким образом, для того чтобы ядерная оценка обладала хорошими асимптотическими свойствами, естественным представляется выбор последовательности локализующих окон, исходя из условия (13).
В работе [61] показано, что ни для какой сколь угодно сложной оценки величина Е(Jn) не может убывать с некоторой заданной скоростью при любых р.
Асимптотическое разложение ошибки Е( Jn) (при d = 1), найденное в [15, теорема 5.1] для некоторого класса плотностей с хорошими свойствами, влечёт убывание величины Е(Jn) со скоростью п-2/5, если последовательность hn выбрать пропорциональной п-1/5.
В случае ядерной оценки при выборе ядра Бартлетта (см. [34]) 3(1 - х2)/4ЩхЫ1 (для которого fRK2(z)dz = 3/5 и fRz2K(z)dz = 1/5) справедливо
К = fy{z)\dz)2"n-VS. (14)
К сожалению, последовательность hn, определяемая в (14) представляет в основном теоретический интерес, поскольку содержит в качестве множителей неизвестную плотность р. Однако найденное асимптотическое разложение величины Е(Jn) обосновывает выбор последовательности локализующих окон пропорциональной п-1/5. В дальнейшем при изучении асимптотических свойств ядерных оценок помимо условий (13) нами будет предполагаться ещё и условие lim^oo nh„ < оо.
На практике уместно использовать, так называемые, адаптивные оценки (см [15, с. 155]), когда параметр сглаживания является функцией от данных, то есть hn = h(n,Xi,. ,Хп). Зависимость от х не допускается, так как в этом случае могут получаться оценки, не являющиеся плотностями в Вопрос практического выбора оптимальной последовательности hn весьма тонок и не разрешим для всех типов плотностей. Поэтому при изучении асимптотического поведения различных ядерных оценок часто не указывается конкретный выбор hn, а предполагается, что почти наверное ciтп ^ hn ^ С2Тп, где 0 < с\ ^ С2 < оо и тп - детерминированная числовая последовательность, причём lim тп + (птп)~1 = 0 и lim пт,% < оо. тг—»оо п-Юо
В разделе 2.1 устанавливается асимптотическая нормальность, так называемой, регрессионной ядерной оценки, возникающей при изучении следующей модели. Пусть Е = {(Xj, Yi), i 6 Щ - строго стационарная последовательность случайных элементов, где Х( - векторы в а принимают значения в R. Пусть последовательность S удовлетворяет регрессии
У{ = т(Х{) + е(, (15) где m - неизвестная функция, {Ег-, г Е Z} - последовательность центрированных случайных величин, не зависящая от {Xi,i Е Z}. Требуется построить асимптотически нормальную оценку т функции т. Как нетрудно видеть, из равенства (15) следует, что т(х) = = х) для всех х 6 Rd и г Е Z. В работах Надарая [82] и Ватсона [97] независимо была предложена следующая ядерная оценка функции т :
Pn,h[X) где г. i=i
Эмпирический процесс Надарая-Ватсона является широко изучаемым объектом, см., напр., [43], [84], [99]. Одной из причин этого изучения является то, что многие методы финансовой математики, такие как оценивание опционов или управление портфелем, построены на дискретных непараметрических моделях со стохастической волатильностыо. Пусть St обозначает цену акции в момент времени t(t = 1,., п). Подход Блэка-Шоулса к оценке опционов с дискретным временем основан (см. [72]) на моделировании log St винеровским процессом со сносом рь и волатильностыо сг* :
Rt = ii + (TtVt и log(cr() = m(log(^i)) + ?7t, (17) где Rt = \og{St/St-i) - возвраты, yt - независимые нормально распределённые величины, т - произвольная функция, от которой требуется только определённая гладкость, и r)t обозначает независимые одинаково распределённые центрированные случайные величины. Заметим, что модель (17) является непараметрическим обобщением CARV-модели, введённой в [93]. В современной литературе по финансовой математике (см., например, [28, 22]) популярна модель, в которой St = exp(H/7t), где Wt - броуновское движение, заданное на [0, oo), jt ~ случайная замена времени. Покажем связь этой модели с моделью, определённой в (17). Первое равенство в (17) является (в случае /х = 0) дискретной версией дифференциального уравнения (записанного в интегральном виде)
St = ехр [J at dW^j, где интеграл понимается в смысле Ито и предполагается интегрируемость процесса at. Согласно [22, следствие 8.5.3] процесс as dWs, где fit = inf{s : ^a2(ijj)dr > £}, является броуновским движением. Кроме того, 7(fi(t,uj),uj) = t, что проясняет связь упомянутых выше моделей.
Для предсказания развития возвратов Rt необходимо построить оценку функции т на основе наблюдаемых прошлых данных - цен актива St или возвратов Rt, которые связаны с at соотношением (17). Использование непараметрических оценок функции т обсуждается в [69]. Следуя [89], введем обозначения
6 = 1/2 log (Rt - ц)2 - E(log М) and et = log \yt\ - E(log \yt\). Тогда видим = m(&i - et-1) + Vt + £t- (18)
Взяв условное математическое ожидание в равенстве (18) относительно события {log(crf2) = х}, жЕМ, получаем т(х) = E(ff|&i — et~\ = х). В предыдущих обозначениях (X;, Y;) == (& —
Процесс mnth сводится к суммированию схемы серий случайных величин, поэтому изучение предельных свойств оценки Надарая-Ватсона, введённой в (16) связано с установлением ЦПТ для схемы серий. В работе [100] для последовательности (X, Y), образованной из независимых величин, используя ЦПТ Ляпунова, получена асимптотическая нормальность оценки
Надарая-Ватсона. Преимущество (в сравнении с результатом [44]) подхода, который используется в статье [100], состоит в том, что требуется существование абсолютного момента строго больше второго порядка и налагаются лишь локальные в точке х ограничения (такие как дифференцируемость) на функции m(z), E(Y2\X = z) и p(z). Однако, как показывает практика, не всегда корректно, например, при моделировании фондового рынка предполагать независимость последовательности S. В теореме 2.1 получена, в частности, асимптотическая нормальность mn,h для последовательности S, зависимость которой выражена в терминах коэффициента ai)00-Кроме того, используются предположения лишь о локальном поведении регрессионной функции в окрестности точки х. Показано, каким образом следует выбирать последовательность локализующих окон hn в соответствии с коэффициентами перемешивания, чтобы ядерная оценка имела хорошие вероятностные свойства.
Во многих прикладных задачах (например, при оценке величины риска) требуется оценка регрессионной функции т не только в произвольной точке х, но и в той точке в, где достигается её максимум. Кроме того, представляет интерес непараметрическая оценка величины в = argmax{m(:r), х е /}, аргумента максимума функции т на некотором отрезке I, где он существует и единственен. Изучению этого вопроса посвящён разделе 2.3.
В качестве оценки в берётся любая последовательность вп)/1, на которой достигается максимум функции тП)/1(гс) на отрезке I. В силу непрерывности ядра К и компактности множества I оценка вп^ определена корректно. Последовательность mn)/t(0n;/t) будет использоваться как оценка величины т(9). Естественно возникает вопрос об измеримости величин 0п,/t. Вообще говоря, эти величины не обязаны быть измеримыми. В [73] был предложен метод построения последовательности измеримых величин вп удовлетворяющих равенству rhn,h(Qn,h) = . Однако, можно поступить иначе. В диссертации часто рассматриваются функции, заданные на Г2, которые не измеримы. Чтобы не беспокоиться о вопросе измеримости возникающих функций, нужно уточнить понятие слабой сходимости (как это было сделано в [65]). Скажем, что последовательность функций £n : fi —> L слабо сходится к случайной величине £ : Q —L, если для всех ограниченных непрерывных действительнозначных функций ф, заданных на L, где f* ф(Ш = inf{/ фсИ? : ф ^ ф,ф - ^-измерима}.
Описанный выше способ оценивания величин в и т(9) использовался ранее в работе [100], где изучалось асимптотическое поведение оценок 9пь и rhn,k(6n,h) в предположении независимости последовательности наблюдений S. Целью раздела 2.3 является получение асимптотической нормальности оценки en>h и состоятельности оценки тП)/4(0П)/4) при условиях зависимости последовательности S, формулируемых только в терминах коэффициентов (fk,оо, к = 1,2. Кроме того, используются только локальные ограничения в окрестности точки в на поведения функций тир. Допускается, что последовательность hn может быть выбрана адаптивным образом, то есть иметь вид hn = h(n, Si,., En).
Установление ЦПТ для оценки вП}н (теорма 2.6) потребовало доказательства пяти вспомогательных теорем и двух лемм. В этих вспомогательных утверждениях получены, в частности, асимптотическая нормальность ядерной оценки производных регрессионной функции и состоятельность оченки максимума регрессионной функции.
Отметим, что существуют другие способы оценивания в, например, в ра/Ч /1\ хч боте [44] была предложена оценка вщь как решение уравнения fhn h(0n,h) = 0. Однако, в этом случае для получения состоятельности потребовались предположения о существовании и непрерывности первых производных функций тир на всей прямой.
Естественное обобщение оценки Надарая-Ватсона приводит к условным эмпирическим процессам. Пусть, как и ранее, S = {(Х{, Yi), i 6 Z} - строго стационарная последовательность случайных элементов, Xi векторы в Rd, а Yi теперь принимают значения в польском пространстве X. Введём регрессионную функцию F(f \х) = E(f{Y)\X = ж), здесь / входит в некоторый класс измеримых функций, отображающих X в R. Для статистической оценки F(f\x), следуя Надарая-Ватсону (см., например, [84]), используют величины ад») = £ тк pv^) /±к , do) i=1 ^ ' / i=1 * ' где формально полагают 0/0 = 0, ядро К(-) ^ 0 задано на Md, h > 0 -параметр сглаживания, / € Э', х 6 Md и п € N.
Семейство процессов (19) может применяться для оценивания величин, которые представляют интерес с практической точки зрения: supE(yirec|^ = х), supE(У21уес - E2{YIy&c)\X = х) . сее сее
Эти величины описывают, соответственно, среднее значение и среднеквадратичное отклонение случайной величины Y при попадании в наиболее вероятное множество из класса измеримых множеств С при условии X = х.
Заметим, что условная эмпирическая мера получается, если в определении (19) величины Fn(f\x) положить / = 1с, где множество С принадлежит некоторому классу С измеримых множеств. В этом случае мы приходим к оценке условной меры Р(У £ С\Х = х).
Легко усматривается сходство оценки Fn(f\x) с обычным эмпирическим процессом Fn(f) = 1/гг XZiLi /№)> установлению предельных закономерностей которого для зависимых величин уделено большое место в статистической литературе, см., например, [32, 58, 64, 79]. В недавней статье [58] установлен принцип инвариантности для эмпирических процессов в пространстве 100 (Э1"), состоящем из функционалов v, заданных на И, таких, что ||z/||j = sup^ey |^(/)| < оо. При этом условие на перемешивание случайных величин {Xi, г Е Z} выражено в терминах коэффициента <р2,00, в отличие от предшествующих работ, где вовлекалась зависимость двух бесконечных наборов случайных величин, когда расстояние между ними растёт. Доказательство плотности семейства {л/n(Fn(f) — Щ(Хо)), f основано на технике цепной реконструкции, предложенной в работе [64], и использовании новых максимальных неравенств.
Основным объектом изучения в разделах 2.1 и 2.2 является семейство процессов {vn(f), f Е J}, где un(f\x) = yJnhi{Fn{f\x) - F{f\x)). (20)
Это семейство исследовалось в ряде работ (см., например, [92, 75, 40]) для случая, когда 2f - некоторый класс множеств и S - последовательность независимых одинаково распределённых случайных величин. Изучение условных эмпирических процессов представляет интерес, в частности, при описании множеств уровней условных распределений. Напомним (см. [84]), для a G [0,1] множество Ме{а\х) G С называется условным MV-множеством из семейства С соответствующее уровню а, если
Ме(а\х) G argmax{|C| : С G е, F(lc\x) > а}. (21)
Аналогично определяются условные множества Ме(а\х), если в формуле (21) величину F{-\x) заменить на Fn(-\x). Следующий процесс а ^п(\Ме(а\х)\ - |Ме(а|*)|) может рассматриваться как условная версия обобщённого квантильного процесса, введённого в [68]. В работе [84] для перемешивающихся последовательностей Е получен результат, показывающий скорость сходимости по вероятности этого процесса (так называемая, обобщённая аппроксимация Бахадура-Кифера). Установление упомянутого результата потребовало изучение асимптотического поведения процессов un(Ic) в пространстве /°°(С), состоящем из функционалов и, заданных на С, таких, что |Н|е = supC€e \v(Jc)\ < оо. При доказательстве плотности процессов vn возникают условия на энтропию семейства б.
В разделах 2.1 и 2.2 (см. [25, 27]) получены сходимость конечномерных распределений (теорема 2.1) и плотность семейства (теорема 2.5) {vn{f\x),f £ cF} в пространстве При этом зависимость между любым набором величин {Е^,., E,-t} (здесь 0 < n ^ ц < • • • < if.) и а-алгеброй cr{Ei,i ^ 0} описывается коэффициентами а^)00(п) и <Pk,oo{n), введёнными нами ранее. Таким образом, в сравнении с работой [84] рассматривается более широкий класс индексирующих функций и ослабляются условия на перемешивание исходных данных 5. Налагаемые условия имеют следующую особенность: чем слабее зависимы наблюдения Е, тем сложнее может быть устроен класс индексирующих финкций Э'.
В последнем разделе 2.4 изучается асимптотическое поведение (теорема 2.10), так называемой, локально полиномиальной оценки (изучавшейся ранее в [70, 91]), частным случаем которой является оценка Надарая-Ватсона. Основное отличие упомянутых оценок состоит в том, что локально полиномиальная оценка позволяет учесть не только значения регрессионной функции m(z), но и её поведение (например, выпуклость) в окрестности точки х.
Структура работы
Работа, объёмом 100 страниц, состоит из введения, двух глав и списка литературы, насчитывающего 100 наименований.
Первая глава содержит три раздела. В разделе 1.1 для полноты изложения, следуя работе [55], воспроизводится доказательство сходимости конечномерных распределений процессов частных сумм Zn. При этом, в условиях зависимости фигурируют только коэффициенты ai)00. В разделе 1.2 с помощью техники реконструкции и метода, предложенном в [31], доказывается плотность рандомизированных процессов частных сумм {Zn(A), £ А} при условии зависимости, выраженном только в терминах коэффициентов оо- Таким образом, в случае симметризованных полей используются менее ограничительные условия, чем в работе [56], где для доказательства аналогичного результата были вовлечены коэффициенты <^2,оо- В разделе 1.3 устанавливается плотность процессов частных сумм в пространстве D[О, If, когда зависимость поля описывается в терминах коэффициентов ®2d,2d- Этот результат показывает неоптимальность равенства бесконечности второго индекса в коэффициенте ak,i при описании зависимости поля для справедливости плотности семейства процессов {Zn(t),t G Id}.
Вторая глава состоит из четырёх параграфов и, главным образом, посвящена изучению предельного поведения ядерных оценок. В разделе 2.1 (теорема 2.1) устанавливается сходимость конечномерных распределений условных эмпирических процессов \x),f £ 9^}, а в разделе 2.2 (теорема 2.5) доказывается плотность этого семейства процессов. При этом, зависимость поля описывается в терминах коэффициентов перемешивания <*1,оо и <£2,оо> соответственно. Таким образом, полученные результаты обобщают теоремы 2.2 и 2.3 из [84]. В разделе 2.3 изучаются (теорема 2.7 и 2.8) предельные свойства ядерных оценок производных от функций р(х) и т(х)р(х) и устанавливается (теорема 2.6) асимптотическая нормальность оценки argma х{т(х),х El} в случае его существования и единственности на отрезке / С К. В формулируемых условиях зависимости последовательности Н используются только коэффициенты у>2,оо- Эти результаты обобщают недавние результаты работ [99, 100]. Последний раздел 2.4 посвящён использованию методов, развитых в предыдущем разделе 2.1, для получения асимптотической нормальности локально полиномиальной оценки, когда зависимость последовательности S описывается только коэффициентами o;ii00.
Основные результаты диссертации опубликованы в работах автора [24, 23, 25, 26, 27].
Результаты диссертации докладывались автором на Всероссийском симпозиуме по прикладной и промышленной математике (Сочи, 2004 г.), конференции молодых учёных мехмата (МГУ, 2003), на Большом семинаре кафедры теории вероятностей мехмата МГУ (руков. член-корр. РАН, профессор А. Н. Ширяев) в 2006 г., а также на научном семинаре „Асимптотический анализ случайных процессов и полей" (руков. профессора А. В. Булинский, В. И. Питербарг).
Автор благодарен своему научному руководителю профессору А. В. Бу-линскому за постановку задач, постоянное внимание к работе и ценные советы.
1. Бахтин Ю.Ю., Булинский А. В. Моментные неравенства для сумм зависимых мультииндексированных случайных величин - Фунд. и прикл. матем., 1997, Т. 3, № 4, с. 1101-1108.
2. Биллигсли П. Сходимость вероятностных мер Перев. с англ. -М.: Наука, 1977.
3. Булинский А. В. Предельные теоремы для случайных процессов и полей Изд-во МГУ, 1981.
4. Булинский А. В. О различных условиях перемешивания и асимптотическая нормальность случайных полей ДАН СССР, 1988, Т. 299, № 4, с. 785-789.
5. Булинский А. В. Предельные теоремы в условиях слабой зависимости -Изд-во МГУ, 1989.
6. Булинский А. В. Скорость сходимости в центральной предельной теореме для полей ассоциированных случайных величин Теория веро-ятн. и её примен, 1995, Т. 40, № 1, с. 165-174.
7. Булинский А. В. Асимптотическая гауссовость квазиассоциированных векторных случайных полей Обозрения прикладной и промышленной математики, 2000, Т. 7, № 2.
8. Булинский А. В., Журбенко И. Центральная предельная теорема для случайных полей ДАН СССР, 1976, Т. 226, с. 23-25.
9. Булинский А. В., Журбенко И. Центральная предельная теорема для аддитивных случайных функций Теория вероятн. и её примен., 1976, Т. 21, № 4, с. 687-697.
10. Георгий X. О. Гибсовские меры и фазовые переходы Перев. с англ. -М.:Мир, 1992.
11. Гордин М. И. Центральная предельная теорема для стационарных процессов ДАН СССР, 1969, № 188, с. 739-741.
12. Давыдов Ю. А. Условия перемешивания для цепей Маркова Теория вероят. и её примен., 1973, Т. 18, № 4, с. 321-338.
13. Деврой Л., Дъерфи Л. Непараметрическое оценивание плотности. L1-подход Перев. с англ. - М.:Мир, 1988.
14. Добрушин Р. Л. Описание случайного поля при помощи условных вероятностей и условия его регулярности Теория вероятн. и её примен., 1968, Т. 13, № 2, с. 201-229.
15. Ибрагимов И. А. Центральная предельная теорема для одного класса зависимых случайных величин Теория вероят. и её примен., 1963, Т. 8, № 1, с.89-94.
16. Ибрагимов И. А., Лииник Ю. В. Независимые и стационарно связанные величины М.:Наука, 1965.
17. Ибрагимов И. А., Солее В. Н. Условия регулярности стационарного гауссовского процесса ДАН СССР, 1986, № 185, с. 509-512.
18. Колмогоров А. И., Тихомиров В.М. ^-энтропия и ^-ёмкость множеств в функциональных пространствах УМН, 1959, Т. 14, № 2, с. 3-86.
19. Колмогоров А. И., Фомин С. В. Элементы теории функций и функционального анализа М.гНаука, 1989.
20. Оксендалъ Б. Стохастические дифференциальные уравнения. Введение в теорию и приложения Перев. с англ. - М.:Мир, 2003.
21. Порывай Д. В. Плотность в подпространстве D0, l]d некоторого класса процессов частных сумм Вестн. Моск. Ун-та сер. 1, Математика. Механика, 2003, № 6, с. 3-6.
22. Bulinski A. V., Keane M. S. Invariance principle for associated random fields J. Math. Sci., 1996, V. 81, № 5, p.2905-2911.
23. Bulinski A. V., Shashkin A. P. Rates in the central limit theorem for the sums of dependent multiindexed random vectors Journal of Math. Sciences, 2004, V. 122, № 4. p. 3343-3358.
24. Bulinski A., Suquet C. Normal approximation for quasi-associated random fields Statist. Probab. Let., 2001, V. 54, p. 215-226.
25. Coulon-Prieur C., Doukhan P. A triangular central limit theorem under a new weak dependence condition Statist. Probab. Letters, 2000, № 47, p. 61-68.
26. Dedecker J. A central limit theorem for stationary random fields Probab. Theor. Rel. Fields, 1998, V. 110, p. 397-426.
27. Dedecker J. Exponential inequalities and functional central limit theorems for random fields ESAIM: Probability and Statistics, 2001, V. 5, p.77-104.
28. Dedecker J., Doukhan P. A new weak covariance inequality and applications Stoch. Proc. Appl., 2003, V. 106, № 1, p. 63-80.
29. Dedecker J., Louhichi S. Maximal inequalities and empirical central limit theorems Empirical Process Techniques for Dependent Data, 2002, p. 137-159, Dehling Mikosch and Sorensen editors, Birkhaunser.
30. Dedecker J., Rio E. On the functional central limit theorem for stationary processes Ann. Inst. Henri Ротсагё, Probabilites et Statistiques, 2000, № 36, V. 1, p. 1-34.
31. Devroye L. The equivalence of weak, strong and complete convergence in L1 for kernel density estimates Ann. Statist., 1983, V. 11, p. 896-904.
32. Devroye L. On arbitrary slow rates of global convergence in density estimation Z. Wahr. verw. Geb., 1983, V. 62, p. 475-483.
33. Doukhan P. Mixing. Properties and Examples Lecture Notes in Statist., 85, New York: Springer-Verlag, 1994.
34. Doukhan P., Massart P., Rio E. The functional central limit theorem for strongly mixing processes Annales de l'lnstitut Henri Poincare Probabilities et Statistiques, 1994, № 30, p. 63-82.
35. Doukhan PMassart P., Rio E. Invariance principles for absolutely-regular empirical processes Annales de l'lnstitut Henri Poincare Probabilities et Statistiques, 1995, № 31, p. 393-427.
36. Dudley R. M. Weak convergence of probabilities on nonseparable metric spaces and Empirical measures on Euclidean spaces Illionois J. Math., 1966, V. 10, p. 109-126.
37. Dudley R.M. Sample functions of the Gaussian process Ann. Probab., 1973, V. 1, p. 66-103.
38. Dudley R. M. Metric entropy of some classes of sets with differentiable boundaries J.Approx.Theory, 1974, V.10, p. 227-236.
39. Einmahl H. J., Mason D. M. Generalized quantile processes Ann. Statist., 1992, V. 20, p. 1062-1078.
40. Fan J., Truong Y. K. Nonparametric regression with errors in variables -Ann. Statist., 1993, № 21, p. 1900-1925.
41. Fan J. Local polynomial estimation of regression functions for mixing processes Scand, J. Stat., 1997, № 24, p. 165-179.
42. Fernique R. V. Regularit£ des trajectoires des functions aleatoires gaussiennes Lecture Notes in Math., 1974, V. 480, p.1-96.
43. Franke J., Hardle W., Kreiss J.-P., Mercurio D. Nonparametric Estimation in a Stochastic Volatility Model Recent Advances and Trends in Nonparametric Statistics, Eds. Akritas M.G., Politis D.N. Elsevier, 2003, p. 303-312.
44. Grund ВHall P. On the minimisation of If error in mode estimation -Ann.Statist., 1995, V. 23, p. 2264-2284.
45. Herrndorf N. Stationary strongly mixing sequences not satisfying the central limit theorem Ann. Probab., 1983, V. 11, № 3, p, 809-813.
46. Horvath L. Asymptotics of conditional empirical processes J. Multivariate Anal., 1988, V. 26, p. 184-206.
47. Ledoux M., Talagrand M. Probability in Banach Spaces — Springer, New York, 1991.
48. Machkouri M. El. Thdoremes limite pour les champs et les suites stationnaires de variables aleatoires reelles These de doctorat de l'Universite de Rouen, 2002.
49. Machkouri M.El, Volny D. Contre-exemple dans le theoreme central limite fonctionnel pour les champs aleatoires reels Annales de PIHP, 2003, V. 2, p. 325-337,
50. Massart P. Rates of convergence in the central limit theorem for empirical processes. Geometrical and statistical aspects of probability in Banach spaces Lecture Notes in Math., 1986, V. 1193, p. 73-109.
51. Moricz F. A general moment inequality for the maximum of the rectangular partial sums of multiple series Acta math. Acad. sci. hung., 1983, V. 41, № 3-4, p. 337-346.
52. Miiller H. G. Adaptive nonparametric peak estimation Ann. Statist., V.17, p.1053-1069.
53. Nadaraya E. A. On estimating regression Theory Prob. Appl., 1964, V.10, p. 186-190.
54. Parzen E. On estimation of a probability density function and mode Ann. Math. Statist., 1962, № 33, p. 1065-1076.
55. Polonik W., Yao Q. Set-indexed conditional empirical and quantile processes based on dependent data J. Multivar. Anal., 2002, N® 80, p. 234-255.
56. Pollard D. Convergence of Stochastic processes New York:Springer, 1984.
57. Pollard D. Empirical Processes: Theory and Applications. NSF-CBMS Regional Conference Series in Probability and Statistics 2. Institute of Mathematical Statistics and American Statistical Association, 1990.
58. Rio E. About the Lindeberg method for strong mixing sequences ESAIM, 1995, V.l, p.35-61.
59. Rosenblatt M. Remarks on some nonparametric estimates of a density function Ann. Math. Stat., 1956, V. 27, p. 832-837.
60. Ziegler K. On nonparametric kernel estimation of the mode of the regression function in the random design model J. Nonpar. Statist., 2002, V. 14, p. 749-774.