Распределение максимального отклонения оценки спектральной плотности с временным сдвигом для последовательностей взаимно независимых и одинаково распределенных случайных величин тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Гулоб Кавираджсингх
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
1993
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
Московский государственный . университет им. Н.В. Ломоносова
На правах рукописи
Гулоб Капирадассиигх
УДК 519.213
РАСПРЕДЕЛЕНИЕ МАКСИМАЛЬНОГО ОТКЛОНЕНИЯ ОЦЕНЮ! СПЕКТРАЛЬНОЙ ПЛОТНОСТИ С ВРЕМЕННЫМ СДВИГОМ ДЛЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ВЗАИМНО НЕЗАВИСИМЫХ И 0ДШ1А-КОВО РАСПРЕДЕЛЕННЫХ СЛУЧАЙНЫХ ВЕЛИЧИИ
( 01.01.05. - Теория вероятностей и математическая статистика )
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
ИОСКВА 1993
Работ* выполнена в лаборатории математической статистики при кафедре математической статистики « случайных процессов
механике - математического факультета Московского государственного университета имени К.В. Ломоносова. Научный руководитель - кандидат физико-математических наук,
старшсй научный сотрудник М.А. Кожевникова Официальные оппоненты : доктор физико-математических наук,
профессор В.Н. Питербарг; кандидат фнэихо-ыатематических наук, старший научный сотрудник И.Г. Нидеккер. Ведучая организация - Московский государственный институт
электроники ж математики.
Задать диссертации состоится _ 1994; г.
в 16 час. 0$ мин. на заседании специализированного совета Д. 053. 05. 04 при Московском государственном университете имени М.В. Ломоносова по адресу : 119899, ГСП, Воробьевы Горы, МГУ, механико-математический факультет, аудитория 16-24.
С диссертацией можно ознакомиться в библиотеке механико-математического факультета МГУ ( Главное здание, 14 этаж ).
Автореферат разослан " " ^(/Ь^ 1993 г.
Ученый секретарь специализированного совета Д. 053. 05. 04 при МГУ, профессор
Т.П. Лукашенко.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ .
Диссертация посвящена изучению вопроса о нахождении распределения максимального отклонения оценки спектральной плотности с временным сдвигом для последовательностей взаимно независимых и одинаково распределенных случайных величин. Актуальность темы.
Работа посвящена исследованию временных зависимостей в выборочных последовательностях, которые используются во многих прикладных исследованиях и обрабатывайте?, на ЭВМ. Например, необходимо проверить является ли остаточная последовательность регрессионной модели последовательностью взаимно независимых и одинаково распределенных случайных величин, чтобы идентифицировать эти модели, такое же исследование надо провести при использовании датчиков псевдослучайных чисел, которые необычайно разнообразно используются в настоящее время. Большинство исследований в этой области связано с проверкой гипотезы о равномерной распределенности на отрезке
[0.1] выборочной последовательности случайных чисел £ (t), t=0,1.....
Наибольшее значение имеет требование отсустсвия временных зависимостей у датчиков псевдослучайных чисел при моделировании процессов, при этом, что он использует идеальный белый шум£Ц). Статистически значимые отличия £ (t) от последовательности Езаимнонезависимых и одинаково распределенных случайных величин будут, очевидно, приводить к ложным выводам относительно исследуемой модели. Вопросы близости последовательности £ (Г.) х белому шуму были изучены до сих пор слабо, потому что, необходимые для такого изучения спектральные методы [1.4] не позволяли использовать достаточно длинные последовательности случайных чисел.
Цель работы. Необходимо установить является ли данная последователь--ность последовательностью взаимно независимых и одинаково распределе-
иных случайных величин на основании асимптотического распределения максимального отклонения оценки спектральной плотности с временным сдвигом. Построить регрессионные модели для экспериментальных данных. Научная новизна. 1.Получено асимптотическое распределение максимального отклонения оценки спектральной плотности с временным сдвигом для последовательности взаимно независимых и одинаково распределенных случайных величин. Более ранние исследования на эту тему касаются периодограммных оценок спектральной плотности, не позволяющих обрабатывать большие (порядка десятка тысяч) выборки и не включающие в себя оценки с временным сдвигом. 2.Построена нелинейная авторегрессионная модель для изменения численности населения в республике Маврикий по данным переписи. Данные были получены в Центральном Статистическом бюро республики. Модель позволит прогнозировать изменение чггленности населения.
Приложения. Полученное асимптотическое распределение используются при построении статистического критерия для проверки требования отсутствия временных зависимостей при анализе остаточных последовательностей. возникающих, например, при построении регрессионных моделей, при анализе псевдослучайных последовательностей и т.д. Апробация работы. Результаты диссертации были поданы в виде доклада на конференцию, посвященную 90-летию со дня рождения академика А. Н. Колмогорова.
Структура и объем диссертации. Работа состоит из введения, двух глав, каждая из которых содержит по три параграфы, списка литературы, включавшего в себя 55 наименований. В каядой главе проставлена своя нумерация математических утвердений. Графики, иллюстрирующие содержания второй главы приведены в приложении. Исходные экспериментальные данные такие приведены в приложении.
СОДЕРЖАНИЕ РАБОТЫ 1. Проверка гипотезы о принадлежности последовательности к белому шуму .
При построении достаточно узких доверительных границ с использованием относительно больших объемов выборки N удобно использовать статистику спектральной плотности 7 (X). полученную осреднением по сдвигу по времени, разбивая при этом выборку длины N на Т отрезков длины М. Другими словами, проводим осреднение периодограммы I (Я) по ее значениям, оцениваемым на Т смежных временных
отрезках длины М. к=1.....Т. так что. статистика 7 (Л) вычисляется
N
по формулам :
1 Т
Г (Х) = - I (А). (1)
N т к-1 м.к
где функция М-1 2
1
I (X) - ----М.к 23Г Н
1X1
<са+(к-1)М)е 1=0
к-1 .Т (2)
называется периодограммой. Для удобства, обозначим
¿(к. Ъ) - ¿и+(к-1)М). (3)
Следовательно, периодограмма I ^(л) и оценка спектральной плотности
7 (X) в диапазоне частот 0 < М < А полностью определяются набором N
дискретных значений в точках Л| « 2ЛД]/М. Дисперсия такоП статистики
2
согласно формуле (Х)соГ Ш будет асимптотически равна
М.к
2 2 6 - ог (ДОс^Г (X) . X/ 0. 1Я.1 ^. где Г(Л) -
N -----
Т
спектральная плотность случайной последовательности. Следовательно, при фиксированном Я. доверительный интервал статистики (1) будет в Т раз уже доверительного интерзала периодограммы (2).Оценка 7 (Я) собирает статистическую закономерность колебаний спектральной плотности.
вычисленной на различных отрезках временного ряда. Дисперсия этой оценки убывает в зависимости от числа временных интервалов Т и. если какое-то колебание в спектре проявляется при каждом к статистически устойчизым образом, то с ростом Т оно становится значимым на любом фиксированном доверительном уровне .
Если случайные числа £(t). t-0.1...... ( Е£ (t)- 0. D £ (t)- 1 )
имеют одинаковые распределения и независимые, то доверительные области для диапазона частот 2i> /Мт ^ Г-1,2...... определяют-
ся на основании асимтотического распределения переменной
sup >ff O^lXlitf
где 7 (Я) - оценка спектральной плотности, определенная в формуле (1): К
Н - постоянная величина, длина отрезков, которые образуются при разбиении выборки объема N на Т частей: Т - целочисленная функция объема выборки N. причем Т—>оо. при N --><»0.
2. Распределение максимального отклонения оценки спектральной плотности, полученной осреднением по сдвигу во времени. Рассматриваемая последовательность взаимно независимых и одинаково распределенных случайных величин ( белый шум ) £(t). t=0,1,... ( Е £ (t) = 0. D £(t) - 1 ).
Спектральная плотность И*) рассматриваемой последовательности постоянна на l-i ,f ].
Условие А. Длина отрезка последовательности М является целочисленной функцией объема выборки N. причем К при N ->°о, и при этом •
м in т
- —> 0. ------> оо.
Н И
2i? а> -1
N
- sup ^
оаш
2it (Я) - 1 N
(4)
Теорема 1. Пусть ¿(1) - последовательность взаимно независимых и одинаково распре зеленных случайных величин . -Тогда для любого - оо < х < имеет место
11т Р {а ( гир ■{? N—>00 м
2íf (Я) -1 N
-Ь ) < х }- ехр(- ехр(-х) ). М
где
-1/2 а - 12 т М/2) М (5)
1/2 -1/2 ь - (2 1п м/2) - (2 т м/2) (1п т м/2 + т гЦ).
м
где Т (X) определена по формуле (1). N - длина выборки. К и Т - це-N
лочисленные функции длины выборки N. удовлетворяющие условию А.
Эта теорема позволяет построить доверительный интервал на уровне значимости с£ оценки спектральной плотности и. таким образом, оценить качество последовательности и ее отклонение от белого шума.
Для каждого фиксированного А.. функция 23» 7" (Я) - 1 пред-
ставляется в виде суммы независимых и одинаково распределенных
случайных величин 1 (X) и члена, который стремится к 0 при N— М. к
т. е.
ЧГ- , 1 -X , 1 т ММ 2
2* г (Д.) - 1 - - г (Я) + — и+м(к-1))-л. (6)
N Т К-1 И, к ТМ ь-о
Где ~ ~
2 М-1 М-1-Г 1ЯГ
г Я) - 2: £(КЛ) £(кД+Т)е . (7)
М, к К ^ >5
а £№Л) определяется в формуле (3). Обозначим
1 £ . 1 Т . М-1 2
и (Я) - - г (Я), г - -- ^ (£ ».к> - 1). (8) N Т к=1 М.к N ТН Ш
Лемма. Если £(С) - последовательность взаимно независимых и одинаково распределенных случайных величин, то при каждом фиксированном ^
моменты случайных величин 1 (Я), определенных формулой (7). выража-
М к
ются следующим образом :
EZ (к) - 0. N.k
2 .
4 Sin MX .
DZ (X) - 1 - - ♦ "С—V," • ttl
M.k
N M Sin Я
(10)
E ( Z (X) Z (Л) ) - 0. kin. k.n -1.....T. (11)
M.k M.n
Если In M / M < I'XjJ 1-1.2. то при тех же условиях справедливы
Е 1 Z (X) Z Oi I < 1. I M.k M.k I
1
- < M
... in m < -----
I M
I i i
e i z a,) z aj < ~f-.
I M.k M.k I In M
(12)
(13)
In M -----<
M
Из формулы (10) и неравенства
2 . sin М А
-г—4 1. О 4 1*1 < Г
М sin Я
вытекает равномерная по X ограниченность второго момента выборочных
функций Z (Л). M.k
Из теоремы 1 следует, что выборочная функция U (X) является
N
суммой взаимно некоррелированных и одинаково распределенных случайных величин Z (X). причем M.k
EU (X)- - ¿ EZ (X) - 0. 0 4 lAl <1í-К T k-1 M.k
Из (8) получим, что
1 4 sin1 МЯ
X) -
к
DU (X) -----+ —-J-.. О ч< IAI 4<íf.
Т ТМ ТМ sin л
Если 1п М / 1-1.2. то из (И) и (12) следует, что
1
>и
N
ЕШ сии суь
N N
1п М <-----
N
*
Так как случайные величины 1 (*). к-1......Т (Ег (Я) - О)
М. К Н.к
одинаково распределены и имеют конечную дисперсию, то' при Т-->оо.
и при выполнении условия Л. и. следовательно, при М—><*> распределение случайной величины и (Л.), определенной формулой (8). будет
N
стремиться к нормальному распределению с нулевым средним и дисперсией. данной в формуле (14).
На основании закона больших чисел устанавливается сходимость к нулю по вероятности величины г . определенной в формулах (8). а также определяется порядок ее сходимости..
Теорема 2. Если£Ц) , 1-0.1..... - последовательно„гь взаимно
независимых и одинаково распределенных случайных величин, то для любого £ > 0 имеет место
I
11т Р(1п М эир I 2$ Г (Л) - 1 - и (Л) N-->0® I N N
> £ ) - 0.
где МЯ) и 1ЫЯ) определены в формулах (1) и (8) соответственно.
Значения а^ и Ь^. данные в выражениях (5), устанавливаются так же.
как и в случае распределения максимального члена Еь.борки из нормальной совокупности, что следует из приведенной ниже теоремы.
Теорема 3. Если - последовательность взаимно независимых и одинаково распределенных случайных величин . то для всех значения Я!. 1п М / М . 1-1,2 существуют <£>0 и И,, такие, что при всех
N > N. имеет место
эир Р{.1т |и (Я;) I > г. 1-
< Ве
1 - Ф(г)
где и (А) определена в формуле (8). Ф(г) - функция нормального распре-II
деления, а В - некоторая постоянная.
Задача о распределении максимального уклонения оценки спектральной плотности стационарной гауссовской последовательности ХШ. ЕХШ-О. БХЦ)-! рассматривались в работе Р. Рудзкиса " 0 распределещга максимального уклонения оценки спектральной плотности стационарной последовательности " для оценки спектральной плотности вида [4].
Классические периодограммные оценки спектральной плотности имеют большие оценки смещения и дисперсии за счет ограниченности длины обрабатываемой последовательности по сравнению с оценками с временным сдвигом.
Полученные результаты применяются для анализа остаточных последовательностей регрессионных моделей, построенных в главе 2.
3. Построение регрессионных моделей экспериментальных данных.
Во второй главе рассматриваются два вида природных данных:
- изменение численности населения с 1861 года по 1992 год
( данные получены в Центральном Статистическом Бюро республики Маврикий ).
- изменение уровня воды в водохранилище Мар-о-Вакуа в республике Маврикий, ежедневные наблюдения приведены в приложении с 1970 по 1992 год ( данные получены в Центральной Водоохракой Службе республики Маврикий ).
Данные переписи населения республики Маврикий с 1861 по 1992
годы представленны в таблице 2.1(главы 2) через 10 лет. Отчетливо видны два уровня, около которых колеблется численность' населения. Для анализа таких данных применялись детерминированные (уравнение Вольтерра) и динамико-стохастические модели на.основе дифференциальных уравнений Фсрхлуста и Гомперца. Дифференциальное уравнение Вольтерра
<3у у
— - су(1 + - ). с>о. к
имеет решение
к
у(1) ------------------# (15)
(1 + В ехр(-си )
где у(г) - численность населения, I - время (годы). По данным переписи были оценены значения с.к и В уравнения (15). В результате была получена зависимость
55,475
уа) -----------------------------------. (16)
1 - 0,897 ехр(-0.00152Ц-1955) ) Как видно из таблицы 2.1. прогноз, полученный по формуле (16) является очень грубым. В связи с этим была рассмотрена зависимость прироста населения как функция численности населения
У - у - Ф (у ) + 6 , п+1 п к к
где у - численность населения в момент времени к. Относительно £ к ас
предполагается, что последовательность взаимно независимых и одинаково
распределенных случайных величин. В качестве Ф (у ) использовались
к
линейные регрессионные модели до пятого порядка включительно, полученные на основании ортогональных полиномов Чебьшева, К
«V" а V (г ) + £ . г -г -11 д п п+1 п 1=0
где а - коэффициенты, подлежащие оцениванию. У ч (Я)- ортогональные полиноки Чебышева (-1 ^ 2 $ 1 или 0^ 1 ^ 1).
В этой работе рассматривается оценка параметров и построение модели с двумя устойчивыми состояниями с помощью нелинейной авторегрессии. По экспериментальным данным оценим параметры методом наименьших квадратов
X(t) - X(t-l) - (X(t))+£(t). (17)
где£(Ю - последовательность взаимно независимых и одинаково распределенных случайных величин. И £(t) - 0. fl£(t) - s*s, a f(t) - некоторая заданная функция, параметры которой надо определить по экспериментальным данным.
Стандартный метод построения регрессии (или авторегрессии) основан на использовании следующей зависимости
y(t) - i а Ф ( X (t) ) + £(t) . (18)
1-0 11
t - 1.....N.
где р - порядок регрессии. a-t - параметры, которые надо оценить.
Ф (х). Ф (х).....Ф (х) - некоторые заданные функции.
О 1 р
Если £(t) имеют нормальное распределение, для оценки параметров применяется классический метод наименьших квадратов
N а 2
s: ( усt> - y(t) ) - юш . t-i
где y(t) - наблюдения. Регрессионная модель четвертого порядка, полученная по результатам переписи имеет вид ( в нормированном виде ) :
2 3 4
У(Х) - 0.018 - 0.256 X + 1.155 X - 1.557 X + 0.640 X + £(t).
Ixl <1.
Было получено :
На уровне значимости о£ - 0.05 критическое значение F/<ft).m=n-k+l. равно 3.84. Это означает, что модели 4-ого порядка и выше ста-
и.
тистически эквивалентны модели 3-ого порядка с точки зрения этого критерия. Для решения вопроса о различии между моделями 4-ого и 5-ого порядков необходимо применять более тонкие статистические методы.
Для колебания уровня воды в водоеме Map - 0 - Вакуа ( по средемесяч-ным данным) была получена линейная модель статистически неотличимая от регрессионных моделей более высокого порядка. Для первой разности колебаний уроЕня аоды была построена оценка спектральной плотности. На ее графике отчетливо еидны сезонные изменения уровня.
В Приложении приведены графики регрессионных зависимостей и оценки спектральных плотностей для анализируемых природных данных.
Основные результаты : 1. Получено асимптотическое распределение оценки спектральной плотности (1) в случае последовательности одинаково распределенных и взаимно независимых случайных величин. 2. Методом наименьших квадратов полученны регрессионные зависимости по формуле (17) для изменения численности населения в республике Маврикий и изменения уровня воды в самом большом водохранилища Мар-0 - Вакуа. Использовались данные за 131 год t по численности населения ) и за 22 года ( для водохранилища ).
В заключение, автор выражает глубокую благодарность научному руководителю кандидату физико-математических наук. И. А. Кожевниковой за постановку задач, постоянную поддержку, внимание и помощь в работе.
Литература
1. Michael Woodroofe and John Van Ness. The maximum deviation of sample spectral densities. The Annals of Mathematical Statistics. 1967 . vol. 38. Ко. 5. Pages 1558 - 1569.
2. Michael Woodroofe. On the maximum deviation of the sample density. The Annals of Mathematical Statistics. 1967 . vol. 38. Pages 475 -481.
3. Бриллинджер Д. Временные ряды. Обработка данных и теория. М.: Мир. 1980.
4. Рудзкис Р. О распределении максимального уклонения оценки спектральной плотности стационарной последовательности // Лит. матем. сб. 1985. Т. 25. No. 3. Стр. 163 - 174.
Зак.601
внииимт
Тир. 100