Ядерные оценки характеристик случайных полей по нерегулярным наблюдениям тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Кхатиб Махмуд
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Минск
МЕСТО ЗАЩИТЫ
|
||||
1992
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
МИНИСТЕРСТВО'НАРОДНОГО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи УДК 519.2
КХАТИБ МАХМУД
ЯДЕРНЫЕ ОЦЕНКИ ХАРАКТЕРИСТИК СЛУЧАЙНЫХ ПОЛЕЙ ПО НЕРЕГУЛЯРНЫМ НАБЛЮДЕНИЯМ
01.01.05 - Теория вероятностей и
математическая статистика
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
Минск - 1992
Работа выполнена на кафедре теории вероятностей и
математической статистики Белорусского государственного университета.
Научный руководитель - доктор физико-математических наук, профессор Г.А.Медведев.
' Официальные оппоненты: доктор физико-математических наук В.В.Апанасович, кандидат физико-математических наук Д.В.Синькевич.
Ведущая организация - Институт математики и информатики Литовской АН.
Зашита состоится 0-Э. 1992 г. в 10 часов на заседании
Специализированного совета К.056.03.17 Белорусского государственного университета по адресу: 220080, г.Минск, пр.Ф.Скорины 4.
С диссертацией можно ознакомиться в библиотеке Белорусского государственного университета.
Автореферат разослан " " 1992 г.
Ученый секретарь Специализированного совета
доцент Ю.В.Меленеи
Актульность темы. Математическая статистика в настоящее время широко используется для решения самых разноообразных прикладных задач, связанных с обработкой экспериментальных данных. Значительная часть результатов была получена для случая достаточной априорной информации. К сожалению, очень часто бывает, что имеется мало информации, или она является настолько общей, что невозможно установить функциональный вид необходимых вероятностных характеристик. Раздел математической статистики, в котором рассматривался задачи в условиях неполной априорной информации, составляет непараметрическую статистику. Многие авторы, как например, Э.А.Надарая, М.Розенблатт, Э.Парзен и другие изучали непараметрические методы и процедуры, которые эффективны в условиях независимых выборок. К сожалению, на практике такие предположения не всегда выполняются, поскольку выборочные значения часто статистически зависимы между собой. До сих пор еше мало работ по непараметрическому оцениванию даже таких широко используемых характеристик случэлных процессов и полей как корреляционная функция и спектральная плотность. Настоящая работа посвящена исследованию непараметрических оценок ядерного типа этих характеристик по нерегулярным наблюдениям.
Цель работы состоит в следующем:
- получение свойств ядер, обеспечивающих' минимальную зариацию оценок при нерегулярных наблюдениях;
построение ядерных оценок корреляционной функции :лучайного поля и исследование ее несмещенности и юстоятельности при нерегулярных наблюдениях;
построение ядерных оценок спектральной плотности эднородного случайного поля и исследование ее несмещенности и юстоятельности по нерегулярным наблюдениям;
- конкретизация свойств ядерных оценок корреляционной функции. и спектральной плотности на случаи гауссовских однородных случайных полей.
Методы исследования, используемые в диссертационной работе, основаны на обших и специальных результатах теории вероятностей, математической статистики и функционального анализа.
Научная новизна результатов состоит в том, что ' - в задаче оценивания интегральных функционалов по нерегулярным наблюдениям получены интегральные соотношения, которым должны удовлетворять ядра оценок, минимизирующие вариацию;
построена ядерная оценка корреляционной функции случайного однородного поля, найдено асимптотическое разложение ее смешения и вариации (при больших объемах выборки);
- сформулировано определение общей состоятельности оценок (в среднеквадратическом), когда производятся наблюдения над зависимыми случайными величинами, в ограниченной области наблюдений;
- найдены условия обшей состоятельности оценок корреляционной функции, математического ожидания и дисперсии однородного случайного поля по нерегулярным наблюдениям;
построена ядерная оценка спэктральной плотности случайного однородного поля, найдены аимптотические выражения (при неограниченной выборке) для ее математического ожидания и дисперсии;
- найдены условия обшей состоятельности оценок спектральной плотности однородного случайного поля по нерегулярным наблюдениям;
- показано, что для гауссовских случайных полой для
-1
состоятельности ядерных оценок корреляционной функции и спектральной плотности достаточно потребовать эргодичности случайного поля.
Практическая ценность. Для конкретно заданных плотности вероятностей выбора точек наблюдения, функций влияния, коэффициентов нормировки и корреляционной функции получены явные аналитические формулы для смешения оценки корреляционной функции, а также для смещения и вариации оценки спектральной плотности, которые могут быть использованы для численного исследования точности и скорости сходимости ядерных оценок характеристик к их истинным значениям:
Реализация результатов. Диссертационная работа выполянлась в рамках научно-исследовательской работы "Вероятностный и статистический анализ случайных процессов и полей" (номер госрегистрации 01890079844), выполнявшейся на кафедре теории вероятностей и математической статистики Белгосуниверситета в 1986-1990 годах по плану Минвуза СССР (пчиказ № 331 от П.05.87 г.).
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на семинарах кафедры теории вероятностей и математической статистики Белорусского государственного университета, а также на Республиканской научной конференции "Математическое и программное обеспечение анализа данных" (г.Минск, 1990 г.).
Публикации. По теме диссертации имеется три работы, перечень которых приведен в конце автореферата.
Структура и объем работы. Работа состоит из Введения, трех -лав. Заключения и списка литературы. Общий объем 91 страница текста. Библиография содержит 87 наименований.
С
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается важная роль непараметрической статистики, использующей зависимые наблюдения при отсутствии априорной информации. Анализируются недавние работы по оцениванию корреляционных функций и спектральных плотностей. Указывается на необходимость построения оценок по наблюдениям в случайных точках и приводится два реальных примера. Кратко описывается содержание работы.
В первой главе вначале изложены результаты по непараметрическому оцениванию плотности вероятностей в случае независимых выборок, а также задачам оценивания функций регрессии (§1.1). Достаточно подробно на основе известных результатов обсуждаются проблемы построения и преимущества оценок ядерного типа по регулярным наблюдениям (§1.2).
В §1.3 рассматриваются ядерные оценки функционалов по нерегулярным наблюдениям и их оптимизация в среднеквадратическом.
Предположим, что при наблюдении случайной величины У, связанной с переменной X, последняя порождается тоже случайным образом. Так что пара (X ,У) является двумерной случайной величиной и <(х.,у.), 1<1<п> является выборкой случайных пар объема п. Такую выборку б:дем называть выборкой нерегулярных наблюдений. Будем считать, что величины независимы в совокупности и одинаково распределены. Однако при фиксированных <х.} величины {у} могут быть зависимыми. Обычно специфика получения наблюдений такова, что плотность вероятностей случайной величины X известная, а условная плотность случайной величины У при фиксированном X неизвестна. Пусть нам необходимо оценить функционал
е
*(х> = j' SCy)rYx(y,x)dy, (I)
к
где g(y) - некоторая функция скалярной переменной у, гух(у,х) - совместная плотность вероятностей случайных величин (X,Y). Обозначим также через гх(х) известную плотность вероятностей случайной величины X, в общем случае являющейся многомерной. При принятых предположениях г (у.....у,х,..,х)
VX 1 П 1 п
имеет структуру г (у..... у,х..... х ) =
YX i 'n 1 п
п
= Г (у ,. .. , у I х , . . , х ) П г (х. ) .
V 'l п ' t г. . 1 Xi
1. = 1
В качестве оценки *(х) по выборке объема п используем статистику
ф (х) = J- Е в (у. ЖСх.х ), (2)
П П V L
1=1
Представляет интерес среди ядерных функций обеспечиваю-
щих состоятельность, найти такие ядра, которые бы обеспечивали оценкам оптимальность в среднеквадратическом смысле.
Теорема I. I. Для того, чтобы оценка (2) была несмещенной необходимо, чтобы ядро К(х,и) удовлетворяю интегральному соотношению.
J*(u)K(x,u)du = <Кх). (3)
о
ф(х) определено в (I). G - область наблюдения.
Теорема 1.2. Для того, чтобы несмещенная оценка (2) имела минимальную (по множеству ядер) вариацию, необходимо, чтобы ядро К(х,и) удовлетворяло интегральному уравнению
J*Cu.v)K<x,v)dv = Зг *(u) - i»o(u)K(x,u), (4)
а
где ^Cu.v) = J" Jg(y' )s(y")f (y' ,y",u , v)dy' dy", R R
*оСи) = ; ег(у)гух(у,и)ау,
к
л - множитель Лагранжа, определяемый из (3).
Вообще говоря, решения уравнения (3), которые обеспечивали бы . состоятельность оценке (2) может не существовать. Тогда имеет смысл использовать смешенную оценку., обеспечивакшую минимальное значение вариации.
Теорема 1.3. Для того, чтобы ядро К(х,и) минимизировало вариацию оценки (2) необходимо, чтобы оно удовлетворяло интегральному уравнению
« (и)К(х,и)+Г((1-= 0. (5)
П 1 О • • п
а
К сожалению, результаты теорем 1.1 - 1.3 практического применения иметь не могут, так как при определении оптимальных ядер используется условная плотность гу(у | х), которая на самом деле при построении оценок (2) не известна. Однако полезность этих результатов состоит в том, что решение уравнений (4), (5) позволяет исследовать характер оптимальных ядер, рассмотреть чувствительность их формы к виду условной плотности Г/у I к).
Во второй главе рассматриваются ядерные оценки корреляционных функций случайных однородных полей.
В §2.1 исследуются обшие свойства таких оценок.
Примем следующее обозначение двумерной переменной:
€ = (с ).
1 г
Будем предполагать, что в двумерной области в=[0,Т ]*С0,Т ] произведено N измерений случайного поля так что известнг
выборка <у(ък) = у(*-1к.ь \ I с к <■ Ы>. Предполагается, чтс измерения делаются в случайных точках, так что - реализацго
случайных величин, имеющих плотность вероятностей pCt^} = = P(t. ) такую, что Р(£ ) < для всех ъ, «= g и
lk zk r k k
T T
_ _ i 2
Г p(t, )dt = Г Г p(t,,t, )dt , dt , = I.
J r k k J J r Ik 2k lk zk о о о
Относительно p(t) будем также предполагать, что она является дифференцируемой почти всюду в области G по обоим скалярным аргументам и для всякого А <= G, такого, что
_f dt. > О, J p(t)dtJ >0.
А Л
Полагаем пары Z = (t ), I < k < N, независимыми в
к lk zk
совокупности.
Пусть функция *Сх) = '*Чх ,х ) такова, ЧТО Ч'Сх) * О ÜSj, ^Сх)=0 х £ s, где g-некоторая ограниченная область, являющаяся
окрестностью 0. Полагаем также, что J а* = Е Сочевидно, что
9
Е < ле2), а функция 1Пх) обладает следующими основными свойствами
«СО) >0, 0 < Г *Cx)dx = ф < +со. Г хЧ-Сх)^ = 0, k=I ,2.
о J к
• 9 9
Г XX nx)di = 0, j * к. f х2*(£)<£ = * < +00, к = 1,2.
J J к . J к 2
9 9
Обозначим
V (х) =* * (х ) = х , 8 х ),
N N12 N 1 N 2 .
*де в - скалярная неотрицательная переменная, неограниченно
юзрастащая с ростом N: ыгЛтт ®N = 00■
Определим
L (тг) = Г dt f dt * (t -t —c)p(t )p(t ) =
N J 1 J 2 N 1 2 1 2
N *
О
Здесь использованы обозначения
в* = [-Т ,Т ]х[-Т ,Т ] - область изменения двумерной 112 2
переменной в = (в »в ).
ч(^) = ) - плотность вероятностей случайной величины
€4 - определяемая выражением
4 1* у ) 4 ( т -р у
. _ 1*11 2*22
а(в) = аСя ,гг ) = Г Г ¿Ь р(ъ ,Ь ) х
.1 2 •' 1 212
_а у _а у
1 ' 2
X рСъ . Ь ). (6)
112 2
ДЛЯ ВСЯКИХ 5 = (в .в ) в в*.
1 2
В дальнейшем математическое ожидание по ь будем обозначать
М^...>. Условное математическое ожидание по у при фиксированных
ь будем обозначать Му{... .> = М<... |ь>.
Пусть 1?(т) - функция корреляции однородного случайного поля
у(£), то есть РСт) = Му ■{у(ъ)у(ъ+;г)>.
Рассмотрим следующую оценку = Р(т ,-с ) для определен-
1 2
ности ПОЛОЖИВ |т I > 0, |хг I > 0.
1 1 ' -2 1
' О N-1 м * (Ъ.-Ъ -т;)
- -нАтт Е . = ^ • <?>
1=1 1 = 1+1 \т;}
м
Здесь для краткости обозначено у. = у(С.).
Теорема 2.1. Оценка (7) является асимптотически несмещенной и имеет место предельное соотношение
+ ¿йСт). ад(т) к к
До сих пор предполагалось, что |тк| > 0, к = 1,2. В точке т = 0 функция ч(т) может не иметь производной, так как в этой точке
пределы интегрирования в (6) имеют изло'мы. Кроме того, довольно широкий класс корреляционных функций в нуле не имеет производной (это имеет место, например, для случайных полей, недифференцируемых в среднеквадратическом смысле). Поэтому имеет
смысл для случая т
О оценку (т) построить отдельно. Наиболее
просто это сделать так
(?(о) = -¡¡г Е (8)
1=1
Оценка (8) является несмещенной. Обозначим
М <у > = а М {у*} = Н
V I V '1 о
м {у2у2> = Н )
VI} 1 J и
М {у.у у, у,} = Н (ъ.-ъ -ь. >
У Э ) I к V I V'
е.
8 (я ,8 ,8 ) = Г р(Ор(«.+я )р(ъ+я )р(ъ+я
3 1 2 Э 1 2 3 3
J (т ,хг ) = Г (Н (т .я, т +э)-Р(х: ЖСтг ))а (£ ,тг
О 1 2 и 312 1 2 9 1 2
а
Теорема 2.2. Пусть определяется (7) и пусть ^¡'х
1 2
таковы, что ч(т) > 0, ч^) > 0, к = 1,2. где ч(т) определена в (6). Тогда для ковариации оценки (7) справедливо асимптотическое
представление
^ )> = 1"(тг',Х2'> + + оГ-Ц.
12 N
а вариация этой оценки имеет вид
N
Теорема 2.3. Вариация оценки (8) вычисляется по формуле
V(6(o)) [H0-R2Co)] + [l--^-] X d5(HiCs)-R2(o))q(s),
о*
Рассмотрим теперь проблему состоятельности оценок (7) и (8). Обычно, когда выборочные значения, по которым строятся оценки тех или иных характеристик, являются независимыми, состоятельность определяется как предельное свойство при неограниченном увеличении объема выборки. В случае, когда, выборочные значения зависимы, свойство состоятельности следует определить по-другому.
Пусть В «= R2 - некоторая область двумерного пространства. Будем говорить, что область В неограниченно расширяется (В —► оо), если для В и скалярного параметра се * I определено множество = {t | etc, т е в} и й —>оо. Множество В^ будем
сс се
называть расширением множества В. Будем говорить, что плотность вероятностей р(ъ), заданная на G, инвариантна по отношению к расширению G, если для и > I на определена плотность вероятностей р Хъ) такая, что для всякого В_ « G_ имеет место
СС CL OL
равенство
/ р (t)dt = f p(t)dt. Очевидно, чт.о p^Ct) = pf-j-]-
Будем говорить, что оценка на основе выборки N в области G в общем состоятельна Св среднеквадратическом), если при N —» оо и G —► оо вариация этой оценки стремится к нулю.
Теорема 2.4. Если плотность вероятностей рСО выбора точек
наблюдения над случайным полем в области в инвариантна по отношению к расширению в и четвертый смешанный момент Н (5 ), для всех яхО обладает свойством
Э 12 2 3 13
Н (з ,3 ) = ).
- __ 312 23 1 3
I О 1 —> 00 I
2 !
то оценка (7) является состоятельной. Здесь |зг| означает
(2.2 -,1/2 (.Я )
12 22
Теорема 2.5. Если плотность вероятностей р(ъ) выбора точек наблюдения над случайным полем в области в инвариантна по отношению к расширению в и смешанный момент Н (а), обладает свойством
н (н) =~Г?2(о).
- . 1 I И1 —► со
то оценка (8) является состоятельной.
Несмещенной оценкой а является эмпирическое среднее
а = Е у(ък). (9)
к=1
Вариация этой оценки
Va = 7Г RCo) + [1_Тг] J" Rts)q(5)di - а*.
Теорема 2.6. Если плотность вероятностей р(ъ) выбора точек наблюдения над случайным полем в области G инвариантна по отношению к расширению G и корреляционная функция'RCi): поля обладает свойством
Jim. R(£) = а2, . '
I ТГ1 —> 00
то оценка (9) является состоятельной.
Для гауссовских однородных случайных полей (§2.2)
Н (¿) = 2R2(5) + R2(0) - 2а*; 1
Н (s ,S ,S +S ) = R(S )R(s )+R(S )R(i +S -S ) +
Э1223 13 2231
+ ЯС® +3 Же ) - 2а".
2 3 2 1
Поэтому для гауссовских случайных полей условия состоятельности упрощаются.
Теорема 2.7. Если плотность вероятностей р(£) выбора точек наблюдения над однородным гауссовским полем в области в инвариантна по отношению к расширению в и корреляционная функция
(?(?;) поля обладает свойством = а2,
|ХГ| 00
то оценки (7), (8) и (9) являются состоятельными.
Условия состоятельности в теоремах 2.4 - 2.7 будут выполнены, если случайные поля обладают следующим свойством: при раздвижении отсчетов случайного поля на неограниченное расстояние зависимость между ними теряется, то есть выполяниется условие
От р (у ,у | £ ,€ ) = р (у |«Г )р (у ).
_ rY ' 1* 2 V 'I1 1 ГУ 2 2
II -I I 00
1 2
Обычно такое свойство совместных распределений связывают со свойством эргодических случайных полей. Так что можно сказать, что условия состоятельности оценок в теоремах 2.4 - 2.7 выполняются для эргодических случайных полей.
В третьей главе исследуются ядерные оценки спектральных плотностей однородных случайных полей."
В §3.1 изучаются, свойства этих ядерных оценок. Спектральная плотность случайного поля определяется соотношением
г (А) = 2 Г «Г^ лттг = л хг + А т .
112 2
где а и т - двумерные вещественные перемнные, - функция
корреляции случайного поля.
Поэтому в качестве оценки спектральной плотности по выборке
объема N естественно взять функцию
г (л) = 2 / е"^ 6 (10)
N ^ N
а
где оценка корреляционной функции (7). Обозначим
ф (л|С -С ) = 2 / е-1*Г'с « (ь -ь ^
О N
Тогда явный вид оценки (10) приобретает форму
Лемма 3.1: Для функции * (х). имеет место следующее предельное соотношение
Пт. ¥ (х) / ч» = б(^) = Б(х )Б(х )
N —* 00 N О 12
Следствие 3.1:
ит. |_ (£) = Ч< V; бб*.
N 00 N О
Следствие 3.2:
* (я—г) -Ч
1ш -Л- =
00 1_ (¿) ЧЙ N 1
Следствие 3.3:
N —► 00 >1 '
ч(ъ-ъ') _ •
Теорема 3.1. Математическое ожидание оценки определяе?лой (II), при увеличении объема выборки N , —► <*> стремится к следующее пределу
Пт М{? (?0> = 2 Г Р(5)е"1ЯТ°
N —♦ СО N -3
*
О
Таким образом оценка (II) в общем случае является смещенной, если область в* является ограниченной. Расширяя эту
область до к2 можно устранить это смещение. Здесь и ниже мы будем предполагать без особых оговорок, что плотность вероятностей чСя), определенная на области в*, является инвариантной к расширению в*. В этом смысле (II) является асимптотически несмещенной оценкой.
Следствие 3.4.
а
Ит. 1ип. М<Г (Л)> = Г(Л).
_> К2 N -> ОО N
Вариация оценки (II) выражается в виде V,(N,6*) = М{г2(л)> - 2г(л)М{г (А)Ьг2(Л).
( N N
Относительно первого слагаемого справедлива Теорема 3.2. Если интегралы
| (Н (з) / Ч(^)) е"21ЯТ"
_ _ _ _ _ _ ЛТ(~ > — —
/ / (Н (я,я' ) / ц(я)ц(е' ) )е1 """ ' ds ds'
существуют, то
N^00 М<Г2(Л)> = 4/ ¿ё / ) / Ч(а)Ч(з' )е
Следствие 3.5.
-иЛ <8+в')
о т ч
а о
И<п. Ит. V (Ы,в*) = 4Г<Ь8 ГсЬ5' ^ и! ___.. г ' ■> ■>
К2 N 00
ст--,
-IА (а+в >
о_
- )
где
> = ¿¿«I и (в,!5'). ° 0*_ не о
Теорема 3.3. Для того, чтобы оценка была в общем состоятельной, достаточно, чтобы функция ^(¿.ы') удовлетворяла условию
* *
а а
а
J*(s,s')= tim. J (s,s' ) = q(s)q(i' )R(s)R(s' ). a* _ R2 о
Теорема 3.4. Для того, чтобы выполнялось условие состоятельности оценки спектральной плотности (II), достаточно,
чтобы выполнялось условие состоятельности оценки корреляционной
I
функции (7). ;
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Ядерные оценки (2) функционалов вида (I), обладающие минимальной вариацией, должны удовлетворять интегральным соотношениям (3)-(5).
2. Ядерные оценки характеристик однородных случайных полей при нерегулярных наблюдениях имеют вид (7) для корреляционной функции и вид (II) для спектральной плотности. Вид оценок характеризуется наличием нормирующего множителя I-
3. Ядерные оценки (7) корреляционной функции однородного случайного поля являются асимптотически (при N —►<») несмещенными (теорема 2.1) и состоятельными, если выполняется условие теоремы 2.4.
4. Ядерные оценки (II) спектральной плотности однородного случайного поля являются асимптотически (при N —> со, в* —► оо) несмещенными (теорема 3.1) и состоятельными, если выполняются условия теоремы 3.3.
Основные результаты отражены в следующих публикациях:
1. Кхатиб М., Медведев Г.А. Ядерная оценка корреляционной функции случайного поля по нерегулярным наблюдениям.// Математическое и программное обеспечение анализа данных.-Минск.- 1990,- с.16.
2. Кхатиб М., Медведев Г.А. Ядерная оценка спектральной плотности случайного поля по нерегулярным наблюдениям.//
17
Математическое и программное обеспечение анализа данных.-Минск,- 1990.- с.15.
3. Кхатиб М., Медведев Г.А. Оценивание корреляционной функции и спектральной плотности случайного поля на основе нерегулярных наблюдений.// Проблемы компьютерного анализа данных и моделирования. Сборник научных статей,- Минск,- 1931.-с. 120-123.