Математическое моделирование некоторых методов проверки статистических гипотез, основанных на теории больших уклонений тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Романова, Татьяна Анатольевна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2001
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
1 Оценка мультипликативной константы.
1.1 Состоятельность оценки мультипликативной константы.
1.2 Численный анализ мультипликативной константы.
2 Анализ точности аппроксимаций. ••
2.1 Проверка гипотезы однородности двух многомерных выборок.
2.2 Проверка гипотезы независимости.
2.3 Численный анализ асимптотик.
3 Оценивание мощности критерия однородности.
3.1 Асимптотическое поведение статистики Питербарга-Тюрина при альтернативе сдвига.
3.2 Численный анализ статистики Питербарга-Тюрина при альтернативе сдвига.
3.3 Оценивание мощности критерия однородности.
3.4 Доказательство теоремы 6.
Классическая теория математической статистики включает методы обработки данных, основанные на предположении, что закон распределения наблюдений принадлежит к тому или иному параметрическому семейству. Одним из наиболее важных распределений является гауссовское семейство. Отчасти это объясняется тем, что основными потребителями математической статистики в прошлом были дисциплины, для которых характерно было высокое качество измерений, например астрономия и геодезия, а ошибки в измерениях близки к нормальному распределению. Поэтому методы обработки наблюдений, имеющих нормальное распределение, разработаны достаточно полно как для одномерного случая, так и для многомерного. Например, в гауссовском случае проверка гипотезы о независимости признаков сводится к проверке гипотез о равенстве нулю коэффициентов корреляции (см., например [2, Глава 4 и 9], [19, Глава 29]), а проверка однородности заключается в проверке гипотез о равенстве одновременно ковариационных матриц и векторов средних значений (см., например, [2, Глава 10], [19, Глава 42]).
Разработанные для нормального распределения методы иногда приходится применять и в тех случаях, когда имеются какие-либо отклонения от нормальности. Применение гауссовских методов для негауссовских наблюдений превращает точные выводы в приближенные. На практике упомянутые отклонения бывает трудно обнаружить, поскольку статистик располагает лишь ограниченным числом наблюдений. Между тем даже малые отклонения от нормальности могут сильно искажать статистические свойства гауссовских правил.
Один из способов решения этой проблемы — разработка таких статистических методов в рамках гауссовской модели, результаты применения которых были бы устойчивы, малочувствительны к тем или иным отступлениям от нормальности. Это важное направление, известное как робастая статистика, очень интенсивно разрабатывается в последние десятиления.
Если же имеется явное отклонение распределения от гауссовского, проверка корректности выводов, полученных в рамках нормальной модели, может перерасти в сложную проблему. Специально для этих случаев были разработаны непараметрические методы анализа данных. Непараметрические методы — это методы не предназначенные специально для какого-либо параметрического семейства распределений и не использующие свойства этого семейства. Обычно, непараметрические методы проще в применении, чем их конкуренты из нормальной теории. Кроме того, они применимы в ситуациях, в которых методы нормальной теории не "работают". Например, для многих непараметрических методов требуются не действительные значения наблюдений, а только их ранги. Как правило, непараметрические методы лишь немного менее эффективны, чем их конкуренты из нормальной теории, если рассматриваемые генеральные совокупности нормальны. Эти методы могут оказаться значительно эффективнее, чем их соперники из нормальной теории, если распределения генеральных совокупностей отличны от нормального.
В одномерном случае разработано большое количество непараметрических методов проверки статистических гипотез. Для этих методов характерно то, что соответствующий им статистики при выполнении гипотезы распределены свободно, то есть их распределения не зависят от исходного распределения выборок. Поэтому законы распределения этих статистик можно вычислить, что и позволяет эффективно применять эти методы для проверки гипотез. Наиболее известными из непараметрических методов являются методы, основанные на статистиках Колмогорова-Смирнова [37], Уилкса [42], Хефдинга [15], Крамера-фон Мизеса [32], Лемана [20].
Рассмотрим подробнее открытые Ф. Уилкоксоном [41] ранговые методы. Они возникли как замена традиционной корреляционной теории, основанной на двумерном распределении. В непараметрическом случае тоже можно использовать коэффициенты корреляции, но уже ранговые, то есть основанные на рангах наблюдений. Чаще всего используются коэффициенты ранговой корреляции предложенные Спирменом (см.[17]) и Кендэлом [17]. Важной задачей является разработка свободных от распределения методов обработки многомерных данных. Во-первых, это связано с потребностями таких наук, как биология, медицина, экономика и социальные исследования, психология и политология. Для этих наук характерно то, что изучаемые в них данные обладают большой совокупностью признаков, которые не являются независимыми и имеют сложные, малоизученные законы распределения, препятствующие применению классической теории.
Во-вторых, в многомерном случае последствия применения гауссовских методов для негауссовских наблюдений мало изучены.
В-третьих, уровень развития вычислительной техники позволяет осуществить анализ многомерных данных на практике.
Непараметрические методы анализа многомерных данных существуют и развиваются отнюдь не механическим обобщением многомерных результатов. Имеется несколько подходов к построению многомерных непараметрических критериев.
Некоторые авторы для анализа многомерных данных используют перестановочные критерии. Так Бикел [3] построил свободный от распределения критерий, являющийся многомерным обобщением критерия Колмогорова-Смирнова. Хенз [13] предложил критерий, основанный на методе ближайших соседей. Позже Хэнз и Пенроуз [14] развили предложенный Фридманом и Рафски [9] многомерный критерий серий, основанный на минимальном дереве элементарных событий, как многомерном обобщении одномерного классификационного списка. Эти критерии являются свободными от распределения и их тестовые статистики являются асимптотически нормальными.
Для анализа многомерных данных ряд авторов использовали ранговые методы [29], [24], [31]. В одномерном случае ранговые критерии позволяют построить свободные от распределения статистические процедуры принятия решения. Но для векторных наблюдений неизвестно такое обобщение операции ранжирования, которое бы приводило к свободным от распределения статистическим правилам.
Рой [33] предложил метод перехода от многомерной задачи к одномерной задаче. Для этого он рассматривает всевозможные линейные комбинации наблюдаемых признаков. По этому методу критическое множество составляется как объединение критических множеств для проверки тех гипотез об одномерных распределениях, из которых состоит проверяемая гипотеза. Следуя принципу Роя, проверяемая гипотеза отвергается, если отвергается хотя бы одна из составляющих гипотез.
Используя этот метод включения-исключения В. И. Питербарг и Ю. Н. Тюрин [27], [28] ввели статистические процедуры, основанные на ранжировании всевозможных линейных комбинаций наблюдаемых признаков. Разработка этих процедур стала возможна благодаря развитию асимптотической теории гауссовских процессов и полей. Именно с помощью этой теории были получены асимптотические формулы необходимые для оценивания хвостов распределения тестовых статистик. Эти функции распределения зависят от распределения выборок только через постоянный множитель, который можно оценить по выборкам. В данной работе предложена состоятельная оценка этой мультипликативной константы и дан ее численный анализ. Кроме того, в настоящей работе методами статистического моделирования оценивается точность аппроксимаций полученных В. И. Питербаргом и Ю. Н. Тюриным для введенных ими статистических процедур проверки гипотез однородности и независимости, а затем оценивается мощность этих статистических процедур.
Пусть X и Y являются независимыми случайными векторами из d > 2, имеющими неизвестные абсолютно непрерывные распределения F\ и F2, соответственно. Для определенности будем считать, что элементы Hd представлены вектор-столбцами, а атЬ обозначает скалярное произведение векторов а, Ъ G Пусть
Хь.,Хт и Yi,.,Yn (1) представляют собой независимые реализации случайных векторов X и Y. Обозначим через Н гипотезу однородности этих случайных векторов, т.е. гипотезу
H:F1 = F2.
Рассмотрим асимптотический критерий предложенный В. И. Питербаргом и Ю. Н. Тюриным [28] для проверки этой гипотезы однородности при m, п —со. Для перехода от многомерной задачи к одномерной используется метод Роя [33].
По этому методу критическое множество составляется как пересечение критических множеств для проверки тех простых гипотез, из которых состоит проверяемая гипотеза. Так, гипотезу об однородности двух случайных векторов мы представляем в виде пересечения гипотез о независимости всех линейных форм от этих векторов. Рассмотрим одномерные случайные величины АГХ и ArY, где Л € Rd является ненулевым неслучайным вектором. Гипотеза Н влечет за собой гипотезы Н\ об однородности этих одномерных случайных величин. Следуя принципу Роя гипотеза Н отвергается, если отвергается хотя бы одна из гипотез Н\.
Для проверки гипотезы Н\ используется простейший непараметрический критерий однородности двух скалярных выборок — критерий Уилкоксона [41] в форме Манна-Уитни [23].
Пусть \¥т^п(\) — статистика Уилкоксона для проверки гипотезы Ну. т п *=i i где sgn(x) — знаковая функция, такая что sgn(or) = <
1 если х > О
0 если х = О
1 если х < 0.
Согласно критерию Уилкоксона гипотеза Н\ отвергается, если IW^^A)! слишком велико. Поэтому в качестве тестовой статистики можно использовать sup \WmM(X) \. (2) л
Тогда гипотеза Н отвергается, когда (2) превосходит критический уровень. Распределение этой статистики при выполнении гипотезы к сожалению зависит от распределения случайных наблюдений, но основе этой статистики авторы [27], [28] построили асимптотический критерий, для применения которого достаточно оценить по выборке всего, один числовой параметр.
Для построения этого критерия рассмотрим нормированную статистику:
3) где v^nn mn(m + n+1)/3 —дисперсия случайной величины Wmin(A) при выполнении гипотезы Н.
Заметим, что для произвольного к > О
Zm,n(^) = —ZmjTl(—\) и Zm^n(kX) = 2ГТО;П(А), следовательно
Поэтому sup \Zm,n(\)\ = sup Zm,n(A). (4)
Л |A|=1 sup ZmM{\). (5)
A|=1 является тестовой статистикой для гипотезы однородности.
Обозначим через р(х) плотность распределения F\ и введем следующее условие для р(х),
3C>0n3j>d, такие что р(х) < С/( 1 + |х|7), для всех х G RA (6)
Для произвольного ненулевого вектора A G Rd определим матрицу В\ с элементами h(i, j) = 12 J J Угр(х. -y)dy J Zjp(x - z) dz p(x) dx, (7)
Лту=0 ATz=0 где г, j — l,.,cL Обозначим через S(B\) сумму главных миноров В\ порядка d — 1. Для данной плотности р(х) определим константу
Кх= J S^iB^SidX), (8)
Sd-1 где интегрирование осуществляется по единичной сфере в Hd и S(dX) — элемент поверхности сферы.
В работе [28] доказано, что при выполне нии гипотезы Н и при выполнении условия (6) на плотность векторов X и Y, статистика (5) при га, п —> оо сходится по распределению к sup|A|=1 Z(Л), где Z{Л) — некоторое, определенное ниже, гауссовское поле. Для оценивания функции распределения случайной велечины supjA|=1 Z{X) используется результаты асимптотической теории гауссовских процессов и полей. С помощью этой теории в работе [28] доказана следующая асиптотическая формула
Р (^sup Z(X) >х^=Кх xd~2(2ir)~dl2e~x2l2(l + о( 1)) при х оо, (9) где константа Кх, определенная формулой (8), оценивается по выборке Xi,. ,Х,„. Авторы [28] предлагают для больших m, п и малых уровней значимости £ > 0, отвергать гипотезу Н на уровне е, если sup Zmjn(X) > хе, \x\=i где хе вычисляется по асимптотической формуле (9).
Процедура проверки гипотезы независимости двух многомерных признаков, предложенная В. И. Питербаргом и Ю. Н. Тюриным в [27] основана на тех же принципах, что и изложенная выше процедура проверки однородности. Пусть X и Y — р- и g-мерные случайные векторы и
Xi, Yi), (Х2, Y2),. -, (Xn,Yn) представляет собой независимые реализации (X, Y). Гипотеза
Н : случайные векторы X и Y независимы включает в себя гипотезы Haj независимости одномерных случайных величин атХ и /ЗтY, где a G Rp и (3 £ R9 — произвольные неслучайные ненулевые векторы. Согласно принципу Роя, гипотезу Н следует отвергнуть, если по крайней мере одна из гипотез Наф отвергается. Для тестирования гипотезы используется критерий основанный на коэффициенте ранговой корреляции Кендалла [17] тп(а,Р) = ^-Ц-г J] sgn((aTX, - атХ,)(/?т^ - /?TYj)), (10) n(n — 1) где sgn(x) — знаковая функция. По Кендалу гипотеза На в отвергается, если \тп{а,(3)\ слишком велико. Поэтому в качестве тестовой статистики можно использовать sup|rn(a,/3)|. а,/?
Рассмотрим нормированный коэффициент ранговой корреляции
Тп(а,Р) = а-1 J2 (11) где и\ = 2/9п{п- 1)(2п + 5) дисперсия случайной величины п(п — 1 )тп(а,Р) при выполнении гипотезы Н. Заметим, что статистика Тп(а,/3) постоянна вдоль любого двумерного направления, то есть для любых а, /3 и для любых t > О
Кроме того,
Следовательно,
Поэтому
Tn(taJ) = Tn(a,t(3) = Tn(aJ).
Тп(-а,Р) = Т„(а, -Р) = —Тп(а: /3). sup \Тп(а,0)\= sup Тп(а,/9). (12)
N=|0|=1 sup, Tn(a,j3). (13) а\=Щ=1 является тестовой статистикой для гипотезы независимости.
В работе [27] доказано, что при выполнении гипотезы Н и при выполнении условий (6) на плотности векторов X и Y, статистика (13) при п —>■ оо сходится по распределению к sup|A|=1 Z(a, /3), где Z(a: /3) — некоторое гауссовскОе поле и приводится следующая асимптотическая формула
Р ( sup Z(a, Р). > * ] = K*Ky z^-'e-т(1 + о(1)) при г оо,
14) где константы Кх и определенные формулой (8), оцениваются по выборкам Xi,., Хп и Yi,., Yn соответственно. Поэтому для больших п и малых уровней значимости е > 0 мы отвергаем гипотезу Н на уровне если sup Тп(а,/3) > 2£, |А|=1 где z£ вычисляется по асимптотической формуле (14).
Являющиеся результатом применения теории больших уклонений асимптотические формулы (9) и (14) зависят от распределения выборок только через постоянный множитель, который можно оценить по выборке. Для этого рассмотрим функцию
Fi(\,x)= J yip(x-y)dy1
XTy=0 где А € Rd — ненулевой вектор. Тогда элемент b\(i,j) матрицы В\ (7) равен b\(i,j) = j Fi(\,x)Fj(\,x)p(x)dx.
При оценивании F{(X,x) для каждого значения Л заменим плотность р(х) ее ядерной оценкой
1 v 7 где = ., — с?-мерная выборка, содержащая независимые компоненты, из распределения, имеющего плотность р(х), константа h > О, Q(v) — ядерная функция (см. [8]) такая, что где Ai — наибольшая по модулю компонента вектора Л, /{•••} обозначает индикатор множества. Тогда мы получим следующую оценку для F{(А, х): ^ t 6 - < §}((*! - Ы) - i = 1
1=1 1=1
Пусть В*х обозначает d х d матрицу с элементами п — w= 1 И
I S1/2(B*)S(d\)
Sd~ i
Теорема 1. Пусть функции
Gijki( А,х) =
У г Уз У к у) dy
Ату=0 равномерно ограничены по А и х Элл ecerc i, j, к, I — 1,. ,q. Тогда К£ — состоятельная оценка Кх при условии h = hn так, что hn —> 0, п/гп —> оо при п оо.
Таким образом, на практике для получения достаточно точной оценки необходимо брать малые h, но при уменьшении h дисперсия оценки К^ возрастает. Поэтому мы предлагаем следующий подход к выбору h.
Мы выбираем h из условия минимума величины f (р*(х) — p(x))2dx. Для этого мы минимизируем критерий f (p*(x))2dx—2M*, где М* — выборочная оценка для f p*(x)p(x)dx, такая что
Если мы находим h таким образом, то получаем хорошие оценки для Кх даже по выборкам небольшого объема.
В Главе 1 данной работы доказывается состоятельность оценки К£ и приводится ее численный анализ, который показывает, что данный метод оценивания константы Кх хорошо применим на практике.
При тестировании гипотез однородности и независимости мы сталкиваемся с двумя предельными переходами. Оценить теоретически ошибки этих двухстадийных аппроксимаций пока не удается. По-видимому, это весьма сложная задача. Поэтому чтобы понять насколько полезны для г=1 практики описанные выше статистические методы необходимо сделать это численно, используя классический метод Монте-Карло. В Главе 2 приводятся численные результаты которые показывают, что предложенные аппроксимации дают хорошее приближение даже при умеренных объемах выборок (начиная с 50) и уровнях значимости, начиная с 10%.
Безусловно, не существует какой-то одной "самой лучшей" процедуры тестирования гипотез однородности и независимости. При выборе применяемого метода практик обычно предпочитает те методы, которые легки для применения и обладают высокой мощностью в разнообразных ситуациях. Следовательно, важно оценить мощности предложенных критериев и сравнить их с мощностями гауссовских критериев максимального правдоподобия. Последний для гауссовских выборок в определенном смысле оптимальны. Глава 3 посвящена исследованию мощности двувыборочного критерия однородности против альтернатив сдвига.
Пусть X и Z являются независимыми случайными векторами из d > 2 и
Хь.,Хт и Zb.,Zn (16) представляют собой независимые реализации случайных векторов X и Z. Рассмотрим случайный вектор Y = Z — где ipm^n — неслучайный d—мерный вектор сдвига. Затем рассмотрим гипотезу однородности векторов X и Y. По выборкам (16) построим статистику т п zm,n (А) = Ь>~*п Y^ SSn(AT(X?; - ZJ+ ipm,n)), i=1 j=1 где vfnn := mn(m + n + l)/3. Поскольку эта статистика инвариантна относительно линейных преобразований, то в качестве вектора сдвига возьмем для определенности вектор пропорциональный ,, вектору е (1,. ., 1). Рассмотрим семейство векторов сдвига следующего вида: п + т
V шп где t > 0 из R.
Пусть f\(x) — функция плотности случайной величины
АТ(Х - Y), а — угол между векторами А и е. Рассмотрим гауссовское случайное поле Z{А), имеющее математическое ожидание т(А) = EZ{X) = 2V3cos(a)fx(0) t, (17) и ковариационную матрицу равную ковариационной матрице поля Z(А) которое мы определили выше при описании критерия проверки гипотезы однородности. В диссертации доказывается следующая теорема
Теорема 2. Пусть Xi,.,Xm и Ъх - срт,п,., Zn - (рт;П суть две независимые d-мерные выборки из общего распределения имеющего непрерывную плотность р(х) относительно Лебеговой меры в Rd. Предположим, что для этой плотности выполнено условие (6). Тогда sup Zmn{А)=Ф- sup Z{А) т, п -> оо. |А|=1 ' |А|=1
Далее, используя результаты асимптотической теории гауссовских процессов и полей, полученные В. И. Питербаргом и С. Стоматовичем [26], мы получаем следующий результат, описывающий поведение поля Z{А) Л12
P{sup Z(А) > z} - Кх- exp(-(z - m(Л0))2/2) при ^ -ч оо, (18)
А| = 1 ^ - ■пг(Ао) где Ао — точка максимума определенной в (17) функции т(А), а Кх некоторая константа. Эта константа определяется ниже, она зависит от распределения первоначальной выборки, а для гауссовского случая ее значение найдено аналитически.
Используя описанные результаты, мы можем приближенно оценить мощность предложенного критерия однородности. Для этого введем новые обозначения.
Пусть е — ошибка 1-го рода или так называемый уровень значимости критерия (вероятность отвергнуть гипотезу Н, когда она верна):
И пусть /3 — ошибка второго рода (вероятность принять гипотезу Н, когда верна гипотеза о том, что случайные вектора отличаются сдвигом <рт>п).
Тогда для больших т, п и малых уровней значимости е > 0 процедура нахождения мощности критерия однородности выглядит следующим образом:
1. По выборке Xi,., Xm оценивается постоянная Кх
2. Для выбранного уровня значимости е > 0, используя асимптотическую формулу (9) приближенно вычисляется критический уровень ze. Для этого решается уравнение
3. Тогда используя асимптотическую формулу (18) получим оценку (3 для мощности /3 критерия однородности
Приминяя изложенный выше метод, в диссертации показано, что исследуемый критерий однородности двух многомерных выборок
Kxxd£~2( £.
3 = 1- Кх Ze п , exp(~(ze - ш(Ло))2/2).
2:е - т(Ао) к/2
Заключение.
Итак, в настоящей работе был предложен практические непараметрические методы проверки гипотез об однородности двух многомерных выборок и независимости многомерных признаков, основанные на статистических процедурах В.И.Питербарга и Ю.Н.Тюрина. Эч^и методы просты в применеии и обладают высокой мощностью. Это показывает их перспективность как для теоретического, так и для практического использования.
1. Anderson N.H., Hall P. and Titteringon D.M. Two-sample test statistics for measuring discrepancies between two multivariate probability density functions using kernel-based density estimates.//J. Multivariate Anal.-1994. -N50. pp.41-54
2. Андерсон Т. Введение в многомерный статистический анализ.-М.: Физматгиз, 1963.-500с.
3. Bickel P.J. A distribution free version of the Smirnov two-sample test in the multivariate case.// Ann. Math. Statist. -1969. N40. - pp. 1-23
4. Blum J.R., Kiefer J. and Rosenblatt M. Distribution free tests of independence based on the sample distribution function.// Ann. Statist.-1961.-N32.-pp.485-498
5. Боровков А.А. Теория вероятностей.-M.: Наука, 1976.-352c.
6. Боровков А.А. Математическая статистика. -M.: Наука, 1984.-472с.
7. Bowman A.W. A comparative study of some kernel-based nonparamet-ric density estimators.// Manchester-Sheffield School of Probability and Statistics, Reseach Report N84/AWB/1 -1982.
8. Деврой Д., Дьерфи Л. Непараметрическое оценивание плотности. L1-подход.-М.: Мир, 1988.-408с.
9. Friedman J.H. and Rafky L.C. Multivariate generalizations of the
10. Wolfowitz and Smirnov two-sample tests.// Ann. Statist. -1979. N7. -pp.697-717
11. Гаек Я., Шидак 3. Теория ранговых критериев. -М.: Наука, 1971. — 375 с.
12. Ермаков С. М., Михайлов Г. А. Курс статистического моделирования.-М.: Наука, 1976.-320 с.
13. Hall P. Cross-validation in density estimation.// Biometrika. 1982.-N69. - pp.383-390
14. Henze N. A multivariate two-sample test based on the number of nearest-neighbor type coincidences.// Ann. Statist.- 1988.-N16.-pp.772-783
15. Henze N. and Penrose D. On the multivariate runs test.// Ann. Statist. -1999. N27. - pp.290-298
16. Hoeffding W. A non-parametric test of independence.// Ann. Statist.-1948. N19. - pp.546-557
17. Холлендер M., Вулф Д. Непараметнрические методы статистики.-М.: Финансы и статистика, 1983.-518с.
18. Кендэл М. Ранговые корреляции. -М.:Статистика, 1975.-214с.
19. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. -М.:Мир, 1970.-720с.
20. Крамер Г. Математические методы статистики. М.:Мир, 1975. -648с.
21. Lehmann E.L. Consistency and unbiasedness of certain non-parametric tests.// Ann. Math. Statist.-1951.-N22.-pp. 165-179
22. Lehmaim E.L. The powerof rank tests.// Ann. Math. Statist.-1953. -N24.-pp.23-43
23. Леман Э. Проверка статистических гипотез.-М.гНаука, 1979.-498с.
24. Mann Н.В. and Whitney D.R. On a test of whether one of two random variables is stochastically larger than the other.// Ann. Math. Statist. -1947.-N18. -pp.50-60
25. Motonen J., Oja H. Multivariate spatial sign and rank methods.// Non-parametr. Statist.-1995.-v.5.-N2.-pp.201-213
26. Piterbarg, V.I. Asimptotic methods in the theory of Gaussian processes and fields. Translations of Mathematical Monographs, AMS, Providence, Rhode Island, 1996.
27. Piterbarg, V.I. and Stamatovich, S. On maximum of Gaussian non-centered fields indexed on smooth manifolds.-1998.-Preprint N 449-Berlin,
28. Питербарг В.И., Тюрин Ю.Н. Многомерные ранговые корреляции: гауссовское поле на прямом произвидении сфер. / / Теория вероятностей и ее применения. -2000. -N45. -с.236-250
29. Piterbarg V.I. and Tyurin Yu.N. Testing for homogeneity of two multivariate samples : a Gaussian field on a sphere.// Mathematical Methods of Statistics. -1993. -N2. -pp.147-164
30. Puri M.L. and Sen P.K. A class of rank order tests for a general linear hypothesis.// Ann. Math. Stat.-1969.-N40.-pp.1325-1343
31. Puri M.L. and Sen P.K. Nonparametric Methods in Multivaiate Analysis.-New York:Wiley, 1971.
32. Randies R.H., Peters D. Multivariate rank tests for the two-sample location problem.// Comm. Statist. Theory Methods.-1986.-v.15.-Nil.-pp.4225-4238
33. Rosenblatt M. Limit theorems associated with varians of the von Mises statistic.// Ann. Math. Statist.-1952.-N23.-pp.617-623
34. Roy S.N. On a heuristic method of test construction and its use in multivariate analysis.// Ann. Math. Statist.-1953.-N24.-pp.220-238
35. Roy S.N. Some Aspects of Multivariate Analysis. New York: Wiley, 1957.
36. Rudemo M. Empirical choice of histogram and kernel density estimators.// Scandinavian Journal of Statistics.-1982. -N9.-pp.65-78
37. Schilling M.F. Multivariate two-sample tests based on nearest neighbors.// J.Amer. Statist. Assoc.-1986.-N81.-pp.799-806
38. Смирнов H.B. Теория вероятностей и математическая статистика. Избранные труды. М.:Наука, 1970. - с. 117-127, 267-277.
39. Stone C.J. An asymptotically optimal window selection rule for kernel density estimates// Annals of Statistics.-1984-N12.-pp. 1285-1297
40. Wald A. and Wolfowitz J. On a test whether two samples are from the same population.// Ann. Math. Statist.-1940.-Nil.-pp.147-162.
41. Weiss L. Two-sample tests for multivariate distribution.// Ann. Math. Statist. -1960. N 31. - pp.159-16463
42. Wilcoxon F. Individual comparisons by ranking methods.// Biometrics -1945.-N 1.-pp.80-83
43. Wilks S.S. Mathematical Statistics. New York:Wiley, 1962.