Исследования последовательных процедур проверки статистических гипотез тема автореферата и диссертации по математике, 01.01.05 ВАК РФ

Новиков, Владимир Викторович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1996 ГОД ЗАЩИТЫ
   
01.01.05 КОД ВАК РФ
Автореферат по математике на тему «Исследования последовательных процедур проверки статистических гипотез»
 
Автореферат диссертации на тему "Исследования последовательных процедур проверки статистических гипотез"

< и

1 и 1-4.»

РОССИЙСКАЯ АКАДЕМИЯ НАУК

МАТЕМАТИЧЕСКИЙ ИНСТИТУТ имени В.А.Стеклова

На правах рукописи

НОВИКОВ Владимир Викторович

ИССЛЕДОВАНИЯ ПОСЛЕДОВАТЕЛЬНЫХ ПРОЦЕДУР ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

01.01.05 - теория вероятностей и математическая статистика

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

МОСКВА 1996

Работа выполнена в Математическом институте имени В.А.Стеклова Российской академии наук.

Научный руководитель:

доктор физико-математических наук, доцент А.А.НОВИКОВ.

Официальные оппоненты:

доктор физико-математических наук М.В.БУРНАШЕВ, доктор физико-математических наук Б.С.ДАРХОВСКИЙ.

Ведущая организация:

Московский Государственный технический университет имени Н.Э.Баумана.

Защита состоится 11 апреля 1990 г. в "14" часов на заседании специализированного совета Д 002.38.83 при ордена Ленина и ордена Октябрьской революции Математическом институте имени В. А. Стек лова Российской академии наук по адресу 117960, Москва, ул. Вавилова , 42.

С диссертацией можно ознакомиться в библиотеке института. Автореферат разослан 11 марта 1990 г.

Ученый секретарь специализированного совета,

диктор физико математических наук ,—, В.А.ВАТУТИН.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность темы.

Математическая теория проверки статистических гипотез, в которой критерии (решающие правила) появляются как решения точно поставленных оптимальных проблем, была создана Ю.Нейманом и Э.Пирсоном в 30-х годах нашего столетия. Работы А.Вальда и его книга "Последовательный анализ", вышедшая в свет в 1947 году, не только пролили новый свет на классическую теорию, но и стимулировали развитие направления, которое теперь можно назвать вероятностной теорией оптимального управления.

В отличие от классических задач математической статистики, в которых число производимых наблюдений (объем выборки) фиксируется заранее, методы последовательного анализа характеризуются тем, что момент прекращения наблюдений (момент остановки) является случайным и определяется в зависимости от значений наблюдаемых данных.

Преимущество последовательных методов было продемонстрировано А.Вальдом1 на задаче различения двух простых гипотез по результатам независимых наблюдений. Он установил, что такие методы дают выигрыш в среднем числе наблюдений по сравнению с любым другим способом различения, в том числе с фиксированным объемом выборки. Более того, А.Вальд указал и тот последовательный метод, названный им последовательным критерием отношения вероятностей (SPRT), который оказался оптимальным в классе последовательных тестов. Иными словами, тест Вальда позволяет различать гипотезы с заданным уровнем вероятностей ошибок за наименьшее (в среднем) время наблюдения. При этом несомненным достоинством такой процедуры является простая ( хотя и Приближенная) форма зависимости между порогами теста и соответствующими вероятностями ошибок.

Развитие идей А.Вальда на разнообразные постановки в рамках задачи проверки двух простых гипотез, в осуществлении которого боль-

1 Wald A. Sequential Analysis. John Wiley, New York,1947, 212p.

шую роль сыграли работы Т.Андерсона, Д.Вольфовица, Д.Блекуэлла, М.Гиршика, Х.Роббинса, А.Н.Ширяева , привело к разработке и применению соотвествующих алгоритмов в радио- и гидролокации, сейсмологии, телеметрии и других отраслях науки и техники. Поскольку задача проверки гипотез является формой представления широкого круга проблем принятия решений, усложнение статистических моделей, применявшихся на практике, стимулировало работы по посторению и изучению свойств последовательных тестов в более сложных постановках, как в смысле модели наблюдений, так и в смысле структуры проверяемых гипотез.

С одной стороны, для проверки более чем двух гипотез или двух сложных гипотез не удается (за исключением некоторых частных постановок) построить тест, аналогичный тесту Вальда в смысле минимизации среднего времени наблюдения, что влечет многообразие подходов и постановок оптимизационных задач. С другой стороны, бурное развитие статистики случайных процессов как в теоретическом, так и в плане-приложений требует исследования задач проверки гипотез для все более сложных моделей наблюдений с использованием, так называемых, мартингальных методов. Общеприняиым стало рассматривать асимптотические свойства тех или иных процедур при стремлении вероятностей ошибок к нулю. При этом актуальной становится задача оценивания и уточнения соотношений между предельными и допредельными значениями различных характеристик, в том числе среднего времени наблюдения.

Повышенный интерес к проблемам устойчивости статистических выводов обуславливает усиление важности задачи проверки гипотез с, так называемой, "зоной безразличия", то есть областью значений параметра, которой не соответствует ни одна из гипотез. Как было замечено Д.Кифером и Л.Вейссом, классический тест Вальда утрачивает свойство минимизации среднего времени наблюдения, когда параметр принимает значение из области безразличия. Перспективным представля-

ется метод, предложенный И.В.Павловым и развитый А.А.Новиковым и В.П.Драгалиным, построения адаптивных последовательных тестов. Следует отметить, что при рассмотрении задач проверки более чем двух гипотез обобщение тсста Вальда можно проводить несколькими способами, в равной мере как и накладывать условия на вероятности ошибок.

Все вышесказанное объясняет многообразие работ, опубликованных по теме последовательной проверки гипотез. Несмотря на это, актуальным остается вопрос изучения в рамках общего подхода к проблеме, свойств соответствующих тестов, в том числе и адаптивных, как при справедливости одной из гипотез, так и в зоне безразличия. Развитие в последнее время вероятностных приложений, где последовательный характер получения данных является нормой, за счет финансовой и страховой математики (кроме традиционных радиолокации, связи и радиотехники) позволяет говорить о большом практическом потенциале интеграции методов последовательного анализа с современной статистикой случайных процесов.

Цель работы заключается в построении общего подхода к проблеме проверки статистических гипотез, унифицирующего модели с дискретным и непрерывным временем, простыми и сложными, одно- и многоальтернативными гипотезами, при наличии или отсутствии зоны безразличия, разработке методов построения тестов для ее решения, в том числе и адаптивных. Кроме того, целью работы является изучение их свойств, таких как оптимальность, асимптотическое поведение среднего времени наблюдения, связь между характеристиками тестов при различных предположениях.

Методы исследования.

При решении поставленных задач применялись методы, с одной стороны традиционные для последовательного анализа, а с другой стороны подходы, широко применяемые в статистике случайных процессов, называемые еще мартингальными.

G

Представляемая диссертация предлагает следующий подход в рамках последовательной проверки параметрических гипотез.

Общая постановка задачи формулируется в терминах стохастического базиса. При этом случай непрерывного и дискретного времени унифицирован. Затем вводятся понятия вероятности ошибок и классы тестов, сформированные по принципу, в соответствии с которым накладываются ограничения на упомянутые вероятности. После этого определяются последовательные процедуры. Принципиальных конструкций предлагается три, при этом внутри каждой есть адаптивная и неадаптивная версии. Исследования связей между параметрами процедур и вероятностями ошибок тестов ставят целью получение правил выбора значений порогов, обеспечивающих принадлежность теста требуемому классу.

В зависимости от нужд конкретного исследования формируется среда исследования, состоящая из общей постановки, указания типа теста, класса тестов, определения оптимальности, если нужно, уточненной модели наблюдений, количества и структуры гипотез, и т.д.

Научная новизна и практическая значимость.

Все основные результаты работы являются новыми. Они могут быть использованы для построения последовательных процедур, а также для прогнозирования свойств этих процедур на основании проверки соответствующих условий.

Публикации и апробация работы.

По теме диссертации опубликовано 3 работы. Результаты диссертации докладывались на семинаре по статистике случайных процессов под руководством А.Н.Ширяева в Математическом институте им. В.А.Стеклова, на семинаре "Последовательный анализ", действовавшим там же под руководством А.А.Новикова, на Ninth European Young Statisticians Meeting (Роттердам, Голландия, август 1995) и на Первой Всероссийской школе-коллоквиуме по стохастическим методам геометрии и анализа (Абрау-Дюрсо, сентябрь 1994).

Структура и объем работы.

Диссертация состоит из введения, трех разделов и списка литературы, изложенных на 76 страницах. Список литературы содержит 42 наименования.

СОДЕРЖАНИЕ РАБОТЫ.

'В автореферате сохраняется порядок нумерации утверждении и формул, использованный в диссертации.

Первый раздел содержит общую постановку задачи проверки гипотез и определение основных объектов последовательного анализа данной задачи.

Пусть (П, Т, Ро) есть стохастический базис с непрерывным или дискретным параметром t Е Z+ = {0,1,...}, £ € К+ = [0, оо), удовлетворяющим " обычным условиям". То есть Т/ есть семейство неубывающих сг-алгебр, непрерывное справа и Тч пополнено всеми множествами нулевой меры При этом сама мера Ро зависит от параметра 9, принимающего значения из параметрического множества ©. Поток сг-алгебр Т1 интерпретируется как доступная к моменту £ информация. Иными словами, Т{ — гг(А%, л < £), где X = А'< есть некоторый (наблюдаемый) процесс на (Г2, Т).

Параметрическое множество 0 разделено на тп, тп > 2 непересекающихся подмножеств 0,-. Будем называть множество I — 0 \ (53,-О,-) зоной безразличия. Символ ^ здесь и в дальнейшем в отношении множеств обозначает объединение взаимно непересекающихся множеств.

Рассмотрим задачу проверки гипотез вида

Я, :(?6 0;, I < г < гп

по наблюдениям X. Назовем последовательным тестом 5 набор из двух объектов:

1) правила остановки т, являющегося марковским моментом относительно потока то есть такой (12, случайной величиной, что для каждого £ событие {г < £} принадлежит

2) Решающего (терминального) правила d, представляющего из себя •7>-пзмер1шую функцию со значениями из множества {1,..,т}. Значение d трактуется как номер принимаемой гипотезы.

Заметим, что процедура с фиксированным объемом наблюдений Т может рассматриваться как последовательный тест 5 с т = Т.

Важнейшей характеристикой каждого теста является вероятность принятия ошибочных решений. Мы вводим классы тестов в соответствии с ограничениями, которые накладываются на вероятности ошибок.

Определение 1.1.1.

Если задана матрица ||«;,j|j с нулевой диагональю и a,-j € (0,1), то класс A'djttijH) составляют такие S = (r,d), что

Рo{d = j)<aij WeQi, г ф j, i, j = 1,..., m.

Определение 1.1.2.

Если задан вектор ||а,|| с компонентами «,■ 6 (0,1), то 8 € Л'(||а,-||), при

?o{d ф г) < щ, V6 G ©;, г = 1, ...,т. Определение 1.1.3.

Для случая байесовской постановки с априорным распределением 7г(#) параметра 9 € 0 и заданного вектора |j«,-|| с элементами a,- G (0,1) определим класс

/1(|Ы|, 7г) = = (т, d) : Pff{wrong accept Hi) < a,-, i = 1, ...,m}.

Здесь мера P^. соответствует распределению тт.

В построении последовательных тестов важную роль играют процессы отношения правдоподобия. В §1.2 предполагается, что при каждых в,ф € в соответствующие меры Ро и Рф локально эквивалентны, и

существует мера Р (Е {Р»}, доминирующая все остальные меры т рассматриваемого параметрического семейства. Введем следующие процессы:

(2Л)

Цв) :=1оВ £,(<?),

где справа в определении Ь((0) стоит производная Радона-Никоднма сужения соответствующих мер на гг-алгебру Т,. Подробное описание этого процесса можно встретить в различной литературе,"'3''1.... Отметим лишь, что в сделанных выше предположениях процесс Ь^О) является Р) - мартингалом.

Со статистической точки зрения параметр в является неизвестным и его оценивание само по себе является важной задачей. Предположим наличие такой оценки, то есть для каждого ( определена Р( - измеримая функция со значениями в в. Степень близости к оцениваемому параметру в данный момент не играет роли. Определим адаптивный процесс отношения правдоподобия следующим образом:

Для дискретного времени положим Л/((0) = /((0)—(0), (1О(0) -0), и

I

(2.2) /,=1о81, = ^Д/в(0.-1).

В непрерывном случае мы рассматриваем случай, когда отношение правдоподобия имеет следующую структуру (экспоненциальное свойство распределений):

(2.4) Ь((0) = С1ехр{(а(0),Х1)-Ь(0)А1},

2Жакод Ж. Ширяев А.Н. Предельные теоремы для случайных процессов. -М. Издательская фирма "Физико-математическая литература", 1004, Том 1 и 2.

3Липцер Р.Ш., Ширяев А.Н. Теория мартингалов, М. Наука, 1985, 512 с.

4Яшин А.И. К задаче последовательной проверки гипотез. Теория вероятностен и ее применения, т. 28, н. 1, с. 157-155.

где Ct,Ai,Xt — Tt-согласованные процессы, Xt - семимартингал со значениями в R/', Л > 1, At - неубывающий процесс, а(0) и 6(0) - ограничены на 0, < •,• > - есть скалярное произведение. В этом случае для непрерывного справа и имеющего пределы слева процесса 6t адаптивное отношение правдоподобия есть

(2.5) Lt := ft exp j jf (ae(9..),dXa) - jf be(0,_)A4.} .

Следующая лемма демонстрирует схожесть свойств адаптивного и неадаптивного отношений правдоподобия. Лемма 1.2.1.

Lt является [Tt, Р) - локальным мартингалом, кроме того, для любого марковского момента т относительно Tt

Eo/{r < 00)7—777 < 1, при каждом 0 6 0. Ьт[в)

Наконец, §1.3. содержит определение последовательных процедур, свойства которых и составляют предмет изучения. Таких процедур три, каждая имеет адаптивную и неадаптивную модификации. Введем обозначения

h(Qj):= вир /4(0).

Адаптивная версия 5/ = (T/,dj) (Ak-SPRT)

Ti - inf jf : i, > 111ax[h{ßj) + «¿,j]|, a,j > 0,

(0.2) fj = min n, (I/ = argmin r,-.

' i

Неадаптивный тест = (r/,d/) (k-SPRT)

Ti = inf j£ : lt{Qi) > 111ax[i,(0j) + a,j] l, aitj > 0,

(0.2*)

т/ = min г;, <li = argimnr,

i •

Впервые подобная неадаптивная процедура исследована в работах Г.Лордена5,6 для более чем двух простых гипотез как обобщение известного теста Вальда. Адаптивная модификация была предложена в работе7 как более приемлимое средство для проверки сложных гипотез в присутствии зоны безразличия.

Следующая конструкция последовательных тестов представляет собой обобщение исследовавшихся ранее в работах Г.К.Голубева и Р.З.Хасьмин ского8 (небаиесовская постановка, простые гипотезы), а также С.Баума и В.Вееравалли9. Адаптивный вариант рассматривается впервые. Адаптивный тест II 6ц = (т¡¡,<1ц) (АМ-вРКТ).

5Lordon G. (1972) Likelihood ratio tests for sequential k-decision problem. - Ann. Math. Stat., v.43, 1412-1427.

6Lorden G. (1977) Nearly-optimal sequential tests for finitely many parameter values.

- Ann. Stat., v.5, 1-21.

7Dragalin V.P. and Novikov A.A. Adaptive sequential tests for composite hypotheses.

- In: Statistics and Control for Stochastic Processes V. 199G, Moscow, TVP, pp.27-38.

8Голубев Г.К., Хасьмннский Р.З. О последовательном различении нескольких сигналов в гауссовском белом шуме. Теория вероятностей и ее применение, - 1983, т.28, вып.З, с. 544-553.

9Baum C.W. and Veeravalli V.V. (1994) A sequential procedure for multihypotliesis testing. IEEE Trans. Inform. Theory, vol.39, 1994-2007.

(0.3)

T/i = mini;, (111 = arglllilli T;.

Неадаптивный тест II 6ц — (тц,(1ц) (M-SPRT).

(0.3*) тц = шп! г,, (1ц = argmini г,-.

Следующий тест восходит к работам И.В.Павлова10'11. Хотя адаптивное отношение правдоподобия впервые, по-видимому, появилось в работе Х.Роббинса и Д.Сигмунда12 , именно И.В.Павлов сконструировал тест, определение которого дается ниже, применительно к задаче проверки гипотез в схеме независимых одинаково распределенных наблюдений. Само же определение совпадает с определением, данным в уже упоминавшейся работе А.А.Новикова и В.П.Драгалина.

Адаптивная версия ¿¡и = (тщ,йщ) (Р-^ев!;).

<7, = М : /( > [/,(0.) + а,-]} , а,- > 0,

(0.4) т/// =ттгаах<7;, Лщ = агцтах сг,-.

• зФ' »■

Неадаптивная версия Р-теста Ьщ = {тщ^щ) в общем виде не рассматривалась, однако в работе13 речь идет, в сущности, об неадаптивном Р-тесте для проверки трех гипотез. Эта процедура легко строится заменой адаптивного отношения правдоподобия в (0.4) на процесс /¿(0,).

В дальнейшем при ссылках на тот или иной тест мы пользуемся аббревиатурами, указанными в скобках. Несложно заметить, что для задачи проверки двух простых гипотез неадаптивные версии построенных тестов совпадают с тестом Вальда. Леммы А1, А2 и 1.2.1 формулируют соотношения между значениями порогов тестов и вероятностями ошибок.

10ПавловИ.В. Последовательная процедура проверки сложных гипотез. - Теория вероятностей и ее применения, т. 33, 1988, н.2, с. 280-292.

11 Павлов И.В. Последовательная процедура проверки сложных гипотез с приложением к задаче Кифера-Вейса. - Теория вероятностей и ее применения, т. 35, 1990, н.1, с. 138-142.

12Robbins Н. and Siegmund D. A class of stopping rule for testing of parametric hypotheses. - In: Proceedings of the Sixth Bcrceley Symposium on Theory of Probab. and Math. Stat., Univ. California Press, v.4, 1973, 37-41.

13Lai T.L. Asymptotic optimality of invariant sequential probability ratio tests. The Ann. of Statictics, 1981, vol.9, n.2, 318-333.

Раздел 2 объединяет результаты, относящиеся к свойствам последовательных тестов для проверки сложных гипотез (адаптивных и неадаптивных), когда продолжительность процедуры характеризуется математическим ожиданием момента остановки по мере, соответствующей истинному значению параметра 0.

В §2.1 определяется понятие оптимальности и раскрывается связь этого понятия с конкретной постановкой задачи. Оптимальность понимается в асимптотическом смысле, то есть в предположении стремления вероятностей ошибок к нулю. В частности, дается Определение 2.1.1. Тест 5* = (т*,(1*) называется оптимальным первого порядка в классе К, где К определяется ограничениями на вероятности ошибок, если

(i) 8*ек-

(ii) inf Eör = Е9т*(1 + о(1)) для всех 9 € 0,-, г=1,...,т,

<5£/\

при стремлении вероятностей ошибок к нулю.

Разумно также говорить о понятии оптимальности первого порядка в более широком смысле, потребовав выполнение соотношения (ii) определения 2.1.1 при всех значениях параметра. В дальнейшем будем ссылаться на эту трактовку как на определение 2.1.1*.

§2.2 посвящен доказательству асимптотической оптимальности в смысле Определения 2.1.1* (2.1.1) для теста AMSPRT (MSPRT).

Кроме предположений, сделанных при постановке задачи в разделе 1, будем считать выполненными следующие условия: 1). В случае класса K(ajj),

(2.1) | logajj| ~ logcvi^l, с константами с,j > 0.

Для тестов типа I (A-kSPRT и k-SPRT) пороги задаются соотношениями

(2.2)

(i{j — | logrtjjl для всех г ф j, i,j = 1,..., m.

В случае класса Л'(а,), для тостов типа I (A-kSPRT и k-SPRT) порош задаются соотношениями

(2.3) ntJ = |logiv,-| + log(m - 1)Л'(||п',||);

для тестов типа III (P-test) пороги задаются соотношениями

(2.4) (ii = i log«;| для всех г = 1,... ,m.

В случае класса Л'(тг,«,-), для тестов типа II (AMSPRT, MSPRT) пороги задаются соотношениями

(2.5) (ii = | logfv, | для всех i = 1,... , m.

2).Представление (1.2.4) имеет вид :

(2.G) Lt(0) = U «ф{(а(б),Л'0 - b(9)t},

где процесс Л'/ имеет независимые однородные приращения. Кроме того, найдется константа С такая, что

(2.7) |«(ö)| + |Ь(0)| < С < оо для всех 9 6 Ö.

3). Предположим существование расстояния Кульбака-Лейблера между мерами Po и Р^, определяемого как

(2.8) Р{0,<Р):=МШ-Ш]-

Обозначим

(2.9) р;{9) = inf р(9,<р),

и введем для заданного класса Л'(Ца^Ц) функцию на Э

зФ* Ci i

(2Л0) п(9)

\{6) := maxmin 0 € I.

1 J Ci j

Для классов Л"(||«, ||) и Л"(||пг,-||, п) функция Х(0) будет определяться аналогично (2.10) с заменой константы с,-^ на с.^ и с,- соответственно. Всюду ниже предполагается, что Л (А) > 0.

4). Условия,накладываемые на степень близости используемой в процессе адаптивного отношения правдоподобия оценки с оцениваемым параметром, формулируются следующим образом. Существует вещественное р, 1 < р < оо, такое, что

оо

если £ег+,то ,£>)]'' < со,

(2.11) < = 1

/»ОО

а если t Е

Л

Теорема 2.2.1.

Пусть = состоит из конечного числа точек, причем

п(в = 9jtk) > 0 и выполнены условия 1)-4).

Тогда

А

тГ Е0т ~ Е„т,, ~ ——, 0 6 9.

Л-(||<.;||,тг) \{0)

Этот результат аналогичен полученному А.А.Новиковым и В.П.Драгалины для Ак-ЭРКТ и Р-теста (теорема А1).

Таким образом, адаптивные версии всех описанных в разделе 1 процедур при выполнении условий §2.1 являются аснмтотически оптимальными в смысле Определения 2.2.1*, тогда как соответствующие неадаптивные тесты оптимальны в смысле Определения 2.2.1.

В §2.3 проводятся более тонкие исследования момента остановки в рассматриваемых процедурах, которые приводят к доказательству теорем 2.3.1 и 2.3.2. Эти теоремы дают второй член разложения для тестов к-БРИТ (Ак-БРИТ), МБРКГ (АМвРКГ). Полученные в предыдущем параграфе результаты основаны на получении первого члена в разложении Ей т. Для практических приложений хотелось бы понимать

это как аппроксимацию. Как было отмечено в работе аппроксимация первого порядка практически перестает таковою быть при неоднозначности argmiii y,- !>j{0)- Это иллюстрируют и примеры из §2.5. В этом случае мы получим второй член разложения для Еот. Введем следующие обозначения:

Gí(0) = {у> 6 6 \ ((-); + I) : Л{()) = р(в, v?)} для 0 6 0,-.

Непосредственно из предположений 1) - 4) с учетом (2.15) следует, что

.1 ,. lt{0)-l,{.4>k)-p{0,Vk)t 1)к Ьш -г-'

t-* ОО уД

являются гауссовскнми с Ey//¿ = 0. Теорема 2.3.1.

Пусть справедливы условия теоремы 2.2.1. Кроме того, в предположении 4) р < 2. Пусть процесс А' имеет конечный третий момент относительно каждой Pq. Тогда для теста I

для теста II

где

ЕЛ.С.

С,п = Е о шах ?//,. кeGi

Замечание. В случае простых гипотез и пустой зоны безразличия все приведенные выше результаты справедливы для неадаптивных версий к-БРИТ, М-ЭРКГ, Р-теста, за исключением теоремы 2.3.1 для Р-теста.

В §2.4 рассматривается важный частный случай постановки, где выполняются условия (1) - (4) . Это широко распространенная в таких приложениях, как радиолокация, телеметрия, задача поиска сигнала в многоканальной системе. Используя специфику задачи, удается не только более конкретно описать уже доказанные ранее разложения второго порядка для среднего времени наблюдения, но и получить аналог закона больших чисел и асимптотическую нормальность момента остановки. К описанной задаче применяется тест к - БРИТ.

Пусть наблюдается А'-мерный случайный процесс Лг(*) = (Л'(1)(0,... , х{к) (Л)), где г е или t е с независимыми компонентами . Предположим, что распределение процесса за-

висит от параметра 0¿, принимающего только два значения /<о и //[, которые можно интерпретировать как соответственно отсутствие и наличие сигнала в ¿-ом канале (г = 1,2,... ,к). На основе наблюдений проверяется к простых гипотез :

(4.1) Я,- : 0,- = //, , 0, = /|0, ф г; г = 1, к.

Введем еще гипотезу отсутствия сигнала в системе Но : — /;0, г =Д,/с. Пусть г - ой гипотезе соответствует ме])а Р,-.

В данной ситуации тест к - БРКГ выглядит следующим образом:

6(п) = (т(а),<1(а)), где т(а) — пин т,-(«), <1(а) = а.Щ1шиъ(а),

г,(«) = : > а + птх

где

а Р1, (I = 0,1), обозначает меру, порожденную процессом при

в1 = Утверждение следующей теоремы есть конкретизация теоремы 2.3.1.

Теорема 2.4.1.

Пусть процесс имеет относительно меры Р; независимые однородные приращения и конечный третий момент. Тогда при а -» оо

где

,Зк = Е шх г/_,-, Ч] ~ М(О,1) и независимы , / = Е1 - Е0^1'.

Конкретная постановка позволяет найти также разложения для дисперсии момента остановки.

Теорема 2.4.2.

Пусть выполнены условия теоремы 2.4.1, тогда

В.т, (а) - + о2о1к ^ + 0(а3/4), а оо, .

где

7/с = О тах г]], ~ Л/"(0,1) и независимы,

а? =Б%(1),/=0,1, а знак Ю' обозначает дисперсию по мере Р'.

На основе приведенных результатов доказаны следующие теоремы. Теорема 2.4.3.

В условиях теоремы 2.4.1 имеет место сходимость по вероятности:

' 1, а —> оо.

Е,т(а)

Теорема 2.4.4.

В условиях теоремы 2.4.1 распределение момента остановки к- ЙПТГ является асимптотически нормальным, т.е.

т(а) — Е;т(») ^ п

ч/б^о

сю.

Практическая значимость полученных результатов, в том числе и польза учета второго члена разложения, продемонстрирована при помощи числового моделирования примеров, описанных в §2.5.

В последнем разделе используется набор условий, альтернативный предложенному в §2.2 . Эти условия обобщают предложенный Т.Л.Лаем подход, в соответствии с которым требуется выполнение усиленного закона больших чисел для логарифма отношения правдоподобия.

А именно, предполагается, что для любого (р € © выполняется соотношение:

(3.1) т^М^д^) [р0)-а,.,

где q(в, <р) > 0 для в ф (р.

Отметим, что условие (3.1) выполнено для схемы независимых одинаково распределенных случайных величин, а также используется в исследованиях по асимптотическому поведению мощности критерия Неймана - Пирсона14 .

Результат следующей теоремы можно рассматривать как определение нижней границы для продолжительности наблюдений в. Предположим, что Э = } + ...+ {О к}.

Теорема 3.1.

Пусть 6 = (т,(1) € Л'(||а,'^||). Тогда, если шах,-^-а,-—> 0, то для любого е 6 (0,1)

Рв{т>ет®}->1 чвее,

14Линьков Ю.Н. Асимптотические методы статистики случайных процессов. Киев, Наукова думка, 1993, 255с.

(3.2) где тп(0) = minmax * , 9 £ I,

I log a,-1 max 1 , t = 6i.

i^i q(i,j)

На основе этого утверждения можно предложить иной, чем в разделе 2, подход к понятию оптимальности. Это понятие сформулировано в теореме 3.2. Теорема 3.2

Тест Sj = (тi,d[) с порогом, выбранным из (3.6'), обладает свойством: для каждой гипотезы i

т

(i.s.Pj —т—г —> 1, при max«; —* 0, m(0i) i,j

где m(0,) определено в (3.2). Следовательно, для любого 5 G Л'(||а,1У||) и любого е G (0,1)

Р(т > ет/) 1, при таха;,- —> 0. Следствие 3.1.

Тест 5] с порогами o:j,- = |loga_, | 4- log(m — 1), обеспечивающими <5/ € К(||а,-||), обладает аналогичными свойствами:

т

1 Р, —a.s., при maxa,j —> 0.

m(0i)

Следствие 3.2.

Теорема 3.2 и следствие 3.1 справедливы также для Р-теста 5щ.

Впервые в данной постановке рассмотрены непрерывное время наблюдений и адаптивные тесты. При выполнении условий А1 или А2 доказана оптимальность по вероятности первого порядка на всем параметрическом пространстве, включая зону безразличия адаптивных тестов (0.2) и (0.4).

А1).Предположим, что 6t такова, что функцня Lt(e)/Lt(e) является правильно меняющейся на [1,оо) с показателем р > 0, иными словами,

Lt(e)/Lt = t"gt{e),

где gt{0) - медленно меняющаяся, то есть

Oi(0) - 9и{в) I, *->оо.

А2) .Существует константа с такая, что

lt{et)-h(0) <сГс, £>0.

Теорема 3.4.

Если выполнены условия А1 или А2 и (3.1), то 5j с a¡j = |loga,j| является оптимальным в классе ЛГ(||а,^||) в смысле выполнения сходимости:

=> 1 Ро — a.s. при всех 0 6 0.

т{в)

Аналогичный результат получен для Р-теста S/u-

Автор считает своим долгом выразить глубокую признательность своему научному руководителю Александру Александровичу Новикову за выбор направления исследования, поддержку и постоянное внимание к работе.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Novikov A. A. and Novikov V.V. Sequential procedures for multihypotheses

testing //In: Proceeding of Japan-Russian Symposium on Probability Theory, Tokyo, 1995,(in print)

2. Novikov V.V. On asymptotic expansions for k-SPRT.// In: Statistics and Control for Stochastic Processes V. Moscow,TVP,1996, pp.213-219

3. Novikov V.V. On properties of sequential procedures for multihypotheses

testing.// In: Ninth European Young Statisticians Meeting, Erasmus University Rotterdam, 1995, pp. 21 - 24.