Методы статистического анализа надежности сложных систем, основанные на некоторых асимптотически нормальных статистиках тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Хоссейн Беврани
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2005
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
ВВЕДЕНИЕ
1. КОЭФФИЦИЕНТ ГОТОВНОСТИ ПРИ НЕСЛУЧАЙНОМ ОБЪЕМЕ ВЫБОРКИ
1.1. Асимптотические свойства оценки К\.
1.2. Асимптотические свойства оценки К*.
1.3. Асимптотические свойства оценки Кч.
1.4. Асимптотические доверительные границы для К, построенные с помощью оценки К
2. ОЦЕНКИ МИНИМАЛЬНОГО ОБЪЕМА ВЫБОРКИ ДЛЯ КОЭФФИЦИЕНТА ГОТОВНОСТИ
2.1. Постановка задачи.
2.2. Оценки минимального объема выборки.
2.2.1.Решение, основанное на центральной предельной теореме
2.2.2.Решения, принимающие во внимание точность нормальной аппроксимации.
2.3. Точность нормальной аппроксимации и гарантированные доверительные интервалы для коэффициента готовности
3. О РАСПРЕДЕЛЕНИИ СТЬЮДЕНТА КАК АСИМПТОТИЧЕСКОЙ АППРОКСИМАЦИИ
3.1. Постановка задачи.
3.2. Распределение Стьюдента как масштабная смесь нормальных законов
3.3. Распределение Стьюдента как асимптотическая аппроксимация
3.4. О точности аппроксимации отрицательного биномиального распределения гамма-распределением.
3.5. О скорости сходимости распределений некоторых статистик к распределению Стьюдента.
4. КОЭФФИЦИЕНТ ГОТОВНОСТИ ПРИ СЛУЧАЙНОМ ОБЪЕМЕ
ВЫБОРКИ
4.1. Постановка задачи.
4.2. Коэффициент готовности при случайном объеме выборки, имеющем отрицательное биномиальное распределение
4.2.1.Асимптотические свойства оценки КЬ
4.2.2.Асимптотические свойства оценки
4.2.3.Асимптотические свойства оценки КЬ
4.2.4.Асимптотические доверительные границы для К, построенные с помощью оценки Кцп.
Развитие современной математической теории надежности, основанной, в первую очередь, на результатах и методах теории вероятностей и математической статистики, имеет не только вполне естественное серьезное теоретическое значение, но и огромную практическую важность. Это обусловлено, в первую очередь, насущной необходимостью решать на практике большое число конкретных задач, связанных с анализом рисковых ситуаций, то есть определением как размера возможных потерь, так и самой возможности потерь критического, например, катастрофического уровня из-за отказа тех или иных технических или информационных систем. Ситуации, связанные с риском отказов таких систем, чрезвычайно разнообразны. Они могут возникать в самых разных областях человеческой деятельности и могут иметь самые разные последствия -от больших материальных потерь и человеческих жертв при недооценке риска землетрясений, ураганов, наводнений или других природных катаклизмов большой силы при проектировании зданий или защитных сооружений, до значительных материальных и финансовых потерь при недооценке риска отказов энергетических или инфотелекоммуникацион-ных систем.
Многие классические методы оценки показателей надежности, разработанные, как правило, в середине XX века, основаны на идеальных предположениях о том, что параметры, характеризующие, скажем, воздействие внешней среды, имеют нормальное распределение, а параметры, характеризующие надежность составных частей изучаемой системы, например, время жизни (наработки на отказ) имеют показательное (экспоненциальное) распределение. Однако, к сожалению, зачастую применение классических методов приводит к недооценке риска отказов. Причины иногда имеющей место несостоятельности классических моделей могут быть разными. К примеру, если показатели надежности вычисляются на основе статистических данных, накопленных за определенное время, то существенную роль будет иметь то обстоятельство, является или нет поток событий, в результате которых накапливаются статистические данные, однородным. То есть, стремится ли отношение количества зарегистрированных в течение определенного интервала времени событий к длине этого интервала времени к некоторому числу с течением времени. Если такое сближение указанного отношения с некоторым числом имеет место, то классические модели могут давать адекватные результаты. Однако, если такое сближение не наблюдается, и указанное отношение сильно колеблется, оставаясь случайным (то есть непредсказуемым), то классические модели неадекватны и приводят к весьма существенной недооценке риска. В частности, вместо ожидаемого в соответствии с классической теорией нормального закона в подобных ситуациях (например, если упомянутое выше отношение ведет себя как гамма-распределенная случайная величина) могут возникать, скажем, функции распределения ущерба типа распределения Стьюден-та с произвольно малым числом 7 степеней свободы ( см. например [21], [9], [11]). Например, функция распределения Стьюдента при 7 = 2 (ему соответствует интенсивность потока информативных событий, имеющая асимптотически экспоненциальное распределение) имеет вид
Ф(х) = \ + Х/(2У/2 + Х2), Ж 6 К.
Хвосты этого распределения столь тяжелы, что у него отсутствуют моменты порядков 6 > 2. Несложно видеть, что для | < ¡3 < 1, (3-квантиль этого распределения равна у/2{2(3 — 1)/у/1 — (2(3 — I)2. Поэтому, например, расстояние между квантилями порядков 0.975 и 0.025 этого распределения (что в определенном смысле соответствует длине "наикратчайшего доверительного интервала" с коэффициентом доверия 0.95) оказывается почти в 2.2 раза больше соответствующей характеристики нормального распределения с тем же параметром масштаба. Этот пример наглядно иллюстрирует, насколько важно учитывать случайность интенсивности потока событий, несущих регистрируемую информацию. В противном случае можно существенно недооценить размер возможного ущерба или саму возможность критического ущерба (легко видеть, что реальная доверительная вероятность "95%-ного нормального" интервала, вычисленная по приведенной выше функции распределения оказывается меньшей, чем 0.82).
В такой же ситуации с асимптотически гамма-распределенной интенсивностью потока информативных событий вместо классического экспоненциального закона возникают распределения Парето с произвольно тяжелыми хвостами [16].
Неоднородность потока информативных событий, приводящая к возникновению неклассических вероятностных моделей с "тяжелыми хвостами", является, увы, не исключением, а правилом. Поэтому особую важность приобретает изучение именно внутренних, аналитических механизмов формирования вероятностных моделей рисковых ситуаций.
Асимптотический подход, основанный на предельных теоремах теории вероятностей, дает возможности получить не только сами формальные вероятностные модели рисковых ситуаций, традиционных для теории надежности, но и в некотором смысле дать разумное теоретическое объяснение их адекватности на основе минимальных предположений о внутренней структуре изучаемых характеристик, что чрезвычайно важно при решении задач анализа надежности технических и информационных систем и рисков, связанных с их отказами, в условиях стохастической неопределенности.
При изучении надежностных характеристик сложных технических и информационных систем (в том числе модифицируемых) возможны как минимум два подхода. Первый из них - параметрический - заключается в том, что распределения параметров, определяющих надежностные характеристики систем, считаются известными. Эти распределения задаются заранее исходя из каких-либо предположений или заключений (см., например [46], [49], [43], [44]).
Второй подход - непараметрический - стал предметом систематических исследований только в последнее время (см., например [32], [22]). Непараметрический подход заключается в рассмотрении моделей изменения самих надежностных характеристик, минуя задачу идентификации распределений. Если распределение времени безотказной работы известно хотя бы с точностью до параметра (известна модель), то параметрический подход может привести к более точным результатам. Однако, если модель неизвестна, то параметрический подход неприменим. Более того, если модель распределения времени безотказной работы выбрана неправильно, то параметрический подход может привести к существенно неверным результатам. В то же время непараметрический подход является устойчивым по отношению к выбору модели, так как непараметрические методы не зависят от конкретной модели распределения времени безотказной работы.
Именно непараметрический подход рассматривается в данной диссертации. В рамках этого подхода удается построить методы анализа показателей надежности сложных систем, и, прежде всего, коэффициента готовности, свободные от конкретного вида распределений времени безотказной работы технической или информационной системы и ремонтно-восстановительных работ. Более того, в диссертации изучается трансформация этих методов при случайной интенсивности потока информационных событий, в частности, при случайном объеме доступной выборки. Приведен достаточно общий пример такой организации испытаний сложных агрегированных систем, при которой объем выборки имеет отрицательное биномиальное распределение.
Основным объектом исследования в диссертации является коэффициент готовности, который в условиях стационарного режима работы системы имеет смысл вероятности того, что система окажется работоспособной в случайно выбранный момент времени. Этот показатель надежности сочетает относительную простоту его определения как отношения соответствующих средних арифметических с возможностью удобной интерпретации и лучше других показателей характеризует вероятность безотказной работы системы.
В диссертации разработаны методы оценивания коэффициента готовности, позволяющие получить не просто приближенные асимптотические непараметрические доверительные интервалы для коэффициента готовности, но гарантированные доверительные интервалы как для неслучайного объема выборки, так и для упомянутой выше ситуации, в которой объем выборки имеет отрицательно биномиальное распределение. В последнем случае вместо нормального в качестве асимптотического распределения коэффициента готовности возникает распределение Стью-дента. Поэтому в таком случае для получения гарантированных доверительных интервалов оказалось необходимым систематически исследовать точность аппроксимации распределений некоторых статистик распределением Стьюдента.
В главе 1 , используя непараметрический подход к статистическому оцениванию коэффициента готовности технической или инфотелекомму-никационной системы, мы приведём точечные оценки, построенные как и по полным, так и по неполным статистическим данным. Используя новые оценки скорости сходимости в центральной предельной теореме, мы также приведём гарантированные доверительные интервалы для коэффициента готовности.
В главе 2 приводятся оценки минимального объема выборки, достаточного для обеспечения требуемой точности с заданным уровнем надежности. Таких оценок мы рассматриваем три. Первая основывается на центральной предельной теореме (ЦПТ), но не учитывает погрешность нормальной аппроксимации. Вторая и третья оценки учитывают точность нормальной аппроксимации, обеспечивая уровень надежности не ниже требуемого, и потому являются гарантированными. Однако, как легко видеть, они превосходят первую, и поэтому следующая наша задача — выбрать наименьшую оценку.
В главе 3 мы будем рассматривать предельные теоремы для "нарастающих "случайных сумм, в которых предельные распределения являются масштабными смесями нормальных законов. И еще мы укажем довольно простую асимптотическую схему, непосредственно приводящую к распределению Стьюдента как к предельному. Потом поговорим о точности аппроксимации отрицательного биномиального распределения гамма-распределением. Наконец, применим результаты, полученные в третьем и четвертом разделах, к оцениванию скорости сходимости распределений некоторых статистик к распределению Стьюдента.
В главе 4 мы построим предельную функцию распределения для коэффициента готовности при случайном объеме выборки, имеющем отрицательное биномиальное распределение.
В приложении приводятся таблицы всех трех оценок главы 2 в зависимости от требуемой точности приближения, надежности статистического вывода и таких характеристик распределений слагаемых, как величина третьего абсолютного момента и максимума плотности. И еще мы приводим таблицы для требуемых объемов выборок, которые обеспечивали бы желаемую точность гарантированных оценок К.
1. Аничкин К.С., Беврани X., Оценка параметров распределений с тяжелыми хвостами. - Материалы международной конференции студентов, аспирантов по фундаментальным наукам "Ломоносов-2005". Секция ВМиК, С. 5.
2. Беврани X. Обобщение метода Монте-Карло для вычисления определенных интегралов. Доклады 11-й всероссийской конференции Математические методы распознавания образов, Москва, 2003, С. 208210.
3. Беврани X. Оценка объема выборки в методе Монте-Карло. Сборник тезисов докладов 11 международной конференции Математика, Компьютер, Образование (дополнительный выпуск), Дубна, 2004, С. 2.
4. Беврани X. Оценка параметра распределения Стьюдента как показатель тяжести хвостов. Сборник тезисов докладов 12 международной конференции Математика, Компьютер, Образование, г. Москва, 2005, С. 79.
5. Беврани X. Оценка объема выборки в методе Монте-Карло. Математика, Компьютер и Образование, Изд-во МГУ, 2004, Т. 11, С. 574-578.
6. Беврани X., Аничкин К. Оценка параметров распределений с тяжелыми хвостами с помощью эмпирического распределения. Математика, Компьютер и Образование, Изд-во МГУ, Москва, 2005, Т. 12, В печати.
7. Беврани X., Шевцова И. Г. Репрезентативность выборки в методе Монте-Карло. Статистические методы оценивания и проверки гипотез. Изд-во Пермского гос. Ун-та, Пермь, 2005, С. 135-138.
8. Бенинг В. Е., Королев В. Ю. Об использовании распределения Стьюдента в задачах теории вероятностей и математической статистики. Теория вероятностей и ее применения, 2004, том 49, вып. 3, С. 3-22.
9. Бенинг В. Е., Королев В. Ю., У Да. Оценки скорости сходимости распределений некоторых статистик к распределению Стьюдента. -Вестник Университета дружбы народов им. П. Лумумбы, сер. Прикладная математика и информатика, 2005 , В печати.
10. Бенинг В. Е., Королев В. Ю. и Прохоров Ю. В. Аналитические методы математической теории риска, основанные на смешанных гауссов-ских моделях. Вестник Московского университета, сер. 15 Вычисл. матем. и киберн. 2005, Специальный выпуск, с. 94-112.
11. Ермаков С. М. Метод Монте-Карло и смежные вопросы. М.: Наука, 1971.
12. Здоровцов И. А. От чего зависит устойчивость связи. Connect!, 2001, т. 5, С. 98-100.
13. Здоровцов И. А., Королев В. Ю. Основы теории надежности волоконно-оптических линий передачи железнодорожного транспорта. МАКС Пресс, Москва, 2004.
14. Золотарев В. М. Одномерные устойчивые распределения. "Наука", Москва, 1983.
15. Королев В.Ю. Прикладные задачи теории вероятностей: модели роста надежности модифицируемых систем. М., изд-во "Диалог-МГУ",1997.
16. Королев В. Ю. Сходимость случайных последовательностей с неза-висиммыми случайными индексами. I. Теория вероятностей и ее применения, 1994, т. 39, вып. 2, С. 313-333.
17. Королев В. Ю. Сходимость случайных последовательностей с независимыми случайными индексами. II. Теория вероятностей и ее применения, 1995, т. 40, вып. 4, С. 907-910.
18. Королев В. Ю. Смешанные гауссовские вероятностные модели реальных процессов. Москва, МАКС Пресс, 2004.
19. Королев В. Ю., Козлов А. О., Матвеев Ф. В. Рекуррентные модели роста надежности. Статистические методы оценивания и проверки гипотез, Изд-во Пермского государственного университета, Пермь,1998, С. 148-157.
20. Королев В. Ю., Шевцова И. Г. О точности нормальной аппроксимации. I. Теория вероятностей и ее применения. В печати
21. Прохров Ю. В. Об одной локальной теореме. Предельные теоремы теории вероятностей, Ташкент, изд-во АН УзССР, 1963, С. 75-80.
22. Селиванова Д. О. Оценки скорости сходимости для случайных сумм.- Диссертация на соискание ученой степени кандидата физико-математических наук, МГУ, Москва, 1995.
23. Шевцова И. Г., Беврани X. Оценки минимального объема выборки в методе Монте-Карло. Материалы международной конференции студентов, аспирантов по фундаментальным наукам "Ломоносов-2005". Секция ВМиК, С. 75-76.
24. Barlow R. E., Proschan F. Statistical Theory of Reliability and Life Testing Holt, Rinehart and Winston: New York, NY, 1975.
25. Baxter L.A., Li L. Nonparametric confidence intervals for the renewal function and the point availability Scandinavian journal of Statistics, 1994a, vol. 21, P. 277-287.
26. Baxter L.A., Li L. Nonparametric confidence intervals for the renewal function and the point availability Scandinavian journal of Statistics, 1994b, vol. 4, P. 317-326.
27. Baxter L.A., Li L. Nonparametric estimation of the limiting availability- Lifetime Data Analysis, 1996, vol. 2, P. 391-402.
28. Bening V., Bevrani H., Korolev V. The application of the student distribution in asymptotic problems of mathematical statistics. The XXVth International Seminar on Stability Problems for Stochastic Models, Italy, 2005, In print.
29. Bening V. E., Korolev V. Yu. Generalized Poisson Models and Their Applications in Insurance and Finance. VSP, Utrecht, 2002.
30. Bevrani H. A method of practical calculation of availability function. -XXIV International Seminar on Stability Sroblems for Stochastic Models, Jurmala, Latvia, 2004,P. 214.
31. Bevrani H. Parameter estimation for a class of heavy-tailed distribution. Book of abstracts 12th Iranian Researchers' Conference in Europe, Manchester, United Kingdom, 2004, P. 376.
32. Bevrani H., Korolev V. Yu. Prediction of reliability complex system with the order statistics. VII Iranian International Statistics Conference, Allame university, Tehran, Iran, 2004, P. 31.
33. Bevrani H., Korolev V. Yu. Prediction of reliability complex system with the order statistics. Proceedings of the VII Iranian International Statistics Conference, Allame University, Tehran, Iran, 2004, P. 251-256.
34. Bevrani H., Shevtsova I. Minimal estimates of samples value in the Monte-Carlo method. Book of abstracts 13th Iranian Researchers' Conference in Europe, Leeds, United Kingdom, 2005, In print.
35. Blatberg R. and Gondes N. A comparision of the stable and Student distributions as statistical models of stock prices.- J. Business, 1974, vol. 47, P. 244-250.
36. Cabuk S. Simple test of hypotheses on system availability and mean time to repair IEEE Trans. Reliability, 1986, vol. R-35, P. 581-583.
37. Gray H. L., Lewis T. O. A confidence interval for the availability ratio -Technometrics, 1967, vol. 9, P. 465-471.
38. Korolev V. Yu. A general theorem on the limit behavior of superposition of independent random process with applications to cox processes. -Journal of Mathematical Sciences, 1996, vol. 81, N. 5, P. 2951-2956.
39. Mi J. Interval Estimation of availability of a series system IEEE Trans. Reliability, 1991, vol. R-40, P. 541-546.
40. Prawitz H. Limits for a distribution, if the characteristic function is given in a finite domain. Skand. AktuarTidskr., 1972, P. 138-154.
41. Rao C. R. Linear Statistical inference and its Applications, Second edition John Wiley and Sons: New York, 1973.
42. Thompson W. E., Pelicio P. S. Bayesian confidence limits for the availability of Systems IEEE Trans. Reliability, 1975, vol. R-24, P. 118-120.
43. Uchaikin V. V., Zolotarev V. M. Chance and Stability: Stable Distributions and their Applications. VSP, Utrecht, the Netherlands, 1999.