Исследование вероятностных методов решения интегральных и дифференциальных уравнений тема автореферата и диссертации по математике, 01.01.05 ВАК РФ
Голяндина, Нина Эдуардовна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Санкт-Петербург
МЕСТО ЗАЩИТЫ
|
||||
1998
ГОД ЗАЩИТЫ
|
|
01.01.05
КОД ВАК РФ
|
||
|
¿У/Я?-
У
Санкт-Петербургский государственный университет
Исследование вероятностных методов решения интегральных и дифференциальных уравнений
01.01.05 - теория вероятностей и математическая статистика
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель:
кандидат физико-математических наук,
доцент В. В. Некруткин
Санкт-Петербург - 1998
На правах рукописи
Голяндина Нина Эдуардовна
Содержание
Введение 4
Глава 1. Аппроксимация полугрупп, порожденных уравнениями баланса в пространстве мер
1 Дифференциальные уравнения в пространстве мер 20
1.1 Производные. Общие определения и обозначения .... 20
1.2 Дифференциальные уравнения в мерах. Условия и свойства ............................................................24
1.3 Полугруппы, порожденные дифференциальными уравнениями ........................................................25
2 Аппроксимация решения дифференциального уравнения в мерах 27
2.1 Общие условия................................................27
2.2 Аппроксимация с помощью скачкообразных семейств . 30
2.2.1 Условия сходимости..................................30
2.2.2 Предварительные результаты об ошибках аппроксимации ..........................................35
3 Уравнения и процессы вЯиих продолжения 37
3.1 Продолжение дифференциальных уравнений ............38
3.2 Продолжение марковских скачкообразных семейств . . 46
3.3 Перенос аппроксимационных свойств......................48
4 Эмпирические скачкообразные семейства 50
4.1 Эмпирические процессы и процессы в И71................50
4.2 Аппроксимация с помощью (п, &)-частичных семейств 55
Глава 2. Статистическое оценивание функционалов от решений уравнений баланса
1 Свойства оценок 67
1.1 Состоятельность..............................................67
1.2 Вклад начального распределения..........................69
1.3 Смещение и среднеквадратическое отклонение..........80
2 Уравнения больцмановского типа 83
2.1 Свойства уравнения . .......................................83
2.2 Алгоритмы....................................................85
2.3 Сравнение алгоритмов......................................89
2.3.1 Сравнение дисперсий................................89
2.3.2 Сравнение трудоемкостей..........................90
2.4 Случайное число сталкивающихся частиц................91
2.5 Случай локально-компактного П . . .....................93
3 Модельный пример. Асимптотика при £ -» оо 98
Глава 3. Решение методом Монте-Карло краевых задач для оператора Лапласа
1 Скорость сходимости марковских цепей 105
1.1 Основные неравенства...................105
1.2 Оценка скорости сходимости................109
2 Сферический процесс со сдвинутыми центрами 112
2.1 Основной вариант......................112
2.2 Модифицированный вариант................117
3 Краевые задачи для оператора Лапласа 119
3.1 Подход к построению оценок решения..........119
3.2 Решение краевых задач...................123
3.2.1 Внутренние задачи.................123
3.2.2 Внешние задачи...................125
3.2.3 Моделирование ...................127
Литература 130
Введение
Метод Монте-Карло является одним из основных методов решения многих уравнений математической физики, в том числе кинетических уравнений динамики разреженных газов и краевых задач. При изучении стохастических процедур решения таких уравнений возникают теоретические вопросы, связанные с исследованием статистических свойств оценок и трудоемкости их моделирования.
Задачи метода Монте-Карло состоят, вообще говоря, в построении несмещенных или малосмещенных оценок вп величины в (как правило, некоторого функционала от решения той или иной задачи математической физики), пригодных для вычислительных целей. Этим и определяется основное отличие таких задач от задач оценивания параметров в математической статистике: если в последней основное внимание уделяется точности оценки (скажем, ее дисперсии), а "исходный материал" для ее построения (выборка) считается заданным, то в методе Монте-Карло большое значение имеет способ конструирования выборки и естественно возникает понятие трудоемкости алгоритма, которую можно условно описать как среднее число "основных" математических операций, необходимых для того, чтобы точность оценивания величины в была достаточно высока.
Именно эта специфика и объединяет две различные задачи, решаемые в диссертации.
Диссертационная работа посвящена применению метода Монте-Карло к решению интегро-дифференциальных уравнений. В первых двух главах рассматривается вероятностное решение задачи Ко-ши для обыкновенных дифференциальных уравнений баланса в пространстве мер, правая часть которых может иметь, в частности, интегральный вид. Здесь основное внимание уделяется качеству аппроксимации, то есть смещению и дисперсии оценок изучаемого функционала.
В третьей главе на основе так называемого "сферического процесса со сдвинутыми центрами" строятся новые оценки решения внутренней и внешней задачи Дирихле для некоторых уравнений математической физики, связанных с оператором Лапласа. В этой задаче акцент ставится на уменьшении вычислительных затрат при получении малосмещенных оценок, что достигается путем выбора соответствующей марковской цепи, быстро сходящейся к границе области.
Остановимся более подробно на каждой из задач по-отдельности. В первых двух главах рассматривается вероятностное решение обыкновенных дифференциальных уравнений баланса в пространстве мер с помощью последовательности скачкообразных марковских ме-розначных семейств (то есть в схеме серий). Под уравнением баланса понимается уравнение
с начальным условием /1^=0 = /л € Н, где Н — множество вероятностных мер на борелевской сг-алгебре подмножеств некоторого метрического компакта — достаточно гладкое отображение на Н и для любого распределения и £ Н имеет место равенство С (г/) (И) = О (это и есть условие баланса). Такую форму имеют, например, однородные уравнения больцмановского типа, для них
= J Т(- \иии2)у{йщ)и{йи2) - V, (2)
В2
где "ударная трансформанта" Т является вероятностной мерой по первому аргументу при фиксированных двух других. Нас интересует значение ф(^), где ф — некоторый функционал на множестве Н.
Поскольку уравнения больцмановского типа являются характерным частным случаем уравнения (1), опишем постановку задачи на их примере.
Существует несколько вариантов стохастического решения уравнений больцмановского типа (например, методы Бёрда и Нанбу, а также множество их вариантов), но общая структура их одинакова: при большом п моделируется специальным образом сконструированный "п-частичный" случайный процесс
такой, что £(£„(0)) = ц®п (возможны и другие варианты началь-
п . ,
ного распределения), и рассматривается о;та(/, £) = ^ /(0 (¿))/п в
¿=1
качестве оценки линейного функционала ф(^) = / где распре-
деление = /¿г(^) является решением соответствующего уравнения больцмановского типа с начальными данными /л £ Н.
Математическое обоснование этого практического приема должно состоять в доказательстве нескольких утверждений. Первым
из них является утверждение типа закона больших чисел (ЗБЧ): р
Ф(^) при п —У сю. Если ЗБЧ имеет место для любой ограниченной непрерывной функции /, тогда он эквивалентен распространению хаоса [38]. Естественно, ЗБЧ играет основную роль в поставленной задаче. Поэтому он привлекал к себе усилия многих математиков, и к настоящему времени можно считать, что задача распространения хаоса решена практически полностью в случае ограниченного полного сечения рассеяния и частично для твердых шаров (в терминологии динамики разреженных газов) для некоторых видов марковских п-частичных процессов.
Первые теоретические результаты в этом направлении получил, по всей видимости, М. Кас [31]. В 70-х годах усилиями (в основном, японских) математиков были получены результаты типа ЗБЧ для общих уравнений больцмановского типа и некоторого класса марковских п-частичных процессов. Эти результаты могут быть названы теоремами корректности для соответствующих вычислительных алгоритмов при фиксированном моменте времени
С 80-х годов и до настоящего времени усилия специалистов были сконцентрированы на доказательстве функциональных предельных теорем (в основном типа функционального закона больших чисел на конечном отрезке времени) для различных видов п-частичных процессов и форм уравнений больцмановского типа. Авторами первых работ в этом направлении являются А. В. Скороход [22] и К. Ое^Ыа^ег [36]. Один из наиболее полных результатов получен Б. Мё-1ёагс1 [33], где рассматривается сходимость по вариации. Отметим, что эти и аналогичные результаты существенным образом используют линейную структуру фазового пространства рассматриваемых процессов, в то время как в диссертации для пространства И такой структуры не предполагается.
В то же время даже для фиксированного момента времени £ и линейного функционала ф вопросы точности аппроксимации величины оценкой о;те(/, ¿) остаются во многом открытыми. В 1967 г. Н. Р. МсКеап [32] исследовал главный член погрешности аппроксимации для простейшего модельного уравнения больцмановского типа (по существу, обыкновенное дифференциальное уравнение в [0,1]).
Для двух видов n-частичного процесса и достаточно общих (неоднородных) уравнений больцмановского типа в [20] и [10] было фактически получено асимптотическое разложение смещения и дисперсии оценки ujn(f,t) по степеням п-1. Однако коэффициенты при п~к выражались через достаточно сложные ряды, что затрудняло их анализ.
Отметим, что один из последних результатов, относящийся к оцениванию сверху погрешности приближения функционала на отрезке [0,Т] с помощью случайного процесса и;п(/, •)' принадлежит S. Méléard [33]. Полученная в работе верхняя граница имеет вид 0(есТ/п), что, несмотря на функциональный характер неравенства и точный порядок оценки, не является достаточным для приложений.
Важность отыскания пределов вида c(f,t) = limnD(a;n(/, £)) при п —> оо (то есть коэффициентов асимптотических дисперсий) связана с тем, что только после решения этой задачи можно ставить вопрос о центральной предельной теореме и состоятельных оценках дисперсий, необходимых для построения доверительных интервалов. Отметим, что, хотя центральная предельная теорема для общих уравнений больцмановского типа не доказана, проблема построения состоятельной оценки дисперсии может оказаться даже более сложной.
Метод решения описанной задачи в данной работе основан на технике теории однопараметрических полугрупп операторов. Если рассматривать однородное уравнение больцмановского типа как обыкновенное дифференциальное уравнение в банаховом пространстве конечных зарядов, появляется возможность применять к нему и к полугруппе, порожденной скачкообразным мерозначным марковским семейством, теорему Троттера-Като теории линейных сжимающих полугрупп в банаховых пространствах (см., например [12, 26]). Вместе с формулой Дюамеля этот метод позволяет не только доказывать результаты о сходимости, но и хорошо приспособлен для исследования точности аппроксимации.
Применение такого подхода к стохастическому решению систем обыкновенных дифференциальных уравнений в хорошо известно. Различные его аспекты (в том числе и вычислительные) обсуждались, например, в [23, 19, 34].
В рассматриваемой задаче, однако, имеются свои особенности, связанные с тем, что интересующие нас дифференциальные уравнения заданы на банаховом пространстве конечных знакопеременных мер (иногда для краткости в дальнейшем называемых просто мера-
ми), где норма заряда равна его полной вариации. Такое пространство обладает, вообще говоря, рядом специфических топологических свойств. Например, оно не является сепарабельным, а множество вероятностных мер Н не является в нем компактом. Поэтому на пространстве зарядов приходится рассматривать одновременно как сильную (сходимость по вариации), так и слабую (слабая сходимость) топологии. Так, несколько нестрого выражаясь, гладкость отображения С понимается в том смысле, что оно имеет необходимое число сильных производных (по вариации), в то время как эти производные являются слабо (и сильно) непрерывными.
Другой особенностью задачи является ограничение на класс рассматриваемых скачкообразных марковских процессов (или семейств), возникающее из требования их конструктивности (пригодности для практического моделирования). В принципе величина скачка ме-розначного процесса может быть любым конечным зарядом, и тогда можно ставить и решать задачу о нахождении оптимального в смысле минимума коэффициента асимптотической дисперсии процесса (см. [34] для систем обыкновенных дифференциальных уравнений в евклидовом случае). Но для произвольных зарядов такая процедура будет, вообще говоря, нереализуемой с точки зрения метода Монте-Карло, и поэтому требуется ограничить множество рассматриваемых процессов. В работе в качестве такого множества рассматриваются эмпирические мерозначные процессы, траектории которых имеют вид
1 п i=l
где (¿) — координаты соответствующего п-частичного процесса, а ^ — мера Дирака, сосредоточенная в точке х.
Таким образом, первая задача, решаемая в диссертационной работе, может быть сформулирована следующим образом: для однородных дифференциальных уравнений баланса в пространстве мер (включая однородные уравнения больцмановского типа) и гладких функционалов ф : Н К выделить достаточно широкий класс таких эмпирических мерозначных скачкообразных марковских процессов £„(*), что для них не только имеет место сходимость —> ф(^г), но и явным образом вычисляются коэффициенты асимптотических дисперсий и смещений, причем в форме, удобной для дальней-
шего анализа.
В диссертации приведены два примера такого анализа для уравнений больцмановского типа. Во-первых, для этих уравнений удается сравнить трудоемкости двух наиболее популярных алгоритмов Монте-Карло — алгоритмов Бёрда и Нанбу. Из практики хорошо известно, что первый из них обладает преимуществами, которые обычно объясняют учетом физических законов сохранения импульса и энергии, отсутствующих в методе Нанбу. В диссертации показано, что даже в абстрактной постановке, когда фазовое пространство одной частицы не является евклидовым, с точностью до о(1/п) трудоемкость метода Бёрда не больше трудоемкости метода Нанбу. Что касается использования законов сохранения при рассмотрении уравнения Больцмана динамики разреженных газов, то, по всей видимости, оно лишь усиливает это преимущество.
Второе применение полученных общих математических результатов относится к поведению коэффициентов асимптотических дисперсий при больших временах. На примере модельного уравнения Больцмана, изучавшегося в [3, 37], найдены асимптотические при t оо значения коэффициентов асимптотических дисперсий и смещений для двух основных монте-карловских алгоритмов. При этом оказалось, что главный член дисперсии оценки функционала по методу Бёрда при больших t превосходит такой же член в методе Нанбу, причем обе асимптотические дисперсии выражаются через дисперсию оцениваемого функционала по асимптотическому распределению [loo = lim [if Таким образом, в этом случае чисто статистиче-
Í—f оо
ские свойства оценки Бёрда оказались хуже, чем у Нанбу.
Вторая часть диссертационной работы посвящена традиционной для метода Монте-Карло проблематике решения краевых задач Дирихле, связанных с оператором Лапласа. Поскольку задачи такого сорта имеют вероятностное решение, связанное с траекторией вине-ровского процесса вплоть до его выхода на границу области, возникает естественная задача построения вложенной в этот процесс марковской цепи, "быстро" приближающейся к границе.
Например, если рассмотреть марковское семейство с переходной функцией р(х, •), которая является равномерным распределением на границе максимального шара с центром в точке х Е G, целиком содержащегося в ограниченной области G С Rm с границей Г = 8G, и
обозначить р£ момент первого попадания соответствующей марковской цепи £о — х-> £ъ ■ • • в е-границу Ге области (2, то при е —0
где и является решением внутренней задачи Дирихле для оператора Лапласа в области (7 с граничным условием = <р (естественно, при выполнении некоторых требований на функцию (р и область (7), а — точка границы, ближайшая к .
Таким образом, случайная величина ) является малосмещен-ной оценкой величины и(х) (для достаточно гладкой границы Г смещение пропорционально е) и возникает вопрос о скорости сходимости марковской цепи £п к границе Г, то есть о поведении в нуле функции Ежг/е. Тем самым в терминологии метода Монте-Карло речь идет о трудоемкости описанного вероятностного алгоритма решения внутренней задачи Дирихле для оператора Лапласа. Аналогичные рассуждения имеют место и для других (внутренних и внешних) задач Дирихле, связанных с оператором Лапласа (например, [8, 25, 21]).
Для описанной марковской цепи (она традиционно называется сферическим процессом) величина
/(е) = вир Бху£
является хорошо исследованной. А именно, для широкого класса областей С (например, для выпуклых и близки