Разработка параметрических методов анализа данных и методов трехмерного моделирования для малоуглового рассеяния монодисперсными системами тема автореферата и диссертации по физике, 01.04.18 ВАК РФ

Козин, Михаил Борисович АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
1997 ГОД ЗАЩИТЫ
   
01.04.18 КОД ВАК РФ
Автореферат по физике на тему «Разработка параметрических методов анализа данных и методов трехмерного моделирования для малоуглового рассеяния монодисперсными системами»
 
Автореферат диссертации на тему "Разработка параметрических методов анализа данных и методов трехмерного моделирования для малоуглового рассеяния монодисперсными системами"

! ^

на правах рукописи

КОЗИН Михаил Борисович

УДК: 548.732

РАЗРАБОТКА ПАРАМЕТРИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ И МЕТОДОВ ТРЕХМЕРНОГО

МОДЕЛИРОВАНИЯ ДЛЯ МАЛОУГЛОВОГО РАССЕЯНИЯ МОНОДИСПЕРСНЫМИ СИСТЕМАМИ.

Специальность 01.04.18 - кристаллография, физика кристаллов.

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Москва - 1997

Работа выполнена в Институте кристаллографии им. А.В.Шубникова Российской Академии Наук.

Научные руководители:

кандидат физико-математических наук Д.И.Свергун, кандидат химических наук В.В.Волков.

Официальные оппоненты:

доктор физико-математических наук профессор Б.М.Щедрин, доктор физико-математических наук профессор И. Н.Сердюк.

Ведущая организация - Институт биохимической физики РАН.

Защита состоится " 14 " мая 1997 г. в "10:30" часов на заседании диссертационного совета Д 002.58.01 по защите диссертаций на соискание ученой стенени кандидата физико - математических наук в Институте кристаллографии имени А.В.Шубникова РАН по адресу: 117333 Москва, Ленинский проспект, 59.

С диссертацией можно ознакомиться в библиотеке Института кристаллографии РАН (Москва, Ленинский проспект, 59).

Автореферат разослан "_" 1997 года.

Ученый секретарь диссертационного совета Д 002.58.01 при Институте кристаллографии РАН кандидат физ.-мат.наук

В.М.Каневский

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. Малоуглопое рассеяние рентгеновских лучей и нейтронов (МУР) - универсальный метол исследования надатомного строения дисперсных систем различной физической природы. Изучая рассеяние на неодиородностях плотности, пространственные размеры которых велики но сравнению с длиной волны падающего излучения (составляющего несколько ангстрем), можно получить информацию о структуре вещества на уровне разрешения, более грубом, чем межатомные расстояния. Метод МУР широко используется для изучения надатомного строения различных высокодиснерсных систем, таких как стекла, сплавы, синтетические полимеры и пр:

Значение МУР особенно велико для исследований биологических объектов, например белков, нуклеиновых кислот, вирусов, клеточных мембран, рибосом. Образец представляет собой раствор идентичных частиц (монодисперсную систему), а экспериментальная интенсивность рассеяния - усредненную по всем ориентациям интенсивность рассеяния одной частицей, что позволяет изучать четвертичную структуру нативных биополимеров Ь физиологических растворах.

Развитая экспериментальная база метода позволяет получать дифракциошшые данные в широком диапазоне векторов рассеяния. В то же время, 'среди методов анализа малоугловых данных в настоящее время отсутствует единый подход к проблеме, позволяющий оценивать эффективность различных методов. Поэтому задача разработки оптимальной системы извлечения структурной информации из данных малоуглового рассеяния является весьма актуальной. ■

Целью работы являлось развитие параметрических методов обработки и интерпретации данных и методов трехмерного моделирования, и создание па их основе прототипа автоматизированной системы анализа данных МУР.

Научная иовизна. Разработан новый параметрический метод обработки экспериментальных данных МУР, который является оптимальным с точки зрения точности восстановления идеальной кривой

интенсивности рассеяния. Осуществлена модификация алгоритма интерпретации экспериментальных данных, позволяющая однозначно определять трехмерную структуру частиц в монодисперсных системах при низком разрешении. Развитые методы применены к определению надатомной структуры белка обратной транскриптазы вируса иммунодефицита человека. Создана графическая система для трехмерного моделирования, отвечающая задачам представления моделей низкого разрешения, полученных в результате обработки и интерпретации экспериментальных данных МУР.

Научная значимость работы. Разработанные параметрические методы обработки и интерпретации данных малоуглового эксперимента являются оптимальными с точки зрения точности и устойчивости получаемых результатов и позволяют надежно рассчитывать интегральные параметры объекта и его характеристические функции непосредственно из экспериментальных данных с учетом приборных искажений, и определять трехмерную структуру низкого разрешения из данных МУР. Алгоритмы обработки и интерпретации реализованы в виде компьютерных программ и показали свою эффективность при изучении строения ряда белков.

Созданная графическая система трехмерного моделирования способна обмениваться информацией с программами анализа данных и позволяет интерактивно контролировать процесс интерпретации экспериментальных данных рассеяния.

Апробация работы. По теме диссертации опубликовано 6 печатных работ. Список их приведен в конце автореферата.

Основные результаты работы докладывались на IV Международном симпозиуме "Экспериментальные методы в изучении рибосомы" (Рингберг, Германия, 1995), V Международной конференции "Биофизика и синхротронное излучение" (Гренобль, Франция, 1995), X Международной конференции по малоугловому рассеянию (Кампинас, Бразилия, 1996), на конкурсе научных работ Института

кристаллографии РАН (1996), на Международной школе "Прямые методы в определении фаз" (Йорк, Англия, 1997).

Структура и объем диссертации. Диссертация состоит из введения, 5 глав, заключения и выводов. Общий объем диссертации 111 страниц, включая 26 рисунков, 3 таблицы и список литературы из 82 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обсуждается актуальность темы, формулируются задачи исследования и дается краткое содержание разделов диссертации.

В червой главе дается обзор методических задач, возникающих при обработки и интерпретации экспериментальных данных МУР, а также при представлении полученных результатов. Задача обработки данных МУР монодисперсными системами (то есть системами хаотически ориентированных идентичных невзаимо-действующих частиц) формулируется в §1.1 как задача восстановления "идеальной" функции интенсивности рассеяния I(s) (¿-|s|=( 4л/A)sinО, 29 - угол рассеяния, Л -длина волны падающего излучения) по набору экспериментальных значений /£,(sI)=VK[/(s,)] + rc(s,), i~i,...Nexp на отрезке измерения [smn,smax\, где W - оператор приборных искажений, a n(s) -статистический шум. Структурная информация о частице заключена в характеристической функции yir), причем гу(г) и slis) связаны синус-преобразованием Фурье [1J. Методы обработки данных МУР рассмотрены в §1.2. Основное внимание уделяется параметрическим методам, в Korop.ix либо si is), либо r){r) представляются в виде ряда по некоторому набору ортогональных функций, а коэффициенты . разложения, определяются по МНК. Такой подход позволяет одновременно устранять • все типы приборных искажений и шумов, что является несомненным достоинством параметрических методов. Общим же их недостатком является относительный произвол как в определении длины ряда, так и в выборе конкретной системы функций. Длину ряда ортогональных функций разумно связывать с информативностью данных МУР, а именно,

с числом независимых параметров (§1.3), которое, согласно теореме "отсчетов" Котельникова, равно М K-(smax-smin)DI я, D - диаметр частицы. Однако структура используемых при параметризации систем ортогональных функций (кубические B-сплайны, тригонометрические функции, полиномы Эрмита [2]) никак не связана, по крайней мере теоретически, с информативностью данных. Таким образом, актуальным является вопрос о поиске оптимальной системы функций для параметризации задачи обработки данных МУР.

Интерпретация данных МУР монодисперсными системами состоит в создании модели низкого разрешения для рассеивающей частицы (§1.4). Форма частицы описывается с помощью угловой функции F(ca)=r, устанавливающей соответствие между телесным углом со ~(ß,<p) и расстоянием т до границы частицы в направлении со. Эффективным методом аппроксимации функции формы является приближение радом

FL(®)= I 2flmYlm(o). <1)

/=0т=-1

где У/т(ю> - сферические гармоники [3]. Алгоритм определения формы частицы состоит в определении мультипольных коэффициентов fi„, непосредственно по экспериментальным данным из условия минимизации функционала среднеквадратичных отклонений

R}(J, f!m) = ff } -Vi'k) - Wf ■ <2>

[ ¿=1 a{ j ¿=1 ai

где Iiis) - интенсивность рассеяния моделью (1), рассчитываемая по набору {fim}, а oj - стандартные отклонения измеренных интенсивностей. Разрешение описания формы функцией Fi(<o) можно оценить величиной xRq /(1+1), где R0 - радиус сферы равного с частицей объема, L - длина ряда (1). С ростом L разрешение улучшается, но одновременно возрастает число неизвестных в параметризации (1), что осложняет однозначное восстановление формы частицы. Проблема оптимального соотношения между детальностью формы модели и однозначностью ее

восстановления недостаточно освещена в литературе и является актуальной.

На этане представления результатов МУР задача состоит в создании графической системы трехмерного моделирования ориентированной на работу с моделями низкого разрешения (§1.5). Существующие программы для представления атомных структур, полученных кристаллографическими методами [4], не вполне подходят для этой задачи, так как работают, как правило, с моделями тина "проволочного скелета". Графические пакеты, применяемыми в электронной микроскопии являются скорее средством подготовки изображения модели, чем инструментом для ее исследования.

Во второй главе показывается, что оптимальной для параметризации задачи обработки данных МУР является система линейных вытянутых сфероидальных функций (ЛВСФ) [5] и рассматриваются свойства этих функций. Из общей схемы параметризации вытекают требования к системе параметризующих функций (§2.1): ортогональность и полнота на области определения функции ryir) в прямом пространстве, то есть на отрезке [0,D]; ортогональность и полнота в обратном пространстве на отрезке [0,smax]; оптимальность с точки зрения невязки приближения "идеальной" функции интенсивности. Для формулировки последнего требования ограничим класс аппроксимируемых функций множеством Е(s,smax) функций с финитным спектром (спектр Фурье равен нулю вне конечного интервала), энергия которых в основном сосредоточена на отрезке [0,smax\\

о / -<о

Тогда для некоторого s функция /(х)еЕ(г,лиаг) в силу теоремы Порода и того, что при r>D. Назовем систему ортогональных функций

[<р„] оптимальной для параметризации функций из множества E(s,sm(,T),

| N II2

если при любом N величина невязки щах min \ f ~ Е^ЧМ для

/■егСад,,,«.)^}^! 1=0 1

нее минимальна среди всех систем ортогональных функций. Таким свойством обладает система линейных вытянутых сфероидальных функций (ЛВСФ) {^B(c,.s),n=0,l, . }, где c=smaxD. Традиционное их название является не совсем удачным, ибо с математической точки зрения ЛВСФ не линейны. ЛВСФ четны при четных п и нечетны при нечетных п, а также обладают следующими свойствами [6] (§2.2) :

(1) На интервале (-да, +<ж) ЛВСФ ортонормированы, а система ЛВСФ полна в пространстве функций с финитным спектром.

(2) на отрезке [-smaxismax] они ортогональны, а система ЛВСФ полна в пространстве функций, интегрируемых с квадратом:

W ÎQ,n*k

J = L (3)

~~smax

(3) ЛВСФ являются собственными функциями преобразования Фурье как на всей прямой, так и на отрезке и, как следствие, являются собственными функциями преобразования

, ч sinDlx-s) , , , . , ч

* УпУс'Х> n(x-s) (4)

~smax

(4) При аппроксимации функции fis), спектр которой сосредоточен на

оо

отрезке длины D, рядом вида ¡Г an\\iп(с,s) коэффициенты ап могут быть

и=О

вычислены, используя лишь значения fis) на отрезке [0,slnax\:

smax

an=T~ in-VV*(c>s)ds' (5)

" о

(5) Собственные числа ЛВСФ Х.„(с) упорядочены: 1>Яо(е)>Д|(г;)>....>0, причем с возрастанием я убывают неравномерно. Значения первых Mcrii-smaxD/n собственных чисел близки к единице, а затем следует резкий экспоненциальный спад.

Свойство двойной ортогональности системы ЛВСФ обусловлено тем, что эти функции составлены из угловой и радиальной частей решения скалярного волнового уравнения Гельмгольца в вытянутой сфероидальной системе координат (§2,3), и таким образом

удовлетворяют волновому уравнению дважды: на всей прямой и на конечном отрезке. Само вычисление ЛВСФ представляет собой непростую задачу, для решения которой до сих пор предлагаются новые методы. В §2.4 описан устойчивый алгоритм расчета ЛВСФ, разработанный нами специально для решения задач обработки данных МУР. Этот алгоритм реализован в • виде программы CALCPRO, написанной на языке FORTRAN 77, и позволяет вычислять все четные или нечетные ЛВСФ {y/n(c,s)},n<N для достаточно больших N и с используя технику вычисления собственных векторов с помощью QL-алгоритма с целыми сдвигами. В §2.5 обсуждается точность разработанного метода в сравнении с ранее опубликованными алгоритмами и приводятся примеры некоторых ЛВСФ.

Третья глава посвящена использованию системы ЛВСФ для обработки данных МУР. Общая схема метода (§3.1) состоит в том, чтобы искать функцию lis) в виде

s/(s)= 5>„y„(c,s), (б)

л=О

где суммирование ведется только по нечетным п, так как sl(s) - нечетная функция. Так как ЛВСФ инвариантны к преобразованию Фурье, характеристическая функция частицы fir) выражается в виде

Ыг)--^ 1ьпц,п{с/-^) , (7)

¿к п-О

ь = а Г" ¿2=1 ,йЧ

рп(с)0 ' 1 <8>

Благодаря свойствам ЛВСФ, каково бы ни было значение М обрыва рядов (6) и (8), аппроксимация функций /(л) и у{г) с помощью этих рядов будет оптимальной. Коэффициенты ап определяются по МНК минимизацией функционала.

л2

0(М)= v i=l

2М+1

*iJ(si)~ Та„у'„ (с, «=1

(9)

где у/п= XV( цгп), W-оператор приборных искажешшй, а се, - стандартные отклонения в измеренных интенсивностях. В силу двойной

ортогональности ЛВСФ матрица системы нормальных уравнений в данном случае диагональна. Когда размер матрицы превышает М¡<--$„ииЕ)/я (число независимых параметров по Котельпикову), ее число обусловленности резко падает. Таким образом, выбор М¡( в качестве длины ряда (6) является теоретически обоснованным. Оиисашшй метод был проанализирован на модельных примерах (§3.2). Модельная кривая интенсивности МУР искажалась нормально распределенным статистическим шумом с относительным отклонением о=5%. По данным 5тах и Б вычислялась система ЛВСФ ^п(с,$) при с=5пшхО для нечетных п. Первые М=[$тахО/л\+\ коэффициентов «„*, п= 1,..., 2М+1 ряда (6) вычислялись но МНК стандартным методом сингулярного разложения с пороговым значением числа обусловленности 0.1х10~3. Восстановленные по формулам (6)-(8) функции ¿¡'С?) и д"(г)=гу{г) сравнивались с модельными функциями.

Для оценки точности восстановления вычислялась величина

Л = (10)

Коэффициенты Ьп' сравнивались с модельными коэффициентами Ьптог1, которые получаются при разложении в ряд по ЛВСФ точной модельной функции д(У)=гу{г).

Таблица 1 Результаты обработки модельных данных МУР сферой.

| К-ты "Кг .! Ьп Ъ"в | и той ип К |

! 1 1.00 .59665*103 .60236*103 .13845

; 3 .998 .78513*102 .8034П02 .042038 1

! 5 1 .825 ! .26802*10' .33806*10! .041769 I

1 7 .112 1 -.59397*102 -.57574*102 .027601

1 9 .131*10-2 .30325*103 .32409*103 ! .34143*103 .017887 I

1 11 I .477*10 3 .15855*104 .38841*10* | .24555* 104 .016950 |

! 13 ! .807* 10"8 ; .22134*104 .48275*105 1 .54034*1О5 .014402 !

1 15 I .736*10 11 .122081О4 -.14468*107 | -.12670*107 .013902 I

1 17 1 .396*10-" .23108*104 .75441*108 ! .40848*108 .012998 1

: 19 ! .134*1017 .37955*1О4 .20846*Ю10 I .16837*10'° .012899 !

! 21 1 .299*10'21 .24982*104 .69688*10и 1 .87416*10п .012465 !

! 23 ! .459*10-25 .23611*104 ,28017*1013 ! .55312*1013 .012449 ]

1 25 1 .500*10 .54426*104 .21063*1014 I .42566*1015 .012429 1

0.0 0.5 1.0 1.5 20 25 30

Рис. i. Результаты обработки модельных данных МУР сферой, (а) -функция sl(s) в обратном пространстве (логарифмический масштаб): сплошная линия - модельная; кружки восстановленная, (б) - функция гу{г) в прямом пространстве: пунктир- модельная, сплошная линия - восстановленная.

В качестве модельных были использованы тела, характеристическая функция которых допускает аналитическое выражение: сфера и эллипсоид вращения. В Табл. 1 приведены результаты модельных расчетов для сферы радиуса 5. Значения Ьп' при п > = 7, как и следовало ожидать, сильно отличаются от bnmod. Задача их определения (а значит, более точного восстановления д(т)) является некорректной, и для ее решения надо использовать методы регуляризации по Тихонову [7] (§3.3). Особенность регуляризации в данном случае заключается в том, что найденные коэффициенты с п<М не меняются (что снимает проблему определения параметра регуляризации), а дополнительные

коэффициенты Ь/еэ определяются из условия, чтобы регуляризованное решение в прямом пространстве

минимизировало выполняющий роль стабилизатора функционал [8]

Значения Ъ£е9 и достигнутые с их помощью Я-факторы (10) показаны в Табл.1 после горизонтальной черты. Видно, что применение регуляризации позволяет существенно улучшить качество восстановления характеристической функции. На Рис. 1(а,б) показаны результаты обработки модельных данных рассеяния сферой.

Четвертая глава посвящена проблеме единственности интерпретации данных МУР и разработке соответствующего алгоритма. С увеличением длины ряда (1) улучшается угловое разрешение модели, однако ее восстановление становится неоднозначным. Аналитически разрешить эту проблему трудно в силу ее нелинейности и большой потери информации при сферическом усреднении. Поэтому для исследования ранее предложенного алгоритма построения модели низкого разрешения [9] был предпринят ряд численных экспериментов (§4.1). Для заданного L конструировалось модельное тело, форма которого описывается набором сферических гармоник {[¡т}, -1<т<1\ l<L. Для этого тела рассчитывалась модельная интенсивность рассеяния /¿(s), которая затем искажалась случайным шумом и подавалась на вход алгоритма восстановления. Восстановление модели заключается в определении набора коэффициентов {//и} из условия минимизации целевой функции

удерживают центр тяжести модели (г0х, г0г) в центре координат и обеспечивают положительную определенность функции формы; весовые множители р п V задаются так, чтобы вклад соответствующих слагаемых

(И)

(12)

составлял не более 10'2 от значения целевой функции. Для минимизации целевой функции (13) была использована программа нелинейной оптимизации NL2SOL на базе алгоритма Левенберга-Марквардта [10].

Количество независимых параметров, описывающих форму, определенную рядом (1) по L сферическим гармоникам, есть Л/£=(/„+1)2-6 (уменьшение на шесть параметров обусловлено произвольностью положения и ориентации частицы). Единственность построения модели определяется соотношением между Ni и числом Мк независимых параметров, описывающих экспериментальные данные. Численные эксперименты проводились для ¿=3,4 по данным, искаженным 10%-ным относительным шумом, а также по данным без участка Гинье, искаженным 3%-ным относительным шумом, а также систематическими погрешностями (имитация реальных условий малоуглового эксперимента). В целом проведенные модельные эксперименты позволяют утверждать, что если Nто можно с высокой степенью надежности утверждать, что получаемое решение однозначно (с точностью до энантиоморфного преобразования частицы, не меняющего интенсивности рассеяния) в классе моделей, описываемых функцией формы (1).

Таким образом, для однозначного построения модели рассеивающей частицы, необходимо ограничивать спектр сферических гармоник таким значением L, что Mj-A^iM^. Влияние этого ограничения на функцию формы Fia) описывается сверткой со следующей функцией (§4.2)

О M -, L+x pdcosi)~pLAcosy} (14)

vL\I ) 4n i-cosy '

где P[ - полином Лежандра /-ой степени, у - угол между точками на поверхности частицы, 0<у<п.

Однако при восстановлении формы следует учитывать влияние обрыва спектра на интенсивность рассеяния, что уже сложно сделать аналитически ввиду нелинейной связи между {fim} и I(s). Обрыв спектра можно учесть с помощью следующей модификации алгоритма определения формы частицы (§4.3). Обозначим через Е эллипсоид,

интенсивность рассеяния от которого /¿(я) аппроксимирует начальную часть экспериментальной интенсивности рассеяния (3 независимых параметра по Котельникову) наилучшим образом. Разложив функцию формы найденного эллипсоида в ряд (1) по сферическим гармоникам и удержав слагаемые с 1<Ь, получим форму £.'/.• Положим а>(х) = (х) / (я) и будем подавать на вход алгоритма нелинейной

минимизации., взвешенные экспериментальные значения а>(5,-),Г(^). Модифицированный алгоритм был опробован на экспериментальных данных рассеяния более чем 15 белками с известной атомной структурой в кристалле, и вовсех случаях обеспечивал удовлетворительное воссташвление формы частиц при низком разрешении.

Использования развитых алгоритмов обработки и интерпретации данных МУР иллюстрируется исследованием строения обратной транскриптазы вируса иммунодефицита человека (ВИЧ) в растворе. (§4.4). Этот белок синтезирует двуспиральную ДНК из вирусной РНК, и тем самым играет ключевую роль в воспроизводстве вируса ВИЧ. Его молекулярный вес 105 КДа, диаметр 125 А, измерения проводились в диапазоне 0.017-0.2 А"1. Интенсивность малоуглового рассеяния раствором ВИЧ была измерена на установке Х-33 (ЕМВ1., синхротрон ОЕ5У). При обработке данных с использованием ЛВСФ (с=зтахО=25) первые Мк=8 коэффициентов вычислялись но МНК, причем величина функционала (9) составила 0.347, что говорит о завышенной оценке погрешности измерений. Затем с помощью регуляризации длина ряда была увеличена до М\=12 членов. На Рис. 2 (а) приведены экспериментальные значения и восстановленная кривая интенсивности рассеяния. На Рис. 2 (6) показаны функции распределения по расстояниям р(.г)=г2у(.г) в прямом пространстве, восстановленные предложенным методом и широко применяемой программой СЫОМ [И]. При .интерпретации данных поиск оптимальных мультипольных коэффициентов велся до ¿=4, (20 независимых параметров). Величина Я/=0.8% (2) характеризует качество полученной модели низкого разрешения. Форма полученной модели представлена на Рис. 3 в виде

s, nnr' г

Рис. 2. Анализ данных МУР раствором обратной ранскриптазы вируса ВИЧ: (а) - функция ils) в обратном пространстве (логарифмический масштаб); (б) - функция р(г) в прямом пространстве: кружки - метод с использованием ЛВСФ; сплошная линия - метод GNOM.

Рис. 3. Модель низкого разрешения (прозрачная оболочка) и атомная модель обратной ранскриптазы вируса ВИЧ.

прозрачной поверхности. вместе с кристаллографической моделью данного белка из Белкового Банка Данных (РОВ) [12]. Сравнительный анализ этих двух моделей, полученных разными методами подтверждает адекватность описания формы данного белка полученной моделью низкого разрешения.

Пятая глава посвящена описанию графической системы трехмерного моделирования, разработанной для анализа данных МУР. Описанная методика интерпретации данных МУР предполагает определенные требования к графической системе для анализа ее результатов (§5.1). Такая графическая система должна:

1) представлять произвольную конфигурацию трехмерных моделей (1), а также кристаллографические и электронно-микроскопические модели;

2) контролировать положение и ориентацию каждой отдельной модели, а также нескольких моделей, объединенных в одну группу;

3) при анализе сложных конфигураций изменять степень прозрачности некоторых тел;

4) рассчитывать кривую интенсивности рассеяния для каждого тела, учитывая изменения его расположения;

5) автоматически корректировать модель низкого разрешения на основании полученных экспериментальных данных;

6) быть достаточно гибко конфигурируемой и переносимой.

Общая схема организации графической системы трехмерного моделирования АББА для анализа данных МУР, удовлетворяющей перечисленным требованиям, показана на Рис. 4.

Трехмерную поверхность, описываемую функцией формы /-Х««), можно рассматривать С§5.2) как результат растяжения (сжатия) сферы единичного радиуса вдоль лучей, исходящих из ее центра, с коэффициентами К со), непрерывно зависящими от углов а, задающих направления лучей. Для моделирования таких форм удобно сначала задать равномерную сетку на поверхности сферы, после чего каждая форма будет определяться лишь набором расстояний от центра до ее границы по соответствующим направлениям.

Рис. 4. Схема организации графической системы Л55/1.

Программа TRIANG производит триангуляцию сферы при помощи квазиравномерной сетки, и сохраняет соответствующую информацию в выходном файле. Переход от набора мультипольных коэффициентов {flm)> 1=0,...L, определяющих модельную функцию формы f/Cai)

к самой модели осуществляется программой FLM2SLD. Она вычисляет значения г;=Р/,(<Уг), и сохраняет их в бинарном файле на жестком диске вместе с координатами центра модели и именем файла, содержащего триангуляционную информацию. Таким образом, этот файл содержит всю информацию, необходимую для представления модели.

Для представления подготовленной таким образом трехмерной модели средствами персонального компьютера была разработана программа РН (§5.3). Эта программа, написанная на языке FORTRAN для 32-битного транслятора MS Fortran PowerStation, может представлять до 10-ти различных форм, при этом каждая форма обладает своим набором графических атрибутов, в которые входят: цвет, стиль изображения (линейный каркас; поверхность с равномерной закраской граней; сглаженная по методу Гуро поверхность) и тип представляемой модели. Кроме описанного выше типа моделей низкого разрешения, программа может также представлять атомные структуры стандартного PDB-формата в виде совокупности символов или как цепи Са-атомов.

Рис- 5. Визуальный контроль процесса создания модели низкого разрешения по данный МУР с помощью системы Л55/4.

Наличие средств для контроля положения всех изображаемых объектов в абсолютной системе координат с помощью "горячих" клавиш дает возможность сравнивать модели, полученные описанными выше методами анализа данных МУР, с моделями, полученными кристаллографическими и электронно-микроскопическими методами.

Те же принципы заложены в основу графической системы ASSA (§5.4), созданной на базе рабочей станции SUN SPARC ZX-20, так как ресурсов стандартного персонального компьютера для реализации всех сформулированных выше требований недостаточно. Л55Л позволяет манипулировать до 52 объектами или группами элементов любых типов, рассматриваемыми как отдельные объекты. Графические атрибуты объектов включают коэффициент прозрачности поверхности (см. Рис.3), а управление программой осуществляется с помощью системы меню. Текущая конфигурация может быть сохранена в дисковом файле, а графический образ может быть сохранен в файле формата PostScript.

Важной особенностью комплекса ASSA является интерфейс с программами анализа данных: FLM2IS, рассчитывающей модельную кривую интенсивности рассеяния для модели и SH_DET, определяющую форму частицы по данным МУР. Внешние модули запускаются из программы трехмерного моделирования как независимые процессы, все необходимые параметры задаются с помощью командных окон, а обмен данными между родственными процессами происходит по специально организованным информационным каналам. ASSA передает в программу SHJDET имя файла данных МУР и число сферических гармоник L, определяющее разрешение модели, а получает набор мультипольных коэффициентов {fin}, \m\<l, l-0,...L. Уточнение формы происходит в реальном времени: последовательные приближения отображаются на экране вокруг начального приближения и идентифицируются номером итерации, и одновременно показывается график согласия между экспериментальной и расчетной кривой. Так как вся процедура состоит из нескольких независимых процессов, связанных друг с другом только потоками информации, то пользователь имеет возможность

контролировать (си. Рис.5) процесс автоматического определения формы по данным МУР, обычно скрытый ,от глаз исследователя. Программа написана на языке Си, трехмерная графика, реализована в индустриальном стандарте PHIGS, а при создании пользовательского интерфейса, меню и элементов двумерной графики использовались библиотеки XLib и XView. Это позволяет переносить данную программу на любую рабочую станцию, использующую широко распространенный стандарт X-Windows в операционной системе UNIX. В зависимости от ресурсов конкретной графической станции возможна гибкая конфигурация системы. Возможность программы ASSA к диалогу с модулями анализа данных и ее развитый пользовательский интерфейс позволяют использовать ее как ядро автоматизированной системы анализа данных МУР.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Разработан и реализован в виде программы для ЭВМ параметрический метод обработки экспериментальных данных малоуглового рассеяния монодисперсными. системами с использованием системы линейных вытянутых сфероидальных функций. Метод использует свойство двойной ортогональности предлагаемой системы функций и является оптимальным среди параметрических методов в смысле величины невязки приближения.

2. Путем: численных экспериментов показана однозначность прямого восстановления, но данным малоуглового рассеяния в рамках модели формы частиц, параметризованной сферическими гармониками на низком разрешении.

3. Разработаны способы учета неидеальности модели в алгоритме прямого определения формы. Эффективность модифицированного алгоритма продемонстрирована определением формы обратной транскриптазы вируса иммунодефицита человека в растворе.

4. Создана система трехмерной графики для совместного представления моделей низкого разрешения и атомных моделей на персональном компьютере и на графической рабочей станции.

5. Развитые программные модули обработки, интерпретации и представления результатов объединены в комплекс программ, представляющий собой прототип автоматизированной системы анализа данных МУР,

6. Совокупность разработанных программ представляет собой прототип автоматизированной системы анализа данных МУР.

Цитируемая литература.

1. Свергун Д.И., Фейгин Л.Л. Рентгеновское и нейтронное

малоугловое рассеяние. М.: Наука, 1986.

2. Glatter О. J. Appt. Cryst., 1977, v.lO, pp. 415-421. Moore P.B. J.

Appl. Cryst., 1980, v.13, 168-175. Svergun D.I. J. Appt. Cryst., 1993, v. 26, pp. 258-267.

3. Stuhrmann H. Acta Cryst., 1970, A26, pp. 297-306.

ï. Jones T.A., et al. Acta Cryst., 1991, A47, pp. 110-119.

5. Фламмер К. Таблицы волновых сфероидальных функций. М.: ВЦ АН

СССР, 1962. 244 с.

6. Slepian D„ PoIIak Н.О. Bell Syst. Tech. J., 1961. v. 40. pp. 43-64.

7. Тихонов A.B., Арсении В.Я. Методы решения некорректных задач.

М: Наука, 1985.

8. Bertero M. et al. Opt. Letters, 1978, v. 3, № 2, pp. 51-53.

9. Svergun D.I., Stuhrmann H. Acta Cryst., 1991, A47, pp. 736-744.

10. Dennis J., Gay D., Welsh R. ACM Trans. Math. Soft., 1981, v. 7, pp. 348-368., pp. 369-383.

11. Scmenyuk A.V., Svergun D.I./. Appl. Cryst., v.24, pp. 537-540.

12. Bernstein F.C.et al. J. Mol. Biol., 1977, v. 112, pp. 535-542.

Публикации по теме диссертации

1. Svergun D.I., Volkov V.V., Kozin М.В., Stuhrmann H. New

developments in direct shape determination from small-angle scattering. 2. Uniqueness. Acta Cryst., 1996, Л52, pp. 419 426.

2. Козни М.Б., Свергун Д.Й. Обработка данных малоуглового рассеяния с помощью линейных вытянутых сфероидальных функций. Кристаллография,1996, т. 41, № 5, с. 817-825.

3. Svergun D.I., Barberato С., Kozin М.В., Volkov V.V., Stuhrmann

H.B., Koch M.H.J. New methods for solution scattering data analysis and their applications to biopolymers. 5-th International Conference on Biophysics and Synchrotron Radiation, Abstract book. Grenoble (France), 21-25 August 1995. Р.Зэ!

4. Kozin M.B., Volkov V.V., Svergun D.I. Real-time shape determination

from solution scattering data. Abstracts of' the Xtk International Conference on small-angle scattering. July 1996 Campinas, Brasil. P. 105.

5. Volkov V.V., Kozin M.B., Stuhrmann H.B., Svergun D.I. Shape determination in small-angle scattering: theory'arid practice."'Abstracts of the Xth International Conference on small-angle scattering. July 1996 Campinas, Brasil. P. 118.

6. Svergun D.I., Koch M.H.J., Volkov V.V., Kozin M.B., Meerwink W., Stuhrmann H.B., Pederscn J.S., Burkhardt N., Dicdrich G., Nierhaus K.H. Contrast variation study of the 70S E.coli ribosome. Abstracts of the Xtk International Conference on smalUangle scattering. July 1996 Campinas, Brasil. P. 226.