Топологические особенности РНК-подобных молекул со случайной первичной структурой тема автореферата и диссертации по физике, 01.04.17 ВАК РФ

Вальба, Ольга Владимировна АВТОР
кандидата физико-математических наук УЧЕНАЯ СТЕПЕНЬ
Москва МЕСТО ЗАЩИТЫ
2014 ГОД ЗАЩИТЫ
   
01.04.17 КОД ВАК РФ
Автореферат по физике на тему «Топологические особенности РНК-подобных молекул со случайной первичной структурой»
 
Автореферат диссертации на тему "Топологические особенности РНК-подобных молекул со случайной первичной структурой"

На правах рукописи

Вальба Ольга Владимировна

Топологические особенности РНК-подобных молекул со случайной первичной структурой

01.04.17 Химическая физика, горение и взрыв, физика экстремальных состояний вещества

Автореферат диссертации на соискание учёной степени кандидата физико-математических наук

Москва — 2014

005549996

005549996

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте химической физики им. H.H. Семенова Российской академии наук

Научный руководитель: Аветисов Владик Аванесович

доктор физико-математических наук ИХФ РАН, заведущий лабораторией

Официальные оппоненты: Якушевич Людмила Владимировна доктор физико-математических наук ИБК РАН, ведущий научный сотрудник Горшков Михаил Владимирович кандидат физико-математических наук ИНЭПХФ РАН, заведущий лабораторией

Ведущая организация: Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. A.A. Харкевича Российской академии наук (ИППИ РАН)

Защита состоится 15 октября 2014 г. в 1200 часов на заседании диссертационного совета Д.002.012.02 при Федеральном государственном бюджетном учреждении науки Институте химической физики Российской академии наук по адресу: 119991 Москва, ул. Косыгина, д.4, корп. 1.

С диссертацией можно ознакомиться в библиотеке Федерального государственного учреждения науки Института химической физики им. H.H. Семенова Российской академии наук. Автореферат разослан 15 августа 2014 года.

Автореферат размещен на сайте Высшей атестационной комиссии Министерства образования и науки Российской Федерации 16 апреля 2014 года.

Ученый секретарь

Диссертационного совета Д.002.012.02

Голубков М.Г.

кандидат физико-математических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Структура важнейших биологических макромолекул, таких как дезоксирибонуклеиновые кислоты (ДНК), рибонуклеиновые кислоты (РНК) и белки, играет ключевую роль в их правильном функционировании в клетке. Различают несколько уровней структурной упорядоченности биомакромолекул. Последовательность звеньев в ДНК, РНК и белках индивидуального организма, которая называется первичной структурой, строго зафиксирована. Биополимерные цепи могут формировать спиралеобразные и складчатые участки небольшого масштаба, как в белках, или комплементарно спаренные и петлевые участки, как в РНК. Такие фрагменты называются элементами вторичной структуры. Различают также третичную и четвертичную пространственные структуры биополимеров.

Данная работа посвящена исследованию топологических свойств вторичной структуры молекул РНК-типа. Известно, что биомакромолекулы являются «слабо отредактированными случайными гетерополимерами» [1,2]. Более того, для ряда свойств распределение мономерных звеньев в первичной структуре биополимера ( например, функциональных РНК) можно считать случайным [3,4]. В этом случае, модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления. Основное внимание при этом сфокусировано на нетривиальной вторичной структуре РНК-подобных полимеров, для описания которой привлекаются разнообразные техники, в том числе, техники квантовой теории поля и моделей Изинга [5].

Цель работы заключается в описании топологических особенностей РНК-подобных последовательностей методами статистической физики и теории случайных процессов. Для достижения поставленной цели необходимо было решить следующие задачи:

1. Разработать алгоритм вычисления свободной энергии РНК-подобной молекулы;

2. Установить зависимость статистических свойств распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью звеньев от длины цепи;

3. Рассмотреть зависимость топологических свойств РНК-подобных структур от количества типов мономерных звеньев (далее, алфавита), используемого в случайных первичных структурах;

4. Разработать алгоритм вычисления свободной энергии в модели первичной структуры со случайными расстояниями между мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния.

Научная новизна работы заключается в следующем.

1. Впервые методами статистической физики и теории случайных процессов установлена зависимость топологических свойств РНК-подобных гетеропо-лимеров со случайной первичной структурой от их длины и используемого в первичной структуре алфавита;

2. Теоретически обнаружено критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному и проведена аналитическая оценка точки перехода в рамках комбинаторного и матричного описания;

3. Установлена взаимосвязь между наблюдаемым критическим изменением топологии РНК-подобных структур и переходом в замороженное состояние, который обсуждался ранее в работах Т. Хва и Р. Бундшу [6];

4. Впервые показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче.

Теоретическая и практическая значимость диссертационной работы обусловлена тем что, полученные результаты носят фундаментальный характер и дают более глубокое понимание физических закономерностей, лежащих в основе формирования вторичной структуры молекул РНК.

Методы исследования. В работе использовалось компьютерное моделирование, включающее вычисление свободной энергии основного состояния РНК-подобных молекул и предсказание соответствующих вторичных структур. В аналитическом рассмотрении широко использовалась теория случайных процессов, а также описание вторичной структуры РНК случайными матрицами.

Основные положения, выносимые на защиту:

1. Алгоритмы описания вторичной структуры РНК-подобной молекулы и вычисления свободной энергии основного состояния, учитывающие внутри-петлевое взаимодействие;

2. Свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью мономерных звеньев;

3. Зависимость топологических свойств РНК-подобных структур от используемого в первичной структуре числа различных мономерных звеньев (алфавита). Критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному;

4. Топологические свойства РНК-подобных структур с выбранным распределением расстояний между мономерными звеньями и потенциалом взаимодействия между мономерами, заданным выпуклой вниз функцией от расстояния.

Достоверность изложенных в работе результатов обеспечивается использованием широко апробированных методов. Результаты находятся в соответствии с данными, полученными ранее другими авторами.

Апробация работы. Основные результаты по теме диссертации изложены в 6 статьях ведущих российских и зарубежных журналах, рекомендованных ВАК

и 8 тезисах к докладам конференций. Работа докладывалась и обсуждалась на конференциях:

1. International conference "Engineering of Chemical Complexity Berlin, Germany, 2011;

2. Conference on physics and biological systems, Orsay, France, 2011;

3. International conference on Statistical Physics, Larnaka, Cyprus, 2011;

4. Юбилейная конференция «Химическая физика вчера, сегодня, завтра», Москва, 2011;

5. Journées de Physique Statistique, Paris, France, 2012;

6. Конференция молодых ученых Института химической физики им. Н.Н. Семенова РАН, Звенигород, 2012;

7. Journee de LPTMS, Paris, France, 2012;

8. Spring School in Probability, Dubrovnik, Croatia, 2012;

9. 38th Conference of the Middle European Cooperation in Statistical Physics, Triest, Italie, 2013;

10. Conference on Biological Complexity, Krakow, Poland, 2013;

11. Всероссийская научная конференция «Химическая физика и строение вещества», Москва, 2013;

12. 9-ая Санкт-Петербургская конференция молодых ученых «Современные проблемы науки о полимерах», Санкт-Петербург, 2013;

и семинарах:

1. Seminars on physical biology and complex systems, Paris, France, 2010;

2. Молодежный семинар лаборатории Ж.-В. Понселе по проблемам статистической физики неупорядоченных систем с приложением к биофизическим системам, Москва, 2010;

3. Seminars of LPTMS, Paris, France, 2011;

4. Добрушинский математический семинар Института Проблем Передачи Информации, Москва, 2012;

5. Семинар Физического Факультета МГУ, Москва, 2012;

6. Seminars of LPTMC, University Paris IV, Paris, France, 2012;

7. Seminar in Politécnico di Torino, Turin, Italy, 2012;

8. Seminar in University of Potsdam, Potsdam, Germany, 2012;

9. Seminar in University of Cologne, Cologne, Germany, 2013;

10. «Московский биоинформатический семинар», МГУ, Москва, 2013;

11. Семинар в Институте Высокомолекулярных Соединений, Санкт-Петербург, 2013;

12. Seminar in Princeton University, Princeton, 2014.

Личный вклад автора заключается в развитии методов описания РНК-подобных молекул со случайной первичной структурой. Им были разработаны соответствующие алгоритмы вычисления свободной энергии РНК-подобных молекул. Все приведенные в работе расчеты и обобщение полученных результатов были выполнены автором лично.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во Введении обосновывается актуальность исследований, проводимых в рамках данной диссертационной работы, формулируются цель и задачи работы, обсуждаются научная новизна и практическая значимость работы.

Первая глава является обзором литературы. В этой главе перечислены основные характеристики РНК-подобных структур:

1. Связи между мономерами во вторичной структуре образуются согласно правилам комплементарное™;

2. Вторичная структура имеет иерархическую вложенную структуру (Рис. 1).

Рис. 1 Клеверная структура РНК (а) и псевдоузел (б); (в) и (г) — арочное представление (а) и

(б), соответственно.

Отдельно обсуждаются существующие подходы к предсказанию вторичной структуры молекул РНК. Здесь также рассматриваются термодинамические свойства РНК со случайной первичной структурой и обсуждается метод описания вторичной структуры РНК случайными матрицами.

Вторая глава посвящена описанию разработанных алгоритмов вычисления свободной энергии основного состояния РНК-подобной структуры. Рассматривается вспомогательная статистическая модель, описывающая взаимодействие мономерных звеньев в РНК-подобной структуре с петлевыми участками.

Пусть распределение мономерных звеньев во взаимодействующих фрагментах случайно и длины этих фрагментов, измеренные в единицах мономерных звеньев, равны тип, соответственно. Каждый мономер может быть выбран из с различных мономеров А, В, С, О,... (для РНК алфавит с равен 4). Мономеры первой последовательности образуют связи с мономерами второй последовательности согласно правилам комплементарности. Задача заключается в вычислении свободной энергии описанной модели при достаточно низких температурах, при которых энтропийным вкладом можно пренебречь по сравнению с энергети-

ААВАВВВААВВАААВААВ

11 \ ^ Чч ...

АВААВВАВВВАВАВВ

Рис. 2 Взаимодействие мономерных звеньев в РНК-подобной структуре с петлевыми участками как выравнивание соответствующих последовательностей (первичных структур).

ческим. Пусть Стп - статистическая сумма рассматриваемого комплекса. По смыслу С1п1п - это сумма по всем возможным конфигурациям связей. При низких температурах СШ]П можно представить как:

' т,п

Ст.п =1+5] С,-У=1

о = 1; Со,п = 1; = 1. Здесь и далее, Т = квТ. Смысл данной формулы очевиден: начиная с левого конца последовательностей (Рис. 2), находим первый существующий контакт между г-м мономером первой цепи и мономером второй, а далее суммируем по всем возможным расположениям этого контакта. Статистические веса связей определяются энергией контакта между г-ым и .7-ым мономерами Без потери общности, можно считать, что е = 1 для комплементарной пары и 6 = 0 при некомплементарном связывании. Отметим, что в этом случае значение свободной энергии Р в пределе нулевой температуры совпадает с количеством комплементарных пар в структуре основного состояния.

В свою очередь, статистическая сумма связана со свободной энергией комплекса Рт,п и температурой Т известным соотношением Ст,„ = ехр{—Рт,п/Т}. Будем интересоваться значением свободной энергии с точностью до знака. Тогда после преобразований и перехода к пределу Т 0, выражение на „ = —Ргп ,,

примет вид:

Ffn.ii = Шах ^^гд—1т -^т—1 ?

где функция Рт п удовлетворяет начальным условиям: -Рц,, = Ёпд = = 0.

Отметим что, переход к пределу нулевой температуры сохраняет смысл рассматриваемой задачи, так как энергия комплементарной пары в десятки раз превышает комнатную температуру. Полученное выражение для свободной энергии аналогично уравнениям динамического программирования, описывающим, в частности, задачу о выравнивании или нахождении наибольшей общей подпоследовательности двух буквенных последовательностей [7].

Алгоритм динамического программирования можно разработать и для разветвленных полимеров с внутрипетлевой структурой, свойственной, в частности, молекулам РНК. В этом случае статистическая сумма двух таких взаимодействующих фрагментов описывается следующими соотношениями:

т,п »¿=1

С,„.о = Дьт! Со,11 = д^п, = 1,

где с/^ и д-2) — статистические веса участков (с г'-го нуклеотида до ^-го) первой и второй последовательности соответственно, удовлетворяющие уравнениям [8]:

< кМ /=¿+1+«

^» = 1, а = 1,2.

Эти уравнения описывают иерархическую топологию петлевых участков, свойственную молекулам РНК (Рис. 1). Как и в случае взаимодействия последовательностей с петлевыми участками, для иерархических РНК-подобных структур можно выполнить переход к пределу нулевой температуры:

' Рт,п = шах. [/$, + + /Ц{т + /$,„ + 6,:.,)] ,

, Л») -тяЛ/(а) 4- 4-е(аЛ1

НЛ+к — |Л:+М+А-' ^/«+1,5-1 + ¿в+и+к + 4,8 )] I

¿о,о = 0; = — >

где = lim jring-j j (a = 1,2)- свободные энергии участка последовательности с i-ro нуклеотида по j-й.

Разработанные алгоритмы были использованы для описания взаимодействия двух молекул РНК. На Рис. 3 представлены структуры получаемых комплексов. Следует отметить, что структура образующегося комплекса двух полимеров сильно зависит от деталей модели. Так, структуры (б) и (в) (Рис. 3) отличаются только одним параметром в модели — минимальным размером петли L. Сильная чувствительность глобальной топологии оптимальной структуры к микроскопическим деталям модели ясно показывает, что для того чтобы получать экспериментально достоверные результаты, необходимо иметь подробную информацию о точных значениях петлевого фактора, об энергиях связей и о параметре кооперативное™. При необходимости все эти параметры можно учесть, не выходя за рамки предложенной модели.

AÜ^GAI^G^AgGС^Д Ai^Gj^C^t^n^J J j; А!JC^U^JG^¿Д^^^С^^А^^^^ЩААА . $1 AGUUCCACCGCCAGACiJACUUAACiJAAACGUCGGCCAAGACAAUÜCGCAUCGACCUAGUUAGCACGC ACCAUCGA -s2

(а)

п=п I

I п=л г-,1,-, П

AOCGAOGO^||'^ACCGGGCW^G^^CGApg^OAn^Ct'qegOCGAOCAOGCGCOnCCGCGGAGA^^(?AjlA - s1

AGUUGCACCGCCAGACUACUUAACUAAACGUCGGCCnAGACAAUL'CGCAUCGACCUAGUUAGCACGCACCAUCGA • s2 |-1 | i-, | L_i .-i .-i | [ I_II_I |-1 I ■-■ I L-I | u-i L-i | i Ц i | L-. | I-I UJ

(6)

аок^иосбАОСАиссбССОССССбСАСАСОбСААА -«1 АООР6САСС6ССАСАСОАСОО»АСОАААеСЦСйаСОААСАСААЦОСССАЦ^^уСИАСарА6С^рССАССАиеВА - 82

(в)

Рис. 3 Комплементарное связывание двух РНК: с петлевыми участками (а), с внутрипетлевым взаимодействием и минимальной длиной петли (. = 0 (б), и £ = 3 (в).

Третья глава диссертации посвящена статистическому анализу ансамбля РНК-подобных структур со случайной последовательностью мономерных звеньев. На Рис. 4 представлены зависимости среднего значения свободной энергии

и флуктуации свободной энергии для ансамбля случайных первичных структур РНК от длины последовательностей.

Отметим основные особенности наблюдаемых зависимостей. Угловой коэффициент линейной зависимости свободной энергии от длины последовательности в случае связывания с петлевыми участками к\ ^ 0.65 (Рис. 4(а)) хорошо согласуется с величиной, вычисленной в рамках модели так называемого «бер-нуллиевского сравнения» [9], т.е. в предположении о том, что матричные элементы е¿^ являются независимыми случайными величинами, принимающими значения 1 с вероятностью р = с-1 и 0 с вероятностью д = 1 — р:

(Гт,п) « —^=П + /(С)(Х)П1/3, 1 + V с

где х ~ случайная величина с распределением Трейси-Видома {(х) = —1.7711... и (X2) ~ (X>2 = 0.8132...).

Флуктуации свободной энергии основного состояния, как в случае линейных, так и в случае РНК-подобных структур, характеризуется степенной зависимостью с показателями степени близкими к 1/3. Показатель 1/3 является типичным для стохастической динамики сильно коррелированных систем и относится к классу универсальности Кардара-Паризи-Занга [10]. Как и для взаимодействия с петлевыми участками, (Рп.п) (п) = кп при п » 1 (Рис. 4), но угловой коэффициент прямой к и 0.92 гораздо выше, что обусловлено взаимодействием нуклеотидов внутри петель.

Наблюдаемая высокая вероятность связывания во вторичной структуре, а также хорошая согласованность распределения длин петель в структуре с аналитическим предсказанием, основанным на модели случайных блужданий, послужили поводом детального анализа РНК-подобных структур от алфавита с. Этот анализ вынесен в отдельную Четвертую главу.

Было показано, что топологические свойства РНК-подобных структур критическим образом зависит от алфавита, используемого в случайной первичной структуре. Такое критическое явление в диссертационной работе названо «топологическим переходом». В допереходной области, когда с < сс, случайная после-

400 600 600 700 81» 900 1000 У\

(в)

(г)

Рис. 4 Зависимость свободной энергии основного состояния (а,в) и флуктуации

свободной энергии а (б,г) от длины случайной последовательности п: (а,б) — взаимодействие РНК с петлевыми участками; (в,г) — внутрипетлевое взаимодействие. Усреднение проводилось по ансамблю из 105 случайных пар последовательностей для

каждого значения длины.

довательность образует полностью связанную вторичную структуру без пропусков (Рис. 5(6)), тогда как в области с > сс всегда есть конечная доля несвязанных мономеров (делеций) (Рис. 5(а)). Первым структурам соответствуют пути без горизонтальных участков в случайном блуждании— пути Дика, вторым — пути Моцкина [11].

В диссертационной работе представлены аналитические оценки критической точки сс топологического перехода, основанные на сравнении числа всех полностью связанных вторичных структур (Рис. 5) и всех случайных последовательностей с величиной алфавита с и заданной длиной Ь. В результате было показано, что 2 < сс < 3 (см. также [12]).

-ЛХ

1 2 3 4 5 6 7 8 9 1011 12 13 14

(а)

да

.а.

123456789 1011 121314

(б)

Рис. 5 Вторичная структура РНК с пропусками (а) и без пропусков (б) и соответствующие им пути случайных блужданий.

Для более точного описания топологического перехода предложена модель Бернулли, в которой матрица е возможных комплементарных пар является случайной матрицей, состоящей из единиц и нулей с вероятностями р и 1 — р соответственно. Мономеры цепи в данной модели не различаются по сортам и, в целом, любой мономер может образовать связь с любым другим, однако, в среднем, вероятность такого события равна р. Каждой последовательности в рассматриваемой модели можно сопоставить граф Эрдёша-Реньи, изображающего все возможные контакты между Ь мономерами.

Для более точной оценки критической точки топологического перехода были расссмотрены ансамбли, состоящие из N (М = 105) случайных бернуллиевских полимеров длины Ь. Доля последовательностей, образующих полностью связанную структуру в таком ансамбле щ есть функция от р (см. Рис. 6), и естественно ожидать, что в пределе Ь —> оо (Рис. 6(а)), функция ^¿(р) вырождается в ступен-

чатую функцию. Скейлинг-анализ полученных зависимостей т]ь{р) обеспечивает критическое значение рс = 0.37, что соответствует алфавиту: сс ~ 2.67.

1.0

0.8 0.6 0.4 0.2 0.0

а

тг

/

НИ- и=500 ~®-1-=1000 -А- 1_=2000

0.34 0.36 0.38 0.40 0.42 0.44

Р

(а)

-0.8 -0.4 0.0 0.4 0.8 1.2

Р-Рс

(б)

Рис. 6 Зависимость доли полностью связанных РНК-подобных структур в ансамбле случайных первичных структур различной длины (а) от параметра р модели Бернулли; скейлинг-анализ полученных зависимостей (б). Для каждого значения р и Ь было выполнено

103 накоплений.

Модель Бернулли позволяет провести более точную аналитическую оценку точки перехода. Для этого задачу удобнее формулировать в терминах случайных графов как задачу о размещении Ь/2 непересекающихся арок, принимая во внимание ограничения, накладываемые матрицей смежности е графа с ¿вершинами. Для р = 1 (когда все элементы е^- равны 1), количество всех возможных полностью связанных арочных структур определяется числами Каталана Сц2 (количество путей Дика длины Ь):

* = ^ = Ш- Ш

При р ф 1, некоторые из конфигураций ф запрещены матрицей е. В предположении среднего поля, т.е, что связи (арки) между мономерами образуются независимо, вероятность иметь по крайней мере одну планарную конфигурацию

для данной плотности р матрицы е определяется как:

V = #рх/2 - М^1/2 + С\ръь!2 +...

= 1 - (1 - pL!-)* = 1 - exp(-pL/2#).

В пределе L —ь оо, величина равна либо нулю, либо единице в зависимости от величины р£//2#. Таким образом, точка перехода характеризуется вероятностью:

limpc[#]2/i = l.

L->3о

Данное условие приводит к оценке сс = 4. Для учета корреляций между различными планарными диаграммами в работе введена функция £(р):

lim £(рс) [#]2/L = 1,

L—>oa

Полностью связанную планарную конфигурацию, состоящую из Lj2 арок, соединяющих L точек может быть построена как: i) L/4 непересекающихся единичных арок (г, i +1) из L — 1 возможных, разрешенных матрицой контактов е и и) L/4 арки большей длины. Такая процедура обусловлена тем, что арки разной длины встречаются в оптимальной планарной конфигурации с различной вероятностью, в частности, вероятность кратчайшей арки Р{г, i + 1) = Выделенность кратчайших арок в идеальной полностью связанной структуре учитывается непосредственно вычислением вероятности выбора L/4 арок из возможных pL (в предположении, что разрешенные арки равномерно «размазаны» по цепочке). Учет корреляций между планарными диаграммами на уровне единичных дуг, приводит к следующему выражению для функции

ln£(p) = ±lnp + f Inf

И соответственно, к величине сс = 2.87. Полученная оценка критического алфавита сс близка к наблюдаемой в численном моделировании.

Другой подход к аналитической оценки точки перехода сс основан на матричном описании РНК-подобной структуры. Статистическая сумма Zl(N, V) в этом случае записывается через случайные эрмитовы матрицы ф, (см., например, [13])

как:

i ¿ф^.Афье-3«—tr {фх.-.фь)

Zl(N,V) = i--j-У—-= (Фь-Фь)*,

/ (1ф1...(1ф1е 0

S0 = S0{e, фи..., фь} = £ £ij(e-Vr(^)-

Усреднение статистической суммы Zl(N, V) по матрицам е выполняется с использованием стандартного преобразования Хаббарда-Стратоновича и последующим интегрированием по е. В диссертационной работе приведены необходимые математические выкладки. В первом приближении критическое значение сс достигается при рс = 0.25, что совпадает с оценкой, полученной в приближении среднего поля. Учет корреляций в разложении So обеспечивает небольшой сдвиг в сторону значения, полученного в численном моделировании.

В главе также показана взаимосвязь рассматриваемого топологического перехода и фазовым переходом, который обсуждался ранее в [6] для РНК со случайной первичной структурой. Было показано, что в зависимости от температуры, РНК-подобные структуры со случайной последовательностью звеньев могут находится в одной из фаз: i) в «расплавленной» высокотемпературной фазе или ii) в «замороженной» низкотемпературной фазе. В высокотемпературной фазе большую роль играет энтропия цепочки, а не первичная структура. Данная фаза хорошо описывается в предположении, что связывание возможно для любых пар мономеров, т.е, эффективно, все звенья можно считать мономерами одного типа А и положить энергию пары А-А равной е.

Низкотемпературная фаза, напротив, определяется первичной структурой РНК и основной вклад в свободную энергию обусловлен именно комплементарными связями. В работе [6] было показано, что температура перехода из высокотемпературной фазы в низкотемпературную фазу непосредственно связана со средним количеством комплементарно связанных мономеров в основном состоянии РНК-структуры.

В диссертационной работе предполагается, что критическая точка топологического перехода между полностью связанной РНК-подобной структурой и

структурой с пропусками является пороговым значением для температурного фазового перехода. В области р > рс возможна только расплавленная фаза вне зависимости от температуры. Рис. 7 показывает фазовую диаграмму на (Т, р) плоскости. Это предположение подтверждается исследованием энергии пинча от длины случайной последовательности в точке Т = О (см. дополнительный график на Рис. 7).

Р

Рис. 7 Фазовый переход в замороженное состояние, ограниченный топологическим переходом в модели Бернулли. Дополнительный график: зависимость энергии пинча в пределе X —> 0 от вероятности р.

В заключительной части главы обсуждаются различные подходы к генерации случайной последовательности с эффективно нецелочисленным алфавитом. В частности, предлагается модель рационального алфавита, в которой правила комплементарности задаются искуственно в зависимости от величины алфавита с = В другой модели — модели коррелированного алфавита, последовательность описывается цепью Маркова. Для моделей приводятся соответствующие зависимости предельного значения средней свободной энергии основного состояния от величины алфавита. Заканчивается глава качественными доводами,

почему алфавит в реальных молекулах РНК расположен вблизи критической величины.

В Пятой главе развивается новый подход к описанию вторичной структуры РНК-подобной молекулы, основанный на использовании оптимизационной транспортной задачи. В работе формулируется модель РНК-подобной молекулы со случайными интервалами между звеньями цепи (Рис. 8). В рамках предложенной модели энергия взаимодействия мономеров е,^ предполагается выпуклой функцией расстояния между мономерами вдоль цепи. С физической точки зрения, примером такого взаимодействия может служить электростатическое взаимодействие ~ 1/с/у. В численном моделировании использовалось

= -и 1п \х{ - х^; {] ф г),

где и — некоторая положительная величина, и Х{, х^ — координаты мономеров г и j вдоль цепи. Расстояния с/{ = — 1г| между соседними мономерами подчиняются распределению Р(с?г- = ¿).

1 2 3 4 5 6 78 9 10

(а)

(Ь)

Рис. 8 Модель РНК-подобной молекулы со случайными интервалов между звеньями цепи: арочное представление (а), и соответствующий путь Дика (б).

В [14] было показано, что свободная энергия основного состояния ^ удовлетворяет рекурсивному соотношению, обладающему свойствами субаддитивно-

сти и субмодулярности:

Fi,i+k = min[£iii+fc + i^i+i.fc-i;

Fi,i+k—2 + Fi+2A+k — Fi+2ti+k-2] • В работе приводятся результаты аналитического описания и численного моделирования топологических особенностей структур РНК-подобных молекул для двух видов распределений f(d): распределения Гаусса и степенного распределения. Было показано, что для распределения Гаусса имеет место топологический переход между конфигурацией, в которой спарены лишь ближайшие по цепи соседи, и конфигурацией, имеющую структуру вложенных друг в друга арок. Параметр, контролирующий такой переход — величина дисперсии а в распределении Гаусса f(d, а) (Рис. 9(a)).

Для степенного распределения f(d, 7) ~ в котором вероятность большого расстояния между соседними мономерами не мала экспоненциально, характерна конфигурация иерархически вложенных арок в широком диапазоне значений показателя распределения 7. При этом, для величины максимального числа вложенных друг в друга арок в РНК-подобной структуре, (h(7)) имеет характерный максимум при 7 = 1 (Рис. 9(c)). Вероятность появления вложенной топологии в оптимальной конфигурации определяется интегралом:

Р= / f(x)dx / f(y)dy / f(z)dz,

Jdm m J (¿mill J dmm

где dmin и dmax — наименьшее и наибольшее значение расстояний между соседними мономерами в распределении f(d). Рис. 9(6,г) показывает зависимость интеграла от параметров распределений. Видно, что аналитические кривые имеют те же особенности, что наблюдаются в численном моделировании. Важным результатом данного исследования является возможность перейти от нелокального уравнения для свободной энергии основного состояния РНК к локальным соотношениям. В рамках предположения выпуклого потенциала взаимодействия между мономерами, выражение для энергии основного состояния существенно упрощает алгоритм описания РНК-подобной структуры.

3.50

3.25

3.00

2.75

А

О 2.50

-5*

V

2.00

1.75

1.50

(а)

■Н * ' - П } ; ,

.:: *

,4= 250 ,У= 500 N»1000

? Т Т *

1 2 3 4 5

С

У

(В)

Рис. 9 Зависимость высоты оптимальной конфигурации от параметров распределения: (а) — распределение Гаусса; (б) — степенное распределение; (в,г) — аналитическая вероятность "переключения" с последовательных на вложенные конфигурации.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Получено выражение для статистической суммы, описывающие взаимодействие двух сополимеров, учитывающий способность каждого из сополимеров образовывать РНК-подобную структуру с иерархией петлевых участков. Разработан соответствующий алгоритм динамического программирования вычисления свободной энергии основного состояния таких РНК-подобных молекул.

2. Численно и аналитически показано критическое поведение РНК-подобной структуры в зависимости от используемого в первичной структуре алфавита. Существует две области: для алфавитов с < сс свойственна максимально связанная вторичная структура без пропусков, тогда как для с > сс вторичная структура содержит конечную долю несвязанных мономеров. Аналитическая оценка точки топологического перехода сс = 2.87 близка к наблюдаемой в численном моделировании сс = 2.67.

3. Показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче. Разработан алгоритм вычисления свободной энергии в модели первичной структуры со случайными расстояниями между мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния. Показана зависимость топологии РНК-подобной структуры от параметров распределения.

ЛИТЕРАТУРА

1. Птицын Б.О., Финкельштейн А. Физика белка: Курс лекций // Москва: Университет, 2002. - 376 С.

2. Гросберг Ю.А., Хохлов Р.А. Статистическая физика макромолекул / под ред. Главной редакции физико-математической литературы // Москва: Наука, 1989. - 344 С.

3. Workman С., Krogh A. No evidence that mRNAs have lower folding free energies than random sequences with the same dinucleotide distribution // Nucleic Acids Research. - 1999. - V. 27. - N. 24. - P. 4816-4822.

4. Clote P., Ferre F., Kranakis E., Krizanc D. Structural RNA has lower folding energy than randomRNA of the same dinucleotide frequency // RNA. — 2005. — V. ll.-N. 5.-P. 578-591.

5. Brezin E.E., Itzykson C., Parisi G., Zuber J.B. Planar diagrams // Communications in Mathematical Physics. — 1978. — V. 59. — N. 1. — P. 5-51.

6. Bundschuh R., Hwa T. Statistical mechanics of secondary structures formed by random RNA sequences // Physical Review E. — 2002. — V. 65. — N. 3. — P. 031903.

7. Waterman M.S., Vingron M. Sequence comparison significance and poisson approximation // Statistical Science. — 1994. — V. 9. — P. 367-381.

8. de Gennes P.G. Statistics of branching and hairpin helices for the dat copolymer // Biopolymers. - 1968. - V. 6. - N. 5. - P. 715-729.

9. Majumdar S.T., Nechaev S.K. Exact asymptotic results for the bernoulli matching model of sequence alignment // Physical Review E. — 2005. — V. 72. — N. 2. — P. 020901.

10. Kardar M., Parisi G., Zhang Y.C. Dynamic scaling of growing interfaces // Physical Review Letters. - 1986. - V. 56. - N. 9. - P. 889-892.

11. Ландо К. Лекции о производящих функциях // Москва: Московский центр непрерывного математического образования, 2007. — 144 С.

12. Владимиров А.А. Паросочетания без пересечений // Проблемы передачи информации. - 2013. - Т. 49. - N. 1. - С. 61-65.

13. Orland Н., Zee A. RNA folding and large N matrix theory // Nuclear Physics B. - 2002. - V. 620. - P. 456-476.

14. Delon J., Salomon J., Sobolevski A. Local matching indicators for transport problems with concave costs // Journal on Discrete Mathematics. — 2012. — V. 26.-N. 2.-P. 801-827.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Nechaev S.K., Tamm M.V., Valba O.V. Statistics of noncoding RNAs: alignment and secondary structure prediction // Journal of Physics A: Mathematical and Theoretical. - 2011. - V. 44. - N. 19. - P. 195001.

2. Вальба O.B., Нечаев C.K., Тамм M.B. Сравнение молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Журнал экспериментальной и теоретической физики. — 2012. — Т. 114. — N. 2.-С. 399-413.

3. Вальба О.В., Нечаев С.К., Тамм М.В. Взаимодействие молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Химическая физика. — 2012. — Т. 31. — С. 23-25.

4. Valba O.V., Tamm M.V., Nechaev S.K. New Alphabet-Dependent Morphological Transition in Random RNA Alignment // Physical Review Letters. — 2012. — V. 109.-N. 1,-P. 018102.

5. Nechaev S.K., Sobolevskii A.N., Valba O.V. Planar diagrams from optimization for concave potentials // Physical Review E. — 2013. — V. 87. — N. 1. — P. 012102.

6. Lokhov A.Y., Valba O.V., Nechaev S.K., Tamm M.V. Phase transition in random planar diagrams and RNA-type matching // Physical Review E. — 2013. — V. 88. -N. 5.-P. 052117.

7. Valba O.V., Tamm M.V., Nechaev S.K. A new approach to comparison of two graphs // International conference "Engineering of Chemical Complexity Berlin, Germany, 4-8 July 2011.

8. Valba O.V., Tamm M.V., Nechaev S.K. Matching of RNA-type sequences and statistical analysis of random RNAs // International conference on Statistical Physics, Larnaka, Cyprus, 11-15 July 2011.

9. Вальба O.B., Нечаев C.K., Тамм M.B. Взаимодействие молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Юбилейная конференция ИХФ РАН «Химическая физика вчера, сегодня, завтра», Москва, 11-14 октября 2011.

10. Вальба О.В., Нечаев С.К., Соболевский А.Н. Топологические переходы во вторичной структуре случайных РНК-подобных полимеров // Конференция молодых ученых ИХФ РАН, Звенигород, 1-4 марта 2012.

11. Valba O.V. On exclusivity of alphabets with four nucleotide types // Spring School in Probability, Dubrovnik, Croatia, 23-27 April 2012.

12. Valba O.V. Topological transition in secondary structure of RNA-like polymer// 38th Conference of the Middle European Cooperation in Statistical Physics, Triest, Italie, 25-27 March 2013.

13. Вальба O.B. Фазовый переход в случайных РНК-подобных полимерах // Всероссийская научная конференция «Химическая физика и строение вещества», Москва, 19-20 июня 2013.

14. Valba O.V., Lokhov A.Y., Nechaev S.K., Tamm M.V. New topological transition in secondary structure of random RNA-tlike polymer // 9-ая Санкт-Петербургская конференция молодых ученых «Современные проблемы науки о полимерах», Санкт-Петербург, 11-15 ноября 2013.

Заказ № 102-Р/04/2014 Подписано в печать 21.04.14 Тираж 100 экз. Усл. пл. 1,2

ООО "Цифровичок", тел. (495) 797-75-76 www.cfr.ru ; e-mail: zakpark@cfr.ru