Топологические особенности РНК-подобных молекул со случайной первичной структурой тема автореферата и диссертации по физике, 01.04.17 ВАК РФ
Вальба, Ольга Владимировна
АВТОР
|
||||
кандидата физико-математических наук
УЧЕНАЯ СТЕПЕНЬ
|
||||
Москва
МЕСТО ЗАЩИТЫ
|
||||
2014
ГОД ЗАЩИТЫ
|
|
01.04.17
КОД ВАК РФ
|
||
|
На правах рукописи
Вальба Ольга Владимировна
Топологические особенности РНК-подобных молекул со случайной первичной структурой
01.04.17 Химическая физика, горение и взрыв, физика экстремальных состояний вещества
Автореферат диссертации на соискание учёной степени кандидата физико-математических наук
Москва — 2014
005549996
005549996
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте химической физики им. H.H. Семенова Российской академии наук
Научный руководитель: Аветисов Владик Аванесович
доктор физико-математических наук ИХФ РАН, заведущий лабораторией
Официальные оппоненты: Якушевич Людмила Владимировна доктор физико-математических наук ИБК РАН, ведущий научный сотрудник Горшков Михаил Владимирович кандидат физико-математических наук ИНЭПХФ РАН, заведущий лабораторией
Ведущая организация: Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. A.A. Харкевича Российской академии наук (ИППИ РАН)
Защита состоится 15 октября 2014 г. в 1200 часов на заседании диссертационного совета Д.002.012.02 при Федеральном государственном бюджетном учреждении науки Институте химической физики Российской академии наук по адресу: 119991 Москва, ул. Косыгина, д.4, корп. 1.
С диссертацией можно ознакомиться в библиотеке Федерального государственного учреждения науки Института химической физики им. H.H. Семенова Российской академии наук. Автореферат разослан 15 августа 2014 года.
Автореферат размещен на сайте Высшей атестационной комиссии Министерства образования и науки Российской Федерации 16 апреля 2014 года.
Ученый секретарь
Диссертационного совета Д.002.012.02
Голубков М.Г.
кандидат физико-математических наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Структура важнейших биологических макромолекул, таких как дезоксирибонуклеиновые кислоты (ДНК), рибонуклеиновые кислоты (РНК) и белки, играет ключевую роль в их правильном функционировании в клетке. Различают несколько уровней структурной упорядоченности биомакромолекул. Последовательность звеньев в ДНК, РНК и белках индивидуального организма, которая называется первичной структурой, строго зафиксирована. Биополимерные цепи могут формировать спиралеобразные и складчатые участки небольшого масштаба, как в белках, или комплементарно спаренные и петлевые участки, как в РНК. Такие фрагменты называются элементами вторичной структуры. Различают также третичную и четвертичную пространственные структуры биополимеров.
Данная работа посвящена исследованию топологических свойств вторичной структуры молекул РНК-типа. Известно, что биомакромолекулы являются «слабо отредактированными случайными гетерополимерами» [1,2]. Более того, для ряда свойств распределение мономерных звеньев в первичной структуре биополимера ( например, функциональных РНК) можно считать случайным [3,4]. В этом случае, модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления. Основное внимание при этом сфокусировано на нетривиальной вторичной структуре РНК-подобных полимеров, для описания которой привлекаются разнообразные техники, в том числе, техники квантовой теории поля и моделей Изинга [5].
Цель работы заключается в описании топологических особенностей РНК-подобных последовательностей методами статистической физики и теории случайных процессов. Для достижения поставленной цели необходимо было решить следующие задачи:
1. Разработать алгоритм вычисления свободной энергии РНК-подобной молекулы;
2. Установить зависимость статистических свойств распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью звеньев от длины цепи;
3. Рассмотреть зависимость топологических свойств РНК-подобных структур от количества типов мономерных звеньев (далее, алфавита), используемого в случайных первичных структурах;
4. Разработать алгоритм вычисления свободной энергии в модели первичной структуры со случайными расстояниями между мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния.
Научная новизна работы заключается в следующем.
1. Впервые методами статистической физики и теории случайных процессов установлена зависимость топологических свойств РНК-подобных гетеропо-лимеров со случайной первичной структурой от их длины и используемого в первичной структуре алфавита;
2. Теоретически обнаружено критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному и проведена аналитическая оценка точки перехода в рамках комбинаторного и матричного описания;
3. Установлена взаимосвязь между наблюдаемым критическим изменением топологии РНК-подобных структур и переходом в замороженное состояние, который обсуждался ранее в работах Т. Хва и Р. Бундшу [6];
4. Впервые показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче.
Теоретическая и практическая значимость диссертационной работы обусловлена тем что, полученные результаты носят фундаментальный характер и дают более глубокое понимание физических закономерностей, лежащих в основе формирования вторичной структуры молекул РНК.
Методы исследования. В работе использовалось компьютерное моделирование, включающее вычисление свободной энергии основного состояния РНК-подобных молекул и предсказание соответствующих вторичных структур. В аналитическом рассмотрении широко использовалась теория случайных процессов, а также описание вторичной структуры РНК случайными матрицами.
Основные положения, выносимые на защиту:
1. Алгоритмы описания вторичной структуры РНК-подобной молекулы и вычисления свободной энергии основного состояния, учитывающие внутри-петлевое взаимодействие;
2. Свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью мономерных звеньев;
3. Зависимость топологических свойств РНК-подобных структур от используемого в первичной структуре числа различных мономерных звеньев (алфавита). Критическое изменение топологии РНК-подобных структур при переходе от двухбуквенного алфавита к трехбуквенному;
4. Топологические свойства РНК-подобных структур с выбранным распределением расстояний между мономерными звеньями и потенциалом взаимодействия между мономерами, заданным выпуклой вниз функцией от расстояния.
Достоверность изложенных в работе результатов обеспечивается использованием широко апробированных методов. Результаты находятся в соответствии с данными, полученными ранее другими авторами.
Апробация работы. Основные результаты по теме диссертации изложены в 6 статьях ведущих российских и зарубежных журналах, рекомендованных ВАК
и 8 тезисах к докладам конференций. Работа докладывалась и обсуждалась на конференциях:
1. International conference "Engineering of Chemical Complexity Berlin, Germany, 2011;
2. Conference on physics and biological systems, Orsay, France, 2011;
3. International conference on Statistical Physics, Larnaka, Cyprus, 2011;
4. Юбилейная конференция «Химическая физика вчера, сегодня, завтра», Москва, 2011;
5. Journées de Physique Statistique, Paris, France, 2012;
6. Конференция молодых ученых Института химической физики им. Н.Н. Семенова РАН, Звенигород, 2012;
7. Journee de LPTMS, Paris, France, 2012;
8. Spring School in Probability, Dubrovnik, Croatia, 2012;
9. 38th Conference of the Middle European Cooperation in Statistical Physics, Triest, Italie, 2013;
10. Conference on Biological Complexity, Krakow, Poland, 2013;
11. Всероссийская научная конференция «Химическая физика и строение вещества», Москва, 2013;
12. 9-ая Санкт-Петербургская конференция молодых ученых «Современные проблемы науки о полимерах», Санкт-Петербург, 2013;
и семинарах:
1. Seminars on physical biology and complex systems, Paris, France, 2010;
2. Молодежный семинар лаборатории Ж.-В. Понселе по проблемам статистической физики неупорядоченных систем с приложением к биофизическим системам, Москва, 2010;
3. Seminars of LPTMS, Paris, France, 2011;
4. Добрушинский математический семинар Института Проблем Передачи Информации, Москва, 2012;
5. Семинар Физического Факультета МГУ, Москва, 2012;
6. Seminars of LPTMC, University Paris IV, Paris, France, 2012;
7. Seminar in Politécnico di Torino, Turin, Italy, 2012;
8. Seminar in University of Potsdam, Potsdam, Germany, 2012;
9. Seminar in University of Cologne, Cologne, Germany, 2013;
10. «Московский биоинформатический семинар», МГУ, Москва, 2013;
11. Семинар в Институте Высокомолекулярных Соединений, Санкт-Петербург, 2013;
12. Seminar in Princeton University, Princeton, 2014.
Личный вклад автора заключается в развитии методов описания РНК-подобных молекул со случайной первичной структурой. Им были разработаны соответствующие алгоритмы вычисления свободной энергии РНК-подобных молекул. Все приведенные в работе расчеты и обобщение полученных результатов были выполнены автором лично.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во Введении обосновывается актуальность исследований, проводимых в рамках данной диссертационной работы, формулируются цель и задачи работы, обсуждаются научная новизна и практическая значимость работы.
Первая глава является обзором литературы. В этой главе перечислены основные характеристики РНК-подобных структур:
1. Связи между мономерами во вторичной структуре образуются согласно правилам комплементарное™;
2. Вторичная структура имеет иерархическую вложенную структуру (Рис. 1).
Рис. 1 Клеверная структура РНК (а) и псевдоузел (б); (в) и (г) — арочное представление (а) и
(б), соответственно.
Отдельно обсуждаются существующие подходы к предсказанию вторичной структуры молекул РНК. Здесь также рассматриваются термодинамические свойства РНК со случайной первичной структурой и обсуждается метод описания вторичной структуры РНК случайными матрицами.
Вторая глава посвящена описанию разработанных алгоритмов вычисления свободной энергии основного состояния РНК-подобной структуры. Рассматривается вспомогательная статистическая модель, описывающая взаимодействие мономерных звеньев в РНК-подобной структуре с петлевыми участками.
Пусть распределение мономерных звеньев во взаимодействующих фрагментах случайно и длины этих фрагментов, измеренные в единицах мономерных звеньев, равны тип, соответственно. Каждый мономер может быть выбран из с различных мономеров А, В, С, О,... (для РНК алфавит с равен 4). Мономеры первой последовательности образуют связи с мономерами второй последовательности согласно правилам комплементарности. Задача заключается в вычислении свободной энергии описанной модели при достаточно низких температурах, при которых энтропийным вкладом можно пренебречь по сравнению с энергети-
ААВАВВВААВВАААВААВ
11 \ ^ Чч ...
АВААВВАВВВАВАВВ
Рис. 2 Взаимодействие мономерных звеньев в РНК-подобной структуре с петлевыми участками как выравнивание соответствующих последовательностей (первичных структур).
ческим. Пусть Стп - статистическая сумма рассматриваемого комплекса. По смыслу С1п1п - это сумма по всем возможным конфигурациям связей. При низких температурах СШ]П можно представить как:
' т,п
Ст.п =1+5] С,-У=1
о = 1; Со,п = 1; = 1. Здесь и далее, Т = квТ. Смысл данной формулы очевиден: начиная с левого конца последовательностей (Рис. 2), находим первый существующий контакт между г-м мономером первой цепи и мономером второй, а далее суммируем по всем возможным расположениям этого контакта. Статистические веса связей определяются энергией контакта между г-ым и .7-ым мономерами Без потери общности, можно считать, что е = 1 для комплементарной пары и 6 = 0 при некомплементарном связывании. Отметим, что в этом случае значение свободной энергии Р в пределе нулевой температуры совпадает с количеством комплементарных пар в структуре основного состояния.
В свою очередь, статистическая сумма связана со свободной энергией комплекса Рт,п и температурой Т известным соотношением Ст,„ = ехр{—Рт,п/Т}. Будем интересоваться значением свободной энергии с точностью до знака. Тогда после преобразований и перехода к пределу Т 0, выражение на „ = —Ргп ,,
примет вид:
Ffn.ii = Шах ^^гд—1т -^т—1 ?
где функция Рт п удовлетворяет начальным условиям: -Рц,, = Ёпд = = 0.
Отметим что, переход к пределу нулевой температуры сохраняет смысл рассматриваемой задачи, так как энергия комплементарной пары в десятки раз превышает комнатную температуру. Полученное выражение для свободной энергии аналогично уравнениям динамического программирования, описывающим, в частности, задачу о выравнивании или нахождении наибольшей общей подпоследовательности двух буквенных последовательностей [7].
Алгоритм динамического программирования можно разработать и для разветвленных полимеров с внутрипетлевой структурой, свойственной, в частности, молекулам РНК. В этом случае статистическая сумма двух таких взаимодействующих фрагментов описывается следующими соотношениями:
т,п »¿=1
С,„.о = Дьт! Со,11 = д^п, = 1,
где с/^ и д-2) — статистические веса участков (с г'-го нуклеотида до ^-го) первой и второй последовательности соответственно, удовлетворяющие уравнениям [8]:
< кМ /=¿+1+«
^» = 1, а = 1,2.
Эти уравнения описывают иерархическую топологию петлевых участков, свойственную молекулам РНК (Рис. 1). Как и в случае взаимодействия последовательностей с петлевыми участками, для иерархических РНК-подобных структур можно выполнить переход к пределу нулевой температуры:
' Рт,п = шах. [/$, + + /Ц{т + /$,„ + 6,:.,)] ,
, Л») -тяЛ/(а) 4- 4-е(аЛ1
НЛ+к — |Л:+М+А-' ^/«+1,5-1 + ¿в+и+к + 4,8 )] I
¿о,о = 0; = — >
где = lim jring-j j (a = 1,2)- свободные энергии участка последовательности с i-ro нуклеотида по j-й.
Разработанные алгоритмы были использованы для описания взаимодействия двух молекул РНК. На Рис. 3 представлены структуры получаемых комплексов. Следует отметить, что структура образующегося комплекса двух полимеров сильно зависит от деталей модели. Так, структуры (б) и (в) (Рис. 3) отличаются только одним параметром в модели — минимальным размером петли L. Сильная чувствительность глобальной топологии оптимальной структуры к микроскопическим деталям модели ясно показывает, что для того чтобы получать экспериментально достоверные результаты, необходимо иметь подробную информацию о точных значениях петлевого фактора, об энергиях связей и о параметре кооперативное™. При необходимости все эти параметры можно учесть, не выходя за рамки предложенной модели.
AÜ^GAI^G^AgGС^Д Ai^Gj^C^t^n^J J j; А!JC^U^JG^¿Д^^^С^^А^^^^ЩААА . $1 AGUUCCACCGCCAGACiJACUUAACiJAAACGUCGGCCAAGACAAUÜCGCAUCGACCUAGUUAGCACGC ACCAUCGA -s2
(а)
п=п I
I п=л г-,1,-, П
AOCGAOGO^||'^ACCGGGCW^G^^CGApg^OAn^Ct'qegOCGAOCAOGCGCOnCCGCGGAGA^^(?AjlA - s1
AGUUGCACCGCCAGACUACUUAACUAAACGUCGGCCnAGACAAUL'CGCAUCGACCUAGUUAGCACGCACCAUCGA • s2 |-1 | i-, | L_i .-i .-i | [ I_II_I |-1 I ■-■ I L-I | u-i L-i | i Ц i | L-. | I-I UJ
(6)
аок^иосбАОСАиссбССОССССбСАСАСОбСААА -«1 АООР6САСС6ССАСАСОАСОО»АСОАААеСЦСйаСОААСАСААЦОСССАЦ^^уСИАСарА6С^рССАССАиеВА - 82
(в)
Рис. 3 Комплементарное связывание двух РНК: с петлевыми участками (а), с внутрипетлевым взаимодействием и минимальной длиной петли (. = 0 (б), и £ = 3 (в).
Третья глава диссертации посвящена статистическому анализу ансамбля РНК-подобных структур со случайной последовательностью мономерных звеньев. На Рис. 4 представлены зависимости среднего значения свободной энергии
и флуктуации свободной энергии для ансамбля случайных первичных структур РНК от длины последовательностей.
Отметим основные особенности наблюдаемых зависимостей. Угловой коэффициент линейной зависимости свободной энергии от длины последовательности в случае связывания с петлевыми участками к\ ^ 0.65 (Рис. 4(а)) хорошо согласуется с величиной, вычисленной в рамках модели так называемого «бер-нуллиевского сравнения» [9], т.е. в предположении о том, что матричные элементы е¿^ являются независимыми случайными величинами, принимающими значения 1 с вероятностью р = с-1 и 0 с вероятностью д = 1 — р:
(Гт,п) « —^=П + /(С)(Х)П1/3, 1 + V с
где х ~ случайная величина с распределением Трейси-Видома {(х) = —1.7711... и (X2) ~ (X>2 = 0.8132...).
Флуктуации свободной энергии основного состояния, как в случае линейных, так и в случае РНК-подобных структур, характеризуется степенной зависимостью с показателями степени близкими к 1/3. Показатель 1/3 является типичным для стохастической динамики сильно коррелированных систем и относится к классу универсальности Кардара-Паризи-Занга [10]. Как и для взаимодействия с петлевыми участками, (Рп.п) (п) = кп при п » 1 (Рис. 4), но угловой коэффициент прямой к и 0.92 гораздо выше, что обусловлено взаимодействием нуклеотидов внутри петель.
Наблюдаемая высокая вероятность связывания во вторичной структуре, а также хорошая согласованность распределения длин петель в структуре с аналитическим предсказанием, основанным на модели случайных блужданий, послужили поводом детального анализа РНК-подобных структур от алфавита с. Этот анализ вынесен в отдельную Четвертую главу.
Было показано, что топологические свойства РНК-подобных структур критическим образом зависит от алфавита, используемого в случайной первичной структуре. Такое критическое явление в диссертационной работе названо «топологическим переходом». В допереходной области, когда с < сс, случайная после-
400 600 600 700 81» 900 1000 У\
(в)
(г)
Рис. 4 Зависимость свободной энергии основного состояния (а,в) и флуктуации
свободной энергии а (б,г) от длины случайной последовательности п: (а,б) — взаимодействие РНК с петлевыми участками; (в,г) — внутрипетлевое взаимодействие. Усреднение проводилось по ансамблю из 105 случайных пар последовательностей для
каждого значения длины.
довательность образует полностью связанную вторичную структуру без пропусков (Рис. 5(6)), тогда как в области с > сс всегда есть конечная доля несвязанных мономеров (делеций) (Рис. 5(а)). Первым структурам соответствуют пути без горизонтальных участков в случайном блуждании— пути Дика, вторым — пути Моцкина [11].
В диссертационной работе представлены аналитические оценки критической точки сс топологического перехода, основанные на сравнении числа всех полностью связанных вторичных структур (Рис. 5) и всех случайных последовательностей с величиной алфавита с и заданной длиной Ь. В результате было показано, что 2 < сс < 3 (см. также [12]).
-ЛХ
1 2 3 4 5 6 7 8 9 1011 12 13 14
(а)
да
.а.
123456789 1011 121314
(б)
Рис. 5 Вторичная структура РНК с пропусками (а) и без пропусков (б) и соответствующие им пути случайных блужданий.
Для более точного описания топологического перехода предложена модель Бернулли, в которой матрица е возможных комплементарных пар является случайной матрицей, состоящей из единиц и нулей с вероятностями р и 1 — р соответственно. Мономеры цепи в данной модели не различаются по сортам и, в целом, любой мономер может образовать связь с любым другим, однако, в среднем, вероятность такого события равна р. Каждой последовательности в рассматриваемой модели можно сопоставить граф Эрдёша-Реньи, изображающего все возможные контакты между Ь мономерами.
Для более точной оценки критической точки топологического перехода были расссмотрены ансамбли, состоящие из N (М = 105) случайных бернуллиевских полимеров длины Ь. Доля последовательностей, образующих полностью связанную структуру в таком ансамбле щ есть функция от р (см. Рис. 6), и естественно ожидать, что в пределе Ь —> оо (Рис. 6(а)), функция ^¿(р) вырождается в ступен-
чатую функцию. Скейлинг-анализ полученных зависимостей т]ь{р) обеспечивает критическое значение рс = 0.37, что соответствует алфавиту: сс ~ 2.67.
1.0
0.8 0.6 0.4 0.2 0.0
а
тг
/
НИ- и=500 ~®-1-=1000 -А- 1_=2000
0.34 0.36 0.38 0.40 0.42 0.44
Р
(а)
-0.8 -0.4 0.0 0.4 0.8 1.2
Р-Рс
(б)
Рис. 6 Зависимость доли полностью связанных РНК-подобных структур в ансамбле случайных первичных структур различной длины (а) от параметра р модели Бернулли; скейлинг-анализ полученных зависимостей (б). Для каждого значения р и Ь было выполнено
103 накоплений.
Модель Бернулли позволяет провести более точную аналитическую оценку точки перехода. Для этого задачу удобнее формулировать в терминах случайных графов как задачу о размещении Ь/2 непересекающихся арок, принимая во внимание ограничения, накладываемые матрицей смежности е графа с ¿вершинами. Для р = 1 (когда все элементы е^- равны 1), количество всех возможных полностью связанных арочных структур определяется числами Каталана Сц2 (количество путей Дика длины Ь):
* = ^ = Ш- Ш
При р ф 1, некоторые из конфигураций ф запрещены матрицей е. В предположении среднего поля, т.е, что связи (арки) между мономерами образуются независимо, вероятность иметь по крайней мере одну планарную конфигурацию
для данной плотности р матрицы е определяется как:
V = #рх/2 - М^1/2 + С\ръь!2 +...
= 1 - (1 - pL!-)* = 1 - exp(-pL/2#).
В пределе L —ь оо, величина равна либо нулю, либо единице в зависимости от величины р£//2#. Таким образом, точка перехода характеризуется вероятностью:
limpc[#]2/i = l.
L->3о
Данное условие приводит к оценке сс = 4. Для учета корреляций между различными планарными диаграммами в работе введена функция £(р):
lim £(рс) [#]2/L = 1,
L—>oa
Полностью связанную планарную конфигурацию, состоящую из Lj2 арок, соединяющих L точек может быть построена как: i) L/4 непересекающихся единичных арок (г, i +1) из L — 1 возможных, разрешенных матрицой контактов е и и) L/4 арки большей длины. Такая процедура обусловлена тем, что арки разной длины встречаются в оптимальной планарной конфигурации с различной вероятностью, в частности, вероятность кратчайшей арки Р{г, i + 1) = Выделенность кратчайших арок в идеальной полностью связанной структуре учитывается непосредственно вычислением вероятности выбора L/4 арок из возможных pL (в предположении, что разрешенные арки равномерно «размазаны» по цепочке). Учет корреляций между планарными диаграммами на уровне единичных дуг, приводит к следующему выражению для функции
ln£(p) = ±lnp + f Inf
И соответственно, к величине сс = 2.87. Полученная оценка критического алфавита сс близка к наблюдаемой в численном моделировании.
Другой подход к аналитической оценки точки перехода сс основан на матричном описании РНК-подобной структуры. Статистическая сумма Zl(N, V) в этом случае записывается через случайные эрмитовы матрицы ф, (см., например, [13])
как:
i ¿ф^.Афье-3«—tr {фх.-.фь)
Zl(N,V) = i--j-У—-= (Фь-Фь)*,
/ (1ф1...(1ф1е 0
S0 = S0{e, фи..., фь} = £ £ij(e-Vr(^)-
Усреднение статистической суммы Zl(N, V) по матрицам е выполняется с использованием стандартного преобразования Хаббарда-Стратоновича и последующим интегрированием по е. В диссертационной работе приведены необходимые математические выкладки. В первом приближении критическое значение сс достигается при рс = 0.25, что совпадает с оценкой, полученной в приближении среднего поля. Учет корреляций в разложении So обеспечивает небольшой сдвиг в сторону значения, полученного в численном моделировании.
В главе также показана взаимосвязь рассматриваемого топологического перехода и фазовым переходом, который обсуждался ранее в [6] для РНК со случайной первичной структурой. Было показано, что в зависимости от температуры, РНК-подобные структуры со случайной последовательностью звеньев могут находится в одной из фаз: i) в «расплавленной» высокотемпературной фазе или ii) в «замороженной» низкотемпературной фазе. В высокотемпературной фазе большую роль играет энтропия цепочки, а не первичная структура. Данная фаза хорошо описывается в предположении, что связывание возможно для любых пар мономеров, т.е, эффективно, все звенья можно считать мономерами одного типа А и положить энергию пары А-А равной е.
Низкотемпературная фаза, напротив, определяется первичной структурой РНК и основной вклад в свободную энергию обусловлен именно комплементарными связями. В работе [6] было показано, что температура перехода из высокотемпературной фазы в низкотемпературную фазу непосредственно связана со средним количеством комплементарно связанных мономеров в основном состоянии РНК-структуры.
В диссертационной работе предполагается, что критическая точка топологического перехода между полностью связанной РНК-подобной структурой и
структурой с пропусками является пороговым значением для температурного фазового перехода. В области р > рс возможна только расплавленная фаза вне зависимости от температуры. Рис. 7 показывает фазовую диаграмму на (Т, р) плоскости. Это предположение подтверждается исследованием энергии пинча от длины случайной последовательности в точке Т = О (см. дополнительный график на Рис. 7).
Р
Рис. 7 Фазовый переход в замороженное состояние, ограниченный топологическим переходом в модели Бернулли. Дополнительный график: зависимость энергии пинча в пределе X —> 0 от вероятности р.
В заключительной части главы обсуждаются различные подходы к генерации случайной последовательности с эффективно нецелочисленным алфавитом. В частности, предлагается модель рационального алфавита, в которой правила комплементарности задаются искуственно в зависимости от величины алфавита с = В другой модели — модели коррелированного алфавита, последовательность описывается цепью Маркова. Для моделей приводятся соответствующие зависимости предельного значения средней свободной энергии основного состояния от величины алфавита. Заканчивается глава качественными доводами,
почему алфавит в реальных молекулах РНК расположен вблизи критической величины.
В Пятой главе развивается новый подход к описанию вторичной структуры РНК-подобной молекулы, основанный на использовании оптимизационной транспортной задачи. В работе формулируется модель РНК-подобной молекулы со случайными интервалами между звеньями цепи (Рис. 8). В рамках предложенной модели энергия взаимодействия мономеров е,^ предполагается выпуклой функцией расстояния между мономерами вдоль цепи. С физической точки зрения, примером такого взаимодействия может служить электростатическое взаимодействие ~ 1/с/у. В численном моделировании использовалось
= -и 1п \х{ - х^; {] ф г),
где и — некоторая положительная величина, и Х{, х^ — координаты мономеров г и j вдоль цепи. Расстояния с/{ = — 1г| между соседними мономерами подчиняются распределению Р(с?г- = ¿).
1 2 3 4 5 6 78 9 10
(а)
(Ь)
Рис. 8 Модель РНК-подобной молекулы со случайными интервалов между звеньями цепи: арочное представление (а), и соответствующий путь Дика (б).
В [14] было показано, что свободная энергия основного состояния ^ удовлетворяет рекурсивному соотношению, обладающему свойствами субаддитивно-
сти и субмодулярности:
Fi,i+k = min[£iii+fc + i^i+i.fc-i;
Fi,i+k—2 + Fi+2A+k — Fi+2ti+k-2] • В работе приводятся результаты аналитического описания и численного моделирования топологических особенностей структур РНК-подобных молекул для двух видов распределений f(d): распределения Гаусса и степенного распределения. Было показано, что для распределения Гаусса имеет место топологический переход между конфигурацией, в которой спарены лишь ближайшие по цепи соседи, и конфигурацией, имеющую структуру вложенных друг в друга арок. Параметр, контролирующий такой переход — величина дисперсии а в распределении Гаусса f(d, а) (Рис. 9(a)).
Для степенного распределения f(d, 7) ~ в котором вероятность большого расстояния между соседними мономерами не мала экспоненциально, характерна конфигурация иерархически вложенных арок в широком диапазоне значений показателя распределения 7. При этом, для величины максимального числа вложенных друг в друга арок в РНК-подобной структуре, (h(7)) имеет характерный максимум при 7 = 1 (Рис. 9(c)). Вероятность появления вложенной топологии в оптимальной конфигурации определяется интегралом:
Р= / f(x)dx / f(y)dy / f(z)dz,
Jdm m J (¿mill J dmm
где dmin и dmax — наименьшее и наибольшее значение расстояний между соседними мономерами в распределении f(d). Рис. 9(6,г) показывает зависимость интеграла от параметров распределений. Видно, что аналитические кривые имеют те же особенности, что наблюдаются в численном моделировании. Важным результатом данного исследования является возможность перейти от нелокального уравнения для свободной энергии основного состояния РНК к локальным соотношениям. В рамках предположения выпуклого потенциала взаимодействия между мономерами, выражение для энергии основного состояния существенно упрощает алгоритм описания РНК-подобной структуры.
3.50
3.25
3.00
2.75
А
О 2.50
-5*
V
2.00
1.75
1.50
(а)
■Н * ' - П } ; ,
.:: *
,4= 250 ,У= 500 N»1000
? Т Т *
1 2 3 4 5
С
У
(В)
Рис. 9 Зависимость высоты оптимальной конфигурации от параметров распределения: (а) — распределение Гаусса; (б) — степенное распределение; (в,г) — аналитическая вероятность "переключения" с последовательных на вложенные конфигурации.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Получено выражение для статистической суммы, описывающие взаимодействие двух сополимеров, учитывающий способность каждого из сополимеров образовывать РНК-подобную структуру с иерархией петлевых участков. Разработан соответствующий алгоритм динамического программирования вычисления свободной энергии основного состояния таких РНК-подобных молекул.
2. Численно и аналитически показано критическое поведение РНК-подобной структуры в зависимости от используемого в первичной структуре алфавита. Существует две области: для алфавитов с < сс свойственна максимально связанная вторичная структура без пропусков, тогда как для с > сс вторичная структура содержит конечную долю несвязанных мономеров. Аналитическая оценка точки топологического перехода сс = 2.87 близка к наблюдаемой в численном моделировании сс = 2.67.
3. Показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче. Разработан алгоритм вычисления свободной энергии в модели первичной структуры со случайными расстояниями между мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния. Показана зависимость топологии РНК-подобной структуры от параметров распределения.
ЛИТЕРАТУРА
1. Птицын Б.О., Финкельштейн А. Физика белка: Курс лекций // Москва: Университет, 2002. - 376 С.
2. Гросберг Ю.А., Хохлов Р.А. Статистическая физика макромолекул / под ред. Главной редакции физико-математической литературы // Москва: Наука, 1989. - 344 С.
3. Workman С., Krogh A. No evidence that mRNAs have lower folding free energies than random sequences with the same dinucleotide distribution // Nucleic Acids Research. - 1999. - V. 27. - N. 24. - P. 4816-4822.
4. Clote P., Ferre F., Kranakis E., Krizanc D. Structural RNA has lower folding energy than randomRNA of the same dinucleotide frequency // RNA. — 2005. — V. ll.-N. 5.-P. 578-591.
5. Brezin E.E., Itzykson C., Parisi G., Zuber J.B. Planar diagrams // Communications in Mathematical Physics. — 1978. — V. 59. — N. 1. — P. 5-51.
6. Bundschuh R., Hwa T. Statistical mechanics of secondary structures formed by random RNA sequences // Physical Review E. — 2002. — V. 65. — N. 3. — P. 031903.
7. Waterman M.S., Vingron M. Sequence comparison significance and poisson approximation // Statistical Science. — 1994. — V. 9. — P. 367-381.
8. de Gennes P.G. Statistics of branching and hairpin helices for the dat copolymer // Biopolymers. - 1968. - V. 6. - N. 5. - P. 715-729.
9. Majumdar S.T., Nechaev S.K. Exact asymptotic results for the bernoulli matching model of sequence alignment // Physical Review E. — 2005. — V. 72. — N. 2. — P. 020901.
10. Kardar M., Parisi G., Zhang Y.C. Dynamic scaling of growing interfaces // Physical Review Letters. - 1986. - V. 56. - N. 9. - P. 889-892.
11. Ландо К. Лекции о производящих функциях // Москва: Московский центр непрерывного математического образования, 2007. — 144 С.
12. Владимиров А.А. Паросочетания без пересечений // Проблемы передачи информации. - 2013. - Т. 49. - N. 1. - С. 61-65.
13. Orland Н., Zee A. RNA folding and large N matrix theory // Nuclear Physics B. - 2002. - V. 620. - P. 456-476.
14. Delon J., Salomon J., Sobolevski A. Local matching indicators for transport problems with concave costs // Journal on Discrete Mathematics. — 2012. — V. 26.-N. 2.-P. 801-827.
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Nechaev S.K., Tamm M.V., Valba O.V. Statistics of noncoding RNAs: alignment and secondary structure prediction // Journal of Physics A: Mathematical and Theoretical. - 2011. - V. 44. - N. 19. - P. 195001.
2. Вальба O.B., Нечаев C.K., Тамм M.B. Сравнение молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Журнал экспериментальной и теоретической физики. — 2012. — Т. 114. — N. 2.-С. 399-413.
3. Вальба О.В., Нечаев С.К., Тамм М.В. Взаимодействие молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Химическая физика. — 2012. — Т. 31. — С. 23-25.
4. Valba O.V., Tamm M.V., Nechaev S.K. New Alphabet-Dependent Morphological Transition in Random RNA Alignment // Physical Review Letters. — 2012. — V. 109.-N. 1,-P. 018102.
5. Nechaev S.K., Sobolevskii A.N., Valba O.V. Planar diagrams from optimization for concave potentials // Physical Review E. — 2013. — V. 87. — N. 1. — P. 012102.
6. Lokhov A.Y., Valba O.V., Nechaev S.K., Tamm M.V. Phase transition in random planar diagrams and RNA-type matching // Physical Review E. — 2013. — V. 88. -N. 5.-P. 052117.
7. Valba O.V., Tamm M.V., Nechaev S.K. A new approach to comparison of two graphs // International conference "Engineering of Chemical Complexity Berlin, Germany, 4-8 July 2011.
8. Valba O.V., Tamm M.V., Nechaev S.K. Matching of RNA-type sequences and statistical analysis of random RNAs // International conference on Statistical Physics, Larnaka, Cyprus, 11-15 July 2011.
9. Вальба O.B., Нечаев C.K., Тамм M.B. Взаимодействие молекул РНК: энергия связывания и статистические свойства случайных последовательностей // Юбилейная конференция ИХФ РАН «Химическая физика вчера, сегодня, завтра», Москва, 11-14 октября 2011.
10. Вальба О.В., Нечаев С.К., Соболевский А.Н. Топологические переходы во вторичной структуре случайных РНК-подобных полимеров // Конференция молодых ученых ИХФ РАН, Звенигород, 1-4 марта 2012.
11. Valba O.V. On exclusivity of alphabets with four nucleotide types // Spring School in Probability, Dubrovnik, Croatia, 23-27 April 2012.
12. Valba O.V. Topological transition in secondary structure of RNA-like polymer// 38th Conference of the Middle European Cooperation in Statistical Physics, Triest, Italie, 25-27 March 2013.
13. Вальба O.B. Фазовый переход в случайных РНК-подобных полимерах // Всероссийская научная конференция «Химическая физика и строение вещества», Москва, 19-20 июня 2013.
14. Valba O.V., Lokhov A.Y., Nechaev S.K., Tamm M.V. New topological transition in secondary structure of random RNA-tlike polymer // 9-ая Санкт-Петербургская конференция молодых ученых «Современные проблемы науки о полимерах», Санкт-Петербург, 11-15 ноября 2013.
Заказ № 102-Р/04/2014 Подписано в печать 21.04.14 Тираж 100 экз. Усл. пл. 1,2
ООО "Цифровичок", тел. (495) 797-75-76 www.cfr.ru ; e-mail: zakpark@cfr.ru